Nvidia推出一個與Kubernetes集群配合使用,加速深度
在數據中心越來越受歡迎,它可以加速機器學習和深度學習等數據密集型工作負載?,F在,全球最大的GPU制造商Nvidia將推出一個與Kubernetes集群配合使用的用例,以加速深度學習模型的訓練。
本周二表示,將發布Kubernetes on Nvidia GPUs的候選版本,可供開發人員免費使用。該版本是針對那些在多云GPU集群上訓練深度學習模型的企業。
Nvidia 是在Computer Vision and Pattern Recognition大會上宣布推出Kubernetes on Nvidia GPUs的,此外還推出了新版本的推理優化工具和運行時引擎TensorRT,以及名為DALI的GPU數據增強和圖像加載庫,旨在優化深度學習框架的數據管道。
Nvidia表示,推出Kubernetes on Nvidia GPUs背后的想法是為了讓軟件容器編排平臺更加“GPU感知”。Kubernetes on Nvidia GPUs針對的是運行人工智能應用的容器,將幫助開發人員更好地協調散步在多個云主機的GPU集群。
Moor Insights&Strategy創始人兼首席分析師Patrick Moorhead表示:“這很重要,因為Kubernetes托管的應用現在可以利用GPU的性能了。這在虛擬機上將實現比以前更高的可擴展性。”
就在Nvidia這次發布的幾周之前,谷歌剛剛在其Kubernetes Engine平臺上發布了一個測試版的GPU,旨在加速圖像處理和機器學習工作負載。谷歌當時表示,這個云GPU可用于創建由、和K80處理器驅動的Kubernetes節點池。
Nvidia的TensorRT推理加速器是針對推理模型的開發者。該工具集成了谷歌開源的TensorFlow機器學習框架,并增加了新的層和功能,以加強針對推薦系統、神經機器翻譯、圖像分類和語音識別等應用的推理。
至于DALI,這是一項為JPEG圖像編碼提供GPU加速庫的服務,旨在解決基于視覺的深度學習應用中的性能瓶頸,目的是為了幫助擴展圖像分類系統如PyTorch、TensorFlow和ResNet-50的訓練。AWS的P3 8-GPU實例以及Nvidia自己的DGX-1深度學習系統上都將提供DALI。
“深度學習研究人員需要他們的管道是便攜的,”加速計算軟件和AI產品總監Kari Briski說。
?