Microsoft用來擴展基于云的人工智能邊界的不斷增長的技術中

?機器人資訊 ????|???? ?2020-06-22

  將Kubernetes添加到Microsoft用來擴展基于云的人工智能邊界的不斷增長的技術中。流行的開源容器編排平臺Kubernetes 在2017年取得了突破性的發展。現在,除了幫助企業在云或本地管理其應用程序容器部署外,還招募了Kubernetes,以便為基于云的AI工作負載提供在需求回升時完成工作所需的空間。
 

Microsoft用來擴展基于云的人工智能邊界的不斷增長的技術中


 

  微軟推出了一種新的自動擴展系統,該系統使用Kubernetes來擴展或縮減學習培訓工作負載所需的云計算資源量。該系統是與加利福尼亞州圣何塞市的技術初創公司Litbit合作開發的,該公司使用物聯網數據創建“ AI角色”,工作場所可根據其集體經驗和專有技術來增強員工的能力。

 

  例如,組織可以創建和培訓角色,以幫助其現場技術人員在跳上工作卡車并親自拜訪正在起作用以節省時間和費用的機械之前,檢測并診斷設備問題。

 

  事實證明,這是一個艱巨的任務,而且是一個不可預測的任務。Litbit發現,由于客戶在不同時間訓練其角色,因此AI訓練工作負載的變化很大。

 

  “其中一些訓練工作(例如Spark ML)大量使用CPU,而其他一些工作(例如TensorFlow)大量使用GPU。在后一種情況下,某些工作會重新訓練神經網絡的單個層并很快完成,而其他人則需要訓練整個新的神經網絡,這可能需要數小時甚至數天。”微軟代表在博客中解釋道。

 

  微軟和Litbit選擇了Kubernetes,部分原因是因為其成熟的集群管理技術,而且還因為該項目在短短幾年內吸引了社區的大力支持。盡管該項目始于Google,但仍被視為Linux基金會的Cloud Native Computing Foundation(CNCF)的頭等大事。

 

  兩家公司著手通過使用適用于Kubernetes的Azure CNI網絡插件在具有GPU支持的Azure上配置Kubernetes群集來解決高度可變的機器學習工作負載的問題。然后,他們使用用于Kubernetes的Helm軟件包管理器應用了節點級自動縮放器,隨后進行了一些配置更改,以啟動和運行系統。

 

  該項目是成功的。該系統已經運行了四個月,它使Litbit一次可以擴展到40個節點,并且在需求減少時可以無縫縮減規模。微軟已經在其開發者博客上發布了Kubernetes自動縮放器的完整演練。

 

  反映出困擾企業DevOps團隊的容器熱潮,微軟對Kubernetes的支持增加了一倍。

 

  在今年12月初的KubeCon會議上,微軟宣布其Azure容器服務現已縮寫為AKS,這表示該公司以客戶為中心,以Kubernetes為中心的云原生應用程序開發方法。該公司還推出了一個名為Virtual Kubelet的新連接器,該連接器使用戶可以定位該公司的快速容器創建和部署服務Azure容器實例(ACI)。

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。