Internet Develppment
      互聯(lián)網(wǎng)開發(fā)& 推廣服務(wù)提供商

      我們擅長商業(yè)策略與用戶體驗的完美結(jié)合。

      歡迎瀏覽我們的案例。

      首頁 > 新聞中心 > 新聞動態(tài) > 正文

      微軟推出 ZeRO++ 技術(shù) 可顯著減少大模型訓練時間和成本

      發(fā)布時間:2023-06-27 14:43:14來源:IT之家

        微軟研究人員日前推出了名為 ZeRO++ 的新技術(shù),用于優(yōu)化在訓練大型 AI 模型時,容易遇到的數(shù)據(jù)傳輸成本和帶寬限制的難題,可顯著減少大模型訓練時間和成本。

        據(jù)悉,ZeRO++ 建立在現(xiàn)有的 ZeRO 傳輸技術(shù)基礎(chǔ)上,并提供增強的通信策略,可提高訓練效率,同時減少訓練時間和成本。


      圖片來自網(wǎng)絡(luò)/侵刪

        為了減少參數(shù)通信量,ZeRO++ 可對權(quán)重進行量化,其利用基于塊的量化方法來保持訓練精度,這種優(yōu)化的量化過程相對原始 Zero 傳輸技術(shù)更快更準確。為了能夠盡量減少通信開銷,ZeRO++ 通過在每臺機器上保持完整的模型副本,以向 GPU 顯存換取通信帶寬。而在梯度通信方面,ZeRO++ 引入了一種名為 qgZ 的新的量化梯度通信方式,可以減少跨節(jié)點的流量和延遲。

        這些改進的通信技術(shù)大大減少了通信量,微軟研究人員表示,與 ZeRO 相比,ZeRO++ 減少了高達 4 倍的通信量,提高了訓練吞吐量和效率。當在每個 GPU 上使用小批量大小時,在高帶寬集群中,ZeRO++ 相比 ZeRO-3 的吞吐量提高了 28% 至 36%。在低帶寬集群中,與 ZeRO-3 相比,ZeRO++ 實現(xiàn)了平均 2 倍的加速,使得大模型訓練在更多種類的集群上更為可行。

        IT之家注意到,例如 Turing-NLG、ChatGPT 和 GPT-4 這樣的大型模型,其訓練需要跨多個 GPU 設(shè)備占用大量顯存和計算資源,而 ZeRO++ 引入了通信優(yōu)化策略,以克服在低帶寬集群上進行訓練時原有 ZeRO 傳輸技術(shù)的帶寬限制。目前微軟已經(jīng)放出了相關(guān)技術(shù)文檔,研究人員可以利用 ZeRO++ 更有效地訓練模型,在 AI 領(lǐng)域探索新的可能性。
        (碼上科技

      最新資訊
      ? 2018 河北碼上網(wǎng)絡(luò)科技有限公司 版權(quán)所有 冀ICP備18021892號-1   
      ? 2018 河北碼上科技有限公司 版權(quán)所有.
      主站蜘蛛池模板: 国产主播一区二区三区在线观看| 韩国精品一区二区三区无码视频| 久久国产精品亚洲一区二区| 精品视频一区二区三区在线观看 | 视频一区二区三区免费观看 | 激情综合丝袜美女一区二区| 亚洲视频在线一区二区| 日韩AV在线不卡一区二区三区 | 亚洲色偷精品一区二区三区| 怡红院一区二区在线观看| 亚洲夜夜欢A∨一区二区三区| 亚洲爆乳精品无码一区二区| 国产一区二区免费视频| 另类ts人妖一区二区三区| 91精品一区二区三区久久久久 | 国产一区二区高清在线播放| 亚洲a∨无码一区二区| 亚洲香蕉久久一区二区| 一本AV高清一区二区三区| 亚洲一区二区精品视频| 内射一区二区精品视频在线观看| 色老头在线一区二区三区| 少妇无码一区二区二三区| 亚洲A∨无码一区二区三区| 中日av乱码一区二区三区乱码| 亚洲AV无码一区二区三区在线观看 | 精品乱人伦一区二区| 成人久久精品一区二区三区| 人妻夜夜爽天天爽一区| 激情综合丝袜美女一区二区| 国产精品熟女视频一区二区| 色天使亚洲综合一区二区| 日韩精品一区二区三区毛片| 欧美日韩精品一区二区在线观看| 日韩爆乳一区二区无码| 日韩AV无码一区二区三区不卡| 国产aⅴ精品一区二区三区久久| 国产成人综合精品一区| 精品一区二区久久| 无码人妻av一区二区三区蜜臀| 精品国产一区二区三区AV|