我們擅長商業(yè)策略與用戶體驗的完美結(jié)合。
歡迎瀏覽我們的案例。
近日,有媒體報道稱,百度正加緊訓(xùn)練文心大模型 4.0,這將是文心大模型 3.5 版本后又一個重磅版本。據(jù)報道,文心大模型 4.0 進(jìn)展比預(yù)期快很多,將是基礎(chǔ)模型的大升級,理解、生成、邏輯、記憶核心能力都將提升,特別是在邏輯推理、代碼和數(shù)學(xué)等方面提升最明顯。
10 月 10 日,記者從百度內(nèi)部人士基本確認(rèn)了該消息,據(jù)悉,即將推出的文心大模型 4.0 的參數(shù)量、訓(xùn)練數(shù)據(jù)量以及推理成本等都比 3.5 高出一個數(shù)量級。
今年 3 月 16 日,百度官宣新一代大語言模型“文心一言”啟動邀測,8 月 31 日正式面向公眾開放服務(wù)。如今,文心大模型即將再度升級發(fā)布 4.0 版,如此迅速的大模型升級速度,在國內(nèi)尚屬唯一。只不過,快速升級的背后,文心大模型 4.0 快速攀升的參數(shù)量、數(shù)據(jù)量所帶來的訓(xùn)練和推理成本提升,也正在成為大模型商業(yè)化過程中需要考慮的重點。
據(jù)此前消息報道,相比文心大模型 3.5,文心 4.0 不僅訓(xùn)練成本在增加,推理成本也增加了很多,大概是此前的8-10 倍。一直以來,百度并未對外披露大模型訓(xùn)練、推理的各項成本,不過據(jù)國盛證券此前估算,GPT-3 訓(xùn)練一次的成本約為 140 萬美元,對于一些更大的 LLM 模型(如擁有 2800 億參數(shù)的 Gopher 和擁有 5400 億參數(shù)的 PaLM),訓(xùn)練成本介于 200 萬美元至 1200 萬美元之間。作為國內(nèi)大語言模型代表,文心一言想要在性能上追趕甚至超越 ChatGPT 等國外同行,所需耗費(fèi)的資金成本,恐怕也將與之相當(dāng)。
過高的訓(xùn)練和推理成本壓力下,在打造領(lǐng)先的底層基礎(chǔ)大模型的路上,注定只能是一場巨頭間的游戲。不過對于百度而言,由于具備萬卡集群、飛槳、文心大模型以及豐富的百度應(yīng)用生態(tài)優(yōu)勢,獨(dú)具芯片、框架、模型及應(yīng)用四層架構(gòu)優(yōu)勢,更具技術(shù)競爭力。
在進(jìn)一步降低大模型算力成本和時間成本上,百度萬卡集群的整體優(yōu)勢已得到充分體現(xiàn)——在萬卡集群訓(xùn)練大模型時,常規(guī)方法下工程師們有 30%-40% 時間都花在容錯和故障恢復(fù)上,而在百度智能云自研的集群組網(wǎng)故障管理機(jī)制下,模型有效訓(xùn)練時間達(dá)到 95% 以上,人力及算力資源均得到了利用。
真金白銀投入的背后,目前國外大模型廠商已開始嘗試收費(fèi)模式,無論是在面向企業(yè)客戶的B端垂類大模型開發(fā),還是面向消費(fèi)群體的 To C 付費(fèi)產(chǎn)品,均有不少案例。例如,在面向C端消費(fèi)者付費(fèi)領(lǐng)域,目前 GPT-4 已推出“每月支付 20 美元訂閱費(fèi)”的收費(fèi)模式。
可以預(yù)見,不遠(yuǎn)的將來,以百度為代表的大模型企業(yè)們,或?qū)㈥懤m(xù)推出收費(fèi)模式。在 To C 大模型 AI 應(yīng)用層面,類似愛奇藝或百度網(wǎng)盤 VIP 會員的收費(fèi)模式,也將不斷浮現(xiàn),逐漸培養(yǎng)用戶付費(fèi)習(xí)慣。
百度文心大模型4.0即將發(fā)布,萬卡訓(xùn)練史上最大參數(shù)模型 08:57:04
更小、更輕!索尼全新PS5發(fā)布:可拆卸光驅(qū)方便了 08:53:10
新Surface Laptop Studio 2和Laptop Go 3開啟預(yù)售 09:35:35
三星Galaxy S24系列設(shè)計細(xì)節(jié)曝光:采用直屏方案+四邊等寬設(shè)計 09:32:12
德國反壟斷機(jī)構(gòu)負(fù)責(zé)人:人工智能可能會強(qiáng)化大企業(yè)主導(dǎo)地位 09:26:40
微軟收購動視暴雪后,將于明年開始將其游戲引入 Game Pass 09:22:01