千呼萬喚,GPT-5面世了。一鍵生成網頁、寫作像詩人、更懂健康問題,OpenAI稱它將徹底改變人們工作、學習及創新方式。但許多人表示,這次GPT-5并沒有帶來更多的驚喜,反倒是價格策略成了此次發布的最大亮點。GPT-5上線后,社交媒體出現不少關于GPT-5使用感不佳的吐槽,更有用戶直呼"還我GPT-4o"。面對用戶爭議,OpenAI發文宣布,重新上線GPT-4o,供Plus和Team用戶使用。
"博士級專家"
自2018年OpenAI發布首個大模型GPT-1以來,GPT系列已經走過了七年。2020年GPT-3的出現,讓大模型參數規模從15億直接拓展到了1750億,也因此通過"上下文學習"能力,擺脫了對大量標注數據的依賴,使大模型能夠開始作為效率工具使用。
兩年后,基于GPT-3.5構建的對話式模型ChatGPT上線,進一步推動大模型走入C端日常,成為通用AI應用的重要落地轉折點。隨后GPT-4的全面升級,更是在實現萬億級模型參數的同時,讓大模型在單純文本輸出的基礎上,實現了圖像的交互提升。
美東時間8月7日,OpenAI正式發布GPT-5。新模型發布后,OpenAI聯合創始人、首席執行官薩姆·奧爾特曼在一場訪談中表示,相比于GPT-4,GPT-5不僅能解答各種難題,更能實現即時的、按需的軟件開發,并將徹底改變人們工作、學習及創新方式。
奧爾特曼用三個身份,類比了公司三代旗艦模型的演進:GPT-3像是偶有靈光閃現但常伴挫敗感的高中生;GPT-4則如同具備了真實智慧與實用價值的大學生;而最新的GPT-5,則被譽為可以按需召喚的"博士級專家",能夠隨時助力用戶達成各種復雜目標。
OpenAI聲稱,GPT-5在超高難度的科學問題上刷新了世界紀錄,并在與人類專家的對比測試中,有近70%的場景表現更優。此外,GPT-5還與現有的o系列模型進行了無縫整合,能夠根據任務的復雜性,自動選擇最佳的推理路徑。官方數據顯示,GPT-5在代碼生成和寫作領域的準確率均高于GPT-4系列,部分內部測試中的錯誤率甚至下降了約80%。
值得一提的是,在訪談中,奧爾特曼表示,GPT-5在健康建議方面的能力顯著提升,它的答案更準確、幻覺更少,更有可能告知真正的病因和應對措施。奧爾特曼還表示,在2035年,人們將能借助這些工具治愈或至少有效治療許多目前仍在困擾人類的疾病。
在奧爾特曼看來,在GPT-8時代,人們可以利用這一AI工具治療某種癌癥。比如,GPT-8會先遍歷所有現存的研究與數據,并提出治療思路。隨后告知用戶:"我需要你找一個實驗室完成這9個實驗,并反饋結果。"
邊際收益遞減
近兩年,隨著AI工具開始席卷各行各業,人們渴望AI能夠取代重復繁瑣的工作,也在擔憂自己是否會被AI所取代,這也是GPT-5發布前備受關注的原因之一。
但相比此前GPT-3到GPT-4所帶來的全方位升級,許多人表示,這次GPT-5并沒有帶來更多的驚喜,從發布會規模、產品亮點到性能升級,都顯得較為平庸,相較當前主流SOTA模型,提升幅度并不顯著。
從第三方的基準測試數據來看,GPT-5相較于競爭對手的旗艦模型,其領先優勢也微乎其微。根據Artificial Analysis的綜合排名,GPT-5目前雖然位列第一,但其綜合得分僅比自家的老模型o3高出兩分,比Grok 4僅高出一分。而在被譽為AGI終極測試的Arc Prize競賽中,GPT-5更是被Grok 4大幅超越。
OpenAI在發布會上還特別強調了GPT-5在代碼生成和寫作方面的能力。然而,用戶的實際使用體驗,似乎并未完全印證官方的說法。Meta公司的一位工程師體驗GPT-5后在社交媒體上感嘆道:"GPT-5僅用一次調用就重構了我的整個代碼庫:25個工具調用,3000多行新代碼,12個全新的文件。"但他隨即話鋒一轉:"然而,這些代碼都無效(無法正常工作),雖然確實寫得很漂亮。"
"GPT-5不太可能‘超越一切預期’,因為大模型的邊際收益正在迅速遞減。"AI營銷與銷售專家、太和智庫研究員唐興通分析指出,"我們今天所看到的所謂‘進步’,更多是來自于工程層面的調優和多模態能力的融合,而非純粹的智能層面上的突破。"
他認為,AI的發展正面臨兩大物理限制:"我們必須清醒地認識到,‘數據墻’是客觀存在的,高質量的公共訓練數據正在被快速耗盡。同時,算力成本的指數級增長,也讓過去那種‘大力出奇跡’的暴力美學難以為繼。"
不過,不少人表示價格很"香"。GPT-5的API調用價格僅為前幾日發布的Claude Opus 4.1的1/15,顯著低于Gemini 2.5 Pro,在當前大模型市場上展現出極強的性價比。
缺少溫度
最新數據顯示,今年8月ChatGPT周活躍用戶已達7億,同比增長4倍。其付費用戶數從2024年的300萬增至500萬,Pro會員和企業版用戶貢獻了超60%的收入。
龐大的用戶規模,幫助ChatGPT的商業收入再創新高。曾有媒體報道,截至今年7月末,OpenAI預計將實現120億美元的年度經常性收入,成為全球最大的AI創業公司。它的最大競爭對手Anthropic同期收入預計僅為50億美元。
不過,OpenAI的挑戰也顯而易見。尤其是在企業級市場,OpenAI的市場份額正在迅速被競爭對手蠶食。近期,海外投資機構Menlo Ventures發布的一份報告顯示,Anthropic在企業大語言模型市場占有率已達32%。相比之下,OpenAI的市場份額僅為25%。
ChatGPT-5上線后,不少用戶發現OpenAI停用了GPT-4o版本。社交媒體出現不少關于GPT-5使用感不佳的吐槽,更有用戶直呼"還我GPT-4o"。用戶對GPT-5的"吐槽",主要集中在新模型雖提升了回答的專業度,但卻缺少了情感交互的溫度、個性及想象力。
面對用戶爭議,OpenAI發文宣布,重新上線GPT-4o,供Plus和Team用戶使用,若需多平臺使用,用戶可在ChatGPT網頁版設置中啟用"顯示舊版模型"訪問GPT-4o。與此同時,下周還將推出迷你版GPT-5和GPT-5 thinking。
針對用戶對GPT-5的負面反饋,奧爾特曼解釋稱,這是由于自動切換器損壞,致使GPT-5表現異常。他表示,未來將專注于完成GPT-5的部署與改進,并確保其穩定性。奧爾特曼同時透露,GPT-5上線后,ChatGPT API流量在24小時內翻倍增長,OpenAI正在全力優化系統并尋找更多的容量。但他坦言,預計下周仍將面臨嚴峻的容量挑戰。
奧爾特曼坦言,低估了用戶對GPT-4o的喜愛程度,并表示這強化了公司為不同用戶提供定制化服務的理念,未來將推出比當前更多的定制化內容。同時,其宣布將允許Plus用戶繼續使用GPT-4o,并將密切關注用戶使用情況,考慮舊版本模型的保留期限。
北京商報記者 趙天舒