我們擅長商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
“雖然大家經(jīng)常討論的是聊天機(jī)器人或情感陪伴助手這些應(yīng)用,但實(shí)際上,我們現(xiàn)在能看到大模型在工業(yè)領(lǐng)域有更多的落地場(chǎng)景,大模型的應(yīng)用場(chǎng)景非常廣泛。”
近日,微軟亞洲研究院資深首席研究員、微軟亞洲研究院機(jī)器學(xué)習(xí)組和產(chǎn)業(yè)創(chuàng)新中心負(fù)責(zé)人邊江博士接受記者采訪時(shí)說,大模型已經(jīng)可以用于能源領(lǐng)域的電能產(chǎn)量預(yù)測(cè),或者醫(yī)療領(lǐng)域的患者監(jiān)測(cè)預(yù)測(cè)。
圖源網(wǎng)絡(luò)/侵刪
“這些時(shí)序預(yù)測(cè)任務(wù),在大模型中都有很好的落地場(chǎng)景,盡管目前還沒有太多人深入討論。”邊江說,“我們通過相關(guān)研究,并對(duì)一些技術(shù)增強(qiáng)了大模型的預(yù)測(cè)能力,包括決策能力。”
邊江分享了一個(gè)解決供暖和空調(diào)系統(tǒng)中的能源消耗問題的創(chuàng)新解決方案,實(shí)時(shí)分析外部天氣情況和建筑內(nèi)部人流量的變化,實(shí)時(shí)調(diào)整空調(diào)設(shè)備的送風(fēng)溫度和送風(fēng)壓力,能源使用效率提升,能源消耗減少達(dá)30%。
這個(gè)被稱為“可優(yōu)化HVAC控制策略的強(qiáng)化學(xué)習(xí)”的技術(shù),近日也在上海氣候周期入選2024年十大值得關(guān)注的氣候技術(shù)。
“這個(gè)算法的本質(zhì),其實(shí)是為了優(yōu)化長期的收益,來調(diào)整當(dāng)前的決策。比如,空調(diào)系統(tǒng)可能每隔15分鐘或1小時(shí)就需要重新設(shè)定,這些設(shè)置不僅影響當(dāng)前的溫控效果,還會(huì)影響到空調(diào)的長期能耗。強(qiáng)化學(xué)習(xí)需要處理的就是這種時(shí)序決策問題,即如何做出既考慮當(dāng)前影響又優(yōu)化長期收益的決策。”邊江說,當(dāng)然這里面臨的一個(gè)主要挑戰(zhàn)是環(huán)境動(dòng)態(tài)變化。
“當(dāng)時(shí),我們?cè)诠究偛看髽菧y(cè)試這個(gè)算法,正好趕上加州的山火,這種大范圍的自然災(zāi)害,顯著影響了美國西海岸的氣候,這類突發(fā)事件是我們以前沒有遇到過的挑戰(zhàn)。我們也設(shè)計(jì)了能夠適應(yīng)這些復(fù)雜環(huán)境的算法,讓它做得更好。”邊江說,與當(dāng)年AlphaGo處理的圍棋環(huán)境不同,圍棋的環(huán)境是靜態(tài)且封閉的,而HVAC系統(tǒng)則需要應(yīng)對(duì)每天變化的氣候和不同的室內(nèi)人員變動(dòng)。
據(jù)了解,對(duì)于預(yù)測(cè)的算法,主要涉及兩種類型,一是時(shí)序預(yù)測(cè),比如面向糖尿病患者,可以基于每五分鐘一次的血糖監(jiān)測(cè)數(shù)據(jù),預(yù)測(cè)其未來血糖的變化,這屬于時(shí)序數(shù)據(jù)的預(yù)測(cè)。另一種非時(shí)序數(shù)據(jù)的預(yù)測(cè),即結(jié)構(gòu)化的表格數(shù)據(jù),比如金融行業(yè)中用于檢測(cè)欺詐行為或反洗錢等。
“根據(jù)我們目前的研究,大模型在這些預(yù)測(cè)任務(wù)上具有很大的潛力,通過對(duì)現(xiàn)有大模型的微調(diào),我們可以賦予它這種預(yù)測(cè)能力。”邊江說,它可以用于能源領(lǐng)域的電能產(chǎn)量預(yù)測(cè),或者醫(yī)療領(lǐng)域的患者監(jiān)測(cè)預(yù)測(cè)。
“這些時(shí)序預(yù)測(cè)任務(wù)在大模型中也有很好的落地前景,盡管目前還沒有太多人對(duì)此有深入探討。我們已經(jīng)進(jìn)行了相關(guān)研究,并通過一些技術(shù)增強(qiáng)了大模型的預(yù)測(cè)能力,包括決策能力。”
此前剛剛在上海結(jié)束的F1中國大獎(jiǎng)賽,不少車隊(duì)也都融入了高科技。“車手應(yīng)該在哪一圈進(jìn)站更換輪胎,應(yīng)該選擇換哪種類型的輪胎……”邊江說。
據(jù)了解,F(xiàn)1賽車有三種不同的輪胎:軟胎、中性胎和硬胎。軟胎盡管可以短時(shí)間內(nèi)獲得快速圈速,但無法堅(jiān)持太多圈,磨損較快;硬胎耐磨但圈速不如軟胎快;中性胎則介于兩者之間。這根據(jù)比賽情況決策何時(shí)進(jìn)站、換胎,以及換什么類型的胎。同時(shí)進(jìn)站策略也很關(guān)鍵,它取決于當(dāng)前車手的賽道位置,比如是否處于比較擁擠的賽段,或者出站后是否會(huì)遇到慢車等情況,這些都是重要的決策點(diǎn)。因?yàn)槊咳Χ家獩Q定這一圈要不要讓車手進(jìn)站。
”整個(gè)決策過程是一個(gè)時(shí)序決策的過程,通過一套強(qiáng)化學(xué)習(xí)算法,并結(jié)合大數(shù)據(jù)模型生成數(shù)據(jù),這一整套框架應(yīng)用能夠于F1賽車的場(chǎng)景。”邊江說,在方程式賽車中,該基礎(chǔ)模型能夠優(yōu)化賽車的輪胎維修策略,根據(jù)賽車輪胎的損耗和維修成本,找到最佳的進(jìn)站維修時(shí)間,以縮短賽程、提高賽車排名。
邊江也表示,“我們已將大模型與強(qiáng)化學(xué)習(xí)結(jié)合,使其能夠提供高質(zhì)量的離線數(shù)據(jù),幫助學(xué)習(xí)泛化性很強(qiáng)的策略。
對(duì)于大模型在產(chǎn)業(yè)落地過程中的成本問題,邊江認(rèn)為,考慮成本時(shí),不同的角度會(huì)有不同的應(yīng)對(duì)策略。
“站在微軟的角度,我們可以為客戶提供不同成本的解決方案。比如預(yù)測(cè)類的任務(wù),可以將其作為一種云服務(wù)進(jìn)行提供,這種模式特別適合中小企業(yè),他們不需要自行處理大規(guī)模數(shù)據(jù),只需收集幾個(gè)、幾十個(gè)樣本,就能利用我們的大模型,通過“上下文學(xué)習(xí)”(in context learning),實(shí)現(xiàn)有效的預(yù)測(cè)。”
在邊江看來,另一個(gè)平衡成本的例子是采用基于檢索增強(qiáng)生成(RAG)的方法進(jìn)行知識(shí)管理,這也是大模型落地的很好的場(chǎng)景。
“我們已與物流公司合作處理海關(guān)通關(guān)的知識(shí)管理,以及與醫(yī)藥公司合作進(jìn)行FDA審批的知識(shí)管理中使用了這樣的方式。這種方法的優(yōu)點(diǎn)在于,企業(yè)不需要自己訓(xùn)練大模型,只需調(diào)用我們提供的大模型API,并結(jié)合RAG進(jìn)行知識(shí)管理,就可以達(dá)到很好的效果。RAG是在已有的大模型基礎(chǔ)上進(jìn)行增強(qiáng),通過添加外部知識(shí)庫來實(shí)現(xiàn)更好的行業(yè)知識(shí)管理。”邊江說。
據(jù)了解,微軟近期發(fā)布了一個(gè)小模型Phi-3。小模型的優(yōu)勢(shì)是計(jì)算量的需求少,對(duì)于沒有大模型算力的公司,小模型既可以作為補(bǔ)充,也因?yàn)檩^低的能耗而具有優(yōu)勢(shì),不是所有任務(wù)都需要大模型。小模型也是微軟研究院預(yù)測(cè)的今年的AI重點(diǎn)的研究方向之一。
(邯鄲小程序開發(fā))
新 AI 系統(tǒng)可輔助外科醫(yī)生完成內(nèi)窺鏡手術(shù) 09:33:12
預(yù)約小程序功能豐富,特點(diǎn)鮮明,為用戶帶來全新體驗(yàn) 09:21:13
微信官方解答客戶端“消息撤回時(shí)限”:常規(guī)消息 2 分鐘、文件類 3 小時(shí) 08:57:28
消息稱淘寶、京東今年均取消 618 預(yù)售,5 月下旬現(xiàn)貨開售 08:54:01
對(duì)話微軟亞洲研究院邊江博士:如何推動(dòng)大模型在工業(yè)場(chǎng)景落地 08:51:56
客戶和商家的共同選擇,預(yù)約小程序原來有這么多優(yōu)點(diǎn)! 09:26:00