“雖然大家經(jīng)常討論的是聊天機器人或情感陪伴助手這些應用,但實際上,我們現(xiàn)在能看到大模型在工業(yè)領域有更多的落地場景,大模型的應用場景非常廣泛。”
近日,微軟亞洲研究院資深首席研究員、微軟亞洲研究院機器學習組和產(chǎn)業(yè)創(chuàng)新中心負責人邊江博士接受記者采訪時說,大模型已經(jīng)可以用于能源領域的電能產(chǎn)量預測,或者醫(yī)療領域的患者監(jiān)測預測。
圖源網(wǎng)絡/侵刪
“這些時序預測任務,在大模型中都有很好的落地場景,盡管目前還沒有太多人深入討論。”邊江說,“我們通過相關研究,并對一些技術增強了大模型的預測能力,包括決策能力。”
邊江分享了一個解決供暖和空調系統(tǒng)中的能源消耗問題的創(chuàng)新解決方案,實時分析外部天氣情況和建筑內部人流量的變化,實時調整空調設備的送風溫度和送風壓力,能源使用效率提升,能源消耗減少達30%。
這個被稱為“可優(yōu)化HVAC控制策略的強化學習”的技術,近日也在上海氣候周期入選2024年十大值得關注的氣候技術。
“這個算法的本質,其實是為了優(yōu)化長期的收益,來調整當前的決策。比如,空調系統(tǒng)可能每隔15分鐘或1小時就需要重新設定,這些設置不僅影響當前的溫控效果,還會影響到空調的長期能耗。強化學習需要處理的就是這種時序決策問題,即如何做出既考慮當前影響又優(yōu)化長期收益的決策。”邊江說,當然這里面臨的一個主要挑戰(zhàn)是環(huán)境動態(tài)變化。
“當時,我們在公司總部大樓測試這個算法,正好趕上加州的山火,這種大范圍的自然災害,顯著影響了美國西海岸的氣候,這類突發(fā)事件是我們以前沒有遇到過的挑戰(zhàn)。我們也設計了能夠適應這些復雜環(huán)境的算法,讓它做得更好。”邊江說,與當年AlphaGo處理的圍棋環(huán)境不同,圍棋的環(huán)境是靜態(tài)且封閉的,而HVAC系統(tǒng)則需要應對每天變化的氣候和不同的室內人員變動。
據(jù)了解,對于預測的算法,主要涉及兩種類型,一是時序預測,比如面向糖尿病患者,可以基于每五分鐘一次的血糖監(jiān)測數(shù)據(jù),預測其未來血糖的變化,這屬于時序數(shù)據(jù)的預測。另一種非時序數(shù)據(jù)的預測,即結構化的表格數(shù)據(jù),比如金融行業(yè)中用于檢測欺詐行為或反洗錢等。
“根據(jù)我們目前的研究,大模型在這些預測任務上具有很大的潛力,通過對現(xiàn)有大模型的微調,我們可以賦予它這種預測能力。”邊江說,它可以用于能源領域的電能產(chǎn)量預測,或者醫(yī)療領域的患者監(jiān)測預測。
“這些時序預測任務在大模型中也有很好的落地前景,盡管目前還沒有太多人對此有深入探討。我們已經(jīng)進行了相關研究,并通過一些技術增強了大模型的預測能力,包括決策能力。”
此前剛剛在上海結束的F1中國大獎賽,不少車隊也都融入了高科技。“車手應該在哪一圈進站更換輪胎,應該選擇換哪種類型的輪胎……”邊江說。
據(jù)了解,F(xiàn)1賽車有三種不同的輪胎:軟胎、中性胎和硬胎。軟胎盡管可以短時間內獲得快速圈速,但無法堅持太多圈,磨損較快;硬胎耐磨但圈速不如軟胎快;中性胎則介于兩者之間。這根據(jù)比賽情況決策何時進站、換胎,以及換什么類型的胎。同時進站策略也很關鍵,它取決于當前車手的賽道位置,比如是否處于比較擁擠的賽段,或者出站后是否會遇到慢車等情況,這些都是重要的決策點。因為每圈都要決定這一圈要不要讓車手進站。
”整個決策過程是一個時序決策的過程,通過一套強化學習算法,并結合大數(shù)據(jù)模型生成數(shù)據(jù),這一整套框架應用能夠于F1賽車的場景。”邊江說,在方程式賽車中,該基礎模型能夠優(yōu)化賽車的輪胎維修策略,根據(jù)賽車輪胎的損耗和維修成本,找到最佳的進站維修時間,以縮短賽程、提高賽車排名。
邊江也表示,“我們已將大模型與強化學習結合,使其能夠提供高質量的離線數(shù)據(jù),幫助學習泛化性很強的策略。
對于大模型在產(chǎn)業(yè)落地過程中的成本問題,邊江認為,考慮成本時,不同的角度會有不同的應對策略。
“站在微軟的角度,我們可以為客戶提供不同成本的解決方案。比如預測類的任務,可以將其作為一種云服務進行提供,這種模式特別適合中小企業(yè),他們不需要自行處理大規(guī)模數(shù)據(jù),只需收集幾個、幾十個樣本,就能利用我們的大模型,通過“上下文學習”(in context learning),實現(xiàn)有效的預測。”
在邊江看來,另一個平衡成本的例子是采用基于檢索增強生成(RAG)的方法進行知識管理,這也是大模型落地的很好的場景。
“我們已與物流公司合作處理海關通關的知識管理,以及與醫(yī)藥公司合作進行FDA審批的知識管理中使用了這樣的方式。這種方法的優(yōu)點在于,企業(yè)不需要自己訓練大模型,只需調用我們提供的大模型API,并結合RAG進行知識管理,就可以達到很好的效果。RAG是在已有的大模型基礎上進行增強,通過添加外部知識庫來實現(xiàn)更好的行業(yè)知識管理。”邊江說。
據(jù)了解,微軟近期發(fā)布了一個小模型Phi-3。小模型的優(yōu)勢是計算量的需求少,對于沒有大模型算力的公司,小模型既可以作為補充,也因為較低的能耗而具有優(yōu)勢,不是所有任務都需要大模型。小模型也是微軟研究院預測的今年的AI重點的研究方向之一。
(邯鄲小程序開發(fā))