大模型在先,小模型在后,生成式AI試水工業(yè),如何破局數(shù)據短缺/可靠性不足?
作者:彭昭(智次方創(chuàng)始人、云和資本聯(lián)合創(chuàng)始合伙人)物聯(lián)網智庫 原創(chuàng)
這是我的第352篇專欄文章。
在我之前的文章《從LLM大模型到SLM小模型再到TinyML,這個領域有望增長31倍》中,曾經提到小模型SLM的進展,如今這一領域正在悄然發(fā)生突破。
小模型SLM,可以看作是大模型LLM的“迷你版”,它們雖然體型小巧,但卻擁有著不容小覷的能力。相比動輒數(shù)百萬、數(shù)十億參數(shù)的GPT-4等大模型,SLM的運行規(guī)模要簡單得多。經過優(yōu)化的SLM能夠高效處理較為簡單的任務,而無需消耗大量計算資源。
如今,小模型正朝著產業(yè)落地的方向大步邁進,它們不再是實驗室里的“玩具”,而是正在成為各行各業(yè)的“生力軍”。
科技巨頭們已經嗅到了小模型的無限潛力,紛紛加入這場爭奪未來的戰(zhàn)局。
微軟、谷歌和蘋果等公司均已入局小模型SLM,例如微軟的Phi-3、谷歌的Gemma和蘋果的Foundation Models。
最近,微軟更是推出了適用于工業(yè)領域的全新AI小模型。
通過與拜耳、羅克韋爾自動化、西門子等公司合作,這些小模型使用行業(yè)特定數(shù)據進行了預先訓練,可用于處理一些關鍵問題。這就像是為每個行業(yè)量身定制了一套“智能裝備”,讓AI的力量深入到每個生產環(huán)節(jié),提升效率、優(yōu)化流程、創(chuàng)造價值。
今天這篇文章,我們將一起探索小模型在工業(yè)應用中的最新進展,了解它們所蘊藏的機遇與挑戰(zhàn)。
小模型與AI代理:下一個熱門?
首先,我們需要進一步理清大模型與小模型之間的區(qū)別,如上圖所示。
小模型之所以“小”,不僅僅在于其參數(shù)數(shù)量較少,更重要的是,小模型常常在小型數(shù)據集上進行微調,以優(yōu)化其在特定任務上的性能,使其更加契合業(yè)務工作流的需求。
小模型的強項在于處理特定任務和工作流程。盡管參數(shù)數(shù)量有限,但當使用定制數(shù)據集針對特定領域任務進行微調時,小模型完全能夠勝過大型通用模型。針對特定任務的訓練可以減輕幻覺現(xiàn)象,增強問題解決能力。
資源效率是小型語言模型的另一大亮點,對于希望跨越各種平臺和設備實施AI解決方案的企業(yè)來說,它們尤其具有吸引力。小模型使企業(yè)能夠以更簡單的基礎架構和更低的成本,充分享受AI帶來的優(yōu)勢。據測算,小模型可以節(jié)省高達75%的模型訓練成本和超過50%的總部署成本。
在小模型的基礎上,我們還可以玩出許多新花樣。
一些公司將小模型用于AI代理工作流中,其中多個小模型通過通信和協(xié)作來執(zhí)行更加復雜的任務。
例如,在AI代理工作流中,第一個AI代理可能負責規(guī)劃如何解決任務,第二個AI代理進行必要的研究,第三個AI代理執(zhí)行該計劃,第四個AI代理則驗證和評估結果。這種協(xié)作方式展示了這些模型如何協(xié)同工作,以提高生產力并實現(xiàn)更復雜的結果。
說到這里,我來解釋一下什么是AI智能代理。
AI代理的官方定義是一種能夠感知環(huán)境、進行決策和執(zhí)行動作的智能體。
簡而言之,ChatGPT不屬于AI代理,但戰(zhàn)勝李世石的AlphaGo可以被視為AI代理。
目前,我們與AI的交互形式基本上都是先輸入指令,AI模型根據指令內容做出響應,這就導致我們每次都需要提供有效的提示詞,才能達到預期效果。
而AI代理則不同,它被設計為具有獨立思考和行動能力的AI程序。我們只需要提供一個目標,比如寫一個游戲、開發(fā)一個網頁,AI代理就會自主生成一個任務序列,開始工作。
讓我們通過幾個例子來更深入地理解AI代理。
一個初級的AI代理,是家中的空調自動控制系統(tǒng)。它遵循簡單的“如果-那么”原則運行:如果溫度低于設定點,則打開空調暖風;如果溫度高于設定點,則關閉空調暖風。這種基礎的AI代理雖然簡單,但在日常生活中已經發(fā)揮了重要作用。
而高級的AI代理,如DeepMind的AlphaGo,則是專為復雜的圍棋而設計的人工智能系統(tǒng)。AlphaGo展示了非凡的學習能力,最終擊敗了世界冠軍圍棋選手。這一里程碑式的事件,彰顯了AI代理在處理復雜任務方面的巨大潛力。
就像俄羅斯套娃一樣,多個初級和高級的AI代理可以建立起分層代理系統(tǒng)。
分層代理是一種將復雜任務分解為更簡單的子任務,并以分層結構組織起來的AI系統(tǒng)。這種方法允許代理管理不同級別的抽象,更有效地處理復雜問題。
分層代理的一個典型例子,就是亞馬遜Amazon Go商店的“Just Walk Out”技術。該系統(tǒng)在運作中表現(xiàn)出了清晰的層級結構:
頂層:整體商店管理和庫存跟蹤
中級:客戶跟蹤和行為分析
低級:產品識別和交互檢測
最低級別:傳感器數(shù)據處理和融合
依靠這些AI代理的協(xié)同工作,Amazon Go以“不用排隊,拿了就走”的全新購物體驗,在零售行業(yè)和科技圈吸引了無數(shù)目光。
上述案例只是冰山一角,AI代理在實際應用中的想象力正在被激發(fā)。
小模型與Copilot覆蓋超100家公司12萬用戶
在了解了小模型與AI代理的概況后,讓我們一起探索微軟與工業(yè)企業(yè)的最新合作。
本次嘗試微軟小模型的企業(yè)包括拜耳、羅克韋爾自動化、西門子、Sight Machine等。
以羅克韋爾自動化為例,該公司從操作層面開始嘗試應用小模型。在人機界面可視化平臺FactoryTalk Optix的食品和飲料版本中,他們運用小模型,將行業(yè)特定功能的優(yōu)勢帶給制造業(yè)一線工人,支持食品和飲料領域的資產故障排除。AI模型為工廠車間工人和工程師提供關于特定制造流程、機器和輸入的實時建議、解釋和知識。
另一款產品FactoryTalk Design Studio是羅克韋爾自動化專注于系統(tǒng)設計的云原生軟件,它使用Copilot增強了PLC代碼創(chuàng)建和用戶管理。工程師能夠使用自然語言提示執(zhí)行產品指導、代碼生成、故障排除和代碼解釋等任務,使系統(tǒng)設計更快、更直觀。
同樣,西門子正在為CAD解決方案NX X軟件引入全新的Copilot。該軟件利用經過調整的AI模型,使用戶能夠通過自然語言提問、獲取詳細的技術見解并簡化復雜的設計任務,實現(xiàn)更快、更智能的產品開發(fā)。
目前,包括舍弗勒和蒂森克虜伯自動化工程在內的100多家公司正在使用西門子工業(yè)Copilot來簡化流程、解決勞動力短缺問題并推動創(chuàng)新。12萬名西門子工程軟件用戶,現(xiàn)在有機會通過生成式AI驅動的助手來提升工作效率。
作為敢于吃螃蟹的用戶,蒂森克虜伯自動化工程公司是首家使用Copilot的公司,并且計劃從2025年初開始,在該公司的全球體系內普及應用。
根據實踐,工程師現(xiàn)在可以在30秒內創(chuàng)建可視化面板,并生成代碼,根據經驗這些代碼僅需20%左右的調整就可以直接應用。這簡化了工作流程,減少了人工工作量,解決了熟練勞動力短缺的問題。
就具體場景而言,蒂森克虜伯使用AI輔助開發(fā)用于生產汽車電池的自動化系統(tǒng)。例如在一臺電池質量的檢測裝置中,傳感器、攝像頭和測量系統(tǒng)集成在一起,監(jiān)控多個階段的電池單元質量,進行復雜的評估以檢測超出設定閾值的放電。Copilot通過自動執(zhí)行多個任務,如數(shù)據管理、傳感器配置、電池質量檢測等各個重復性步驟,輔助操作員增強了該設備的運行效果。
Copilot:工業(yè)生成式AI的現(xiàn)實角色
在工業(yè)領域,“想到”和“做到”完全是兩碼事,生成式AI的工業(yè)價值尚需被驗證。
古人云“欲得其利、先知其弊”,要充分發(fā)揮小模型的優(yōu)勢,就必須了解它的局限性。
生成式AI的弊端在于可靠性較低,具有不可解釋性,只能應用于對可靠性要求不高的場合。
小模型的缺點則是精度有限,無法捕捉大規(guī)模和復雜數(shù)據集中的細致特征和關系,預測能力相對較弱;此外,它們難以應對復雜問題。這些弊端決定了小模型只能承擔輔助思考的角色,為我們提供更多可行性方案作為選擇,而最終決策仍需由人來做。
在實際應用過程中,也是挑戰(zhàn)重重。
工業(yè)領域廣泛使用AI的最大障礙是數(shù)據的缺失。由于工業(yè)涉及設備、工藝、操作、環(huán)境等多重因素影響,獲取大量且多維的全面數(shù)據難度很大。大多數(shù)制造商雖然坐擁數(shù)據,但其中大部分是時間序列數(shù)據,沒有得到適當?shù)臉藴驶,甚至無法用于AI的模型訓練。
數(shù)據問題的本質,很多時候不單純是技術問題,而是人員和流程問題。不成熟的數(shù)據管理流程、始終存在的OT與IT鴻溝,以及缺乏對小模型的理解,都是導致生成式AI目前僅限于一次性試點或實驗的因素。
因此,目前生成式AI在工業(yè)領域更多以虛擬助手的功能存在,并將會持續(xù)較長時間。
這些AI虛擬助手為工廠車間操作員提供指導,或幫助控制工程師編寫PLC代碼。鑒于當前吸引和留住工廠車間人才的挑戰(zhàn),Copilot能夠輕松幫助合成實時信息或提供編碼輔助。
過去,工程師需要熟悉云平臺、傳感器、物聯(lián)網、人工智能和不同類型的時間序列和工程數(shù)據,而生成式AI則允許工程師輕松進行數(shù)據查詢、可視化和工作流程,而無需擔心復雜性。操作員可以按需提出問題,而不需要了解軟件。
許多制造企業(yè)配備了復雜的系統(tǒng)和更多的自動化設備,但那些擁有幾十年經驗與知識的資深員工卻逐漸離開了職場,制造商們很難找到年輕的技術人員來維護現(xiàn)有的系統(tǒng)。Copilot可以成為幫助縮小這一差距的工具。
例如,工業(yè)軟件企業(yè)Aveva的AI助手可以幫助操作員回答以下問題:上個月車間的最大產量是多少?或者為什么這臺壓縮機本周效率較低?杜邦公司也已經開始使用生成式AI來幫助工程師更快地找到信息,生成式AI可以節(jié)省數(shù)小時的手冊搜索時間。
這些Copilot就像操作員的專家顧問,根據需要建議如何提高產量、降低能耗等。從某種意義上說,它們與原有的“專家系統(tǒng)”并沒有本質區(qū)別,是否采納這些建議取決于操作員。
面臨的挑戰(zhàn)也與過去的“專家系統(tǒng)”大同小異:如何建立對顧問的信任。工廠中的新配方經常出現(xiàn),如果沒有適當?shù)母潞途S護,專家系統(tǒng)也會很快過時。另一個風險在于,如何檢查和驗證所有生成式AI的輸出。AI不會說“我不知道”;如果沒有數(shù)據,它可能會進行編造。
寫在最后
在這個萬物互聯(lián)、智能無處不在的時代,小模型和生成式AI正在工業(yè)領域掀起一場革命。從制造車間到產品設計,從運營優(yōu)化到故障診斷,AI正在重塑著每一個環(huán)節(jié)。
然而,我們也必須清醒地認識到,工業(yè)領域的AI應用之路并非坦途。數(shù)據缺失、可靠性不足、解釋性有限等挑戰(zhàn),都在提醒我們要謹慎對待這項新興技術。盡管如此,我們仍然有理由對未來保持樂觀。
隨著技術的不斷進步和企業(yè)實踐的深入,人機協(xié)作將更加緊密,小模型和生成式AI也將在工業(yè)領域釋放出更大的潛力。
參考資料:
《忍不住談談工業(yè)大模型》,作者:郭朝暉,來源:蟈蟈創(chuàng)新隨筆
《Microsoft Introduces New Adapted AI Small Language Models for Industry》,作者:Colin Masson,來源:ARC Advisory Group
《What is Agentic AI? Is It the Next Big Thing?》,作者:Nora He,來源:arcee.ai
原文標題 : 大模型在先,小模型在后,生成式AI試水工業(yè),如何破局數(shù)據短缺/可靠性不足?

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?