■孫長銀
人類智能的進化史,本質上是一部“試錯文明史”。從石器時代的工具打磨到現代科技的精密設計,每一次認知躍遷都源于對未知的探索與修正。具身智能作為人工智能的下一代范式,其核心在于“具身性”——通過物理“身體”與環境的交互,在試錯中積累經驗、提升認知,最終實現智能涌現。
2025年政府工作報告首次將具身智能列為國家未來產業培育重點,其戰略意義不僅在于技術突破,更在于構建一種“試錯—認知—進化”的閉環邏輯,為智能體賦予適應物理世界復雜性的能力。
然而,正如生物智能體的試錯需要長期不斷探索、量變引起質變一樣,具身智能的“試錯—認知—進化”也面臨著“達爾文進化困境”。
物理試錯的“達爾文進化困境”
自然界中,獵豹為提升捕獵成功率需經歷數百次失敗的追擊,人類嬰兒學會行走平均要跌倒2000次。對具身智能而言,這種在物理環境中試錯的成本太高。
首先,硬件損耗與安全風險突出。機械臂碰撞、機器人跌落等意外可能造成精密傳感器、驅動單元損壞,單次維修成本可達數萬元,工業場景中更可能引發生產事故。
其次,環境復雜性導致試錯效率低下。物理世界存在光照變化、動態障礙物等不可控變量,智能體需應對無限長尾場景,遠超算法預設邊界,如自動駕駛路測百萬公里仍難覆蓋極端天氣。
最后,知識遷移存在“仿真鴻溝”。虛擬訓練依賴理想化建模,與真實物理參數(摩擦系數、材質形變等)的細微偏差可能導致技能遷移失效,如家庭服務機器人常因地面材質差異導致避障失敗。
此外,倫理與法律風險不容忽視。在醫療、公共安全等場景中試錯可能威脅人身安全,易引發責任歸屬爭議。
硬件的高昂損耗與場景的不可逆性,共同構成具身智能物理試錯的核心限制。然而,試錯又是認知提升的必經之路。正如生物學中“自然選擇”通過大量試錯篩選最優解,具身智能的發展也需經歷類似的迭代過程,只是需要尋找破解物理試錯困境之道。
生成式人工智能:突破試錯的時空限制
近年來,以生成式人工智能作為試錯“場景加速器”的研究已成為熱點之一。科技部“新一代人工智能”重大項目已將生成式人工智能列為具身智能核心支撐技術。
本質上,生成式人工智能通過創造高保真、高覆蓋、高風險的虛擬場景,融合自主評估與智能試錯機制,可有效突破物理試錯的時空與成本局限。例如,利用擴散模型合成現實罕見的極端工況,消除傳統仿真無法覆蓋的“認知盲區”;通過神經輻射場(NeRF)技術構建可微分物理環境,使虛擬試錯能反向優化世界模型參數;基于GAN網絡可在稀疏數據場景下合成高密度訓練樣本,支撐強化學習算法的快速收斂,等等。特別是通過生成對抗網絡與強化學習的結合,人工智能系統可主動探索人類預設規則之外的潛在場景,發現傳統方法論難以捕捉的系統性風險。
不過,生成式人工智能雖能創造海量虛擬試錯場景,但若缺乏對物理規律的深層理解,這些場景可能淪為無序的“數字游樂場”。
世界模型的價值正在于此——它為生成式人工智能的虛擬創造提供認知框架,將隨機生成的場景轉化為可解釋、可遷移的“認知燃料”。
世界模型:試錯的“認知羅盤”
以“世界模型”為認知框架的系統工程,有望打破試錯于“無序探索”的困境。世界模型基于人類對物理規律的抽象表征,為試錯提供方向性約束與因果推理能力,進而將試錯從“行為-結果”的簡單表象關聯,升級為“變量-機制-現象”的因果推演。正如人類依靠大腦前額葉預判行為后果,具身智能可通過世界模型預測動作鏈的影響。
試錯機制與“世界模型”的協同演進,本質上是智能系統從“被動響應”向“主動認知”的范式轉變。傳統智能系統依賴預設規則或大數據訓練,僅能被動響應已知場景。而具身智能通過試錯主動探索環境邊界,世界模型則將這些經驗抽象為物理規律與因果關系的知識圖譜,形成“預測—驗證—校正”的認知閉環。
例如,自動駕駛系統在虛擬試錯中遭遇人工智能生成的極端暴雨場景,世界模型不僅預測輪胎打滑概率,更反向推演路面摩擦系數與制動策略的關聯,生成新的安全駕駛規則。這種協同突破了“數據喂養”的被動邏輯:試錯機制負責在虛實場景中主動暴露認知盲區,世界模型則通過物理引擎與神經符號推理,將離散經驗升華為可泛化的因果邏輯鏈,進而推動現有智能系統擺脫“刺激—反應”的被動鏈條,轉向以世界模型為基座的“假設—驗證”主動認知范式。
試錯驅動認知躍遷:重構智能進化新范式
試錯機制與生成式人工智能、世界模型的協同,標志著智能系統從“被動觸發”到“主動認知”的范式躍遷。這種協同機制,本質上是對生物進化邏輯的數字化重構:生成式人工智能如同“基因突變”的加速器,不斷拓展試錯邊界;世界模型則扮演“自然選擇”的裁判角色,基于物理規律對試錯結果進行因果評估與知識提煉。唯有二者耦合,虛擬試錯才能超越單純的數據堆砌,進化出指導現實行動的認知體系。
可喜的是,我國正以國家戰略牽引這場認知革命:將具身智能作為認知革命的核心抓手,構建起以國家重大專項為引領、區域創新平臺為支撐、產學研深度融合的新質生產力培育體系。
安徽大學具身智能研究院的成立正是對這一戰略圖景的落實舉措。該院依托光電信息獲取與防護技術國家重點實驗室、自主無人系統技術教育部工程研究中心、安徽省無人系統與智能技術工程研究中心等,聯合江淮前沿技術協同創新中心、科大訊飛、中科星馳等行業領軍企事業單位,打造思維“立交橋模式”,有機組織各方力量,協同推進教育、科技、人才一體化合作,形成“錨定國家戰略方向、突破高校平臺瓶頸、加速產業協同創新”的產學研合作新模式。我們期待這種“立交橋式”產學研合作新模式,能為具身智能認知進化、技術轉化應用、區域產業高質量發展貢獻科技與人才力量。
(作者系安徽大學校長、中國人工智能學會自主無人系統專委會主任,本報記者趙廣立整理)
《中國科學報》 (2025-04-23 第4版 綜合)