|
|
具身智能如何進(jìn)化?關(guān)鍵在于如何“試錯(cuò)” |
|
■孫長(zhǎng)銀
人類智能的進(jìn)化史,本質(zhì)上是一部“試錯(cuò)文明史”。從石器時(shí)代的工具打磨到現(xiàn)代科技的精密設(shè)計(jì),每一次認(rèn)知躍遷都源于對(duì)未知的探索與修正。具身智能作為人工智能的下一代范式,其核心在于“具身性”——通過(guò)物理“身體”與環(huán)境的交互,在試錯(cuò)中積累經(jīng)驗(yàn)、提升認(rèn)知,最終實(shí)現(xiàn)智能涌現(xiàn)。
2025年政府工作報(bào)告首次將具身智能列為國(guó)家未來(lái)產(chǎn)業(yè)培育重點(diǎn),其戰(zhàn)略意義不僅在于技術(shù)突破,更在于構(gòu)建一種“試錯(cuò)—認(rèn)知—進(jìn)化”的閉環(huán)邏輯,為智能體賦予適應(yīng)物理世界復(fù)雜性的能力。
然而,正如生物智能體的試錯(cuò)需要長(zhǎng)期不斷探索、量變引起質(zhì)變一樣,具身智能的“試錯(cuò)—認(rèn)知—進(jìn)化”也面臨著“達(dá)爾文進(jìn)化困境”。
物理試錯(cuò)的“達(dá)爾文進(jìn)化困境”
自然界中,獵豹為提升捕獵成功率需經(jīng)歷數(shù)百次失敗的追擊,人類嬰兒學(xué)會(huì)行走平均要跌倒2000次。對(duì)具身智能而言,這種在物理環(huán)境中試錯(cuò)的成本太高。
首先,硬件損耗與安全風(fēng)險(xiǎn)突出。機(jī)械臂碰撞、機(jī)器人跌落等意外可能造成精密傳感器、驅(qū)動(dòng)單元損壞,單次維修成本可達(dá)數(shù)萬(wàn)元,工業(yè)場(chǎng)景中更可能引發(fā)生產(chǎn)事故。
其次,環(huán)境復(fù)雜性導(dǎo)致試錯(cuò)效率低下。物理世界存在光照變化、動(dòng)態(tài)障礙物等不可控變量,智能體需應(yīng)對(duì)無(wú)限長(zhǎng)尾場(chǎng)景,遠(yuǎn)超算法預(yù)設(shè)邊界,如自動(dòng)駕駛路測(cè)百萬(wàn)公里仍難覆蓋極端天氣。
最后,知識(shí)遷移存在“仿真鴻溝”。虛擬訓(xùn)練依賴?yán)硐牖?,與真實(shí)物理參數(shù)(摩擦系數(shù)、材質(zhì)形變等)的細(xì)微偏差可能導(dǎo)致技能遷移失效,如家庭服務(wù)機(jī)器人常因地面材質(zhì)差異導(dǎo)致避障失敗。
此外,倫理與法律風(fēng)險(xiǎn)不容忽視。在醫(yī)療、公共安全等場(chǎng)景中試錯(cuò)可能威脅人身安全,易引發(fā)責(zé)任歸屬爭(zhēng)議。
硬件的高昂損耗與場(chǎng)景的不可逆性,共同構(gòu)成具身智能物理試錯(cuò)的核心限制。然而,試錯(cuò)又是認(rèn)知提升的必經(jīng)之路。正如生物學(xué)中“自然選擇”通過(guò)大量試錯(cuò)篩選最優(yōu)解,具身智能的發(fā)展也需經(jīng)歷類似的迭代過(guò)程,只是需要尋找破解物理試錯(cuò)困境之道。
生成式人工智能:突破試錯(cuò)的時(shí)空限制
近年來(lái),以生成式人工智能作為試錯(cuò)“場(chǎng)景加速器”的研究已成為熱點(diǎn)之一。科技部“新一代人工智能”重大項(xiàng)目已將生成式人工智能列為具身智能核心支撐技術(shù)。
本質(zhì)上,生成式人工智能通過(guò)創(chuàng)造高保真、高覆蓋、高風(fēng)險(xiǎn)的虛擬場(chǎng)景,融合自主評(píng)估與智能試錯(cuò)機(jī)制,可有效突破物理試錯(cuò)的時(shí)空與成本局限。例如,利用擴(kuò)散模型合成現(xiàn)實(shí)罕見(jiàn)的極端工況,消除傳統(tǒng)仿真無(wú)法覆蓋的“認(rèn)知盲區(qū)”;通過(guò)神經(jīng)輻射場(chǎng)(NeRF)技術(shù)構(gòu)建可微分物理環(huán)境,使虛擬試錯(cuò)能反向優(yōu)化世界模型參數(shù);基于GAN網(wǎng)絡(luò)可在稀疏數(shù)據(jù)場(chǎng)景下合成高密度訓(xùn)練樣本,支撐強(qiáng)化學(xué)習(xí)算法的快速收斂,等等。特別是通過(guò)生成對(duì)抗網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)的結(jié)合,人工智能系統(tǒng)可主動(dòng)探索人類預(yù)設(shè)規(guī)則之外的潛在場(chǎng)景,發(fā)現(xiàn)傳統(tǒng)方法論難以捕捉的系統(tǒng)性風(fēng)險(xiǎn)。
不過(guò),生成式人工智能雖能創(chuàng)造海量虛擬試錯(cuò)場(chǎng)景,但若缺乏對(duì)物理規(guī)律的深層理解,這些場(chǎng)景可能淪為無(wú)序的“數(shù)字游樂(lè)場(chǎng)”。
世界模型的價(jià)值正在于此——它為生成式人工智能的虛擬創(chuàng)造提供認(rèn)知框架,將隨機(jī)生成的場(chǎng)景轉(zhuǎn)化為可解釋、可遷移的“認(rèn)知燃料”。
世界模型:試錯(cuò)的“認(rèn)知羅盤”
以“世界模型”為認(rèn)知框架的系統(tǒng)工程,有望打破試錯(cuò)于“無(wú)序探索”的困境。世界模型基于人類對(duì)物理規(guī)律的抽象表征,為試錯(cuò)提供方向性約束與因果推理能力,進(jìn)而將試錯(cuò)從“行為-結(jié)果”的簡(jiǎn)單表象關(guān)聯(lián),升級(jí)為“變量-機(jī)制-現(xiàn)象”的因果推演。正如人類依靠大腦前額葉預(yù)判行為后果,具身智能可通過(guò)世界模型預(yù)測(cè)動(dòng)作鏈的影響。
試錯(cuò)機(jī)制與“世界模型”的協(xié)同演進(jìn),本質(zhì)上是智能系統(tǒng)從“被動(dòng)響應(yīng)”向“主動(dòng)認(rèn)知”的范式轉(zhuǎn)變。傳統(tǒng)智能系統(tǒng)依賴預(yù)設(shè)規(guī)則或大數(shù)據(jù)訓(xùn)練,僅能被動(dòng)響應(yīng)已知場(chǎng)景。而具身智能通過(guò)試錯(cuò)主動(dòng)探索環(huán)境邊界,世界模型則將這些經(jīng)驗(yàn)抽象為物理規(guī)律與因果關(guān)系的知識(shí)圖譜,形成“預(yù)測(cè)—驗(yàn)證—校正”的認(rèn)知閉環(huán)。
例如,自動(dòng)駕駛系統(tǒng)在虛擬試錯(cuò)中遭遇人工智能生成的極端暴雨場(chǎng)景,世界模型不僅預(yù)測(cè)輪胎打滑概率,更反向推演路面摩擦系數(shù)與制動(dòng)策略的關(guān)聯(lián),生成新的安全駕駛規(guī)則。這種協(xié)同突破了“數(shù)據(jù)喂養(yǎng)”的被動(dòng)邏輯:試錯(cuò)機(jī)制負(fù)責(zé)在虛實(shí)場(chǎng)景中主動(dòng)暴露認(rèn)知盲區(qū),世界模型則通過(guò)物理引擎與神經(jīng)符號(hào)推理,將離散經(jīng)驗(yàn)升華為可泛化的因果邏輯鏈,進(jìn)而推動(dòng)現(xiàn)有智能系統(tǒng)擺脫“刺激—反應(yīng)”的被動(dòng)鏈條,轉(zhuǎn)向以世界模型為基座的“假設(shè)—驗(yàn)證”主動(dòng)認(rèn)知范式。
試錯(cuò)驅(qū)動(dòng)認(rèn)知躍遷:重構(gòu)智能進(jìn)化新范式
試錯(cuò)機(jī)制與生成式人工智能、世界模型的協(xié)同,標(biāo)志著智能系統(tǒng)從“被動(dòng)觸發(fā)”到“主動(dòng)認(rèn)知”的范式躍遷。這種協(xié)同機(jī)制,本質(zhì)上是對(duì)生物進(jìn)化邏輯的數(shù)字化重構(gòu):生成式人工智能如同“基因突變”的加速器,不斷拓展試錯(cuò)邊界;世界模型則扮演“自然選擇”的裁判角色,基于物理規(guī)律對(duì)試錯(cuò)結(jié)果進(jìn)行因果評(píng)估與知識(shí)提煉。唯有二者耦合,虛擬試錯(cuò)才能超越單純的數(shù)據(jù)堆砌,進(jìn)化出指導(dǎo)現(xiàn)實(shí)行動(dòng)的認(rèn)知體系。
可喜的是,我國(guó)正以國(guó)家戰(zhàn)略牽引這場(chǎng)認(rèn)知革命:將具身智能作為認(rèn)知革命的核心抓手,構(gòu)建起以國(guó)家重大專項(xiàng)為引領(lǐng)、區(qū)域創(chuàng)新平臺(tái)為支撐、產(chǎn)學(xué)研深度融合的新質(zhì)生產(chǎn)力培育體系。
安徽大學(xué)具身智能研究院的成立正是對(duì)這一戰(zhàn)略圖景的落實(shí)舉措。該院依托光電信息獲取與防護(hù)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室、自主無(wú)人系統(tǒng)技術(shù)教育部工程研究中心、安徽省無(wú)人系統(tǒng)與智能技術(shù)工程研究中心等,聯(lián)合江淮前沿技術(shù)協(xié)同創(chuàng)新中心、科大訊飛、中科星馳等行業(yè)領(lǐng)軍企事業(yè)單位,打造思維“立交橋模式”,有機(jī)組織各方力量,協(xié)同推進(jìn)教育、科技、人才一體化合作,形成“錨定國(guó)家戰(zhàn)略方向、突破高校平臺(tái)瓶頸、加速產(chǎn)業(yè)協(xié)同創(chuàng)新”的產(chǎn)學(xué)研合作新模式。我們期待這種“立交橋式”產(chǎn)學(xué)研合作新模式,能為具身智能認(rèn)知進(jìn)化、技術(shù)轉(zhuǎn)化應(yīng)用、區(qū)域產(chǎn)業(yè)高質(zhì)量發(fā)展貢獻(xiàn)科技與人才力量。
(作者系安徽大學(xué)校長(zhǎng)、中國(guó)人工智能學(xué)會(huì)自主無(wú)人系統(tǒng)專委會(huì)主任,本報(bào)記者趙廣立整理)
《中國(guó)科學(xué)報(bào)》 (2025-04-23 第4版 綜合)