物理人工智能，加速走進現實世界-紫荊網

物理人工智能，加速走進現實世界

日期：2026-06-15 來源：人民日報瀏覽量：字號：大中小

分享到

從讀懂圖片的“視覺”，到寫出文字的“表達”，再到創造視頻畫面的“想象”，當下，AI正持續“進化”。

學會看、寫、生成之後，AI還能做什麼？近年來，科技界正在探索推動AI從虛擬走向現實的技術路徑。一種新的技術理念——物理AI越來越受關注。

物理AI與生成式AI有何不同，適用哪些場景？如何理解物理AI與具身智能的關係，技術落地又有什麼挑戰？記者採訪了相關業內專家。

升級

讓AI進化為與現實世界交互的智能體

什麼是物理AI？簡單說，我們可以將其理解為走出屏幕、進入現實的AI智能體，它能如人一般感知環境、“動手”操作。

北京通用人工智能研究院—德塔智能聯合實驗室負責人馬曉健認為，物理AI有3個重要特徵：能力建立在真實物理交互數據之上、包含對物理世界的理解以及能部署到真實實體上。

這意味着，物理AI知道物體的運動、接觸、變形，了解摩擦、重力、空間關係和因果變化等，並能據此預測未來、規劃動作，從而在開放環境中完成任務。

從技術演進角度看，物理AI是AI發展到一定階段的自然方向。

“第一階段AI通過計算機視覺學會了‘看’，第二階段AI通過自然語言處理學會了‘寫’，當前通過物理AI要學會‘行動’。”百度智能雲主任架構師應茹介紹，物理AI的出現，讓AI從信息處理工具進化為能夠與現實世界交互的智能體。

過去大模型主要是復現人的語言、知識和推理能力，相當於進入人的精神世界；但人的智能並不只體現在大腦中，還體現在與物理世界的互動裡。“當AI在語言和多模態理解上取得突破後，下一步必然是把這種智能外化到真實世界，讓機器能夠感知、行動、試錯和完成工作。”馬曉健說。

物理AI和生成式AI的差異，主要體現在技術原理和承載任務上。

具體來說，物理AI的重要能力是在物理世界中承載運動控制、環境交互等任務；而生成式AI的重要能力是文、圖、視頻生成等，支撐內容創作、代碼編寫、數據分析等任務。

“物理AI和生成式AI屬於AI的兩種不同分類維度。”馬曉健介紹，兩者正在深度結合。比如，生成式AI強大的語言理解、場景生成、規劃和代碼生成能力，可以幫助物理AI更好地理解任務、構建仿真環境等。

挑戰

從模型、數據到承載本體，物理AI落地面臨多重難題

過去數年，科技界從核心算法到工程本體，多措並舉推進物理AI落地。

比如，用於模擬環境動態並預測未來狀態的世界模型被稱為物理AI的“內部大腦”。學界專家提出世界模型的3項重要能力，即生成性、多模態、交互性，為物理AI搭建起環境理解、因果推斷與任務規劃的框架。

當前，“視覺—語言—動作”大模型迭代演進，為物理AI築牢模型底座。

馬曉健介紹，目前落地物理AI大致分為3類技術路線。第一類是“預訓練—後訓練”範式，即先利用互聯網視頻、第一視角視頻、跨機器人操作數據等開展大規模預訓練，再依託遙操作數據、強化學習或真機微調完成後訓練；第二類是“現實—仿真—現實”範式，即先把真實世界的幾何、材質、動力學等信息重建到高仿真環境中，讓機器人在“數字孿生”場景中大量試錯，再遷移部署至實體設備；第三類是大模型編程路線，依託語言模型，根據任務生成機器人控制程序，串聯感知、規劃、執行等功能模塊。

不同的技術實現路線，各有優劣。

比如，“預訓練—後訓練”範式路徑清晰，但對數據質量、機器人本體一致性和真實交互數據體量要求極高。由於物理AI尚未規模化落地生產生活，難以低成本、高效率採集海量訓練數據，這成為制約技術落地的瓶頸之一。

又比如，“現實—仿真—現實”範式的優勢在於以仿真算力替代成本高昂、周期漫長的真實數據採集。然而，複雜接觸、柔性形變、流體運動、非平整地面等物理過程仍難以高精度實時模擬。

“由於真實世界工況繁雜、多種物理因素相互影響，仿真系統無法完整復刻物理細節，有時僅能作為真實數據缺失時的補充方案。”北京微鏈道愛科技有限公司總經理張宇說。

“總體看，3條路線大概率不會互相取代，而是在數據、仿真和大模型推理層面逐步融合。”馬曉健說。

物理AI與具身智能又是什麼關係？簡單說，具身智能是物理AI的重要載體，物理AI是落地具身智能的核心技術路徑。不過，物理AI落地具身智能的過程中，在硬件本體工程化層面仍存諸多挑戰。例如，具身智能執行任務時，需適配複雜動作控制算法。倘若硬件精度不達標，極易影響軟硬件深度耦合。業界專家表示，近些年，我國機器人核心零部件國產化水平提升顯著，但諧波減速器等關鍵零部件的加工精度距離國際先進水平仍有提升空間。

前景

依託豐富應用場景優勢，物理AI持續迭代

雖然存在阻力，但業內專家普遍看好物理AI產業化落地前景。

一方面，物理AI與大模型發展底層邏輯相通，依託更大規模的數據採集、性能更強的模型、系統化評測與持續迭代，產品能力將穩步提升。另一方面，物理AI不必等到完全研發出通用類機器人才算實現產業化。在垂直細分場景中，只要模型可在同類任務中展現優良泛化能力，便是重要的階段性成果。

在未來，低空經濟、新能源電池、具身智能、高端芯片、航空航天等需要複雜場景仿真與優化的前沿領域，均是物理AI的落地方向。馬曉健認為，在一些不適合人類長期作業、傳統自動化又難以完全解決的場景，物理AI有望最先落地。

電力巡檢便是這樣一個場景。在西南偏遠地區，過去需要工作人員翻山越嶺檢查設備，現在北京人形機器人創新中心研製的“天工”機器人可實現戶外巡檢、變電倒閘操作、配網接地線掛載等複雜任務。

“物理AI並不是為了替代所有自動化。”馬曉健說，如果任務高度規整、流程固定，傳統工業自動化往往更便宜、更穩定。物理AI真正有優勢之處在於執行環境多變、需要實時感知和靈活決策，同時兼具重複性或高危屬性的任務。

在產業界，物理AI模型訓練效率也在持續提升。

“得益於在AI基礎設施領域的常年積澱，我們將‘視覺—語言—動作’大模型訓練速度提升70%，世界模型推理時延下降50%。原本以周為單位的訓練周期，如今可壓縮至小時級。”百度集團執行副總裁、百度智能雲事業群總裁沈抖表示。

如何更好推進物理AI落地？

當前物理AI仍處在技術路線尚未收斂的發展階段。“我們要鼓勵差異化、多路線並行探索。”馬曉健認為，產業政策與科研扶持不宜扎堆單一技術熱點，應引導企業、高校和科研院所圍繞模型、控制、仿真、傳感器、靈巧手、本體結構等方向開展多元化攻關。此舉既能規避押注單一路線的研發風險，也有助於補齊我國在算法、硬件、製造和系統集成領域的全鏈條產業部分短板。

物理AI真正落地，不靠實驗室演示，而是依託真實場景的數據反饋與持續迭代。

業內人士認為，應用場景資源充沛是我國發展物理AI的獨特優勢。“讓技術深入礦井、工廠、倉儲、巡檢現場等一線場景，物理AI才能更好形成‘場景—數據—模型—產品’良性閉環。”馬曉健說。