一级黄网站_波多野结衣片子_欧美性极品_熟女高潮一区二区三区_亚洲最大成人在线_xxx在线播放

<dfn id="bdmgo"></dfn>

首頁人工智能AI 正文

物理AI 如何變革機器人產業？英偉達與宇樹、銀河通用創始人閉門會全實錄

人工智能AI2025-08-11

黃仁勛在今年多次演講中提到，英偉達（NVIDIA）正積極布局“物理AI”。物理AI將使機器人和自動駕駛汽車等自主機器具備運動技能，從而幫助它們理解并與現實世界互動。黃仁勛強調，物理AI將為機器人領域帶來革命性突破，并直言：“我們已經進入AI推理時代，下一波浪潮將是物理AI”。在2025世界機器人大會上，英偉達Omniverse和仿真模擬技術副總裁Rev Le...

黃仁勛在今年多次演講中提到，英偉達（NVIDIA）正積極布局“物理AI”。

物理AI將使機器人和自動駕駛汽車等自主機器具備運動技能，從而幫助它們理解并與現實世界互動。黃仁勛強調，物理AI將為機器人領域帶來革命性突破，并直言：“我們已經進入AI推理時代，下一波浪潮將是物理AI”。

在2025世界機器人大會上，英偉達Omniverse和仿真模擬技術副總裁Rev Lebaredian表示，物理AI將撬動萬億美元級的實體經濟。與IT產業的5萬億美元規模相比，制造、物流、醫療等物理產業的總量是其百倍之多。若機器人能夠將計算能力與這些產業連接，將極大提升生產力，帶來指數級的變化。

會后，英偉達的Rev Lebaredian與其機器人生態伙伴銀河通用和宇樹科技的創始人王鶴、王興興，以及多家媒體，進行了一場閉門交流會，再次深入探討物理AI在未來的發展路徑。

在會上，Rev Lebaredian對中國市場在物理AI領域的發展表示高度認可。他向騰訊科技表示：“中國在物理AI和機器人領域具備獨特的規模和人才優勢，形成了獨一無二的生態系統。中國不僅在制造電子硬件和機器人關鍵部件方面具備深厚的專業能力，還擁有全球領先的制造規模。這些優勢為物理AI和機器人產業的快速發展奠定了堅實的基礎”。

以下為交流會完整版實錄：

物理AI如何變革機器人產業？-1.jpg

英偉達Omniverse和仿真模擬技術副總裁 Rev Lebaredian

01 英偉達副總裁Rev Lebaredian：

物理AI將計算帶入現實世界的智能革命

過去三四十年里，我們建立了計算機產業和 IT 產業，它們放大了各行各業的能力。但計算的影響大多還停留在“信息空間”——也就是可以數字化的內容，比如語言和各種可編碼的信息。

互聯網的出現，讓計算技術真正走進每個人的生活，把所有人連接起來，并帶來了幾十年的增長。從全球市場規模來看，相比IT行業的總規模約為 5 萬億美元，這雖然龐大，但與全球所有行業超過100萬億美元的總量相比，只是很小的一部分。其它行業之所以更有價值，是因為它們處理的是真實世界的“原子”——交通、制造、供應鏈、物流、醫療、制藥等涉及物理世界的領域。

而今天，隨著人工智能的出現，我們終于有了讓機器具備“物理智能”的能力，可以把物理世界和信息世界真正連接起來。換句話說，計算的力量不再只局限于那 5 萬億美元的信息市場，而是可以進入那 100 萬億美元的物理世界市場。而這個橋梁，就是機器人。有了機器人，我們就能把計算和人工智能帶進真實世界，創造出能理解并改變物理環境的智能體。

中國是實現這一跨越的最佳地點，因為這里具備獨一無二的條件：

頂尖 AI 人才：全球近一半的人工智能研究人員和開發者在中國，其中包括來自頂尖大學的最優秀人才。

電子與計算技術能力：中國不僅有技術研發能力，還有全球無可匹敵的電子制造產業，這在物理 AI 和機器人領域至關重要。

龐大的制造業基礎：這里有大規模部署和測試機器人的真實場景，可以快速收集數據、迭代算法，讓機器人不斷進化。

因此，在世界機器人大會上看到如此多的能量、能力和熱情，并不令人意外。

NVIDIA 也為這幅拼圖貢獻了獨特的一塊。我們早已夢想參與解決這一問題，并為此努力了很長時間。在機器人領域，我們打造了三臺計算機：

機器人本體計算機：嵌入在機器人內部，例如自動駕駛汽車或人形機器人中的計算機。專門為人形機器人打造的Jetson Thor就屬于這一類，今年在 WRC 展會上，就可以在 Galbot 和其他展出的機器人上看到它們的身影。

AI 工廠計算機：在使用機器人本體計算機之前，必須先開發它的“大腦”。需要依賴 DGX 和 HGX 系統，處理海量原始數據，生成物理 AI 算法、物理 AI 模型和神經網絡，再部署到機器人上。

仿真計算機：物理世界的數據無法直接從互聯網獲取，只能通過兩種方式獲得：真實世界傳感器采集；基于物理定律和世界規則進行計算機仿真生成。仿真不僅能生成數據，還能在部署前測試機器人，確保它們在真實環境中安全運行，且測試速度可快于現實時間。

在機器人領域，NVIDIA 擁有完整的Isaac 平臺，它結合了硬件與三臺計算機所需的軟件棧，包括：運行時和計算環境、仿真工具、訓練框架。NVIDIA Jetson Thor是一款專為物理世界中的智能推理代理（特別是機器人）打造的超級計算機，黃仁勛稱它為“實時推理機器”。

Jetson Thor 性能亮點：

計算能力是上一代 Jetson Orin 的 7.5 倍，接近 10 倍；

每瓦性能提升 3.5 倍；

CPU 性能提升 3.1 倍；

I/O 吞吐量提升 10 倍，滿足高帶寬感知需求。

Isaac 平臺還包括 NVIDIA 的模擬器與仿真框架：

Isaac Sim：環境和傳感器仿真、機器人測試、生成合成數據。

Isaac Lab：強化學習的仿真平臺。

NVIDIA Cosmos：世界基礎模型及框架，支持構建理解物理世界的 AI，并與 Omniverse 等模擬器結合，來生成更精確、更大規模的數據。

世界基礎模型雖然還處在起步階段，尚不能完全理解世界，但已經非常有用，并為機器人研發帶來了全新能力。

02 宇樹科技王興興：

AI與機器人協同進化，邁向下一個科技時代

物理AI如何變革機器人產業？-2.jpg

宇樹科技CEO 王興興

在過去幾年，我們非常重視人形機器人這一方向。某種意義上，我將人形機器人視為通用機器人的重要載體。眾所周知，通用AI是目前全球最主流的發展方向，而真正的通用AI在執行任務時必然離不開機器人，尤其是通用型機器人。

對比來看，目前人形機器人反而是最理想的專業機器人形態。雖然看上去較為復雜，但實際結構并不如想象中那么復雜，本質上是由若干關節電機串聯而成。因此結構相對簡單，不像履帶式小車或其他形式的機器人反而更復雜。

我一直相信，當通用AI大規模成熟后，每個人都可以輕松制造一臺人形機器人，就像今天人們可以購買電腦零部件組裝一臺電腦一樣。未來若AI足夠強大，對硬件的要求會越來越低。

我們在去年5月發布了一款機器人，當時售價約9.9萬元人民幣，至今依然具備很強的市場競爭力。它的關節數量和靈活性表現優秀，且在發布后，其架構已成為全球較為主流的設計構型。

去年下半年及今年，不少新興機器人公司的新產品在架構上與這款相似，僅在外觀上存在差異。我們設計的造型流暢且結構簡單，而其他造型可能更復雜且不夠美觀，因此該產品在市場上競爭力較強。

近期我們又發布了新的版本。雖然涂裝稍顯花哨，但我們希望客戶可以自由改裝和噴涂外觀，例如更改顏色或增加個性化裝飾。許多客戶在戶外直播時會為機器人穿衣、戴帽或假發，創造出多種造型。外觀和造型的可定制性對于客戶體驗至關重要。這款新版本售價約3.9萬元人民幣，全球競爭力強，且性能表現出色。目前現貨可供，預計量產在年底前完成。

此外，我們近期發布了A2機器狗，其最大特點是在緊湊輕量化設計下實現了較大負載能力。自重約37千克，持續負載可達30千克，空載續航可行駛20公里。其外觀吸取了以往的設計經驗，更具科幻感，且具備防塵防水性能。我們一直希望機器人能在工業場景中替代人類完成繁重、危險或重復性工作。我們的機器狗在一些公益項目中已實現24小時不間斷運行，具備自動充電和巡邏檢測功能。

去年底我們升級了輪式機器人，這款產品較大，自重約70~80千克，因此部分場景不便使用。為此，我們推出了更小型且防塵防水的版本，適用于室內外多種場景。雖然體型較大，但靈活性依然優秀。通常小型機器人靈活性更強，而大型機器人靈活性較差，但我們在較大尺寸下依然保證了良好的運動性能。

今年1月，我們的機器人登上央視春晚，最大亮點是全自動編隊跳舞。它在頭部配備三個激光雷達，可自動建圖并變換隊形。為適應舞臺演出，我們將后臺控制權交給舞臺控臺，使音樂與動作實現毫秒級同步。此次演出共有16臺機器人，統一連接至我們后臺服務器，再接入舞臺系統。該項目的最大挑戰在于多機協作及復雜的編程維護。目前，這些機器人在澳門美高梅每日進行表演。

在動作學習方面，我們通過采集人體動作數據并結合深度強化學習進行訓練。不同于語言模型訓練，動作訓練只需少量真實數據，其余由強化學習完成。我們主要使用NVIDIA的Isaac Sim平臺進行訓練，已掌握舞蹈、跳躍、空翻等多種動作。當前限制機器人執行更復雜動作的最大因素并非算法，而是硬件物理極限。例如，要將奔跑速度從每秒3~4米提升到10米，對硬件的改進需求極高。

我們同樣重視機器人上肢和手部的研發，目前已自主開發一款約20自由度的靈巧手，目標是讓機器人真正能夠執行日常任務，而不僅是完成展示性動作。希望在未來一到兩年內實現自然交互，例如在沒有預先適配的情況下，直接指令機器人去為某人倒水。

今年5月底，我們與央視合作舉辦了一場機器人格斗賽，時長約1.5小時，包含4個團隊參賽。格斗賽的算法復雜度高于舞蹈或功夫表演，因為動作組合是隨機且存在強干擾，要求動作銜接流暢并可自由組合。我們的目標是在未來實現“任意動作的任意實時生成”。

此外，我們還發布了R1機器人，重量約25千克，輕便且安全。雖然體積較小，但動力性能強勁，主要面向工業應用。其算法與人形機器人類似，但由于四足機器人的穩定性更好，可完成更劇烈的動作而不易損壞，且具備較強的越障能力。

回顧過去，AI與機器人技術的發展始終是全球協作的成果，包括NVIDIA在內的多方力量一直推動機器人與AI領域的全球合作。在通用智能大模型和真正能執行任務的機器人普及之前，我們仍需共同努力，推動人類進入下一個科技時代。我相信，AI與機器人技術將像電力與蒸汽機的發明一樣，使人類文明邁向新的高度。

03 銀河通用王鶴：

合成數據是推動具身智能快速落地的關鍵

物理AI如何變革機器人產業？-3.jpg

銀河通用CEO 王鶴

今天在場的所有機器人公司，包括NVIDIA和銀河通用在內，我們的共同目標都是打造通用機器人。這樣的通用機器人將成為下一個價值數萬億美元、數萬億人民幣市場的關鍵性、革命性產品。

這種革命性產品背后包含多個核心要素：

第一個要素是機器人的本體；

第二個要素是驅動它運轉的具身智能模型；

模型背后則是數據支撐——什么樣的數據能訓練出這樣的能力。

接下來，我將依次分享銀河通用在這些方面的探索與成果，并介紹最終落地的產品。

銀河通用與其他公司的不同之處在于，我們的機器人并非完全人形，而是輪式雙臂雙手的形態。我們采用輪式底盤，主打高續航、工業級安全性，以及可實現大規模、高可靠交付的能力。銀河通用G1機器人于2024年5月首次亮相，經過一年多迭代，目前在自動充電、運行流暢度與穩定性方面均已達到大規模自主商用的標準。

我們在中國將NVIDIA Jetson Thor芯片部署于人形機器人之中，也是全球最早收到該芯片的公司之一，并在本次WRC大會上實現了現場部署。在演示中，配備該芯片的機器人展現出絲滑的運動性能以及實時的貨箱視覺處理與運動規劃能力，速度顯著提升，贏得現場觀眾一致評價為“最快的人形機器人”。這背后離不開強大芯片的支撐。

我們的機器人之所以能夠在復雜環境中高效導航，源于銀河通用長期研發的大規模具身大模型VLA。其中，導航大模型只需一句話指令即可在場景中自主運動。 “六一”兒童節前夕，我們全球首發了無需建圖、可在任何復雜場景中跟隨人的TrackVLA，能夠自然語言交互、穿梭障礙物，全程自主運行，即使在人流干擾下也能穩定跟隨。

上半身操作方面，我們首發了抓取基礎大模型Grasp VLA，實現了抓取動作的實時閉環生成。在各種光照條件和挑戰性背景下，均能實現指定物體的零樣本抓取，且無需事先訓練該物體。這為未來“自然語言+即時執行”奠定了基礎。

基于Grasp VLA，我們打造了零售場景應用，無論瓶裝、袋裝、散裝、掛裝或軟體物品，均可由同一模型完成抓取與遞送。這是全球首個可應對50多種不同物體擺放、且從剛體到軟體全覆蓋的端到端零售大模型。

銀河通能在全球率先推出多款基礎大模型，并能在真實商店場景穩定應用，得益于全套仿真引擎。我們與NVIDIA一致認為，合成數據是推動具身智能快速落地的關鍵。目前，真實世界數據僅占我們訓練數據的1%，其余99%均為合成數據。

我們將自研機器人模型、大量物體與材質資產輸入合成管線，生成全球首個百億級抓取操作大數據集，以及全球首個百億級柔性物體操作大數據集。這些數據使我們的模型在真實環境中具備極高的魯棒性與泛化能力。

目前銀河通用為輪式形態，下一代將采用純雙足設計。無論在仿真環境還是現實環境，該平臺可訓練并部署多種任務能力，例如推車、拾取地面物體等。

銀河通用的多項技能已實現完全商用。我們推出了全球首個24小時無人藥房解決方案，在北京、上海、深圳等地簽約超過100家藥店。用戶通過APP下單后，由機器人在店內完成取藥并交付外賣員。2024年，我們還官宣了24小時無人零售店項目，將在10個城市的百處核心商圈和旅游景點部署銀河通用“太空艙”零售終端，銷售飲品等商品。

媒體交流環節：

04 物理AI的未來：

通過專用計算平臺打破通用計算的限制

問題：英偉達此次在2025世界機器人大會展示了一系列物理AI成果。物理AI，特別是在機器人領域，對能耗、熱管理和體積限制有很高的要求。請問NVIDIA是如何應對這些挑戰的？未來的計算平臺又將如何滿足這些需求？

Rev：回顧歷史，NVIDIA每一代產品都會大幅提升每瓦性能和每美元性能。過去我們有摩爾定律，意味著計算能力會以指數速度增長——在最佳階段，每五年性能提升10倍，十年提升100倍。但單靠摩爾定律已經不足以解決我們面臨的許多問題。

我們預見到，摩爾定律在CPU和通用計算機上的效用會逐漸終結。為此，我們致力于打造針對特定算法的專用計算機。這種專用計算機不僅僅是芯片層面，更需要算法、軟件以及應用層面的整體優化，才能發揮最大性能。這并非靠單一因素，比如芯片變小或變快，而是通過全棧優化實現的。這是一項非常艱難的工程，也正是NVIDIA的核心競爭力所在。

我們最初應用這套方法于計算機圖形渲染（尤其是游戲領域），隨后推廣到其他領域。CUDA推出后，我們開始應用于物理仿真，后來深度學習和AI在GPU上興起，我們不斷專門化處理器。每一代產品，在相同功耗和成本下都實現了顯著的性能飛躍，未來仍會持續，因為我們的創新之路還遠未走完。

問題：關于中國市場，相比其他國家，你怎么看中國AI的需求和實踐中的挑戰？

Rev：中國既是一個重要的市場，也是AI技術和產品的生產基地。中國擁有大量聰明、受過良好教育且充滿熱情的AI研究人員和開發者，全球近一半頂尖AI人才都集中在這里，且中國擁有頂尖的AI高校。

在物理AI和機器人領域，中國擁有獨特的規模優勢，結合人才優勢，形成了獨一無二的生態系統。中國在制造電子硬件和機器人所需關鍵部件方面具備深厚的專業能力，這樣的生態體系和制造規模是其他國家難以匹敵的。這使得像銀河通用、宇樹科技這樣的企業，能夠大規模制造機器人，快速學習和迭代。中國獨特的綜合條件為物理AI和機器人產業的快速發展提供了堅實基礎。

問題：在像醫療和養老這樣高精度應用場景中，NVIDIA Omniverse如何確保用仿真數據訓練的機器人具備可靠性和安全性？

Rev：如果你想構建一個能夠在現實世界中行動且安全可靠的機器人系統，實際上唯一的選擇就是使用仿真。

以自動駕駛為例，我們絕對不希望車撞到人或者孩子，但當街上出現小孩時，車輛的大腦該如何反應，如何獲取訓練這類系統的數據呢？唯一的辦法就是通過仿真。因為我們絕不可能將孩子置于汽車前作為訓練樣本，這樣做是不道德的、危險的，而且耗時且昂貴。

即使訓練完系統，在將它部署到現實世界之前，也需要在這些相同場景中進行測試，確保在真正發生類似情況時，它能夠正確反應。因此，真正的選擇只有通過仿真實現，因為現實世界測試過慢、成本高且危險，我們不希望機器人在現實世界先失敗。

換句話說，如果我們無法讓仿真足夠準確以測試機器人，那么我們將無法制造出可靠的機器人。幸運的是，目前已有非常準確的仿真器。不過，這些仿真器計算量大且成本高昂，我們面臨的真正挑戰是如何提升仿真速度，使其在大規模系統構建中具有成本效益，這也是我們一直努力的方向。

問題：未來幾年內，驅動人工智能機器人的仿真領域會有哪些關鍵技術趨勢將改變整個行業？能否分享一些中國生態合作伙伴如何利用NVIDIA仿真技術加速產品創新的案例？

Rev：我認為目前最大的趨勢，實際上是所有在常規人工智能領域出現的技術和發展，正被應用到物理人工智能中。其中最重要的突破是推理能力的提升。比如DeepSeek將推理能力帶入了開源領域，現在我們也看到了其他各種模型。

我們在智能水平上實現了飛躍，將同樣的技術應用到物理人工智能，是機器人領域的一個重大突破。我們的機器人將能更自然地與人互動，并完成復雜的多步驟任務。這是非常關鍵的能力。而將這種能力與仿真結合，我認為這是一個可能還未被廣泛理解，但將成為重大突破的點。

目前我們面臨的主要問題是人工智能極度依賴數據，而獲取合適的數據非常困難。我們現有的推理模型，尤其是對物理世界的推理，現在可以幫助我們改善數據生成和數據創建的流程。

如今我們生成的數據，即使是合成數據，也需要大量人工參與，人工去構建虛擬世界和仿真環境，判斷該生成哪些數據才能讓智能系統更聰明。但是，如果我們把正在開發的人工智能技術用在數據生成流程中，就可以實現自動化，打造“自動駕駛”的合成數據生成。

如果我們擁有一個自動駕駛的合成數據生成工廠，就能直接將其接入訓練流程，實現訓練過程自動化，減少人為干預，讓機器人大腦更聰明。至于中國的企業如何應用仿真技術及其帶來的影響，我認為他們已經在積極探索和應用這些技術。

王鶴：我認為，隨著仿真引擎和并行渲染器的進步，合成數據的生成變得更加高效，無論是通過強化學習，還是通過數據生成后再進行模仿學習，整體的難度大大降低。無論是人形機器人行走、跳舞等技能的訓練，還是抓取、疊衣服和導航等任務的背后，都離不開高效的仿真器和并行渲染器。我們非常感謝英偉達在這一過程中作為生態合作伙伴的支持，從芯片到仿真平臺，為整個行業提供了強有力的支撐。

問題：請問NVIDIA Jetson Thor與之前的Jetson平臺有何區別？它如何特別有利于機器人應用？

Rev：每一代Jetson產品，我們都努力最大化其計算能力，因為智能問題本身就是一個非常復雜的計算難題。在機器人領域，這一挑戰更大：計算必須非常快速，且在極為苛刻的環境中進行。

機器人往往在現場實時運行，需要在緊湊的循環內完成計算，電力有限，因此需要盡可能降低功耗以延長電池壽命，同時還要考慮散熱等問題。這些因素都極大地增加了難度。

Jetson Thor與之前版本最大的不同是，現在具備了足夠的計算能力，能夠運行更大、更強的神經網絡和模型，支持更復雜的推理任務，這是之前的產品無法做到的。此外，Jetson Thor擁有更高的帶寬，能更快地處理來自各種傳感器的大量信息，使機器人能夠快速反應，在動態變化的環境中高速移動和操作。

問題：NVIDIA 在機器人訓練中強調仿真優先的策略，并推出了一系列支持技術。然而，仿真到現實（Sim2Real）之間的差距仍然存在挑戰。NVIDIA 如何與合作伙伴共同應對這一問題？能否分享一些具體的客戶案例或合作項目，展示這一方法的有效性？展望未來，提升仿真物理真實性和增強現實世界遷移效率的關鍵方向有哪些？

Rev：這是一個非常好的問題。如果我們依賴仿真來構建和測試AI，就必須確保仿真盡可能接近現實，否則我們無法信任它。我們構建的AI如果是在一個“卡通世界”里訓練的，是無法真正理解現實世界的；因此，測試時也必須確保仿真場景與現實相符。那么，如何彌合仿真與現實之間的差距呢？其實可以通過多種方式，我們也在全力推進這些方法。

首先，是提升仿真器本身的精度。我們幾十年來一直在構建物理仿真算法，且驗證了這些算法能夠較好地反映現實世界的物理規律。比如我們利用仿真設計飛機機翼和汽車，確保空氣動力學性能，并驗證仿真結果與真實世界匹配。問題是這些高精度仿真計算成本極高，通常需要在大型計算機上運行數小時。挑戰就在于如何將仿真速度提升到足夠快，能夠嵌入AI訓練流程中，實現大規模、高效的數據生成和測試。

為此，我們正在利用AI本身作為提升仿真速度和精度的工具。AI能夠近似任何數學函數，我們可以將物理仿真函數轉換為AI函數，構建AI模擬器完成仿真。只要提供足夠的示例數據，AI就能學習仿真功能。這正是我們正在開發的“Cosmos”項目。這些“世界基礎模型”是能理解世界物理規律的AI模型，我們可以將真實世界數據和可信仿真數據輸入這些模型進行訓練。一旦有了這樣理解世界的AI基礎模型，就可以將其與傳統仿真結合，構建更精準、更高效的仿真器。

其次，即使擁有高質量的仿真器，構建代表現實世界的數據也非常困難。以這個房間為例，雖然仿真器可以模擬物理現象，但我們還要創造帶有正確物理參數（如摩擦系數、材料特性）的桌布和桌子，這類信息采集非常復雜。

目前，全球只有少數專業人士，比如通常是游戲或電影行業的藝術家具備這類能力。但隨著我們構建具備物理理解能力的AI，這些AI可以輔助生成這些虛擬環境，成為“機器人藝術家”，幫助我們高效創建真實感十足的虛擬世界。

第三種方法是直接捕捉現實世界。我們也利用物理AI技術將現實環境（例如我們身處的房間）數字化、導入仿真環境，確保虛擬場景與現實高度一致。

NVIDIA正在這三個方向全面發力，打造相關技術，但這項工作遠超過任何一家公司的能力。我們正與整個生態系統的合作伙伴協同推進，爭取在這三條路徑上共同攻關。事實上，我們已經積累了不少成果，目前已有的仿真器已經能夠生成足夠高質量的數據，助力我們提升AI性能。

05 多模態大模型發展面臨數據稀缺

仿真技術成突破數據瓶頸的關鍵

問題：OpenAI最近發布了GPT-5，給人的印象是技術突破不大，而且它更像是一個系統，而非單一模型。我們是否可以理解為大模型的擴展定律（Scaling Law）遇到了一些挑戰？

王鶴：目前大模型類型繁多，有純文本大模型，有圖文大模型，圖文大模型又分為視覺理解型和視頻生成型，包括我們具身智能的VLA也是一種大模型。所以說，是否可以說大模型的擴展遇到了瓶頸，無法簡單地用一個統一的結論來概括。

我理解，在當前純文本階段，我們主要的數據源是互聯網公開數據，但很多私域知識并不在網上，這導致模型的推理能力實際上需要的數據與公開數據有差異。除非能通過某種可控的方式獲得額外數據增強，否則單靠公開數據提升模型能力是有限的。

這部分能力的增長，并不會自然地通過單純擴大模型規模實現。但不能低估推理模型的進展，比如在IMO國際數學競賽上，文模型獲得金牌，面對從未見過的題目表現出色，這說明文本大模型的能力在不斷提升。

關于多模態大模型（比如VLM和VLA），如果說文本模型現在能力已經很強了，那么多模態模型目前還處于比語言模型稍弱的階段。其核心原因是數據不足：文本數據非常豐富，而文本-圖像配對數據相對較少，再加上動作數據更少，因此視覺理解能力和基于視覺的動作操作能力還有較大差距。

這也是為什么合成數據和仿真技術非常重要。正如Rev所說，仿真能夠將真實世界場景和動作復現到虛擬環境，生成大量帶動作、圖像和語義配對的數據，這將極大促進圖文、多模態大模型及具身智能大模型的發展。

如果完全依賴真實數據，進展會受到很大限制。總體來看，充分利用仿真技術，我相信將是多模態大模型和具身大模型應對數據瓶頸的最有效途徑。

問題：當前一些專家認為，目前機器人領域的大模型架構尚未統一。針對具身智能大腦的基礎模型，宇樹科技主要聚焦哪些方向的探索？能否透露一些具體內容？

王興興：我一直覺得目前的模型架構確實非常不統一，這導致大家的整體進展沒有那么快。如果模型架構能更加統一、方向明確，結合當前行業熱度，大家其實能更快取得突破。但現實是，目前進展還是比較緩慢。

我們公司探索了很多方向。比如今年上午也展示了我們去年嘗試的一個用視頻生成模型作為“世界模型”，來驅動并對齊機械臂的項目，這個嘗試取得了一定效果。但由于視頻生成模型訓練規模極大，考慮到我們公司的算力和投入，難以進行大規模訓練。

而且我們嘗試發現，這類模型的泛用性還不能完全滿足預期，因此后來基本沒有繼續使用。但最近谷歌發布了一個新的視頻生成模型，其物理對齊效果非常好，并且他們公開嘗試把視頻生成模型作為世界模型，直接用于機械臂和通用智能。這讓我覺得這個方向非常值得重新探索。

由于公司規模和算力人才限制，我們只是初步探索，沒有深入推進。但谷歌的成果證明這個方向很有潛力。視頻生成模型在時間內容、數據源以及效果方面，已經達到不錯的預期。舉例來說，如果控制視頻生成模型生成一個機器人打掃全屋的視頻，而且效果不錯，理論上只要把視頻與機器人動作對齊，也能實現類似效果。

不過，目前對齊工作仍然非常復雜且具有挑戰性。這個方向無論是對機器人應用，還是純視頻生成技術本身，都是非常主流且值得投入的。即便不用于機器人，視頻生成技術也會持續被大公司加大投入、不斷優化。

除此之外，還有其他方案。隨著基礎模型能力快速提升，很多潛力尚未被充分挖掘。我們發現，如果在基礎模型后訓練時加入機器人指令控制和空間理解訓練，效果能明顯提升。比如王賀老師團隊展示的一些基于基礎模型的機器人控制效果就非常不錯。

我們公司的策略很簡單：不斷嘗試各種新模型和新想法。今天可能有一種想法，明天可能會調整，這很正常。對于新興技術，我認為大家都應該大膽嘗試。AI領域充滿了可能性，往往一個靈光一閃的創意就能帶來突破。希望鼓勵更多人去探索，或許下一個創新就出自你手。

問題：目前限制人形機器人規?；渴鸬年P鍵技術瓶頸是什么？

王鶴：當前限制人形機器人規?；渴鸬暮诵钠款i非常明確——機器人完成任務的能力仍然不足，能夠執行的任務類型有限。然而，如果能在這些有限的技能范圍內實現高度通用化，就能迅速擴展其應用場景。

銀河通用目前的主要突破集中在“抓取”和“移動”能力上。只要機器人能夠抓取任何物體、實現下肢的移動和上肢的伸展，并且能夠準確放置物體，這三個基本能力就能支持許多實際應用場景。背后需要一個精準的目標識別與定位系統，目前我們正在通過合成數據推動這一技術的發展。

盡管解決了這些關鍵問題，仍有很多任務機器人暫時無法完成，但只要目標識別與定位技術得到突破，未來人形機器人市場至少能達到千億級規模，并且在五年內實現顯著成效。解決這一技術瓶頸后，憑借龐大的市場投資，機器人將解鎖更多技能，邁向萬億市場的步伐。

06 機器人硬件成本降低：

不再是商業化障礙，具身智能模型的泛用性才是關鍵

問題：機器人為什么要做雙足？除了情感價值，雙足在商業上還有哪些考慮？

王興興：采用雙足設計其實相對更為簡便，最關鍵的是雙腿能提供更強的通用性。運動能力本質上是相對較弱的AI能力。舉個例子，雖然小動物、螞蟻甚至蟲子走路非常靈活，但它們的AI能力卻并不強。因此，我一直認為，真正具備通用性和執行力的具身AI模型，移動能力和腿部的控制只是附加的部分。

如果機器人能夠完成任務，那么腿的控制自然不會差；如果連腿的控制都做不好，說明它還未達到通用AI模型的階段。所以，雙足設計是一個自然而然的發展方向。盡管雙足機器人仍然面臨一些挑戰，但我們公司專注于腿部設計，因此這一方向對我們來說既是順理成章的，也是非常有趣的。

目前市場上大部分公司都在做輪式底盤，這可能導致同質化競爭，但我們認為沒有必要跟風。輪式底盤在工業開闊場景和貨架間穿梭時非常穩定且能耗低，但在復雜環境中的適應性較差，若底盤進一步縮小，穩定性會下降。

因此，在不同的應用場景中，機器人下半身的方案需要根據需求靈活調整。我們堅信，雙足設計是未來的發展方向，因為它能覆蓋上半身所有可達空間，并提供更靈活的腰部運動。然而，在不同的階段，最適合落地應用的形態會有所不同，我們并不局限于單一方案。目前，我們同時在進行輪式底盤和人形機器人下半身控制的研究，力求在多個維度實現最優解決方案。

問題：目前，國內外專家和企業對“人形”的必要性爭議不斷，有人認為人形是AGI的最終載體，有人認為未來十年人形機器人的占比只有10%，銀河通用如何看待人形的必要性？

王鶴：從長遠來看，人形機器人無疑是要融入人類的生活中。以終局視角來看，人形機器人除了能干活、能夠伸手達到1米或2米的高度，甚至能觸及地面，它還能在我們的環境中靈活穿梭，除了人形，它沒有其他合適的形態。

未來幾年，人形機器人將從移動復合機器人不斷發展，向更高的智能化和靈活性邁進。如果是一個定點機器人，它所能完成的任務僅限于眼前的工作，這樣的局限性是巨大的，因此，具備移動能力是必然趨勢。單純的移動小車，只能用于承載貨物，不能完成任何復雜的操作。我們目前設計的機器人，便是在一個移動平臺上加入了可升降和可折疊的功能，配備兩根機械臂，能夠進行更靈活的操作。

對于未來十年人形機器人的占比問題，雖然與其他工業機器人相比，當前人形機器人的市場規模較小，但隨著技術的進步，我預期其產值將呈現指數級增長。以當前情況來看，每年頭部企業銷售約1000臺人形機器人，而三年后，這一數字將達到1萬臺，再三年后可望達到10萬臺。即使每臺售價數十萬元，人形機器人市場的總產值也將突破1000億人民幣，超越整個工業機械臂市場。

在未來十年內，我們將看到一個超越當前所有工業機器人市場規模的機器人行業。而進一步來看，十年后人形機器人市場可能會超越汽車和手機產業，成為萬億級市場。因此，雖然短期內這一市場并不會快速達到與汽車產業相當的規模，但其未來的潛力和影響力不可小覷。

問題：既然機器人能取代很多比如養老等工作，之后的生育率會不會降低？

Rev：我認為，生育選擇與機器人數量之間并不存在直接關聯。然而，有一點是明確的：當社會人口增長時，GDP和生產力通常也會隨之增長。社會的生產能力與人口規模直接掛鉤，而目前大多數國家正面臨人口縮減的趨勢，這可能導致經濟增長停滯，甚至出現萎縮。

如果不采取有效的應對措施，經濟將不可避免地走向衰退。因此，發展機器人技術以補充“人工人口”，幫助完成各類工作并提升生產力，已成為一項緊迫的任務。這不僅有助于維持當前的生產力水平，還能推動社會的進一步發展。

問題：宇樹R1定價3.99萬元，大幅降低消費級人形機器人的門檻，這是否意味著硬件成本已不再是影響機器人商業化的障礙？現階段，推動人形機器人規?；逃眠€存在哪些難點？

王興興：我一直在分享的一個觀點是，雖然人形機器人價格已經大幅降低，比如宇樹R1定價3.99萬元，但對于人形機器人的基層商業化而言，硬件成本并非最關鍵的障礙。事實上，即使機器人的價格高達10萬或100萬，只要能實現功能，仍然可以在很多場景中應用。

目前的最大難題，實際上還是具身智能模型的泛用性和實用性。盡管硬件的成本和性能在過去幾年已經取得了很大進展，但模型的適用范圍和實用性仍需進一步提升，這是當前最棘手的問題。硬件已不再是限制性因素，盡管我們仍然需要在可靠性和成本控制等方面做得更好，但真正的挑戰在于如何優化和完善具身智能模型，使其具備更廣泛的應用能力。

問題：宇樹科技曾提到人形機器人已經從當前主要應用于娛樂表演的特定場景，逐漸加速進入解放工廠和家庭生產力的應用。未來機器人在哪些場景會迎來大規模普及？

王興興：未來，機器人肯定會朝著更加實用的方向發展，但這一進程仍然需要時間。無論是在工業、服務業，還是家用領域，整個行業的成熟周期都相對較長。回顧過去，比如新能源車，十幾年前大家也認為它們會迅速發展，但實際情況是，整體成熟度花了更多時間。

每個產業的成熟都需要較長的周期。而目前的新一代人形機器人或通用機器人技術，其實才發展了兩到三年。與十幾二十年前的技術相比，現在的硬件和軟件已經發生了巨大變化。然而，許多人在談論機器人時，依然習慣將過去的標準套用在今天的技術上，認為機器人行業已經發展很久，但當時的技術與現在的水平無法相提并論。盡管當前技術仍處于發展初期，整體進展還需要更多時間，但從目前的發展速度來看，我個人認為這個行業仍在快速增長，未來幾年，人員和出貨量有望每年翻倍，這對整個行業來說是非常有可能的。

如果未來能夠推出更強大、更通用的AI大模型，機器人將能在工廠、家庭等更多通用場景中表現得更好。因為越通用的機器人，普及的難度就越小。相反，如果機器人缺乏通用性，推廣將面臨更大挑戰。因此，我認為整體的發展周期會比較長，尤其是在家用領域。

家用機器人的最大挑戰并非技術本身，而是涉及倫理、安全等高標準的要求，這使得家用機器人的普及面臨更高的門檻。

問題：今年，許多人形機器人已開始在汽車工廠進行訓練。機器人真正能在工廠車間投入工作還需要多長時間？還有哪些關鍵挑戰需要解決？

王鶴：今年，許多人形機器人已開始在汽車工廠進行訓練。大多數公司在工廠中部署人形機器人時，主要集中在兩個領域：一是搬運，二是分揀。

在搬運方面，銀河通用最近展示的機器人，其搬運速度已經接近人類水平，經過計算，每小時搬運的數量與人工相當。這一階段已經接近實際工廠部署，我預計到今年年底，銀河通用將有幾十臺機器人進入工廠車間實際應用。

然而，搬運只是第一步。除了搬運，機器人還需要實現碼垛的閉環能力，只有搬運和碼垛兩個環節完成閉環，機器人才能真正勝任整個工作流程。如果只完成其中一部分，效果將大打折扣。

分揀則是更為復雜的挑戰。不論是從傳送帶上取貨，還是從貨架上拿取物品，當前最大難點在于速度。盡管機器人在模型和硬件方面已有進展，但目前還難以達到熟練工人那樣的速度和精度。

我們在零售機器人的應用中，涉及的物品取放與工業分揀有很多相似之處，只是零售對節拍的要求較低，拿錯貨的后果相對較輕。而在工業環境中，特別是汽車制造廠，一條產線停工一分鐘可能帶來巨大的經濟損失，因此，分揀的速度和精度要求極高。

綜上所述，雖然分揀技術已有明顯進步，但目前還未達到人類工人的水平，仍需要進一步的技術迭代和突破。

標簽AI 機器人英偉達銀河通用宇樹科技

上一篇：大廠戰投，重現活躍

下一篇：英偉達帝國“王儲”曝光：黃仁勛的一兒一女