久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來

五大巨頭聚首論道具身智能:數(shù)據(jù)與仿真策略分歧下,未來路在何方?

   時(shí)間:2026-03-23 16:55 來源:快訊作者:陸辰風(fēng)

在近日舉辦的GTC具身智能論壇上,特斯拉、Physical Intelligence(PI)、Agility Robotics、Skild AI及Hexagon等企業(yè)的技術(shù)領(lǐng)袖齊聚,圍繞自動(dòng)駕駛數(shù)據(jù)遷移、仿真與現(xiàn)實(shí)差距跨越等核心議題展開深度探討。與會(huì)者提出,盡管人形機(jī)器人與自動(dòng)駕駛在數(shù)據(jù)需求上存在共性,但技術(shù)路徑的差異與場景復(fù)雜度仍構(gòu)成關(guān)鍵挑戰(zhàn)。

特斯拉AI軟件副總裁Ashok Elluswamy指出,自動(dòng)駕駛數(shù)據(jù)遷移至人形機(jī)器人需精準(zhǔn)篩選。他以特斯拉車隊(duì)為例,強(qiáng)調(diào)并非所有數(shù)據(jù)價(jià)值均等——專業(yè)司機(jī)的駕駛數(shù)據(jù)比賽車手?jǐn)?shù)據(jù)更具實(shí)用性。這一邏輯同樣適用于機(jī)器人:特斯拉工廠中數(shù)十萬員工執(zhí)行的物理任務(wù),為人形機(jī)器人Optimus提供了關(guān)鍵學(xué)習(xí)樣本。通過攝像頭采集的互聯(lián)網(wǎng)視頻雖數(shù)據(jù)量龐大,但如何篩選有效信息、評(píng)估其對(duì)任務(wù)目標(biāo)的貢獻(xiàn),成為技術(shù)落地的核心問題。

Agility Robotics CTO Pras Velagapudi提出“數(shù)據(jù)金字塔”模型,將數(shù)據(jù)按采集難度與價(jià)值分層:頂層為遙操作機(jī)器人數(shù)據(jù),底層為通用視頻。他強(qiáng)調(diào),頂層數(shù)據(jù)雖精準(zhǔn)但稀缺,需結(jié)合下層數(shù)據(jù)預(yù)訓(xùn)練模型。例如,在與客戶合作時(shí),團(tuán)隊(duì)通過分層利用數(shù)據(jù),既用頂層數(shù)據(jù)完成核心任務(wù),又借助底層數(shù)據(jù)提升模型泛化能力。然而,合規(guī)與監(jiān)管限制(如部分區(qū)域禁止部署監(jiān)控系統(tǒng))導(dǎo)致運(yùn)營數(shù)據(jù)采集面臨挑戰(zhàn),部分場景僅能獲取部分觀測數(shù)據(jù)。

Physical Intelligence聯(lián)合創(chuàng)始人Chelsea Finn則從跨形態(tài)數(shù)據(jù)利用角度提出新思路。她發(fā)現(xiàn),當(dāng)模型訓(xùn)練數(shù)據(jù)覆蓋多種機(jī)器人形態(tài)時(shí),反而能更高效遷移人類視頻中的信息。例如,網(wǎng)絡(luò)視頻中的人類動(dòng)作數(shù)據(jù),結(jié)合輪式、四足等機(jī)器人數(shù)據(jù)訓(xùn)練的模型,在泛化能力上優(yōu)于僅使用人形機(jī)器人數(shù)據(jù)的模型。這一發(fā)現(xiàn)挑戰(zhàn)了“形態(tài)越接近人類、遷移效果越好”的直覺,為數(shù)據(jù)利用提供了新方向。

在機(jī)器人架構(gòu)設(shè)計(jì)上,分層模型成為共識(shí),但具體實(shí)現(xiàn)路徑各異。Agility Robotics的Digit機(jī)器人采用任務(wù)層、技能層、控制層分層架構(gòu),控制層由RL驅(qū)動(dòng),通過域隨機(jī)化技術(shù)應(yīng)對(duì)環(huán)境變化(如不同摩擦系數(shù)的地面)。Physical Intelligence則將分層架構(gòu)與單一模型結(jié)合,上層負(fù)責(zé)抽象規(guī)劃(如語言指令理解),下層執(zhí)行具體動(dòng)作,實(shí)現(xiàn)15分鐘多步驟任務(wù)(如泡咖啡)。特斯拉的方案更強(qiáng)調(diào)端到端統(tǒng)一性:所有層級(jí)在同一模型內(nèi)運(yùn)行,共享信息以降低決策延遲,適應(yīng)人形機(jī)器人對(duì)實(shí)時(shí)性的高要求。

Hexagon Robotics則探索多模型編排,通過“機(jī)器人提示工程”整合感知、規(guī)劃、控制模塊。Arnaud Robert比喻道,這類似于為ChatGPT設(shè)計(jì)提示詞,但需額外注入環(huán)境信息(如產(chǎn)線變化)。團(tuán)隊(duì)還構(gòu)建了高精度與快速移動(dòng)的混合模型架構(gòu),根據(jù)任務(wù)需求動(dòng)態(tài)切換,解決單一模型在精度與速度上的矛盾。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容