久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

具身智能新突破:Pi 0.6機器人借助RLT,快速掌握精細(xì)操作進廠有望

   時間:2026-03-21 16:42 來源:快訊作者:馮璃月

在工業(yè)自動化領(lǐng)域,機器人能否勝任高精度操作一直是制約其廣泛應(yīng)用的關(guān)鍵瓶頸。近日,具身智能領(lǐng)域傳來突破性進展:Physical Intelligence團隊研發(fā)的RLT技術(shù),通過為機器人添加"精細(xì)動作外掛",成功實現(xiàn)用十幾分鐘真實數(shù)據(jù)攻克擰微型螺絲、插網(wǎng)線等毫米級精度任務(wù),部分場景效率甚至超越人類操作水平。

傳統(tǒng)機器人訓(xùn)練面臨兩難困境:重新訓(xùn)練整個大模型需要海量算力和漫長周期,而直接部署又難以應(yīng)對工廠場景中"差之毫厘謬以千里"的精度要求。以擰M3螺絲為例,螺絲刀尖與抓取點存在10厘米距離,手腕微小偏移都會導(dǎo)致刀尖產(chǎn)生數(shù)倍誤差,更遑論從攝像頭視角難以捕捉的接觸過程。研究團隊創(chuàng)新性地采用"主腦+外掛"架構(gòu),在保留VLA大模型通用能力的同時,通過RL token技術(shù)實現(xiàn)精準(zhǔn)動作的局部強化。

這套系統(tǒng)的工作原理猶如為機器人配備"智能手術(shù)刀"。VLA大模型首先生成包含任務(wù)全局理解的RL token,這個高度壓縮的信息摘要被輸入到專門訓(xùn)練的Actor-Critic網(wǎng)絡(luò)中。這兩個輕量級神經(jīng)網(wǎng)絡(luò)采用off-policy強化學(xué)習(xí),每秒可更新數(shù)百次,能根據(jù)實時試錯數(shù)據(jù)快速調(diào)整動作策略。研究者特別設(shè)計了"動作塊預(yù)測"機制,使強化學(xué)習(xí)策略與VLA的原始動作空間保持一致,通過"編輯修改"而非"推翻重建"的方式優(yōu)化關(guān)鍵動作。

實驗數(shù)據(jù)驗證了技術(shù)的有效性。在擰螺絲、系扎帶、插網(wǎng)線、插電源線四項任務(wù)中,裝備RLT的機器人僅需15分鐘真實數(shù)據(jù)訓(xùn)練,關(guān)鍵步驟速度提升300%,整體任務(wù)吞吐量(每10分鐘成功次數(shù))顯著提高。特別在插網(wǎng)線任務(wù)中,強化學(xué)習(xí)策略完成的操作有一半速度超過人類遠程操控記錄,訓(xùn)練總時長2小時中僅有15分鐘用于實際動作數(shù)據(jù)采集。

技術(shù)突破的關(guān)鍵在于三大創(chuàng)新設(shè)計:參考動作dropout機制防止模型過度依賴VLA原始輸出,人類干預(yù)接口允許直接注入糾正動作,以及動作塊預(yù)測確保策略調(diào)整與任務(wù)時序匹配。這種模塊化設(shè)計使RLT成為可復(fù)用的"通用插件",無需針對不同任務(wù)重新設(shè)計,為工業(yè)機器人提供了"邊干邊學(xué)"的進化能力。當(dāng)被問及技術(shù)落地前景時,研究團隊展示的測試視頻顯示,機器人已能穩(wěn)定完成亞毫米級精度的螺絲擰入動作,這標(biāo)志著自動化設(shè)備向取代人類精密操作邁出關(guān)鍵一步。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容