久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來(lái)市場(chǎng)!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來(lái)

小米機(jī)器人新突破:Xiaomi-Robotics-0發(fā)布,消費(fèi)級(jí)顯卡助力具身智能普及

   時(shí)間:2026-02-12 15:58 來(lái)源:快訊作者:鄭佳

雷軍在微博上宣布,小米機(jī)器人團(tuán)隊(duì)正式推出并開(kāi)源了一款全新的具身智能VLA模型——Xiaomi-Robotics-0,同時(shí)首次公開(kāi)了該模型在真實(shí)機(jī)器人上的運(yùn)行畫(huà)面。這一發(fā)布標(biāo)志著小米在機(jī)器人領(lǐng)域邁出了重要一步,解決了多項(xiàng)行業(yè)長(zhǎng)期存在的技術(shù)難題。

Xiaomi-Robotics-0擁有47億參數(shù),集成了視覺(jué)語(yǔ)言理解與高性能實(shí)時(shí)執(zhí)行能力。該模型在三大主流仿真測(cè)試中表現(xiàn)優(yōu)異,全面超越行業(yè)標(biāo)桿,取得全項(xiàng)SOTA成績(jī)。更令人矚目的是,它在真實(shí)機(jī)器人上實(shí)現(xiàn)了流暢的動(dòng)作表現(xiàn),徹底改變了傳統(tǒng)機(jī)器人動(dòng)作卡頓、反應(yīng)遲緩的形象。

傳統(tǒng)VLA模型面臨兩大核心挑戰(zhàn):一是推理延遲高導(dǎo)致動(dòng)作不連貫,二是依賴(lài)昂貴專(zhuān)業(yè)顯卡,硬件門(mén)檻高。這些問(wèn)題使得先進(jìn)機(jī)器人技術(shù)難以走出實(shí)驗(yàn)室,無(wú)法在現(xiàn)實(shí)場(chǎng)景中廣泛應(yīng)用。Xiaomi-Robotics-0通過(guò)創(chuàng)新設(shè)計(jì),成功突破了這些限制。

該模型最大的突破在于能在普通消費(fèi)級(jí)顯卡上實(shí)現(xiàn)實(shí)時(shí)推理,大幅降低了技術(shù)落地成本。這一特性使其區(qū)別于同類(lèi)產(chǎn)品,為更多開(kāi)發(fā)者和研究機(jī)構(gòu)提供了接觸前沿技術(shù)的機(jī)會(huì)。小米通過(guò)自研的Mixture-of-Transformers混合架構(gòu),為機(jī)器人構(gòu)建了"雙腦協(xié)同系統(tǒng)",有效解決了傳統(tǒng)模型存在的效率問(wèn)題。

這個(gè)雙腦系統(tǒng)由視覺(jué)語(yǔ)言大腦(VLM)和動(dòng)作執(zhí)行小腦(DiT)組成。VLM負(fù)責(zé)理解人類(lèi)指令和環(huán)境信息,能夠準(zhǔn)確解析模糊指令中的空間關(guān)系和任務(wù)目標(biāo);DiT則專(zhuān)注于將指令轉(zhuǎn)化為流暢動(dòng)作,通過(guò)流匹配技術(shù)確保動(dòng)作精準(zhǔn)穩(wěn)定。這種設(shè)計(jì)使機(jī)器人動(dòng)作更加自然,接近人類(lèi)操作水平。

研發(fā)團(tuán)隊(duì)采用兩階段訓(xùn)練方案提升模型性能。第一階段通過(guò)跨模態(tài)預(yù)訓(xùn)練,使模型在掌握動(dòng)作技能的同時(shí)保持基礎(chǔ)認(rèn)知能力;第二階段通過(guò)后訓(xùn)練優(yōu)化,解決真機(jī)運(yùn)行中的動(dòng)作斷層問(wèn)題。這些技術(shù)改進(jìn)使機(jī)器人能夠穩(wěn)定完成疊毛巾、拆積木等復(fù)雜物理任務(wù)。

從公開(kāi)的真機(jī)演示視頻可以看到,機(jī)器人處理柔性物體時(shí)表現(xiàn)出色,能夠自動(dòng)調(diào)整動(dòng)作策略完成疊放任務(wù);操作剛性積木時(shí)手眼協(xié)調(diào)穩(wěn)定,動(dòng)作精準(zhǔn)無(wú)誤。這種對(duì)不同材質(zhì)物體的適應(yīng)能力,展現(xiàn)了模型強(qiáng)大的物理智能和環(huán)境感知能力。

在Libero、Calvin、SimplerEnv等國(guó)際主流測(cè)試集中,Xiaomi-Robotics-0與超過(guò)30款主流模型對(duì)標(biāo),在所有基準(zhǔn)測(cè)試中均取得最優(yōu)成績(jī)。這些數(shù)據(jù)證實(shí)了該模型在仿真環(huán)境和真實(shí)場(chǎng)景中的全面領(lǐng)先地位。

小米此次選擇將技術(shù)成果全量開(kāi)源,包括技術(shù)文檔、GitHub代碼和Hugging Face模型權(quán)重全部公開(kāi)。這一舉措打破了行業(yè)技術(shù)壁壘,使全球開(kāi)發(fā)者都能免費(fèi)使用和二次開(kāi)發(fā)相關(guān)資源,將加速具身智能技術(shù)的普及和應(yīng)用創(chuàng)新。

雷軍透露,小米已持續(xù)多年布局機(jī)器人領(lǐng)域,目前仍在全球招募頂尖人才。此次發(fā)布的Xiaomi-Robotics-0只是階段性成果,團(tuán)隊(duì)正在攻關(guān)下一代技術(shù),未來(lái)將帶來(lái)更多創(chuàng)新突破。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容