久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來

雷軍宣布小米AI研究大放異彩 多篇成果入選ICLR 2026 涵蓋多領(lǐng)域創(chuàng)新

   時(shí)間:2026-02-03 12:40 來源:快訊作者:李娜

近日,小米公司在人工智能領(lǐng)域的研究成果引發(fā)廣泛關(guān)注。其團(tuán)隊(duì)有多篇論文成功入選國際頂級(jí)會(huì)議ICLR 2026,研究范疇覆蓋多模態(tài)推理、強(qiáng)化學(xué)習(xí)、GUI Agent、端到端自動(dòng)駕駛以及音頻生成等多個(gè)前沿方向。ICLR作為人工智能領(lǐng)域極具影響力的學(xué)術(shù)會(huì)議,始終致力于推動(dòng)該領(lǐng)域理論與方法的前沿探索與創(chuàng)新發(fā)展。

在強(qiáng)化學(xué)習(xí)領(lǐng)域,小米團(tuán)隊(duì)提出的《Shuffle-R1》成果頗具創(chuàng)新性。該研究構(gòu)建了數(shù)據(jù)動(dòng)態(tài)重組框架,核心在于運(yùn)用成對(duì)軌跡采樣和優(yōu)勢值批次重排序兩項(xiàng)關(guān)鍵技術(shù)。這一創(chuàng)新有效解決了多模態(tài)大模型訓(xùn)練過程中存在的優(yōu)勢坍縮與軌跡沉默難題,大幅提升了梯度信號(hào)質(zhì)量。在多個(gè)基準(zhǔn)測試中,該成果以極低的計(jì)算開銷超越了現(xiàn)有的強(qiáng)化學(xué)習(xí)基線水平。

移動(dòng)智能體方向,小米團(tuán)隊(duì)的《MobileIPL》同樣表現(xiàn)亮眼。團(tuán)隊(duì)首創(chuàng)迭代偏好學(xué)習(xí)框架,借助Thinking-level DPO實(shí)現(xiàn)思考步驟的細(xì)粒度優(yōu)化。同時(shí),結(jié)合三階段指令演化機(jī)制,成功突破了高質(zhì)量軌跡稀缺這一瓶頸。在AITZ等主流GUI-Agent測試中,該成果刷新了性能紀(jì)錄,并且在分布外場景下展現(xiàn)出更強(qiáng)的魯棒性。

端到端自動(dòng)駕駛研究方面,小米團(tuán)隊(duì)的《ReCogDrive》實(shí)現(xiàn)了技術(shù)融合創(chuàng)新。研究通過分層認(rèn)知數(shù)據(jù)流水線,將駕駛先驗(yàn)知識(shí)注入其中,利用認(rèn)知引導(dǎo)擴(kuò)散規(guī)劃器生成物理可行的軌跡。還首創(chuàng)DiffGRPO強(qiáng)化學(xué)習(xí)算法,直接對(duì)駕駛策略進(jìn)行優(yōu)化。在NAVSIM與Bench2Drive的閉環(huán)測試中,該成果領(lǐng)先于現(xiàn)有方案。

除了上述成果,小米團(tuán)隊(duì)還有其他創(chuàng)新研究?!禩hinkOmni》實(shí)現(xiàn)了文本推理能力向全模態(tài)的零成本遷移;《Flow2GAN》融合流匹配與對(duì)抗生成技術(shù),實(shí)現(xiàn)了高保真少步音頻合成;《WorldSplat》則在4D駕駛場景生成技術(shù)上取得突破。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容