久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網 手機網站 站內搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網,商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

雷軍宣布小米AI成果入選ICLR 2026 涵蓋多領域創(chuàng)新突破

   時間:2026-02-03 13:08 來源:天脈網作者:鐘景軒

小米科研團隊在人工智能領域再傳捷報,其多篇最新研究成果成功入選國際頂級學術會議ICLR 2026。此次入選的研究覆蓋多模態(tài)推理、強化學習、GUI智能體、端到端自動駕駛及音頻生成等前沿方向,展現(xiàn)了該團隊在人工智能理論創(chuàng)新與應用實踐中的深厚積累。

在強化學習領域,團隊提出的《Shuffle-R1》框架通過動態(tài)數(shù)據重組技術破解了多模態(tài)大模型訓練中的兩大核心難題——優(yōu)勢坍縮與軌跡沉默。該研究創(chuàng)新性地采用成對軌跡采樣與優(yōu)勢值批次重排序機制,在保持極低計算開銷的同時,顯著提升了梯度信號質量。實驗數(shù)據顯示,該框架在多個基準測試中超越現(xiàn)有強化學習基線,為復雜場景下的智能決策提供了新范式。

移動智能體方向的研究同樣取得突破性進展。團隊開發(fā)的《MobileIPL》系統(tǒng)首創(chuàng)迭代偏好學習框架,通過Thinking-level DPO技術實現(xiàn)思考步驟的細粒度優(yōu)化。結合三階段指令演化機制,該系統(tǒng)成功突破高質量軌跡數(shù)據稀缺的瓶頸,在AITZ等主流GUI智能體測試中刷新性能紀錄,同時在分布外場景中展現(xiàn)出更強的魯棒性。

端到端自動駕駛領域,團隊提出的《ReCogDrive》方案實現(xiàn)了多技術融合創(chuàng)新。該研究通過分層認知數(shù)據流水線注入駕駛先驗知識,利用認知引導擴散規(guī)劃器生成物理可行軌跡,并首創(chuàng)DiffGRPO強化學習算法直接優(yōu)化駕駛策略。閉環(huán)測試結果表明,該方案在NAVSIM與Bench2Drive等平臺上的表現(xiàn)全面領先現(xiàn)有技術。

其他創(chuàng)新成果同樣引人注目:《ThinkOmni》研究實現(xiàn)了文本推理能力向全模態(tài)的零成本遷移;《Flow2GAN》通過融合流匹配與對抗生成技術,在音頻合成領域達成高保真少步生成;《WorldSplat》則突破4D駕駛場景生成技術,為自動駕駛仿真訓練提供更真實的虛擬環(huán)境。這些成果標志著小米在人工智能基礎研究領域已形成系統(tǒng)性布局。

 
 
更多>同類內容
全站最新
熱門內容