久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

小米認(rèn)領(lǐng)爆款模型!雷軍稱超越馬斯克xAI,MiMo-V2-Pro將開源引期待

   時(shí)間:2026-03-19 12:45 來源:快訊作者:趙靜

近日,科技圈迎來一則重磅消息:此前在OpenRouter平臺(tái)引發(fā)廣泛關(guān)注的神秘模型Hunter Alpha,終于揭開神秘面紗,其真實(shí)身份竟是小米最新發(fā)布的MiMo-V2-Pro早期內(nèi)部測試版本。與此同時(shí),小米正式推出MiMo-V2家族三款全新模型,除MiMo-V2-Pro外,還包括MiMo-V2-Omni和MiMo-V2-TTS,另一備受猜測的匿名模型Healer Alpha也確認(rèn)對應(yīng)MiMo-V2-Omni。

一周前,Hunter Alpha悄然上線全球最大的API聚合平臺(tái)OpenRouter,憑借出色表現(xiàn)迅速成為焦點(diǎn)。上線后,其調(diào)用量持續(xù)攀升,連續(xù)多日占據(jù)日榜榜首,累計(jì)調(diào)用量突破1T tokens。小米官方介紹,經(jīng)過一周的持續(xù)迭代與優(yōu)化,MiMo-V2-Pro在長文處理能力以及Agent場景穩(wěn)定性方面實(shí)現(xiàn)顯著提升。雷軍也親自為新品站臺(tái),他表示MiMo-V2-Pro在榜單上的表現(xiàn)已超越馬斯克旗下xAI的Grok,并透露小米在AI領(lǐng)域雖一直保持低調(diào),但實(shí)際進(jìn)展遠(yuǎn)超外界想象,今年在AI領(lǐng)域的研發(fā)和資本投入將超過160億元。

MiMo-V2家族的三款模型各有側(cè)重。MiMo-V2-Pro作為旗艦?zāi)P停瑢楦邚?qiáng)度Agent工作場景打造。它總參數(shù)量超過1T,激活參數(shù)為42B,采用創(chuàng)新的混合注意力架構(gòu),支持1M超長上下文。該模型在匿名測試階段就引發(fā)大量關(guān)注,OpenClaw早早給予支持。從技術(shù)規(guī)格看,相比前代MiMo-V2-Flash,其總參數(shù)量擴(kuò)大約3倍,混合注意力比例從5:1提升到7:1,在參數(shù)規(guī)模增大的同時(shí)維持較高推理效率,輕量級MTP層也進(jìn)一步提升了生成速度。在后訓(xùn)練階段,團(tuán)隊(duì)針對更廣泛的Agent場景持續(xù)Scaling,使模型逐漸能勝任真實(shí)生產(chǎn)環(huán)境中的復(fù)雜執(zhí)行工作,朝著“生產(chǎn)力系統(tǒng)的大腦”定位推進(jìn)。在大模型綜合智能排行榜Artificial Analysis上,MiMo-V2-Pro位列全球第八、國內(nèi)第二。在實(shí)際使用中,它在OpenClaw、Claude Code等智能體框架中展現(xiàn)出突出的端到端任務(wù)完成能力,官方稱其整體使用體感超越Claude Sonnet 4.6,逼近Claude Opus 4.6,且API定價(jià)僅為后者的1/5。

MiMo-V2-Pro在編程領(lǐng)域也重點(diǎn)發(fā)力。小米內(nèi)部工程師深度評測顯示,其整體體驗(yàn)接近Claude Opus 4.6,在系統(tǒng)設(shè)計(jì)、任務(wù)規(guī)劃、代碼風(fēng)格以及問題解決路徑上展現(xiàn)出更高階的代碼智能。在Hunter Alpha測試階段,調(diào)用量最高的幾款應(yīng)用大多是編程工具,側(cè)面證明其在真實(shí)研發(fā)場景中具備較高的可用性和可靠性。目前,MiMo-V2-Pro已正式開放API服務(wù),支持1M上下文長度,并根據(jù)使用量分段計(jì)價(jià):256K上下文以內(nèi),輸入1美元/百萬tokens,輸出3美元/百萬tokens;1M上下文以內(nèi),輸入2美元/百萬tokens,輸出6美元/百萬tokens。與智譜面向真實(shí)Agent長鏈路任務(wù)深度優(yōu)化的模型GLM-5-Turbo相比,小米模型定價(jià)整體略高,但此前Hunter Alpha在Claw-eval測試中擊敗了GLM-5。

MiMo-V2-Omni則瞄準(zhǔn)現(xiàn)實(shí)世界中復(fù)雜的多模態(tài)交互與執(zhí)行場景。在音頻理解方面,它支持從環(huán)境聲分類、多說話人分離,到音頻—視覺聯(lián)合推理,再到超過10小時(shí)長音頻的連續(xù)理解,綜合表現(xiàn)超過Gemini 3 Pro,是當(dāng)前最強(qiáng)的音頻理解基座模型之一。在圖像理解方面,展現(xiàn)出強(qiáng)大的多學(xué)科視覺推理與復(fù)雜圖表分析能力,效果超過Claude Opus 4.6,逼近Gemini 3 Pro等頂尖閉源模型。在視頻理解方面,支持原生音視頻聯(lián)合輸入,實(shí)現(xiàn)真正意義上的多模態(tài)視頻理解,通過創(chuàng)新性的視頻預(yù)訓(xùn)練,具備更強(qiáng)的情境感知與未來推理能力。在與真實(shí)數(shù)字環(huán)境交互的評測基準(zhǔn)上,其整體表現(xiàn)比肩Gemini 3 Pro。目前,MiMo-V2-Omni已正式開放API服務(wù),支持256K上下文長度,定價(jià)為輸入0.4美元/百萬tokens,輸出2美元/百萬tokens。

一同發(fā)布的MiMo-V2-TTS是一款自研的語音合成大模型。它基于自研Audio Tokenizer與多碼本語音—文本聯(lián)合建模架構(gòu),經(jīng)過上億小時(shí)語音數(shù)據(jù)的大規(guī)模預(yù)訓(xùn)練和多維度強(qiáng)化學(xué)習(xí),具備高度可控的多粒度語音風(fēng)格控制能力。不僅能完成整體風(fēng)格定調(diào),還能對局部情緒表達(dá)進(jìn)行精準(zhǔn)調(diào)節(jié)。訓(xùn)練時(shí)先通過超大規(guī)模語音—文本混合預(yù)訓(xùn)練建立跨模態(tài)對齊、理解和生成能力,再通過少量高質(zhì)量監(jiān)督數(shù)據(jù)微調(diào)獲得可泛化的多粒度、多風(fēng)格指令控制能力。為激發(fā)模型在預(yù)訓(xùn)練階段積累的高表現(xiàn)力語音生成潛力,團(tuán)隊(duì)引入多維度強(qiáng)化學(xué)習(xí),圍繞更自然的韻律、更穩(wěn)定的音質(zhì)、更準(zhǔn)確的字詞表達(dá)、更高質(zhì)量的音色克隆以及不同場景下更合適的語氣與表達(dá)方式進(jìn)行持續(xù)優(yōu)化。得益于多層碼本建模架構(gòu),它能在高保真的離散token空間中建模語音,最大限度保留原始語音中的豐富信息,讓強(qiáng)化學(xué)習(xí)階段能更直接地利用語音相關(guān)獎(jiǎng)勵(lì)信號(hào)對模型進(jìn)行優(yōu)化。

小米此次發(fā)布的三款模型,顯示出其押注一套面向Agent時(shí)代的通用智能底座的決心。此前匿名爆紅也讓市場對其他模型廠家充滿期待。近日有消息稱,DeepSeek-V4將于4月正式上線,作為梁文鋒打磨已久的多模態(tài)大模型,除在Coding能力上躍升外,還將在LTM(long term memory長期記憶)上取得突破,這恰好是智能體當(dāng)前的短板之一。隨著國內(nèi)各模型廠家的戰(zhàn)略和人才調(diào)整,今年國內(nèi)大模型市場必將精彩紛呈。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容