久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

MiniMax M2.7發(fā)布:從“大腦”到系統(tǒng),AI龍蝦開啟自我進(jìn)化新征程

   時(shí)間:2026-03-21 16:20 來源:快訊作者:趙云飛

誰能想到,年初爆火的OpenClaw熱度持續(xù)至今,不僅專業(yè)工程師對其津津樂道,普通大眾也在“錯(cuò)失恐懼”心理的驅(qū)使下,紛紛投身“養(yǎng)龍蝦”熱潮。就在昨天凌晨的GTC 2026大會上,英偉達(dá)CEO黃仁勛推出了英偉達(dá)版NemoClaw,并著重強(qiáng)調(diào):“當(dāng)下每家企業(yè)都需制定自己的OpenClaw戰(zhàn)略?!边@一觀點(diǎn),無疑為這場熱潮再添一把火。

國內(nèi)大模型廠商敏銳捕捉到這一趨勢,在“AI養(yǎng)蝦”賽道加速布局。以MiniMax為例,2月底就在其Agent平臺推出MaxClaw模式。該模式依托強(qiáng)大的M2.5大模型,能在10秒內(nèi)為用戶部署一個(gè)24小時(shí)待命的私人助理。起初,不少人對MaxClaw持懷疑態(tài)度,但經(jīng)過一段時(shí)間使用,其價(jià)值逐漸得到認(rèn)可。一位用戶分享道:“一個(gè)月前我還吐槽MaxClaw,現(xiàn)在它完全刷新了我的認(rèn)知。云端預(yù)裝好一系列Agent能力后,實(shí)際效果相當(dāng)不錯(cuò)?!边@也讓大家對MiniMax全新一代大模型在“養(yǎng)蝦”等Agent場景中的表現(xiàn)充滿期待。

今日,MiniMax全新一代大模型M2.7正式亮相,帶來諸多驚喜。此次M2.7的能力升級涵蓋五大方面,從單點(diǎn)能力突破邁向系統(tǒng)級Agent能力構(gòu)建。在Agentic指令遵循方面,模型能在包含50多種技能、60 - 150個(gè)功能列表的復(fù)雜環(huán)境中,穩(wěn)定調(diào)用并執(zhí)行流程。多智能體協(xié)作與工程級Coding實(shí)現(xiàn)原生智能體協(xié)作,減少對外部編排的依賴,在日志分析、Bug定位、代碼重構(gòu)等真實(shí)工程場景中表現(xiàn)穩(wěn)定。Agent Harness加強(qiáng)編排工具能力,支持Agent Teams、多工具檢索,配合預(yù)置技能構(gòu)建自迭代任務(wù)執(zhí)行鏈路。角色扮演能力全面強(qiáng)化,覆蓋閑聊陪伴、互動小說等七大場景,支持10種語言,跨語言角色人格保持一致,適配OpenClaw長期記憶框架后,智能體角色擁有持久身份與真實(shí)情感。辦公自動化支持復(fù)雜Excel/Word/PPT辦公任務(wù)及多輪編輯,效率大幅提升。

值得一提的是,M2.7憑借自身演化出的自迭代能力,科研表現(xiàn)顯著提升。它向以Kaggle競賽為基礎(chǔ)構(gòu)建的MLE Bench評測體系發(fā)起挑戰(zhàn),在MLE Lite的22道高難度競賽題目中斬獲9枚金牌。

為了解M2.7實(shí)戰(zhàn)效果,我們將MiniMax - M2.7接入官方版OpenClaw測試其執(zhí)行日常任務(wù)能力。本地OpenClaw不具備檢索X的能力,我們給出指令:“安裝search - x skill,配置好密鑰,然后檢索X,看看今天AI領(lǐng)域又有哪些新agent問世?!迸渲煤媚P秃螅琈2.7迅速完成任務(wù)。接著,我們讓它去alphaXiv查看當(dāng)前排名前列的論文,它也出色完成。在搶優(yōu)惠券方面,我們向配備M2.7模型的“龍蝦”提供麥當(dāng)勞MCP地址和密鑰,雖提示未安裝MCP,但它很快找到解決辦法,登錄麥當(dāng)勞查看,優(yōu)惠券已到賬。

在專業(yè)辦公領(lǐng)域,M2.7同樣表現(xiàn)出色。作為一家專業(yè)AI媒體,日常刷選題積累大量選題文檔,其中不少優(yōu)質(zhì)選題被遺忘。借助M2.7,我們將歸檔選題重新利用。例如,我們讓M2.7閱讀每日選題總結(jié)文件夾中的docx格式文檔,總結(jié)今年AI領(lǐng)域發(fā)展趨勢。它得出幾個(gè)有見地的洞察,如模型軍備競賽競爭維度轉(zhuǎn)變、AI智能體大爆發(fā)、AI記憶和具身智能蓬勃發(fā)展等,最終總結(jié)頗具參考價(jià)值:“2026年AI正在從‘聊天工具’進(jìn)化為‘能行動的智能體’,競爭焦點(diǎn)從模型參數(shù)轉(zhuǎn)向推理效率、Agent生態(tài)和安全對齊。物理世界(機(jī)器人、3D)成為新的主戰(zhàn)場,而開源與閉源的博弈將決定行業(yè)格局?!盡2.7在專業(yè)辦公領(lǐng)域取得GDPval - AA榜單開源模型最高分,也就不足為奇。

在編程能力測試中,我們將M2.7配置到Claude Code,輸入指令:“給我構(gòu)建一個(gè)蒸汽朋克的龍蝦信息網(wǎng),內(nèi)容介紹真正的龍蝦,從網(wǎng)上找素材放入,讓網(wǎng)站信息豐富?!?倍速視頻記錄下,7分多鐘后,我們得到第一版結(jié)果——龍蝦檔案室,可簡單了解真正龍蝦的分類學(xué)、身體構(gòu)造等知識。隨后,我們利用MiniMax精心設(shè)計(jì)并開源的技能優(yōu)化項(xiàng)目。先讓配置M2.7的Claude Code安裝技能,很快技能配置就緒,M2.7具備更卓越的前端、全棧等開發(fā)能力。接著,我們使用前端技能優(yōu)化龍蝦檔案室,最終得到結(jié)構(gòu)和動畫更現(xiàn)代的網(wǎng)站。

我們還問了MiniMax - M2.7一個(gè)讓M2.5始終無法正確回答的問題:“你認(rèn)識馬嘉祺嗎?”此次M2.7正確拼寫出馬嘉祺,看來MiniMax已解決這一問題,之前通過“馬嘉祺測試”辨認(rèn)MiniMax后續(xù)隱身模型的想法難以實(shí)現(xiàn)。

從這些測試結(jié)果看,M2.7實(shí)現(xiàn)能力蛻變。過去大模型多充當(dāng)“最強(qiáng)大腦”,如今MiniMax推出的M2.7是擁有“手腳、工具和記憶”的多面手系統(tǒng)。當(dāng)模型能自己構(gòu)建工具鏈、優(yōu)化執(zhí)行路徑并在反饋中持續(xù)重寫策略時(shí),其定位發(fā)生根本改變,不再只是被優(yōu)化對象,而是成為優(yōu)化過程的一部分。

M2.7實(shí)現(xiàn)自我進(jìn)化能力躍遷的關(guān)鍵在于構(gòu)建與運(yùn)轉(zhuǎn)復(fù)雜Agent Harness的能力。該系統(tǒng)由多個(gè)Agent協(xié)作組成,集成大量結(jié)構(gòu)化Skills模塊、外部工具和多種Agent腳手架。在MiniMax內(nèi)部,Agent Harness的價(jià)值得到驗(yàn)證,僅用1人、4天、零代碼,M2系列模型就以“架構(gòu)師”身份自主搭建完整開發(fā)Agent系統(tǒng),并構(gòu)建覆蓋數(shù)據(jù)、訓(xùn)練等的研究型Agent體系,形成“用AI迭代AI”的自我進(jìn)化閉環(huán)。

這種Agent自迭代范式推動模型科研能力進(jìn)化。以強(qiáng)化學(xué)習(xí)場景實(shí)驗(yàn)為例,Agent能協(xié)助啟動實(shí)驗(yàn),運(yùn)行中持續(xù)監(jiān)控狀態(tài),自動完成日志分析等關(guān)鍵步驟。過去需多個(gè)工程師協(xié)作的流程,現(xiàn)在只需他們在關(guān)鍵決策節(jié)點(diǎn)介入,M2.7已能承擔(dān)約30% - 50%的實(shí)際工作量。M2.7還能主動迭代Agent Harness,對任務(wù)執(zhí)行系統(tǒng)持續(xù)優(yōu)化。在一項(xiàng)軟件工程任務(wù)中,MiniMax讓M2.7在內(nèi)部scaffold上優(yōu)化模型開發(fā)表現(xiàn),它自主運(yùn)行超100輪迭代,逐步發(fā)現(xiàn)有效改進(jìn)策略,最終在評測集上實(shí)現(xiàn)約30%的性能提升。

在MLE Lite評測中,MiniMax進(jìn)行三次測試,每次間隔24小時(shí)迭代,驗(yàn)證模型性能隨迭代次數(shù)增加而持續(xù)攀升。三次測試平均得牌率達(dá)66.6%,與Gemini - 3.1持平,僅次于GPT - 5.4、Opus - 4.6。其運(yùn)行邏輯圍繞短時(shí)記憶、自反饋與自優(yōu)化三大模塊構(gòu)建簡易腳手架,每一輪迭代后,Agent生成記憶文件并自我評估,沉淀問題與改進(jìn)方向,下一輪迭代統(tǒng)一利用歷史記憶與反饋推動優(yōu)化。

截至3月10日,MiniMax市值攀升至3800億港元(約合人民幣3350億元),超過百度、京東、攜程等互聯(lián)網(wǎng)巨頭。M2.7的發(fā)布,對于這家剛完成資本躍升的大模型獨(dú)角獸而言,或許只是其“一周為單位更迭”馬拉松中的一個(gè)節(jié)點(diǎn)。從此次更新重點(diǎn)看,無論是指令遵循、復(fù)雜任務(wù)處理,還是多智能體協(xié)作、代碼能力以及對日常辦公場景的支持,M2.7都在試圖回答一個(gè)問題:模型能否穩(wěn)定融入真實(shí)工作流,而非僅在演示環(huán)節(jié)令人眼前一亮。

在“龍蝦”等Agent場景走熱后,用戶期待已變,不再滿足于一句話的聰明回答,更在意其能否持續(xù)協(xié)作、理解角色、處理約束、完成復(fù)雜任務(wù)。M2.7的發(fā)布雖未必意味著塵埃落定,但至少表明模型競爭焦點(diǎn)正從參數(shù)、榜單和概念,逐漸轉(zhuǎn)向執(zhí)行質(zhì)量、任務(wù)完成度與真實(shí)體驗(yàn)。對MiniMax而言,這種演進(jìn)契合其一貫風(fēng)格,不急于講宏大故事,而是持續(xù)將能力融入產(chǎn)品、場景、成本結(jié)構(gòu)。大模型的真正價(jià)值不在于制造對立,而在于作為日?;ぞ撸謸?dān)繁瑣事務(wù),M2.7為未來共存與協(xié)作提供了更扎實(shí)可靠的起點(diǎn)。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容