久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

阿里千問Qwen3-Coder-Next發(fā)布:以低推理成本解鎖高效編程智能體新可能

   時間:2026-02-04 11:03 來源:快訊作者:趙云飛

阿里巴巴千問團隊近日正式發(fā)布了一款名為Qwen3-Coder-Next的開放權重語言模型,該模型專為編碼代理和本地開發(fā)場景設計,通過創(chuàng)新架構與訓練方法實現(xiàn)了性能與效率的顯著提升。與傳統(tǒng)的參數(shù)擴展模式不同,新模型聚焦于智能體訓練信號的擴展,采用混合注意力機制與MoE(專家混合)架構,在降低推理成本的同時強化了編程能力與智能體交互水平。

在訓練方法上,團隊構建了多階段強化體系:首先通過持續(xù)預訓練讓模型吸收代碼與智能體相關數(shù)據(jù),隨后利用高質(zhì)量智能體軌跡數(shù)據(jù)進行監(jiān)督微調(diào),并針對軟件工程、QA測試、Web/UX開發(fā)等垂直領域開展專家訓練。最終通過知識蒸餾技術將專家能力整合到單一可部署模型中。這種訓練策略特別強化了長程推理、工具調(diào)用及錯誤恢復能力,使其更適應真實開發(fā)環(huán)境的需求。

基準測試數(shù)據(jù)顯示,當集成SWE-Agent框架時,該模型在SWE-Bench Verified基準上取得超過70%的準確率,在多語言版本及更具挑戰(zhàn)性的Pro版本中仍保持競爭力。值得注意的是,盡管其激活參數(shù)規(guī)模僅為30億,但在TerminalBench 2.0和Aider等智能體評測中,性能表現(xiàn)可與激活參數(shù)量高10-20倍的開源模型媲美,展現(xiàn)出顯著的效率優(yōu)勢。

效率對比圖表進一步證實,在SWE-Bench-Pro任務中,Qwen3-Coder-Next的3B激活參數(shù)版本已達到行業(yè)領先水平,其性能曲線處于帕累托前沿位置。雖然全注意力架構的專有模型在絕對指標上仍占優(yōu)勢,但新模型在低成本智能體部署場景中展現(xiàn)出更強的實用性,特別適合資源受限的開發(fā)環(huán)境。

該模型現(xiàn)已通過ModelScope和Hugging Face平臺開源,開發(fā)團隊表示將持續(xù)優(yōu)化模型的推理決策能力,擴展其任務支持范圍,并根據(jù)用戶反饋進行快速迭代。此次發(fā)布標志著編程智能體領域在效率優(yōu)化方向取得重要突破,為開發(fā)者提供了更具性價比的選擇。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容