久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

阿里開源Qwen3.5小尺寸模型系列,性能亮眼引馬斯克關(guān)注與網(wǎng)友熱議

   時間:2026-03-03 15:50 來源:天脈網(wǎng)作者:顧雨柔

阿里近日宣布開源Qwen3.5系列中的四款小尺寸模型,包括Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B和Qwen3.5-9B。這些模型專為筆記本電腦等端側(cè)設(shè)備設(shè)計,支持在消費級顯卡上運行,并允許通過LoRA或全量微調(diào)進行任務(wù)適配。

在性能評測中,Qwen3.5-9B在多項基準(zhǔn)測試中表現(xiàn)突出,尤其在GPQA Diamond、MMMU-Pro、ERQA和Video-MME等任務(wù)中超越了GPT-OSS-20B、GPT-5 nano和Gemini 2.5 Flash-Lite等競品。盡管Qwen3.5-4B作為更小版本,在多語言知識、視覺推理和文檔理解等任務(wù)上接近9B版本的水平,但在純數(shù)學(xué)推理方面仍有提升空間。

開發(fā)者社區(qū)對這批模型的發(fā)布反應(yīng)熱烈。一位開發(fā)者指出,Qwen3.5-9B在MMMU-Pro測試中以13分優(yōu)勢擊敗GPT-5-Nano,證明架構(gòu)設(shè)計比參數(shù)規(guī)模更重要。另一位開發(fā)者分享了實際使用體驗:在Mac mini上運行Qwen3.5-9B,結(jié)合OpenClaw工具,可構(gòu)建成本低于初級員工月薪的AI系統(tǒng)。還有用戶通過AMD Ryzen AI Max+395處理器和Q4_K_XL量化算法,實現(xiàn)了約30個token/s的處理速度,且顯存占用不足16GB。

不同版本模型針對特定場景優(yōu)化:0.8B和2B版本以輕量化見長,適合移動設(shè)備和低延遲交互場景;4B版本作為多模態(tài)基座模型,可平衡性能與資源消耗;9B版本則在緊湊結(jié)構(gòu)下實現(xiàn)接近GPT-OSS-120B的性能,成為服務(wù)器端高性價比選擇。所有模型均采用Apache 2.0協(xié)議開源,基座模型也同步開放。

社區(qū)討論中,有用戶提出Qwen3.5系列可在手機端運行,引發(fā)關(guān)于iPhone部署方案的追問。不過也有開發(fā)者客觀指出,4B模型在復(fù)雜推理任務(wù)中正確率不足50%,數(shù)學(xué)測試正確率僅約15%,更適合作為自動補全工具而非深度思考伙伴。盡管存在局限,但這些小尺寸模型在特定能力維度已達到Gemini 3 Flash等云端模型的水平,具備實際端側(cè)應(yīng)用價值。

目前Qwen3.5家族已形成完整產(chǎn)品線,包含1個397B參數(shù)的大尺寸模型、3個中型模型(122B、35B、27B)和4個新發(fā)布的小尺寸模型。開發(fā)者可通過魔搭社區(qū)和Hugging Face平臺獲取相關(guān)資源。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容