久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來市場(chǎng)!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來

阿里開源千問Qwen3.5-Plus:性能媲美Gemini 3 Pro,推理效率與多模態(tài)能力雙飛躍

   時(shí)間:2026-02-16 21:08 來源:快訊作者:沈如風(fēng)

阿里巴巴近日宣布開源全新一代大模型千問Qwen3.5-Plus,該模型在性能上與Gemini 3 Pro不相上下,成為全球開源模型中的佼佼者。此次發(fā)布的Qwen3.5-Plus版本總參數(shù)高達(dá)3970億,但激活參數(shù)僅為170億,實(shí)現(xiàn)了以小博大的技術(shù)突破。其性能不僅超越了萬億參數(shù)的Qwen3-Max模型,還在部署顯存占用上降低了60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價(jià)格極具競(jìng)爭(zhēng)力,每百萬Token僅需0.8元,僅為Gemini 3 Pro的1/18。

與前幾代千問大語言模型相比,Qwen3.5-Plus實(shí)現(xiàn)了從純文本模型到原生多模態(tài)模型的重大轉(zhuǎn)變。千問3主要在純文本Tokens上進(jìn)行預(yù)訓(xùn)練,而Qwen3.5-Plus則基于視覺和文本混合token進(jìn)行預(yù)訓(xùn)練,并大幅增加了中英文、多語言、STEM和推理等數(shù)據(jù)。這使得模型能夠“睜開眼睛”看世界,掌握更密集的世界知識(shí)和推理邏輯。在推理、編程、Agent智能體等全方位基準(zhǔn)評(píng)估中,Qwen3.5-Plus均表現(xiàn)出色,例如在MMLU-Pro知識(shí)推理評(píng)測(cè)中得分87.8分,超越GPT-5.2;在博士級(jí)難題GPQA測(cè)評(píng)中斬獲88.4分,高于Claude 4.5。

原生多模態(tài)訓(xùn)練也顯著提升了Qwen3.5-Plus的視覺能力。在多模態(tài)推理、通用視覺問答VQA、文本識(shí)別和文件理解、空間智能、視頻理解等眾多權(quán)威評(píng)測(cè)中,Qwen3.5-Plus均取得了最佳性能。特別是在視頻理解方面,該模型支持長(zhǎng)達(dá)2小時(shí)的視頻直接輸入,適用于長(zhǎng)視頻內(nèi)容分析與摘要生成。同時(shí),Qwen3.5-Plus還實(shí)現(xiàn)了視覺理解與代碼能力的原生融合,能夠?qū)⑹掷L界面草圖直接轉(zhuǎn)為可用的前端代碼,一張截圖就能定位并修復(fù)UI問題,極大地提高了視覺編程的效率。

Qwen3.5-Plus性能的飛躍,得益于對(duì)Transformer經(jīng)典架構(gòu)的重大創(chuàng)新。千問團(tuán)隊(duì)自研的門控技術(shù)成果曾獲得全球AI頂會(huì)2025 NeurIPS最佳論文,該技術(shù)已融入到Qwen3.5-Plus的創(chuàng)新混合架構(gòu)中。團(tuán)隊(duì)結(jié)合線性注意力機(jī)制與稀疏混合專家MoE模型架構(gòu),實(shí)現(xiàn)了397B總參數(shù)激活僅17B的極致模型效率。通過訓(xùn)練穩(wěn)定優(yōu)化以及多token預(yù)測(cè)等系列技術(shù),Qwen3.5-Plus的性能與Qwen3-Max模型持平,并進(jìn)一步提升了推理效率。在常用的32K上下文場(chǎng)景中,推理吞吐量可提升8.6倍;在256K超長(zhǎng)上下文情況下,推理吞吐量最大可提升至19倍。

Qwen3.5-Plus的原生多模態(tài)訓(xùn)練是在阿里云AI基礎(chǔ)設(shè)施上高效完成的。通過系列基礎(chǔ)技術(shù)創(chuàng)新,該模型在文本、圖像、視頻等混合數(shù)據(jù)訓(xùn)練吞吐量上,幾乎與純文本基座模型訓(xùn)練持平,大大降低了原生多模態(tài)訓(xùn)練的難度門檻。同時(shí),通過設(shè)計(jì)精巧的FP8、FP32精度應(yīng)用策略,在訓(xùn)練穩(wěn)定擴(kuò)展到數(shù)十萬億個(gè)token時(shí),激活內(nèi)存減少約50%,訓(xùn)練還能提速10%,進(jìn)一步節(jié)約了模型訓(xùn)練成本、提升了訓(xùn)練效率。

基于強(qiáng)大的視覺能力,Qwen3.5-Plus在Agent框架和應(yīng)用方面也取得了新突破。該模型可自主操作手機(jī)與電腦,高效完成日常任務(wù),在移動(dòng)端支持更多主流APP與指令,在PC端可處理更復(fù)雜的多步驟操作,如跨應(yīng)用數(shù)據(jù)整理、自動(dòng)化流程執(zhí)行等。千問團(tuán)隊(duì)還構(gòu)建了一個(gè)可擴(kuò)展的Agent異步強(qiáng)化學(xué)習(xí)框架,端到端可加速3到5倍,并將插件式智能體Agent支持?jǐn)U展至百萬級(jí)規(guī)模。1月15日,千問App發(fā)布了全球首個(gè)消費(fèi)級(jí)AI購(gòu)物Agent,春節(jié)期間6天時(shí)間幫用戶完成了1.2億筆訂單,在全球首次實(shí)現(xiàn)大規(guī)模真實(shí)世界任務(wù)執(zhí)行和商業(yè)化驗(yàn)證。

自2023年開源以來,阿里巴巴已開源400多個(gè)千問模型,覆蓋全尺寸、全模態(tài),全球下載量突破10億次。單月下載量方面,千問是DeepSeek、meta、OpenAI、智譜、Kimi、MiniMax等2到8名總和,開發(fā)者基于千問開發(fā)的衍生模型超20萬,成為公認(rèn)的全球第一開源模型,也是開發(fā)者最友好的開源大模型。面向不同國(guó)家的AI開發(fā)者和企業(yè)的需求,千問大模型還在持續(xù)演進(jìn),Qwen3.5-Plus已擴(kuò)展支持201種語言,將詞表大小從15萬擴(kuò)展到25萬,可最高提升小語種60%的編碼效率。據(jù)悉,千問APP、PC端已第一時(shí)間接入Qwen3.5-Plus模型,開發(fā)者可在魔搭社區(qū)和HuggingFace下載新模型,或通過阿里云百煉直接獲取API服務(wù)。阿里巴巴還將繼續(xù)開源不同尺寸、不同功能的千問3.5系列模型,性能更強(qiáng)的旗艦?zāi)P蚎wen3.5-Max不久也將發(fā)布。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新