久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

多模態(tài)視覺語言測評:Gemini-3-pro登頂 國內(nèi)多款大模型表現(xiàn)亮眼

   時間:2025-12-31 09:48 來源:互聯(lián)網(wǎng)作者:江紫萱

近日,SuperCLUE-VLM多模態(tài)視覺語言基準測評12月總榜正式揭曉,全球多款主流大模型在基礎認知、視覺推理、視覺應用三大核心維度展開激烈角逐,最終谷歌Gemini-3-pro以絕對優(yōu)勢登頂榜首,國內(nèi)多款模型憑借技術突破躋身前列,展現(xiàn)出中國人工智能領域的強勁實力。

谷歌Gemini-3-pro以83.64分的總成績領跑全場,其在三項細分指標中均表現(xiàn)卓越:基礎認知得分89.01分,視覺推理82.82分,視覺應用79.09分,三項數(shù)據(jù)均遠超其他競品。這一成績不僅鞏固了谷歌在多模態(tài)領域的領先地位,也為行業(yè)樹立了新的技術標桿。

國內(nèi)陣營中,商湯科技SenseNova V6.5 Pro以75.35分位居第二,成為榜單中排名最高的國產(chǎn)模型。字節(jié)跳動旗下兩款模型表現(xiàn)亮眼:豆包大模型以73.15分躋身前三,其視覺版在基礎認知環(huán)節(jié)得分82.70分,甚至超越部分國際競品,僅在視覺推理環(huán)節(jié)稍顯不足;另一款模型則憑借均衡表現(xiàn)穩(wěn)居前列。百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等模型也成功進入前五,其中Qwen3-vl作為榜單中首個開源且總分超70分的模型,為開源社區(qū)貢獻了重要技術資產(chǎn)。

國際頭部模型在此次測評中表現(xiàn)分化。Anthropic的Claude-opus-4-5以71.44分位列第六,而OpenAI的GPT-5.2(high)僅獲69.16分,排名相對靠后。這一結果反映出,盡管國際巨頭在通用人工智能領域占據(jù)先發(fā)優(yōu)勢,但國內(nèi)模型通過針對性優(yōu)化和垂直場景深耕,正在逐步縮小技術差距。

據(jù)測評機構介紹,本次評估從基礎認知能力、復雜視覺推理、實際應用場景適配性三個維度展開,覆蓋圖像理解、邏輯推斷、跨模態(tài)交互等關鍵技術指標。評測數(shù)據(jù)顯示,國內(nèi)模型在中文語境下的語義理解、文化相關視覺內(nèi)容處理等方面表現(xiàn)突出,而國際模型則在多語言支持、通用場景泛化能力上保持優(yōu)勢。隨著技術迭代加速,多模態(tài)大模型正從實驗室走向?qū)嶋H應用,在醫(yī)療、教育、工業(yè)檢測等領域展現(xiàn)出巨大潛力。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容