久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來

GPT-5.4重磅登場:能力效率雙提升,開啟AI數(shù)字員工新時(shí)代

   時(shí)間:2026-03-07 21:50 來源:快訊作者:顧青青

OpenAI再次引爆AI領(lǐng)域,正式推出GPT-5.4,這款被業(yè)界稱為"全能型選手"的新模型,將推理、編程、計(jì)算機(jī)原生交互、深度網(wǎng)頁搜索和百萬級(jí)Token上下文處理能力集于一身,且在各項(xiàng)性能指標(biāo)上均保持領(lǐng)先地位。這一突破性進(jìn)展,讓等待已久的AI社區(qū)終于迎來一場"驚喜暴擊"。

GPT-5.4最引人注目的創(chuàng)新在于其原生計(jì)算機(jī)操作能力。這款模型能夠通過分析軟件界面截圖,自主執(zhí)行鼠標(biāo)點(diǎn)擊、鍵盤輸入等操作,完成發(fā)送郵件、創(chuàng)建日歷事件、填寫表單等復(fù)雜任務(wù)。在WebArena瀏覽器任務(wù)測試中,GPT-5.4取得67.3%的成功率,在Online-Mind2Web測試中,僅通過截圖完成網(wǎng)頁操作的成功率高達(dá)92.8%。更令人驚嘆的是,在OSWorld-Verified桌面操作任務(wù)中,其75.0%的成功率已超越人類平均水平(72.4%)。

編程能力方面,GPT-5.4整合了此前最強(qiáng)編程模型GPT-5.3-Codex的核心功能,不僅支持1.5倍速的/fast模式輸出,還新增"Playwright (Interactive)"實(shí)驗(yàn)性功能。這項(xiàng)技術(shù)允許模型在開發(fā)網(wǎng)頁或應(yīng)用時(shí),同步進(jìn)行視覺化調(diào)試。例如在開發(fā)模擬游戲時(shí),它能同時(shí)生成美術(shù)資源、編寫邏輯代碼,并運(yùn)行自動(dòng)測試驗(yàn)證游戲狀態(tài)。在SWE-Bench Pro測試中,GPT-5.4取得57.7%的成績,延遲較前代更低,復(fù)雜前端任務(wù)的表現(xiàn)顯著提升,生成的界面設(shè)計(jì)更美觀、功能結(jié)構(gòu)更完整。

知識(shí)工作領(lǐng)域,GPT-5.4在GDPval基準(zhǔn)測試(涵蓋44種職業(yè)、9個(gè)GDP主要貢獻(xiàn)行業(yè))中,綜合得分達(dá)83.0%。在投資銀行建模測試中,其平均得分從GPT-5.2的68.4%躍升至87.3%。人類評(píng)審在PPT生成測試中,68%的時(shí)間更偏好GPT-5.4的作品,認(rèn)為其視覺效果更佳、版式更豐富、圖片運(yùn)用更合理。該模型還支持1024萬像素原圖輸入,在MMMU-Pro視覺推理測試中準(zhǔn)確率達(dá)81.2%,文檔解析錯(cuò)誤率從0.140降至0.109。

效率優(yōu)化是本次升級(jí)的另一大亮點(diǎn)。相比GPT-5.2,GPT-5.4在推理過程中使用的Token數(shù)量顯著減少,響應(yīng)速度更快且成本更低。這得益于其引入的工具搜索機(jī)制——模型不再需要將所有工具定義塞入提示詞,而是先瀏覽工具清單,需要時(shí)再調(diào)取具體定義。在MCP Atlas基準(zhǔn)測試中,這項(xiàng)技術(shù)使總Token使用量降低47%,同時(shí)保持同等準(zhǔn)確率。

隨著GPT-5.4上線,ChatGPT的模型體系同步調(diào)整。新模型同步登陸ChatGPT、API和Codex平臺(tái),API定價(jià)雖較GPT-5.2有所上漲(每百萬輸入Token從1.75美元升至2.5美元,輸出從14美元升至15美元),但任務(wù)總成本因Token消耗減少而變化不大。面向復(fù)雜任務(wù)的Pro版本同步推出,在ChatGPT中命名為GPT-5.4 Thinking,將取代此前的GPT-5.2 Thinking,而GPT-5.2系列將于三個(gè)月后正式退役,GPT-5.1系列則將在3月11日退出ChatGPT。

社交媒體上,網(wǎng)友對(duì)這款新模型的討論熱度持續(xù)攀升。有人戲稱,擁有百萬token上下文窗口且能原生操作電腦的GPT-5.4,與蘋果最新發(fā)布的低價(jià)筆記本電腦MacBook Neo形成"科技雙雄";更有開發(fā)者調(diào)侃:"我的電腦正在經(jīng)歷存在主義危機(jī)!"這些反應(yīng)折射出AI技術(shù)對(duì)傳統(tǒng)工作方式的深刻影響——當(dāng)模型能獨(dú)立完成從界面操作到多輪網(wǎng)頁搜索的完整工作流時(shí),人類與數(shù)字世界的交互方式正在發(fā)生根本性變革。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容