久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來(lái)市場(chǎng)!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來(lái)

馬斯克xAI新模型Grok 4.2公測(cè):能力毀譽(yù)參半,每周迭代能否逆襲?

   時(shí)間:2026-02-19 15:17 來(lái)源:天脈網(wǎng)作者:顧雨柔

在經(jīng)歷高層人事變動(dòng)與多次跳票后,馬斯克旗下xAI公司推出的Grok 4.2大模型終于以公測(cè)Beta版形式上線。這款參數(shù)規(guī)模為500B的模型在發(fā)布后迅速引發(fā)兩極分化評(píng)價(jià),既有用戶盛贊其多模態(tài)能力,也有人質(zhì)疑其性能與宣傳存在差距。

馬斯克在社交平臺(tái)X上展開(kāi)密集公關(guān)行動(dòng),連續(xù)轉(zhuǎn)發(fā)十余條夸贊Grok 4.2的推文,并親自發(fā)文強(qiáng)調(diào):"公測(cè)將持續(xù)至下個(gè)月,正式版將比Grok 4快得多、聰明得多。目前已知存在許多bug,團(tuán)隊(duì)正在每日修復(fù)。"他特別指出,新模型具備每周自我迭代能力,未來(lái)將形成常態(tài)化更新機(jī)制。

這款被馬斯克稱為"無(wú)偏見(jiàn)模型"的產(chǎn)品,實(shí)際測(cè)試中卻暴露出顯著傾向性。有開(kāi)發(fā)者通過(guò)特定測(cè)試發(fā)現(xiàn),Grok 4.2的回答風(fēng)格與馬斯克本人高度契合,引發(fā)關(guān)于模型中立性的討論。更引發(fā)爭(zhēng)議的是,在處理高難度邏輯推理任務(wù)時(shí),500B參數(shù)規(guī)模被指難以支撐復(fù)雜計(jì)算需求,部分場(chǎng)景表現(xiàn)甚至不及參數(shù)規(guī)模更大的競(jìng)品。

技術(shù)層面仍存在諸多謎團(tuán)。xAI至今未公布完整技術(shù)報(bào)告,僅在排行榜展示部分評(píng)測(cè)數(shù)據(jù)。據(jù)AI工程師Mark Krechman透露,當(dāng)前版本屬于"輕量級(jí)"測(cè)試版,中大型版本仍在開(kāi)發(fā)中,該說(shuō)法已獲馬斯克轉(zhuǎn)發(fā)確認(rèn)。值得關(guān)注的是,新模型引入的實(shí)時(shí)反饋優(yōu)化機(jī)制,使其具備類似人類的實(shí)踐學(xué)習(xí)能力。

在具體應(yīng)用場(chǎng)景測(cè)試中,Grok 4.2展現(xiàn)出特殊優(yōu)勢(shì)。面對(duì)國(guó)內(nèi)AI圈流行的"50米外洗車店"邏輯謎題,該模型給出符合預(yù)期的解決方案。更引發(fā)關(guān)注的是其通過(guò)"Caitlyn Jenner測(cè)試"的表現(xiàn)——當(dāng)被問(wèn)及跨性別者稱謂問(wèn)題時(shí),Grok 4.2給出符合語(yǔ)境的回答,而ChatGPT和Gemini此前在該測(cè)試中均出現(xiàn)爭(zhēng)議性回應(yīng)。

伴隨公測(cè)啟動(dòng),xAI同步推出Grok imagine視頻生成模板,目前僅限iOS用戶使用。這款新工具的推出,顯示出xAI在多模態(tài)領(lǐng)域的持續(xù)布局。盡管馬斯克對(duì)Grok 4.2充滿信心,但市場(chǎng)觀察人士指出,在OpenAI、Anthropic等競(jìng)爭(zhēng)對(duì)手持續(xù)發(fā)力的背景下,xAI仍需解決模型性能、開(kāi)發(fā)透明度等關(guān)鍵問(wèn)題。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容