久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

馬斯克xAI新模型Grok 4.2公測,通過趣味測試,回答風(fēng)格似“老馬”親臨

   時(shí)間:2026-02-18 18:38 來源:天脈網(wǎng)作者:顧雨柔

馬斯克旗下xAI公司推出的Grok 4.2公測Beta版在爭議聲中悄然上線。這款參數(shù)規(guī)模僅500B的模型,與當(dāng)前動(dòng)輒數(shù)萬億參數(shù)的行業(yè)主流形成鮮明對比,其市場表現(xiàn)呈現(xiàn)出兩極分化的態(tài)勢——部分用戶盛贊其創(chuàng)新功能,另一派則直言性能不及預(yù)期。

面對質(zhì)疑聲浪,馬斯克在社交平臺展開密集公關(guān)行動(dòng)。他不僅連續(xù)轉(zhuǎn)發(fā)十余條夸贊推文,更親自下場承諾:"公測將持續(xù)至下月,正式版將比Grok 4快得多、聰明得多。"據(jù)其透露,模型具備每周自我迭代的獨(dú)特能力,未來將形成固定更新節(jié)奏。這一表態(tài)與xAI聯(lián)合創(chuàng)始人近期離職引發(fā)的動(dòng)蕩形成微妙對比,此前外界甚至猜測項(xiàng)目可能難產(chǎn)。

技術(shù)特性方面,Grok 4.2首次引入實(shí)時(shí)反饋優(yōu)化機(jī)制。與傳統(tǒng)靜態(tài)更新模式不同,新模型能根據(jù)用戶交互數(shù)據(jù)持續(xù)調(diào)整性能。在弱智吧風(fēng)格測試題"50米外洗車店該開車還是步行"中,該模型展現(xiàn)出邏輯推理能力,順利通過考驗(yàn)。不過官方至今未公布完整技術(shù)報(bào)告,僅在排行榜釋放有限評測數(shù)據(jù),導(dǎo)致討論多集中于使用體驗(yàn)而非技術(shù)細(xì)節(jié)。

用戶反饋呈現(xiàn)明顯分化。批評者指出,在處理復(fù)雜邏輯問題時(shí),500B參數(shù)規(guī)模明顯力不從心,懷疑所謂"橫掃榜單"成績來自特定實(shí)驗(yàn)環(huán)境優(yōu)化。更有開發(fā)者測算其使用成本高于競品模型。支持陣營則強(qiáng)調(diào)代碼生成速度和多模態(tài)處理能力,特別提及該模型通過"Caitlyn Jenner測試"——這道曾讓ChatGPT和Gemini折戟的性別認(rèn)知題,成為Grok 4.2的亮點(diǎn)戰(zhàn)績。

爭議焦點(diǎn)還涉及模型偏見問題。盡管馬斯克宣稱Grok 4.2保持中立,但測試顯示其回答傾向與創(chuàng)始人觀點(diǎn)高度吻合。對此馬斯克回應(yīng)稱:"這還是個(gè)寶寶模型",并預(yù)告中大型版本即將推出。AI工程師Mark Krechman的爆料得到本人轉(zhuǎn)發(fā)確認(rèn)——當(dāng)前版本實(shí)為"精簡版",完整功能尚未釋放。

在模型發(fā)布同期,xAI還推出Grok imagine視頻生成模板,目前僅限iOS用戶體驗(yàn)。這款馬年主題創(chuàng)作工具,為爭議中的產(chǎn)品矩陣增添新變量。隨著公測推進(jìn),每周迭代機(jī)制能否兌現(xiàn)承諾,將成為決定Grok 4.2命運(yùn)的關(guān)鍵因素。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容