久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

馬斯克xAI再發(fā)力:Grok 4.1發(fā)布,情商智商雙提升,團隊或成“全華班”

   時間:2025-11-21 02:07 來源:快訊作者:沈如風(fēng)

馬斯克旗下人工智能公司xAI近日推出新一代大模型Grok 4.1,以"智商情商雙突破"的定位向行業(yè)頭部發(fā)起沖擊。該模型分為Thinking(推理版)和標(biāo)準(zhǔn)版兩個版本,現(xiàn)已通過Grok官網(wǎng)及X平臺向全球用戶開放,移動端iOS和Android應(yīng)用同步更新,用戶可免費體驗。

在權(quán)威評測平臺LMArena的最新榜單中,Grok 4.1 Thinking以1483分登頂全球大模型排行榜,較第二名Gemini 2.5 Pro高出31分。其標(biāo)準(zhǔn)版同樣表現(xiàn)亮眼,直接占據(jù)榜單次席。更引人注目的是情商專項測試EQ-Bench3的結(jié)果:Thinking版以1586分刷新紀(jì)錄,標(biāo)準(zhǔn)版緊隨其后,國產(chǎn)模型Kimi K2位列第三。

實測反饋顯示,新模型在交互體驗上實現(xiàn)質(zhì)的飛躍。相比前代產(chǎn)品,Grok 4.1展現(xiàn)出更強的共情能力,回復(fù)中不僅增加耐心傾聽的表述,還會在結(jié)尾添加愛心符號等情感化設(shè)計。創(chuàng)作能力方面,其文本生成評分較前代提升600分,敘事流暢度與畫面感顯著增強。技術(shù)團隊通過優(yōu)化訓(xùn)練方法,將模型幻覺率從12.09%壓縮至4.22%,降幅達65%。

xAI后訓(xùn)練負責(zé)人Dustin Tran透露,技術(shù)突破主要源于強化學(xué)習(xí)框架的革新。團隊開發(fā)了基于智能體推理模型的獎勵機制,通過分析數(shù)萬條真實對話數(shù)據(jù),將RLHF(人類反饋強化學(xué)習(xí))技術(shù)推向新高度。"我們擴大了10倍訓(xùn)練規(guī)模,讓模型在自主評估與迭代響應(yīng)中實現(xiàn)指數(shù)級進化。"他舉例說明,新系統(tǒng)能像人類評委般分析對話質(zhì)量,并據(jù)此優(yōu)化回答策略。

值得關(guān)注的是,xAI近期因團隊構(gòu)成引發(fā)討論。社交平臺流傳的合影顯示,其核心研發(fā)團隊以亞裔工程師為主。有消息稱,公司近期調(diào)整了人員結(jié)構(gòu),但官方未對此作出回應(yīng)。這種技術(shù)團隊的國際化特征,或許正是其能快速突破技術(shù)瓶頸的關(guān)鍵因素。

關(guān)于備受期待的Grok 5,馬斯克在最新訪談中給出明確時間表。這款規(guī)劃中的6萬億參數(shù)模型將推遲至明年發(fā)布,原因在于需要更強大的算力支撐訓(xùn)練過程。"這將是通往通用人工智能的重要里程碑,"他強調(diào),"我們寧愿延遲也要確保其成為世界上最智能的系統(tǒng)。"與此同時,谷歌即將推出的Gemini 3.0被行業(yè)視為Grok 4.1的有力競爭者,大模型領(lǐng)域的軍備競賽正進入白熱化階段。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容