久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

AlphaGo核心負(fù)責(zé)人戴維·席爾瓦創(chuàng)業(yè):繞開大模型,以強(qiáng)化學(xué)習(xí)叩響超級智能之門

   時(shí)間:2026-02-21 01:39 來源:快訊作者:馮璃月

前谷歌DeepMind首席科學(xué)家、AlphaGo項(xiàng)目核心負(fù)責(zé)人戴維·席爾瓦(David Silver)近日宣布在倫敦創(chuàng)立人工智能公司"Ineffable Intelligence",并啟動(dòng)規(guī)模達(dá)10億美元的種子輪融資。這一融資規(guī)模與OpenAI前首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)2024年創(chuàng)立Safe Superintelligence(SSI)時(shí)持平,標(biāo)志著AI領(lǐng)域新一輪技術(shù)路線競爭的開啟。

與當(dāng)前主流的大語言模型(LLM)技術(shù)路徑不同,席爾瓦提出要"回歸強(qiáng)化學(xué)習(xí)本質(zhì)"。他主張構(gòu)建完全自主的智能系統(tǒng),通過與環(huán)境交互積累經(jīng)驗(yàn),而非依賴人類標(biāo)注的文本數(shù)據(jù)。這一理念源于其2025年4月與導(dǎo)師查理·薩頓(Charlie Sutton)聯(lián)合發(fā)表的論文《歡迎來到經(jīng)驗(yàn)時(shí)代》,論文強(qiáng)調(diào)智能體應(yīng)通過持續(xù)試錯(cuò)實(shí)現(xiàn)自我進(jìn)化。

作為強(qiáng)化學(xué)習(xí)領(lǐng)域的標(biāo)志性人物,席爾瓦的學(xué)術(shù)影響力顯著。其論文被引用超28萬次,2019年獲得的ACM計(jì)算獎(jiǎng)印證了他在該領(lǐng)域的技術(shù)權(quán)威性。更引人注目的是,他主導(dǎo)開發(fā)的AlphaGo、AlphaZero和MuZero等系統(tǒng),已驗(yàn)證強(qiáng)化學(xué)習(xí)在規(guī)則明確環(huán)境中的突破性潛力——AlphaZero僅用三天自我對弈就超越人類千年圍棋經(jīng)驗(yàn),MuZero更在完全不知規(guī)則的情況下掌握多類游戲策略。

技術(shù)路線的分歧正在重塑AI產(chǎn)業(yè)格局。當(dāng)前主流模型如GPT系列和Gemini系列,均采用"預(yù)訓(xùn)練+微調(diào)"范式,通過海量文本數(shù)據(jù)學(xué)習(xí)語言規(guī)律。但席爾瓦指出,這種路徑存在根本性局限:AI的能力上限被人類標(biāo)注數(shù)據(jù)的質(zhì)量和數(shù)量所束縛。他特別批評了依賴人類反饋強(qiáng)化學(xué)習(xí)(RLHF)的后訓(xùn)練方式,認(rèn)為這導(dǎo)致模型認(rèn)知水平無法超越人類評估員。

Ineffable Intelligence的愿景是打造"持續(xù)學(xué)習(xí)的超級智能"。知情人士透露,該公司計(jì)劃開發(fā)能通過模擬環(huán)境自我博弈的系統(tǒng),從基礎(chǔ)原理推導(dǎo)問題解決方案。這種技術(shù)路線在AlphaGo與李世石對決中已現(xiàn)端倪——第37手看似違背所有已知定式,實(shí)則是AI通過計(jì)算發(fā)現(xiàn)的人類未知規(guī)律,這種"不可言說"的智慧正是公司名稱的由來。

資本市場對席爾瓦的押注反映了對"后大模型時(shí)代"的技術(shù)期待。接近交易的投資人表示,10億美元融資主要基于兩點(diǎn):席爾瓦在DeepMind期間證明的技術(shù)轉(zhuǎn)化能力,以及強(qiáng)化學(xué)習(xí)在復(fù)雜決策場景中的潛在突破。但質(zhì)疑聲同樣存在:現(xiàn)實(shí)世界存在規(guī)則模糊、反饋稀疏等挑戰(zhàn),強(qiáng)化學(xué)習(xí)在此類環(huán)境中的有效性尚未得到充分驗(yàn)證。

AI領(lǐng)域正經(jīng)歷路線分化。除席爾瓦外,參與AlphaGo項(xiàng)目的部分科學(xué)家近期創(chuàng)立了Reflection AI,meta則在楊立昆帶領(lǐng)下重組"超級智能實(shí)驗(yàn)室"探索新架構(gòu)。這種局面被行業(yè)觀察家比作2010年代深度學(xué)習(xí)爆發(fā)前的技術(shù)探索期——當(dāng)時(shí)主流方法尚未收斂,不同學(xué)派在競爭中推動(dòng)技術(shù)躍遷。

目前,Ineffable Intelligence已在倫敦組建核心團(tuán)隊(duì),并啟動(dòng)全球強(qiáng)化學(xué)習(xí)專家的招募計(jì)劃。盡管尚未公布產(chǎn)品路線圖,但該公司對算力資源的巨額投入,預(yù)示其可能構(gòu)建超大規(guī)模的數(shù)字孿生系統(tǒng)進(jìn)行AI訓(xùn)練。這場由技術(shù)理念差異引發(fā)的產(chǎn)業(yè)變革,或?qū)⒅匦露x通用人工智能(AGI)的發(fā)展路徑。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容