永久免费观看美女裸体视频的网站,日本免费一区二区三区视频,日韩免费无码成人久久久久久片

久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站站內(nèi)搜索

洞察行業(yè)動(dòng)向，賦能未來市場！發(fā)現(xiàn)者網(wǎng)，商業(yè)視角的探索之旅！

發(fā)現(xiàn)商業(yè)評論旗下

洞察商業(yè) 啟迪未來

前谷歌DeepMind首席科學(xué)家、AlphaGo項(xiàng)目核心負(fù)責(zé)人戴維·席爾瓦（David Silver）近日宣布在倫敦創(chuàng)立人工智能公司"Ineffable Intelligence"，并啟動(dòng)規(guī)模達(dá)10億美元的種子輪融資。這一融資規(guī)模與OpenAI前首席科學(xué)家伊利亞·蘇茨克維（Ilya Sutskever）2024年創(chuàng)立Safe Superintelligence（SSI）時(shí)持平，標(biāo)志著AI領(lǐng)域新一輪技術(shù)路線競爭的開啟。

與當(dāng)前主流的大語言模型（LLM）技術(shù)路徑不同，席爾瓦提出要"回歸強(qiáng)化學(xué)習(xí)本質(zhì)"。他主張構(gòu)建完全自主的智能系統(tǒng)，通過與環(huán)境交互積累經(jīng)驗(yàn)，而非依賴人類標(biāo)注的文本數(shù)據(jù)。這一理念源于其2025年4月與導(dǎo)師查理·薩頓（Charlie Sutton）聯(lián)合發(fā)表的論文《歡迎來到經(jīng)驗(yàn)時(shí)代》，論文強(qiáng)調(diào)智能體應(yīng)通過持續(xù)試錯(cuò)實(shí)現(xiàn)自我進(jìn)化。

作為強(qiáng)化學(xué)習(xí)領(lǐng)域的標(biāo)志性人物，席爾瓦的學(xué)術(shù)影響力顯著。其論文被引用超28萬次，2019年獲得的ACM計(jì)算獎(jiǎng)印證了他在該領(lǐng)域的技術(shù)權(quán)威性。更引人注目的是，他主導(dǎo)開發(fā)的AlphaGo、AlphaZero和MuZero等系統(tǒng)，已驗(yàn)證強(qiáng)化學(xué)習(xí)在規(guī)則明確環(huán)境中的突破性潛力——AlphaZero僅用三天自我對弈就超越人類千年圍棋經(jīng)驗(yàn)，MuZero更在完全不知規(guī)則的情況下掌握多類游戲策略。

技術(shù)路線的分歧正在重塑AI產(chǎn)業(yè)格局。當(dāng)前主流模型如GPT系列和Gemini系列，均采用"預(yù)訓(xùn)練+微調(diào)"范式，通過海量文本數(shù)據(jù)學(xué)習(xí)語言規(guī)律。但席爾瓦指出，這種路徑存在根本性局限：AI的能力上限被人類標(biāo)注數(shù)據(jù)的質(zhì)量和數(shù)量所束縛。他特別批評了依賴人類反饋強(qiáng)化學(xué)習(xí)（RLHF）的后訓(xùn)練方式，認(rèn)為這導(dǎo)致模型認(rèn)知水平無法超越人類評估員。

Ineffable Intelligence的愿景是打造"持續(xù)學(xué)習(xí)的超級智能"。知情人士透露，該公司計(jì)劃開發(fā)能通過模擬環(huán)境自我博弈的系統(tǒng)，從基礎(chǔ)原理推導(dǎo)問題解決方案。這種技術(shù)路線在AlphaGo與李世石對決中已現(xiàn)端倪——第37手看似違背所有已知定式，實(shí)則是AI通過計(jì)算發(fā)現(xiàn)的人類未知規(guī)律，這種"不可言說"的智慧正是公司名稱的由來。

資本市場對席爾瓦的押注反映了對"后大模型時(shí)代"的技術(shù)期待。接近交易的投資人表示，10億美元融資主要基于兩點(diǎn)：席爾瓦在DeepMind期間證明的技術(shù)轉(zhuǎn)化能力，以及強(qiáng)化學(xué)習(xí)在復(fù)雜決策場景中的潛在突破。但質(zhì)疑聲同樣存在：現(xiàn)實(shí)世界存在規(guī)則模糊、反饋稀疏等挑戰(zhàn)，強(qiáng)化學(xué)習(xí)在此類環(huán)境中的有效性尚未得到充分驗(yàn)證。

AI領(lǐng)域正經(jīng)歷路線分化。除席爾瓦外，參與AlphaGo項(xiàng)目的部分科學(xué)家近期創(chuàng)立了Reflection AI，meta則在楊立昆帶領(lǐng)下重組"超級智能實(shí)驗(yàn)室"探索新架構(gòu)。這種局面被行業(yè)觀察家比作2010年代深度學(xué)習(xí)爆發(fā)前的技術(shù)探索期——當(dāng)時(shí)主流方法尚未收斂，不同學(xué)派在競爭中推動(dòng)技術(shù)躍遷。

目前，Ineffable Intelligence已在倫敦組建核心團(tuán)隊(duì)，并啟動(dòng)全球強(qiáng)化學(xué)習(xí)專家的招募計(jì)劃。盡管尚未公布產(chǎn)品路線圖，但該公司對算力資源的巨額投入，預(yù)示其可能構(gòu)建超大規(guī)模的數(shù)字孿生系統(tǒng)進(jìn)行AI訓(xùn)練。這場由技術(shù)理念差異引發(fā)的產(chǎn)業(yè)變革，或?qū)⒅匦露x通用人工智能（AGI）的發(fā)展路徑。

發(fā)現(xiàn)者網(wǎng) - 深度洞察行業(yè)動(dòng)態(tài) 引領(lǐng)市場先鋒平臺(tái) - 發(fā)現(xiàn)商業(yè)評論旗下網(wǎng)站北京·通州天津·濱海山東·濟(jì)南
發(fā)現(xiàn)者網(wǎng)（m.ruruan.com.cn）所有稿件免費(fèi)開放轉(zhuǎn)載，轉(zhuǎn)載請務(wù)必保留版權(quán)。
合作微信：netspread（注明:發(fā)現(xiàn)者網(wǎng)）
Copyright ? FXW 2012-2023 m.ruruan.com.cn All rights reserved. 魯ICP備2022032383號(hào)-3 魯公網(wǎng)安備37010202700500號(hào)

AlphaGo核心負(fù)責(zé)人戴維·席爾瓦創(chuàng)業(yè)：繞開大模型，以強(qiáng)化學(xué)習(xí)叩響超級智能之門

AlphaGo核心負(fù)責(zé)人戴維·席爾瓦創(chuàng)業(yè)：繞開大模型，以強(qiáng)化學(xué)習(xí)叩響超級智能之門