久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動(dòng)向,賦能未來(lái)市場(chǎng)!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評(píng)論 旗下
洞察商業(yè) 啟迪未來(lái)

從清華少年到OpenAI骨干:翁家翌如何用“鏟子”撬動(dòng)AI未來(lái)?

   時(shí)間:2026-01-21 05:31 來(lái)源:快訊作者:蘇婉清

在人工智能領(lǐng)域,OpenAI一直是備受矚目的創(chuàng)新引擎,而其核心團(tuán)隊(duì)中有一位來(lái)自中國(guó)的工程師——翁家翌,近日在AI播客WhynotTV Podcast中分享了他從清華學(xué)子成長(zhǎng)為OpenAI基礎(chǔ)設(shè)施骨干的非凡經(jīng)歷,引發(fā)了廣泛關(guān)注。

翁家翌在強(qiáng)化學(xué)習(xí)與后訓(xùn)練(Post-Training)系統(tǒng)開(kāi)發(fā)中扮演著關(guān)鍵角色,深度參與了GPT-3.5、GPT-4、GPT-5等里程碑式模型的訓(xùn)練工作。他構(gòu)建的基礎(chǔ)設(shè)施系統(tǒng)不僅成為OpenAI內(nèi)部大模型訓(xùn)練與迭代的核心支撐,更是ChatGPT持續(xù)進(jìn)化的重要基石。在長(zhǎng)達(dá)兩個(gè)多小時(shí)的深度對(duì)話中,他首次公開(kāi)了OpenAI內(nèi)部Post-Training系統(tǒng)的構(gòu)建邏輯,并剖析了公司持續(xù)產(chǎn)出爆款模型的成功要素。

從清華大學(xué)到OpenAI,翁家翌的職業(yè)軌跡充滿傳奇色彩。在清華求學(xué)期間,他就展現(xiàn)出與眾不同的思維模式——將所有作業(yè)開(kāi)源共享,打破信息壁壘,這一舉動(dòng)在校園內(nèi)引發(fā)轟動(dòng)。他坦言:"在清華,信息差常被視為生存資源,但我認(rèn)為每個(gè)人都應(yīng)平等獲取知識(shí)。"這種理念貫穿了他的整個(gè)職業(yè)生涯。

大學(xué)時(shí)期,翁家翌的科研方向幾經(jīng)轉(zhuǎn)折。從圖形學(xué)到網(wǎng)絡(luò)安全,再到最終專注的強(qiáng)化學(xué)習(xí),他始終保持著對(duì)技術(shù)本質(zhì)的探索熱情。大二時(shí),他與學(xué)長(zhǎng)發(fā)現(xiàn)并修復(fù)了清華校園網(wǎng)的漏洞,使原本需要付費(fèi)的成績(jī)單下載服務(wù)變?yōu)槊赓M(fèi),這一經(jīng)歷不僅鍛煉了他的實(shí)戰(zhàn)能力,更堅(jiān)定了他用技術(shù)解決實(shí)際問(wèn)題的信念。

在強(qiáng)化學(xué)習(xí)領(lǐng)域,翁家翌的探索之路并非一帆風(fēng)順。他回憶道,早期在一個(gè)上世紀(jì)90年代的游戲中訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),常常需要"瘋狂地用技巧防止訓(xùn)練崩掉",這種"煉丹"般的體驗(yàn)讓他意識(shí)到工具層面的重要性。大四時(shí),他決定轉(zhuǎn)向基礎(chǔ)設(shè)施開(kāi)發(fā),這一戰(zhàn)略選擇為他日后在OpenAI的工作奠定了基礎(chǔ)。

2020年,面對(duì)多家科技巨頭的橄欖枝,翁家翌最終選擇了當(dāng)時(shí)尚未廣為人知的OpenAI。"我想體驗(yàn)世界最前沿的research是怎么做的",這個(gè)決定源于他對(duì)強(qiáng)化學(xué)習(xí)和系統(tǒng)能力的深刻認(rèn)知。加入初期,他就參與了WebGPT后續(xù)項(xiàng)目,構(gòu)建的RL訓(xùn)練系統(tǒng)在ChatGPT上線前已成為公司主力基礎(chǔ)設(shè)施之一。

在OpenAI,翁家翌主導(dǎo)搭建了強(qiáng)化學(xué)習(xí)后訓(xùn)練階段的核心基礎(chǔ)設(shè)施,他的工作哲學(xué)是"把infra地基打好,讓別人去玩"。他將自己定位為"賣(mài)鏟子里最面向客戶的那位",因?yàn)閺?qiáng)化學(xué)習(xí)模塊處于基礎(chǔ)設(shè)施棧的最頂端。這種定位使他能夠直接影響模型訓(xùn)練的效率和效果。

對(duì)于OpenAI持續(xù)推出爆款模型的現(xiàn)象,翁家翌歸因于兩個(gè)關(guān)鍵因素:高效率的迭代機(jī)制和技術(shù)領(lǐng)導(dǎo)層的深度參與。他透露,公司引入前Google工程負(fù)責(zé)人后,團(tuán)隊(duì)開(kāi)始系統(tǒng)性提升工程效率,"RL本質(zhì)上就是試錯(cuò),試得越快越多,成功就越近"。而領(lǐng)導(dǎo)層對(duì)技術(shù)細(xì)節(jié)的強(qiáng)關(guān)注,確保了組織上下信息通暢,避免了"身子動(dòng)了,腳沒(méi)動(dòng)"的執(zhí)行困境。

在ChatGPT 3.5發(fā)布前,翁家翌就已在GPT-4上驗(yàn)證了RLHF流程的可行性。他回憶道,當(dāng)時(shí)需要從頭構(gòu)建許多關(guān)鍵流程,最大的挑戰(zhàn)在于模型效果的衡量標(biāo)準(zhǔn)不清晰。"你訓(xùn)練出很多個(gè)checkpoint,但不知道哪個(gè)更好",最終團(tuán)隊(duì)只能依賴"人機(jī)協(xié)同"的評(píng)估流程,通過(guò)內(nèi)部員工交互測(cè)試來(lái)選出最佳版本。

面對(duì)外界對(duì)OpenAI"不開(kāi)放"的批評(píng),翁家翌有著深刻理解。他認(rèn)為開(kāi)源與商業(yè)可持續(xù)之間存在必然取舍:"你沒(méi)法直接把最好的模型開(kāi)源,因?yàn)楣疽妗?在他看來(lái),OpenAI的"Open"戰(zhàn)略體現(xiàn)在降低使用門(mén)檻上,比如提供免費(fèi)版本和語(yǔ)音模式體驗(yàn),這比直接開(kāi)源模型權(quán)重更有實(shí)際意義。

對(duì)于AGI(通用人工智能)的定義,翁家翌認(rèn)為不存在統(tǒng)一標(biāo)準(zhǔn):"OpenAI內(nèi)部15個(gè)人可能有20種定義方法。"他個(gè)人傾向于任務(wù)完成度的量化標(biāo)準(zhǔn):"如果它能完成80%、90%我認(rèn)為有意義的任務(wù),那可能就是AGI了。"不過(guò),他坦言當(dāng)前模型尚無(wú)法完全接管他負(fù)責(zé)的代碼修改工作,因?yàn)锳I infra的數(shù)據(jù)集覆蓋度仍然不足。

在組織管理層面,翁家翌觀察到大型科技公司的共同挑戰(zhàn)——規(guī)模帶來(lái)的效率衰減。他提到DeepSeek的快速迭代曾引發(fā)OpenAI內(nèi)部警覺(jué),這也是公司決定重構(gòu)Infra的原因:"Infra的迭代是OpenAI的生死線,我們?cè)缇筒蛔鰹榱怂穸龅氖铝恕?

展望未來(lái),翁家翌提出了一個(gè)大膽設(shè)想:具有無(wú)限上下文記憶能力的AI Agent可能成為最合適的CEO。他認(rèn)為,當(dāng)前組織臃腫、信息共享不一致的問(wèn)題源于人類認(rèn)知的局限性,而AI可以突破這些限制,未來(lái)或許能承擔(dān)起決策者的核心角色。

當(dāng)被問(wèn)及如果擁有預(yù)測(cè)未來(lái)的能力會(huì)如何時(shí),這位技術(shù)理想主義者表現(xiàn)出罕見(jiàn)的謹(jǐn)慎:"這會(huì)導(dǎo)致所有價(jià)值體系的崩塌。"他選擇專注于當(dāng)下,"假裝不知道世界是否確定",這種哲學(xué)思考折射出他對(duì)技術(shù)倫理的深刻反思。

 
 
更多>同類內(nèi)容
全站最新
熱門(mén)內(nèi)容