久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

Allen人工智能研究所推出MolmoWeb:開源視覺網(wǎng)絡(luò)智能體新選擇

   時間:2026-04-03 06:46 來源:快訊作者:陸辰風(fēng)

人工智能領(lǐng)域迎來重要進展——Allen人工智能研究所(Ai2)正式推出開源視覺網(wǎng)絡(luò)智能體MolmoWeb。作為Molmo 2模型家族的新成員,該系統(tǒng)以獨特的技術(shù)路徑和開源特性引發(fā)關(guān)注,其40億參數(shù)與80億參數(shù)兩個版本均支持本地部署,為研究人員提供了輕量化的研究工具。

與傳統(tǒng)依賴專有模型蒸餾訓(xùn)練的網(wǎng)絡(luò)智能體不同,MolmoWeb采用創(chuàng)新的數(shù)據(jù)構(gòu)建方式。研發(fā)團隊通過可訪問性樹技術(shù)生成合成軌跡數(shù)據(jù),結(jié)合3萬個人類任務(wù)軌跡組成的訓(xùn)練集,其中包含1100多個網(wǎng)站的近60萬個子任務(wù)。這種混合訓(xùn)練策略使模型既能理解網(wǎng)頁結(jié)構(gòu),又能模擬人類操作邏輯。訓(xùn)練數(shù)據(jù)還包含220萬組問答對,通過讓模型回答關(guān)于400個網(wǎng)站截圖的問題,強化其信息檢索能力。

在功能實現(xiàn)層面,該系統(tǒng)具備完整的瀏覽器操作能力。通過分析網(wǎng)頁截圖預(yù)測行動步驟,可完成導(dǎo)航跳轉(zhuǎn)、表單填寫、商品搜索等復(fù)雜任務(wù)。其操作方式與人類用戶高度相似,通過模擬點擊、文本輸入和頁面滾動等交互行為推進任務(wù)流程。這種設(shè)計使其能夠適應(yīng)不同網(wǎng)站的結(jié)構(gòu)變化,無需針對特定平臺進行定制開發(fā)。

基準測試數(shù)據(jù)顯示,MolmoWeb在瀏覽器操作任務(wù)中表現(xiàn)優(yōu)異。其性能超越OpenAI舊版GPT-4o模型,在開放權(quán)重模型領(lǐng)域更是一騎絕塵,40億與80億參數(shù)版本均領(lǐng)先于Fara-7B和GLM-4.1V-9B等同類產(chǎn)品。不過研究人員坦言,當(dāng)前專有模型在綜合性能上仍保持優(yōu)勢,但MolmoWeb的開源特性為學(xué)術(shù)界提供了重要的研究基線。

該項目團隊強調(diào),開源生態(tài)的完整性比單一模型性能更重要。此次發(fā)布不僅包含模型權(quán)重和訓(xùn)練代碼(即將上線),還同步開放了評估工具和人類演示數(shù)據(jù)集。其中人類任務(wù)軌跡數(shù)據(jù)集的規(guī)模創(chuàng)下公開數(shù)據(jù)集新紀錄,為后續(xù)研究提供了豐富的訓(xùn)練素材。這種全鏈條開源策略旨在破解當(dāng)前網(wǎng)絡(luò)智能體研究中的可復(fù)現(xiàn)性難題,推動技術(shù)透明化發(fā)展。

目前,MolmoWeb已通過Hugging Face和GitHub平臺向全球研究者開放下載。其輕量化設(shè)計使個人開發(fā)者也能在消費級硬件上運行模型,這為中小研究團隊參與網(wǎng)絡(luò)智能體開發(fā)提供了可能。隨著訓(xùn)練數(shù)據(jù)的持續(xù)擴充和社區(qū)貢獻的加入,這個開源系統(tǒng)有望催生更多創(chuàng)新應(yīng)用。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容