久久国产精品国产精品国产-青春草在线精品视频-长春欧亚卖场是哪个区-青青草视频在线你懂的-丰满人妻一区二区三区精品高清-国产精品久久久久久无码AV-韩国精品一区二区三区四区-韩国日本在线观看一区二区-av日韩天堂在线播放

發(fā)現(xiàn)者網(wǎng) 手機(jī)網(wǎng)站 站內(nèi)搜索
  • 洞察行業(yè)動向,賦能未來市場!發(fā)現(xiàn)者網(wǎng),商業(yè)視角的探索之旅!
發(fā)現(xiàn)商業(yè)評論 旗下
洞察商業(yè) 啟迪未來

螞蟻數(shù)科開源數(shù)據(jù)分析智能體關(guān)鍵技術(shù) 登頂BIRD-SQL并規(guī)劃持續(xù)開源新能力模塊

   時(shí)間:2025-12-15 23:46 來源:互聯(lián)網(wǎng)作者:楊凌霄

在第二屆CCF中國數(shù)據(jù)大會上,螞蟻數(shù)科宣布了一項(xiàng)重要舉措:正式開源其數(shù)據(jù)智能體核心技術(shù)Agentar SQL的全套資料,涵蓋論文、代碼、模型以及詳細(xì)的使用指南。這一技術(shù)旨在讓非專業(yè)人士也能通過自然語言輕松完成商業(yè)數(shù)據(jù)的查詢與分析,為企業(yè)數(shù)字化轉(zhuǎn)型提供更加精準(zhǔn)、實(shí)用的智能數(shù)據(jù)分析基礎(chǔ)。

作為首期開源內(nèi)容,螞蟻數(shù)科推出了實(shí)時(shí)文本轉(zhuǎn)化結(jié)構(gòu)化查詢語言(Text-to-SQL)框架,為開發(fā)者提供了一套即插即用的數(shù)據(jù)查詢解決方案,顯著提升了文本與數(shù)據(jù)庫查詢之間的交互效率。未來,該公司計(jì)劃在2026年陸續(xù)開源更多技術(shù)框架,包括數(shù)據(jù)庫理解與挖掘、行業(yè)知識挖掘以及實(shí)時(shí)多輪交互技術(shù),覆蓋從意圖理解到業(yè)務(wù)理解再到數(shù)據(jù)理解的全鏈路數(shù)據(jù)能力。

由該技術(shù)支持的螞蟻數(shù)科數(shù)據(jù)分析智能體Agentar-Scale-SQL,已在全球權(quán)威的自然語言轉(zhuǎn)結(jié)構(gòu)化查詢語言(NL2SQL)評測基準(zhǔn)BIRD-SQL中脫穎而出,力壓Google等國內(nèi)外知名企業(yè),登頂排行榜。目前,該智能體在執(zhí)行準(zhǔn)確率和執(zhí)行效率兩大榜單上均保持領(lǐng)先地位,持續(xù)領(lǐng)跑超過兩個(gè)月。BIRD-SQL評測要求AI模型將自然語言查詢精準(zhǔn)轉(zhuǎn)換為SQL,并在真實(shí)復(fù)雜的大規(guī)模生產(chǎn)級數(shù)據(jù)庫中穩(wěn)定運(yùn)行。其數(shù)據(jù)集涵蓋金融、電力、醫(yī)療等37個(gè)行業(yè)場景,總量達(dá)33GB,包含超過1萬條高復(fù)雜度查詢?nèi)蝿?wù),被公認(rèn)為全球最具挑戰(zhàn)性的NL2SQL測試。

研究機(jī)構(gòu)數(shù)據(jù)顯示,全球商業(yè)智能市場規(guī)模預(yù)計(jì)在2025年達(dá)到474.8億美元,而中國商業(yè)智能與分析軟件市場規(guī)模則有望達(dá)到12億美元。到2028年,中國商業(yè)智能軟件市場規(guī)模預(yù)計(jì)將增長至17.9億美元,未來五年年復(fù)合增長率(CAGR)為12.7%,成為企業(yè)智能技術(shù)投資的重要領(lǐng)域。

當(dāng)前,中國企業(yè)在商業(yè)智能與分析產(chǎn)品的應(yīng)用深度上存在較大差異,多數(shù)企業(yè)仍集中在數(shù)據(jù)可視化和簡單分析需求,如報(bào)表、駕駛艙、儀表板等。然而,如何在保證準(zhǔn)確性的前提下,提升技術(shù)在真實(shí)生產(chǎn)環(huán)境中的可用性,仍是NL2SQL在產(chǎn)業(yè)中規(guī)?;涞氐钠毡殡y題。

螞蟻數(shù)科AI技術(shù)負(fù)責(zé)人章鵬在會上指出,NL2SQL在實(shí)際應(yīng)用中面臨四大挑戰(zhàn):理解人類口語的模糊多義性、注入龐大的行業(yè)專業(yè)知識、解析復(fù)雜的數(shù)據(jù)庫結(jié)構(gòu)與關(guān)聯(lián),以及生成準(zhǔn)確無誤的復(fù)雜SQL語句。這些挑戰(zhàn)表明,簡單的模型“套殼”無法滿足企業(yè)級應(yīng)用的可靠性與準(zhǔn)確性要求。

以金融領(lǐng)域?yàn)槔?,從業(yè)者需要結(jié)合復(fù)雜業(yè)務(wù)規(guī)則與多條件組合進(jìn)行數(shù)據(jù)查詢,以有效分析產(chǎn)品數(shù)據(jù)。而在業(yè)務(wù)管理中,非專業(yè)數(shù)據(jù)分析人員的口語化提問,則需要產(chǎn)品能夠準(zhǔn)確理解行業(yè)術(shù)語和詢問意圖,并與數(shù)據(jù)庫字段精準(zhǔn)匹配,才能生成真實(shí)準(zhǔn)確的結(jié)果。

章鵬強(qiáng)調(diào),BIRD-SQL主要評測SQL的復(fù)雜度生成能力(在線擴(kuò)展OnlineScaling),但要實(shí)現(xiàn)產(chǎn)業(yè)可用的NL2SQL乃至數(shù)據(jù)智能體技術(shù),必須構(gòu)建更完整的能力棧。除了在線擴(kuò)展,還需包括離線擴(kuò)展(Offline Scaling),即對數(shù)據(jù)庫的深度理解與知識結(jié)構(gòu)化;人機(jī)交互(Human Interaction),即智能體識別自身不確定性,主動與用戶澄清意圖,實(shí)現(xiàn)白盒化、可糾錯的協(xié)作;以及自我進(jìn)化(Self Evolution),即通過“記憶”優(yōu)化、工具(如UDF)創(chuàng)建與復(fù)用等“免調(diào)優(yōu)”技術(shù),使智能體能夠從錯誤中學(xué)習(xí),持續(xù)提升,降低對大量標(biāo)注數(shù)據(jù)和專家調(diào)優(yōu)的依賴。

螞蟻數(shù)科計(jì)劃逐步開源這些更全面的能力模塊,如理解數(shù)據(jù)庫的Agentar Profiling-SQL、實(shí)現(xiàn)免調(diào)優(yōu)進(jìn)化的Agentar TuningFree-SQL等。目前,首期在線擴(kuò)展框架Agentar-Scale-SQL的開源內(nèi)容已發(fā)布在arXiv、GitHub、ModelScope及Hugging Face等平臺,供開發(fā)者免費(fèi)使用。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容