速途網(wǎng)11月18日消息(報(bào)道:李楠)今日,在2025 OceanBase年度發(fā)布會(huì)上,OceanBase發(fā)布并開源了其首款A(yù)I數(shù)據(jù)庫(kù)OceanBase seekdb(簡(jiǎn)稱seekdb)。開發(fā)者僅需三行代碼,即可快速構(gòu)建知識(shí)庫(kù)、智能體等AI應(yīng)用,輕松應(yīng)對(duì)百億級(jí)多模數(shù)據(jù)檢索,真正實(shí)現(xiàn)“開箱即用”的AI數(shù)據(jù)基座。
該產(chǎn)品支持向量、全文、標(biāo)量及空間地理數(shù)據(jù)的統(tǒng)一混合搜索,深度融合AI推理與數(shù)據(jù)處理,并兼容Hugging?Face、LangChain等30余種主流AI框架。這一產(chǎn)品實(shí)現(xiàn)了數(shù)據(jù)庫(kù)從傳統(tǒng)“業(yè)務(wù)支撐系統(tǒng)”邁向“AI原生數(shù)據(jù)入口”的新功能,也是OceanBase自啟動(dòng)“Data×AI”戰(zhàn)略以來的一份答卷。CEO楊冰表示:“希望OceanBase能夠探索出一條數(shù)據(jù)庫(kù)在AI時(shí)代的范式躍遷。”

楊冰認(rèn)為,AI的真正瓶頸不在模型,而在數(shù)據(jù)。尤其在金融、政務(wù)等高敏場(chǎng)景,AI需在毫秒級(jí)完成實(shí)時(shí)推理,并安全融合私有數(shù)據(jù)。而傳統(tǒng)架構(gòu)依賴多系統(tǒng)拼接數(shù)據(jù)鏈路,不僅復(fù)雜低效,還易引發(fā)權(quán)限混亂與延遲風(fēng)險(xiǎn)。
“seekdb不是傳統(tǒng)數(shù)據(jù)庫(kù)的功能疊加,而是專為AI時(shí)代重構(gòu)的AI原生數(shù)據(jù)庫(kù)。”楊冰表示,“它繼承OceanBase的代碼和設(shè)計(jì)理念,更輕量、更敏捷,目標(biāo)是成為大模型與私有數(shù)據(jù)融合計(jì)算的‘實(shí)時(shí)入口層’。我們希望與開發(fā)者一起,在混合搜索、多模融合等方向加速迭代、大膽創(chuàng)新。”
據(jù)Gartner預(yù)測(cè),到2028年,支持生成式AI的數(shù)據(jù)庫(kù)支出將達(dá)2180億美元,占市場(chǎng)74%。但MIT研究顯示,超95%的企業(yè)AI項(xiàng)目因多模態(tài)數(shù)據(jù)割裂、系統(tǒng)鏈路冗長(zhǎng)、權(quán)限管理復(fù)雜難以落地。seekdb帶來三大核心突破:
一是AI原生混合搜索能力。seekdb支持在一個(gè)查詢中融合向量檢索、全文搜索與標(biāo)量過濾,采用“粗排+精排”多階段檢索機(jī)制,在低延遲的同時(shí)提升精度。依托成熟的事務(wù)引擎,它支持實(shí)時(shí)寫入與ACID 一致性,并兼容MySQL 生態(tài)。此外,seekdb支持標(biāo)量、向量、文本、JSON和GIS等多模數(shù)據(jù)的統(tǒng)一存儲(chǔ)與檢索。例如,在反欺詐場(chǎng)景中,可直接查詢“近7天交易超5萬(wàn)元、位置異常且行為類似歷史欺詐樣本”,無需跨系統(tǒng)調(diào)用,兼顧性能與安全。
二是極簡(jiǎn)部署,開箱即用。seekdb最低僅需1核CPU、2GB內(nèi)存,支持pip install一鍵安裝、秒級(jí)啟動(dòng),兼容嵌入式與客戶端/服務(wù)器雙部署模式,可輕松集成至智能Agent、開發(fā)工具鏈或本地應(yīng)用,大幅降低AI應(yīng)用的工程門檻。
三是更開發(fā)者友好。seekdb以Apache 2.0協(xié)議全球開源,開發(fā)者可自由使用、修改和擴(kuò)展。產(chǎn)品全面兼容HuggingFace、Dify、LangChain等30余種AI框架及MCP大模型協(xié)議,無縫融入AI生態(tài);并提供SQL及PythonSDK,適配不同開發(fā)習(xí)慣。同期開源的PowerRAG智能文檔解析框架與PowerMem分層記憶架構(gòu),后者在LOCOMO Benchmark上以73.70分登頂SOTA,Token消耗降低96%,大幅節(jié)省推理成本。
作為 OceanBase“Data×AI”戰(zhàn)略的關(guān)鍵一環(huán),seekdb既可獨(dú)立使用,也可平滑融入新發(fā)布的OceanBase 4.4一體化融合版本。該版本首次將TP、AP與AI能力集成于單一內(nèi)核,兼具分布式擴(kuò)展、多云部署與金融級(jí)高可用,幫助企業(yè)避免后期架構(gòu)重構(gòu)風(fēng)險(xiǎn)。商用LTS版本將于2026年2月2日推出。
目前,OceanBase的混合搜索能力已在多個(gè)行業(yè)成功落地,充分驗(yàn)證了其技術(shù)價(jià)值:中國(guó)聯(lián)通基于混合搜索構(gòu)建統(tǒng)一AI知識(shí)庫(kù),有效解決了私有文檔的權(quán)限管理與高效檢索難題;螞蟻百寶箱則基于混合搜索實(shí)現(xiàn)智能體的實(shí)時(shí)在線搜索,顯著提升了信息獲取的精準(zhǔn)性與響應(yīng)效率。
“這不僅是技術(shù)產(chǎn)品,更是開發(fā)范式的躍遷?!睏畋硎?,“傳統(tǒng)數(shù)據(jù)庫(kù)只‘存’數(shù)據(jù),而seekdb能‘理解’數(shù)據(jù)語(yǔ)義,混合搜索正是AI原生數(shù)據(jù)庫(kù)的關(guān)鍵分水嶺?!边^去十五年,OceanBase在“雙11”等極限場(chǎng)景錘煉出的工程化能力,正轉(zhuǎn)化為AI時(shí)代的底層優(yōu)勢(shì),在AI原生混合搜索、多模融合、TP/AP/AI一體化、多云原生等方向持續(xù)突破。
自2010年由螞蟻集團(tuán)自主研發(fā)以來,OceanBase已服務(wù)全球4000余家企業(yè),覆蓋金融、政企、能源、通信、零售、制造、互聯(lián)網(wǎng)等關(guān)鍵領(lǐng)域。其云服務(wù)OB Cloud是全球唯一同時(shí)支持阿里云、華為云、騰訊云、百度智能云、AWS、GCP、Azure七大主流云廠商的數(shù)據(jù)庫(kù)產(chǎn)品,業(yè)務(wù)遍及全球16個(gè)國(guó)家和地區(qū)、60多個(gè)地域、240多個(gè)可用區(qū)。
楊冰強(qiáng)調(diào):“未來數(shù)據(jù)庫(kù)必須同時(shí)服務(wù)‘人’與‘智能體’。在一個(gè)數(shù)據(jù)庫(kù)中支撐事務(wù)、分析與AI混合搜索,在數(shù)據(jù)源頭驅(qū)動(dòng)實(shí)時(shí)、可信的智能。”seekdb現(xiàn)已在GitHub開源,新域名oceanbase.ai同步啟用,全球開發(fā)者可免費(fèi)下載使用。此舉是OceanBase踐行AI戰(zhàn)略的關(guān)鍵一步,旨在推動(dòng)行業(yè)加速邁向“智能原生”架構(gòu),為全球智能化轉(zhuǎn)型提供更普惠、更可落地的數(shù)據(jù)底座。