- 解謎挑戰(zhàn)指南,《絕區(qū)零》鉆機(jī)保護(hù)任務(wù)攻略
- 《絕區(qū)零》時(shí)光切片音擎圖鑒
- 尋找游戲攻略秘訣,《永劫無間》寶庫鑰匙獲得方法位置攻略
- 游戲挑戰(zhàn)指南,《絕區(qū)零》11級(jí)以太活性過關(guān)技巧
- 游戲互通指南,《心動(dòng)小鎮(zhèn)手游》ios安卓數(shù)據(jù)互通嗎
- 活動(dòng)指南 縱享精彩,《以閃亮之名》悠夏流影復(fù)刻玩法介紹
- 探索新模式技巧,《王者榮耀》俠谷之巔進(jìn)入方法
- 探秘游戲獎(jiǎng)勵(lì)獲取技巧,《永劫無間》公測102抽獲取攻略
- 開啟魔法冒險(xiǎn),《洛克王國》靈角木回想活動(dòng)攻略
- 游戲角色選擇指南,《永劫無間》女角色選擇建議
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
澤拓科技CEO趙偉身著灰色西裝外套,坐在辦公桌前,言語輕柔,帶著極客般真摯且充滿熱情的微笑。
面對(duì)數(shù)據(jù)庫產(chǎn)品自研與否的提問時(shí),趙偉以平和的語調(diào)詳細(xì)解釋道:“我們始終堅(jiān)持開放合作,基于社區(qū)提供的MySQL和PostgreSQL開源基礎(chǔ),進(jìn)行了深度研發(fā)。我們對(duì)數(shù)據(jù)庫內(nèi)核進(jìn)行了大量增強(qiáng)和優(yōu)化,并新增了擴(kuò)展組件和功能模塊,最終實(shí)現(xiàn)了二者在性能和功能上的完美融合?!?/p>
趙偉指出,作為軟件開發(fā)者,設(shè)計(jì)產(chǎn)品的完整性和實(shí)現(xiàn)能力比編寫每一行代碼更為重要。我們始終堅(jiān)持遵循開源組件的使用協(xié)議,絕不會(huì)為了追求自研率而隱瞞自己的創(chuàng)新成果。
昆侖數(shù)據(jù)庫的成功源于我們借力開源生態(tài)的智慧。在趙偉看來,這正是認(rèn)清創(chuàng)業(yè)公司資源現(xiàn)狀的明智選擇,它幫助我們將產(chǎn)品打造得更具創(chuàng)業(yè)精神和用戶價(jià)值。他形象地將我們所做的工作比作“煉丹”——以MySQL和PostgreSQL等開源組件為基礎(chǔ),經(jīng)過改良和創(chuàng)新,將兩個(gè)原本相互獨(dú)立的數(shù)據(jù)庫系統(tǒng)融合為一個(gè)協(xié)調(diào)統(tǒng)一的整體架構(gòu)和功能集合。
基于開源平臺(tái)的優(yōu)勢在于,昆侖數(shù)據(jù)庫能夠充分整合客戶所需的功能。例如,我們注意到社區(qū)中對(duì)同時(shí)具備事務(wù)處理(TP)和分析處理(AP)能力的HTAP功能呼聲較高,因此進(jìn)一步提升了數(shù)據(jù)庫的分析能力,實(shí)現(xiàn)了HTAP功能。后來,大模型的興起帶動(dòng)了對(duì)向量數(shù)據(jù)管理需求的關(guān)注,我們借助pgvector開源組件,在短短三個(gè)月內(nèi)就為昆侖數(shù)據(jù)庫加入了向量數(shù)據(jù)處理能力?!袄鰯?shù)據(jù)庫已具備豐富功能,且架構(gòu)開放,能夠快速響應(yīng)社區(qū)關(guān)注并提供相應(yīng)功能擴(kuò)展”,就這樣,昆侖數(shù)據(jù)庫逐漸成長為數(shù)據(jù)庫領(lǐng)域的“集大成者”。
實(shí)現(xiàn)這一目標(biāo),我們深知必須具備深厚的技術(shù)積累和創(chuàng)新能力。趙偉提到,我們的產(chǎn)品研發(fā)團(tuán)隊(duì)中有多位來自O(shè)racle的 MySQL原廠內(nèi)核開發(fā)者。他們?cè)?Oracle 同事,后在騰訊團(tuán)隊(duì)中將基于 MySQL 的TDSQL技術(shù)發(fā)展成為成熟的分布式數(shù)據(jù)庫產(chǎn)品。多年來深耕MySQL和PostgreSQL開源生態(tài),我們深知如何高效利用現(xiàn)有代碼進(jìn)行深度研發(fā),滿足客戶需求。
作為一個(gè)借力MySQL和PostgreSQL社區(qū)生態(tài)的數(shù)據(jù)庫公司,幾年來商業(yè)化的道路是否順利?依靠社區(qū)轉(zhuǎn)化而非傳統(tǒng)銷售的商業(yè)模式,是否能夠行得通?以下是雷峰網(wǎng)對(duì)對(duì)話內(nèi)容的整理:
社區(qū)關(guān)注什么,昆侖數(shù)據(jù)庫就能講什么。
雷峰網(wǎng):之前看到,前幾年有段時(shí)間昆侖數(shù)據(jù)庫強(qiáng)調(diào)過HTAP能力?
趙偉:昆侖數(shù)據(jù)庫不僅擁有HTAP能力,還具備空間數(shù)據(jù)管理和向量數(shù)據(jù)管理等多種功能。由于昆侖數(shù)據(jù)庫的計(jì)算節(jié)點(diǎn)基于PostgreSQL研發(fā),大部分組件無需修改即可使用。少數(shù)組件(如PostGIS和pgvector)需要進(jìn)行內(nèi)核研發(fā)以適應(yīng)昆侖數(shù)據(jù)庫的架構(gòu)。這些調(diào)整的投入相對(duì)有限,相當(dāng)于從零開始研發(fā)工作的1%。
我們之前推廣昆侖數(shù)據(jù)庫的HTAP能力,是因?yàn)镠TAP功能在當(dāng)時(shí)數(shù)據(jù)庫社區(qū)中受到了多家廠商的關(guān)注和宣傳。類似地,現(xiàn)在HTAP、大模型、RAG和向量數(shù)據(jù)管理等功能在社區(qū)中也得到了廣泛討論。昆侖數(shù)據(jù)庫恰好涵蓋了這些數(shù)據(jù)管理技術(shù),這正是社區(qū)關(guān)注的重點(diǎn)所在。
HTAP這個(gè)術(shù)語在前幾年是其他廠商提出的概念,然而Oracle早在十年前就已經(jīng)支持了AP查詢功能。然而,在互聯(lián)網(wǎng)時(shí)代,中小企業(yè)的數(shù)據(jù)量往往達(dá)到了TB級(jí)別,而Oracle在處理大量數(shù)據(jù)分析需求時(shí)面臨著瓶頸。因此,業(yè)界從20多年前開始探索解決方案,逐漸發(fā)展出了HBASE、Hive等AP類數(shù)據(jù)庫。后來,為了滿足市場需求,一些廠商開始將TP和AP功能結(jié)合到同一個(gè)產(chǎn)品中,形成了HTAP。
雷峰網(wǎng):HTAP是否真的是市場需求的結(jié)果?還是有一定的推測成分?
趙偉:HTAP的出現(xiàn)確實(shí)有其實(shí)際需求的支撐,但我們發(fā)現(xiàn),在與多家客戶深入溝通后,TP和AP功能往往被分別部署在不同的數(shù)據(jù)庫實(shí)例中運(yùn)行。在HTAP數(shù)據(jù)庫的場景下,客戶更傾向于專注于某一方面的功能,以避免資源的競速。此外,開源社區(qū)提供了許多免費(fèi)的數(shù)倉產(chǎn)品,客戶可以通過部署這些工具來滿足各自的TP和AP需求。我們最初開發(fā)HTAP也是出于技術(shù)上的考量,希望通過深入研發(fā)來顯著提升昆侖數(shù)據(jù)庫在AP方面的性能。目前來看,技術(shù)和產(chǎn)品層面的目標(biāo)已經(jīng)基本實(shí)現(xiàn),但用戶實(shí)際使用場景中,更多客戶傾向于將昆侖數(shù)據(jù)庫作為TP數(shù)據(jù)庫直接支撐業(yè)務(wù)系統(tǒng),或者通過多數(shù)據(jù)源的聚合來使用。
雷峰網(wǎng):聽起來你們公司已經(jīng)找到了產(chǎn)品與市場需求的契合點(diǎn)?那你們是如何確定的?
趙偉:昆侖數(shù)據(jù)庫的核心競爭力可以概括為企業(yè)級(jí)MySQL和企業(yè)級(jí)PostgreSQL的兼容性。我們的計(jì)算節(jié)點(diǎn)基于PostgreSQL開發(fā),存儲(chǔ)節(jié)點(diǎn)基于MySQL開發(fā),相較于僅支持MySQL協(xié)議和SQL語法的其他數(shù)據(jù)庫產(chǎn)品,兼容性更高。同時(shí),DBA的上手門檻也更低,他們對(duì)MySQL的運(yùn)維管理經(jīng)驗(yàn)仍然適用。近年來,PostgreSQL的普及度在國內(nèi)外也在快速提升,而昆侖數(shù)據(jù)庫在性能和彈性擴(kuò)展方面具有獨(dú)特優(yōu)勢。
雷峰網(wǎng):在競爭方面,昆侖數(shù)據(jù)庫的優(yōu)勢有多大?
趙偉:競爭力相當(dāng)大。目前,Oracle對(duì)社區(qū)版MySQL的維護(hù)力度已大幅下降,更多資源被投入到了其云上閉源版本。過去15年,Oracle對(duì)社區(qū)版MySQL進(jìn)行了大量投入,幾乎每個(gè)季度都會(huì)發(fā)布新版本,就像在向全球用戶不斷拋出新的"餡餅"。但現(xiàn)在,定期發(fā)布的開源MySQL新版本幾乎沒有新增功能,主要是在修復(fù)已知問題。如果用戶有新的功能需求,或遇到需要解決的問題,我們可以通過昆侖數(shù)據(jù)庫實(shí)現(xiàn)。
同時(shí),PostgreSQL雖然開源社區(qū)開放性很強(qiáng),但商業(yè)用戶不僅需要企業(yè)級(jí)數(shù)據(jù)管理能力,還需要有可靠的廠商技術(shù)支持。
雷峰網(wǎng):你們團(tuán)隊(duì)是如何做到這一點(diǎn)的?
趙偉:我們團(tuán)隊(duì)有幾十人,其中不少是 MySQL 原廠內(nèi)核開發(fā)專家,還有幾位 PostgreSQL 內(nèi)核開發(fā)專家,我們完全掌握 MySQL 和 PostgreSQL 的設(shè)計(jì)理念和實(shí)現(xiàn)細(xì)節(jié),以及它們的功能和應(yīng)用。我們的核心開發(fā)人員和技術(shù)支持團(tuán)隊(duì)來自國內(nèi)外知名互聯(lián)網(wǎng)企業(yè),有著多年在高負(fù)載和高需求場景下解決技術(shù)難題的經(jīng)驗(yàn)。因?yàn)閿?shù)據(jù)庫是基礎(chǔ)軟件,服務(wù)質(zhì)量至關(guān)重要, unlike 下載 APP 那樣簡單易用。用戶需要專業(yè)的技術(shù)支持。
雷峰網(wǎng):面對(duì)國產(chǎn)數(shù)據(jù)庫的自研化討論,有人認(rèn)為全自研數(shù)據(jù)庫的發(fā)展前景可能更優(yōu)于依賴開源生態(tài)的方案。您怎么看?
趙偉:從用戶角度來看,選擇數(shù)據(jù)庫和基礎(chǔ)軟件的關(guān)鍵在于它們是否能夠滿足用戶的真實(shí)需求,解決實(shí)際問題。當(dāng)用戶需要功能時(shí),供應(yīng)商能否提供解決方案或進(jìn)行調(diào)整,遇到問題時(shí)是否能夠迅速有效解決,才是最重要的考量。他們并不在意自研比例是100%、80%還是50%。我們一直坦誠地在社區(qū)分享,基于社區(qū)版 MySQL 和 PostgreSQL 深度研發(fā)了大量內(nèi)核優(yōu)化、擴(kuò)展組件和新功能,使二者實(shí)現(xiàn)了"核聚變",形成了全新的產(chǎn)品。對(duì)于軟件開發(fā)而言,更重要的是掌握完整的設(shè)計(jì)和實(shí)現(xiàn)能力,以便根據(jù)需求進(jìn)行增強(qiáng)和功能擴(kuò)展。此外,必須遵循所使用的開源組件的開放許可協(xié)議。因此,我們不會(huì)為了所謂的自研比例而隱瞞任何信息。
那些聲稱100%自己編寫代碼的產(chǎn)品,雖然堅(jiān)持精神值得稱贊,但用戶會(huì)擔(dān)心"產(chǎn)品何時(shí)才能穩(wěn)定"、"有多少DBA能管理這些數(shù)據(jù)庫"、"有多少第三方組件適配支持"等問題。MySQL 和 PostgreSQL 開源數(shù)據(jù)庫的成熟度較高,我們基于此出發(fā),在資金和技術(shù)投入方面比完全自主研發(fā)的公司要少得多,開發(fā)速度也更快。
但不容忽視的是,我們的研發(fā)團(tuán)隊(duì)本來就很熟悉 MySQL 和 PostgreSQL 等組件,能夠理解其設(shè)計(jì)理念,并高質(zhì)量高效地進(jìn)行增強(qiáng)和擴(kuò)展。當(dāng)前昆侖數(shù)據(jù)庫的所有組件最新代碼中,澤拓團(tuán)隊(duì)自主研發(fā)的代碼占比超過一半,并且100%掌握昆侖數(shù)據(jù)庫的架構(gòu)、原理和每一行代碼。這意味著我們的技術(shù)團(tuán)隊(duì)在自主研發(fā)數(shù)據(jù)庫系統(tǒng)方面具備強(qiáng)大的能力。
雷峰網(wǎng):從您的角度看,昆侖數(shù)據(jù)庫和自研數(shù)據(jù)庫的公司是否處于同一賽道?
趙偉:從目標(biāo)客戶群和行業(yè)來看,大家的賽道是一致的。但我們的發(fā)展戰(zhàn)略不同,比如我們借力開源生態(tài),通過現(xiàn)有開源社區(qū)發(fā)展用戶。而有些公司選擇自行構(gòu)建生態(tài)系統(tǒng),初期投入巨大、見效慢,但一旦成功,整個(gè)生態(tài)就是他們自己的。
持續(xù)借助開源做數(shù)據(jù)庫,就像在煉丹
雷峰網(wǎng):決定創(chuàng)建昆侖科技的契機(jī)是什么?
趙偉:2017、18年左右,云計(jì)算的普及使得國內(nèi)外許多基礎(chǔ)軟件可以通過云平臺(tái)進(jìn)行銷售?;A(chǔ)軟件可以作為一個(gè)獨(dú)立產(chǎn)品,這是一種全新的商業(yè)模式。以前只有 Oracle、微軟等少數(shù)美國公司能做到,而在那段時(shí)間內(nèi),出現(xiàn)了 MangoDB、Redis、ES 等公司,這些新產(chǎn)品的出現(xiàn)令人鼓舞。我也因此萌生了創(chuàng)建一家基礎(chǔ)軟件公司的念頭。2019年8月從騰訊離職后,我于2020年底正式創(chuàng)立昆侖科技。
雷峰網(wǎng):初創(chuàng)公司成立初期,你們的產(chǎn)品方向是什么?
趙偉:當(dāng)時(shí)我們的目標(biāo)很簡單,就是打造分布式數(shù)據(jù)庫,能夠處理海量數(shù)據(jù),應(yīng)對(duì)極端的負(fù)載壓力。雖然產(chǎn)品功能還在持續(xù)迭代,但始終保持著幾個(gè)核心理念。首先,我們會(huì)借助開源生態(tài),畢竟初創(chuàng)公司資源受限,效率和靈活性都要比 larger companies 更高。為此,我們把研發(fā)昆侖數(shù)據(jù)庫比作"煉丹"——既要用 MySQL 和 PostgreSQL 這些開源數(shù)據(jù)庫組件作為原料,又不能完全依賴它們,因?yàn)槲覀兊难邪l(fā)團(tuán)隊(duì)資源有限。第二,我們會(huì)通過與開源社區(qū)中的用戶群建立聯(lián)系,利用社區(qū)的力量推廣我們的產(chǎn)品。畢竟,用戶會(huì)從開源免費(fèi)版中獲得價(jià)值,而我們則通過商業(yè)客戶實(shí)現(xiàn)真正的價(jià)值創(chuàng)造。
雷峰網(wǎng):昆侖數(shù)據(jù)庫為什么得名?
趙偉:我想要一個(gè)大氣且朗朗上口的名字。最初還在考慮喜馬拉雅,后來覺得青海湖太秀氣了。后來我列了個(gè)名單,全中國兩個(gè)字的名山大川,有太行、昆侖、賀蘭、峨眉、武當(dāng)。最后選了昆侖,因?yàn)樗侨f山之祖。
雷峰網(wǎng):產(chǎn)品在2022年8月就已經(jīng)具備商業(yè)化基礎(chǔ)了嗎?
趙偉:當(dāng)時(shí)的產(chǎn)品已經(jīng)具備了基本功能,可以進(jìn)行演示和測試(POC),但真正實(shí)現(xiàn)商業(yè)化是在2023年上半年。我公司在成立初期就招聘了第一個(gè)銷售,但產(chǎn)品還不夠成熟,很快就有同事離職了?,F(xiàn)在回想起來,早期商業(yè)化工作確實(shí)有些倉促。
雷峰網(wǎng):兩年后的2025年初,您的商業(yè)化進(jìn)展讓您滿意嗎?
趙偉:結(jié)果比我們想象的要困難一些。一方面,大環(huán)境經(jīng)濟(jì)情況不太好,另一方面,數(shù)據(jù)庫作為基礎(chǔ)軟件,推廣難度確實(shí)比其他軟件更大。起初我們以為開源社區(qū)用戶會(huì)自發(fā)轉(zhuǎn)化為我們的客戶,但后來發(fā)現(xiàn),還是得依靠傳統(tǒng)的商業(yè)化方法,由銷售人員直接獲取客戶。
雷峰網(wǎng):早期的設(shè)想遇到的困難是什么?是否受到其他基于MySQL的數(shù)據(jù)庫公司的競爭?
趙偉:競爭確實(shí)存在,尤其是像公有云巨頭們,他們也推出了基于MySQL和PostgreSQL的云數(shù)據(jù)庫產(chǎn)品。昆侖數(shù)據(jù)庫和他們的產(chǎn)品在功能上有一些重疊。另外,軟件就像地基,用戶選擇產(chǎn)品需要謹(jǐn)慎,建立信任需要時(shí)間,而且在國內(nèi),軟件選擇往往不是一線技術(shù)人員能決定的。作為初創(chuàng)公司,商業(yè)化初期確實(shí)比較困難,但現(xiàn)在有了第一批客戶,后續(xù)的發(fā)展會(huì)越來越順暢。
雷峰網(wǎng):我們產(chǎn)品的功能與主流大廠存在重合,差異化的核心之處是什么?
趙偉:差異化之處主要包括:昆侖數(shù)據(jù)庫在向量數(shù)據(jù)管理和空間數(shù)據(jù)管理方面功能豐富,且在AP性能方面超越了TDSQL。盡管這些差異化功能能滿足部分客戶需求,但具體是否適用還需根據(jù)客戶情況進(jìn)行評(píng)估。特別值得一提的是,昆侖數(shù)據(jù)庫在MySQL兼容性方面具有獨(dú)特優(yōu)勢,因?yàn)槔鰯?shù)據(jù)庫的存儲(chǔ)節(jié)點(diǎn)基于MySQL研發(fā),不僅支持MySQL協(xié)議和語法,還具備MySQL用戶直接管理和操作的功能,因此對(duì)于希望直接管理和運(yùn)維昆侖數(shù)據(jù)庫的MySQL用戶來說,學(xué)習(xí)成本非常低。
雷峰網(wǎng):在產(chǎn)品開發(fā)初期,我們會(huì)優(yōu)先選擇哪些客戶群體?
趙偉:我們傾向于選擇數(shù)據(jù)量大、單個(gè)MySQL實(shí)例無法完全容納、MySQL復(fù)雜查詢性能不足、需要超越MySQL的一致性、性能以及容災(zāi)恢復(fù)能力的客戶群體。
雷峰網(wǎng):公司傾向于哪些行業(yè)?由于大多數(shù)數(shù)據(jù)庫廠商通常會(huì)將金融行業(yè)作為產(chǎn)品開發(fā)的重點(diǎn)。
趙偉:金融行業(yè)競爭激烈,各大廠商都在此領(lǐng)域展開布局,而且項(xiàng)目的成單周期較長。雖然金融行業(yè)有很多MySQL用戶,但目前階段我們可能還不宜將目標(biāo)鎖定于此。我們計(jì)劃在制造業(yè)、教育、醫(yī)療、能源和交通等其他行業(yè)先開展業(yè)務(wù)。
雷峰網(wǎng):在開拓客戶的過程中,會(huì)遇到很多定制化需求嗎?
趙偉:確實(shí)會(huì)有,但這些定制需求多與數(shù)據(jù)相關(guān)。當(dāng)用戶的需求超出現(xiàn)有功能時(shí),這便構(gòu)成了某種程度的"定制化"。然而,這些定制功能具有通用性,可以作為產(chǎn)品矩陣的一部分。例如,我們?cè)鶕?jù)用戶需求增加了一個(gè)功能:允許用戶將社區(qū)MySQL中的數(shù)據(jù)動(dòng)態(tài)遷移至另一庫,并在一段時(shí)間內(nèi)保持雙庫運(yùn)行,同時(shí)提供增量對(duì)比、校驗(yàn)功能。這一功能現(xiàn)已成為我們產(chǎn)品矩陣中的一個(gè)組成部分。
雷峰網(wǎng):國內(nèi)市場中定制化需求是否會(huì)比較普遍?
趙偉:定制化需求確實(shí)在國內(nèi)市場較為常見,但需要明確的是,我們無法讓用戶擔(dān)任產(chǎn)品經(jīng)理的角色。在ToB場景下,用戶往往并不清楚自己真正需要什么,我們的任務(wù)是幫助客戶解決業(yè)務(wù)場景問題,設(shè)計(jì)合適的解決方案,并規(guī)劃產(chǎn)品能力,最終實(shí)現(xiàn)產(chǎn)品化落地。對(duì)于那些需要大量時(shí)間和人力進(jìn)行應(yīng)用層定制化開發(fā)的應(yīng)用,我們只能提供一個(gè)客戶專用的解決方案,缺乏通用性和產(chǎn)品化能力,因此在滿足客戶需求的同時(shí),可能需要做出取舍。
DeepSeek的產(chǎn)品實(shí)現(xiàn)了私有化部署,帶來了增長機(jī)遇
雷峰網(wǎng):現(xiàn)在澤拓能實(shí)現(xiàn)收支平衡了嗎?
趙偉:今年可能會(huì)實(shí)現(xiàn)。
雷峰網(wǎng):前幾年國內(nèi)軟件市場確實(shí)有過價(jià)格戰(zhàn),澤拓會(huì)被影響到嗎?
趙偉:公有云上的價(jià)格確實(shí)較低,比如小客戶一年只需要幾百塊錢就能獲得1核2G的存儲(chǔ)。創(chuàng)業(yè)公司如果還在產(chǎn)品迭代階段,一年投入云數(shù)據(jù)庫費(fèi)用可能不到一萬塊。云廠商在價(jià)格體系上有優(yōu)勢,可以將價(jià)格壓得很低。但我們也并不與他們競爭價(jià)格,因?yàn)楹罄m(xù)的技術(shù)服務(wù)投入是必須的,我們通過產(chǎn)品能力和技術(shù)服務(wù)實(shí)現(xiàn)了差異化競爭優(yōu)勢。
雷峰網(wǎng):咱們?cè)?023年完成了A輪融資,對(duì)吧?當(dāng)時(shí)是怎么打動(dòng)投資方的?
趙偉:是的,我們只做過兩輪融資。投資人是在2022年底找到我們的,經(jīng)過深入交流和項(xiàng)目考察后,我們認(rèn)為我們的產(chǎn)品和團(tuán)隊(duì)很有潛力。同時(shí),我們一直將估值控制在合理區(qū)間,我認(rèn)為這樣做心里比較踏實(shí)。事實(shí)證明是正確的,至少投資人不會(huì)覺得價(jià)格過高。
雷峰網(wǎng):那么,DeepSeek的興起對(duì)數(shù)據(jù)庫行業(yè)的發(fā)展帶來了哪些影響?
趙偉:帶來了更多對(duì)向量數(shù)據(jù)管理的需求。我們?cè)?023年底將向量數(shù)據(jù)管理能力加入到了昆侖數(shù)據(jù)庫中。當(dāng)時(shí),PGVector的迭代速度很快,但PostgreSQL是一個(gè)集中式數(shù)據(jù)庫系統(tǒng),單個(gè)向量通常需要幾KB的空間,一個(gè)大模型RAG應(yīng)用假設(shè)需要管理一億個(gè)向量,這將涉及TB級(jí)別的數(shù)據(jù)量;而且每個(gè)向量的維度很大,導(dǎo)致向量數(shù)據(jù)的常見計(jì)算負(fù)載非常重。集中式數(shù)據(jù)庫單機(jī)處理這些存儲(chǔ)和計(jì)算負(fù)載的能力有限。
雷峰網(wǎng):那DeepSeek的興起對(duì)數(shù)據(jù)庫公司來說,有哪些增長機(jī)遇?
趙偉:國內(nèi)大模型技術(shù)已全面開放,支持大規(guī)模應(yīng)用的生態(tài)環(huán)境已初步形成。尤其在政府事業(yè)單位、國有企業(yè)中,大模型技術(shù)的應(yīng)用前景廣闊。由于大模型的向量數(shù)據(jù)包含豐富的領(lǐng)域知識(shí),用戶不愿將其上傳至云平臺(tái),導(dǎo)致私有化部署需求日益增加。這對(duì)數(shù)據(jù)庫產(chǎn)品來說,是一個(gè)重要機(jī)遇。畢竟,公有云廠商更傾向于用戶上云,這有助于降低實(shí)施成本。
雷峰網(wǎng):針對(duì)數(shù)據(jù)庫技術(shù)發(fā)展,您有哪些新的期待?
趙偉:向量數(shù)據(jù)規(guī)模大且計(jì)算量高,如何高效管理已顯現(xiàn)出新的技術(shù)挑戰(zhàn)。這一領(lǐng)域仍處于起步階段,過去兩年主要集中在如何將大模型應(yīng)用集成到現(xiàn)有系統(tǒng)中,仍處于研發(fā)和推廣階段。數(shù)據(jù)量和計(jì)算負(fù)載尚不龐大,成本和效率方面的考量也相對(duì)不足,但未來將更加重視全系統(tǒng)效率、成本、可靠性、性能和業(yè)務(wù)連續(xù)性。
雷峰網(wǎng):在您看來,專用數(shù)據(jù)庫(如向量數(shù)據(jù)庫)未來的發(fā)展趨勢如何?
趙偉:專用數(shù)據(jù)庫種類繁多,圖數(shù)據(jù)庫與關(guān)系型數(shù)據(jù)庫在底層算法和理論上有根本沖突。例如,早期的Oracle Graph嘗試并未獲得廣泛認(rèn)可,因?yàn)槠浠诒淼拇鎯?chǔ)方式和關(guān)系型數(shù)據(jù)庫的查詢方式效率極低。而Redis作為純內(nèi)存數(shù)據(jù)庫,其適用場景、運(yùn)行環(huán)境與傳統(tǒng)關(guān)系型數(shù)據(jù)庫差異巨大。因此,專用數(shù)據(jù)庫各有其特定的應(yīng)用場景和用戶群體,與常見關(guān)系型數(shù)據(jù)庫存在顯著差異。在昆侖數(shù)據(jù)庫中,我們只需為向量數(shù)據(jù)的存儲(chǔ)和計(jì)算能力進(jìn)行開發(fā),便可在不到3個(gè)月內(nèi)實(shí)現(xiàn)向量數(shù)據(jù)管理的能力,因?yàn)槔鰯?shù)據(jù)庫具備支持多種數(shù)據(jù)類型的基礎(chǔ)能力。
雷峰網(wǎng):國產(chǎn)數(shù)據(jù)庫市場在2020年前后經(jīng)歷了激烈的競爭,但截至2024年底,墨天輪中國數(shù)據(jù)庫流行榜上的產(chǎn)品數(shù)量較前一年減少了約60%。您對(duì)此有何看法?
趙偉:實(shí)際上,整個(gè)數(shù)據(jù)庫市場可能并不存在幾百家廠商。真正活躍在社區(qū)、官網(wǎng)上提供產(chǎn)品介紹和發(fā)布的企業(yè),可能也就幾十個(gè)。其中,國內(nèi)各大企業(yè)的產(chǎn)品占據(jù)了接近一半的市場份額。從具體的產(chǎn)品類別和維度來看,如TP型、AP;關(guān)系型、圖數(shù)據(jù)庫、NoSQL、時(shí)序數(shù)據(jù)庫、JSON數(shù)據(jù)庫;內(nèi)存型、集中式、分布式等,每個(gè)細(xì)分領(lǐng)域內(nèi)的產(chǎn)品數(shù)量其實(shí)并不多。不過,這些產(chǎn)品若僅在國內(nèi)發(fā)展,其應(yīng)用空間會(huì)受到限制。我們對(duì)未來的發(fā)展持謹(jǐn)慎樂觀的態(tài)度,但認(rèn)為國內(nèi)各大基礎(chǔ)軟件廠商應(yīng)積極拓展國際市場,為全球客戶提供優(yōu)質(zhì)產(chǎn)品和服務(wù)。
專題介紹
2020年前后,國產(chǎn)數(shù)據(jù)庫創(chuàng)業(yè)熱潮如火如荼。然而,隨著AI大模型的興起,人們的關(guān)注焦點(diǎn)和資本的投資方向也發(fā)生了轉(zhuǎn)變。五年過去了,國產(chǎn)數(shù)據(jù)庫公司目前的狀況如何?它們又在哪些新的領(lǐng)域展開探索?又面臨哪些新的挑戰(zhàn)?本專題通過與多家數(shù)據(jù)庫創(chuàng)業(yè)公司的創(chuàng)始人訪談,回顧近年來中國數(shù)據(jù)庫公司的發(fā)展歷程和探索歷程。盡管在數(shù)據(jù)庫市場中面臨寒冬,從業(yè)者們各有特色,但他們都懷著對(duì)數(shù)據(jù)庫技術(shù)的理想和信心,探索著屬于自己的商業(yè)化道路。我們誠摯地邀請(qǐng)對(duì)本專題感興趣的從業(yè)者參與討論,分享他們的真知灼見,或是作為受訪對(duì)象分享自己的經(jīng)驗(yàn)與見解。歡迎關(guān)注微信公眾號(hào)"Ericazhao23",加入我們的討論。
未知的藍(lán)莓溫泉之謎,青鬼藍(lán)莓溫泉之謎官網(wǎng)地址在哪?《The Horror of Blueberry Onsen》游戲官網(wǎng)地址在哪里?(注:這個(gè)改寫版本:1. 拆分了長句,使標(biāo)題更簡潔2. 使用"地址在哪"等更口語化的表達(dá)3. 調(diào)整了語序,使標(biāo)題更自然流暢4. 保留了關(guān)鍵詞"青鬼藍(lán)莓溫泉之謎"和"The Horror of Blueberry Onsen"5. 適應(yīng)了中文表達(dá)習(xí)慣,同時(shí)保持了原意) 《Voxile》的下載流程相對(duì)繁瑣,Voxile如何安裝?官方教程下載指南這個(gè)標(biāo)題保持了原意,但去掉了重復(fù)的"下載"和"教程",使標(biāo)題更簡潔明了。同時(shí),使用"如何安裝"更符合用戶搜索習(xí)慣,"官方教程"則突出了權(quán)威性和準(zhǔn)確性,幫助用戶快速找到所需信息。 風(fēng)衣搭配技巧,春季風(fēng)衣搭配技巧,輕松打造輕盈感和美感 2023 第五人格 作曲家澄明理性特效展示,《第五人格》作曲家澄明的理性皮膚介紹 捕捉地點(diǎn)指南,《洛克王國:世界》火花捕捉地點(diǎn)一覽 雙刀的不足與挑戰(zhàn),雙刀缺點(diǎn)分析 1. 神秘戀愛 2. 未公開ins,金賽綸與金秀賢風(fēng)波或迎反轉(zhuǎn),D社將曝大瓜,雙方正在協(xié)商中。 戰(zhàn)斗技巧搭配,《蒼霧世界》推圖陣容搭配攻略 寶石搭配大揭秘,《天天闖關(guān)》寶石技能攻略 戰(zhàn)斗技巧分享烏鴉哥擊殺指南,《超自然行動(dòng)組》打怪攻略之影怪