Top
首页 > 正文

问“数”那得清如许 为有“自研”活水来

本文通过海量数据自身的发展经验, 总结了国产数据库生态建设的基本思路, 即牢牢抓住自 主可控之“魂”,扎根行业内核根技术,不断实现技术和应用的突破。
发布时间:2022-12-26 14:32 来源:数字经济杂志 作者:肖枫

星移斗转,回顾人类科技发展史,就是一个不断突破认知边界、学习并再创造的过程。

进入数智时代,科技的进步不再只依赖于人类的大脑,数字被赋予了“生命”和“智慧”,数字化开始让万物互联,让产品和系统更智能,能够实现自我学习和进化。今天,我们正在经历一场立体的、多要素的、全景式的数智化变迁。随着数智化向千行百业不断深入,现代社会也将会拓展出一幅超出当前想象的时代图景。

而这一切改变的发生,都离不开一个关键要素:数据。

数据是数字世界一切行为的基础。

而作为存放、管理数据的手段,数据库软件犹如数字世界中的一把金钥匙,对数据的存储、读取、调用、管理、维护,都起着决定作用,支撑着数字世界所有应用的正常运转。

根据华为《全球产业展望(GIV)》预测,到2030年,全球数据将进入YB52数字经济DIGITALECONOMY时代。数智时代,如何更好地获取并利用数据要素,发挥其价值,已成为全球科技竞争的新战场。

一、国产数据库步入黄金发展期

数据库作为信创三大基础软件之一,它向下连接着硬件算力,向上支撑着各种应用,是信息系统高效运行的关键基础。在科技竞争的今天,我们必须以国产数据库实现替代,才能保障我国重点行业的数据和应用安全。

当时针回拨,我们常会惊叹国产数据库近年来的发展速度之迅猛。四五年前,那时国际形势一片祥和,现在发生的事件,在当时都是匪夷所思。近年来,随着国际局势的突然变化,中国科技被西方国家“卡脖子”,以芯片、操作系统、数据库等为代表的产业,得到了从国家到地方、从行业到用户的各方重视,国产数据库也因此迎来了前所未有的机遇。

市场数据是最好的证明。2019年我国数据库市场规模为138.5亿元,到2021年,我国数据库市场规模达到了223.5亿元。从2019年到2021年期间,我国数据库三年的市场规模增速分别为:17.8%、26.6%和27.5%。去除国外商业数据库巨头固有的市场空间,刨去公有云市场,增速依旧惊人。

国产数据库的快速发展,一方面得益于政策、产业的扶植,另一方面得益于客户思维的转变,他们给予了国产数据库厂商更多信任,逐渐敢于把核心业务系统和项目迁移部署到国产数据库中。而国产数据库厂商的技术实力、产品性能也在快速提升,开始从“能用”向“好用”阶段过渡,两者相互促进,形成了产业发展的正循环。

作为国产数据库厂商中的一员,海量数据也在2021年实现了多个重点行业的相继突破。去年,海量数据赢下了制造行业中的比亚迪,券商行业中的中信证券、国泰君安等头部厂商,央企龙头中海油、中交建也选用了海量数据库。同时我们的产品继续服务于广州、深圳等极具示范价值的政务系统改造,公安、城商、保险等行业也都有所斩获。特别值得一提的是,中海油、中交建等是被美国列入了实体名单的客户,而海量数据的产品应用在这些被美国打压的“国之重器”企业中,助力客户实现了数据库的本地化发展。这不仅是我们的一份荣誉与骄傲,更是作为从业者,深刻感受到了肩上的那份责任与担当。

我国的数据库市场,大致经历了探索期、萌芽期、成长期、发展期四个阶段。市场从最初完全被海外巨头垄断,到国产数据库艰难起步,再到行业燃起星星之火,直到今天也迎来了百花齐放的局面。目前国产数据库厂商数量,据不完全统计已经超过了200家。

但国产数据库的市场发展还远未见顶。据信通院预测,中国数据库市场2020-2025年复合增长率达23.35%,2025年市场规模有望达688亿元,国产数据库市场发展前景广阔。

中国拥有巨大的经济体量、广阔的市场空间,其土壤足以支撑我们发展起自己的技术体系。目前,国产数据库已经在政府、金融、电信等行业得到了越来越多的应用,行业呈现出技术创新、生态繁荣、人才涌动的特点,市场正在释放出前所未有的活力。

二、国产数据库亟待“立根铸魂”

但是,我们仍需清醒地认识到,国产数据库从技术、高可用、生态等各方面,距国际知名数据库厂商的差距依然巨大,市场发展还存在多而不强的现状,尤其在自主可控方面,纯国产自研数据库占比还非常低。

据Gartner报告显示,按收入统计,目前海外商业数据库份额占39%,公有云数据库占比45%,基于开源的国产数据库占6%,纯国产自研内核数据库占比仅有10%。如果扣除云市场份额,国外厂商则占据了国内数据库市场70%左右的份额。

另外,从企业规模和研发投入上,国内数据库厂商与国外厂商也存在较大差距。我国数据库厂商虽有超过200家,但中国信通院发布的《数据库发展研究报告》显示,员工人数少于300人的国产数据库企业高达84%,而单看甲骨文一家巨头在全球有约13万员工,年度研发投入大于60亿美元,差距可见一斑。

国内数据库厂商研发投入较多的包括华为、阿里、腾讯等大厂,也有达梦、海量数据等独立数据库厂商,大的独立数据厂商员工人数基本都在800以上。近年来,海量数据持续坚定加大在研发方面的投入,2021年海量数据研发投入同比增长54.39%,占营业收入的17.50%。

虽然我们距离世界级软件巨头的差距还很大,但我相信中国在20年内,有希望诞生世界级的软件企业。数据库其实是一种生态产品,一款数据库之所以“好用”,是因为它的开发环境、工具、功能都成为了用户使用中的默认选项,这就是所谓的生态。

华东师范大学周傲英教授也曾经感慨过,“数据库一直都是我们的切肤之痛,但我们始终没弄明白为什么做不出自己的数据库,直到进入了互联网时代,我们一下子就醒悟了,就是生态!这之中既包含用户生态,更包含技术生态,前者是我们要将国内数据库市场空间做大,后者是我们要形成合力,因为数据库要解决的问题是综合性的,只有一起才能将这个事情做好。”

所以国产数据库要想“好用”,首先要有很厉害的内核根技术,其次就是要有繁荣的产业生态、足够的行业人才。因为软件生态越往后发展,越会呈现出指数级的加速度态势,软件行业的人才、市场、生态,都会螺旋式上升。在国产数据库的生态建设中,海量数据也会一直秉承专注做好数据库的初心,为用户提供更好的数据技术服务,为国产数据库发展贡献我们的力量。

三、竞争加剧引发技术路线收敛

目前,国产数据库主要有四条主流技术路线:代码授权(源于国外代码)、基于国外开源封装(开源修改)、仿制国外商用(仿制)、自主重构(国内自研)。随着中西方对抗加剧和科技武器化的趋势凸显,信息、数据安全已经关乎国家发展战略,极限思维也成为了用户在选型数据库时首要考虑的问题。因此,未来国产数据库的四种技术路线也将加速收敛。

对于国产数据库未来技术路线的预判,海量数据的思考是:

国外代码授权因独立演进可能性不高;基于国外开源封装的产品具有协议风险、断供风险、法务风险等隐患,与国产硬件匹配度差;仿制国外商业版缺乏面向未来的创新能力,产业生态难以做大;只有独立、自主、代码重构的数据库技术,才有发展前景,这其中则以openGauss技术路线为代表。

openGauss是一个全面、友好、开放的企业级开源关系型数据库社区,有望在未来自主可控数据库市场胜出。openGauss的源代码放在中国,获取非常方便。相比其他国际主流数据库,openGauss不受美国EAR(出口管制条例)管制,实现了完全的自主可控,具备独立演进的能力。在产业生态建设方面,它根植于中国数字经济的沃土,截至2022年11月底,目前已吸引超过200家头部企业加入,有4200余名开发者参与社区贡献,在各行业累计商用部署1.5万多套。

对于海量数据来说,我们的发展思路是“依托鲲鹏大生态、融入openGauss中生态、打造Vastabase小生态”。在信创产业链上,海量数据作为首批加入openGauss社区并推出商业发行版的厂商,产品耦合了多家国产芯片、操作系统、中间件的技术与产品,深度匹配各行业应用场景,目前经历了政务、制造、金融、通信、能源、交通等全场景的检验,事实证明在所有行业中都可以实现成功应用。海量数据库VastbaseG100是一款纯国产自研的集中式关系型数据库,产品基于对openGauss核心架构的深刻理解和强大的源代码能力,具备了高性能、高并发、高可用、高安全、高兼容、多模态特性,是国产数据库的首选之一。

从海量数据的企业发展路径借鉴,我们想阐明的是国产数据库厂商的建设思路,即一定要牢牢把握自主研发的“灵魂”,深深植根于行业中生命力最强的根技术,在此基础上再不断实现技术和应用的自我突破,才能走出行业里的一条康庄大道。

“问渠那得清如许,为有源头活水来”,我认为只有当一个产业能够源源不断地注入“活水”,不断地接受新事物,才能保持产业的活力与进步。作为国产数据库领域,我认为“活水”指的就是产业生态,是自研的技术创新,是人才的汇聚。只有依靠不断强大的自主研发创新能力,才能实现产业最终的高质量发展。(文︱肖枫海量数据总裁)

合作站点
stat
Baidu
map