找回密码
 立即注册

一家银行数据库的六年攻坚战

#媒体热点# 2024-7-25 12:36 177人围观 媒体热点

文|白 鸽
传统的商业数据库Oracle,到后来加入的MySQL数据库,再到现如今的分布式数据库,中国金融行业数据库的转型升级走过了多年时间。
“2018年,我们提出了要向分布式架构转型。”四川农商联合银行科技部相关负责人回顾起当时做的战略决策,“现在看是一种理所当然的趋势,但在2018年选择这个方向是艰难的,因为当时分布式数据库都是互联网场景在用,传统银行都还没有。”
彼时,对于国产数据库厂商而言,大家也都还处于起步阶段。
“当时的产品还不太成熟。”他回忆道,“报名参与我们PoC的只有3家,其中就包括OceanBase。”
经过严格的PoC场景测试,四川农商联合银行最终选择了OceanBase,自此开启了从外围向核心系统推进的数据库转型升级之路。
“我们一共有111个系统,现在一共有49个系统上了OceanBase的数据库,今年预计有一大半系统将全部上去。”他如此说道。
对于承载关键业务负载的数据库而言,一定是在场景中打磨出来,而不是在实验室写出来的。
作为经过内部支付宝、淘宝、天猫等具有高并发的金融交易场景中深度打磨出的数据库,OceanBase在走向商业化过程中,也受到众多金融机构的青睐。
7月18日,IT市场研究和咨询公司IDC发布《中国金融行业分布式事务型数据库市场份额,2023:技术验证结束,迎接高速增长》报告显示,OceanBase占据金融行业本地部署市场份额第一、保险证券子市场本地部署份额第一。

据OceanBase官方数据显示,目前70%千亿资产规模以上银行、75%头部证券机构、65%头部保险机构、45%头部基金公司都已选择OceanBase进行核心系统升级。
主要包括中国工商银行、交通银行、四川农商联合银行、中国太平洋保险、招商证券等,其中有一半以上将OceanBase应用于核心系统。
从营收角度来讲,2023年,OceanBase的金融行业营收规模为2.7亿人民币,在金融行业分布式数据库市场中位列独立数据库厂商第一。
据IDC报告统计,2023年中国金融行业分布式事务型数据库的市场规模约2亿美元,同比增长12.1%,市场正在加速增长。同时,市场竞争格局基本稳定,头部5家厂商占据整体市场份额的86.9%。

随着中国数智化转型进入深水区,作为基础软件的三座大山之一,金融行业的数据库转型升级,已经从选择题成为了必答题。
金融行业数据库迎“关键年”

IDC报告称,2024年将进入分布式数据库大规模部署阶段,这也将是金融行业数据库转型升级的关键年。一方面,金融行业的数据库升级将从边缘系统走向核心系统。另一方面,国产分布式数据库也将从可用走向好用。
自20世纪70年代开启信息化建设以来,金融行业开始着手搭建核心系统,作为金融机构的交易中枢,经过数十年的发展,在沉淀大量数据资产的同时,更是与周边系统盘根错节,可以说是“牵一发而动全身”。
相比其他系统,数据库是最底层、也是最关键的核心技术之一,而且由于国产数据库起步较晚,金融行业使用国产数据库普遍在2016年之后。但即便经过了约8年时间,金融系统对于新型数据库的升级、转型,依然处于早期阶段。
目前,头部大银行、保险机构已经走完了分布式数据库升级转型的路,但数量更多的中小银行、保险、证券等金融机构仍然才刚刚开始做、甚至计划开始做。
提速背后,是金融机构的数智化转型进入了深水区。
不过,金融机构的数据库升级并不是一蹴而就,往往需要2~3年时间。而且大多数金融机构在开展数据库升级时,通常采取循序渐进、风险可控的策略,即先边缘系统再核心系统。

典型的银行系统业务全景架构
四川农商联合银行策略也是以稳妥为主,“先外围后核心,先一般再关键。”
截至目前,四川农商联合银行已经有49个系统稳定运行在OceanBase上,其中关键业务系统6个、重要业务系统18个、一般业务系统23个。
经过7年迭代升级,四川农商联合银行的数据库升级也将迎来“从一般向核心迈进”的关键一步。
据光锥智能了解,四川农商联合银行的分布式核心系统已经于2023年年初启动建设,预计2024年年底完成主体开发和测试。新一代核心系统也将基于OceanBase建设。
“我们今年列了20个左右的项目,要全部放到OceanBase上做升级改造。”四川农商联合银行相关负责人对光锥智能讲述了今年的发展计划,“更关键的是要把2.2和3.2的系统统一升级到4.2版,启动信贷业务,2025年会把收单业务放上去,2026到2028年会完成全部存量系统迁移。”
这也就意味着,四川农商联合银行底层的技术架构也将逐渐实现统一。
相比于银行业在数据库升级路径上的稳妥,部分保险企业的策略可能会更激进一些。

保险系统业务全景架构
“我们根据中国太保的情况因地制宜,最终选择了一开始就从核心系统做数据库升级,跟OceanBase一起做联合攻坚。”中国太平洋保险数智研究院首席数据库专家林春的这种做法,与其说是冒险、不如说是战略眼光足够坚定。
林春认为,“通过先难后易,选择核心系统做攻坚,在暴露了很多问题后,就可以迅速沉淀出自己的知识库。”
通过金融机构和数据库厂商的双方联合攻坚,做大量复杂场景的历练,国产的数据库产品正在从“可用”向“好用”演进。
“自2021年至今,OceanBase数据库越来越好用,也正在加速形成完整生态。”在林春看来,数据库厂商是否有“内核掌控”能力、修复能力,决定了未来能否走的远。
金融分布式数据库、从选择题到必答题

上世纪60年代,国内出现了第一代集中式数据库。
彼时用户业务量和数据量很小,因此Oracle做的集中式数据库就可以满足绝大部分客户需求。后随着互联网兴起,出现中间件形式,如MySQL数据库等。
但集中式的数据库部署方式是IOE(IO扩展口),属于烟囱式部署,一套系统就需要部署一套数据库架构,成本非常高昂,且扩展性非常差。而中间件数据库只是一种过渡方案。
第三代,则是原生分布式数据库。2019年,在信通院总结报告中明确表示,分布式数据库一定是未来方向。

“2021年前,分布式数据库市场是混沌的。”林春回忆道。
而最终选择OceanBase,林春总结了三方面原因:
一、数据压缩能力强。由于保险行业的数据、保险的周期很长,海量大库多,而OceanBase的数据压缩特性就对中国太保而言非常重要。
二、要能够兼容Oracle系统,并实现平滑迁移。过去十几年中,由于保险业务的复杂性,中国太保的保险业务与Oracle绑定程度很深,所以在进行数据库架构升级中,必须考虑能不能匹配Oracle的深度特性,能不能支持平滑迁移,而这一点对数据库厂商的挑战很大。
三、整体软硬件综合成本要低。为了寻求最终的效果做评判,中国太保集团先做了试点,然后在这个基础上,制定了选型路线,路线的核心重点就是成本。
“我们把综合的软硬件成本做了非常细致的计算。”林春说道,“通过综合测评,一般场景中,OceanBase非常适合,而在核心攻坚场景里,有的问题只有OceanBase能解决。”
不难看出,中国太保做数据库转型升级背后的核心原因,一是技术架构能力,二则是降本增效的需求。当然,于银行业而言,在数字化转型进程中,也同样面临着传统数据库架构不足以满足未来发展需求,且成本高昂的问题。
四川农商联合银行相关负责人也说道:“在进行分布式数据库架构转型前,我们使用了6种数据库,这就导致维护、人员技能,都必须依赖厂商,且每一个数据库都需要买一个原厂的支持服务,成本非常高。”
因此,统一数据库架构体系,实现技术的自主掌控,势在必行。金融行业的分布式数据架构体系,正从选择题成为必答题。
那么,金融数字化到底需要怎样的分布式数据库?
OceanBase副总裁、金融政企事业部总经理王爽认为,要立足当下,着眼未来,既要能够为客户做数据库兜底,实现自主掌控,还要保证技术路线是未来主流发展趋势。
分布式数据库发展路线已经是既定趋势,而在这趋势之下,只有100%根自研数据库才能成为金融需求兜底,才能确保完全的自主掌控。
“我们的代码是一行行写出来的,没有依赖于任何开源软件,代码是根自研,自建了研发环境和流程,自研编码优化技术,同时还没有开源协议风险。”王爽说道。
当前,分布式事务型数据库的实际应用价值和可行性已经得到验证,伴随技术验证的稳固,除了头部大型金融厂商外,越来越多的中小型金融机构,也都正在加速数据库架构的转型升级。而在此过程中,如何降本增效,则成为影响金融机构数据库转型升级的关键。
一个好的数据库,不仅增效,更可以降本

技术的创新和应用,在企业侧的目的都是降本增效,分布式数据库的诞生,也同样如此。
OceanBase的公司成立于2020年,但这款产品却于2010年敲下了第一行代码。彼时阿里每年在数据库上耗费大量的钱。
2013年的双十一,10%的流量数据架构支持转移至OceanBase上,“当年我们非常好的完成了这个任务,到第二年,我们把双十一底层数据库的支撑全部转移至OceanBase,一直到现在。”王爽说道。
而经历了内部众多核心业务场景打磨的OceanBase,降本增效也成为了其切入金融行业的核心竞争力。
“我们最初的目标就是节约成本,因为原本的方案太贵了。”四川农商联合银行相关负责人如此说道,“我们之前用的大型机,每年需要投入70%的成本,来确保大型机的安全,这也导致我们成本投入结构失衡。”

将数据库向OceanBase迁移后,由于多地多活架构的成功落地,四川农商联合银行的IT系统在可用性方面有了显著提升,在数据库层面可以实现同城RPO(恢复点目标)=0、RTO(恢复时间目标)