数智金融创新:技术和业务引领的优秀行业实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

金融信创篇

案例1 分布式银行核心系统

本文介绍了广发银行在信息技术应用创新(以下简称“信创”)方面的成功实践。广发银行基于拥有自主知识产权的分布式技术平台,采用国产分布式数据库,通过自研的方式建设分布式银行核心系统,实现了从传统的集中式系统架构向开放的分布式微服务架构的转变,突破了主机封闭式生态的制约,以更加开放的生态充分赋能业务的数字化转型。这不仅是广发银行信创的一座重要里程碑,也是中国银行业在金融科技领域的一次重要实践。

关键词:银行核心,分布式,国产分布式数据库,自主可控

一、背景介绍

广发银行坚定不移地贯彻落实国家“信息技术创新驱动发展”战略,加强核心技术攻关,开展以核心系统分布式转型为代表的信创实践。从发展形势看,信息安全和国产化自主可控已成为金融行业的重大战略方向。广发银行原银行核心系统运行在IBM大型主机平台上,使用的是DB2数据库。随着业务的快速发展,服务资源日趋紧张,亟须推进核心系统架构优化。

2020年12月,广发银行正式启动分布式银行核心系统建设。系统建设按照“统一规划,分步实施,整体切换”的实施策略,基于拥有完全自主知识产权的分布式技术平台,使用国产分布式数据库进行自研和建设。2023年5月2日,系统成功切换上线,正式对外提供服务。

分布式银行核心系统通过DDD(领域驱动设计)建模和分布式微服务化建设,支持高并发、可扩展、安全可靠的业务处理,突破了主机封闭生态的制约。通过更加开放的生态,系统充分赋能业务数字化转型,改善服务质量,有效提升创新动力。分布式银行核心系统建设是广发银行在信创方面的一次深度实践,走出了一条自主可控、安全、高效的数字化转型路径,同时为其他金融同业提供了一个可借鉴的实践案例。

二、建设内容

(一)积极探索,建设分布式技术平台

广发银行完全自主知识产权的分布式技术平台——统一应用研发平台(以下简称RTP平台)提供了统一的全行级技术底座。截至本文完稿时,经过不断完善和推广,已有300多个应用在RTP平台上稳定运行。

RTP平台基于Dubbo微服务框架构建企业级服务体系,其内核配合使用的银行核心经历了6次迭代升级,为银行核心应用的稳定运行提供了平台框架支撑。基于银行核心的高保障要求,广发银行自研并集成了一系列适配的监控和运维能力。基于分布式架构体系,RTP平台完善了分布式任务调度、分布式事务协调,建立了混沌中心。

结合银行核心的批量场景,RTP平台完善了分布式任务调度,新增了可视化流程编排、任务上下文共享、动态负载均衡、弹性伸缩以及作业故障影响面分析等特性,支持多中心多活调度、快速自动故障转移、分区资源隔离等场景。通过对批量作业的集中管控,为批量规范治理和全生命周期监控提供了技术基础。平台落地后,日均批次作业调度超百万次,完满地支撑了分布式银行核心的高并发需求,成为最坚实的技术平台保障。

分布式事务协调为RTP平台支持银行核心业务跨中心调用提供了一站式解决方案。事务协调服务端提供了TCC(Try、Confirm、Cancel,尝试、确认、取消)和SAGA两种事务模式,并基于注册的开发方式提供服务。作为分布式事务的协调者,分布式事务协调中心的所有微服务应用通过“事务管理SDK”和“事务协调服务端”进行交互,这样可以确保正常事务的运行及异常事务的恢复。事务管理SDK是嵌入微服务中的SDK组件,负责与事务协调服务端进行交互,主要功能包括开启全局事务/分支事务、汇报事务状态、驱动事务的提交与回滚等。

(二)领域驱动分布式银行核心设计

广发银行根据银行核心业务模型,并参考业内先进的DDD领域建模实践,对银行核心业务模块进行解耦,将银行核心业务模块拆分为业务服务和公共服务两个领域的模型。广发银行通过对业务服务领域和公共服务领域的深入分析、拆分和抽象,构建出一系列业务能力模型。这些模型包括存款、贷款、核算、票据处理等关键业务功能,以及客户、运营、计价、产品、参数和数据等公共业务能力。

RTP平台

分布式事务协调

广发银行依托应用平台,结合银行核心业务领域能力模型,基于RTP平台进行服务化重构,并引入成熟的国产分布式数据库,实现银行核心业务功能的整体迁移,最终建成包含9个业务中心和5个业务支撑应用的分布式银行核心系统。该系统为银行提供了高效、灵活、可靠的业务支持,从而更好地服务客户。

(三)国产分布式数据库适配分布式银行核心系统建设

银行核心应用场景对数据库的要求十分高。银行核心业务具有7×24小时不间断服务的需求,要能够时刻向千万级客户提供安全、可靠且快捷的服务,并确保记账严谨。分布式银行核心系统要适用于复杂交易,高并发量,系统日活跃交易量超千万笔,存在联机、批量处理以及账户热点等特殊业务场景。因此,对分布式银行核心系统中的业务系统数据库的选择要着重考虑以下四点:数据可靠性,数据一致性,可扩展性,产品成熟度。

广发银行在分布式银行核心系统数据库选型时,根据银行核心业务特点及数据库要求制定了7类评测类型,共35项评测指标。针对国内成熟的分布式数据库产品,广发银行进行了多轮研究调查和POC评测,最终确定了分布式银行核心系统的数据库。

分布式银行核心系统架构

分布式数据库选型

为进一步提升分布式数据库的安全性、可靠性和性能容量,以满足分布式银行核心系统的差异化场景支持,广发银行增加了100多个优化要求,以满足分布式银行核心系统在特性功能、安全保护、工具运维监控、数据迁移、可用性和性能提升等多个维度的需求。例如,新增支持直达数据库的全链路事务跟踪、在线DDL、全局索引、全局序列、大事务拦截和高并发线程池优化等方面的能力要求,以提升数据库产品的适配性。

数据库能力持续完善

(四)可靠的技术架构,确保业务连续性

分布式银行核心系统在部署上采用了“生产+同城+异地灾备”的两地三中心技术架构。三中心技术架构采用“应用三中心多活、数据库同城双活”设计模式。逻辑架构采用“竖井式”设计,除了为了流量入口和必要的数据访问及复制以外,还为了最大程度削减跨中心互联互访,确保架构的简单性和易维护性。各技术组件均实现高可用及负载均衡,数据库等关键组件结合应用特征采用了故障域隔离设计。

为实现数据的高可用部署,三站点业务数据库GoldenDB按“一主七从”的方案部署,配比为3:3:2。各中心应用均访问生产站点的GoldenDB数据库。主节点在生产中心内及至同城中心是同步复制,至灾备中心是异步复制。

结合监管和业务连续性要求,分布式银行核心系统的灾难恢复目标满足以下条件:同城灾备RTO<15min、RPO=0,异地灾备RTO<4h、RPO<30min。同城灾备可以独立支撑100%的业务,且与生产资源的配比原则为1:1;异地灾备可以支撑50%的业务,且与生产资源的配比原则为1:2。

两地三中心部署架构

(五)健全的监控体系为系统运行保驾护航

自主建设分布式银行核心系统生产监控体系,制定从网络、硬件到应用、业务服务的全栈监控指标及告警策略;实现对分布式银行核心系统各个应用生态、各专业领域技术栈的统一管理,以场景编排、可视化配置、菜单式应急等形式赋能一线运维团队。通过告警处理入口实现对分布式银行核心系统应用群、分布式数据库等直达主数据库的服务全链路实时跟踪监控、故障排障及应急全流程联动,实现1分钟响应、5分钟排障定位、10分钟应急恢复。

三、创新应用

基于分布式技术建设分布式银行核心系统,突破主机封闭式生态制约,实现自主可控,以开放生态充分赋能业务发展,改善服务质量,有效提升创新发展动能,助力数字化转型。

(一)强化业务支持能力

广发银行通过对分布式银行核心系统的业务架构进行领域拆分和建模,对业务领域的功能进行更为精准的划分和定位,实现了更加精细化的管理,从而能够更快速地满足业务的差异化需求。同时,分布式银行核心系统抽象了业务处理的共性能力,形成了公共的服务输出,实现了对产品、计价、参数、限额、专项资金以及名单等的模型化设计,从而提升了产品模型化的可配置能力。

分布式银行核心系统通过重新设计批量框架,完善了7×24小时服务机制,实现了银行核心系统持续支持业务的能力。通过灰度验证,在系统变更时有效隔离业务验证风险,确保了业务的连续性。至此,分布式银行核心系统支持了全天候业务运行,有效提升了客户服务质量。

(二)提高业务处理效率

经过新架构体系的设计和落地实施,分布式银行核心系统已可支持日均4000万交易量,联机交易平均耗时80毫秒,日终批量处理时间从220分钟缩短至70分钟,其中计提和计结息分别耗时15分钟和25分钟,业务处理能力大幅提升,有效降低了批量处理对关联业务的影响,可为全行近亿存贷账户提供高质量服务。

分布式银行核心系统实现了交易核算分离,解耦了客户账务和银行内部账务处理。交易以客户交易明细记录和账户余额更新完成为客户账务处理边界,返回客户端表示交易完成,此时会异步提交银行内部账户进行处理。这有效缩短了交易处理链路,提升了交易处理效率。

(三)提升高并发处理能力

针对热点账户交易瓶颈,分布式银行核心系统采用延时记账方案以支持热点账户业务处理。与此同时,为了解决账户处理效率问题以及账户交易量突发导致的数据库资源消耗问题,分布式银行核心系统对热点账号实施了自动升降级处理,从而有效降低了数据库的访问压力。分布式银行核心系统在投入使用后,热点账户的并发处理能力显著增强,提升了资源使用效率和账户处理效率,有效应对了高并发支付、双11等消费业务场景,提升了客户服务体验。

(四)释放业务数据价值

分布式银行核心系统新建了银行核心数据平台应用,通过数据交换及数据同步技术,实时高效地将业务数据分发到下游数据分析类系统,为数据业务化和服务智能化奠定了基础。该平台为全面推进客户画像、精准营销、运营管理、监管报送和风险控制提供了有力的数据支撑,充分发挥了数据的价值。

(五)助力数字化转型

分布式银行核心系统的成功上线,突破了主机封闭式生态的制约,以开放生态充分赋能业务发展。同时,这不仅坚定了广发银行走自主可控道路的信心,也为把握战略机遇、加快推进数字化转型以及推动创新发展打造了新引擎。

下一步,广发银行将以分布式银行核心系统上线为高质量发展的新起点,加快推进数字化转型,为开创高质量发展的新局面贡献力量。

四、取得成效

广发银行的分布式银行核心系统的成功投产,是一次信息技术创新的深度实践,在经济效益和社会效益两个方面均取得显著成效。

(一)经济效益

分布式银行核心系统进行了领域化和模型化设计,能够快速响应业务差异化需求,有效提升研发效率,降低研发风险。通过建立自动化测试生态,测试效率明显提高,测试成本降低了约50%。同时,分布式银行核心系统在低成本和弹性伸缩方面具有很大优势,在系统日常生产维护方面,平均每年降低维保成本超过2000万元,有效提升了运营效益。

(二)社会效益

银行核心业务对系统的高可靠性和数据的强一致性有着严格要求,银行业一直在探索分布式技术在银行核心业务领域的应用。而广发银行的分布式银行核心系统的建设以及与业务的一次性整体成功切换,为银行同业提供了一个实践典范。

在数据库使用方面,在分布式银行核心系统建设过程中广发银行制定了一整套的数据库选型标准和选型评测流程,最终选择了适合银行核心系统的数据库,这具有非常大的意义。同时,根据银行核心业务领域的特性,广发银行完善了国产分布式数据库自身的能力,提升了分布式数据库在银行核心领域应用的健壮性,为国产分布式数据库产品成熟度的提升提供了助力。

在信创实践上,分布式银行核心系统在系统建设、技术平台、基础软件和基础设施方面全面落实信创工作要求,做到了自主可控。

完成人:

唐海勇 广发银行股份有限公司数据中心副总经理

吴海良 广发银行股份有限公司研发中心二级部门副总经理

郭远军 广发银行股份有限公司研发中心资深工程师

周 迪 广发银行股份有限公司研发中心资深工程师

赵 磊 广发银行股份有限公司研发中心资深工程师