同花顺-圈子

请广大用户注意风险,切勿加入站外群组或添加私人微信,如因此造成的任何损失,由您自己承担。
农行、邮储、中信银行“新核心”实践!
0人浏览 2024-01-29 16:46

   白皮书作者:华为云 应用现代化推进中心 中国农业银行 中国邮政储蓄银行 中信银行

  导语:核心系统是金融机构的心脏,也是其数字化水平的重要体现。随着云原生理念的推广与技术的成熟,在业务创新、流程优化、降本增效等因素的驱动下,云原生逐步成为银行核心系统优化转型的最优路径。

  本白皮书聚焦银行业,从宏观角度分析了数字时代背景下金融科技的需求与发展趋势,梳理了金融核心系统的发展脉络,指出现代化金融核心系统的建设要点、建设思路与痛难点,归纳出一套现代化金融核心系统建设方法论。同时,本白皮书详细阐明了云原生金融核心系统架构,从实践角度介绍了云原生金融核心系统的落地思路与实施路径,并给出了典型商业银行的优秀实践。

  期望本白皮书能够为云原生在金融业的广泛应用提供落地参考,推进银行业充分采用云原生理念与技术建设符合现代化需求的金融核心系统。

  以下为白皮书第四部分“云原生银行核心系统行业实践”

  4.1 农业银行分布式新核心云原生实践

  4.1.1 农业银行分布式核心系统建设概况

  面对业务爆发增长对核心系统的新挑战,在“打造自主可控新技术栈,提升业务连续性保障能力”的新形势要求下,农业银行按照“积极探索、搭建平台、试点推进、深入转型”的规划路线开展工程实施。

  分布式核心系统基于云平台、分布式数据库技术底座,依托数据中台和全栈式技术中台,采用服务化的设计思想,抽象账务、合约、客户信息等公共基础服务,建设个人负债、公司业务、贷记卡等产品服务;对接 DevOps 工具链以实现应用持续集成、持续交付;对接全行生产运维平台以实现应用监、管、控、配联动;通过两地三中心单元化双活提升业务连续性水平;通过云安全架构体系建设支撑更高信息安全和网络安全要求,最终将在开放平台建成采用分布式、微服务、容器化技术架构的分布式核心系统群。

  4.1.2 农业银行信用卡分布式核心系统建设

  信用卡是农业银行核心系统的重要模块之一,在分布式核心系统建设整体框架下,信用卡分布式核心系统建设于 2020 年 9 月启动,2022 年 10 月完成全量功能投产,2023 年 4 月完成亿级客户规模的数据迁移和流量切换。信用卡是农业银行分布式核心系统首个完成下移的高敏感、高并发大型应用,具有代表性的意义。

  信用卡核心系统面对近年来信用卡业务的快速发展,叠加客户、同业、风险等多方面因素的发展变化,系统的服务能力面临多种挑战:

  一方面是传统的集中式系统架构因缺乏快速有效的横向扩容能力,单体规模过于庞大,难以有效应对互联网类业务的瞬时高并发、大数据量、快速迭代等发展需要;另一方面是信用卡业务呈现渠道线上化、产品多元化的趋势,原有的业务架构底层设计难以满足场景额度、灵活计价等方面的新需求。

  在架构转型的过程中同样面临着多项技术挑战:在基础设施方面,基于大型主机的集中式架构难以满足全新技术栈和业务创新需要;在架构设计方面,分布式微服务架构增加了设计、研发、运维的复杂度;在服务能力方面,核心系统对业务连续性和事务一致性有极高的要求,并要求支持海量高并发的交易场景;在系统关联方面,信用卡系统与其他核心系统、众多外围系统间存在紧密的交互关系,内外部关联影响复杂。

  农业银行构建了跨部门、跨专业、跨领域的分布式核心工程团队,重点对设计开发、技术支持、运维保障等方面进行统筹协调和集中攻坚。信用卡分布式核心系统在实施路径上综合评估业务需求迫切度和技术实施可行性,选择了技术架构升级与应用重构并行的方案;在技术方案上基于农业银行分布式核心技术栈,结合信用卡业务特点,开展了各项专题攻关工作。

  一是基础设施与技术栈全面替换,为业务快速发展提供能力保障。信用卡分布式核心系统由基于大型机、封闭式中间件的架构,转向基于“云平台+分布式数据库”的技术路线,构建高性能、高可用、易扩展的分布式核心信用卡系统,大幅度提升横向扩缩容能力和容灾能力,针对当前新型业务的瞬时高并发、大数据量、产品创新及市场活跃快速迭代等特点实现有效支撑。通过云原生容器环境,构建了安全稳定运行的云平台,实现了应用全面上云;利用分布式数据库,提升灵活扩展能力,可以满足大容量、高并发和突发峰值场景的需求,为亿级客户的经营与管理提供安全稳定的数据服务支撑。

  二是基于微服务的应用架构转型,提供更好的业务能力支撑。将原有的集中式单体化应用逐步按照业务模块进行拆解,根据交易类型细分成多个微服务,形成了高内聚、低耦合、规模适中的独立功能模块,将原有集中式架构逐步拆解,实现了应用架构解耦。通过明确模块功能和微服务边界,各模块独立开发提高交付效率,独立运行提高系统健壮性,独立扩展提升弹性扩缩容能力。有效提升应用自动部署与持续交付能力,更好地融入了 DevOps 流水线体系,使研发、测试、投产部署、运维管控等形成了一键式的体系化、流程化贯通,能够更加敏捷高效安全的快速迭代和持续交付。

  三是单元化分布式数据架构,构建面向客户的高可用数据服务能力,提升容灾水平。信用卡分布式核心建设中,采用分区多活架构设计,数据采用单元化多分片形式,通过分布式数据库支撑了上层微服务应用单元化能力。

  数据分布上,信用卡采用一主多副本方式部署,在数据全生命周期管理方面,形成了在线、近线、离线的多层次数据分布规划,全面提升了数据应用和数据安全服务能力,夯实以客户为中心的多级数据服务基石。

  应用部署上,将重要业务和其对应的系统横向切分为若干单元,每个单元都具备全量服务能力。在容灾能力上,构建了“同城双活+异地灾备”的容灾体系,提供了灰度发布和快速故障隔离能力,实现故障情况下应急切换,重要数据有备份,重要业务不中断,有力保证业务连续性。

  四是分布式事务解决方案,保证业务流程合规和资金安全。针对信用卡多样化的交易场景,设计满足信用卡特色的分布式事务处理方案,为账务等具备数据强一致性要求的业务场景提供高性能、一致性的事务保障。基于农业银行基础平台公共技术组件,以保障客户资金安全为出发点,逐场景、逐交易设计和编排分布式事务,切实提升事务一致性能力防控资金风险,保障信用卡交易的安全、稳定、高效。

  完善异常差错处理机制,打通跨服务、跨数据库、跨数据分片的流程断点,实现分布式异常差错信息的实时共享、业务集中处理、服务无缝对接,保障客户服务的及时性和账务处理的准确性,切实增强风险管控和自动化处置能力。

  五是提升一体化运营能力,保障安全生产。构建运维能力成熟度模型,实现模型全自动化评级,全面衡量系统应用运维自动化水平,引导应用运维能力全面提升。围绕新技术底座,深度适配分布式核心新技术栈,提升分布式核心平台化运营能力,通过统一规划、专项匹配方式,实现分布式核心平台化运营能力下沉,充分支撑分布式核心系统“监、控、管、配、析”一体化运营能力,保障分布式核心生产运行的稳定性。

  目前,信用卡分布式核心系统运行平稳,联机交易性能同业可比,批量处理时长显著缩短,平稳支撑“双十一”等瞬时高并发场景运行,有力支持多项新型业务产品的发行。

  4.1.3 农业银行信用卡分布式核心系统未来展望

  农业银行信用卡分布式核心系统在原有主机系统功能实现全产品、全场景、全渠道业务可覆盖及全兼容的基础上,对客户化、数字化、数字货币等市场和产品的发展趋势进行前瞻性架构设计及功能储备,构建了信用卡新一代额度架构、交易子账户体系、差异化定价体系等多种关键能力来满足未来业务与市场发展需求。未来,信用卡分布式核心系统将充分挖掘云原生架构的潜力,推进信用卡业务流程升级优化,使业务流程与分布式系统的原生能力相融合,更好的为业务发展赋能。

  同时,在主机下移到分布式系统的架构变化下,IT 系统复杂度大幅上升。公共技术平台、云计算、分布式数据库等新技术底座,为分布式核心提供了统一、可复用的技术能力,实现高可用、高可靠、高性能的支撑,但另一方面也客观地将风险分散与扩大了,作为金融业的核心系统,保障系统的安全运行是科技工作的重中之中。农业银行将结合分布式系统运维实际,以生产运维平台提供的各项智能监控、分析、处置能力为基础,结合 AI 学习能力,探索分布式核心系统智能化运维的新场景。

  4.2 邮政储蓄银行分布式云原生架构和开源实践

  面对数字化浪潮带来的快速变革,邮储银行在十四五规划明确了共享技术平台、智慧邮储大脑、开放共赢生态及极致用户体验四个关键领域,打造科技金融四横三纵金融科技能力。2022 年邮储银行基于单元化架构的新一代个金核心全量投产;对公核心完成平台验证;前端渠道业务的手机银行 8.0 投产。为了这些关键业务系统提供运行相匹配的高可靠、高可用、高性能、可服务的基础环境,邮储开展蓝图先行,自上而下进行顶层设计和资源规划:国芯规划:全栈- 全云服务- 全应用的国芯支持,实现从芯片、操作系统、基础设施到 IaaS、PaaS 和应用层的全系列自主可控。安全合规:满足金融行业的强网络安全管控要求,普通业务符合等三,核心业务符合等四,容器要符合行里的安全能力标准和实施规范。

  高可用性:匹配业务场景要求的同城和异地容灾规划,故障下可快速熔断并及时切换恢复。以用户转账场景为例,单元化架构下转账数据要支撑跨中心的产品及方案设计,服务治理也要具备跨中心高可用设计。

  扩展性强:平台在架构、规模、云服务、功能等充分发挥分布式架构特征,可快速、大规模灵活扩展。以平台为例,可为上层应用供给各类商用或自研中间件。

  可服务性:具备资源和应用维度的智能化运维、快速定障、根因分析以及故障恢复,在业务云化由单体变分布式后可获得原极简的服务能力。

  其中在 2022 年 11 月全新推出新一代手机银行,新一代手机银行系统以客户为中心,以数据为驱动,不断丰富场景应用,为客户提供更安全、更便捷、更高效、更智能移动金融服务,为全行超 6 亿客户打造数字化智慧服务新体验。

  新一代手机银行全面采用国产化的软硬件体系,在架构设计上摒弃 了 传 统 单 体 架 构 设 计 模 式 , 采 用 分 布 式 云 原 生 架 构 , 以Docker+Kubernetes 为容器底座和麒麟/统信国产化操作系统,结合软负载均衡、高性能网络等云原生能力承载容器化 4-7 层应用访问,运用领域设计理念对系统进行子域和限界上下文划分,梳理出清晰的微服务边界,形成可持续演进的分布式微服务架构体系。在技术架构上引入单元化设计思想提升系统弹性伸缩能力和高可用能力,一方面将各个微服务的数据和逻辑进行立体拆分,划分成更细粒度的服务单元,具备强大的水平扩展能力;另一方面一个单元出现故障不会影响其他单元运行,实现了单元粒度的高可用能力。

  手机银行技术架构

  在云原生建设方面,新一代手机银行以容器云平台为中心、云原生技术为基础,建立了统一代码基线、规范的依赖制品仓库和分离的构建、发布、运行流水线,消除了项目的部署环境差异,实现一键部署、快速复制、持续集成的目标。同时引入 DevOps 研发运维一体化工具让研发更专注于业务需求的交付,提升敏捷开发、快速迭代水平。在基于云原生的系统设计与部署方面,新一代手机银行进行了基础组件、管理类任务、应用服务与配置的分离设计,叠加端口绑定、优雅启停等技术,实现微服务应用的无状态部署。借助云平台的服务状态感知、压力驱逐等特性,系统具备限流、扩缩容、降级、重启、回滚、切流等一系列的故障快速恢复能力。建设了高度自动化、智能伸缩的应用部署及运行平台,实现自动化、智能化运维,具备大规模集群调度能力,单中心服务节点高达上千个。

  在运维监测方面,基于“无法度量,就无法管理”的理念,新一代手机银行系统围绕延迟、流量、错误和饱和四类指标标准,定制化交易类、作业类、配置类、微服务类、中间件类和自身类六大类监控目标,共 50 余项核心指标,结合容器化监控组件,从多个视角监控服务状态,来感知和预知手机银行系统的运行状态,建立全景可观测的监控能力和智能化运维体系。从指标(Metrics)、日志(Logging)、跟踪(Tracing)三个数据维度提供了全链路监控能力和全链路问题快速发现能力。

  多维度监控关联

  对于需要容器化运行环境的应用系统(以手机银行为例),容器资源要满足以上的设计要求和规范,不仅要考虑优秀架构和功能丰富的容器组件引入,也要在部署上按行里的业务要求进行容灾规划,并基于行里的运维规范进行 API 的封闭和对接;同时在分布式云边端设计、全局的可观测性、灰度发布能力、云原生市场、容器安全等能力进行完整的平台功能规划设计和分阶落地。

  手机银行业务架构

  新一代手机银行实现了更快的响应速度、更优的交互体验、更强的系统性能。在系统高可用上采用双中心双活模式,RPO 小于 10 分钟,RTO 小于 5 分钟,整体服务成功率全年保持在 99.99%以上。单中心系统容量可达 50000TPS(实测),并且具备快速水平扩展能力,能够根据业务发展情况进行分钟级扩缩容。在纪念币预约、保险开门红等抢购场景中系统平稳运行,峰值高达 10 万 TPS。

  未来,新一代手机银行会继续坚持科技引领,持续拥抱云原生,引入新技术,以打造用户体验良好、性能卓越、高效稳定的移动金融服务为目标,全面构建“场景+金融”智慧服务强生态,更好地满足人民群众的移动金融服务需求。

  邮储银行容器云平台已完成一云多芯、高性能网络、可观测性和多集群设计的规划与建设:支持一云多芯:鲲鹏和麒麟、统信等国产服务器与 OS 的支持;高性能网络:基于 Underlay 模式的高效容器网络;可观测性:基于大规模的容器指标、告警、日志一体化可观测平台能力构建,支持秒级监控能力、采集监控数据的统一上报、自定义指标的采集;多集群设计:与业务模型、网络隔离、容灾诉求相结合的多 K8S 集群设计规划,实现业务按照实例、集群、数据中心、地域等多种层次的冗余保障。未来还会探讨结合应用场景的超大规模容器集群高阶方案设计和应用推广。

  4.3 中信银行核心系统分布式化及云原生演进

  中信银行凌云分布式核心系统,于 2020 年 5 月投产,将原有 IBM主机系统“一次性、全业务、零差错”全部迁移到开放平台分布式系统上。投产后,系统运行平稳,能够满足业务发展需求,为银行业核心系统转型提供了“中信模式”的解决方案,促进中国银行业核心业务系统下移的速度。中信银行分布式核心系统整体建设历程如下:

  2019 年 10 月,基于云架构的信用卡分布式核心系统投产。2020 年 5 月,基于开放平台的分布式技术和分布式数据库的总行核心系统投产(凌云系统)。2021 年 10 月,由分布式核心系统拆分出的凌云快捷支付服务和凌云组合网关投产,采用容器云部署,并支持 service mesh 服务网格接入。2021 年 11 月,凌云海外核心系统投产,全部使用容器云部署。2022 年 3 月,采用凌云平台底座研发的理财平台投产,全部使用容器云部署。2022 年 12 月,整合分布式核心系统和外围系统登记簿体系的资金簿中心投产,全部使用新的全栈云部署,中信银行分布式核心系统初步实现了“多云多芯”的部署架构。2020 年 5 月投产的凌云工程,将运行在主机的银行核心系统一次性迁移到基于国内创新的数据库和服务器的大中型银行核心分布式系统,率先在大中型银行中实现了银行核心系统分布式架构转型。

  中信银行核心系统分布式架构转型框架

  凌云工程以技术创新为驱动力,着重强化突破新技术、探索新工艺和构建新体系,降低实施风险,提高实施质量和提升实施效率和组织创新能力。该工程的主要特点如下:一是突破新技术,联合研制了金融级分布式数据库,达到银行核心系统的高稳定性、高可靠性和高安全性要求,通过研发代码翻译技术、仿真比对技术和创新数据迁移技术,实现核心系统一次性整体迁移、业务无感、核心应用全继承,工程实施时间短、投入少;二是探索革新工艺,基于生产仿真工艺,最大化地缓释未知技术风险;三是构建新体系,强本固基,立足“平台化运维”,建立“全域覆盖、全时自动、全程可控”的分布式核心运维体系。通过代码翻译技术和仿真测试工艺的运用,大幅降低了核心系统重构的成本。较采用 AS/400 主机核心相比,在系统容量提升的前提下,建设成本下降 50%以上,建设周期缩短 40%以上,而且质量高、风险小,投产前无遗留缺陷,业务功能零遗漏。

  中信银行凌云工程研发工程

  此外,中信银行通过凌云工程,统一了核心系统与行内其他系统的技术栈,从科技人力资源,到基础软硬件资源,以及应用研发与运维体系,实现全系可复用。凌云工程中金融级分布式数据库成功研制,并探索出一种加速基础产品成熟的研发模式,成为共建共享、优势互补、快速迭代,成为产用结合、联合研发的典范。凌云系统投产上线后,日均交易量超亿笔,峰值系统处理能力超 3 万笔/秒,可用率超过99.99999%。系统表现稳中有进,有效支撑了中信银行各业务条线发展。凌云系统创新实现了国有大中型银行的核心系统主机迁移,其成功投产为中国银行业核心系统的分布式转型闯出一条路,证明了金融行业使用开放平台和国内创新服务器的可行性;验证了国内创新的数据库完全胜任银行核心系统的实施性;加速了银行业核心系统分布式转型的进程。

  未来,中信银行将依托企业级业务建模,深化核心系统服务化建设,加强数据能力,建设绿色高可用数据中心,夯实一体化运营中台,健全自动化风险控制机制。进一步提高科技架构支撑能力,构建赋能开放生态、数字化业务发展的核心业务系统。 

更多
· 推荐阅读
0
1
扫码下载股市教练,随时随地查看更多精彩文章
发 布
所有评论(0
  • 暂时还没有人评论
  • 0
  • TOP
本文纯属作者个人观点,仅供您参考、交流,不构成投资建议!
请勿相信任何个人或机构的推广信息,否则风险自负