近期,江苏移动公司引入流原生新技术,结合云原生技术体系,完成了基于流云一体化架构的新一代业务支撑系统全省上线,实现了支撑系统在云原生时代新的演进。面对5G+时代的新挑战,新一代业务支撑系统通过引入新理念、新技术、新方法,打造了全新支撑架构;通过跨系统间的资源融合、能力融智、数据融通,结合微服务和AI能力,实现规模化、敏捷化、智能化、弹性化的支撑目标;通过打造新一代高效智能的流云一体化基础架构,有效助力公司IT支撑效能提升,主要体现在如下方面:
·全面具备弹性能力,实现资源弹性调度与共享,持续降低资源成本
引入流原生技术,实现流处理应用的弹性扩展并结合云原生技术实现的面向交易的微服务应用的弹性扩展,全面扩大系统弹性能力范围,提升系统处理能力,降低资源成本。
·统一技术栈及处理框架,实现流云一体化,提升支撑效率
基于流原生技术,构建以Pulsar为核心的流处理框架,支撑全支撑系统的流处理应用,并结合云原生体系中以ServiceMesh为核心的微服务框架和以容器为核心的PaaS平台,实现支撑系统统一技术栈、统一框架、统一能力标准,拉齐各系统在弹性伸缩、灰度发布、敏捷交付、智能运维、微服务治理、流处理治理方面的能力,提升支撑效率及架构掌控能力。
·支撑系统全面注智,实现IT换人,提升支撑系统智能化水平
在资源智能调度、智能弹性伸缩、性能优化、流量智能分片、业务咨询智能应答、根因分析、容量预测等方面全面引入人工智能算法并结合系统运营运维数据,实现智能处理与预测,提升支撑效率。
·聚焦客户感知,实现关键场景重点突破,提升内外部客户满意度
通过流原生技术引入并结合云原生的能力,重构5G话单处理、海量信令处理、经分日报、营销/提醒/信控/业务办理事件处理等场景应用架构,全面提升处理效率,提升内外部客户感知。
图1建设成效
架构演进背景
图2 当前的系统支撑挑战
江苏移动基于X86化的第三代业务支撑系统自2014年建成以来,已使用多年,业务量、工单量大幅增长,同时5G时代CHBN业务应用百花齐放,消息数、话单数、信令数据都将出现10倍以上的爆发式增长,支撑系统面临如下挑战:
·海量数据处理:近几年我省用户日均使用流量从数百TB增长到数万TB,随着5G大规模商用,消息量、话单量、信令量将持续暴增,使得支撑系统的处理压力不断大幅增加。
·客户感知要求更高:5G用户PCRF双开,开通工单量成倍增长,要求工单处理效率不断提升,保障业务及时开通;5G流量使用更快,用户对流量费用更为敏感,业务部门要求提醒进一步提速。
·硬件资源不断投入:随着业务量增加,计算、存储资源需要不断增加才能满足业务发展需要,硬件资源成本不断增加。
为了解决以上问题,经过多轮的专家评估、技术选型、测试验证,最终以Pulsar为代表的流原生技术被全面引入,并结合云原生PaaS平台,共同实现新一代业务支撑系统的全面演进。
整体架构方案
图3 流云一体化架构
新一代业务支撑系统的建设核心包含三个方面:以Pulsar为核心的流原生技术框架、以ServiceMesh为核心的微服务框架、以容器为核心的云原生PaaS平台。
·流原生框架:面对BOSS/CRM/大数据系统中流处理应用,基于Pulsar实现统一的框架封装,提供分布式消息队列、分布式计算引擎、I/O连接器、SQL引擎、负载均衡、分布式分层存储、多租户隔离、热发布、链路跟踪、弹性伸缩等通用能力,简化流处理应用的复杂度,提升支撑效率。
·微服务框架:面对BOSS/CRM/大数据系统中交易应用,以ServieMesh为核心,提供负责均衡、服务发现、服务路由、熔断限流、监控度量等通用能力,统一服务框架,拉齐各系统服务治理能力,提升支撑效率。
·云原生PaaS平台:以容器为核心构建云原生PaaS平台,提供弹性伸缩、弹性计算、自动化交付、灰度发布、智能运维等能力,提升交付效率,降低运营运维成本。
关键技术特性
图4 六大技术能力特性
流云一体化架构具备六大能力特性:结构化Schema与SQL化支持、分级分层存储、函数计算特性、存算分离架构、跨中心复制、运维与交付能力。当前生产环境已初具规模:
图5 生产集群能力
关键场景支撑
1、打造计费新架构,实现计费系统“六化”支撑,提升支撑效率
图6基于流原生的计费中心
基于流原生技术,结合微服务及AI能力,重新打造了计费核心架构,实现计费系统“规模化、消息化、微服务化、敏捷化、弹性化、智能化”支撑,大幅提升处理效率。通过服务化,减少话单消息落地8次,话单处理性能提升达到180%,设备数量减少26%。通过消息化,减少计费系统与共享存储NAS交互18次,NAS资源I/O使用减负达到90%。通过弹性伸缩及智能调度,实现资源忙闲时灵活调度及全局共享,提升35%的资源利用率;通过灰度发布及敏捷交付,实现上线过程流水线式交付及话单处理不中断,提升客户满意度。
2、重构海量信令的实时处理,保持数据的新鲜度,提升数据价值
图7流原生的实时流处理平台
以流原生技术,重构实时流处理平台,实现流处理具备“弹性扩展、多租户隔离、数据分层存储、数据在离线分析”等能力,全面提升信令数据处理的及时性,保持数据新鲜度,发挥数据的最大价值。通过PulSar存储与计算分离功能,实现了弹性扩展能力,信令处理能力提升4倍,能够支撑5000亿+/天的实时数据处理能力;通过多租户能力,实现数据间资源及权限隔离,提升流处理的安全性;通过数据分层存储,实现冷热数据分开存储,提升了数据保存的持久性;通过与分析引擎无缝对接,实现信令数据的离线分析能力,提升架构的先进性。
3、构建实时数据仓库,实现经分日报全面提速,提升经营决策的及时性
图8实时报表
基于流原生技术,构建实时数据仓库,实现数据仓库的实时化转型,提升经分快报、日报数据实时性。通过Pulsar多I/O连接器能力,实现多渠道数据的快速接入,提升数据接入与变化感知效率;通过数据资产的实时加工,实现日报、快报数据实时处理,助力各级管理人员及时掌控业务发展情况,提升经营决策的及时性。
4、构建事件处理中心,实现客户相关事件的高效处理,提升客户的感知
图9事件处理中心
基于流原生技术,构建实时事件处理中心,实现事件共享订阅及高效处理,提升事件的处理效率及复用度。通过事件消息化处理,实现营销、信控、提醒及时率从分钟级提升至秒级,提升客户满意度;通过消息的订阅机制,实现信控、提醒、资料变更等事件的复用,降低数据的冗余度,提升数据一致性。