一、把握国产化机遇,拥抱国产虚拟化
“十四五”规划中明确指出到2025年行政办公及电子政务系统要全部完成国产化替代。2022年9月底相关主管部门下发指导文件,要求国央企落实信息化系统的信创国产化改造,要求央企、国企、地方国企全面落实信创国产化,政策中明确部署了国央企信创国产化的具体要求和推进时间表,政策要求到2027年央企国企100%完成信创替代,替换范围涵盖芯片、基础软件、操作系统、中间件等领域。在此背景下,国内企业寻求传统的国外虚拟化替换的步伐开始持续加速,寻求一种新的 IT 基础设施架构转型应对业务迭代创新的需求。
民生通惠资管公司作为金融行业保险资管行业中的重要成员,始终坚持“攻坚、正道、创造、乐观、大同”的鲁冠球精神,以“规模、质量、效益、队伍、客户、文化”为战略目标,推动业务高质量发展,推进公司国产化替换进程。 公司超融合虚拟化设备已经使用了7年,不仅超过设备生命周期,部分配件已经停产,难以进行维护和扩容,而且由于Nutanix已退出中国市场,续保和技术支持成本高昂。为保障生产业务系统、生产数据及业务连续性,切实降低信息系统运营管理风险,计划对原有核心业务老旧超融合虚拟设备进行替换。作为上海第一家对核心生产系统超融合虚拟设备进行替换的保险资管企业,我们在对多家厂商超融合的能力评估后,最终选用国产SmartX超融合对核心虚拟化进行替换。
二、国外虚拟化的四大痛点
1.故障频发
核心生产虚拟化目前部分服务存在问题,导致当前环境集中管理平台无法纳管虚拟机,无法根据业务情况修改虚拟机配置,生产环境存在崩溃风险,生产数据存在丢失风险。
2.故障率上升
硬件老旧导致系统不稳定风险,设备性能的下降和故障率的增加带来意外停机风险,部件故障率逐步增加,存在潜在BUG,且设备软件版本较低,一些运维功能存在缺失,影响核心业务系统的连续性和稳定性。
3.技术支持有限
核心超融合虚拟化原厂维保服务已经到期,技术支持能力受限。因为有些老旧设备部件已经不再生产,或者生产商已经停止为旧模型提供支持,导致在需要维修或更换部件时,寻找合适的部件变得非常困难。
4.维护成本高
设备已经使用了7年,超过设备生命周期,并且部分配件已经停产,难以进行维护和扩容,同时由于Nutanix公司退出中国市场,设备一旦出现问题,续保和技术支持成本高昂。
三、虚拟化建设方案
1.总体设计思路
结合以上痛点,民生通惠采取“技术成熟、方案适配、先见成效、分步建成”的策略,在把控总体技术风险的基础上,根据自身架构现状,利用cloudmove工具进行不停机自动迁移,最终实现国产虚拟化替换目标。
(1) 迁移方案设计
① 需求分析与规划。
② 明确迁移的目标和范围,包括需要迁移的服务器数量、应用类型、数据量等。
③ 评估现有系统的性能和资源使用情况,确定迁移后的资源需求。
④ 选择合适的虚拟化平台和工具,并考虑其兼容性、性能和成本。
(2) 明确迁移步骤和迁移验证
①迁移前准备工作。一是重要数据备份,防止极端情况造成的数据丢失;二是SMTX CloudMove 防火墙策略开通。
②安装控制中心。准备一台虚拟机或物理机来安装控制中心。要能连通源主机、目标机,如果离线安装,需要手动生成激活码。
③添加云平台账户。填写CloudTower的登录信息,CloudMove通过相应的账户调用云平台API。
④添加备份目标。创建虚拟代理机,并且登录控制中心添加备份目标。
⑤ 添加源主机。添加迁移的源端主机信息。
⑥ 创建迁移计划。创建到SMTX ELF平台的迁移计划。
⑦ 运行迁移计划。执行迁移计划后,SMTX CloudMove 将自动在 SMTX OS 目标集群创建目标虚拟机。
⑧ 切换演练。切换演练创建与源端主机相同的虚拟机并进行测试与验证。演练不会影响迁移源端主机、迁移计划的运行和实时复制。
⑨ 切换。切换前,提前停止源主机生产数据更改,网络传输速度降到接近0、数据缓存图降到接近0,再执行切换操作。切换过程将源端虚拟机网卡断开,CloudMove会自动在SmartX平台启动虚拟机。
SMTX CloudMove 为了验证迁移数据的可用性和一致性提供演练计划,演练计划开始 SMTX CloudMove 将在虚拟化平台启动虚拟机。虚拟机启动完毕后,进行数据和应用检查、配置等,演练完毕后,停止演练。CloudMove 停止并清除当前的演练虚拟机,恢复到数据复制过程。如果出现最后迁移失败的情况,可以将SmartX 平台虚拟机关机,源端虚拟机恢复网卡链接。
2.使用工具迁移
按SMTX CloudMove 迁移工具在进行迁移作业时,控制中心会对源主机的配置(CPU、内存、磁盘、网络、操作系统等)进行识别,自动在目标集群创建相同配置的目标虚拟机。SMTX CloudMove 利用连续数据保护(CDP)技术,实时捕捉源主机上的数据变化,对源主机进行持续数据保护。切换过程中,控制中心对目标虚拟机自动配置网络等操作,从而实现虚拟机整机级别的在线迁移。
SMTX CloudMove Agent是SMTX CloudMove 迁移解决方案的核心组件。它需要安装在参与迁移计划的每台主机(包括源主机和虚拟代理)上。CloudMove Agent根据角色的不同,可以分别或同时承担读取数据,捕捉用户产生数据,通过网络发送接受数据,写入数据到SmartX虚拟化平台上的块设备,通过SmartX虚拟化平台的API对平台上的虚拟资源进行管理、配置与操作,从而完成迁移切换时迁移目标端主机在平台上的创建、配置与启动。迁移拓扑如图1所示。
(1)连续数据保护
整体迁移方案中的连续数据保护包含两个阶段:同步(Synchronization)与实时复制(Real-time Replication),全部过程是完全自动的,无需人工干预。
(2)同步(Synchronization)
同步是指使所保护的数据与目标云或者虚拟化/超融合平台上的数据在某一时刻保持完全相同的过程。同步是开始实时复制的初始默认步骤。SMTX CloudMove 使用卷同步,且仅同步使用的数据
(3)演练
在实时复制的过程中随时对迁移到目标云或者虚拟化/超融合平台上的数据进行一致性测试、验证和演练(Data AssuranceTest)。使用演练开始那一时刻的最新数据创建与源端主机相同的虚拟机以供用户进行测试与验证。演练不会影响迁移源端主机、迁移计划的运行和实时复制,在演练过程中源端主机上产生的所有数据仍然会实时复制到目标云或虚拟化/超融合平台上。在管理界面点击切换按钮,开始进行迁移切换时,会自动实时复制,同时使用从源主机实时复制的最新数据在目标端启动迁移目标机,并按照迁移计划中的属性对迁移目标机进行网络设置。整个迁移切换过程手动触发。迁移切换完成后,迁移目标主机会提供与迁移源端主机在切换前一秒完全一样的数据和服务,从而实现数据与服务的热迁移。
四、基于国产虚拟化的技术创新点
1.广泛的平台兼容性
本项目使用CloudMove迁移模式,相较于 SMTX 迁移工具(无代理),CloudMove(有代理)不仅支持从虚拟化平台进行迁移,也支持从物理机和公有云平台进行迁移,且不受云平台 Hypervisor 品牌限制,仅对操作系统有兼容性要求,具有更广泛的适用场景和更强的兼容性。
2.迁移不停机
基于卷块级别的 CDP 技术,采用在磁盘卷驱动层面实时监控生产环境磁盘上每个块(Block)的改动,完成捕捉、读写、复制和重放,可以通过数据一致性保证数据零丢失, 从而实现物理机/虚拟机整机级别的热迁移,不仅迁移生产数据,而且迁移操作系统包括磁盘上的应用软件、中间件、数据库等所有数据。
3.迁移自动化
迁移时,SMTX CloudMove 控制中心会自动在目标集群创建目标虚拟机,实现源主机到目标虚拟机的自动迁移,人工干预少,自动化效率高。
五、国产虚拟化带来的启发
互联网敏捷思维为民生通惠国产化建设带来了更新的思路,向金融机构提供了数字时代更多的选择,也为同行业虚拟化替换的构建提供了更多的参考。
1.技术创新自主可控
随着国际形势的变化,自主可控已成为国家发展的重要战略。国产虚拟化技术的广泛应用,有助于降低对外部技术的依赖风险,提高信息系统的安全性和稳定性。同时,为我国信息技术产业的发展注入了新的活力,推动了相关产业链的发展和完善。
2.市场机遇和产业链完善
随着中国信息技术的快速发展和数字化转型的深入推进,虚拟化市场呈现出蓬勃发展的态势。越来越多的企业和机构开始采用虚拟化技术来优化资源配置、提高系统性能和安全性。这为国产虚拟化技术提供了广阔的市场空间和发展机遇。
目前,中国虚拟化市场已经形成了较为完整的产业链和生态系统。市场上涌现出了一批具有竞争力的虚拟化产品和服务提供商,这些企业通过不断创新和优化产品,推动了虚拟化市场的繁荣和发展。