5月26日凌晨4点30分,印尼最大科技独角兽GoTo集团总部的迁云作战室里,最后一条验证指令闪烁通过,标志着GoTo旗下即时配送和出行服务平台Gojek的业务系统已经全量迁移到了腾讯云上,比原计划提前了整整一个小时。
但出行高峰尚未到来,GoTo 集团CEO Patrick Walujo 还不敢掉以轻心。
Patrick 的谨慎并非没有缘由:一方面,这场迁移关乎着GoTo筹划已久的降本提效战略能否成功;另一方面,这场东南亚史上规模最大且跨越距离最远的云迁移战役,由于其放之行业历史都首屈一指的复杂度,吸引着整个东南亚互联网行业的极大关注。
8点开始,Gojek App上的订单逐步起量,后台监控大屏上的负载数据也随之稳稳提升。最高峰的丝滑,才能宣告这场战役真正的胜利。
9点,Patrick 激动地宣布:Gojek所有业务全部迁移至腾讯云,这是有史以来最复杂的跨云迁移项目!
消息发布后,行业为之震动,不少同行私信祝贺Patrick和Goto。作为支撑这场“搬家”旅程的服务商,腾讯云也收到了东南亚一众企业的咨询和点赞。
(图:在迁云项目室,双方团队庆祝迁云成功)
里程碑之下,由 AWS、Azure 和 GCP 主导的东南亚云计算市场,也从此迎来新的变局。
//这事有得做吗?
互联网行业素有“得印尼者得东南亚”之说。被类比为“滴滴+美团+支付宝+淘宝”的整合体的GoTo就诞生于此。
2021年5月,GoTo由印尼两大独角兽企业——2010年成立的即时配送和出行服务平台 Gojek 和2009年成立的电商平台 Tokopedia 合并而成。这个覆盖出行、电商、金融服务的综合应用生态,年度交易用户高达数千万 。
但由于历史原因,这家主要用户群分布于印尼及东南亚的互联网企业,开展业务时却不得不面临着因7000公里物理距离导致的70ms网络延迟。Patrick对此难言满意。
时间来到2024年。这一年,经过一系列业务重构,GoTo首次盈利。与此同时,一个旨在降低成本同时优化客户体验的技术升级计划,经过Patrick 决策成为了重点战略,CTO William Xiong则负责领导这个计划。
在William的规划中,技术升级最首当其冲的就是确保所有系统都位于印度尼西亚境内,以彰显公司对印尼数据主权承诺的支持。但他也清楚,搬家的困难摆在面前——7000公里、体量巨大、架构复杂、业务中断零容忍……
“这事有得做吗?”GoTo自己的技术团队甚至也对搬迁的可行性表达了疑虑。
很快,GoTo为这次迁移计划组织了一次全球招标。为了业务安全,GoTo选择了多云策略,即为ODS(Gojek等)、GTF(GoTo Financial等)、大数据三块业务寻求不同的合作方。多家全球知名的云供应商参与了这次投标,从去年开始大力拓展国际市场的腾讯云也在应标之列。
最终,在国内就以“搬家”能力强著称的腾讯云团队,通过展示过往成功案例,并经过服务匹配度、性价比、技术能力和交付能力等综合竞争,拿下了GoTo业务中复杂度最高的板块之一——以Gojek为代表的ODS业务。
2024年五一假期后,腾讯云项目组正式进驻Gojek开启具体需求调研。
但他们很快发现,困难比想象的更大——
Gojek对现有供应商的依赖很大,广泛采用很多独有的产品特性,如果要实现最小化改动,腾讯云需要付出巨大的适配成本;
原以为是一个App的搬迁,调研完发现是打车、打摩的、外卖、快递、社区团购等7个App的搬迁,业务复杂度前所未有;
Gojek随着业务发展逐步累加了越来越多的功能,没有特别好地做过架构梳理,迁移涉及近千个微服务;
……
“这事有得做吗?”腾讯云团队也有些许疑虑。
//579项新需求
短暂的内部对齐后,腾讯云团队很快给出了应对策略:双线并进。
在方案设计上尽量保持Gojek现有使用习惯;无法兼容的场景则快速开发配套功能,如采用基于策略的安全组代替基于规则的安全组,并把这项工程视为腾讯云国际化战略的组成部分。
在调研与 PoC 阶段,双方团队密切合作,针对100多个关键场景开展详尽的验证。最终确认,迁移将覆盖十余类 IaaS 产品,50多个产品模块及200多个功能点。
随后的短短数月,腾讯云团队快速交付上线579项需求,包括325个功能新增、118项体验优化及126项文档更新、性能优化、安全性提升等改进。
2024年9月,随着产品需求交付上线,Gojek工程平台适配工作同步启动。
不同于其他项目,Gojek 的工程平台与开源的基础设施即代码(Infrastructure as Code,IaC)工具Terraform 深度集成,且架构与现有服务商高度耦合,简单编写模块代码已无法满足需求。同时,腾讯云团队还需要了解清楚Gojek平台如何与云产品集成,并从多云适配角度理解需求,用于指导代码的编写模式。
通过线下紧密沟通合作,双方团队梳理了 Terraform 模块定制化需求的细节,整理了交付模块样本,经过与Gojek工程平台集成反复打磨之后,迅速进入了模块量产开发工作阶段。一个月内,腾讯云团队在开发代码的同时,也逐步向Gojek技术团队进行在线演示,进行产品的使用培训。
最终,腾讯云完整地交付了全部 Terraform 模块并协助Gojek实现了集成对接,确保了PoC以及后续搬迁工作的顺利进行。
此外,为了降低腾讯云与现有服务商产品在使用差异方面给架构带来的影响,腾讯云团队最大化的将 Terraform 模块的使用与之前方式靠拢,通过模拟产品形态、整合产品功能用例等方式,为Gojek技术团队提供了使用上的连续性,保障了Gojek在多云环境下架构的一致性,也加速了其在腾讯云上的部署速度。
据不完全统计,为了达到这一目标,腾讯云交付的整体代码量增加了30%以上。
//与时间赛跑
随着项目深入,资源不足的问题逐渐浮出水面。
一方面,Gojek所需资源远超腾讯云印尼两个可用区的承载能力;另一方面,Gojek架构基于三可用区设计,贸然改为双可用区可能存在风险。
在腾讯云管理层的支持下,项目团队迅速决策启动印尼第三可用区建设。一场与时间的赛跑,随即启动。
通常来说,因为筹备工作复杂,海外数据中心建设都需6个月以上。
但Gojek的目标是在2025年5月底前完成全量迁移——在此之前,还需要留出至少2个月的资源部署、割接演练的时间。留给腾讯云团队筹建的时间只有5个月。
把压力留给自己,给客户多一些从容。
在多个团队的协同下,项目组采用了“极限提拉”的策略,细化建设步骤,把整个机房筹建步骤细化到以天为单位,充分压缩每一个步骤的所需时间。
2025年3月25日,印尼第三可用区提前一周交付。也就是说,腾讯云团队在短短5个月内完成了印尼第三可用区从决策建设到交付的全过程。
值得一提的是,在正式交付前,为了确保Gojek整套系统在腾讯云上提前进行适配,腾讯云团队还开创性地提出了先在已有可用区内部署“虚拟可用区3”用于系统提前适配,在第三可用区正式交付后,再通过腾讯云自主研发的跨可用区无感知热迁移技术,进行全量业务无感迁移。
由于方案相对超前,Gojek团队甚至一度不能相信。但经过预生产环境 PoC 及正式环境演练后,该技术能力获得了Gojek团队的高度认可,并在最终生产环境中顺利实施。
//一次“火箭发射”
系统适配与资源准备期间,腾讯云团队与Gojek团队同步制定割接方案。
初期,Gojek倾向于“无业务改造、无中断”的冷热数据分离方案。但在割接过程中,“无业务改造”、“无中断”和“低网络延时”无法全部得到满足。经过与Gojek充分沟通和论证,双方最终决定采用所有系统一晚上全部切完的割接方式,优先保障Gojek无改造、低网络延时的业务发展诉求。
但全量业务流量一夜之间割接到腾讯云,涉及平台所有用户,对海量数据的同步、业务之间大规模的协同配合、底层云基础设施对突发海量业务的支持性,都是历史级的考验。这好比一次“火箭发射”,如果失败,损失严重。
为了保证项目万无一失,在腾讯云的配合下,GoTo还主导建设了细致具体的运行手册,涉及几千个步骤,并根据整个业务割接的流程,划定了5个可能出现问题的卡点,针对每个卡点沙盘推演了各种风险,制定了20多套应急预案。
4月15日,随着GoTo测试组完成Gojek在腾讯云预生产环境的功能、压力等多重测试,项目也进入了割接之前的演练环节。5轮演练过程中,项目团队优化了割接步骤,解决了诸多演练过程中暴露的风险,同时也增进了不同团队之间的协同配合。经过演练,每个步骤、每个潜在风险以及对应的应急预案,都深刻印在了项目成员脑海里。
5月25日晚上12点30分,正式割接启动。腾讯云在雅加达现场30多位和深圳总部100多位工程师们,与GoTo技术团队一起见证着这一历史时刻。
前期充分的准备,反而让大家异常平静。整个割接过程也非常顺利,仅仅用了4个小时就完成了数据增量同步校验、原环境全量业务停服、腾讯云全量业务开服、生产环境流量切换、业务验证等50多个大步骤、300多个小步骤。
在此过程中,腾讯云还承担了Gojek数据库迁移工具开发和护航重保的工作。针对Gojek数据库种类多元且没有成熟的工具辅助迁移,腾讯云团队定制化开发了数据迁移工具,并实现了整个割接过程中零故障的成绩。
腾讯云数据库
,赞23
5月26日凌晨4点30分,当测试团队完成业务验证、GoTo CTO William通过Gojek App正式完成其打车服务的下单后,团队正式确认割接比预计提前1小时顺利完成。
6月9日,GoTo集团CEO Patrick和CTO William 到访腾讯深圳总部。在接受采访时,他们表达了对腾讯云技术团队的认可和感谢。他们表示,GoTo是印尼第一大数字生态,要确保产品和技术能够具备世界级的能力,服务好庞大的用户需求。这也是GoTo与腾讯云的合作要实现的目标。
(图:GoTo集团CEO Patrick Walujo 与CTO William Xiong接受采访)
经此一役,在竞争日益激烈的东南亚市场,腾讯云也凭借卓越的技术实力、极致的性价比以及工程师团队的韧性与服务,打开国际化的一扇窗。
“没有搬不了的云,只有不努力的工程师。”腾讯云工程师的这句口头禅,已然成为这场远征的最佳注脚。