Knowledge center

生于疼痛的阿里云(en)

2019-04-02 09:01:05 mimukeji

拥有超过10万员工的阿里集团,其平台交易总金额已经占到了中国社会消费品零售总额的13%,创造就业超过4000万。这个庞大的数字经济体,今年即将迎来二十岁生日。

鲜为人知的是,这个数字经济体之所以能够顺利走到今天,离不开其花了一半时光所打造的业务与技术底座——那朵伴随着成长阵痛而扶摇直上的阿里云,今年也已经十周岁。

2019年3月,虎嗅专访了阿里云智能基础产品事业部总经理蒋江伟(花名小邪)、资深技术专家钟华(花名古谦)。不出意外,采访内容印证了我们此前的猜测:如果要从磅礴繁杂的阿里经济体中,找出一条读懂“昨天,今天,明天”的业务线索,阿里云恐怕是不二之选。

烟囱

“即便你仅仅访问一次淘宝的首页,所涉及的技术和系统规模都是你完全无法想象的,是淘宝2000多名顶级的工程师们的心血结晶,其中甚至包括长江学者、国家科学技术最高奖得主等众多牛人。” ——卡特《你刚才在淘宝上买了一件东西》

2008年初,淘宝的程序员撞到了墙上,心惊胆战。

那时候,淘宝在技术层面上,是一个由200多个功能模块组成的代码压缩包,体积大概有几百兆字节。其复杂程度已经“超出人类的认知负载”,没有人能完全掌握内部逻辑和关联。“改动商品相关代码,发现交易出问题了,改了论坛上的代码,结果旺旺出问题了”。

这还是“几个月就翻倍”的业务快速发展期。淘宝在峰值时的数据库连接数量已经超过5000个,数据库服务器的CPU占用率常常超过90%,且无法扩容。

实际上,早在4个月前的一次战略会上,阿里决策层已经看到问题所在。

那个会的召集人是马云。平时战略会都在西湖,那次他说找个看海的地方,思路开阔一些。但是当时秘书对宁波不熟,订错了地方,结果一群高管在一个海在哪里都看不到的屋子里,“不接地气”地吵了两天两夜。

在最后一天晚上深夜,大家历经争吵终于画出一张图。图上示意,信息流、资金流和物流将形成统一的数据智能,基本勾勒了12年后阿里现在的样子。

流淌在各个业务中的数据要做到“大一统”,项目被命名为“登月计划”。



但,月亮美好,却太遥远。眼下的现实是,淘宝底层技术基础已经危如累卵,已经是出了名的“改这里、错那里”。

要上线“淘宝旅行”和“淘宝彩票”。为了“不给主站添乱”,技术人员就另起炉灶重新做了这两个系统。哪怕有很多重复功能,比如用户、交易、查询、评价等功能。

重复建设还只是成本的问题。一个个独立的业务就是一根根独立的烟囱,都长在同一片地里,但各冒各的烟。数据大一统,无从谈起。

连业务属性最一致的两个业务——淘宝和淘宝商城(天猫的前身)都像两个独立的国家。

他们有很多共同的用户、共同的商家,但车不同轨、书不同文,载着数据的“火车”到了“国界线”,必须要通过复杂的架构手段,“找一个翻译”或者“换一个火车头”。



再加上,阿里的地里长了这么多烟囱,无数的火车头和翻译,复杂得不成样子。

建设烟囱本来就是多年来的企业IT模式:你起一个业务,底下给你弄一套系统;再起一个业务,我再给你弄一套系统。设计、生产、供应、物流、订单、库存、分销、客服……每个功能再一套系统,企业就是一片烟囱田。

这是工业流水线被发明之后,管理界的金科玉律:理顺、分配、不断优化每个封闭的业务流程,通过每个工序和业务流程的效率提高,进而提升整个企业的效率。

然而,当数字化信息取代实物,成为最重要的生产资料后,工业流水线在数字化时代的弱势便被无限放大——内部各环节之间只能是串联的,且对外部完全封闭,恰似一根根烟囱。

“你会发现转不动了,新业务不断出现,所有人都找IT部门要资源,看起来你挺牛,但其实你拖慢了所有人的节奏。”

“互联网这种速度,生死都是一瞬间。慢下来就挂了。”

虽然决策层看到问题所在,也遥远地指了一下月亮。但就像人类真的登上月球要付出沉重的代价,阿里的“登月”也谈何容易。

补天

阿里云优惠新机+优惠券

本文转载自网络,如有侵权,请联系我们删除。

Home

About

product

success

news

form

bbs

contact

工单(en)

阿里云报价咨询(en)