知識中心

生於疼痛的阿裏雲

2019-04-02 09:01:05 mimukeji

擁有超過10萬員工的阿裏集團,其平台交易總金額已經占到了中國社會消費品零售總額的13%,創造就業超過4000萬。這個龐大的數字經濟體,今年即將迎來二十歲生日。

鮮為人知的是,這個數字經濟體之所以能夠順利走到今天,離不開其花了一半時光所打造的業務與技術底座——那朵伴隨著成長陣痛而扶搖直上的阿裏雲,今年也已經十周歲。

2019年3月,虎嗅專訪了阿裏雲智能基礎產品事業部總經理蔣江偉(花名小邪)、資深技術專家鍾華(花名古謙)。不出意外,采訪內容印證了我們此前的猜測:如果要從磅礴繁雜的阿裏經濟體中,找出一條讀懂“昨天,今天,明天”的業務線索,阿裏雲恐怕是不二之選。

煙囪

“即便你僅僅訪問一次淘寶的首頁,所涉及的技術和系統規模都是你完全無法想象的,是淘寶2000多名頂級的工程師們的心血結晶,其中甚至包括長江學者、國家科學技術最高獎得主等眾多牛人。” ——卡特《你剛才在淘寶上買了一件東西》

2008年初,淘寶的程序員撞到了牆上,心驚膽戰。

那時候,淘寶在技術層面上,是一個由200多個功能模塊組成的代碼壓縮包,體積大概有幾百兆字節。其複雜程度已經“超出人類的認知負載”,沒有人能完全掌握內部邏輯和關聯。“改動商品相關代碼,發現交易出問題了,改了論壇上的代碼,結果旺旺出問題了”。

這還是“幾個月就翻倍”的業務快速發展期。淘寶在峰值時的數據庫連接數量已經超過5000個,數據庫服務器的CPU占用率常常超過90%,且無法擴容。

實際上,早在4個月前的一次戰略會上,阿裏決策層已經看到問題所在。

那個會的召集人是馬雲。平時戰略會都在西湖,那次他說找個看海的地方,思路開闊一些。但是當時秘書對寧波不熟,訂錯了地方,結果一群高管在一個海在哪裏都看不到的屋子裏,“不接地氣”地吵了兩天兩夜。

在最後一天晚上深夜,大家曆經爭吵終於畫出一張圖。圖上示意,信息流、資金流和物流將形成統一的數據智能,基本勾勒了12年後阿裏現在的樣子。

流淌在各個業務中的數據要做到“大一統”,項目被命名為“登月計劃”。



但,月亮美好,卻太遙遠。眼下的現實是,淘寶底層技術基礎已經危如累卵,已經是出了名的“改這裏、錯那裏”。

要上線“淘寶旅行”和“淘寶彩票”。為了“不給主站添亂”,技術人員就另起爐灶重新做了這兩個系統。哪怕有很多重複功能,比如用戶、交易、查詢、評價等功能。

重複建設還只是成本的問題。一個個獨立的業務就是一根根獨立的煙囪,都長在同一片地裏,但各冒各的煙。數據大一統,無從談起。

連業務屬性最一致的兩個業務——淘寶和淘寶商城(天貓的前身)都像兩個獨立的國家。

他們有很多共同的用戶、共同的商家,但車不同軌、書不同文,載著數據的“火車”到了“國界線”,必須要通過複雜的架構手段,“找一個翻譯”或者“換一個火車頭”。



再加上,阿裏的地裏長了這麼多煙囪,無數的火車頭和翻譯,複雜得不成樣子。

建設煙囪本來就是多年來的企業IT模式:你起一個業務,底下給你弄一套系統;再起一個業務,我再給你弄一套系統。設計、生產、供應、物流、訂單、庫存、分銷、客服……每個功能再一套系統,企業就是一片煙囪田。

這是工業流水線被發明之後,管理界的金科玉律:理順、分配、不斷優化每個封閉的業務流程,通過每個工序和業務流程的效率提高,進而提升整個企業的效率。

然而,當數字化信息取代實物,成為最重要的生產資料後,工業流水線在數字化時代的弱勢便被無限放大——內部各環節之間只能是串聯的,且對外部完全封閉,恰似一根根煙囪。

“你會發現轉不動了,新業務不斷出現,所有人都找IT部門要資源,看起來你挺牛,但其實你拖慢了所有人的節奏。”

“互聯網這種速度,生死都是一瞬間。慢下來就掛了。”

雖然決策層看到問題所在,也遙遠地指了一下月亮。但就像人類真的登上月球要付出沉重的代價,阿裏的“登月”也談何容易。

補天

“中國電商行業能有今天,上百萬淘寶店主都應該感謝秦始皇書同文車同軌,感謝高考語文考卷上的普通話發音題。” ——馬平《為了我們雙11“剁手”,中國准備了2000年》

2007年底,有程序員想了個辦法:將每個煙囪都必備,且邏輯最獨立簡單的用戶信息模塊拆了出來,將其獨立成為單個公共模塊。這一嘗試後效果還不錯,淘寶又將交易模塊也獨立了出來。

2008年10月,基於此前的成功嘗試,阿裏進行了一次被稱為“給高速飛行的飛機換發動機”的大手術。

這個名為“五彩石”(即女媧煉石補天用的石頭)的項目,其核心訴求就是要將淘寶與天貓在數據和業務層面完全打通。

當時的解法具有了後來中台的影子:

1、抽離出每個業務的共性功能,如交易、支付、會員等等,打包成“磚塊”,房子千奇百怪,但磚頭都是一樣的。做一個新業務就變得非常容易。

2、讓數據沉澱到統一的池子,為之後喂養數據智能奠定基礎。

“大多數產品,產業共性70%,行業共性20%,真正和同行不一樣的,恐怕只有10%”,阿裏資深技術專家古謙在見過上百家各行業龍頭企業後,這樣總結到。

而這一塊補天之石的影響,遠不止於此。

2009年初,五彩石項目結束,這個一共動用了200多人的公司級大項目(此前阿裏超過10人的技術項目就不小了),最終為阿裏沉澱了一套中間件技術,這個詞後來在技術圈普及,成為“拆煙囪”的標准。


(阿裏雲飛天研發團隊合影)


同樣在2009年,王堅率領的飛天團隊,正式掛出了阿裏雲的牌子。

在寧波的戰略會上,決策層們打算為“登月計劃”找個負責人,後來找來了王堅。

王堅人稱“博士”,不過在很長的時間裏,博士都有一副類似“騙子”的面孔。

馬雲說給阿裏雲每年投10億,投個10年,做不出來再說。但阿裏內部論壇上討伐的聲音一浪高過一浪,花錢又不出成績,這哪是一個商業公司該幹的事情。

其實,這恰好說明阿裏雲的確生於疼痛,生於業務壓力:

第一、“登月”要解決算力的問題,現成的IOE模式完全不適用;

第二、“五彩石”補天之後,要有與之匹配的分布式底座。

2013年,飛天單一集群能力達到5000台,成為全球第一家對外提供這一能力的公司,算力的底座宣告建成。

到2018年底,阿裏雲在中國市場份額已經超過2到8名總和。同時,阿裏宣布組織架構調整,阿裏雲升級為阿裏雲智能,將中台能力與雲全面結合。阿裏雲正式成為阿裏經濟體的技術底座,以及全集團的技術能力出口。

而阿裏雲智能總裁,恰是十年前“五彩石”項目的負責人,“行癲”張建鋒。



今年3月21日,張建鋒首次在公開場合闡述了升級之後的阿裏雲智能戰略。至此,開端於2007年寧波海邊的故事,閉環完美劃上。“登月”的另一條隱線浮出水面。

阿裏雲此前被外界感知的,更多是算力與資源調度能力,以及自主知識產權研發。卻少有人知曉,阿裏雲的壯大與發展,伴隨著集團的每次業務陣痛與瓶頸突破,更與中台戰略密不可分——

從五彩石到阿裏雲,這不是某種巧合,而是同一邏輯下的自然延展。可以說,中台戰略與阿裏雲,就是互為因果,互為充要條件,缺一不可,非你不可的關系。

這不止是一朵能計算的雲,更是一朵可以解決實際業務問題的雲。因為,阿裏雲生於疼痛。而阿裏集團的那次疼痛,又比絕大多數中國企業早了十年。

1000個BUG

“犯了足夠多的錯誤,你跌倒,你站起來。所有的錯誤都是進賬,都是很棒的收入。”

——馬雲演講

“沒被洪水倒灌過,你怎麼能證明這個城市的下水道架構是合理的呢?”

阿裏雲智能基礎產品事業部總經理小邪給我們講了這樣一個故事,2013年,阿裏模擬出遠超過雙11壓力的流量,這股洪水灌下去之後,淹出來1000多個BUG。

“像這種非常極端而極致的BUG,沒有這麼大的流量,是沖不出來的。即便招無數聰明的腦袋,也沒辦法解決的。”

這也是阿裏不同於其他公司的地方,它具備互聯網的規模、金融級的准確性、企業級的複雜程度。

在很多年前,有一個互聯網圈流行的詞彙,叫“鼠標加水泥”,其含義是傳統商業模式與互聯網的結合。這些能夠做面對面生意的“重資產互聯網企業”,就屬於“水泥公司”,和那些只靠屏幕就能滿足用戶的“鼠標公司”截然不同。

而阿裏早在十幾年前,就是中國第一代“水泥公司”。這是其業務性質決定的,和BAT另外兩家的“鼠標業務”完全不同。

比如,搜索是可以有一定模糊范圍的,搜不出來幾個鏈接也沒關系,但電商不行,哪件商品搜不出來,商家都會電話投訴的。不僅內容上不能有偏差,每次交易的數字都代表著真金白銀,差一分商家也是不幹的。

再比如,社交行為基本是可以預見的,很難出現巨大的起伏跌宕。而電商用戶就如同12306一樣,面臨巨大的彈性,算力放多了浪費,放少了崩潰……

而且,其它互聯網企業的業務基本是比較清晰的,多是圍繞著一個主流量核心再去設置支流業務。而阿裏則從一開始就像個傳統企業,要把一個產品或服務從生產設計、庫存運輸、分銷推廣再到客服分析全鏈路包含,其業務複雜度遠超過同體量互聯網企業。

高精准度、高複雜度以及難以預測的高並發,共同構成了阿裏的技術瓶頸。這也是當業界大佬認為雲計算“新瓶裝舊酒”時,馬雲堅稱“不做雲計算,阿裏會死”的原因。

同期的其它幾家知名電商企業,依然在采購IBM的框架,甚至從Oracle請來了CTO。隨後,這些企業的技術端紛紛在現實磨難中各種崩盤,而且對這種崩潰的彌補,很難得到系統性的提升。

十年後的2018,騰訊、美團、京東等企業,或多或少都放出了中台戰略和TO B戰略的消息,而雲計算也逐漸成為了各家的當紅業務線。

當然,還有更多傳統企業,在近幾年的市場挑戰中,逐漸發現了自身原本信息系統建設的滯後性,開始求教於阿裏技術團隊。

這些事實無不印證著那個判斷:阿裏並不是多聰明或多奇怪,只是比其它企業提前很多年就遇到了挑戰。而現在,大部分企業也走到了那個挑戰的門口。

讓天下沒有難碰的運氣

“我們必須承認各種不確定性,利用數據和信息消除它們,而不是采用過去那種來自頂層的設計方式去解決問題。” ——吳軍《矽穀之謎》

在采訪中,古謙向我們展示了一組術語:VUCA。

這組術語包含四個詞,即Volatility(易變性)、Uncertainty(不確定性)、Complexity(複雜性)、Ambiguity(模糊性)。可以充分概括這個商業時代的特征。

企業商業模式的轉型,已經從電氣時代的30年一個生命周期,到信息化時代的10年,到互聯網時代的5年,直至今天DT時代的2~3年的生命周期。

不確定性成為時代主題。生死都是一瞬間,就是這麼VUCA。

商業本質從未改變:信息不對稱牟利的產品或服務,加上時代機遇,也可以稱為運氣。而在這個不確定的VUCA時代,機遇變成一個變幻莫測的東西。告別工業時代的“看十年做十年”的戰略思維,快速試錯和數據智能才是VUCA時代的王道。

這也恰恰是阿裏中台能力的價值,阿裏的聚劃算業務只需要7個人花一個半月就能開發出來,飛豬、釘釘、盒馬等商業新物種頻繁湧現。很多阿裏內部幾個人幾星期做的事情,放在外部企業中,至少要幾十人幹半年。哪怕方向錯了,從頭再來,成本也要低很多。

企業能做的第二件事,就是形成數據的統一,挖掘智能的“石油”。

比如波司登連續兩年利潤猛増。這其中一大原因,就是利用中台策略,實時監控全國3000多家門店的庫存和銷售情況,進而降低庫存壓力和物流成本,提升商品售罄率。

這一升一降間,對於一家銷售額數十億的企業而言,只要物流成本降10%,利潤很可能就會多出一兩個億。

一些咨詢機構則看得更長遠。比如埃森哲、畢馬威、德勤紛紛來找阿裏雲合作,就是希望可以幫助企業數字化轉型,並通過數據智能支撐商業決策。

阿裏本身也是用機器做決策最多的公司,從阿裏小貸,到手淘千人千面,如果沒有AI能力,幾百人肯定無法運營這個萬億規模平台。

前穀歌雲首席科學家李飛飛曾多次說過,雲是人工智能落地的最好平台。這也是40%的中國500強企業、近一半中國上市公司、80%中國科技類公司齊聚阿裏雲的重要原因。

結語

二十年前,在湖畔花園那間漏水的民宅裏,這家企業的基因就決定了後來的故事。它的根須在中國經濟社會的根須之間。受難於此,也反哺於此。

早於社會十年,阿裏遇到巨大困境。也由此築起了巨大的壁壘,來自別人所未長的見識,和不能承受的痛苦。

變身阿裏雲智能之後,阿裏的苦,要去解決社會的苦,將自己十年來在企業運營和商業實踐中總結的方法論和技術架構,打包成產品和商品,賦能整個經濟社會。

二十年前,阿裏在報紙上發出半個版的招聘廣告,那句廣告詞如今已經成為它的企業文化,“If not now, When? If not me , Who?”(此時此刻,非我莫屬)。

疼痛本就是先行者的必然經曆。世界在質疑,而你走了過去。

本文轉載自網絡,如有侵權,請聯系我們刪除。