阿里巴巴首席技术官、达摩院院长张建锋(花名:行癫)站在阿里巴巴2019年“云栖大会”的讲台中央,高高举起一枚巴掌大小的芯片。
它被称作“含光800”,是阿里巴巴的第一颗人工智能自研芯片,主要用于云端视觉处理场景。张建锋(行癫)介绍,含光800在业界标准的ResNet-50测试中,推理性能比目前业界最好的AI芯片高4倍,能效比是第二名的3.3倍。
“含光”本是中华民族上古时期商天子的三大神剑之一。《列子·汤问》形容含光之剑“视之不可见,运之不知有,其所触也,泯然无际,经物而物不觉。”擅长为传统文化意象赋予“比特性”的阿里巴巴,希望自己的含光800也拥有同样的“剑法”:隐于无形,算力强大——在杭州“城市大脑”的业务测试中,1颗含光800的计算能力,相当于10颗GPU。
“今天阿里巴巴有足够的信心,有足够的能力,去做传统硬件公司能做到的,包括他们不能做到的。”行癫对着台下的数千名听众说,“阿里巴巴今后会成为一家真正软硬件一体化协同发展的科技公司。”
▲阿里巴巴首席技术官、阿里云智能总裁、达摩院院长张建锋(花名:行癫)在“云栖大会”上
这场在阿里巴巴成立20年,阿里云成立10周年的节点进行的“云栖大会”,无时不刻地从每一个毛孔和细节里都试图提醒人们:这家公司在过去10年发生了根本的改变。
它从一家“互联网公司”变成了一家“技术公司”;它从为中小企业提供“鼠标+水泥”的低技术含量建站解决方案,到提供最前沿的人工智能芯片和AI解决方案;它从单纯地依托互联网,到建立起云计算数据中心、软件平台、软件应用解决方案、人工智能、芯片和芯片组架构的软硬件一体化的技术架构……阿里巴巴已经成了一家真正意义上的高科技公司。
根据阿里巴巴提供的数据,这家拥有中国最大电商平台、提供中国市场占有率最高的云计算服务的公司,每天的人工智能调用规模超过1万亿次,已是中国人工智能平台之最。成立两年的面向基础科学和底层技术研发的达摩院,已经网罗来10多位电气和电子工程师协会会士(IEEE FELLOW)和30多位知名高校教授,阿里巴巴成为全球人工智能科学家流向最集中的科技公司。达摩院孵化出的芯片公司“平头哥”,也初步完成终端处理器IP、终端芯片设计平台SoC和云端AI芯片的布局。
而这些当今最热门的技术展示,更像是冰山露出水面的一角。从开始探索自己的技术道路直到今天,阿里巴巴跋涉了10年。这10年,阿里巴巴经历了从技术支持商业,到技术融入商业,再到技术改造商业,直到技术驱动商业的彻底转变,从底层到前端,从组织到文化,形成了自己的技术架构、技术路线、技术储备、技术产品、技术理念和技术文化。
10年前,“BAT”的概念刚刚有个雏形,人们分别给三家“巨头”打上了“腾讯的产品、百度的技术、阿里的运营”的标签。现在对阿里巴巴来说,是时候摘下这个刻板印象的标签了。过去的10年,是阿里巴巴“属于技术的10年”,也是再造一个阿里巴巴的10年。
“大一统”:技术路线、风格和基石
阿里巴巴“属于技术的10年”的原点,可以回溯至2008年10月淘宝网历史上绝无仅有的一次“停机事件”。这次停机事件背后的“五彩石战役”,可以被视作阿里巴巴“前后两个10年”的分水岭。
它倒逼阿里巴巴第一次在技术上审视自己的道路,告别以往的技术拿来主义。
这场战役是阿里巴巴历史上第一次大规模的自我技术改造,目的是打通淘宝网和刚刚上线的“淘宝商城”(天猫的前身)的数据和系统。此前,两者各自拥有一套系统,彼此商品库和店铺系统都无法互通,导致从淘宝网导流到淘宝商城的用户,感觉就像是到了另一个公司的网站——需要重新注册、登录、选品和下单,体验割裂,直接影响了购物效率。
为了解决“打通”的问题,淘宝的架构师和工程师团队花了5个月的时间。领衔这场战役的项目负责人,是当时加入阿里巴巴只有4年的淘宝架构师行癫。
这场战役,对阿里巴巴思考“什么是技术”的影响,可谓深远。
此前,技术团队部门在阿里巴巴内部更像是一个IT后勤部门,是支撑业务的配角。因为阿里巴巴的核心是商业,是生意。在阿里巴巴成立后近10年的时间里,技术在阿里巴巴,是为了支持商业和生意而存在的。
而在五彩石战役之后,阿里巴巴开始思考技术融入商业的问题。
在打通淘宝和淘宝商城数据和系统的过程当中,架构师团队引入了中间件。也就是在原先只有纵向思维的架构设计里,添加了横向的通道,让各个业务底层彼此互通。同时还将两者共用的业务全部找出,搭建了统一的公用平台。这种思路在后来逐渐被阿里巴巴赋予了一个新的名字:“中台”。
它产生了阿里巴巴独创的“中台”技术思想。
具体来说,“中台”主要负责打通数据和业务,也就形成了数据中台和业务中台的“双中台”——通过数据中台,阿里巴巴旗下的不同业务之间在保证用户隐私前提下可以共享数据。而业务中台则集合了许多最常用的功能,比如账户体系和支付体系等,当有团队需要建设一个新业务,或者需要上线一个新功能时,就可以直接快速复用这些已经沉淀在中台的功能,避免重复造轮子。
参与“五彩石战役”的时候,时任淘宝网工程师的蒋江伟(花名:小邪)刚刚加入阿里巴巴。在接受PingWest品玩采访时,他感慨道当初彻底打通两个业务数据和后台的必要性:“如果当初选择了各做各的,那之后的阿里巴巴内部自己的两个业务之间交流,肯定像两家公司一样”。蒋江伟后来担任了阿里巴巴中间件团队负责人等职位,现为阿里巴巴合伙人,负责阿里云的技术研发。
“中台”思想在文化上也颇符合在一家中国科技公司搭建技术架构和技术团队的底层逻辑:“大一统”的商业观和技术观。
通过“两个淘宝”的打通,这种“大一统”带来的效率变化让行癫感觉到,在两个中台下面,也需要有一个统一的技术平台来支撑。行癫对PingWest品玩表示:“这种统一,一方面是避免重复工作,提高效率;另一方面则是希望能让底层技术得到积累。核心都是为了降低创新的成本。”
于是,在2012年被派去负责阿里巴巴B2B业务时,行癫作为技术出身的业务负责人,除了一手推动了B2B和淘宝的数据和系统打通之外,它还第一次打通了两边的技术团队。
“行癫非常精明的一点就是,除了数据和业务外,技术也一定要统一。”蒋江伟对PingWest 品玩说。他见过不少公司,在不断的团队或者投资方更迭后,会在技术风格上留下明显的迭代烙印,甚至有的公司内部各个部门之间所使用的语言也都不同,彼此无法交流。而阿里巴巴对技术的统一,让协作在一个非常庞杂和巨大的业务体系下面,反而显得更加方便。
“当我们要启动某个项目,需要各个团队出人一起来做时,你会发现我们可以把人凑起来,就是因为大家的技术体系是一样的。而且不只技术统一,这些人的工作方式和技术背景也是统一的。这和中台的思路一样,这些人也可以被快速复用,可以快速的组建团队去完成项目。否则的话就是整天争吵,谁的语言更好,整个架构怎么做更好”,蒋江伟说。
当时行癫负责的B2B业务,有一个200人的中间件团队,而淘宝的中间件团队只有40个工程师。两者的工作内容基本相同,但后者的小团队却支持着比B2B更多的工作。行癫快速地对团队进行了合并。结果是B2B 原本200多人的中间件团队,只留下不到10人。
这样大刀阔斧的合并,也让不少人犹豫和担心,蒋江伟记得,行癫当时只是果决地说:“这个事情必须要更高效的统一。”
这次合并也成了一次里程碑事件。它体现出阿里巴巴在技术治理上的强大组织力,这贯穿了阿里巴巴过去10年的技术体系建设中。类似的合并在之后不断发生。
“难免有矛盾,有的是两个人都很优秀但必须只选一个,肯定有损伤。但所有的问题必须一次性全部解掉,而且非常彻底。”蒋江伟记得,那之后在对整个阿里巴巴集团的四个存储、两个数据库和容器的团队合并时,“办法就是两个团队选一个leader出来,剩下的人不服气的,该走的走。”
随着五彩石战役之后各业务线的整合,中台雏形基本确定,由此汇聚的数据也越来越多,阿里巴巴开始思考如何能更好利用这些数据的价值。
与那些自下而上,从技术本身的可能性来慢慢探索出一套方法的做法截然不同,阿里巴巴对如何用好数据的解决方案,来自马云的一个“灵光乍现”。
2008年,马云提出一个概念——“登月计划”。这个计划的含义是,要靠技术去解决挖掘数据价值的难题,“登上数据这个月亮”。
它很马云,天马行空,有一个名字和宏大的想法,但没有任何基础架构支撑。正巧,阿里巴巴遇到了王坚,一个容易被“大词”打动的人。
2009年,王坚成为阿里巴巴的首席技术官(CTO)之后,提出要解决登月问题,首先必须解决算力。因为有算力才能对数据进行分析。这之后,在一片争议声中,王坚说服马云先从云计算和“去IOE”——用自己研发的基于云计算的数据中心,替换掉IBM、Oracle和EMC提供的小型机服务器——开始做起。于是,阿里云成立。
那正是阿里巴巴B2B公司在香港的股价一落千丈的“困难时期”。在这样的背景下,马云表示“每年给阿里云投10个亿,投个10年,做不出来再说。”当时中国互联网界,对此一片嘲笑。百度创始人李彦宏形容云计算是“新瓶装旧酒”,人们纷纷奚落马云是遇上了王坚这个骗子,而阿里巴巴则是吃了创始人不懂技术的亏。
不过,当时说服马云的还有另一个重要原因,基于IOE 的基础设施从成本和能力上都已经对阿里巴巴不利。阿里巴巴在2008年的数据库规模已经基本无法扩展,但涌入平台的流量却仍在飞速翻倍,加之越来越多的大型“秒杀”营销,IOE架构已经无法满足需求。
2009年,阿里巴巴决定自主研发云计算操作系统“飞天”,尝试将全球数百台服务器连成一台超级计算机。2月,飞天团队写下第一行代码。9月阿里云正式成立。他们直接拿阿里巴巴最核心的淘宝业务进行改造。2010年,阿里金融的订单贷款产品“牧羊犬”成为飞天系统上的第一个产品。2011年,阿里云官网上线,成为中国首个对外开放的公有云。2012年底,淘宝系去IOE完成。同时由于这次底层技术变革涉及的业务越来越广,阿里巴巴在内部对技术后台部门进行了第一次大整合,成立了集团的技术保障部。到2013年8月,飞天开放平台的单集群超越了5000台这个瓶颈。此后阿里内外对于阿里云的质疑终于停息。同年,阿里巴巴全集团最后一台IBM小型机下线。
作为王坚阿里巴巴首席技术官一职的继任者,行癫在回顾阿里云的前10年的经历时形容:“飞天系统是阿里云过去10年最重要的成就”。
在解决了对内的算力问题后,2014年,阿里云开始商业化。在阿里云对底层基础架构的变革完成后,整个集团技术“大一统”的路线也更加清晰。
2015年初,当时担任阿里巴巴中国零售事业群总裁,统一负责淘宝、天猫等核心电商业务的张建锋(行癫),又一次做了一次里程碑式的整合。当时的阿里巴巴正在“all in 无线“,电商业务在处于无线化、数据化和“千人千面”个性化的转折关键时期,张建锋(行癫)决定将淘宝和天猫的推荐算法团队合并。
“这是一次很大的改变。此前淘宝、天猫的算法团队是分开的,但行癫的大的判断是,要从全局上推动个性化、无线化的发展,于是做了团队的整合。”当时负责天猫产品技术的吴泽明(花名:范禹)对PingWest品玩回忆。“80后”吴泽明2004年加入淘宝,之后先后担任淘宝和天猫的产品技术负责人,参与了历次“双十一”的技术保障,2017年2月成为阿里巴巴合伙人。
合并淘宝、天猫的算法团队后,在2015年的“双十一”上,阿里巴巴用算法全面取代人工来分配流量。
“事实上,当时关于流量是应该由商家和行业运营来人工分配,还是用机器分配,是有很大的路线斗争的。然后2015年双十一,行癫和逍遥子决定让数据发挥更大作用。而事实证明,效果确实提升很多。” 吴泽明对PingWest品玩说。“这之后阿里再也没人挑战靠人更好还是靠数据更好的问题了。”
吴泽明认为,这次整合其实就是之后阿里巴巴正式成立“大中台”的前身。因为它靠“双十一”这样重要事件的实际成绩,验证了基于强大组织力的“大一统”技术路线的正确性。
2015年12月,阿里巴巴正式提出“大中台”战略,成立阿里巴巴中台事业群,推动整个集团的中台战略落地,行癫再度成为“大中台”的操盘者。翌年,行癫正式接替王坚成为阿里巴巴首席技术官。随着“大中台”的推进,阿里巴巴进入技术改造商业的阶段。
▲2019云栖大会上,阿里云三代总裁同台。从左至右分别为胡晓明,王坚,张建锋。
“大中台战略”不只是在更多的业务线上重复当年合并B2B 和淘宝中间件团队的工作,它更是一场更大范围的统一。“建中台,不仅是一个技术,他还是个思想体系的转变。”行癫对PingWest品玩说。
“这就要强调一些基础的东西,我们叫统一技术、统一数据、统一文化,马老师(指马云——编者注)最早提出这三个必须要统一。逍遥子(阿里巴巴现任董事长、CEO张勇的花名)今年也反复提,要通人才、通技术、通策略,你必须得通。所以这个大的前提下,我们提出大中台。”
在行癫推动落实大中台的同时,另一边快速推进商业化的阿里云正在遇到挑战:以帮助客户上云,提供存储和带宽资源等业务为主的IaaS (基础设施即服务),竞争门槛快速降低,市场更多在围绕价格进行竞争。阿里云急需向技术含量更高的PaaS(平台即服务,比如提供一些大数据分析和人工智能服务等)转变。而阿里此前在建设中台过程中的中间件技术积累,正好可以用来补足阿里云的短板。
因此,2018年底,阿里巴巴决定更进一步,以阿里云为抓手,对整个阿里巴巴的后端技术做更进一步的整合。2018年11月,阿里巴巴公布组织架构调整,阿里云升级为阿里云智能,行癫成为总裁。
同时,这次组织架构调整也对前端电商业务的技术力量进行统一,成立新零售技术事业群,由吴泽明负责。
这种“大一统”的技术体系也让阿里巴巴庞杂的业务,“以技术之名”联接在了一起。阿里巴巴CEO张勇(逍遥子)将阿里巴巴的业务归纳为五层:IaaS, PaaS, DaaS, SaaS和 BaaS 。
技术的基座是阿里云提供的存储和计算为代表的“基础设施即服务”(IaaS)和基于云上的各种数据、人工智能等服务构成的“平台即服务”(PaaS)。上面承载着是双中台的数据分析产品为主的“数据即服务”(DaaS),再上面是以钉钉为代表的“软件即服务”(SaaS)。落实到具体业务场景上,又有为金融、支付、交通、地图、本地服务、文娱等领域提供完整的数字解决方案的 “商业即服务”(BaaS)。
这五层服务就涵盖了阿里巴巴所有业务,它们全部以技术为核心竞争力,彼此又因技术而构成关联,一起组成了逍遥子提出的“阿里巴巴商业操作系统”。阿里巴巴商业操作系统的形成,标志着阿里巴巴正式进入技术驱动商业的阶段。
从技术只是“鼠标+水泥”,到形成了一套技术驱动的商业操作系统,将阿里巴巴的“数字经济体”带入真正可以被技术的轮子带着运行的今天,阿里巴巴花了整整10年。而毋庸置疑的是,“大一统”的技术路线和技术风格,是阿里巴巴的商业操作系统之所以能成为整个“数字经济体”的操作系统的基石。
达摩院:理想主义与现实主义的水晶球
2018年底,阿里巴巴密集举行了三场大的集团技术战略规划会议,讨论如何让技术体系更好地反哺业务,成为业务真正的驱动力。
讨论的最终结果,是将整个阿里巴巴的技术分为三类:统一于阿里云智能的底层技术;归属新零售技术事业群的贴近前端的技术;以及寄托着这家公司“技术梦想”的达摩院。
达摩院成立于2017年,但阿里巴巴集团技术战略部总监刘湘雯第一次听到这个名字是在2014年。
当时的阿里云已经基本解决了算力问题,王坚认为接下来的重心要转移到算法上。这需要成立一个类似研究院的组织。现在是阿里巴巴集团技术战略部总监的刘湘雯,此前她曾担任阿里云的销售,后转做技术传播和技术战略。2014年她和同事向马云汇报研究院的计划时,马云想出了这个名字。
像“登月计划”一样,“达摩院”这个名字也很马云。马云希望阿里巴巴的研究院也能像金庸小说里的达摩院那样,成为一个“武学殿堂”。这个殿堂的武艺,就是世界最厉害的技术。
因为它来得太天马行空,以至于有了“达摩院”的中文,才有了它的英文解释:“达摩”(DAMO)被拆解成了Discovery(发现)、Adventure(探险)、Momentum(势能)和Outlook(远见),涵盖了阿里巴巴的技术着力点。
2014年夏天,从密歇根州立大学“停薪留职”来阿里巴巴做顾问的金榕,也第一次听到了“达摩院”这个名字。当时他已经在阿里妈妈做了半年顾问,主导完成了阿里妈妈广告推送机制的升级,通过优化推荐矩阵,将被动的推送改为提前推送,计算效率提升了30%。就在这时,阿里巴巴时任首席技术官王坚找到了他,希望他加入这个新成立的研究院,两人来了次“史上最短面试”。
“我们估计谈了不到五分钟。我自己都不知道他为什么会定下来要我。”金榕回忆。王坚的问题很简单,他问金榕觉得要怎么做好大数据这事情。
“我的回答就是,做数据通常的做法是业务提出一个问题然后技术人员把它抽象去解答,但是我觉得这里最大的问题是业务人员可能问了一个错误的问题,因为他看的东西比较短视。所以一个好的技术人员,很关键的不仅是知道如何解决问题,更重要的是知道怎么找到正确的问题。”
听完金榕的回答,王坚就说了句“OK”。面试就算通过了。金榕之后正式加入了阿里巴巴。
像金榕一样,当时人工智能的人才大多在海外,所以达摩院的招聘目标也更多瞄准海归。“考虑到招的一堆人都是从美国回来的,而且初期大多只是研究算法,还不知道和业务如何连接,觉得这件事与达摩院的宏大想法相比还很小,所以就起了一个英文名字IDST(全称:数据科学与技术研究院——编者注),没敢用达摩院的名号。”刘湘雯对PingWest品玩回忆。
金榕加入IDST后,生活和工作都发生巨大变化。从在美国时每天泡在办公室不需跟人打交道的象牙塔生活,变成了兵荒马乱、天天需要和团队沟通的“战场”。一开始,他感到非常不适应。
金榕的第一个项目是给聚划算做个性化的搜索推荐,他发现,理论上十分完美的算法,到了现实中却因为完全不符合业务逻辑而失效了。
“他们的业务逻辑非常多,像选品、排期,一开始真的搞不懂他们在干嘛。然后他们也搞不懂我们在干嘛。每一次跟业务方开会,我说完头三句话,同事能说三个小时不停。每次都这样,我就插不上嘴了,光理解他那一段业务逻辑就要花很大时间,然后每一次逻辑还都不太一样。”金榕回忆。他没法把这些业务逻辑变成简单的数学,感到十分挫败。
共2页 [1] [2] 下一页
关注公号:redshcom 关注更多: 阿里巴巴