“真实世界充满bug,我在最大的舞台寻找答案”

南风窗 2020-09-17 19:37

作者 | 顾山

2016年3月阿尔法狗打败世界围棋冠军李世石的时候,肖文聪正在微软亚洲研究院(MSRA)实习,25岁的他开着一个屏幕假装写代码,另一个屏幕观看着这场“世纪人机大战”。


当李世石艰难拿下第四局、也是唯一获胜的那局时,这名从事AI深度学习的在读博士撇了撇嘴角:“阿尔法狗的系统还是有bug,有些小技巧能够骗过它。”


所以14个月后,当声称能打败阿尔法狗的柯洁如愿与之对垒的时候,肖文聪早已预判到了柯洁最后摘下眼镜抹脸那一刻的黯然神伤。“一年多的数据投喂和模型更新,足以让阿尔法狗修复它的那些bug。”


李世石和柯洁的败北让很多人沮丧,也让不少AI业内人士振奋,但并不包括肖文聪。在他看来,阿尔法狗本质仍是对既有经验的归纳总结,“吃”的仍是海量互联网信息中的已有的知识——“在这点上,没有任何突破”。


主动寻找“bug”向往“突破”,“想给这个世界带去点改变”,于是博士毕业后的肖文聪选择了阿里巴巴。


“真实生活充满bug,这些bug才是这个世界的魅力所在,阿里连接着真实的世界。”



要战,便选择最大的战场

“如果一个东西不符合你的逻辑和预期,我们把这个东西叫做bug。”作为一名工程师,肖文聪讨厌bug。但是他的选择,似乎又在主动迎接bug。


在微软亚洲研究院实习的肖文聪,那时已经在操作系统顶级学术会议和网络顶级学术会议上发表了北京航空航天大学的第一篇OSDI和第一篇NSDI,论文至今已经被引用上百次。


博士毕业时,肖文聪可以继续从事科研工作,但他还是选择离开。“我已经证明了自己的学术能力。”经学长推荐,肖文聪选择了阿里作为下一段征程的起点:“阿里拥有中国云计算最大的业务落地场景,在阿里所做的,就是在改变世界。”


同样由前辈引荐来到阿里的余英豪,有着另外一个理由——“我不希望自己成为一个重复劳动的人。”


本科复旦大学电子工程系百余人中排名第二、交换加州大学洛杉矶分校时成绩满分、直博香港科技大学时获得香港特区政府博士研究生奖学金……博士毕业的余英豪不出意外收获了各大厂的橄榄枝。在沟通和实地了解中,余英豪发现,一些工作机会可能存在“重复造轮子”的情况,而此前在阿里的实习经历让余英豪相信,在阿里他能有更多自主选择权和创新空间。


这位93年的男孩相信理性与逻辑,也正是因此,在面对多家大厂offer的时候,他最后选择了阿里:“云计算的研究是学术界与工业界相互促进,甚至有时是由工业界引领的。阿里拥有最大的业务体量和落地规模,因此这家公司有强大的内驱力去尊重技术,有广阔的土壤让人成长。”


小学一年级账号被盗的经历,让刘煜堃早早地接触了网络安全这一领域。信息安全CTF竞赛从国内打到国外,均斩下不菲战绩。


刘煜堃曾在另一大厂实习,从事漏洞挖掘的工作,但是他最后没有选择留下:“挖漏洞这事,你在自己家里也能做,总感觉在闭门造车。”要战,就要选择最值得奋斗的战场。


刘煜堃选择了最大的战场——“云计算是未来,阿里云是亚洲最好的云。”


入职阿里之前,刘煜堃就知道,李晓宁、知名白帽子“猪猪侠”王昱都在阿里,这代表了阿里的业界水平。当他接到“猪猪侠”的面试电话时,他感受到了“战栗”:“我跟他们聊就觉得有东西。”


肖文聪所在团队“PAI”,意为“platform of AI,AI平台”



年轻科学家的“鲁棒时刻”

“鲁棒”一词来自Robust的音译,意为“健壮”“强壮”。在程序员的世界里,这个词语代表系统的健壮性,是在异常和危险情况下系统生存的关键。


这群刚走出象牙塔的年轻科学家,也在阿里经历着自己的“鲁棒时刻”。


肖文聪入职后,按阿里的企业文化,给自己起了个花名:天工,取自“巧夺天工”和“天工开物”。他有着一张娃娃脸,以及与其脸庞不相匹配的野心。2019年6月的最后一天,他一路南下来到西溪之畔,离开了驻足10年的北京,第一次一个人生活。那天杭州大雨,仅仅从出租车下车到酒店大堂的距离,就把肖文聪全身打湿了。


后来肖文聪发现,那是一场成年的洗礼。


肖文聪来到阿里后发现,业内主流 AI 框架 Caffe 的创始人、谷歌大脑前研究科学家、Facebook AI 前架构总监贾扬清,早他一步来到了阿里云。随后,他又发现,首位入选全球顶级开源基金会CNCF技术监督委员会名单的中国人李响,也成为与自己共事的同学。


刚入职时与“大牛”共事的兴奋,此后变成压力。肖文聪憋着一股劲,在最初的一个月里疯狂地翻阅论文;余英豪则退至“舞台”一侧,埋头努力,“不想让任何人失望”。“优秀”是一种惯性,但真实的世界充满“bug”。


最初的挫败感来自对项目推进的失控——自己写下的代码与工业结合、变成人们生活的一部分,是余英豪真诚的心愿。他也曾对接触现实世界做好心理预期。只是当脑海中理想的“人们”变成一个个有鼻子有眼的业务方坐在桌前,嘴巴一张一合和自己对着需求,习惯了抽象思维和高大视角的他被下拽至现实的尘土。


“刚入职的时候,我是意气风发的,现在才知道当初的眼高手低,现实推进不如我的想象。”


这位从小“独善其身”便可的优等生第一次知道,原本一个人能够轻松书写的方程式,如今有诸多解题步骤需要与现实中的他人产生联结,才能一同解答。


随后,业内大牛对自己的挑战,更成为他们更挫败的体验。


第一次肖文聪和余英豪将各自的设计项目交由贾扬清和李响评议的时候,他们被问得哑口无言。习惯了快速解题的“好学生们”发现,原来取得答案并不够,解题步骤的选择与扬弃在现实场景中也十分关键。

“为什么需要GPU的共享能力?”

“为什么GPU不能像CPU那样细粒度地分时复用?”

“优化GPU资源共享机制的本质挑战是什么?”


质问步步紧逼,他们措手不及。从小的教育只要求他们给出答案,为何已经取得结果,还要追问过程?为何已经完美解答,还要自寻bug?甚至要去了解不同路径,即便那条路径是默认的死胡同。


“他们迫使我们去看向本质。当你能回答出他们的问题,说明你对这个事情的理解更加深刻了。”


曾经的天之骄子被迅速打碎、融化、锻造。


如今,肖文聪和余英豪提交新设计前,必先从不同视角进行演练。看似“打破砂锅问到底”的笨办法,却让以往习惯一条路走到底的他们有了全局观。


被业界大牛挑战,于肖文聪而言是一种大脑的兴奋剂:“现在我们的产品已经被最懂行的人挑战过了,还有什么好怕的?”


在阿里尚不满一年的余英豪习惯了向下求索,知其然且知其所以然,同时用逆向思维倒推业务需求,考虑项目的可复制性及普适性,开始享受用“gets your hands dirty”的方式去设计项目。


当代码粘上现实的泥土,裹挟着充满意外的bug在粗糙的土地中向前,程序不再是轻飘飘的云端自赏,而是充满现实力量的混合物,犹如女娲以藤条沾满泥浆,挥舞洒落出更加鲁棒的新生命。



对这个世界“微薄”的贡献

余英豪没料到,甫一加入阿里,他就站在了中国乃至全球一场购物鏖战的暴风中心。


2019年,余英豪成为阿里云云原生应用平台的一员,这个团队的工作,决定天猫“双11”当晚系统所能承担的订单峰值。


“双11”技术团队的会场设在“光明顶”,墙面由大块大块的屏幕覆盖,跳动的数字显示着服务器的实时负荷。屏幕上不断闪烁的色块印照在会议室中人们的脸上,斑驳而魔幻。


2019年,余英豪第一次以员工的身份参与“双11”,他掏出手机,拍下了灯火通明的园区。那一夜,让他难忘。


当时针从11:59转变为00:00,余英豪似乎听见了号角响起。时间如炙热的岩浆,冒着丝丝的热气与咕嘟咕嘟的泡泡,凝滞地缓慢流动。


全球消费者对美好的期待,以每秒几十万笔的速度在余英豪团队的代码上奔跑,电信号带着老老少少的兴奋和躁动,发送到千里之外的服务器,不大的会议室成为最激烈的战场,团队以百人之力,为每秒五十多万次数据冲击清淤固堤。


一夫当关,万夫莫开。


自己敲下的代码成为“双11”中的一部分,经受全球最大流量峰值的考验,与曾经遥望的业界大牛并肩共战,这样的机会并非每个工程师都能拥有。


看着屏幕上飞快滚动着的红色数字,余英豪第一次感受到,他在键盘上敲下的东西,是如此真切地影响着这个世界。


余英豪的战场清晰可见,而肖文聪却还在最好的舞台中寻找着自己的“对手”。


肖文聪加入阿里云计算平台事业部PAI机器学习平台时,大数据和深度学习的基础平台已经初具规模,成千上万台的机器为这位初出江湖的年轻科学家,准备好了一展抱负的大好舞台。打好基础的平台充满各种可能,而主管给予肖文聪充分的探索空间,他一时不知如何发力。“放养”让这名急于证明自己的年轻人反而陷入了焦虑。


一日,肖文聪和团队伙伴在午餐时随口聊着,两人逐渐成为一个想法,一拍即合,旋即形成了一个完整的设计。设计评审会上,主管看了文档的开头,提出几个问题,肖文聪手指将鼠标滚轮向下滑动:“你问的问题,都在这儿了。”


技术构想如愿在阿里云成千上万的服务器规模上得到验证。主管又给了肖文聪们2个星期的脱产时间,专心写论文做实验,这让肖文聪更加确定自己选对了地方:“阿里除了能够广泛接触业务、让学术成果真正和业务结合而不是束之高阁外,主管对我们的学术也非常支持。”


这是肖文聪第一次脱离导师操刀论文。


8月的一个周六中午,暑气正盛。肖文聪把刚做好的蛤仔煎端上桌,拿起手机,发现有主管的4通未接电话。随后他得知,论文被顶级学术会议OSDI录用,这成为阿里云在系统领域学术会议上的突破。


“我给阿里做了一点微不足道的贡献,大概就每年省了一两个亿吧。”在杭州阿里云总部46楼,肖文聪的眼睛因为这句“狂言”不太好意思地弯了起来。这项技术让GPU显存利用率和GPU计算单元利用率分别提升了42%和34%,这意味着中小企业未来使用阿里云将能节省三成的成本。


和肖文聪的傲气不同,本硕期间参加网络安全领域中国际最高水平CTF竞赛的刘煜堃,在阿里收敛了他年少时作为“黑客”的攻击性,成为一名网络安全的“白帽子”网络安全的“守方”,意味着刘煜堃不仅仅要面对自身系统可能产生的bug,更要应对“恶意bugs”。


每天,阿里云都帮助客户抵御上万次黑客攻击。恶意如污水,寻找每一个细小的bug,利用裂缝企图入侵。


“云计算是非常重要的基础设施,是当今数字时代的中坚力量。阿里云的业务范围很广,我在阿里云做的一点改良,通过平台的乘数效应放大后,能够对这个社会提高更大的社会效率。”


2019年入职的26岁刘煜堃,遇到了“20岁”的阿里。那一天,他觉得,这是一群有梦想的人,在做有意义的事。


2019年年底,以刘煜堃为主要核心的阿里团队用3个月的时间完成“可信虚拟机产品的架构设计和研发”,并在内部灰度上线,即将于今年9月在公共云发布。此前,全球只有谷歌发布了类似产品。


“我们每一次抵挡住攻击,守护的是上千万的客户和亿万消费者。”1米85的大男孩挠了挠后脑,不好意思地说:“这话说起来虽然矫情,但这真的是我们的任务。安全就是胜利。”



他们期待“bug”

更让肖文聪兴奋的,是他所处于的无人之境。


“很多人做学术,往往是参考前人尚未涉足的某一个研究方面的领域,看看哪个维度还有缺口,就去把这个坑位占了。”而阿里,为肖文聪架了一座象牙塔通往真实世界的桥梁。“在阿里,我们了解真实场景里的痛点,为了真正解决用户的需求而创新,不是为了发论文而发论文,不是闭门造车。”


OSDI会议将在今年11月举行,肖文聪已经迫不及待开始着手下一个项目。“阿里的场景确实丰富,技术和理念也很前沿,我看到还有很多机会。”阿里还向浸淫学术十余年的肖文聪展示了真实世界的另一面——不是博士的同伴也能为传统意义上“根正苗红”的他以学术启发,在其他领域浸淫多年的人也可以对AI有深刻认识与远见。阿里的深度与广度,让肖文聪着迷。


余英豪的想法很朴素,即充分释放云计算的生产力,更快更多地为中小企业服务。选择工业界而非继续投身科研的他认为:“我既然选择了‘世俗’,那就要在最大的平台创造价值,去改善别人的生活,让这个世界更好。”


成长于严格家教的余英豪吝啬于夸奖自己,疫情期间他所在的阿里云为医疗机构免费提供科研算力,也进一步印证了这位本就热衷公益的大男孩的想法。这一次,他终于松了口:“我私心觉得,我和阿里做的东西对人们的生活还是有点改善的。”


2001年的中美黑客大战、2010年的“震网病毒”,让刘煜堃明白他这位“网络安全”守护者的角色。“做网络安全要先懂黑客攻击,这样才能做好防守。就像开锁匠,技能是一样的,善恶全在一念之间。


曾见过黑夜腥甜的刘煜堃或许更能理解罗曼·罗兰的那句话:世界上只有一种英雄主义,就是看清生活的真相之后依然热爱生活。而刘煜堃则更是直接说,他的工作正是“因为相信,所以简单”的写照。


一群年轻的科学家将阿里作为人生的新舞台,证明自己的能力和价值。有人将AI模型推理作业的GPU利用率提高3-5倍,让淘宝直播更流畅地和消费者分享美好;有人用AI还原老旧照片,让回忆更加清晰……


刘煜堃喜欢乔布斯的一句话:“Stay foolish and stay hungry(直译为“保持愚笨,保持饥渴”,意译为“虚心若愚,求知若饥”)。“愚笨”和“饥渴”是别人避之不及的bug,但刘煜堃主动寻求。


阿里能让他们感知“饥渴”和“愚笨”,也为他们的想法提供了试错的空间和最广阔的应用舞台。


善于用编程和逻辑去构建世界的肖文聪说,在阿里,他猜不到自己将会成长成什么样,会给世界带去怎样的改变,“虽然我不喜欢bug,但不得不承认,我期待它们。”



肖文聪、余英豪、刘煜堃都有一个共同的名字——“阿里星”。


阿里巴巴从2011年开启“阿里星”人才培养计划,在每年几十万工科毕业生大军中挑选最顶尖的人才。历经几轮面试、入选后业界牛人带队、年薪远超百万上不封顶……


一群初初走出校园的顶尖青年科学家,选择阿里巴巴成为他们职业生涯的第一站,在阿里全球化的平台和资源上,创造着世界级的影响力,去迎接bug,证明自我,改变世界。



-End- 

作者 | 顾山

统筹 | 张鹏霞

排版 | TAKA



投稿、投简历:newmedia@nfcmag.com

广告、商务合作: nfcnewmedia

推荐阅读