第三回:鹏城九章演天工玄奥 残差星火破混沌鸿蒙
诗曰:
辽海鲲鹏凌波起,负笈西渡剑气长。
神眸照影玉鉴澈,云阙推演九章彰。
薪传继晷开金匮,天工破壁铸龙章。
苍昊难留青鸟使,星陨天河泪化璜。
上回书说到吴恩达先生以教育普惠天下,推动AI浪潮席卷全球。此回,咱们将目光南移,聚焦于那颗璀璨的“东方之珠”——香港。此地不仅是国际金融贸易中心,亦是中西文化交汇之所,更在人工智能的兴盛时期,孕育出了一批杰出的华人精英和一段段师徒传承、共铸辉煌的动人故事。本回书的核心人物有三:一位是已故的商汤科技创始人,被誉为中国AI界一代宗师的汤晓鸥教授;一位是商汤科技的联合创始人,同样在学术与产业间游刃有余的林达华教授;还有一位,则是汤晓鸥教授的得意门生,以革命性的深度学习架构名震四海的何恺明博士。
先说这位汤晓鸥先生。汤公乃辽宁鞍山人氏,性情豪爽,才华横溢。早年毕业于中国科学技术大学这所英才辈出的高等学府,后远涉重洋,负笈求学,先在罗切斯特大学获得硕士学位,继而在一九九六年于人才济济的麻省理工学院(MIT)摘得博士桂冠,可谓学贯中西,根基深厚。学成之后,汤教授并未急于留美,而是选择来到香港中文大学执教,春风化雨,培育桃李。其间,亦曾短期供职于声名显赫的微软亚洲研究院(MSRA)。这微软亚洲研究院,位于北京,却辐射亚洲,广纳贤才,堪称华人AI精英的“黄埔军校”,后文中亦会提及多位出身于此的俊彦。
汤晓鸥教授一生潜心于计算机视觉研究,尤其在人脸识别技术领域,取得了奠基性的突破,堪称此领域的“开山鼻祖”之一。话说从二〇一四年六月起,他领导的团队犹如神助,接连发表了DeepID系列算法。这些算法如同拥有了火眼金睛,逐步将机器识别人脸的准确率提升至惊人的百分之九十九点五五,在某些特定的测试集上,其精准度甚至超越了训练有素的人类肉眼。这一成就,犹如一声号角,宣告人脸识别技术真正从实验室的象牙塔中走出,大踏步地迈向了广阔的实际应用场景,开启了一个全新的“刷脸”时代。DeepID的横空出世,也成为日后商汤科技创立的标志性事件与核心技术基石。
慧眼识珠,更要勇于开拓。汤晓鸥深知,真正的创新不能只停留在纸上谈兵。二〇一四年十月,他联合一批志同道合的学者与得意门生,在香港这片充满活力的土地上,创立了商汤科技(SenseTime)。公司甫一成立,便立下宏愿:“坚持原创,让人工智能引领人类进步”。凭借其在人脸识别、图像处理等领域独步天下的技术领先优势,商汤科技犹如一匹黑马,迅速在AI的赛道上脱颖而出。短短数年间,不仅发展成为亚洲地区收入最高的人工智能公司,更于二〇二一年末,在港交所成功鸣锣上市,创下了当时全球AI领域最大规模的首次公开募股(IPO)纪录,一时风光无两。为支撑其庞大的AI模型训练与应用需求,商汤还倾尽心血,打造了名为“商汤AI大装置SenseCore”的新型AI基础设施,意图构建AI时代的“发电厂” 。
然天道无常,世事难料。正当汤晓鸥教授意气风发,引领商汤迈向更高峰之际,噩耗传来。二〇二三年十二月十五日,为AI事业鞠躬尽瘁的汤晓鸥教授因病不幸辞世,享年仅五十五岁。一颗AI巨星的陨落,令整个中国乃至全球AI界扼腕叹息,悲痛不已。其母校香港中文大学和亲手创办的商汤科技,都将网站主页调为黑白,以示哀悼。汤公虽逝,然其“坚持原创”的精神不朽,其开创之事业,仍在激励着后人,尤其是他的学生们,秉承其遗志,在AI的漫漫征途上奋勇前行。甚至在他逝世后,于二〇二四年三月的商汤年会上,还通过AI技术“复活”了他的数字人形象,发表了演讲,令人唏嘘不已,亦展现了AI技术的另一种可能性。
任何一家伟大企业的崛起,都非一人之功,而是众志成城的结果。在商汤科技的创始团队中,林达华教授亦是举足轻重的人物,堪称汤晓鸥的左膀右臂。林教授同样出身于学术名门,二〇〇四年在中国科学技术大学获得学士学位,二〇〇六年在香港中文大学取得硕士学位,二〇一二年则在麻省理工学院获得计算机科学博士学位,与汤晓鸥教授亦有MIT的同门之谊。他不仅是商汤科技的联合创始人,还担任公司AI基础设施首席科学家及大模型首席科学家,同时也是香港中文大学信息工程系的教授,研究方向涵盖机器学习、数据科学和计算机视觉等多个前沿领域。林教授著述颇丰,发表高水平论文逾百二十篇,并曾在神经信息处理系统大会(NIPS 2010)上荣获最佳学生论文奖,学术功底可见一斑。他还积极投身AI教育普及工作,曾担任高中AI教材《人工智能基础》的执行主编,致力于培养下一代AI人才。林达华教授在商汤科技负责技术部署与AI基础设施的研发规划,同时在香港中文大学教书育人,这种产学研紧密结合的模式,正是香港地区乃至整个中国AI创新生态的一个生动缩影。
正所谓“名师出高徒,慧眼识英才”。在汤晓鸥教授的众多弟子中,何恺明博士无疑是最为耀眼的一颗明星,其光芒甚至在某些方面超越了业师。何恺明二〇〇七年毕业于清华大学这所中国顶尖学府,后进入香港中文大学攻读信息工程博士学位,师从的正是汤晓鸥教授。这段师承关系,是华人AI学术界知识传承与人才流动的一个生动写照,也为后来的ResNet传奇埋下了伏笔。
何恺明在学术上的天赋,早在其求学之初便已显露无遗。二〇〇三年,他在广东省高考中一举夺魁,是当年凤毛麟角的几位状元之一,足见其天资聪颖,卓尔不群。进入计算机视觉这一充满挑战与机遇的领域后,他更是如鱼得水,展现出惊人的创造力与洞察力。其最为世人所称道的旷世成就,便是作为主要创建者之一,于二〇一五年石破天惊地提出了残差神经网络(ResNet)。
话说在深度学习发展早期,研究者们普遍认为神经网络的层数越深,其表达能力就越强,模型性能也理应越好。然而,在实践中却发现一个令人困惑的现象:当网络堆叠到一定深度后,再盲目增加层数,反而会导致训练愈发困难,性能不升反降,这就是所谓的“网络退化”问题,犹如给一位武功高强的侠客强行灌输过多驳杂内力,反而会走火入魔。何恺明及其合作者(张祥雨、任少卿、孙剑)另辟蹊径,从信息传递的角度巧妙地引入了“残差学习”(Residual Learning)的思想,设计出ResNet架构。这种架构通过引入“快捷连接”(Shortcut Connections),允许网络中的信息“跨层跳跃”传递,极大地缓解了深度网络训练中令人头疼的梯度消失和梯度爆炸问题,使得构建数百层乃至上千层的超深神经网络从理论走向了现实。其二〇一六年在CVPR上发表的经典论文《用于图像识别的深度残差学习》(Deep Residual Learning for Image Recognition),犹如武林秘籍般被广为传阅,在谷歌学术的统计中,连续两年(二〇二〇年和二〇二一年)成为过去五年内被引用次数最多的研究论文,迄今引用已逾七十万次,足见其影响力之深远,堪称深度学习发展史上的一个里程碑。
ResNet的出现,不啻于深度学习领域的一场革命,它不仅极大地推动了计算机视觉技术的飞速进步,更成为后续诸多先进AI模型(包括大名鼎鼎的Transformer架构,乃至ChatGPT、AlphaGo Zero、AlphaFold等)的基础组件或重要灵感来源。何恺明也因此获得了无数荣誉,包括两次计算机视觉顶级会议CVPR的最佳论文奖(二〇〇九年、二〇一六年)、一次国际计算机视觉大会ICCV的最佳论文马尔奖(二〇一七年),并于二〇二三年与三位合作者共同获得了被誉为“中国诺贝尔奖”的未来科学大奖,以表彰其在引入深度残差学习方面对人工智能做出的基础性贡献。
博士毕业后,何恺明曾先后在微软亚洲研究院(MSRA)和Facebook人工智能研究院(FAIR,后更名为Meta AI)担任研究科学家,与众多顶尖学者切磋琢磨,佳作频出。如今,这位年轻的AI巨匠已受聘于麻省理工学院(MIT),担任电气工程与计算机科学系的终身副教授,继续在学术的最前沿探索未知,致力于通过计算机视觉和构建学习表示模型来开发通用且广泛适用的方法,以期用AI更好地理解和服务世界。
汤晓鸥教授、林达华教授与何恺明博士,他们或为师友,或共同创业,或传承学术衣钵,共同构成了香港乃至全球AI领域一道亮丽的风景线。汤公以DeepID技术为基石,创立商汤帝国,将人脸识别这一特定AI能力成功商业化,展现了学术突破转化为产业优势的巨大能量。而其高徒何恺明,则以ResNet这一更为基础性的架构创新,为整个深度学习领域添砖加瓦,其影响更为广泛深远,润物无声。这两种类型的创新,一种是应用的尖兵,披荆斩棘;一种是基础的磐石,固本培元,皆从香港中文大学这一学术沃土中孕育而出,足见学术传承与创新环境之重要。
然而,正如古人云“福兮祸所伏,祸兮福所倚”,AI技术的飞速发展,也带来了新的挑战与争议。商汤科技在取得巨大商业成就的同时,也因其技术被指用于某些地区的监控活动,而面临美国的制裁,股价亦曾大幅波动。这凸显了先进AI技术固有的“双刃剑”属性,以及围绕其应用(尤其是在安全监控等敏感领域)日益升级的地缘政治博弈和伦理拷问。此事亦警示世人,技术本身虽无善恶之分,然其应用之道,却关乎人类福祉与社会公正。如何在创新与责任之间取得精妙的平衡,是所有AI从业者必须时刻警醒、深思熟虑的课题。
正是:
溟鹏振翼溯风流,烛照瀛寰十二楼。
金绳玉策传薪火,铁划银钩勒鼎猷。
残星补阙天机破,巨舰劈波宿雾收。
潮汐岂因蚌珠止,扶摇九万正抟秋。
汤晓鸥、林达华、何恺明等人的故事,展现了香港在AI浪潮中的独特地位与非凡贡献。然中华大地,卧虎藏龙,AI领域的传奇,远不止于此。
下一回,我们将目光转向内地,看一位图灵奖得主如何毅然归国效力,于清华园内播撒智慧火种,培育国之栋梁;又有一位年轻的掌舵人,如何引领科技巨轮,在智能时代劈波斩浪,勇立潮头。
正是“赤心巨擘衔桑梓绛帐传薪分紫白·玄霜司舵砺鲸波璇玑焕斗领风骚”。
欲知后事如何,且听下回分解。

留下评论