《中华AI演义·英雄人物谱》(十)

 

第九回:沥血十年,智源初成“悟道”业;秉心一片,清华丕显“顶天”功

诗曰:

清华才俊领风骚,悟道宏图志气高。

万亿玄机藏慧谷,十年磨砺铸龙韬。

图谱融通开境界,智能探索任逍遥。

智谱光华耀寰宇,产学同心赋新谣。

上回书说到北京大学的朱松纯教授倡导中国AI发展应另辟蹊径,强调认知与叙事。本回,咱们将目光再次投向清华大学,聚焦另一位在中国人工智能领域举足轻重的人物——唐杰教授。他不仅在学术上成就斐然,更是成功领导团队研发出中国首个万亿参数级别的大型AI模型“悟道”,并将其成果产业化,创立了“六虎”之一的智谱AI。

唐杰教授,清华大学计算机科学与技术系教授,鬓发微霜,然目光炯炯,言谈间透着一股学者的儒雅与工程师的干练。他亦是北京智源人工智能研究院(BAAI)的学术副主任,同时担任智谱AI的联合创始人兼首席科学家。其人生轨迹,恰似一幅浓墨重彩的画卷,将象牙塔内的精深研究与产业界的波澜壮阔,巧妙地融为一体。

时光回溯至二〇二〇年仲夏,大洋彼岸OpenAI的GPT-3横空出世,其展现出的强大能力,犹如一声惊雷,震动了全球AI界。彼时,国内大模型研究尚处于起步阶段,与国际先进水平差距明显。智源研究院的会议室内,灯火彻夜通明。唐杰与团队骨干围坐一起,气氛凝重。有人忧心忡忡:“GPT-3参数之巨,能力之强,我等望尘莫及,几近绝望矣!” 唐杰默然片刻,目光扫过众人疲惫而焦虑的面庞,沉声道:“昔日王选先生于困厄之中,研制汉字激光照排,不也曾面临泰山压顶之势?外国人可以做的,我们中国人亦可以!18此刻退缩,则永无赶超之日!”他深知,此役关乎中国在AI浪潮中的未来。

当年十月,智源研究院果断启动“百人大模型计划”,唐杰临危受命,担纲项目总负责人。北京市亦高瞻远瞩,大力支持,从专项经费中拨出巨资,为项目购置了高达千P的算力资源。这支肩负特殊使命的团队,以“悟道”为统一代号——此名既谐音清华大学所在的“五道口”,亦寓意深远,寄托着对人工智能大道至理的探求与顿悟。一时间,清华园内外,无数科研人员夜以继日,向着那看似遥不可及的目标奋力冲刺。唐杰更是身先士卒,办公室的灯光常常亮至凌晨。他时而在白板前反复推演“askmo1”等创新算法,时而与团队成员激烈讨论技术瓶颈,其“十年磨一剑”的坚韧与“利他之心”的驱动,感染着每一位参与者。

终于,在二〇二一年,历经无数不眠之夜与艰苦攻关,“悟道2.0”横空出世!此模型以高达一点七五万亿的参数量,一举成为当时全球规模最大的自然语言处理AI模型15,打破了西方国家在该领域的垄断,极大地提振了中国AI界的士气与信心。发布会上,唐杰站在聚光灯下,神情中既有成功的喜悦,亦有对未来的深思。他深知,这只是万里长征的第一步。面对市场上“烧钱”的质疑与对未来发展路径的议论,他坦然回应,坚信其长远价值。

“悟道”模型的研发成功,不仅是中国在超大规模AI模型领域的技术突破,更是国家层面战略投入与顶尖学府科研实力相结合的硕果。清华大学作为中国AI研究的重镇,拥有深厚的技术积累和人才优势,为“悟道”的诞生提供了坚实的土壤。为了将“悟道”等先进技术进一步发扬光大并推向市场,唐杰教授及其核心团队随后创立了智谱AI公司,这便是前文书第五回中提到的“京华六虎”之一,由张鹏担任CEO的那家公司。智谱AI致力于实现大模型生成AI的全链路自主可控,专注做大模型的中国创新。

唐杰教授的学术贡献,远不止于“悟道”模型。早在二〇〇六年,他就创建了名为AMiner(早期称ArnetMiner)的科技情报分析与挖掘系统15。这是一个面向全球科研人员的数据库和多语言数据挖掘工具,能够自动整合海量学术论文、学者信息、专利数据等,构建起庞大的学术知识网络,为科研人员提供了极大的便利。AMiner系统因其持续的创新与广泛应用,获得了数据挖掘领域顶级会议SIGKDD颁发的时间检验奖(Test of Time Award),足见其学术价值与深远影响15。

到了二〇一三年,唐杰教授又创建了XLORE项目,这是全球首个中英双语的跨语言知识图谱33。在当时,人工智能的研究与应用大多以英文语料为中心,这不仅可能导致AI模型对其他语言文化的理解存在偏差,也限制了AI技术在全球范围内的普惠性。XLORE的出现,旨在解决这种英文AI的偏见问题,为构建更加公平、包容的多语言智能系统迈出了重要一步。

唐杰教授怀抱着一个宏大的使命——“教会机器像人类一样思考”。这与智谱AI的使命宣言如出一辙。他认为,下一代的人工智能工具,将不再仅仅是单一功能的模型,而是能够整合预训练语言模型、大规模知识图谱以及逻辑推理能力的综合性智能体,从而生成与人类一样甚至超越人类的有意义内容。

对于当前火热的大型语言模型,唐杰教授亦有其冷静的思考。他虽然肯定LLM的强大能力,但也指出,目前的LLM尚“不足以复制人脑的认知机制”,在真正的理解、推理和创造性方面,仍有很长的路要走。他认为,AGI之路还很漫长,未来的更大挑战在于理解人类认知到底是如何运作的。因此,他主张需要更深入地探索受生物启发的AI路径,从人脑的结构与功能中汲取灵感,这与朱松纯教授的某些观点不谋而合,都显示出中国顶尖AI学者对超越纯粹规模化路径、追求更高层次智能的共同关切。

“悟道”模型的发布,以及基于“悟道”技术诞生的中国首位原创虚拟学生“华智冰”,都充分展示了中国在大型模型研发和通用人工智能探索方面的雄心与创新能力。而唐杰教授对LLM局限性的清醒认识,以及他对知识图谱和逻辑推理重要性的持续强调,则表明他更倾向于一条将数据驱动与知识驱动相结合、更偏重认知能力的AGI发展路径。这种对AI深层认知机制的探索,可能为未来AI发展提供新的突破口,并有助于解决当前大型模型面临的一些固有挑战,如“幻觉”现象和可解释性差等问题。

清华大学在AI人才培养方面亦是硕果累累。前文书提到的月之暗面创始人杨植麟,在清华大学攻读本科学位期间,便曾师从唐杰教授。这种师生相承、薪火相传的学术氛围,正是清华AI实力不断壮大的源泉之一。

唐杰教授这种身兼数职,在学术界引领前沿研究,在研究院所组织重大攻关,又在产业界创办领军企业的“多面手”角色,正是中国AI领域产学研紧密结合、高效协同的一个缩影。他既是象牙塔中的博学鸿儒,又是运筹帷幄的科研统帅,还是搏击商海的创业先锋。这种独特的身份组合,使得基础研究的火花能够迅速点燃产业应用的燎原之火,而产业实践中遇到的真实问题,又能反过来为学术研究提供新的方向与课题。这种良性循环,极大地加速了中国AI技术的迭代与落地。

正是:

悟道功成惊四座,智源星火已燎原。

十年沥血铸神算,一片冰心向昊天。

图谱千寻联万象,模型百炼启新元。

莫愁前路多艰险,自有英才续锦篇。

唐杰教授以其在大型模型、知识工程领域的深厚造诣和卓越领导力,为中国AI的发展立下了汗马功劳。然AI大厦之构建,不仅需要聪慧的“大脑”(算法与模型),更需要坚实的“躯干”(硬件与芯片)。

下一回,我们将聚焦一位致力于为中国AI打造强大“中国芯”的年轻才俊——寒武纪科技的创始人陈天石。正是“铸芯托起强国梦,寒武纪元力擎天”。欲知陈天石如何攻坚克难,打造国之重器,且听下回分解。



留下评论