第五回:六虎灵枢破天机 硅基灵境演神通
诗曰:
京华沪上起苍黄,六骏嘶风战未央。
开复重挥金戈日,零一擎帜向天阊。
智谱深耕承绛帐,百川星聚焕龙光。
面壁九章藏机杼,潜鳞蓄势待云骧。
上回书说到图灵奖得主姚期智院士归国执教,为中国AI奠定理论基石;字节跳动新帅梁汝波引领应用潮流,豆包AI声名鹊起。本回,咱们将视线聚焦于中国人工智能领域最具活力的创新腹地——首都北京。近年来,随着ChatGPT的横空出世,全球掀起了一股大型语言模型(LLM)的研发狂潮。在这场浪潮中,一批专注于LLM的中国初创企业如雨后春笋般涌现,它们以其颠覆性的技术、灵活的机制和雄厚的资本,搅动着AI江湖的风云,被业界誉为“AI六虎” 1。这些企业及其背后的领军人物,正展开一场群雄逐鹿般的激烈竞赛,欲在这方兴未艾的大模型时代拔得头筹,重塑未来。本回书,便要为列位看官细数这“京沪六虎”的英雄谱,看他们如何各显神通,逐鹿中原。
“AI六虎”逐鹿京沪,各领风骚

李开复 (Kai-Fu Lee) – 零一万物 (01.AI) 老将新征再铸传奇
说起李开复博士,在华人科技界乃至全球AI领域,可谓是无人不知,无人不晓的泰斗级人物。他祖籍四川,一九六一年生于台湾,后负笈美国,在哥伦比亚大学获得计算机学士学位,继而在卡内基梅隆大学(CMU)师从图灵奖得主拉吉·瑞迪,并于一九八八年获得计算机科学博士学位,其博士论文研究的便是早期的语音识别系统。其职业生涯波澜壮阔,犹如一部浓缩的现代科技发展史,先后在苹果、SGI、微软、谷歌等国际顶尖科技公司担任要职,指点江山,激扬文字。
在微软任职期间,他一手创办了声名远播的微软亚洲研究院(MSRA),广纳贤才,悉心培养,为中国乃至亚洲输送了大批AI领域的顶尖人才,堪称华人AI的“黄埔军校”,桃李满天下,影响深远。之后,他又临危受命,创立谷歌中国,筚路蓝缕,以启山林,开启了谷歌在华的新篇章,虽历经波折,却也留下了浓墨重彩的一笔。离开谷歌后,李开复华丽转身,投身风险投资领域,创办“创新工场”,以其敏锐的商业嗅觉和深厚的技术洞察,扶持了众多科技初创企业,慧眼识珠,点石成金,成为中国科技创业浪潮中一位重要的“引路人”与“赋能者”。
岁月流转,初心不改。当人工智能的浪潮再次汹涌而至,特别是大型语言模型展现出改天换地的惊人潜力之时,这位在AI领域浸淫数十载的科技界“老兵”,再次按捺不住内心的激动与创业的激情。二〇二二年,已年过花甲的他,毅然重披战袍,创立了“零一万物”(01.AI),誓要在AI 2.0时代再创辉煌,并迅速跻身“六虎”之列,其雄心壮志,可见一斑 1。零一万物最初亦曾雄心勃勃,致力于构建参数量巨大的基础模型,欲与OpenAI等国际巨头一较高下。然李开复凭借其在产业界数十年的深厚积累与对市场趋势的精准判断,很快便审时度势,调整战略,将重心转向更具商业价值、更易落地的行业特定应用,并选择与阿里巴巴、DeepSeek等拥有强大基础模型能力的伙伴合作,以期“站在巨人的肩膀上”,更快地将AI技术转化为生产力。
李开复对AI的未来发展,常有独到且深刻的见解,其言论往往能引发业界的广泛思考。他曾预言,全球AI领域将经历一场“大浪淘沙”般的洗牌,最终在中美两国都只会剩下少数几个实力超群、生态完善的主导性AI模型提供商。他更语出惊人地指出,美国对华的芯片制裁,在某种程度上反而“无意中帮助”了中国AI产业。因为外部的巨大压力,迫使中国AI公司不得不在资源相对匮乏、芯片性能受限的情况下,绞尽脑汁进行创新,从而锤炼出更高的算法效率和更优的成本控制能力,例如在模型训练和推理成本上,中国公司往往能做到显著低于西方同行。此番言论,虽有争议,却也一针见血地揭示了中国AI企业在逆境中求生存、求发展的独特韧性与“倒逼式创新”的现实。他还敏锐地观察到,风险投资的焦点正从耗资巨大、研发周期漫长的开创性基础模型,转向AI基础设施、面向特定场景的应用型公司以及能够直接为企业和消费者创造价值的具体应用。这种由“重”向“轻”,由“基础”向“应用”的战略转变,或许正预示着AI产业从技术探索期迈向价值实现期的必然路径。
张鹏 (Zhang Peng) – 智谱AI (Zhipu AI) 清华智种绽放异彩
智谱AI,这家公司的血脉里,深深烙印着中国顶尖学府清华大学的基因。其核心技术与创始团队,皆源自清华大学计算机系的知识工程实验室(KEG),可谓是“学院派”创业的典范之作。公司的首席执行官张鹏,便是清华大学计算机系的毕业生,而其联合创始人兼首席科学家,则是大名鼎鼎的唐杰教授(我们将在后续章节中为唐教授单独立传,详述其学术贡献与“悟道”传奇)。
智谱AI自二〇一九年成立以来,便专注于研发先进的大型语言模型和多模态AI应用,致力于服务于广大的消费者和企业级用户,力求“教会机器像人类一样思考” 。公司推出的一系列产品,如开源的端到端语音大语言模型GLM-4.0,能够实现高度拟人化的流畅交互,并支持用户自定义音色、情感乃至各地方言,仿佛一位善解人意的智能伙伴,令人耳目一新。此外,拥有高达1300亿参数的代码生成模型CodeGeeX,能够辅助程序员高效编程;文本到图像生成模型CogView,则能将文字描述化为生动逼真的图像;而由语音指令驱动的AI代理AutoGLM,更是展现了智谱AI在技术上的全面布局与深厚实力。AutoGLM的Rumination代理甚至免费提供给公众使用,可用于深度研究、网络搜索、旅行规划乃至辅助撰写研究报告等复杂任务,颇具实用价值,也体现了智谱AI推动AI普惠的决心。
凭借其源自清华的领先技术、清晰的商业路径以及强大的执行团队,智谱AI获得了包括阿里巴巴、腾讯等互联网巨头以及社保基金、地方政府背景基金等“国家队”资本的大力支持,融资额度可观,估值已超过二十八亿美元,并已启动IPO辅导,有望成为“AI六虎”中率先登陆资本市场的成员。其API接口的收入在二〇二四年更是实现了超过三十倍的惊人同比增长,发展势头之迅猛,令人侧目。智谱AI的成功,不仅是一家企业的崛起,更是中国高校科研成果高效转化、服务国家战略与市场需求的生动案例,这种将学术象牙塔中的智慧火花,迅速转化为市场上熊熊燃烧的商业烈焰的模式,正是中国AI产业快速崛起的一个重要特征。
王小川 (Wang Xiaochuan) – 百川智能 (Baichuan AI) 搜狗老将再谱新篇
王小川,这个名字在中国互联网的搜索江湖中,曾代表着一股坚韧不拔、持续创新的力量。如今,这位昔日的搜狗掌门人,也已全身心投入到波澜壮阔的AI大模型浪潮之中,欲再创一番事业。他一九七八年出生于四川成都,自幼便展现出超凡的数理天赋,十四岁便获得全国高中数学竞赛一等奖,十七岁更是在国际信息学奥林匹克竞赛(IOI)中勇夺金牌,被直接保送至清华大学计算机系,并在此完成了学士、硕士及博士学位,可谓是根正苗红的“清华系”技术领袖。年仅二十七岁,便出任搜狐首席技术官,后临危受命,创立搜狗并长期担任CEO,将搜狗从巨头环伺的夹缝中,一步步打造成中国互联网市场的一支重要力量,其“三级火箭”战略和输入法、浏览器、搜索的联动,至今仍为业界称道。
二〇二一年,随着搜狗被腾讯并购,王小川功成身退,从搜狗CEO任上卸任。经过短暂的休整与思考,这位永不满足的创业者,于二〇二三年四月,以雷霆万钧之势创立了“百川智能”,目标直指“中国的OpenAI”,并迅速集结了一支由来自搜狗、谷歌、腾讯、百度、华为、微软等国内外顶尖科技公司的精英组成的豪华团队。百川智能甫一成立,便展现出惊人的“百川速度”,在短短一年时间内,接连发布了超过十二个大型语言模型,既包括Baichuan-7B、Baichuan-13B等广受欢迎、性能优异的开源模型,为社区贡献力量;也包括能力更为强大、针对特定场景优化的闭源专有模型如Baichuan4。其推出的聊天机器人“百小应”,以其卓越的搜索增强能力和知识问答水平,赢得了用户的广泛好评,也展现了王小川将搜索技术与大模型能力巧妙结合的深厚功力。
百川智能的战略,并非盲目追求模型参数的庞大,而是更侧重于将AI技术与实际应用场景深度融合,尤其是在医疗、教育和金融等关乎国计民生的关键领域,寻求AI驱动的解决方案。王小川曾表示,他希望利用AI来解决诸如全球医生短缺这样的系统性问题,展现了科技领袖的社会责任感与远大抱负。
凭借王小川在业界的深厚积累与个人魅力、清晰的战略定位以及团队高效的执行力,百川智能迅速获得了市场的高度认可。在二〇二三年十月和二〇二四年七月,公司接连获得巨额融资,估值高达二十七亿美元,成为全球最快达到独角兽级别的AI初创公司之一,其投资者名单中亦不乏阿里巴巴、腾讯、小米等行业巨头与顶级VC的身影。王小川本人也因其在AI领域的卓越贡献,于二〇二四年被美国《时代》杂志评为全球最具影响力的AI人物之一。这位经验丰富的连续创业者,正以其成熟的商业运作和对AI技术的深刻理解,在激烈的市场竞争中劈波斩浪,引领百川智能驶向更广阔的蓝海。
杨植麟 (Yang Zhilin) – 月之暗面 (Moonshot AI) 长文破壁逐梦AGI
在“六虎”之中,月之暗面(Moonshot AI)的创始人杨植麟,堪称是一位年少有为、锐气十足的“技术极客”型领军人物。他拥有令人艳羡的辉煌学术背景:本科毕业于清华大学“姚班”,师从的正是前文书提到的唐杰教授,可谓名师高徒,与智谱AI亦有同门之谊 1。后远赴大洋彼岸,在人工智能领域的另一重镇——卡内基梅隆大学(CMU)计算机学院深造,并获得博士学位,其导师包括机器学习领域的大牛Ruslan Salakhutdinov和William W. Cohen,学术血统纯正。在创立月之暗面之前,杨植麟已在Meta AI研究院(FAIR)和Google Brain等国际顶尖AI研究机构积累了宝贵的科研经验,并对Transformer-XL等核心AI技术做出了重要贡献,是业界公认的青年才俊。
二〇二三年三月,杨植麟联合另外两位CMU校友周昕宇、吴育昕,共同创立了月之暗面(公司英文名Moonshot AI,灵感来源于杨植麟钟爱的Pink Floyd专辑《The Dark Side of the Moon》)。公司从一开始便展现出与众不同的技术追求,将焦点精准地放在了大型语言模型的一个关键且极具挑战性的技术方向——长文本处理能力上 1。同年十月,月之暗面石破天惊地推出了其旗舰产品Kimi Chat(Kimi是杨植麟的英文名),这款AI智能助手一经问世,便以其能够处理长达二十万汉字的超长文本输入能力,震惊了业界,在文档分析、报告总结、长篇小说理解、海量代码阅读等复杂场景中展现出巨大优势,一举奠定了其在该细分领域的领先地位 1。二〇二五年一月,月之暗面更是乘胜追击,推出了更为强大的Kimi 1.5版本,在短链式思维(CoT)等多个权威基准测试中取得了业界领先的性能,甚至在部分关键指标上显著超越了GPT-4o和Claude 3.5 Sonnet等国际顶尖模型,性能提升幅度高达惊人的百分之五百五。
杨植麟对AI的未来有着清晰而坚定的判断,他认为通过微调(fine-tuning)最终能够超越基础模型的性能,而用户数据的规模化效应最终也将超越基础模型本身的重要性。他坚信,基于Transformer概率模型的基本原理,只要拥有足够长的上下文处理能力(他甚至曾畅想过“十亿上下文长度”的未来),当前AI面临的许多瓶颈问题都将迎刃而解,并最终导向通用人工智能(AGI)这一终极目标。他将计算能力、模型架构(可扩展性、通用性)和数据并列为AI生产力的三大核心要素,并视AGI的实现和优秀的产品体验为团队共同的终极追求。他曾说:“如果上下文长度能达到十亿,今天的问题将不再是问题。” 59 这份对技术路径的执着与对AGI的信仰,驱动着月之暗面在长文本领域不断深耕。
凭借其在长文本处理领域的独特优势和杨植麟本人的技术魅力与清晰愿景,月之暗面迅速吸引了资本市场的热烈追捧。二〇二四年二月,公司完成了由阿里巴巴领投,红杉中国、小红书等知名机构跟投的超过十亿美元的B轮融资,同年八月又额外获得了三亿美元融资,公司估值飙升至三十亿美元,成为AI领域炙手可热的独角兽企业。杨植麟及其月之暗面,正以其在特定技术点上的深度突破和对AGI的执着追求,为中国AI初创企业在激烈的全球竞争中开辟出一条差异化发展、追求极致技术的新路径。
闫俊杰与MiniMax,姜大昕与阶跃星辰- 潜龙在渊待时飞,多模态中觅玄机
在“AI六虎”的名单中,还包括由闫俊杰领导的MiniMax(成立于二〇二一年,或与游戏巨头米哈游有渊源,专注于多模态AI解决方案与AIGC内容生成)以及由姜大昕掌舵的阶跃星辰(StepFun/StepStar AI)。然则,关于这两位才俊及其企业的详细事迹与具体打法,目前公开的资料尚不如前四家那般详尽明朗。
我们仅知MiniMax在多模态AI的融合探索上颇有建树,致力于打造通用大模型,并在游戏、社交等场景积极探索AI的落地应用,其技术实力不容小觑,但行事风格相对低调。而阶跃星辰,作为AI大模型领域一股不可忽视的新生力量,其创始团队背景与技术路径,更添几分神秘色彩,业界对其未来潜力亦抱有期待。
正所谓“神龙见首不见尾,潜龙在渊待时飞”。这两家企业及其领导者,或许正如武侠小说中的隐世高手,正在某个不为人知的角落,潜心修炼内功,精心打磨其“神兵利器”,一旦时机成熟,便会一鸣惊人,技惊四座,在AI江湖中掀起新的波澜。他们的故事,尚待时间来书写,吾辈亦将拭目以待,静候佳音。
这京沪六虎,或有深厚背景,师出名门;或有草根传奇,白手起家。或长袖善舞于资本市场,运筹帷幄;或埋首钻研于技术前沿,精益求精。他们共同的特点,是年轻、有活力,对AI的未来充满无限憧憬与坚定信念,并勇于投身这场充满机遇与挑战的伟大变革。而今正在大变革时代,AI的高速发展和市场的瞬息万变,让他们也面临巨大的挑战,无论是否能走到最后,他们之间的竞争与合作,正共同推动着中国大型语言模型技术应用的迅速落地,为全球AI的多元化格局贡献着中国智慧。
正是:
六虎当年气贯虹,而今沙场见雌雄。
开复折戟犹磨剑,智谱登科已挂弓。
百川倒峡惊涛在,月暗藏锋斗柄空。
他年若问兴亡事,半是麒麟半是虫。
这“六虎”的故事,只是中国AI产业蓬勃发展的一个缩影。在他们之外,还有更多默默耕耘的创新者与追梦人。
下一回,我们将目光转向两位在开源AI领域掀起巨大波澜的人物,一位是DeepSeek(深度求索)的创始人梁文锋,他以极致的成本效益和坚定的开源策略,在全球AI界投下了一颗重磅炸弹,引发了“AI斯普特尼克时刻”的惊叹;另一位则是面壁智能的李大海,他亦在开源之路上奋力求索,欲与群雄逐鹿问鼎,共建开放智能生态。
正是“开源风潮起东方,双雄逐鹿战鼓擂”。
欲知详情如何,且听下回分解。


留下评论