第四回:清华智谱 阶跃多模 三英破阵 各有奇谋
上回书说到字节、阿里两大巨头凭借深厚家底,在AI战场上各领风骚。然长江后浪推前浪,世上新人换旧人。在这片AI“红海”之中,亦有数家新锐势力,凭借其独特的“独家秘籍”,试图打破巨头环伺的格局,闯出一片新天地。此回书,便要细说深度求索、智谱AI与阶跃星辰这三位“破局者”的传奇。
深度求索:效率为刃,破算力垄断
前文已详述深度求索凭借“性能天花板、价格地板”的DeepSeek系列模型,以及在芯片管制前瞻性布局“萤火二号”万卡A100算力集群的远见,一举成名,震撼中外。此处需再次强调其战略核心——“以效率打破算力垄断”。当众多豪强还在为争抢更先进、更稀缺的GPU资源而苦恼时,深度求索另辟蹊径,通过极致的算法创新与工程优化(如其V3模型采用的MLA、DeepSeekMoE架构及无辅助损失函数负载均衡策略等),在既有算力基础上挖掘出惊人潜力。其大胆采用的开放权重策略,更是激活了整个行业的创新氛围,证明了在AI的江湖里,并非只有资本雄厚者方能称霸一方,凭借智慧与勇气的精妙结合,同样能够开辟出一条通往巅峰的道路。深度求索的故事,昭示了技术革命中“小而美”的灵活性与“锋利匕首”般的破局力量。
智谱AI:学府底蕴,稳扎稳打亦称雄
清华知识工程一脉承,GLM架构早开源
有道是“将门虎子,书香传家”,智谱AI这家公司,便带有浓厚的“学府气质”。其技术血脉,与声名卓著的清华大学知识工程实验室(KEG)紧密相连,可谓师出名门,根基深厚。公司自二〇一九年成立以来,便坐落于清华科技园内,据闻其办公室的黑板上,时常留有尚未推演完毕的复杂数学公式,一派严谨治学的科研氛围。
智谱AI在算法模型的积累上起步甚早,自研的GLM(General Language Model)架构及其系列模型,在国内大模型领域独树一帜。早在二〇二三年,当“百模大战”初起之际,智谱便率先开源了国内第一个聊天对话大模型ChatGLM-6B,为推动国内AI社区的早期发展起到了积极作用。进入二〇二五年,智谱AI更是宣布将其320亿参数和90亿参数规模的GLM系列模型(包括基座模型、推理模型和创新的“沉思模型”)进行开源,并遵循对商业友好的MIT许可协议,供全球开发者免费使用和自由分发。其GLM-Z1-Rumination-32B-0414“沉思模型”,更是代表了智谱对AGI未来形态的探索,该模型能够整合搜索工具,进行多步骤的深度思考,以解决高度开放和复杂的问题,其能力获得了业界的高度关注。
中文语料库精深,融资数十亿备粮仓
在AI三要素的构建上,智谱AI亦有其独到之处。
数据层面:依托清华大学强大的科研实力和学术资源,智谱AI在构建高质量中文语料库以及专业领域知识数据方面,具备天然的优势。这为其模型能够更深刻地理解中文语境、更精准地把握本土化需求,奠定了坚实的基础。
算力与资本层面:虽然智谱AI并未公开其算力集群的具体规模,但其持续获得国内外顶级投资机构和国家级战略基金的青睐与注资,总融资金额已高达数十亿元人民币。例如,优刻得(UCloud)便为其提供了超过3000 PFLOPS的算力支持。近期,北京市人工智能产业投资基金再次向智谱AI(Z.ai)增资2亿元人民币,同时,智谱旗下的Z Fund亦宣布将投入3亿元人民币,用于支持全球AI开源社区的发展。这源源不断的雄厚资本,无疑为智谱AI的技术研发、人才招募和市场拓展备足了“粮草”,使其能够心无旁骛地向着AGI的远大目标迈进。
IPO号角已吹响,资本市场竞风流
值得注意的是,智谱AI已成为国内首批正式启动IPO(首次公开募股)辅导备案的大模型创业公司之一。二〇二五年四月十四日,智谱AI在北京证监局办理了上市辅导备案,由中金公司担任其辅导机构,计划登陆国内A股市场。此举标志着智谱AI在稳步推进其商业化和资本化进程,意图借助资本市场的力量,为公司的长远发展再添新翼。智谱AI所选择的道路,是“依托顶尖高校的科研底蕴进行持续的技术研发,同时稳健地推进商业化落地和资本化运作”。其发展历程表明,在资本密集、竞争激烈的AI赛道上,稳健扎实的步伐同样能够在日新月异的竞赛中脱颖而出,跑赢市场。
智谱AI的发展模式,充分体现了深厚学术研究与产业实践相结合的力量。其源于顶尖学府的科研基因,确保了其在核心技术上的持续创新能力;而其早期且坚定的开源策略,则为其赢得了广泛的开发者社区支持和市场认知度。这种“学院派”的稳健打法,辅以充足的资本弹药和清晰的上市规划,使其成为中国AI大模型领域一支不可忽视的重要力量。
阶跃星辰:多模为帜,剑指AGI未来
姜大新多模信念坚,六日六模迭代忙
在AI江湖的众星之中,阶跃星辰(StepFun)这家公司,由前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大新博士挂帅创立。姜大新博士对于人工智能的未来,抱有一个坚定的信念,他认为:“多模态的理解与生成技术必将走向统一,这是通往通用人工智能(AGI)的必由之路。” 为了践行这一理念,阶跃星辰虽然行事风格相对低调,但其内在的雄心壮志却不容小觑。
在过去两年间,阶跃星辰已累计发布了二十二个不同类型的AI模型;进入二〇二五年,更是创下了“六日之内连续发布六个模型”的惊人记录,其迭代速度之快,令人瞩目。这一系列紧锣密鼓的动作,无不围绕着其核心战略——“原生多模态”——进行全面的技术布局和产品矩阵构建。其Step系列模型,涵盖了从Step-1X文生图模型、Step-1V千亿参数视觉识别大模型,到Step-1.5V-mini视频理解大模型、Step-tts-mini文生音频大模型,再到Step-asr语音识别大模型等,构成了一个功能全面的多模态技术矩阵。
原生多模布全局,产业携手探具身
为实现其宏大的多模态技术蓝图,阶跃星辰广纳贤才,邀请了多位深度学习领域的顶尖专家出任公司的首席科学家和关键系统负责人。其内部制定的AGI技术实现路线图,概括为“模拟世界、探索世界、归纳世界”三大阶段,体现了其对AGI路径的深邃思考。
阶跃星辰的雄心并不仅仅局限于模型本身的研发,他们更积极地将技术推向实际应用,与各行各业的领军企业展开深度合作。其合作伙伴遍布汽车制造(如吉利汽车)、智能手机(如OPPO)、机器人(如追觅科技、智元机器人)、智能终端、新零售(如茶百道、瑞幸咖啡)乃至金融传媒(如界面财联社)等多个领域。通过这些合作,阶跃星辰正在积极探索其多模态大模型在智能座舱语音交互(如SAP Audio模型)、手机端AI智能助手、具身智能机器人、各类智能终端以及金融风控与内容生成等场景下的落地应用。例如,其与原力灵机(Yuanli Lingji)的合作,旨在赋予机器人更强的跨场景、跨任务的泛化能力和自主纠错能力,推动具身智能的发展。其先进的Step1X-Edit图像编辑模型,结合了多模态大语言模型(MLLM)与扩散图像解码器(DiT)架构,也已在阿里云PAI等平台开放,展现了其在专业图像编辑领域的卓越性能。
阶跃星辰的整体战略思路,更偏向于“打后期”,即着眼于长远的技术突破和未来市场的领导地位。他们以聚焦多Agent(智能体)系统的超前技术视野,结合自身在独特多模态数据(如视频、音频、3D数据等)上的积累,与产业伙伴紧密协作,共同探索“具身智能”的商业化落地路径。这家被视为“未来主义者”的公司,正手握着一块块多模态技术的拼图,朝着通用人工智能的终极目标加速奔跑。阶跃星辰的探索告诉我们,原生多模态技术,以及在此基础上构建的智能体系统,可能是通往AGI圣杯的核心选项之一。这三家新锐公司的故事,共同揭示了国产大模型产业未来发展的三个重要方向:深度求索证明了算法效率的极致追求能够打破对顶级算力的绝对依赖;智谱AI的历程显示了依托科研底蕴、稳健发展同样能在资本和市场的双重竞赛中胜出;而阶跃星辰的执着则指明了原生多模态技术可能是通向通用人工智能(AGI)的关键路径。当行业巨头在平台层和通用应用层展开激烈厮杀时,这些充满活力的新锐力量,正以各自独特的方式,不断拓展着中国AI技术探索的边界和可能性。真正的技术革命,从来不是一家独秀的 монолог,而是百花齐放、百家争鸣的协奏曲。
表一:国产大模型五强核心秘籍一览
正是:
新锐破阵显奇才,各执利器登高台。
休叹征途缺知己,四海谁人不服君。
欲知其他诸侯沉浮,且听下回分解。

留下评论