中华AI演义:模型风云录(三)

第三回:字节舞刀阿里铸剑 双雄并立各显其能

上回书说到深度求索异军突起,以“性价比”奇兵震撼业界。然则AI江湖,岂容一骑绝尘?早已深耕此道的互联网巨头们,亦非等闲之辈。此回单说字节跳动与阿里巴巴这两大巨头,面对AI浪潮的汹涌来袭,如何各显神通,排兵布阵,逐鹿中原。

字节跳动:应用为王,内圣外王

AI基因早植,头条抖音显锋芒 

话说这字节跳动公司,自盘古开天辟地——哦不,自创立伊始,便将人工智能(AI)奉为核心驱动力,深植于企业基因之中。远在公元二〇一六年,大模型风潮未起之际,字节便已高瞻远瞩,成立了人工智能实验室(A.I. Lab)。此实验室精英云集,为旗下“今日头条”的个性化推荐系统、“抖音”短视频的诸多神奇模型特效等“国之利器”,提供了坚实的技术支撑与算法保障。可以说,字节跳动在AI领域的积累,非一日之功,乃是十年磨一剑,方有今日之锋芒。

Flow、Seed双剑合璧,豆包日涌万亿方 

面对大模型时代风起云涌的竞争态势,字节跳动尽锐出战,对内重整旗鼓,拆分出两支核心团队,犹如双剑合璧,各有专攻:一支名为Flow团队,其使命如急行军,专注于AI应用的快速研发与落地,力求在千行百业中攻城拔寨;另一支名为Seed团队,则如深山铸剑之宗师,潜心负责大模型核心技术的研发与突破,探索智能之边界。为延揽天下英才,字节更推出了专门针对大模型领域的“Top Scientist”全球招聘计划,后扩展为“Top Seed”人才计划,广纳贤士,不惜重金,为顶尖应届博士开出优厚条件,以充实其AI军团。

其在消费级市场的旗舰产品,乃是一款名为“豆包”的大模型应用。此“豆包”一出,便凭借字节强大的用户基础与运营能力,迅速攻城略地。截至二〇二五年三月底,“豆包”大模型的日均处理Tokens量已达到惊人的十二点七万亿,较之一年前,增长了上百倍之多。其升级后的豆包视觉理解模型,不仅能精准识别图像内容,更能进行复杂的逻辑计算,如分析图表、处理代码、解答各类学科难题,展现出强大的多模态实力。尤为引人注目的是,豆包主力模型在企业市场的定价,低至每千Tokens仅0.0008元人民币,即八厘钱便可处理一千五百余汉字,比行业平均价格便宜了九成有九,此举无异于在平静的湖面投下巨石,迅速掀起了国内大模型市场的“价格风暴”。

数据如海算法精,万卡集群筑高墙 

字节跳动之所以能在大模型领域迅速崛起,其底气主要源于其在“数据、算法、算力”这AI三要素上的深厚积累与强大实力。

数据层面:字节跳动旗下拥有“抖音”、“TikTok”等全球知名的短视频应用,日活跃用户数以亿计,每日产生难以估量的文本、图像、视频等多模态数据。此外,其“飞书”办公套件、“火山引擎”云服务等产品,亦覆盖了超过五十类应用场景,源源不断地贡献着丰富多样的数据资源。这片数据的汪洋大海,既是训练和优化大模型的宝贵“燃料”,也是检验模型能力、提升模型智能的最佳“试金石”。

算法层面:字节跳动自诞生之初,便以机器学习技术为核心竞争力,在搜索、广告、推荐等领域积累了先进的算法能力,并在此基础上近十年来不断迭代优化。其豆包大模型亦在算法上有所创新,例如其独特的“边搜边想”(search while thinking)功能,将互联网搜索能力无缝整合进模型的深度思考过程中,使其在处理需要实时信息的复杂问题时更为得心应手。

算力层面:字节跳动是国内最早建成万卡级别AI算力集群的公司之一,拥有庞大且在一定程度上自主可控的专属计算资源。面对AI竞赛对算力的无尽需求,字节跳动计划在二〇二五年投入巨额资金用于AI芯片的采购与相关基础设施的建设,据传其预算接近1600亿人民币,其中计划投入约120亿美元用于AI芯片的采购,包括在中国购买价值约55亿美元的芯片,以及在海外投资约68亿美元采用英伟达芯片加强基础模型训练能力。

火山引擎赋能百业,生态内循环自强 

字节跳动的整体战略打法,可谓是“应用驱动、内部消化、对外赋能”。首先,它以自身庞大且独特的应用场景和海量数据为基础,持续快速地迭代和优化其大模型技术。其次,依靠其强大的工程能力和深厚的算法积累,让AI技术在内部的众多业务线(如抖音、今日头条等五十余项业务)高效流转和应用,形成一个强大的“生态内循环”,既提升了内部业务的效率和智能化水平,也为模型的进一步优化提供了丰富的反馈和数据。在此基础上,字节跳动再通过旗下的云服务平台“火山引擎”,将内部验证成熟的AI能力和解决方案对外输出,赋能千行百业的合作伙伴。火山引擎凭借其技术实力与合规能力,已通过ISO/IEC 42001:2023人工智能管理体系认证,达到了国际领先标准。根据国际数据公司(IDC)的数据,在二〇二五年第一季度,按照大模型API调用量计算的市场份额中,火山引擎以高达49.1%的占比遥遥领先,成为市场的绝对领导者。

这种从内部应用打磨到外部能力输出的“飞轮效应”,使得字节跳动在AI赛道上展现出强劲的竞争力。其海量的真实用户数据和多样化的应用场景,为模型的训练和迭代提供了得天独厚的优势,使其模型能够更贴近实际需求,更具实用价值。而火山引擎的强势崛起,则标志着字节跳动已成功将其内部AI能力转化为对外服务的核心竞争力,在AI赋能产业的浪潮中占据了有利地位。

阿里巴巴:甘为水电,普惠万方

云栖为基,通义千问纳百川 

再观另一科技巨头阿里巴巴,其在人工智能领域的战略定位则显得更为宏大和基础。阿里集团已将AI明确为未来十年发展的核心“发动机”,其目标是成为AI时代的“水电煤”,为千行百业的智能化转型提供基础动力与核心能力。在这一战略指引下,阿里巴巴旗下的阿里云计算平台,本就是国内云计算市场的领导者,如今更是将“AI优先”作为核心战略,进行了全面的组织和业务调整,力图抓住AI时代的历史机遇。其核心大模型产品,便是“通义千问”系列。该系列模型自二〇二三年四月首次亮相以来,便不断进行快速迭代和升级,最新的Qwen3版本更是在混合思考模式、推理能力、多语言支持(达119种)等方面取得了显著进展,展现出卓越性能。

三千八百亿巨资投,天寒含光铸神兵 

为构筑坚实的AI基础设施,阿里巴巴展现出非凡的魄力与决心。其首席执行官吴泳铭公开宣布,在未来三年内,阿里将投入超过三千八百亿元人民币的巨额资金,用于建设云计算和AI硬件基础设施。这一投资总额不仅超过了阿里过去十年在该领域的投入总和,也创下了中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模的投资纪录。

在算力建设方面,阿里巴巴并非仅仅依赖从英伟达等国际厂商采购GPU,更在自主研发AI芯片的道路上持续投入。旗下达摩院研发的“含光800”AI推理芯片,早已在图像识别等场景中得到应用,例如在“拍立淘”业务中,使用含光800能将十亿张图片的识别处理时间从一小时大幅缩短至五分钟,效率提升高达十二倍。此外,阿里亦有如“天寒光”(或为“天衡光 Ouroboros”)等针对特定AI任务(如语音合成)的自研芯片项目在持续推进。这种“软硬一体化”的追求,以及对自研芯片的坚持,充分显示了阿里巴巴在AI核心技术领域建立自主掌控能力的深远图谋。

电商金融物流数据广,达摩院内算法藏 

阿里巴巴在AI三要素的布局上,同样有着其独特的优势。

数据层面:阿里集团的核心业务——淘宝、天猫等电子商务平台,蚂蚁金服的金融服务,以及菜鸟网络的智慧物流体系——共同构成了一个庞大且独特的商业数据金矿。这些海量的、真实的商业交易数据、用户行为数据、金融风控数据和物流轨迹数据,为训练针对商业场景的AI大模型提供了得天独厚的条件。此外,阿里在高质量知识型数据的积累上也下了不少功夫,其通义千问模型在各类知识问答和解题能力评测中一直表现领先。一个具体的应用例证是,阿里国际站为中国外贸商家推出的AI工具“生意助手”,已经全面接入了通义千问的推理模型,服务全球超过十万家企业,通过AI优化的商品,其转化率提升了52%之多。

算法层面:阿里巴巴拥有专注于前沿技术研发的“达摩院”作为其算法创新的核心引擎。通义千问系列模型,包括Qwen3、支持文本、图像、音视频多模态输入输出的Omni模型、以及专注于视觉理解的VL模型等,均出自达摩院的手笔,并在开源社区和各项评测中表现不俗。值得一提的是,通义千问3.0版本采用了对商业使用友好的Apache 2.0开源协议,使其迅速成为开源社区的热门选择之一,极大地推动了其生态的建设 。

魔搭社区聚贤才,开源普惠图远方 

阿里巴巴的AI战略目标非常清晰:通过构建强大的算力基础设施、持续迭代领先的算法模型,并积极建设开放的社区生态,最终成为千行百业实现AI赋能的“基础设施提供者”。为此,阿里不仅大力推广自家的通义千问系列模型,还积极拥抱开源,建立了ModelScope(魔搭)社区。该社区汇聚了众多优秀的开源模型和开发者,旨在降低AI技术的使用门槛,促进AI技术的普及和创新。阿里云在DeepSeek模型发布后,迅速在其平台上提供了一键部署服务,并辅以优惠政策以吸引用户,此举充分展现了其作为平台型选手的开放姿态和吸纳能力,意图将阿里云打造成AI时代最重要的模型集散地和应用孵化器之一。

阿里巴巴的“AI水电煤”战略,是一项着眼长远的布局。通过成为AI时代的基础设施提供者,阿里不仅能够服务于自身的庞大业务体系,更能从整个AI产业的蓬勃发展中获益。这种平台化、生态化的打法,若能成功,将使其在未来的智能经济中占据核心枢纽地位。

正是:

字节应用数据王,阿里基建图远方。

双雄逐鹿AI域,各展奇能谱华章。

欲知新锐如何破局,且听下回分解。



留下评论