谷歌的AI纪元:Google I/O 2025应对王者的挑战

Google I/O 2025开发者大会刚刚结束。本次大会核心聚焦于其眼花缭乱的各类AI产品的应用交付。自去年I/O大会以来,他们已经发布了十多个模型和突破,以及二十多项主要的AI产品和功能,此次特别强调了Gemini Pro的ELO分数显著提升,Gemini 2.5 Pro在LM Arena排行榜上横扫,以及在WebDev Arena上霸榜,然而面临强大对手的竞争,谷歌似乎并不一直是遥遥领先,更多时候只是一个尴尬的追赶者,此次全面发布展现了宝刀不老,但是不是王者回归,还有待后续波诡云谲的市场检验。

本次大会将AI(特别是Gemini)定位为未来几乎所有谷歌产品体验的核心驱动力。谷歌正在以前所未有的速度将模型能力融入产品,并强调AI的智能、个性化和代理能力将为用户和开发者带来巨大机遇。大会展示了AI如何从研究阶段走向现实,并被整合到旗下的众多产品和服务中。

一、核心AI模型与技术进展:深度与广度的飞跃

Gemini系列模型:智能与效率并重

  • Gemini 2.5 Pro 和 2.5 Flash 更新:Gemini 2.5 Pro在LM Arena上表现出色,其“深度思考”模式(Deep Think Mode)利用最新的思考和推理研究成果,包括并行思考技术,使其能更深入地思考复杂查询,探索多种假设再给出解决方案,推理能力更接近人类。目前该模式正向信任的测试者推出。高效模型Gemini 2.5 Flash被称为“主力模型”,它在推理、多模态、代码和长文本处理等关键基准上都有提升,仅次于2.5 Pro。Flash模型预计将于六月初全面可用,Pro模型也将很快跟进。
  • Gemini Pro的ELO分数显著提升,更新后的Gemini 2.5 Pro在LM Arena排行榜上横扫所有类别,并在WebDev Arena上排名第一。

硬件基石:TPU Ironwood

  • 新一代TPU Ironwood:谷歌的第七代TPU Ironwood是首个为大规模思考和推理设计的芯片,性能比上一代提升10倍,计算能力达到惊人的42.5 exaflops。它将于今年晚些时候向Google Cloud客户推出。

多模态生成:图像、视频与音频的融合

  • Imagen 4图像生成模型:这是谷歌最新、最强大的图像生成模型,提升了分辨率到2K,在处理织物、水滴、动物毛皮等精细细节时具有卓越的清晰度,并擅长照片级写实和抽象风格。Imagen 4还改进了AI图像生成中常见的拼写和排版问题。这项能力已在Gemini应用中可用。
  • Veo 3视频生成模型:大会提到了Veo 3模型,它具备原生音频生成能力,可以生成音效、背景音甚至对话,并能将声音与视频完美同步。谷歌认为,Veo 3的出现标志着AI视频生成“无声时代”的结束。
  • 音频生成与内容溯源:Lyria 2模型可以生成高质量音乐和专业级音频,已提供给企业、YouTube创作者和音乐人。Synth ID技术用于将不可见水印嵌入生成内容,目前已为超过100亿条内容添加水印。新的Synth ID检测器可以识别图像、音频、文本或视频中的水印。

二、AI在谷歌产品中的应用突破:重塑用户体验

Google Search的AI模式:彻底重塑搜索体验

  • AI模式:AI模式被描述为对搜索的“彻底重塑”和演进。用户可以提出更长、更复杂的查询,获得AI生成的摘要和见解。谷歌表示,这改变了传统的关键词搜索方式,更接近自然的人类对话。AI模式已向美国所有用户推出(此前仅为实验性功能)。AI概览(AI Overviews)每月服务超过15亿用户,并已推广到全球超过15亿用户和200个国家/地区,在显示AI概览的查询类型中带来了超过10%的增长。Search会动态调整UI,整合文本、图像、链接等。新的Labs工具包括“深度搜索”用于更长期的研究项目。
  • Search Live:将Project Astra的实时能力引入Search AI模式。用户可以使用摄像头展示他们看到的内容,Search能实时提供帮助信息。
  • AI驱动的购物体验:AI模式在搜索中加入了购物相关功能,用户可以根据自然语言描述(如“寻找一个可爱的钱包”)来获得产品推荐和图片。最关键的新功能是虚拟试穿模式,用户上传一张照片后,结合谷歌的Shopping Graph和Gemini AI,可以虚拟试穿衣服。这项功能使用了专门训练的时尚图像生成模型,并首先在美国推出。此外还有“代理结账”功能,可以追踪价格,并在价格达到目标时一键购买。虚拟试穿和代理结账将在未来几个月内推出,Labs中现已可用。

Gemini应用的增强:更个性化、主动和强大

  • Gemini应用的用户量已超过4亿月活跃用户。
  • Gemini Live 集成 Project Astra 能力:将Project Astra的摄像头和屏幕共享能力融入Gemini Live,提供实时视觉协助。用户可以实时讨论屏幕上或摄像头捕捉到的内容,例如为面试练习或准备马拉松。AI系统增强了检测用户语音中情绪并智能回应的能力,同时忽略背景对话。这些摄像头和屏幕共享功能已免费提供给所有Android用户,并开始向iOS用户推出。未来几周,Gemini Live还将与Calendar、Maps、Keep、Tasks等应用连接。
  • 深度研究(Deep Research):现在允许用户上传自己的文件来指导AI研究代理。很快还将支持在Google Drive和Gmail中进行研究。
  • 与 Canvas 集成:Gemini Canvas 作为应用内的创意空间,可以快速将数据和提示转化为信息图表、测验、播客甚至网页。它还能将复杂的想法转化为工作代码,无需特定编程语言知识,只需通过聊天描述即可完成“Vibe Coding”。
  • 代理模式(Agent Mode):一个实验性版本即将向订阅用户推出。它可以执行多步任务,例如根据用户预算和需求在网上寻找公寓,利用Project Mariner调整筛选器,甚至通过MCP协议访问房源并安排看房。
  • 个性化上下文(Personal Context)与智能回复:在用户许可下,Gemini模型可以利用用户在谷歌应用中的相关上下文。这使得Gmail中的智能回复更具个性化,例如根据用户过去的邮件风格和信息(如Google Drive笔记、Google Docs行程)自动生成回复。这项功能将于今年夏天向订阅用户推出。

视频通信与协作:AI赋能沉浸式体验

  • Google Beam 3D视频通信:由Project Starline演变而来,这是一个全新的AI优先视频通信平台。它利用AI将2D视频流转化为逼真的3D体验,通过多摄像头阵列捕捉用户,并在3D光场显示器上呈现,提供沉浸式对话体验。这不需要VR/XR头显,而是需要定制的硬件设备。首批设备将与惠普合作推出,今年晚些时候向早期客户提供。
  • Google Meet 实时语音翻译:Meet中引入了近乎实时的语音翻译功能,可以打破语言障碍。目前支持英语和西班牙语,面向订阅用户提供,并能匹配说话者的声音、语调甚至表情。测试版正在向Google AI Pro和Ultra订阅用户推出,未来几周将支持更多语言。这项技术源自Project Starline。

AI电影制作:Flow

  • Flow:AI电影制作工具:基于Veo、Imagen和Gemini的AI工具,允许创作者通过自然语言提示创建电影场景、角色和资产。它可以生成电影剪辑,并将短片扩展为更长的场景。该工具已发布,并向美国地区的Google AI Pro和Google AI Ultra订阅用户开放。

三、平台与开发者生态系统:AI时代的赋能者

代理能力与API:Project Mariner

  • Project Mariner 与开发者API:Project Mariner是一个研究原型,探索AI代理与网络交互并完成任务的能力。它支持多任务处理(最多10个同时任务),并具备“Teach and Repeat”功能,可以学习未来重复类似任务的计划。Project Mariner的计算机使用能力正通过Gemini API提供给开发者,今年夏天将更广泛可用。代理能力也将集成到Chrome、Search和Gemini应用中。API与Anthropic的Model Context Protocol (MCP)兼容。

跨设备体验:Android XR与Wear OS

  • Android XR 平台:谷歌正在构建Android XR平台,这是Gemini时代的首个Android平台。它旨在支持广泛的XR设备,包括头显和眼镜。谷歌与三星和高通合作优化了平台。大会发布了Android XR SDK的开发者预览版2。三星的Project Muhan是首款Android XR设备,将于今年晚些时候上市。谷歌也在开发轻量级、全天候佩戴的Android XR眼镜,并与Gentle Monster和Warby Parker合作开发。Gemini将整合到Android XR中,提供智能眼镜上的实时信息、翻译等功能。开发者今年晚些时候可以开始为Android XR眼镜开发应用。该平台被认为是Google再次尝试智能眼镜领域,并可能与Ray-Ban Meta Smart Glasses竞争。
  • Wear OS 6 等平台更新:Wear OS迎来了第6个版本。Wear OS 6将引入Material 3 Expressive设计语言,带来个性化的视觉效果和动态。开发者可以通过新的Jetpack库(Wear Compose Material 3和Wear ProtoLayout Material 3)访问这些设计组件。Gemini功能将在未来几个月内整合到Wear OS智能手表、汽车仪表盘甚至电视中。Gemini AI也将集成到Wear OS 6中。
  • Google TV的进展:Compose for TV已稳定发布,帮助开发者构建适应性强的UI。平台更新包括秋季将Gemini功能引入TV。
  • Android 跨设备体验:强调“一个应用,适配所有屏幕”的理念,鼓励开发者构建能在手机、折叠屏、平板、ChromeOS,以及扩展到汽车和XR设备上的应用。这覆盖了5亿的设备生态系统。Compose Layouts库和Jetpack Navigation更新提供了支持。
  • 车载应用体验:为开发者提供了在汽车中构建应用的更多机会,包括新的Gemini集成、游戏和视频等更多应用类别支持。

开发者工具与效率提升:AI赋能开发流程

  • Jetpack Compose:作为谷歌UI开发的重点,Compose的最新稳定BOM版本提供了功能、性能、稳定性和库支持,帮助开发者更快构建适应性强的应用。
  • Kotlin Multiplatform (KMP):新的Android Studio KMP共享模块模板、更新的Jetpack库和新的Codelabs旨在帮助开发者更容易地使用KMP在Android和iOS平台开发。共享模块模板简化了业务逻辑的创建、维护和所有权。
  • Android Studio 中的 Gemini:Gemini 作为AI编码伴侣,旨在提升Android开发者的工作效率。三月份推出的Image to Code功能能将设计稿转换为Compose UI代码。大会预览了新的Agentic AI体验,如Journeys for Android Studio和Version Upgrade Agent,使代码构建和测试更容易。
  • Chrome 中的 Gemini 集成:Gemini将逐步推广到桌面版Chrome。Google AI Pro和AI Ultra的美国订阅用户可以要求Gemini澄清复杂信息或总结网页。谷歌表示最终Gemini将能跨多个标签页工作,甚至代表用户浏览网站。

四、商业增长机会与社会影响

AI订阅计划:拓展商业模式

  • Google AI Pro 和 Google AI Ultra:谷歌推出了两个AI订阅计划。Google AI Pro提供全套AI产品、更高的速率限制和特色功能,取代了之前的Gemini Advanced,将在全球可用。全新的Google AI Ultra计划面向追求尖端AI的用户,提供最高速率限制和对新功能新产品的最早访问权限。Ultra计划目前在美国可用,并将很快在全球推出。新推出的Gemini AI Ultra订阅计划(每月250美元)也显示了谷歌试图从其先进AI能力中创造新的商业模式。

Google Play更新:发现、互动与收入

  • Google Play 更新:围绕提升应用的发现、互动和收入。包括更丰富的内容展示、增强的个性化以及强大的订阅功能(简化结账流程,减少流失)。
  • Play Games Services v2:呼吁开发者开始迁移。

AI的社会应用:解决现实问题

  • AI的社会应用实例:谷歌展示了AI在解决社会问题上的应用。Firesat项目利用卫星图像和AI实时监测野火,可以检测小范围火灾。Wing的无人机送货服务在灾难救援中发挥作用,为避难所运送物资。这些都是AI目前帮助社会的例子。谷歌认为AI的机遇巨大,未来的潜力包括机器人、医疗、量子计算和自动驾驶汽车,这些进展预计在几年内实现,而非几十年。

五、会后反响与股价波动:惊艳与“老调重弹”并存

本次Google I/O大会无疑清晰地传达了谷歌的战略重点:AI,特别是Gemini,是未来创新的核心。大会展示了AI在重塑搜索、人机交互、内容创作、跨设备体验乃至开发者工作流方面的巨大潜力,并提供了大量新的工具和平台供开发者探索。

然而,并非所有人都对大会感到兴奋。根据Reddit上的实时讨论和一篇对比文章,一些开发者和观众表达了失望情绪。主要批评集中在:

  • AI焦点过于突出,掩盖了传统的Android等开发者关注的内容。有观点认为Android相关的重量级新闻已在上周的独立活动中发布。
  • Keynote主题演讲略显沉闷,缺乏早期大会的兴奋感。批评者认为演示风格单调,充斥着技术术语,且议程安排混乱。
  • 部分“新”功能似乎是旧技术的重提(如实时翻译)。
  • 对AI的“炒作”感到厌倦
  • 对AI可能带来的负面影响表示担忧(如取代工作或生成虚假内容)。

股价下跌的深层原因

尽管谷歌在AI领域展示了众多耀眼的技术进步,但会后的股价表现却并未出现大幅上涨,甚至出现小幅下跌。这可能源于以下几个原因:

  1. 市场预期已高:在大会召开之前,市场对谷歌在AI领域的投入和进展已经抱有极高的期望。许多投资者认为,谷歌作为AI领域的领导者,发布新的AI功能是“意料之中”的事情,缺乏能彻底改变市场格局的“One More Thing”式惊喜。当实际发布的内容与市场已经消化的高预期相符时,股价往往不会出现显著的积极波动。
  2. 盈利模式的清晰度不足:尽管谷歌展示了AI在搜索、Gemini应用等多个产品中的广泛应用,并推出了AI订阅计划,但这些新的AI功能和订阅服务能否立即转化为可观的收入增长,以及这些增长能否弥补AI研发和基础设施建设的巨大成本,仍然是投资者心中的疑问。AI的商业化路径尚处于早期阶段,投资者可能需要更明确的盈利前景才能推动股价上涨。
  3. 竞争加剧与技术同质化担忧:AI领域竞争激烈,微软、OpenAI等公司也在不断推出类似甚至更具颠覆性的AI产品。谷歌深陷反垄断调查,面临Chrome浏览器剥离的困境,虽然谷歌强调了其模型的领先性,但一些批评者认为部分“新”功能是旧技术的重提,或是其他公司已经展示过的功能。这可能导致投资者对谷歌AI技术的独特性和领先优势产生担忧,从而影响股价表现。
  4. 成本投入巨大:AI大模型的训练和推理需要巨大的计算资源,如新的TPU Ironwood芯片,这些都意味着高昂的资本支出。尽管谷歌展示了性能提升,但投资者可能会担忧这些投入在短期内对利润率的影响。
  5. 宏观经济环境与市场情绪:股票市场受到多种因素影响,包括宏观经济数据、利率政策、地缘政治等。即使公司发布了积极消息,如果整体市场情绪悲观,股价也可能受到影响。此外,如果市场对AI的过度炒作感到疲劳,也可能导致股价对相关新闻反应平淡。

总结:谷歌的AI雄心与未来的挑战

Google I/O 2025大会清晰地描绘了谷歌在AI领域的雄心壮志和深厚实力。从核心AI模型如Gemini 2.5 Pro的“深度思考”模式和Veo 3的原生音频视频生成,到全新的TPU Ironwood硬件支撑,无不彰显其在技术前沿的领先地位。AI被深度整合进谷歌的各项核心产品和服务中,无论是彻底重塑的Google Search AI模式、功能愈发强大的Gemini应用,还是创新性的Google Beam 3D视频通信,都预示着AI将更智能、更普惠地融入用户生活。同时,Android XR平台和一系列开发者工具的更新,也为开发者构建AI驱动的未来应用提供了肥沃的土壤。谷歌不仅在技术上追求卓越,也通过AI订阅计划探索新的商业增长点,并积极展示AI在解决社会问题上的巨大潜力。

然而,在这些令人瞩目的技术进步和雄心壮志的背后,也存在着挑战和争议。市场的高预期、AI商业化盈利模式的清晰度、日益激烈的竞争环境以及AI研发带来的巨大成本投入,都给谷歌的股价表现带来了压力。此外,一些观众对大会内容“老调重弹”的质疑以及对AI潜在负面影响的担忧,也提醒着谷歌在推进AI技术的同时,需要更好地平衡创新、商业化和社会责任。

总而言之,Google I/O 2025是谷歌在AI纪元中一次全面且深入的亮相。大会不仅展示了其在AI领域无可匹敌的强大实力和王者归来的姿态,也揭示了未来AI发展所面临的机遇与挑战。谷歌已经明确了AI驱动一切的战略方向,接下来的关键在于如何将这些技术优势真正转化为持续的商业成功和更广泛的社会价值。



留下评论