情报检索:历史、现在与未来(九)

第三章:AI驱动的信息检索:当前格局与前沿范式(续)

知识图谱与多跳推理:连接点滴信息

传统的检索增强生成(RAG)应用通常依赖向量相似度搜索,但它们在处理需要连接多个相关文档或文本块中的信息的多部分或多跳问题时面临挑战。知识图谱通过将数据组织成实体(人物、概念、事件)及其关系的网络来解决这些挑战。这种结构化表示允许RAG应用(GraphRAG)通过遍历关系高效导航并收集更广泛的语境。

GraphRAG通过将LLM生成的响应建立在结构化数据和明确关系的基础上,从而增强了准确性、语境和可解释性。它能够克服信息跨多个文档、缺失引用和孤立文本块等问题。GraphRAG管道涉及检索(从文档、数据库、知识图谱中识别相关内容)、增强(将检索到的信息与查询结合)和生成(LLM根据增强后的提示生成答案。

HopRAG是一种新颖的RAG框架,通过图结构知识探索增强检索的逻辑推理。它构建了一个段落图(文本块作为顶点,LLM生成的伪查询作为边),并采用“检索-推理-剪枝”机制,在多跳邻域内识别真正相关的段落。这解决了多跳问答中“不完美检索现象”,即许多检索到的段落是间接相关或不相关的。知识图谱支持思维链工作流程,允许LLM代理将复杂问题分解为多个步骤,并查询图谱以获取额外信息。多跳问题的挑战和LLM“幻觉”的可能性是重要的局限性。知识图谱和GraphRAG、HopRAG等多跳推理框架正是为了应对这些问题而生。通过提供实体之间结构化、可验证的关系,知识图谱为LLMs提供了事实基础,提高了准确性和可解释性,并降低了生成虚假信息的可能性。这是迈向更值得信赖的AI的关键一步。

主要公司解决方案比较:Google, Microsoft, xAI, ByteDance, 阿里巴巴

信息检索领域的竞争格局揭示了主要科技公司不同的战略方法:

  • Google: 其信息检索策略以支持文本、图像、视频和音频输入且具有增强推理能力的多模态模型Gemini 2.0 Flash为中心。该系统通过AI概览在200多个国家/地区达到15亿月活跃用户,推动使用量增长10%以上。Project Mariner代表Google最先进的智能体技术,提供能够导航、点击、滚动和完成复杂任务的自主网络浏览能力。智能体开发工具包(ADK)和Agent2Agent(A2A)协议为AI智能体通信建立了开放标准,拥有50多个技术合作伙伴。
  • Microsoft: 强调通过2025年4月推出的Bing中的Copilot搜索实现传统搜索和生成式搜索的无缝集成。该系统将复杂查询的GPT-4驱动深度搜索与使用OpenAI的o1模型进行高级推理的Think Deeper功能相结合。Copilot Vision分析网页图像以增强购物和设计建议,而Microsoft Prometheus模型提供基于GPT-4构建的专门搜索优化。多平台集成涵盖Windows 11、Office 365、移动应用程序和包括WhatsApp和Telegram在内的消息平台。
  • xAI: Grok 4代表了具有原生工具使用和实时搜索集成的世界上最智能的模型。Think模式提供具有透明思维过程的高级推理能力,而Big Brain模式为复杂问题解决分配额外的计算资源。多智能体系统使Grok 4 Heavy能够生成多个同时工作的智能体,如“学习小组”进行综合分析。其性能基准展示了出色的能力:在人类最后考试上达到25.4%的准确率(超过Gemini 2.5 Pro的21.6%),在ARC-AGI-2上达到16.2%(接近下一个最佳商业模型的2倍),MMLU准确率达到92.7%,处理速度提高30%。
  • ByteDance: 其信息检索策略强调通过DeerFlow(使用LangChain和LangGraph的用于深度研究的开源多智能体框架)实现自动化。PaSa系统为学术研究提供LLM驱动的高级论文搜索能力,Trae Agent在软件工程基准上达到最先进的性能。UI-TARS(用户界面任务自动化和推理系统)整合了感知、推理、定位和记忆能力。
  • 阿里巴巴: WebSailor代表了开源网络推理的当前最先进水平,通过新颖的四阶段训练范式实现了超人推理能力。由通义实验室开发并于2025年7月发布,WebSailor通过专门为三级问题解决设计的专业训练方法解决了广阔信息景观中的极端不确定性。其性能指标在BrowseComp和GAIA基准上表现突出。

对主要科技公司的比较表明,尽管所有公司都在AI领域投入巨资,但它们的战略重点各不相同。谷歌侧重于多模态和代理式浏览,微软侧重于企业集成和生产力,xAI侧重于原始推理能力和多智能体系统,字节跳动侧重于自动化和推荐,而阿里巴巴侧重于超人网络推理。这表明“AI搜索”市场并非单一的,不同参与者正在根据其核心竞争力(消费者与企业、通用搜索与特定任务自动化)开辟利基市场。这意味着未来市场格局将是碎片化但竞争激烈的。

表3:传统搜索引擎 vs. AI答案引擎对比分析 



留下评论