开发基于DeepSeek的Deep Research智能体,应用于数字人文研究

一、研究利器,仓促发布

今天(美东时间2025年2月2日)OpenAI推出了Deep Research工具,不仅与去年12月谷歌推出的研究智能体助手名称撞车(这里有一个详细介绍和比较),而且又要抢很多下游开发者的饭碗了。

我们也一直在思考开发AI4DH平台和工具,很多想法很类似,但实现策略很不相同。

二、四大能力,展示潜力

从今天简短的发布会看,Deep Research的能力主要表现在:

1.高效信息获取和整合:Deep Research由即将发布的OpenAI o3模型的特定版本驱动,专为网页浏览和数据分析进行了优化,能够根据用户提示词进行意图分析,与用户进行交互目标确认。这期间还要进行安全分析,与人类价值观对齐,避免有害信息输出。然后制定计划并进行任务分解,再进行分步执行,通常需要快速搜索浏览大量在线资源,整合信息,高效完成复杂的分析研究任务,并生成详尽的研究报告,必要时还可以修改、调整计划迭代执行。整个时间数分钟到几十分钟,可以输出数万字的“研究报告”。

2.能够进行多模态分析:Deep Research能够处理文本、图像和PDF等多种格式的数据。除了在线搜索获得资料,还支持用户资料上载,目前还不支持音视频资料。人工完成这一过程通常需要数小时到数天时间,但Deep Research可在数十分钟内完成。

3.具有很强的推理能力:Deep Research在科学研究(包括人文社会科学和数学)领域表现出一定能力,OpenAI应该是将其定义为Level3(agents)的智能水平,而科学家至少应属于Level4(innovators),相比较而言谷歌Gemini与之同名的Deep Research应该还属于Level2(Reasoner),只能充当资料收集摘要编写者角色。OpenAI的Deep Research能够有效寻找专业信息,展现类人的处理方式。它通过分析用户输入,理解其需求,并制定相应的行动计划。在执行过程中还能与目标进行比对评判,进行自我反思和调整,以确保任务的顺利完成。它会根据实时信息进行回溯和反应,确保任务执行的准确性和有效性。

4.能够自动化复杂任务:在“人类终极考试”等高难度评测中,Deep Research取得了26.6%的准确率,远高于DeepSeek R1的9.1%,显示出其在复杂任务中的能力。但具体应用效果如何尚无法得知。

目前Deep Research只面向月付200美刀的Pro用户开放。据说等一段时间我们plus用户就能用上。人们相信由于面临DeepSeek的竞争,OpenAI将不得不放下身段,在产品功能和定价上会更加亲民。

三、技术演进,揭示趋势

从技术实现上来说,Deep Research也属于目前炙手可热的智能体应用,大模型的能力越强,智能体的实现越简单。

大模型公司的长处在能够不断提高模型能力,这样可以把大量的工作“内化”到大模型内部进行处理(例如采用MOE、CoT等),这是目前的一个明显趋势。

我们当初的想法是将研究工作切割成不同单元,通过灵活的工作流组合串联起来,期间意图识别、任务分发、数据分析、报告生成、评价总结等都通过智能体编程实现,这种做法虽然也有可能实现满足需求的应用,但复杂程度难以把控,只能通过对智能体框架及其应用的标准化来实现一定的通用性,智能化程度明显不够。看来我们还是幼稚了。

AGI的最大价值就是全自动和自学习,任何人工干预的想法都是缺乏扩展性的。因此还需要借助模型的进步,不断学习,不断简化架构设计。

四、定位清晰,力有未逮

Deep Research目前的应用案例主要还是面向市场调研、行业分析、技术报告撰写等,对标咨询公司的行业分析师职位,差不多博士生水平,主要还不是面向科学研究(如前所述,还达不到Level4的智能),对比Sakana的应用“AI Scientist”,取名就那么雄心勃勃。估计OpenAI对科研所需数据的可获得性、推理的复杂度、结论的准确性和可信度还不是很有信心。对于具体的科学问题,常常需要更加专深的领域知识,要能够连接高质量的商业数据库,或通过API连接本地知识库和应用系统,要能够获取更多的上下文信息和用户画像,以及模仿领域专家的思路和方法、进行专业领域的实验设计和结果分析等,Deep Research似乎还力有未逮。

从Deep Research目前的定位和能力来看,假以时日,开发AI4S应用还是有可能的。如果不算AlphaFold/RossettaFold/MattergenAI等专门领域的AI应用,与AI4S相关的,目前只有Sakana的AI Scientist、斯坦福的STORM、Scispace(typeset.io)和谷歌的Deep Research等少数几个,大都属于学术界的开源试验,尚未投入商业使用。

结论:破局之道,本地方案

Deep Research算是第一个实用的研究类AI智能体,除了它目前的功能尚不成熟之外,它作为一个闭源云服务,用户的数据隐私无法得到保障是一个巨大的障碍,我们的许多应用一定要在本地局域网中实现,数据的安全性极其重要。

因此一个可行的策略是学习Deep Research的架构设计和实现方案,利用当下最优秀的DeepSeek开源模型,结合领域数据库和知识库,搭建开发本地的Deep Research。



《“开发基于DeepSeek的Deep Research智能体,应用于数字人文研究”》 有 1 条评论

  1. […] 2月 4, 2025 Uncategorized 开发基于DeepSeek的Deep Research智能体,应用于数字人文研究 […]

留下评论