近几十年来,科学研究投入持续增长,但许多发达经济体的研究生产力却呈现下降趋势。技术进步的广泛衡量指标——全要素生产率(TFP)显示,自1930年代以来,美国经济需要不断增加的研发投入才能维持恒定的指数增长率,日本、德国和中国也有类似情况。这种“研究生产力下降”现象引发了关于科学和技术进步效率的讨论。同时,科学文献数量呈指数级增长,但对科学知识广度的衡量——认知范围——增长缓慢。这表明科学知识的扩展速度并未跟上出版物数量的爆炸式增长。正是在这一背景下,人工智能(AI),特别是机器学习(ML),作为强大的新兴技术,正在深刻影响科学研究的各个阶段。
AI在科学发现中的潜在前景和应用
AI在科学发现中的应用前景广阔,被视为应对研究效率下降和信息过载的有力工具。研讨会讨论了将AI用于科学发现所需的关键里程碑,包括制定科学假说、识别需要测量的变量及其数据源(模拟、实验、文献等)、记录相关数据、使用收集到的数据可靠地检验假说,以及根据推论完善假说。AI可以用来产生预测或假说。
具体的潜在应用领域包括:
- 协助进行科学发现过程中的关键步骤。
- 编写科学论文,这需要系统能够表达大量的科学知识.
- 在航天项目中提供帮助,例如在木卫二Europa和土卫二Enceladus的任务中,由于信号延迟,AI可以帮助着陆器/机器人根据积累的数据自主做出决策。
- 探索地球益生元条件和生命起源与最后普遍共同祖先之间的联系,填补当前理解中的空白。
- 填补太阳系演化理解中的空白。
- 药物发现和开发,例如帮助识别药物靶点、加速化学计算和预测药物反应。
- 蛋白质结构预测,如AlphaFold工具。
- 改进临床试验的设计、招募和数据分析。
- 处理海量科学文献,通过机器阅读、文献摘要、分类和信息提取等技术帮助科学家提炼信息。
- 分析物理学实验产生的大规模数据集,如在高能物理、天体物理和聚变研究中的应用。
- 加速材料科学的研究。
- 结合公民科学项目,提升生态监测和野生动物保护的效率.
有人提出了“AI科学家”的概念,认为可以开发能够进行重大科学发现、甚至超越顶尖人类科学家的AI系统。这促成了“诺贝尔图灵挑战”的提出,目标是到2050年开发出能够自主进行研究并获得诺贝尔奖的AI科学家。AI科学家可能是一个多智能体系统,由多个具有一定自主性的软件和硬件模块动态交互组成。高度自动化和互联的实验室、对数据库和出版物档案的广泛访问是AI科学家的前提。人类科学家将能以更抽象的指令与AI科学家互动,而AI科学家将具有更高的自主决策能力.
多个组织正在为AI在科学发现中的应用提供资金和支持。美国国家科学基金会(NSF)通过其遍布全美的25个国家AI研究机构以及其他项目支持AI研究。国家人工智能研究资源(NAIRR)的创建旨在提供共享的研究基础设施,促进计算能力、软件、数据集、模型和支持的访问,以加强并民主化美国的AI创新生态系统。国立卫生研究院(NIH)的数据科学预算(包含AI资金)预计未来将继续增长. 许多慈善机构也因AI领域的宣传而增加了对AI的兴趣。
AI应用于科学发现面临的挑战
尽管前景光明,但AI在科学研究中的广泛应用面临诸多挑战。
一个关键挑战是理解的局限性。AI可以生成预测或假说,但无法真正发展出像人类那样的理解。例如,AI图像分类模型在图像上添加微量噪声后可能无法识别图像,这表明它并非真正“理解”了图像内容。同样,大型语言模型可以提供多位数乘法的规则,但无法准确执行计算,这表明它并不理解规则。AI的推理过程可能不透明(“黑箱”),这使得理解其决策或 surprising choices变得困难。有人认为,足够复杂以表现出智能的系统可能过于复杂而无法理解。此外,AI的评估结果可能与人类伦理不符。
另一个主要挑战是数据和计算资源的需求。训练强大的AI模型需要大量数据和计算能力,这可能导致AI研究的“去民主化”,加剧计算鸿沟。缺乏必要的数据、计算基础设施和工程资源是发展中国家发展AI科学能力的主要障碍。AI算法和计算基础设施是特别需要资金支持的领域。
研究的可重复性是AI研究中一个日益突出的问题。由于算法、数据、硬件和随机性等因素的影响,AI研究结果很难复现。
安全和伦理问题也至关重要。AI有潜力被用于不道德的研究,或进行不安全的研究,例如在无人监督的情况下创建危险的病毒或计算机病毒。AI科学家甚至可能做出对人类有害的发现。因此,需要优先考虑AI系统的安全性,并使其与人类价值观对齐。严格的伦理准则和执行可能必不可少。AI安全被认为是需要更多关注的领域。一个具体的例子是药物发现AI可能被用于设计有毒分子,这凸显了双重用途的危险。
AI是否能够提出真正范式转移的原创性想法仍然是一个开放性问题。目前的AI在现有想法基础上进行创新能力很强,但能否提出像人工神经网络或信息论那样基础性的概念,以及能否复制人类的创造力和偶然创新,尚待时间验证。
此外,评估AI模型的指标存在挑战。处理敏感数据(如健康数据)需要解决数据隐私和安全问题,联邦学习等技术被提出作为潜在解决方案。还需要指导以避免将敏感数据共享给AI工具。有人担忧AI研究可能走向狭窄化。
AI科学家可能是一个人机协作的系统,人类专家可以在其中扮演领域专家或指挥和监控的角色。随着AI科学家能力增强,人类提供的指令将更加抽象。充分利用AI科学家的力量需要用户理解其能力。AI被视为人类科学家的“伴侣”。
总结
AI为解决科学研究中效率下降和信息过载的挑战提供了有前景的工具。它可以加速发现过程,并在各个领域带来突破。然而,要充分发挥AI的潜力,必须解决其带来的挑战,包括资源可及性、研究可重复性、数据处理、安全伦理问题以及确保AI研究不会走向狭窄化。AI时代的科学研究,既充满了前所未有的机遇,也伴随着需要深思熟虑应对的挑战。
【在成都参加ADLS2025“第二十一届数智图书馆前沿问题高级研讨会”,秦健教授做了一个关于AI4S最新进展及对图书馆影响的报告,本文是受秦健教授的启发,就相关资料做了一个阅读心得笔记】

留下评论