AI时代的开放运动与图书馆的机遇(之六)

第六章 战略转型(下):再造技术基础设施,拥抱智能未来

在明确了深化核心职能和升级教育使命的战略方向后,图书馆必须对其技术基础设施进行根本性的再造。这是战略转型的第二部分,关乎图书馆“如何做到”的战术执行。从一个单纯的技术消费者,转变为一个主动的技术塑造者和创新者,是图书馆支撑其新使命、实现技术自主的必由之路。

从消费者到提供者:成为高质量训练数据的策展人

在当前AI发展高度依赖于质量参差不齐、甚至充满有害信息的网络抓取数据的背景下,图书馆独特的价值得以凸显。图书馆拥有海量的、经过专业整理和编目的、高质量的数字化馆藏、特殊馆藏和元数据1。这些资源是构建负责任AI的宝贵“燃料”。

通过进行严格的伦理审查、处理好版权与授权问题,图书馆可以将其特色馆藏(如校史档案、地方文献、特定学科数据集)转化为高质量、可信赖的训练数据集,提供给学术界和本地AI研发社群1。这一举措的意义是双重的:一方面,它能促进更具特色和更少偏见的AI模型开发,直接回应AI的“数据原罪”问题;另一方面,它使图书馆从知识生态的下游消费者,一跃成为上游的价值创造者,成为构建一个开放、共享、可信的“AI公地”(AI Commons)的重要贡献者1。

从依赖到自主:探索开源模型的本地化部署

为了规避商业平台的供应商锁定风险,并更好地保护用户数据隐私,有技术能力的图书馆可以积极探索在本地服务器上部署和微调(fine-tuning)开源大语言模型1。

例如,可以利用本馆的数字化馆藏和常见问题解答(FAQ)数据,对一个开源模型进行微调,创建一个专门用于馆藏查询、特定学科领域问答或新生导航的“图书馆助手”。这种本地化部署不仅能提供高度定制化、与馆藏深度融合的服务,更关键的是,它使图书馆能够完全掌控数据流和算法逻辑。这不仅是对“供应商锁定”风险的直接回应,更是实现技术自主和长期可持续发展的关键一步。它标志着图书馆从一个被动的软件采买方,转变为一个能够主动塑造自身技术命运的行动者。

从壁垒到赋能:拥抱自然语言编程与低代码革命

生成式AI的崛起,特别是其强大的代码生成能力,为图书馆带来了“低代码”乃至“无代码”创新的革命性机遇。传统上需要专业程序员才能完成的任务,现在可以通过自然语言指令交由AI完成,这极大地降低了技术创新的门槛1。

例如,图书馆员可以要求ChatGPT生成一段Python脚本,用于批量处理书目元数据、分析借阅数据以发现阅读趋势,或者自动从网络档案中抓取和整理特定主题的数字化文献1。肯塔基大学图书馆利用ChatGPT生成Python脚本,成功从互联网档案馆(Internet Archive)批量下载了超过8.6万份报纸,就是一个绝佳例证1。

这一变革使得更多不具备编程背景的图书馆员也能参与到服务优化和工作流程自动化的进程中,从而释放出巨大的创新潜力。它有望打破长期以来困扰图书馆的技术壁垒,让技术真正成为赋能一线业务人员的工具,而非少数技术专家的专属领域。

这三大基础设施的再造方向——成为数据提供者、部署本地模型、拥抱低代码——共同构成了一个正向的、自我强化的良性循环。高水平的AI素养教育为用户负责任地使用新型AI基础设施奠定了基础;先进、可控的基础设施为图书馆深化其核心知识服务职能提供了强大的技术工具;而这些成功的服务实践,又反过来成为AI素养教育中最鲜活、最贴切的案例,从而吸引和培养更多具备未来素养的用户,推动整个生态系统向前发展。这不仅是技术的升级,更是一场深刻的组织文化变革,引领图书馆迈向一个更加敏捷、自主和创新的未来。

 



留下评论