
一页铺开千重近,万法相通共此身。
高清初识真颜色,协议初传旧墨痕。
话说第二十回中,元数据开广场,通接口现真身。地方馆藏未必离开本馆,却能借题名、描述、缩略图和链接被远方读者发现。可有时,发现还不够。研究者不只想知道“有一页手稿”,还想靠近它:看纸纹,看墨迹,看擦改,看装订孔,看边缘一处几乎被裁去的小字。缩略图像远望山色,真正的学问常要走到石纹前。
于是,图像也需要共同语言。
IIIF,全称 International Image Interoperability Framework,是文化遗产图像互操作的一套框架。它不是某一馆的数据库,也不是单一查看器,而是一组让图像能被请求、缩放、切片、标注、嵌入、跨平台使用的约定。若元数据是门牌,IIIF 更像把窗户、楼梯、放大镜和标注纸都做成通用规格。读者不必被每家机构的界面困住,图像本身可以按共同方法被靠近。
在没有这套共同语言以前,许多馆藏图像像住在各自院落里。甲馆可放大,乙馆只给小图;丙馆能下载,丁馆换个网页便找不回旧地址;研究者想比较两页手稿,先要学两套界面,记两种按钮,忍两样脾气。IIIF 所做的事并不神秘:它把“取哪张图、取多大、取哪一块、怎样呈现一卷书”这些问题拆开,交给约定回答。约定一旦稳定,工具便能生长。
先看一页羊皮纸手稿。它存于某馆恒温库房,平日不轻易翻动。数字化后,高清图像进入服务器。通过 IIIF 图像 API,读者可请求整页,也可请求某一小块;可看缩略图,也可看高分辨率局部。卷曲的边、褪色的墨、针孔、污渍、刮改痕迹,一层层显现。图像不再只是书中插图,而成为可操作的证据。
这种请求可以细到令人惊讶。读者不必下载整张巨图,只需请求左上角某一块、某个尺寸、某种旋转,服务器便按规则送来。地图、卷轴和巨幅画作因此不再压垮浏览器。旧时研究者要把放大镜贴近玻璃,如今则把坐标写进链接。坐标虽冷,却让别人能准确来到同一处。
数字人文学者坐在屏幕前,把这页手稿放大到一个首字母。她发现颜料边缘有后来补色,又把另一馆同一文本的手稿拉到旁边。两个图像原本在不同国家、不同系统中,如今可在同一查看器里并排。她不必先下载巨型文件,也不必忍受两个网站不同的缩放方式。IIIF 像替图像铺了一张平整桌面,让远方页片得以同席。
Mirador、Universal Viewer 等查看器,使这种并置更直观。用户可以拖入不同机构的 manifest,打开多个窗口,比较页码、图像和标注。Manifest 像一本数字书的说明书,告诉查看器有哪些页、顺序如何、每页图像在哪里、题名与描述是什么。图像 API 负责把图像送来,Presentation API 负责告诉它们如何组成对象。术语听来冷,实际是在替手稿排座次。
在 Presentation API 里,一卷书不再只是散落的图片,而被组织成画布、页序、结构与说明。封面、扉页、正文、插图、夹页,各自有位置;一页图像可挂上题名、尺寸、来源和权利说明;一段题跋、一个印章、一处残缺,也可由标注指向。古人装订书页,今人装订数据。装订得好,读者翻阅时便少受折腾;装订得差,图像再清楚,也像一桌好菜缺了筷箸。
修复师也从中受益。她观察一处裂痕,查看不同光照下的图像,记录损伤位置。过去修复记录多在本馆内部流转,如今标注可附着在图像上,供研究、教学和保存工作使用。标注不是在原件上写字,而是在数字层上轻轻贴一张便签。原件不受伤,意见可共享。古代读者在边栏写注,今日学者在图像层写注,动作不同,心思相通。
标注也会彼此争论。甲学者认为某字为“河”,乙学者认为是“何”;修复师标出颜料脱落,历史学者标出地名,学生标出课堂疑问。查看器若设计得好,能让不同标注分层开合,不把初学者疑问和专家结论混作一类。数字边栏比纸边栏更宽,也更需要秩序。
IIIF 的力量还在于跨馆。许多图书馆、档案馆、博物馆、美术馆采用同一框架后,图像不再被各自网站牢牢围住。一个教师可以把大英图书馆手稿、法国国家图书馆图像、斯坦福馆藏、史密森图像放进同一课堂展示;一个研究者可以引用图像局部,而非只截屏。引用变得更精确,图像也像文本一样有了可指向的片段。
有一位学生写论文,想讨论某手稿中一个涂改字。他不再只写“见某馆网页”,而能把局部图像链接嵌入笔记,标出坐标,说明为何判断为后改。导师打开链接,直接看见那一小块。学术争论由此少一点空喊,多一点共同观看。图像被引用,不再只是装饰,而是证据链的一环。
课堂也因此变了模样。教师讲一幅地图,不必只把整图投在幕上,而可沿河道放大,转到港口,再比对另一馆保存的抄本。学生在同一屏上看见地名增删、边界移动、墨色深浅,便知道“版本差异”并非抽象名词。展览策展人也能把本馆图像与外馆图像并置,讲一件物如何流传、如何被临摹、如何在不同目录中换名。图像从展柜里走到桌面上,桌面又通向许多馆。
可是,高清不等于全知。屏幕再清楚,也不等于手中原件。纸张厚薄、装订张力、气味、重量、透光、背面压痕,有些只能在特定条件下观察。IIIF 让远方研究者靠近,却不该让人以为数字替身已完全取代原件。好的数字化,不是宣布原件无用,而是减少不必要接触,同时让更多眼睛先行观察。
图像互操作也带来新的维护责任。服务器要稳定,链接要持久,manifest 要准确,图像权限要清楚。若某馆改版后旧链接失效,研究者笔记里的路便断了。若图像可看但权利不明,教学和出版又会犹豫。标准不仅是技术文档,也是长期承诺。一个 URL 若能多年不变,比许多豪言都更能安慰研究者。
新的机器也悄悄来到图像旁边。版式识别可猜测栏线与段落,手写识别可辨认某些清晰字迹,计算机视觉可比较花押、纹样、纸张水印和印刷缺陷。它们像年轻学徒,眼快,手勤,却需要老馆员不断提醒:这一页来自何处,扫描条件如何,颜色是否校准,标注是谁写的,权利能否允许再训练。若无来源和权限的栏杆,聪明工具容易跑得太快;若栏杆修得妥当,机器的目力又能替人看见从前看不完的细处。
颜色尤其狡猾。不同灯光、相机、屏幕和压缩方式,会让同一处朱砂显出不同深浅。若研究颜料、污渍或修复痕,图像旁便要有色卡、拍摄条件和处理说明。高清不是天然真实,标准也不是只为工程师写的。它们保护的,是未来读者不被漂亮图像轻易哄骗。
IIIF 还改变了公众观看文化遗产的姿态。普通读者可以放大敦煌写本的一角,看墨色如何转折;可以比较两幅版画,找出细小差异;可以在课堂、展览、网页和研究工具中调用同一张图像。过去玻璃柜前只能远观,今天屏幕前可以靠近。靠近之后,敬意未必减少,反而可能增多。因为细节越清楚,越能看见古人手上的迟疑与耐心。
第二十一回写到这里,图像开始像文本一样被请求、引用和拼接。文化遗产不再只是“网页上有一张图片”,而是可被不同工具读取、放大、标注和比较的证据。下一回,入口将从文化遗产平台转向更大的公共网络。关键词、链接、PageRank、向量空间,会把读者带入算法塑造的注意力世界。
正是:一页手稿千重近,万馆图像同法通。欲知关键词如何排阵争先后、向量海怎样藏意辨亲疏,且看第二十二回“关键词排阵争先后,向量海藏意辨亲疏”。
图像虽能千倍近,算法犹自暗中排。
且将像素抛将去,直向词元海中来。

留下评论