图书馆技术史:从泥板甲骨到量子词元|第十三回:艾夫拉姆拆卡成字段 机读录初通电子心

第十三回 艾夫拉姆拆卡成字段 机读录初通电子心 主题插图
第十三回 艾夫拉姆拆卡成字段 机读录初通电子心|主题插图

字段初分磁带上,一条卡片万重光。
机心未解书生意,先把名题代码旁。

话说第十二回中,木柜藏风,纸签引路。读者在抽屉前翻卡,馆员在编目室打字,一张小纸片替一册书立名、报址、开门。可纸片虽灵,终究怕慢。馆藏渐多,馆际相通渐急,卡片要印,要寄,要插,要改。纸做的搜索机转得越快,越显出自己的木轴和纸齿。

这一回,先不急着写机器,先取一张卡片放到灯下。

卡片上有作者,有题名,有出版地,有年代,有页数,有主题,有索书号。读者看它,是一张纸;馆员看它,却知里面藏着许多部件。哪一块是题名,哪一块是作者,哪一块是出版项,哪一块是主题,哪一块只是给本馆排架用的地址。若有一双更细的手,把它拆成一格一格,再告诉机器每一格叫什么,纸卡便有机会离开木柜,走入磁带。

不过,机器能读卡片之前,图书馆先要问自己:这门手艺究竟是什么?

十九世纪末,哥伦比亚大学前身之一的 Columbia College 里,梅尔维尔·杜威创办 School of Library Economy。此事后来常被视作近代图书馆职业教育的重要开端。年轻学生学习编目、分类、参考咨询、馆务管理,学怎样让书从采购到上架,怎样让读者从问题到答案。那课堂未必宽敞,却像给图书馆事业装上了一张训练图。

有一名早期学生,袖口沾着墨。她起初以为图书馆只是爱书之人的清静职业,入学后才知其中多是规矩、账册、读者脾气和无休止的细节。老师让她给一本书作卡,她写得端正,却把作者姓名排错。老师没有斥责,只把另一张卡递来:“读者会从哪里找它?”学生低头重写。那一问,比许多训诫都重。

哥伦比亚现场偏向职业训练,芝加哥现场则更爱追问。1926年,芝加哥大学 Graduate Library School 创立,图书馆学在这里带上更浓的研究气味。人们不只问“怎样做”,还问“为什么这样做”“读者怎样读”“社会怎样用知识”“图书馆学可否成为一门科学”。问题一多,书架后面便多了思想的风。

Pierce Butler 在芝加哥写《An Introduction to Library Science》。书名听来温和,内里却有挑战。他不满足于把图书馆学看作经验手册,想为它找理论骨架。想象他夜里坐在桌前,窗外湖风寒冷,屋中有书、有笔、有卡片,也有许多尚未安顿的概念。若图书馆只是一套操作,何以称学?若它是一门学问,它研究的对象究竟是书,还是书在人群中的运动?

Douglas Waples 把目光投向读者与阅读效果。一本书被借走,不等于被读懂;被读懂,也不等于改变生活。Margaret Egan 与 Jesse H. Shera 更进一步,把书目、传播、知识共同体放在一起思量。Shera 后来谈“社会认识论”,听起来像高楼上的词,落到图书馆却很实在:人怎样通过记录、目录、学校、报刊、书籍和机构共同知道世界?知识不是单独住在书页里,它在人与人之间传递、校正、争吵、沉淀。

芝加哥的一间教室里,或许有学生问:“目录只是工具,何必谈得这么大?”

老师没有急答,只把一张卡片放在桌上:“若没有它,这本书在馆里近乎无声。若所有卡片都按某种观念排列,读者看见的世界也随之改变。工具从来不只是工具。”

这话没有喊出口,却会在后来许多系统里回响。

再看 Seymour Lubetzky。此人一生多与编目原则相伴。他不满意卡片目录只是照习惯累积,追问目录究竟要表达什么:是一本书的物理副本,还是一个作品的各种版本?作者、题名、版本、翻译、改编之间如何关联?卡片柜中许多看似平常的排列,到了他手里,都要接受原则的审问。

有一本《哈姆雷特》摆在案上。英文原版、儿童改写本、中文译本、评注本、戏剧演出本,封面不同,读者目的不同。若每册只当孤本,读者难见它们同源;若全混作一团,又失去版本差异。Lubetzky 像在纸面上搭桥,让同一作品的诸多面貌既能相认,又能各自保有身份。后来书目模型的许多问题,早在这张桌边露出端倪。

到这里,机器尚未正式登场。可职业教育、学科理论、社会认识论、编目原则,都已在纸卡周围布好场。机器若要进入图书馆,不能只带电线和磁带,还要学会这套积累已久的馆员语言。

于是 Henriette Avram 出场。

她原非从小立志做馆员的人。她学过数学,做过程序和数据处理工作,后来进入美国国会图书馆。二十世纪六十年代,计算机正带着庞大机房、穿孔卡、磁带和嗡嗡声进入各种机构。图书馆也站在门口,手里握着成千上万张卡片,心中既期待又警惕:机器很快,可它懂什么是作者、题名、丛书、主题、统一题名么?

Avram 面前的不是一张卡,而是一种翻译任务。她要把馆员习惯的书目信息,翻译成机器能处理的结构。MARC,即 Machine-Readable Cataloging,便在这样的需求中成形。它把书目记录拆成字段,每个字段有标签,有指示符,有子字段。245 可以放题名陈述,100 可放个人作者,260 或后来的 264 关乎出版项,650 可放主题词。数字不再只是排架门牌,也成为机器识别语义的标记。

试验时,打印纸从机器里吐出,边孔整齐,纸带一折一折落在桌旁。馆员拿红笔核对,程序员在旁等候。某处题名显示少了一个标点,某处作者名倒置不合规则,某处主题字段落错,几个人便围着一行字符争论。外人看来不过是小错,馆员却知道小错会变成检索失败、排序异常或远方馆员的误用。机器时代的校对,不比纸卡时代轻松,只是错误换了新衣。

有时一条记录要在纸卡、输入表、磁带、打印清单之间来回走几趟,像一位办证件的旅客,被不同窗口反复询问姓名和住址。每一处窗口都可能出错,每一次通过都让格式更稳定一点。等到记录终于能被机器顺利读出,屋里的人未必欢呼,只会松一口气。真正的标准,常在这类松气声中慢慢成形。

且看一条 245 字段。它像卡片上题名那一行的电子化身,却比一行字更会说话。子字段 a、b、c 分别安置正题名、其他题名信息、责任说明。斜杠、冒号、空格都不再只是排印习惯,而成为格式中的秩序。机器并不懂书名的诗意,却能知道哪一段是题名,哪一段是作者责任,哪一段可供显示,哪一段可供检索。

再看一张穿孔卡,或一页从主机打印出的记录。人眼读来不甚亲切,数字与符号排成窄行,像被拆散的咒文。可馆员若熟悉格式,便能从中认出老朋友:这里是作者,那里是题名,这里是出版者,那里是主题。纸卡时代的版面秩序,到了机器里变成标签秩序;柜中抽屉的前后,变成记录内部的先后。物件换了,规矩仍在迁徙。

字符也有自己的麻烦。英文、法文、德文已有重音符号,俄文、希腊文、中文、日文、阿拉伯文更各有书写系统。机器若只习惯少数符号,世界馆藏便会被迫改口。早期机读目录不得不在字符集、转写、罗马化、显示和排序之间反复折中。一本书的题名到了机器中,先要通过窄窄的字符门。门若太窄,许多语言便要侧身而过。

有一名老编目员第一次看见 MARC 记录,眉头皱得很深。“这哪里像书?”她说。

年轻程序员也不服气:“机器只认这样。”

Avram 或许没有笑。她知道两边都对,也都不够。若只像书,机器无法交换;若只像机器,馆员无法信任。她要做的,是让纸卡的精细经验穿过一条窄桥,抵达电子世界。桥太窄,任何含糊都可能掉下去。

磁带机转动,记录一条条写入。纸卡上的沉默信息被编码成字符,字符排成字段,字段汇成记录。读者还未看见变化,编目室却已听到新声。那声音不像木柜抽屉的轻响,也不像打字机的雨点,而像一条黑色带子在机器中低低行走。书目第一次大规模获得可交换的电子身体。

这并不意味着纸卡立刻退场。旧系统总要与新系统并行多年。馆员一边打卡,一边录入;一边校纸卡,一边校磁带。错误也换了形态:过去是卡片插错抽屉,如今可能是字段标签错、子字段漏、字符集乱、磁带读不出。技术解决旧麻烦,也带来新麻烦。只是新麻烦一旦被驯服,便能打开更大的门。

MARC 的力量,在于它把本馆记录变成可复制、可传送、可合并的结构。纸卡曾经通过邮包旅行;MARC 记录可以通过磁带、网络和系统迁移旅行。一个馆员的著录,不必永远困在一只木柜里。它可以被别的馆下载、修改、采用,成为共享编目的基础。

有一条记录从国会图书馆出发,先进入磁带,再进入远方系统。当地馆员打开它,补上本馆索书号、馆藏地点和本地附注。它像一位有正式姓名的旅客,到了异乡又添了住址。纸卡时代已有这种愿望,MARC 让愿望有了电流。

本回写到这里,卡片没有死,反而换了形。哥伦比亚课堂教人怎样服务读者,芝加哥教室追问知识如何在社会中流动,Lubetzky 在原则中打磨作品与版本的关系,Avram 在机房里把卡片拆成字段。人物彼此未必同桌,却围着同一张卡片,各自伸手。卡片被拆开,并不是碎裂,而是为了在更远处重组。

夜深,机房灯还亮着。磁带卷盘缓缓转动,像一只新式木柜,只是抽屉变成了带轴,纸片变成了字段。老馆员把一张卡放进口袋,年轻程序员抱着打印纸走过走廊。两人擦肩时都没有说话,却都知道明日还要校对。机器已经入馆,馆员仍未退场。

正是:纸卡一分成字段,磁带初醒识书名。欲知一馆著录如何千馆共用、万目联网怎样四海同编,且看第十四回“一馆著录千馆共用,万目联网四海同编”。

代码虽能通万古,机心难解此中情。
且将纸卡抛将去,自有荧屏照眼明。



留下评论