数字人文技术史考察(四)

3.2. 1990s-:观念的计算提取——金观涛、刘青峰的观念史研究

在文本编码为大规模文本数字化奠定基础的同时,一些学者开始探索利用计算方法直接分析大规模文本数据,以揭示思想观念的演变轨迹。金观涛、刘青峰夫妇自20世纪90年代以来在观念史(Conceptual History)领域的研究,便是一个杰出的代表。他们旨在通过对海量历史文献的量化分析,考察中国近现代(主要界定为1830-1930年)一系列重要政治术语的形成、语义流变,以及这些术语所对应的西方现代政治观念在中国被引介、接受和转化的复杂过程。

他们的研究方法论具有鲜明的特点:

●      核心资源: 其研究的核心依托是他们主持建立的“中国近现代思想史专业数据库(1830-1930)”。该数据库收录了此一时期内高达1.2亿汉字的各类文献,包括期刊、报纸、专著等,为进行大规模、历时性的词汇和观念分析提供了坚实的数据基础。

●      关键词统计分析: 研究团队选取了一系列在中国近现代政治思想中至关重要的核心术语,如“权利”、“个人”、“民主”、“科学”、“社会”、“革命”、“经济”等,运用统计学方法分析这些关键词在数据库不同时段文献中的出现频率、分布情况以及词语之间的共现关系(collocation)。通过这些量化指标,他们得以追踪这些术语从无到有、从模糊到清晰、从边缘到核心的演变路径。

●      “以例句为中心”的研究方法: 这是金、刘观念史研究方法论的一大创新。他们强调,对观念的理解和分析必须落实到具体的语言运用层面,即考察关键词在实际文献中是如何被使用的。因此,他们的研究突破了以往思想史研究主要依赖少数代表人物的经典著作或进行宏观思潮概括的局限,转而以数据库中包含特定关键词的“例句”作为分析的基本单位。这种方法使得研究结论更具经验基础,并且在一定程度上具有可验证性。著名史学家王尔敏先生因此将他们的研究范式誉为“当今哲学界的统计学派” 。

●      福柯知识考古学方法的运用: 在理论层面,金、刘的研究借鉴了米歇尔·福柯(Michel Foucault)的知识考古学(archaeology of knowledge)方法。他们关注关键词背后话语实践的断裂与重组,追寻特定观念在特定历史时期得以形成的知识型(episteme)条件,试图通过分析词语涵义、出现频率以及词语网络的变化,来解构传统历史叙事中线性的、统一性的观念史图景,揭示历史的真实性与复杂性 。

金观涛、刘青峰的观念史研究取得了显著的学术贡献,并引发了广泛的讨论:

●      新视角与新分期: 基于大规模数据分析,他们对中国近现代思想史提出了一些不同于传统史学界公认的观点和分期方案,例如他们提出的以“二元论意识形态”(即传统个人道德伦理与公共领域价值的分离)为枢纽的现代思想史三阶段划分。

●      方法论创新: “以例句为中心”的数据库方法,为观念史乃至整个思想史研究领域开启了一种可验证的、基于大规模经验证据的新范式,尤其是在处理非西方语言文献和跨文化观念传播问题上,展现了计算方法的独特优势。

●      工具性价值: 他们的研究成果不仅体现为学术专著,还包括整理出的一份包含十余万字、近百个现代重要政治术语的意义演变词表,这本身就是一份极具参考价值的学术工具书,嘉惠学林。这种研究成果与工具资源并重的产出模式,也体现了数字人文的典型特征。

学术界对金、刘观念史研究的评价普遍积极,认为其工作有力地解构了传统历史观的束缚,努力探求历史的真实面貌与内在复杂性。然而,也有评论者指出其研究中可能存在的一些问题。例如,有学者认为他们对福柯方法的运用,在解构旧的宏大叙事之后,又试图构建一种新的、统一的观念史体系(如“二元论意识形态”作为核心解释框架),这在某种程度上可能偏离了福柯谱系学(genealogy)更强调断裂性、非连续性和权力话语分析的意图。此外,对于某些具体历史事件(如新文化运动)的定位和解释,评论者认为可以更加清晰和细致。这些讨论本身也反映了数字人文研究中一个根本性的张力:即数据驱动的模式发现与既有理论框架或批判性理论之间的复杂互动关系。如何在海量文本模式的解读中,既避免陷入朴素经验主义的泥潭,又不被预设的理论框架所过度束缚,是观念史乃至整个数字人文领域需要持续面对和思考的课题。



留下评论