历史研究的新玩法：挑战和机遇

最近，一篇发在经济学刊物Quarterly Journal of Economics上的历史研究文章引起了学术圈内外的热议。笔者认为这篇文章本身，以及随之而来的争议，恰恰凸显了史学研究在当今数字化浪潮面前所面临的挑战和机遇，因此在这里分享一下自己的看法。

文章简述和历史叙事

2022年，经济学者白营、贾瑞雪等在经济学刊物Quarterly Journal of Economics上发了他们的研究文章《权力之网：精英网络如何塑造中国的战争和政治》（以下简称白文）。这项研究探讨了在太平天国这场晚清浩劫前后，中兴名臣曾国藩的私人关系网络在组织镇压太平军，以及改变战后清廷政治格局中的作用。文章落墨的重点在于作者收集的几个数据集和在此基础上建立的统计模型。作者在本研究中使用的数据集共有三种：曾国藩的人际网络、镇压太平天国战斗中湖南士兵死亡情况、以及太平天国运动前后各省籍政治精英的权力升降；在统计模型中使用了新近流行的差分模型试图作一些因果推断和机制上的探究。主要研究结论是：（i）曾氏掌权后，那些在曾氏网络中拥有更多战前精英的县，士兵死亡人数也有所增加；(ii) 战后政治权力明显地向这些精英的家乡转移，导致国家层面的权力分配不那么平衡。作者也认为研究结果强调了微观精英网络如何影响国家政治和社会权力分配，为精英、战争和国家之间的关系提供了新的视角。

作为经济学顶刊之一的QJE，其审稿标准应该是不低的，至少要让同行审稿者认为在研究方法或者探索发现上有可圈可点之处。本文引入新的数据建模的研究手段来探索某个时段的权利结构变迁的机制，尤其是把人际关系这种网络结构的数据集及其分析方法引入到政治经济学的研究中，可以算是一个学术创格。这大概是这篇文章能够过审发表的主要原因吧。

白文想要探究的那段历史就发生在清朝末年的大约半个世纪的时间展期里。因为年代并不久远，许多史料纪录也保存得相对完好，在清史研究中有详细的讨论并形成相当的共识。

自1850年太平军起义，清廷的主力部队绿营、八旗在围剿斗争中节节败退，颇不堪用。这迫使清廷在军力和财力都匮乏的窘境下，只能以卖官、许爵、捐功名等出让政治资源的方式来实现对地方精英势力的战争动员。以曾国藩为首的湖湘精英开始操办湖南团练，而后组建湘军，成为清廷与太平军作战的主要力量。自组建之日起，湘军与太平军之间共爆发大小六百余场战役，终于在1864年攻陷天京，镇压了太平军。至此，湘军这支由汉人统领的军队已经是清廷治下最大的军事力量，清廷不得不倚仗湘军势力，重用湘军人物，湘军首领因为军功而加官进爵，收获了大量的政治资源。大约以湖广总督官文（满）于1867年因为剿捻不力被免，两江总督马新贻（回）于1870年被刺身亡为时间的分界点，此后湘军首领们以及和曾国藩有较亲近关系的如李鸿章等人，占据了众多督抚级别封疆大吏的位置，形成了一定的政治势力。清廷此前一直维持的满汉大致平衡而满略占优的疆域权力分配格局被打破。一般史学家的解读是清廷在太平天国运动以后相当程度地失去了对地方势力，尤其是南方地区的控制力，清廷从此再也无力收回已分享出的权力，这深刻影响了晚清政局。以湖湘精英势力的崛起为起点，也开启了军事集团攫取和掌握更多政治资源和权利的滥觞，到后来的淮军系，北洋系，甚至一直延续到了清朝灭亡后的军阀时期，被史学界视为近代中国权力结构演变的重要节点。

历史学家的质疑

这篇发表在经济学顶刊上的历史研究论文，自然引起了史学家的注意。耶鲁大学历史学家张泰苏教授首先在社交媒体上公开表达了他对该文的质疑，认为该文的结论了无新意，史学界对晚清这段历史有非常详尽的史料记录和认知共识，该文的数据和结论对史学界几乎毫无新增的价值。论文作者之一的贾瑞雪教授也马上作了回应，两位学者在社交媒体上你来我往进行了一番论战。

从史学家的角度看，尽管白文采用了一些新的数据建模的研究手段，但是其收集的数据集如此小，如此有限，根本难以支撑起任何像样子的叙事框架。当时刚刚经历太平天国运动而元气大伤的清廷面对诸多的外忧内患：外有诸强环伺，内有捻乱未平，兵力财力极度匮乏，民族矛盾积重难返，如此等等，纵然已经有两百年国家治理经验的清廷所面临的选择项并不多。况且以曾国藩为代表的湖湘精英以名臣能吏定位自己，从未形成独特的政治理念和诉求，说是改变了政治格局则未免夸大其词。

作为经济学家跨界研究历史问题，应该是大好事，我们不应该苛求他们一定要补足史料的功课。然而就这一个研究课题来说，虽然引入了一些数据分析上的新元素，但是从数据到结论，跨度太大，沟壑难平，还没有形成衔接得上的数据链。从数据分析结果所导出的叙事框架来看，也显得很单薄，甚至有严重的维度缺失，还不能算得上是一个高质量的尝试。作为一个训练有素的计量学者，对于自己收集的数据集和数据分析手段的有效范围和局限，应该有清楚的认知。对于数据分析结果的解读和叙事框架的形成，也应该恪守一定的自律，就是数据收集到哪里，解读和叙事就应该到哪里，不要随意拓展和外推。白文作者在这方面并不是无可挑剔，所定的论文标题更像是标题党所为，文章的研究范围根本不能支撑起如此宽泛的命题。

历史学研究及其数字化面临的艰巨挑战

白文所引发的争议凸显了历史学研究在数字化浪潮中的两难境地。一方面传统史学研究有其固有的局限性，亟需数字化的新技术新元素来改革强化传统史学研究的方法；另一方面史学研究的数字化又面临许多几乎是难以逾越的挑战和障碍。

历史学研究的对象大都极其复杂，充满挑战，主要体现在：

需要考察的变量元素数目不仅巨大，而且数据源头也繁杂众多，凡是和人类活动相关的领域，气候，地理，人口结构和趋势，政治，经济，技术演进，军事，文化，凡此种种，都有可能在某个历史关口成为影响历史进程的主推力。
历史研究也经常需要覆盖很长的时间跨度才能得出有意义的结论，而且一般的历史事件都有路径依赖，研究者很难切割出适当的时间和空间作为研究范围而仍然能够确保结论的可靠性和适用性。
史学研究是一项研究过去为了裨益将来的脑力活动。面向未来的概率性和事后结果的确定性简直就是天差地别。为了避免那种对研究和实践毫无裨益的‘事后诸葛亮’，需要研究者对所研究的那段历史作深入沉浸，才能较好地理解历史环境和语境。因此一个合格历史学家的训练周期往往比较长，还要有良好的悟性。

历史学研究传统上都是由历史学家用定性方法完成的，史学家通过对史料的挖掘和整理而形成一定的叙事框架，来解读和诠释历史进程，以期对人类历史进程的源动力有更深的理解。但是传统史学这种定性描述的研究方式也往往体现出很大的局限性：

缺乏精确性：定性描述缺乏精确性，难以准确测量。这会造成研究过程和结论的量化困难，难以作定量比较，更不要说形成较客观的变化趋势，以及作可能的因果关系推断。
主观性和有限视角：尼采曾言：‘没有真理，只有视角’。定性描述依赖于历史学家或研究人员的解释和观点，这必然会在分析中引入偏见和主观性。面对人类历史这样宏大长序的研究对象，任何叙事和解读都只是‘坐井说天阔’，‘管中窥全豹’。如何校正和消弭各自的偏见和主观性本身就是一个巨大的挑战，需要大量的训练和磨合。
对多变量，长时序信息处理能力的局限性：人类思维往往限于单变量或者低维变量的分析，对高维多变量信息的处理能力非常薄弱。这也延伸到叙事表达方式，以及信息交流的有效性，往往只能限于低维变量的情形。在长短时序的信息处理上也是差不多的情况。即使是再训练有素的史学家也不能例外。因此他们要面对历史这样一个典型的多变量长时序的复杂研究目标时，面对的挑战几乎是一项不可能任务。
缺乏迭代所需要的灵活性：随着新信息和数据的出现，对历史的解读可能会随着时间而改变。人类学者经常会囿于已经形成的观点而固执己见。

数字化和机器智能不仅可以帮助解决其中相当一部分的艰巨挑战，而且可以自然避免人类历史学家的固有偏见和思维局限。但是在历史研究中尝试使用定量化的数据建模等手段时，却又存在史料数字化的巨大挑战：

史料数据的获取困难和质量问题：历史数据可能很难找到，尤其是年代久远的史料，即使找到，也并不总是可靠和准确的。对于一些覆盖长时展的研究项目，获取所需史料和数据的一致性和完整性也极具挑战性。这些困难都可能使随后进行稳健的分析和得出可靠的结论变得具有挑战性。
选择偏差和幸存者偏差：历史研究中需要的数据资料在经过年代的淘刷，甚至人为的破坏后，即使最终能到研究者手里的，也往往是残缺不全的，存在严重的选择偏差和幸存者偏差。这可能会导致数据分析不准确，研究结论不可靠。
多源数据的整合：史料来自多源，数据形式也多种多样。除了大量文本数据，例如报纸、书籍和手稿等；还有历史数据，例如经济、政治和社会数据；甚至图像资料，例如照片、绘画和地图，等等。整合如此多源多种类的数据集本身就是一个不小的挑战。
建模的复杂性：历史事件和过程通常很复杂且难以建模，数据的各种质量问题和多源性更是加大了建模的挑战性。创立和使用适当的建模方法也是一项艰巨的任务。

历史学在数字化浪潮中的位置

所幸史学研究的数字化进程已经开始了。文本挖掘技术被用于分析历史文件中的大量文本数据，并对历史文件进行数字化和保存，使其更容易为公众所用。自然语言处理技术被用于从大量的文本数据中提取有效信息特征，并按主题对文档进行分类。计算机视觉技术被用于从照片、绘画和地图等图像资料中提取信息，识别对象和特征。统计模型和机器学习算法被用于分析历史数据，帮助我们提炼出一些对历史进程有源驱动力的要素，以及它们的长期趋势，如气候，人口数和分布，技术演进，能量的获取和消耗，公共卫生状况等等。这会让我们更清晰地了解社会和经济如何随时间发生变化，以及哪些因素促成了这些变化。

当今数字化浪潮正进入展开期，数字化不仅正在改造，重塑，甚至颠覆许多行业，也必将深刻影响和变革如教育和研究这些人类智能活动最密集的领域。当然数字化在不同领域的进程不会等量齐观，齐头并进。根据数据收集的完备程度和对算力大小的要求，数字化存在不同的阶段：

数据收集和整合阶段：开始把相关信息数字化，整合不同源头的数据，为下一阶段作准备。大部分人文社会科学，生命科学的大部分分支学科的研究，化学，材料科学，天体宇宙科学，健康管理行业等还处在这个阶段。
定量化和数据模型的描述：已经建立相当规模的数据模块，当前的算力能够处理相应的数据量，所建立的数据模型对变量的关联关系大都能有比较可靠的定量化描述。一些局域内的大气科学，环境科学，许多微观经济学领域如供需关系，价格波动和弹性，以及人类的一些经济行为等研究，许多制造业，零售行业等处在这个阶段。
进行比较准确可靠的预测：已经整合形成基本完整的数据链，当前的算力和算法模型能够对主要变量之间的驱动关联作比较深刻的刻画，因此能比较可靠地预测未来或者不在现有数据集中的场景。在研究领域除了一些个案突破，如新近取得突破的对蛋白质结构的预测，基本都还没有达到这个阶段。但是随着算力的增长，我们可以期待就在不远的将来，就会有更多的个案突破。在行业中，金融和保险行业，博彩业，市场营销业，反欺诈，一些已经完成自动化改造的先进制造业，交通出行和规划等已经达到这个阶段。
提供优化结果的行动方案：在此前阶段的基础上，数据链能够基本做到实时更新，算力能够保证实时优化和推荐行动方案，已经形成了数字化方案的闭环迭代。至此，行业的演进速度会加快，人类认知的更新也会提速。目前，社交，电商，物流，网络欺诈等行业已经进入这一阶段。

总的来说，史学研究目前还只是在‘数据收集和整合阶段’的早期，即便要完成这一阶段的数字化，也还有很长的路要走。除了现有史料的数字化，其他学科的资料和研究成果，如气候科学，环境科学，人口学，生物学和基因组学等等，也会更多地被使用和整合入史学研究。史学家也需要有更开放的心态，积极寻求与其他学科研究者的合作，而不是停留在现有的叙事和史学共识中。

在史料数据积累能形成一定规模的模块，或者在某些局域能够形成比较完整的数据链的时候，机器算力和智能就可以帮助史学家建立多维和长时序的数据模型，才能形成失真度更少，更完整的叙事框架。从低维短时序叙事到高维长时序叙事的转换，不仅是量变，更是质变。我们也都要做好认知上的准备，许多我们根深蒂固的认知和习以为常的基本假设可能都会被推翻和更改。在数字化浪潮席卷一切的过程中，人类所谓的知识，智力，技能，创造力，乃至知识的表达和范畴，等等，这些人类文明的核心要素，也都将被重新定义和价值重估。

推进艺术史研究方法的改进和更新，正是我们编辑‘四海艺术丛书’的初衷。让各类学者跨界来助力艺术史的研究逐步迈向数字化和量化的阶段，是我们的编辑宗旨。因为我们认为，学者跨界研究历史不仅仅是锦上添花的可选项，更是让我们能更好恢复历史这个复杂研究对象原貌的必选项。尽管我们的努力可能微不足道，我们能呈现的结果远非完美，但是我们知道，在数字化浪潮面前，这是必由之路，别无选择。这也是为什么我会挑剔白文的种种瑕疵和不足，但是我绝对会为他们的跨界努力和企图心投下大大的赞成票。

历史研究的新玩法：挑战和机遇

你也许还想看：

九溪幻影：城市探险中的领角鸮寻踪

难忘的盛宴：在美国打造一场盛大派对的完美指南

云·雾·边：探究计算技术的三重境界☁️🌫️💻