克里斯托弗·马洛的一幅可能的肖像。 (信用:匿名通过维基共享资源)

新的统计分析认为,克里斯托弗·马洛(Christopher Marlowe)是威廉·莎士比亚(William Shakespeare)三位作者之一的可能合着者 亨利六世 播放。

莎士比亚是否真正在戏剧的每个场景中写下每一个字的问题,从吟游诗人自己的一生中就流传开来。 怀尔德阴谋论认为,剧作家从来没有真正存在,或者只是一个演员,而不是一个剧作家。 文学学者曾经就可能合作写作的剧本以及那些不知名的合着者可能是谁而辩论。

宾夕法尼亚大学工程与应用科学学院的信息科学家与德蒙特福特大学的莎士比亚学者合作,正在使用一种新的统计方法来深入了解这个问题。

莎士比亚有帮助

在即将出版的散文中 莎士比亚季刊,他们提供了三个新的证据 亨利六世 戏剧包含另一位作者写的语言。 他们的分析认为克里斯托弗·马洛(Christopher Marlowe)是最有可能的人选,尽管其他作者也可能参与其中。

“一个更可靠的方法是使用功能而不是有意义的单词:”the“,”or“,”to“等等。


内在自我订阅图形


有一点是肯定的:莎士比亚自己并没有写这些剧本。

即使在电脑出现之前,文学学者也试图量化作者的风格来解决归因问题。 然而,现有技术的严格性(通常涉及手工计数)引发了争议。 计算方法重振了这个领域,希望提高可靠性和客观性。

“使用信息科学回答关于有争议的作者的问题可以追溯到二十年,随着计算能力的增长而增长。 但是我们的方法不仅仅是计数,“电气和系统工程系副教授Alejandro Ribeiro说。

专注于小词汇

早期的计算方法试图通过词汇和用法来量化作者风格。 计算某些单词的频率并跨文本进行比较,用于创建作者词汇表。 然而,这种方法存在一个缺陷 - 文本中使用的单词的分布可能比其作者更受其主题的影响。

合着者Santiago Segarra说:“更可靠的方法是使用功能性的,而不是有意义的词语:”the“,”or“,”to“等等。 “每个人都必须使用这些词语,因此分析作者之间的差异如何更接近客观的”风格“。”

宾夕法尼亚大学的团队并没有简单地计算这些词汇的频率,而是测量了彼此之间的距离。 在构建目标文本中出现的50-100功能词之间的列表之后,研究人员应用一种算法从它们中推导“字邻接网络”。

每对功能性单词根据彼此之间相隔多少个单词来给出评分。 这些分数在同一作者的不同文本之间显着一致,充当了一种文体“指纹”。

“例如,”里贝罗说,“如果我们通过我和圣地亚哥的一个戏剧来对这个系统进行训练,然后再给我们其中一个人写的另一个戏剧,那么可以知道哪个人写了98%的时间。 ”

训练算法

由于知道莎士比亚着作权问题上的争论,宾夕法尼亚大学与德蒙福特莎士比亚教授加布里埃尔·伊根(Gabriel Egan)合作,确保他们在学术共识的范围内工作。 例如,学者现在广泛接受约翰·弗莱彻(John Fletcher)作为莎士比亚后期剧作的合着者之一, 在两位高贵的亲族。 莎士比亚早期的一些作品,比如 亨利六世 戏剧和 泰特斯,被认为是合作,但多少和谁不清楚。 这使他们成为更深入分析的好目标。

“语言是最终的'大数据'问题。”

研究人员在整个莎士比亚戏剧集中训练他们的算法,为他开发风格指纹。 他们还为几位着名的同时代人开发了指纹,包括弗莱彻,克里斯托弗马洛,托马斯米德尔顿,本琼森,乔治皮尔等人。 最后,他们将所有候选人的所有文本合并为一个简介,基本上是那个时代英语作家的“平均”指纹。

对莎士比亚文本的邻接网络指纹的分析表明, 亨利六世 戏剧是莎士比亚戏剧中的文体异类。 这个异常使得Shakespare完全把这些剧本完整地写下来,证实了其他小组计算方法所产生的结果。

Egan说:“我们看到采用不同方法的独立研究收敛于同一个结论,”越是独立的方法越趋于一致,我们就越有信心。

有信心的 亨利六世 戏剧是异常的,接下来的任务是看看他们可能包含的文体指纹。 克里斯托弗马洛和乔治皮尔,长期以来一直被认为是不具名的合作者 泰特斯,是两位主要候选人。

Segarra说:“如果你不得不挑选一名候选人,那将是Marlowe。 “如果你必须选择两个,那么你会去找Marlowe和Peele,但是在后一种情况下,我们没有足够大的样本来完全训练分类器。 一旦将这一点与历史证据结合起来,马洛显然就成为了首选的合着者。“

伊根有信心,历史证据提示马洛的规模。 “其他使用完全不同方法的研究人员最近发现了使马洛成为主要候选人的证据。”

“有一个非常着名的骚乱场景 亨利六世,第十一部分,“伊根说,”革命者杰克·凯德(Jack Cade)的一个追随者说:'我们做的第一件事,就是杀死所有的律师。 我认为马洛是杰克·凯德场面的负责人。 当然,我们不知道他们是否坐在一起,共同工作。 例如,莎士比亚可能已经改编了这些段落。“

由莎士比亚和马洛

伊根和他的联合编辑 新牛津莎士比亚全集 将确定马洛作为莎士比亚的三个共同作者 亨利六世 播放。 新牛津莎士比亚,其中包含所有莎士比亚的现代和原始拼写的作品,加上分析和评论,被认为是最权威的剧作家的学术资源之一。

Egan说:“这些关于语言的问题正在ENIAC的电脑诞生地方解决。

“语言是最终的”大数据“问题,将作者归属于合法的所有者既是技术挑战,也是编辑者的道德义务。 二十一世纪来自不同背景,具有不同但相辅相成的技能的作家的合作应该发现一个十六世纪的合作,其起源也是多样的。

Sumber: 宾夕法尼亚大学

相关书籍:

at InnerSelf 市场和亚马逊