仿佛作为一名古希腊文化专家学者从源头上而言不够难,他所依靠的初始文本经常会被毁坏而无法修复,因为它已经有几千年的历史时间。 史学家可能会在伊萨卡拥有一个强悍的新工具,这是一种由 DeepMind 搭建的机器学习模型,能够对遗失的英语单词及其文本位置和日期作出令人惊讶的精确猜想。 这也是人工智能的一种非同寻常的运用,但是它验证了它在科技世界之外的用处。

古代典籍不完美的难题涉及到权威专家解决衰退原材料的很多课程。 原始文件很有可能由石块、粘土或纸莎草纸做成,用阿卡德语、古希腊语或线形 A 撰写,叙述了从杂货铺收支明细到英雄人物旅途的所有具体内容。 可是,它们相同点是几千年来积累下来的毁坏。

文本被损坏或撕下间隙一般被称作空缺,能够短到遗失的英文字母,还可以长至一章,甚至整个故事。 填好他们可能是渺小的,也可能是不确定的,但是你需要从一个地方逐渐—这便是伊萨卡要想给予帮助的区域。人工智能帮助历史学家完成被破坏了数千年的古希腊铭文

伊萨卡(以奥德修斯的家乡海岛取名)在一个非常大的古希腊文化文本公共图书馆接纳练习,不但可以讲出遗失的英语单词或语句可能是哪些,还能够拍照它时代和撰写地址。 不会独自一人进行全部诗史一样的循环系统—这是给那些使用这个文本的人提供的一种手段,而非解决方法。

发表于《自然》杂志期刊里的一篇论文展现了它的功效,并且以 Periclean 古罗马的一些法案为例子。 被称之为在公元前445年之后写出的,伊萨卡按照其文本剖析提议他们事实上来源于公元前420年之后—与近期相关证据一致。 听上去很有可能不多,但想象一下,假如权利法案确实是在 20 年之后整理的!

对于文本自身,该科学研究的专业人士在第一遍就获得了大概25%的准确率,可能并不是一流的,虽然文本修复其实也不是一个下午工作,而是一个长久的新项目。 但是,与伊萨卡匹配后,她们迅速就达到72%的准确度。 在别的前提下,一般会发觉这样的事情,人们最后最准确,但能根据快速消除死路或建议起始点来加速学生的进展。 在医疗数据中,非常容易监管人工智能可能快速标识的异常现象—但是最终,认知关键点并寻找标准答案的是我们理论知识。

虽然古希腊语针对伊萨卡来说是一个不言而喻且富有成果的行业,但是该精英团队早就在勤奋科学研究其他语言。 阿卡德语、古代埃及简单语、希伯来语和玛雅语都是在名单里,期待随着时间推移也会增加大量。

「伊萨卡展现了自然语言理解和机器学习算法在人文科学里的潜在性奉献,」参加该项目古罗马大学老师 Ion Androutsopoulos 说。 「大家需要大量像伊萨卡这样的项目来进一步展现这类发展潜力,还要适宜的课和教材内容来文化教育未来科研人员,他将对人文科学和人工智能方式得到更好的一同了解。」