首页 » 医学前沿 >

威尼斯“ ime machine”项目因数据行而暂停

2020-02-12 14:04:47来源:

像这座城市一样,对记录威尼斯历史的十个世纪的数字化文件进行的雄心勃勃的工作也有陷入沉没的危险。在围绕开放数据和方法论问题陷入僵局之后,两个主要合作伙伴已中止了威尼斯时光机项目。威尼斯国家档案馆和洛桑瑞士联邦理工学院(EPFL)表示,他们不得不暂停数据收集,档案馆长对已收集的8 TB信息的可用性提出了疑问。

该项目试图数字化州档案馆中超过80公里货架的文件。这些记录了在中世纪和文艺复兴时期鼎盛时期的城市管理的“从金融交易到公民的住址和家庭联系”的细节,作为一个共和国,这个共和国几个世纪以来一直统治着地中海东部的贸易。许多语言是用拉丁语或威尼斯方言写的,而现代历史学家从未读过。

目的是使这些信息免费在线提供给全世界的研究人员。该项目还旨在推动采用手写文档的文本识别技术的最新发展,利用机器学习自动读取数百万页并标记其内容,以便历史学家可以进行快速搜索。

该项目是EPFL,威尼斯国家档案馆和威尼斯卡斯卡里大学之间的合作发起的,2014年,这三个组织都就该倡议的实施方式签署了无约束力的谅解备忘录。

但是,根据档案中9月19日发布的宣布停工的原始协议,原始协议未包含研究方案的关键细节。档案馆现任馆长吉安尼·彭佐·多里亚(Gianni Penzo Doria)说,特别是,它没有具体规定许可研究人员使用数字化数据的许可类型,这也必须遵守意大利法律。他补充说,在八月份上任后,他试图着手展开详细合同的谈判,但是双方很快陷入了僵局。他说,终止该项目的决定是不可避免的,而且是相互的。

但是在9月23日,EPFL发布了措辞鲜明的新闻稿,称该档案馆单方面中止了该项目,而且EPFL惊讶地从威尼斯国家档案馆的网站上得知了这一决定。

威尼斯时间机器总监EPFL的计算机科学家Fr茅d茅ric Kaplan说:“这实质上是一种误解。”他补充说,分歧可能可以通过合作者之间的面对面会议来解决,但是到目前为止,所有讨论都是通过电话会议进行的。

“无缝”文件

同时,在过去的5年中(从大约190,000个文档中)累积的8 TB数字文件的命运尚不清楚。潘佐·多里亚(Penzo Doria)声称,从档案科学的角度来看,“这些档案是无用的”?因为数字化工作未遵循国际电子系统永久真实记录研究(InterPARES)项目设定的档案科学准则。

这些准则要求严格记录信息,以证明每个文档的来源,并要求将此类信息的记录保留在每个文件随附的元数据中。这是一种电子签名,可确保长期保存和验证数字文件。根据Penzo Doria的说法,进行扫描的EPFL研究人员没有记录他们如何收集此类信息-否则,他们没有与档案馆的合作者共享这些文档。

卡普兰说,研究人员确实收集了元数据,但是他们的方法是基于另一套规则-国际档案馆的国际标准档案描述(ISAD)准则。他说,EPFL研究人员遵循了国家档案馆自己的员工制定的程序。Kaplan还说,他在2019年2月给Penzo Doria的前任Giovanna Giubbini的电子邮件中提供了有关元数据的文档。Penzo Doria和Giubbini都告诉《自然》杂志,他们从未收到过这份文件。

拉斐尔·桑托罗(Raffaele Santoro)是2014年威尼斯国家档案馆的负责人,当时该机器签署了关于时光机项目的备忘录,他说他不知道工人如何收集元数据的细节,但他认为它们是科学有效的,因为档案馆自己的员工密切参与了这一过程。他说,为了使已经数字化的文档符合附加标准,可以简单地向元数据添加更多信息,“没有必要再做一次”。

卡普兰说,他希望,如果双方碰面讨论新条款,该项目能够重回正轨。他说:“ PFL衷心希望会议能尽快举行。”

自然574,607(2019)