当前位置:数智频道首页 > 人工智能 > 正文

谷歌 AI 破译古籍新巅峰:错误率仅 0.56%,准确率媲美人类专家

科技媒体golem报道,谷歌正在其AI Studio平台上测试一款未命名的AI模型,该模型在破译难以辨认的历史手稿方面已接近人类专家的水平。历史学家Mark Humphries使用专门开发的基准数据集对这一模型进行了系统性测试。结果显示,在处理五份高难度历史手稿时,该模型的整体字符错误率约为1.7%,大部分错误涉及标点符号和大小写问题。如果排除这些模糊的错误,模型的字符错误率将降至约0.56%,相当于每转写200个字符才出现一个错误。

谷歌 AI 破译古籍新巅峰:错误率仅 0.56%,准确率媲美人类专家

这次测试涵盖了18至19世纪多种手写风格的文档,包括字迹潦草、拼写错误和语法不一致的复杂样本,进一步证明了该模型的强大能力。特别值得注意的是,该模型不仅能够进行文字转写,还展现了复杂的推理能力。例如,在处理一份18世纪商人的日记时,原文中有一条关于购买糖的记录,仅标记了数字“145”,并未注明计量单位。然而,谷歌的AI模型输出了“14磅5盎司”。研究人员发现,AI是通过反向计算账本中记录的总价,并结合当时英国的货币(磅、先令、便士)与重量单位关系,成功推断出这一结果。

谷歌 AI 破译古籍新巅峰:错误率仅 0.56%,准确率媲美人类专家

尽管初步结果令人振奋,但Humphries也指出了当前评估的局限性。由于该模型目前仅通过A/B测试形式零星出现,系统性地进行大规模测试存在困难,目前仅评估了基准数据集中约10%的样本。

谷歌 AI 破译古籍新巅峰:错误率仅 0.56%,准确率媲美人类专家

谷歌 AI 破译古籍新巅峰:错误率仅 0.56%,准确率媲美人类专家

热点推送

本周关注

MORE