艰深的古代文字居然有了“翻译机”?首个智能文字识别系统面世!

商周文、金文等中国古代文字的艰涩难懂毋庸讳言,但这又是进行学术研究、文物鉴定的重要依据,许多人都幻想,如果能有个“翻译机”,照一照就能把这些古代文字翻译成现代文就好了。

如今,这个梦想成真了,今天上午,一面独一无二的“商周金文智能镜”在华东师范大学面世,使用了这面“魔镜”,艰涩难懂的“天书”商周金文就能为大众读懂。

持续20年的研究获得重大进展

周到君今天从华东师范大学获悉,华东师范大学中国文字研究与应用中心发布AI+表意文字大数据成果——“文镜万象”出土文献智能识别释读系统之“商周金文智能镜”。

这面“魔镜”是“文镜万象”系列的首个成果,开启人类表意文字的学习、释读、研究智能化的全新方式。

事情的缘起,还要从20年前说起。

20年前,华东师范大学中国文字研究与应用中心就开始进行中国文字数字化研究。

中心主任臧克和介绍,2003年版《商周金文数字化处理系统》,就首次推出了商周金文全面数字化的光盘版。随着这些年技术的更新、AI人工智能的加入,由刘志基、臧克和两位教授领衔的文史专家团队和信息科学专家们联手,运用人工智能领域多种前沿技术,首次跨学科研究打造了智能文字识别系统。

这个系统识别的对象,包括以出土文献文字为主的从殷商到现代的各时段汉字、表意系统的少数民族文字以及域外各类古文字。

而最先面世的“商周金文智能镜”,就首次实现了商周金文多维度智能自动识别释读,成为对商周金文资料进行深度建设加工的数字化平台。

不仅能识别单个字,还能整段翻译

那么,这面“魔镜”怎么用呢?

首先,专家们要设立一个庞大的“数据库”,以完整商周金文拓片或影像为素材,一次完成其中所有文字的识别。

在具体使用时,首先可以上传一张真实来源于商周金文拓片的字形,就是对于需要识别的文字,通过智能识别系统,其结果不仅仅是将该字形对应为哪个字单位,同时可以获得该字形的出处、载体、释义、语境、文献类型、时空属性等信息,识别出该字形所出青铜器,并给出相应的语境信息。

那么,如果是想知道一整段文字的意思呢?难道要逐字查询吗?

其实,该系统还能进行成篇文字材料的整体性识别,形成准确的释文。

只要上传一张真实的商周铭文拓片资料,智能识别系统就能判断出该拓片的各类相关属性信息,并给出对应铭文释文和现代汉语大致意思。

换句话说,这面“魔镜”能识别的不仅仅是单个的字,更能翻译整篇文字材料。

将有更多古代文字“智能镜”推出

“就社会普及而言,‘商周金文智能镜’是一种革命性的商周金文学习工具。”  中国文字研究与应用中心主任臧克和说,可以预期,商周金文这种由于历史因素被长期尘封的宝贵传统文化资源,将会在社会各专业领域得到越来越多的应用,而商周金文本身也将在此过程中得到更好的传承。

而对专业研究而言,“商周金文智能镜”的意义,就在于它可以消除商周金文数字化现有的关键性盲点,通过字形识别来打通商周金文各类数据关联对接,盘活数字化营造的商周金文大数据系统,推动商周金文研究大踏步迈向智能化时代。

不仅如此,“商周金文智能镜”的研发经验,将对“文镜万象”其他分支成果的推出产生积极作用,今后“殷商甲骨智能镜”“战国文字智能镜”“秦汉文字智能镜”“魏晋南北朝文字智能镜”……等各时段汉字识别系统,以及“纳西东巴文智能镜”“水书智能镜”等少数民族表意文字识别系统乃至“古埃及文智能镜”等域外表意古文字识别系统将陆续面世,为人类表意文字学习、传承、研究开辟新时代。

来源:周到上海       作者:李星言