首页 > 行业新闻 >详情

中日科技论文翻译系统上线

2018-08-24

    近年来,随着深度学习和神经网络的广泛应用,机器翻译的准确率有了显著提升。机器翻译能够大大提高科研人员获取外文信息的效率,使外文科技文献的深度阅读成为可能。中国科学技术信息研究所27日召开发布研讨会,宣布中日两国共同开发的中日科技论文翻译系统研制成功,其翻译率可达97%。

  互联网和大数据时代,科学技术发展速度越来越快,科技论文、专利和科技报告等不同类型的科技文献数量呈爆发式增长。日本科学技术振兴机构、京都大学与中国科学技术信息研究所开展长期合作,联合中科院自动化所、哈尔滨工业大学及北京交通大学,展开了“面向科技文献的日汉双向实用型机器翻译合作研究”。双方首先构建了以科技论文为基础的500多万条高品质中日双语语料库,之后采用了日本科学家研制的神经元网络翻译引擎对这些语料数据进行学习。

  经评估,利用该翻译系统进行的中译日翻译率达到97%,其中有60%的翻译精度可达到“信息适当,容易理解”的程度。在2016年12月举行的以亚洲语言为对象的国际机器翻译研讨会“WAT2016(Workshop on Asian Translation2016)”上,该翻译系统在科技信息机器翻译任务的精度评估中,取得了第一名的成绩。

  日本科学技术振兴机构特别顾问冲村宪树、著名机器翻译专家长尾真教授、中国科学技术信息研究所书记赵志耘、所长戴国强、科技部国际合作司调研员姜小平以及参与合作的中日研究人员出席了会议。双方表示,中日科技论文翻译系统的问世是中日跨国、跨学科研究的典范,期待能有更多中日科技人员积极利用该系统,同时也将继续开展研究,为研制出紧跟时代进步、精度更高的翻译系统而努力。据介绍,2018年5月至9月期间,中日科技论文翻译系统将面向全球免费开放,未来根据用户的实际使用效果,预计2019年下半年或2020年开始有偿使用。