CN109255129A - 翻译方法、翻译装置以及翻译程序 - Google Patents

翻译方法、翻译装置以及翻译程序 Download PDF

Info

Publication number
CN109255129A
CN109255129A CN201810735086.0A CN201810735086A CN109255129A CN 109255129 A CN109255129 A CN 109255129A CN 201810735086 A CN201810735086 A CN 201810735086A CN 109255129 A CN109255129 A CN 109255129A
Authority
CN
China
Prior art keywords
text
translation
amendment
paginal
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810735086.0A
Other languages
English (en)
Other versions
CN109255129B (zh
Inventor
野村和也
西川刚树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of CN109255129A publication Critical patent/CN109255129A/zh
Application granted granted Critical
Publication of CN109255129B publication Critical patent/CN109255129B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • G06F40/56Natural language generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本公开提供能大量收集使原文与翻译文成对的例文并能防止误译的发生的翻译方法、装置及程序。服务器(1)具备:对译语料库存储部(19),将第1语言的文与第2语言的翻译文成对地存储;翻译对象取得部(11),取得翻译对象即第1语言的原文;机器翻译部(13),生成将原文翻译成第2语言的翻译文;误译判断部(16),翻译文翻译得不正确时,生成包含原文和对应的误译文的对译数据;对译数据发送部(17),将对译数据发送给至少一个终端装置(3);修正对译数据接收部(18),从至少一个终端装置接收包含原文和将误译文修正正确后的修正翻译文的至少一个修正对译数据;及对译语料库登记部(20),将至少一个修正对译数据登记于对译语料库存储部。

Description

翻译方法、翻译装置以及翻译程序
技术领域
本公开涉及进行第1语言与不同于所述第1语言的第2语言之间的翻译处理的翻译方法、翻译装置以及翻译程序。
背景技术
近年来,将第1语言的语句(文)翻译成与第1语言不同的第2语言的语句的机器翻译装置正在被进行研究及开发,例如提出了专利文献1等的技术。要提高这种机器翻译装置的翻译性能,需要收集有大量的可利用于翻译的例文(例句)的对译语料库(Corpus)。
现有技术文献
专利文献1:日本特开2004-156806号公报
发明内容
发明所要解决的问题
在以往的机器翻译装置中,误译(翻译错误)的发生成为问题,发生误译时,在以往的机器翻译装置中,要么修正原文并再次进行机器翻译,要么对误译出的翻译文进行修正。
在以往的机器翻译装置中,通过生成收集有大量的例文的对译语料库,能够防止误译的发生,但是要收集大量的例文并不容易,在上述以往的技术中,需要进一步的改善。
本公开是用于解决上述问题而做出的,其目的在于提供能够大量收集使原文与翻译文成对的例文并且能够防止误译的发生的翻译方法、翻译装置以及翻译程序。
用于解决问题的技术方案
本公开的一个技术方案涉及的翻译方法,是翻译装置中的翻译方法,所述翻译装置进行第1语言与不同于所述第1语言的第2语言之间的翻译处理,所述翻译方法包括:取得作为翻译对象的所述第1语言的原文,生成将所述原文翻译成所述第2语言而得到的翻译文,在所述翻译文翻译得不正确的情况下,生成包含所述原文和与所述翻译文对应的误译文的对译数据,向至少一个终端装置发送所述对译数据,从所述至少一个终端装置接收包含所述原文和将所述误译文修正正确后的修正翻译文的至少一个修正对译数据,将接收到的所述至少一个修正对译数据登记于存储部,所述存储部将所述第1语言的文与所述第2语言的翻译文成对地进行存储。
发明效果
根据本公开,能够大量收集使原文与翻译文成对的例文,并且能够防止误译的发生。
附图说明
图1是表示本公开的实施方式1中的翻译系统的整体结构的图。
图2是表示本公开的实施方式1中的服务器的构成的图。
图3是用于对本公开的实施方式1的翻译系统中的翻译处理进行说明的第1流程图。
图4是用于对本公开的实施方式1的翻译系统中的翻译处理进行说明的第2流程图。
图5是表示在本实施方式1中用于受理误译文的修正的显示画面的一例的图。
图6是表示在本实施方式1的变形例中用于受理误译文的修正以及原文的相似文的输入的显示画面的一例的图。
图7是表示本公开的实施方式2中的服务器的构成的图。
图8是用于对本公开的实施方式2的翻译系统中的翻译处理进行说明的第1流程图。
图9是用于对本公开的实施方式2的翻译系统中的翻译处理进行说明的第2流程图。
图10是表示在本实施方式2中用于受理误译文以及逆向翻译文的修正的显示画面的一例的图。
图11是表示本公开的实施方式3中的服务器的构成的图。
图12是用于对本公开的实施方式3的翻译系统中的翻译处理进行说明的第1流程图。
图13是用于对本公开的实施方式3的翻译系统中的翻译处理进行说明的第2流程图。
标号说明
1、1a、1b服务器;2翻译装置;3终端装置;4网络;11翻译对象取得部;12、12a机器翻译模型存储部;13、13a机器翻译部;14、14a、24翻译结果发送部;15判定结果接收部;16、16a、16b误译判断部;17对译数据发送部;18、18a修正对译数据接收部;19、19a对译语料库存储部;20、20a对译语料库登记部;21、21a机器模型学习部;22、22a对译数据存储部;23翻译结果解析部。
具体实施方式
(成为本公开的基础的见解)
近年来,将第1语言的语句翻译成与第1语言不同的第2语言的语句的机器翻译装置正在被进行研究及开发。要提高这种机器翻译装置的翻译性能,需要收集有大量的可利用于翻译的例文的对译语料库。
另一方面,在以往的机器翻译装置中,误译的发生成为问题,发生误译时,在以往的机器翻译装置中,要么修正原文并再次进行机器翻译,要么对误译出的翻译文进行修正。
对译语料库是使原文与翻译文成对的语料库。例如考虑到,机器翻译装置将被输入的作为翻译对象的原文与翻译该原文而得到的翻译文成对地追加到对译语料库,由此使对译语料库的例文增多。然而,在原文被误译的情况下,无法将该原文与误译文成对地追加到对译语料库,无法使对译语料库的例文增多。
为了解决以上问题,本公开的一个技术方案涉及的翻译方法,是翻译装置中的翻译方法,所述翻译装置进行第1语言与不同于所述第1语言的第2语言之间的翻译处理,所述翻译方法包括:取得作为翻译对象的所述第1语言的原文,生成将所述原文翻译成所述第2语言而得到的翻译文,在所述翻译文翻译得不正确的情况下,生成包含所述原文和与所述翻译文对应的误译文的对译数据,向至少一个终端装置发送所述对译数据,从所述至少一个终端装置接收包含所述原文和将所述误译文修正正确后的修正翻译文的至少一个修正对译数据,将接收到的所述至少一个修正对译数据登记于存储部,所述存储部将所述第1语言的文与所述第2语言的翻译文成对地进行存储。
根据该构成,取得作为翻译对象的第1语言的原文。生成将原文翻译成第2语言而得到的翻译文。在翻译文翻译得不正确的情况下,生成包含原文和与翻译文对应的误译文的对译数据。向至少一个终端装置发送对译数据。从至少一个终端装置接收包含原文和将误译文修正正确后的修正翻译文的至少一个修正对译数据。将接收到的至少一个修正对译数据登记于使第1语言的文与第2语言的翻译文成对地存储的存储部。
因此,包含原文和将误译文修正正确后的修正翻译文的至少一个修正对译数据被登记于存储部,所以能够大量收集使原文与翻译文成对的例文,并且能够防止误译的发生。
另外,在上述的翻译方法中,也可以为,所述至少一个修正对译数据包含所述修正翻译文和修正原文,所述修正原文是与所述原文在语义上相同、在表现上不同的文句。
根据该构成,至少一个修正对译数据包含修正翻译文和作为与原文在语义上相同、在表现上不同的文句的修正原文。
因此,包含修正原文和修正翻译文的修正对译数据被登记于存储部,所以能够进一步增多使原文与翻译文成对的例文。
另外,在上述的翻译方法中,也可以为,还包括:对接收到的所述至少一个修正对译数据所包含的所述修正原文的语义进行解析,在包含具有相同语义的所述修正原文的修正对译数据的数量为预定数量以上的情况下,将该修正对译数据登记于所述存储部。
根据该构成,接收到的至少一个修正对译数据所包含的修正原文的语义得到解析,在包含具有相同语义的修正原文的修正对译数据的数量为预定数量以上的情况下,该修正对译数据被登记于存储部。
因此,并非存储至少一个修正对译数据的全部,而是在包含具有相同语义的修正原文的修正对译数据的数量为预定数量以上的情况下,该修正对译数据被登记于存储部,所以能够将更准确的修正原文与修正翻译文的成对文作为例文进行存储,能够削减存储容量。
另外,在上述的翻译方法中,也可以为,还包括:将所述原文和所述翻译文提示给用户,基于所提示的所述原文和所述翻译文,受理由所述用户对所述翻译文被翻译得是否正确的判定结果的输入,在受理到所述翻译文被翻译得不正确这一判定结果的情况下,生成所述对译数据。
根据该构成,对用户提示原文和翻译文。基于提示出的原文和翻译文,受理由用户对翻译文被翻译得是否正确的判定结果的输入。在受理到翻译文被翻译得不正确这一判定结果的情况下,生成对译数据。
因此,在翻译文由用户判定为翻译得不正确的情况下,生成对译数据并发送给至少一个终端装置,所以能够由用户切实地对误译进行判定。
另外,在上述的翻译方法中,也可以为,还包括:生成将所述翻译文翻译成所述第1语言而得到的逆向翻译文,将所述原文和所述逆向翻译文提示给用户,基于所提示的所述原文和所述逆向翻译文,受理由所述用户对所述翻译文被翻译得是否正确的判定结果的输入,在受理到所述翻译文被翻译得不正确这一判定结果的情况下,生成所述对译数据。
根据该构成,生成将翻译文翻译成第1语言而得到的逆向翻译文。对用户提示原文和逆向翻译文。基于提示出的原文和逆向翻译文,受理由用户对翻译文被翻译得是否正确的判定结果的输入。在受理到翻译文被翻译得不正确这一判定结果的情况下,生成对译数据。
因此,即使是无法理解第2语言的用户,也能够通过比较第1语言的原文与第1语言的逆向翻译文,判定翻译文被翻译得是否正确。
另外,在上述的翻译方法中,也可以为,在所述翻译文被翻译得不正确的情况下,生成包含所述原文、所述误译文和所述逆向翻译文的所述对译数据,向所述至少一个终端装置发送所述对译数据,从所述至少一个终端装置接收包含所述原文、将所述误译文修正正确后的修正翻译文、和将所述逆向翻译文修正正确后的修正逆向翻译文的所述至少一个修正对译数据,将接收到的所述至少一个修正对译数据登记于所述存储部。
根据该构成,在翻译文被翻译得不正确的情况下,生成包含原文、误译文和逆向翻译文的对译数据。向至少一个终端装置发送对译数据。从至少一个终端装置接收包含原文、将误译文修正正确后的修正翻译文、和将逆向翻译文修正正确后的修正逆向翻译文的至少一个修正对译数据。将接收到的至少一个修正对译数据登记于存储部。
因此,也接收将逆向翻译文修正正确后的修正逆向翻译文,所以能够使修正逆向翻译文与修正翻译文成对地登记于存储部,能够进一步使例文增多。
另外,在上述的翻译方法中,也可以为,还包括:生成将所述翻译文翻译成所述第1语言而得到的逆向翻译文,解析所述原文的语义,并且解析所述逆向翻译文的语义,判断所述原文的语义与所述逆向翻译文的语义是否相同,在判断为所述原文的语义与所述逆向翻译文的语义不相同的情况下,生成所述对译数据。
根据该构成,生成将翻译文翻译成第1语言而得到的逆向翻译文。解析原文的语义并且解析逆向翻译文的语义。判断原文的语义与逆向翻译文的语义是否相同。在判断为原文的语义与逆向翻译文的语义不相同的情况下,生成对译数据。
因此,在原文的语义与逆向翻译文的语义相同的情况下,能够判断为翻译文正确,在原文的语义与逆向翻译文的语义不同的情况下,能够判断为翻译文不正确,所以无需用户判定翻译文被翻译得是否正确,翻译装置就能够准确地判定翻译文被翻译得是否正确。
本公开的另一技术方案涉及的翻译装置,是进行第1语言与不同于所述第1语言的第2语言之间的翻译处理的翻译装置,具备:存储部,其将所述第1语言的文与所述第2语言的翻译文成对地进行存储;取得部,其取得作为翻译对象的所述第1语言的原文;翻译文生成部,其生成将所述原文翻译成所述第2语言而得到的翻译文;对译数据生成部,其在所述翻译文翻译得不正确的情况下,生成包含所述原文和与所述翻译文对应的误译文的对译数据;发送部,其向至少一个终端装置发送所述对译数据;接收部,其从所述至少一个终端装置接收包含所述原文和将所述误译文修正正确后的修正翻译文的至少一个修正对译数据;以及登记部,其将接收到的所述至少一个修正对译数据登记于所述存储部。
根据该构成,存储部将第1语言的文与第2语言的翻译文成对地进行存储。取得作为翻译对象的第1语言的原文。生成将原文翻译成第2语言而得到的翻译文。在翻译文翻译得不正确的情况下,生成包含原文和与翻译文对应的误译文的对译数据。向至少一个终端装置发送对译数据。从至少一个终端装置接收包含原文和将误译文修正正确后的修正翻译文的至少一个修正对译数据。将接收到的至少一个修正对译数据登记于存储部。
因此,包含原文和将误译文修正正确后的修正翻译文的至少一个修正对译数据被登记于存储部,所以能够大量收集使原文与翻译文成对的例文,并且能够防止误译的发生。
本公开的另一技术方案涉及的翻译程序,是用于进行第1语言与不同于所述第1语言的第2语言之间的翻译处理的翻译程序,使计算机作为如下单元发挥功能:存储部,其将所述第1语言的文与所述第2语言的翻译文成对地进行存储;取得部,其取得作为翻译对象的所述第1语言的原文;翻译文生成部,其生成将所述原文翻译成所述第2语言而得到的翻译文;对译数据生成部,其在所述翻译文翻译得不正确的情况下,生成包含所述原文和与所述翻译文对应的误译文的对译数据;发送部,其向至少一个终端装置发送所述对译数据;接收部,其从所述至少一个终端装置接收包含所述原文和将所述误译文修正正确后的修正翻译文的至少一个修正对译数据;以及登记部,其将接收到的所述至少一个修正对译数据登记于所述存储部。
根据该构成,存储部将第1语言的文与第2语言的翻译文成对地进行存储。取得作为翻译对象的第1语言的原文。生成将原文翻译成第2语言而得到的翻译文。在翻译文翻译得不正确的情况下,生成包含原文和与翻译文对应的误译文的对译数据。向至少一个终端装置发送对译数据。从至少一个终端装置接收包含原文和将误译文修正正确后的修正翻译文的至少一个修正对译数据。将接收到的至少一个修正对译数据登记于存储部。
因此,包含原文和将误译文修正正确后的修正翻译文的至少一个修正对译数据被登记于存储部,所以能够大量收集使原文与翻译文成对的例文,并且能够防止误译的发生。
以下,基于附图对本公开涉及的一实施方式进行说明。此外,以下的实施方式是使本公开具体化的一例,并非限定本公开的技术范围。另外,各图中标注有同一标号的构成表示同一构成,适当地省略其说明。
(实施方式1)
图1是表示本公开的实施方式1中的翻译系统的整体结构的图。
图1所示的翻译系统具备服务器1、翻译装置2以及多个终端装置3。
翻译装置2例如是智能手机、平板型计算机、个人计算机或者翻译专用机。
翻译装置2受理由用户对作为翻译对象的第1语言的原文的输入。此外,原文通过声音(语音)输入。在该情况下,翻译装置2具备麦克风和声音转换部,麦克风受理由用户对作为翻译对象的第1语言的原文的声音输入,声音转换部将通过麦克风输入的声音转换成文本数据。翻译装置2将表示由用户输入的翻译对象的翻译对象数据发送给服务器1。
此外,原文也可以通过文本输入。在该情况下,翻译装置2也可以具备受理由用户对作为翻译对象的第1语言的原文的文本输入的输入部。输入部例如是键盘、鼠标或者触摸面板。
服务器1经由网络4以能够通信的方式与翻译装置2连接。另外,服务器1经由网络4以能够通信的方式与多个终端装置3连接。网络4例如是互联网。
服务器1进行第1语言与不同于第1语言的第2语言之间的翻译处理。服务器1取得作为翻译对象的第1语言的原文,生成将原文翻译成第2语言而得到的翻译文,在翻译文被翻译得不正确的情况下,生成包含原文和与翻译文对应的误译文的对译数据,向多个终端装置3发送对译数据。
多个终端装置3的各个例如是智能手机、平板型计算机或者个人计算机。此外,在本实施方式1中,翻译系统具备多个终端装置3,但本公开不特别限定于此,翻译系统也可以具备至少一个终端装置3。
多个终端装置3的各个从服务器1接收包含原文和误译文的对译数据。多个终端装置3的各个受理误译文的修正。多个终端装置3的各个向服务器1发送包含原文和将误译文修正正确后的修正翻译文的修正对译数据。服务器1从多个终端装置3接收多个修正对译数据,将接收到的多个修正对译数据登记于存储部。
此外,在图1中,翻译系统具备三个终端装置3,但本公开不特别限定于此,具备两个以上的终端装置3即可。
图2是表示本公开的实施方式1中的服务器的构成的图。
图2所示的服务器1具备翻译对象取得部11、机器翻译模型存储部12、机器翻译部13、翻译结果发送部14、判定结果接收部15、误译判断部16、对译数据发送部17、修正对译数据接收部18、对译语料库存储部19、对译语料库登记部20、机器模型学习部21以及对译数据存储部22。
服务器1例如具备包括CPU(Central Processing Unit,中央处理单元)、ROM(ReadOnly Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)以及辅助存储装置的计算机。
图2所示的各块(功能块)例如通过CPU执行存储于辅助存储装置的、使计算机作为服务器1发挥功能的程序(翻译程序)来实现。因此,在计算机中安装(实施,执行)有翻译方法。在图2中,由四边形表示的块主要通过CPU来实现其功能,由圆柱形表示的块主要通过由ROM、RAM以及辅助存储装置等构成的存储装置来实现其功能。
此外,翻译装置2也可以具备服务器1的一部分或者全部的构成。
翻译对象取得部11取得作为翻译对象的第1语言的原文。在本实施方式1中,翻译对象取得部11从翻译装置2接收包含第1语言的原文的翻译对象数据。
机器翻译模型存储部12连接于机器翻译部13,存储第1语言与第2语言之间的翻译处理中所使用的机器翻译模型。机器翻译模型存储部12存储用于从第1语言翻译成第2语言的机器翻译模型。
机器翻译部13生成将由翻译对象取得部11取得的原文翻译成不同于第1语言的第2语言而得到的翻译文。机器翻译部13通过将原文应用于机器翻译模型存储部12所存储的机器翻译模型来生成翻译文。机器翻译部13使用统计机器翻译、基于神经网络的翻译、或者基于规则式的翻译等进行机器翻译,关于机器翻译部13所使用的机器翻译方法,不特别进行限定。机器翻译部13将由翻译对象取得部11取得的原文、和翻译得到的翻译文输出给翻译结果发送部14。
翻译结果发送部14将包含第1语言的原文和第2语言的翻译文的翻译结果信息发送给翻译装置2。此外,翻译结果发送部14也可以将仅包含第2语言的翻译文的翻译结果信息发送给翻译装置2。
翻译装置2将原文和翻译文提示给用户。翻译装置2基于所提示的原文和翻译文,受理由用户对翻译文被翻译得是否正确的判定结果的输入。
判定结果接收部15从翻译装置2接收判定结果信息,判定结果信息表示由用户对翻译结果信息所包含的翻译文被翻译得是否正确的判定结果。
误译判断部16基于从翻译装置2接收到的判定结果信息,判断翻译文被翻译得是否正确。误译判断部16在翻译文被翻译得不正确的情况下,生成包含原文和与翻译文对应的误译文的对译数据,并存储于对译数据存储部22。即,在受理到翻译文被翻译得不正确这一判定结果的情况下,误译判断部16生成对译数据。另外,误译判断部16在翻译文被翻译得正确的情况下,生成包含原文和翻译文的对译数据,并向对译语料库登记部20输出。
对译数据存储部22存储由误译判断部16判断为翻译文被翻译得不正确从而生成的包含原文和误译文的对译数据。
对译数据发送部17读出存储于对译数据存储部22的对译数据,将读出的对译数据发送给多个终端装置3。此外,对译数据发送部17也可以在每当对译数据存储于对译数据存储部22时发送该对译数据。另外,对译数据发送部17也可以在每当预定数量的对译数据存储于对译数据存储部22时将预定数量的对译数据一并地进行发送。另外,对译数据发送部17也可以定期地发送对译数据。
修正对译数据接收部18从多个终端装置3的各个接收包含原文和将误译文修正正确后的修正翻译文的多个修正对译数据。
对译语料库存储部19存储对译语料库,所述对译语料库使由第1语言构成的原文与该原文的向第2语言翻译的翻译文相关联。对译语料库包含使第1语言的原文与将该原文向第2语言翻译而得到的翻译文成对的译文对。
对译语料库登记部20连接于对译语料库存储部19,将由修正对译数据接收部18接收到的多个修正对译数据登记于对译语料库存储部19。对译语料库登记部20将由修正对译数据接收部18接收到的修正对译数据新登记于对译语料库存储部19所存储的对译语料库。对译语料库登记部20通过将原文与修正翻译文相关联地保存于对译语料库存储部19来登记对译语料库。
机器模型学习部21连接于机器翻译模型存储部12,利用对译语料库来学习机器翻译模型存储部12所存储的机器翻译模型。机器模型学习部21在由对译语料库登记部20登记了新的对译语料库的情况下,对机器翻译模型存储部12所存储的机器翻译模型进行再学习。
图3是用于对本公开的实施方式1的翻译系统中的翻译处理进行说明的第1流程图,图4是用于对本公开的实施方式1的翻译系统中的翻译处理进行说明的第2流程图。
首先,在步骤S1中,翻译装置2受理由用户对作为翻译对象的第1语言的原文的输入。此外,原文的输入通过声音输入或者文本输入来进行。
接着,在步骤S2中,翻译装置2判断由用户对原文的输入是否完成。在此,在判断为原文的输入尚未完成的情况下(步骤S2:否),返回到步骤S1的处理。
另一方面,在判断为原文的输入已完成的情况下(步骤S2:是),在步骤S3中,翻译装置2将由用户输入的原文发送给服务器1。
接着,在步骤S4中,服务器1的翻译对象取得部11从翻译装置2接收作为翻译对象的第1语言的原文。
接着,在步骤S5中,机器翻译部13生成将第1语言的原文翻译成第2语言而得到的翻译文。
接着,在步骤S6中,翻译结果发送部14将包含第1语言的原文和第2语言的翻译文的翻译结果信息发送给翻译装置2。
接着,在步骤S7中,翻译装置2接收由服务器1发送来的翻译结果信息。
接着,在步骤S8中,翻译装置2基于接收到的翻译结果信息,显示原文以及翻译文。
接着,在步骤S9中,翻译装置2受理由用户对所显示的翻译文被翻译得是否正确的判定结果的输入。用户确认显示出的翻译文,判定其相对于自身输入的原文,被翻译得是否正确。翻译装置2例如显示当翻译得正确的情况下按压的按钮、和当翻译得不正确的情况下按压的按钮,用户按压某个按钮。
接着,在步骤S10中,翻译装置2判断由用户对判定结果的输入是否完成。在此,在判断为判定结果的输入尚未完成的情况下(步骤S10:否),返回到步骤S9的处理。
另一方面,在判断为判定结果的输入已完成的情况下(步骤S10:是),在步骤S11中,翻译装置2将表示由用户对翻译文被翻译得是否正确的判定结果的判定结果信息发送给服务器1。
接着,在步骤S12中,服务器1的判定结果接收部15接收由翻译装置2发送来的判定结果信息。
接着,在步骤S13中,误译判断部16基于由判定结果接收部15接收到的判定结果信息,判断翻译文被翻译得是否正确。在此,在判断为翻译文被翻译得正确的情况下(步骤S13:是),在步骤S14中,误译判断部16生成包含原文和翻译得正确的翻译文的对译数据。误译判断部16向对译语料库登记部20输出所生成的对译数据。
接着,在步骤S15中,对译语料库登记部20将由误译判断部16生成的对译数据登记于对译语料库存储部19所存储的对译语料库。
此外,在本实施方式1中,将使原文与翻译得正确的翻译文成对的对译数据登记于对译语料库,但本公开不特别限定于此,也可以不将对译数据登记于对译语料库。在该情况下,当在步骤S13中判断为翻译文被翻译得正确时,结束翻译处理。
另一方面,在判断为翻译文被翻译得不正确的情况下(步骤S13:否),在步骤S16中,误译判断部16生成包含原文和与翻译文对应的误译文的对译数据。
接着,在步骤S17中,误译判断部16将生成的对译数据存储于对译数据存储部22。
接着,在步骤S18中,对译数据发送部17读出存储于对译数据存储部22的对译数据,将读出的对译数据发送给多个终端装置3。
接着,在步骤S19中,终端装置3接收由服务器1发送来的对译数据。此外,在图4的流程图中,对多个终端装置中的一个终端装置发送了对译数据,但对其他终端装置也发送了对译数据,在各个终端装置中进行同样的处理。
接着,在步骤S20中,终端装置3基于接收到的对译数据,显示原文以及误译文。
接着,在步骤S21中,终端装置3受理由翻译者对所显示的误译文的修正。翻译者确认显示出的原文和误译文,将误译文修正为正确的翻译文。终端装置3例如具备键盘、鼠标或者触摸面板等输入部,输入部受理由翻译者对误译文的修正。
图5是表示在本实施方式1中用于受理误译文的修正的显示画面的一例的图。
如图5所示,终端装置3显示显示画面41,显示画面41包含第1语言的原文51、第2语言的误译文52、用于使用户输入对误译文的修正的输入栏53、和用于向服务器1发送修正后的译文的发送按钮54。翻译者输入将第2语言的误译文修正后的修正译文。
在图5所示的例子中,显示出“ジュースはいかがですか。(喝果汁如何)”这一第1语言的原文51,并显示出“How is Juice?(果汁怎么样)”这一误译文52。对此,翻译者在输入栏53输入将原文正确进行翻译而得到的“How about Juice?(喝果汁如何)”这一修正译文。而且,在修正译文的输入完成时,翻译者按压发送按钮54。
返回到图4,接着,在步骤S22中,终端装置3判断由翻译者对误译文的修正是否完成。终端装置3在图5所示的发送按钮54被按压的情况下,判断为由翻译者对误译文的修正已完成。在此,在判断为误译文的修正尚未完成的情况下(步骤S22:否),返回到步骤S21的处理。
另一方面,在判断为误译文的修正已完成的情况下(步骤S22:是),在步骤S23中,终端装置3向服务器1发送包含原文和将误译文修正正确后的修正翻译文的修正对译数据。
接着,在步骤S24中,服务器1的修正对译数据接收部18接收由终端装置3发送来的修正对译数据。此外,修正对译数据接收部18从多个终端装置3的各个接收修正对译数据。
接着,在步骤S25中,对译语料库登记部20将由修正对译数据接收部18接收到的修正对译数据登记于对译语料库存储部19所存储的对译语料库。
在图5所示的例子中,对译语料库登记部20将“ジュースはいかがですか。”这一第1语言的原文与“How about Juice?”这一第2语言的修正译文成对地登记于对译语料库。
此外,在本实施方式1中,将从多个终端装置3接收到的多个修正对译数据全部登记于对译语料库存储部19,但本公开不特别限定于此,对于具有相同的文字串(字符串)的修正翻译文,也可以仅将一个修正对译数据登记于对译语料库存储部19。另外,对译语料库登记部20也可以在修正翻译文的文字串相同的修正对译数据的数量为预定数以上的情况下,将该修正对译数据登记于对译语料库存储部19。
接下来,对本实施方式1的变形例中的翻译系统进行说明。在本实施方式1中,终端装置3受理误译文的修正,但在本实施方式1的变形例中,终端装置3受理误译文的修正、并且受理与原文相似的相似文的输入。在本实施方式1的变形例中,多个修正对译数据的各个也可以包含修正翻译文和修正原文(原文的相似文),修正原文是与原文在语义上相同、在表现上不同的文句。由此,能够将使原文与修正译文成对的第1修正对译数据、和使原文的相似文与修正译文成对的第2修正对译数据登记于对译语料库,能够使对译语料库所存储的例文增多。
图6是表示在本实施方式1的变形例中用于受理误译文的修正以及原文的相似文的输入的显示画面的一例的图。
如图6所示,终端装置3显示显示画面42,显示画面42包含第1语言的原文51、第2语言的误译文52、用于使用户输入对误译文的修正的输入栏53、用于向服务器1发送修正后的译文的发送按钮54、和用于使用户输入原文的相似文的输入栏55。翻译者输入将第2语言的误译文修正后的修正译文,并且输入原文的相似文。原文的相似文是与原文在语义上相同、在表现上不同的文句。
在图6所示的例子中,显示出“ジュースはいかがですか。”这一第1语言的原文51,并显示出“How is Juice?”这一误译文52。对此,翻译者在输入栏53输入将原文正确进行翻译而得到的“How about Juice?”这一修正译文,并且在输入栏55输入“ジュースにしますか。(喝果汁吧)”这一原文的相似文。而且,在修正译文以及原文的相似文的输入完成时,翻译者按压发送按钮54。
终端装置3在图6所示的发送按钮54被按压的情况下,判断为由翻译者对误译文的修正以及原文的相似文的输入已完成。在判断为误译文的修正以及原文的相似文的输入已完成的情况下,终端装置3向服务器1发送包含将误译文修正正确后的修正翻译文和原文的第1修正对译数据、以及包含修正翻译文和原文的相似文的第2修正对译数据。
接着,服务器1的修正对译数据接收部18接收由终端装置3发送来的第1修正对译数据以及第2修正对译数据。此外,修正对译数据接收部18从多个终端装置3的各个接收第1修正对译数据以及第2修正对译数据。
接着,对译语料库登记部20将由修正对译数据接收部18接收到的第1修正对译数据以及第2修正对译数据登记于对译语料库存储部19所存储的对译语料库。另外,对译语料库登记部20也可以针对第2修正对译数据所包含的原文的相似文,进行句法解析和语义解析等预定的解析处理,解析从多个终端装置3接收到的多个第2修正对译数据的各个所包含的原文的相似文的语义。而且,对译语料库登记部20也可以在包含具有相同语义的原文的相似文的第2修正对译数据的数量为预定数量以上的情况下,将该第2修正对译数据登记于对译语料库。
(实施方式2)
在上述的实施方式1中,将原文和翻译文提示给用户,受理由用户对翻译文被翻译得是否正确的判定结果的输入,但在实施方式2中,生成将翻译文翻译成第1语言而得到的逆向翻译文,将原文和逆向翻译文提示给用户,基于所提示的原文和逆向翻译文,受理由用户对翻译文被翻译得是否正确的判定结果的输入。
图7是表示本公开的实施方式2中的服务器的构成的图。
图7所示的服务器1a具备翻译对象取得部11、机器翻译模型存储部12a、机器翻译部13a、翻译结果发送部14a、判定结果接收部15、误译判断部16a、对译数据发送部17、修正对译数据接收部18a、对译语料库存储部19a、对译语料库登记部20a、机器模型学习部21a以及对译数据存储部22a。
此外,翻译装置2也可以具备服务器1a的一部分或者全部的构成。
机器翻译模型存储部12a存储用于从第1语言翻译成第2语言的第1机器翻译模型、和用于从第2语言翻译成第1语言的第2机器翻译模型。
机器翻译部13a生成将由翻译对象取得部11取得的原文翻译成不同于第1语言的第2语言而得到的翻译文。机器翻译部13a通过将原文应用于机器翻译模型存储部12a所存储的第1机器翻译模型来生成翻译文。另外,机器翻译部13a生成将第2语言的翻译文翻译成第1语言而得到的逆向翻译文。机器翻译部13a通过将翻译文应用于机器翻译模型存储部12a所存储的第2机器翻译模型来生成逆向翻译文。机器翻译部13a将由翻译对象取得部11取得的原文、和逆向翻译文输出给翻译结果发送部14a。此外,在将翻译文提示给用户的情况下,机器翻译部13a也可以将翻译文也输出给翻译结果发送部14a。
翻译结果发送部14a将包含第1语言的原文和第1语言的逆向翻译文的翻译结果信息发送给翻译装置2。此外,翻译结果发送部14a也可以将包含第1语言的原文、第2语言的翻译文以及第1语言的逆向翻译文的翻译结果信息发送给翻译装置2。
翻译装置2将原文和逆向翻译文提示给用户。翻译装置2基于所提示的原文和逆向翻译文,受理由用户对翻译文被翻译得是否正确的判定结果的输入。
误译判断部16a基于从翻译装置2接收到的判定结果信息,判断翻译文被翻译得是否正确。误译判断部16a在翻译文被翻译得不正确的情况下,生成包含原文、与翻译文对应的误译文和逆向翻译文的对译数据,并存储于对译数据存储部22a。即,在受理到翻译文被翻译得不正确这一判定结果的情况下,误译判断部16a生成对译数据。另外,误译判断部16a在翻译文被翻译得正确的情况下,生成包含原文和翻译文的第1对译数据、以及包含翻译文和逆向翻译文的第2对译数据,并向对译语料库登记部20a输出。
对译数据存储部22a存储由误译判断部16a判断为翻译文被翻译得不正确从而生成的包含原文、误译文和逆向翻译文的对译数据。
修正对译数据接收部18a从多个终端装置3的各个接收包含原文、将误译文修正正确后的修正翻译文、和将逆向翻译文修正正确后的修正逆向翻译文的多个修正对译数据。
对译语料库存储部19a存储对译语料库,所述对译语料库使由第1语言构成的原文与该原文的向第2语言翻译的翻译文相关联。对译语料库包含使第1语言的原文与将该原文向第2语言翻译而得到的翻译文成对的译文对。另外,对译语料库包含使第2语言的翻译文与将该翻译文向第1语言翻译而得到的逆向翻译文成对的译文对。
对译语料库登记部20a将由修正对译数据接收部18a接收到的多个修正对译数据登记于对译语料库存储部19a。对译语料库登记部20a将由修正对译数据接收部18a接收到的修正对译数据新登记于对译语料库存储部19a所存储的对译语料库。对译语料库登记部20a将原文与修正翻译文相关联地登记于对译语料库,并且将修正逆向翻译文与修正翻译文相关联地登记于对译语料库。
机器模型学习部21a利用对译语料库来学习机器翻译模型存储部12a所存储的第1机器翻译模型。另外,机器模型学习部21a利用对译语料库来学习机器翻译模型存储部12a所存储的第2机器翻译模型。机器模型学习部21a在由对译语料库登记部20a登记了新的对译语料库的情况下,对机器翻译模型存储部12a所存储的第1机器翻译模型以及第2机器翻译模型进行再学习。
图8是用于对本公开的实施方式2的翻译系统中的翻译处理进行说明的第1流程图,图9是用于对本公开的实施方式2的翻译系统中的翻译处理进行说明的第2流程图。
此外,图8所示的步骤S31~步骤S35的处理与图3所示的步骤S1~步骤S5的处理相同,因此省略说明。
接着,在步骤S36中,机器翻译部13a生成将第2语言的翻译文翻译成第1语言而得到的逆向翻译文。
接着,在步骤S37中,翻译结果发送部14a将包含第1语言的原文和第1语言的逆向翻译文的翻译结果信息发送给翻译装置2。
接着,在步骤S38中,翻译装置2接收由服务器1a发送来的翻译结果信息。
接着,在步骤S39中,翻译装置2基于接收到的翻译结果信息,显示原文以及逆向翻译文。
接着,在步骤S40中,翻译装置2受理由用户对翻译文被翻译得是否正确的判定结果的输入。用户确认显示出的逆向翻译文,判定其相对于自身输入的原文,被翻译得是否正确。即,如果翻译文是翻译得正确的译文,则将翻译文进行翻译而得到的逆向翻译文的语义内容与原文的语义内容相同。因此,即使是无法理解第2语言的用户,也能够通过比较原文与逆向翻译文,判定翻译文被翻译得是否正确。翻译装置2例如显示当翻译得正确的情况下按压的按钮、和当翻译得不正确的情况下按压的按钮,用户按压某个按钮。
此外,图8所示的步骤S41~步骤S44的处理与图3所示的步骤S10~步骤S13的处理相同,因此省略说明。
在判断为翻译文被翻译得正确的情况下(步骤S44:是),在步骤S45中,误译判断部16a生成包含原文和翻译文的第1对译数据、以及包含逆向翻译文和翻译文的第2对译数据。误译判断部16a向对译语料库登记部20a输出所生成的第1对译数据以及第2对译数据。
接着,在步骤S46中,对译语料库登记部20a将由误译判断部16a生成的第1对译数据以及第2对译数据登记于对译语料库存储部19a所存储的对译语料库。
此外,在本实施方式2中,将使原文与翻译得正确的翻译文成对的第1对译数据、和使逆向翻译文与翻译文成对的第2对译数据登记于对译语料库,但本公开不特别限定于此,也可以不将第1对译数据以及第2对译数据登记于对译语料库。在该情况下,当在步骤S44中判断为翻译文被翻译得正确时,结束翻译处理。
另一方面,在判断为翻译文被翻译得不正确的情况下(步骤S44:否),在步骤S47中,误译判断部16a生成包含原文、与翻译文对应的误译文和逆向翻译文的对译数据。
接着,在步骤S48中,误译判断部16a将生成的对译数据存储于对译数据存储部22a。
接着,在步骤S49中,对译数据发送部17读出存储于对译数据存储部22的对译数据,将读出的对译数据发送给多个终端装置3。
接着,在步骤S50中,终端装置3接收由服务器1a发送来的对译数据。此外,在图9的流程图中,对多个终端装置中的一个终端装置发送了对译数据,但对其他终端装置也发送了对译数据,在各个终端装置中进行同样的处理。
接着,在步骤S51中,终端装置3基于接收到的对译数据,显示原文、误译文以及逆向翻译文。
接着,在步骤S52中,终端装置3受理由翻译者对所显示的误译文以及逆向翻译文的修正。翻译者确认显示出的原文和误译文并且确认显示出的原文和逆向翻译文,将误译文修正成正确的翻译文并且将逆向翻译文修正成正确的逆向翻译文。终端装置3例如具备键盘、鼠标或者触摸面板等输入部,输入部受理由翻译者对误译文以及逆向翻译文的修正。
图10是表示在本实施方式2中用于受理误译文以及逆向翻译文的修正的显示画面的一例的图。
如图10所示,终端装置3显示显示画面43,显示画面43包含第1语言的原文51、第2语言的误译文52、用于使用户输入对误译文的修正的输入栏53、第1语言的逆向翻译文56、用于使用户输入对逆向翻译文的修正的输入栏57、和用于向服务器1a发送修正后的译文的发送按钮54。翻译者输入将第2语言的误译文修正后的修正译文,并且输入将第1语言的逆向翻译文修正后的修正逆向翻译文。
在图10所示的例子中,显示出“ジュースはいかがですか。”这一第1语言的原文51,并显示出“How is Juice?”这一误译文52。对此,翻译者在输入栏53输入将原文正确进行翻译而得到的“How about Juice?”这一修正译文。另外,显示出“ジュースはどうですか。(果汁怎么样)”这一第1语言的逆向翻译文56。对此,翻译者在输入栏57输入将翻译文正确进行逆向翻译而得到的“ジュースはいかがですか。”这一修正逆向翻译文。而且,在修正译文以及修正逆向翻译文的输入完成时,翻译者按压发送按钮54。
返回到图9,接着,在步骤S53中,终端装置3判断由翻译者对误译文以及逆向翻译文的修正是否完成。终端装置3在图10所示的发送按钮54被按压的情况下,判断为由翻译者对误译文以及逆向翻译文的修正已完成。在此,在判断为误译文以及逆向翻译文的修正尚未完成的情况下(步骤S53:否),返回到步骤S52的处理。
另一方面,在判断为误译文以及逆向翻译文的修正已完成的情况下(步骤S53:是),在步骤S54中,终端装置3向服务器1a发送包含原文、将误译文修正正确后的修正翻译文、和将逆向翻译文修正正确后的修正逆向翻译文的修正对译数据。
接着,在步骤S55中,服务器1a的修正对译数据接收部18a接收由终端装置3发送来的修正对译数据。此外,修正对译数据接收部18a从多个终端装置3的各个接收修正对译数据。
接着,在步骤S56中,对译语料库登记部20a将由修正对译数据接收部18a接收到的修正对译数据所包含的原文与修正翻译文相关联地登记于对译语料库存储部19a所存储的对译语料库,并且将修正逆向翻译文与修正翻译文相关联地登记于对译语料库。
此外,在本实施方式2中,也与本实施方式1的变形例同样地,终端装置3也可以受理误译文以及逆向翻译文的修正、并且受理与原文相似的相似文的输入。在该情况下,多个修正对译数据的各个也可以包含修正翻译文、修正逆向翻译文和修正原文(原文的相似文),修正原文是与原文在语义上相同、在表现上不同的文句。
(实施方式3)
在上述的实施方式2中,将原文和逆向翻译文提示给用户,基于提示的原文和逆向翻译文,受理由用户对翻译文被翻译得是否正确的判定结果的输入,而在实施方式3中,解析原文的语义并且解析逆向翻译文的语义,判断原文的语义与逆向翻译文的语义是否相同,在判断为原文的语义与逆向翻译文的语义不相同的情况下,生成对译数据。
图11是表示本公开的实施方式3中的服务器的构成的图。
图11所示的服务器1b具备翻译对象取得部11、机器翻译模型存储部12a、机器翻译部13a、误译判断部16b、对译数据发送部17、修正对译数据接收部18a、对译语料库存储部19a、对译语料库登记部20a、机器模型学习部21a、对译数据存储部22a、翻译结果解析部23以及翻译结果发送部24。
此外,翻译装置2也可以具备服务器1b的一部分或者全部的构成。
翻译结果解析部23解析原文的语义,并且解析逆向翻译文的语义。更具体而言,翻译结果解析部23针对原文进行词素解析、句法解析以及语义解析,取得原文的语义框架,并且针对逆向翻译文进行词素解析、句法解析以及语义解析,取得逆向翻译文的语义框架。
误译判断部16b判断原文的语义与逆向翻译文的语义是否相同。误译判断部16b判断原文的语义框架与逆向翻译文的语义框架是否相同。误译判断部16b在判断为原文的语义与逆向翻译文的语义不相同的情况下,生成对译数据。即,在原文的语义与将原文的翻译文进行逆向翻译而得到的逆向翻译文的语义相同的情况下,能够判断为原文的翻译文被翻译得正确。于是,误译判断部16b在判断为原文的语义与逆向翻译文的语义不相同的情况下,生成包含原文、与翻译文对应的误译文和逆向翻译文的对译数据,并存储于对译数据存储部22a。
翻译结果发送部24在由误译判断部16b判断为原文的语义与逆向翻译文的语义相同的情况下,将包含第1语言的原文、第2语言的翻译文和第1语言的逆向翻译文的翻译结果信息发送给翻译装置2。此外,翻译结果发送部24也可以将仅包含第2语言的翻译文的翻译结果信息发送给翻译装置2。翻译装置2在从服务器1b接收到翻译结果信息时,将原文、翻译文和逆向翻译文提示给用户。
此外,逆向翻译文是为了判断原文翻译得是否正确所使用的译文,因而,翻译结果发送部24也可以将包含第1语言的原文和第2语言的翻译文、不包含逆向翻译文的翻译结果信息发送给翻译装置2。
另外,在判断为原文的语义与逆向翻译文的语义不相同、即原文的翻译文被翻译得不正确的情况下,翻译结果发送部24也可以将表示没能正确地翻译原文这一情况的信息发送给翻译装置2,翻译装置2也可以不显示原文的翻译结果。在该情况下,翻译装置2也可以将没能正确地翻译原文这一情况通知给用户。再者,翻译结果发送部24也可以将包含原文、没能正确地翻译所得到的误译文以及逆向翻译文的翻译结果信息发送给翻译装置2,翻译装置2也可以显示原文、误译文和逆向翻译文。
图12是用于对本公开的实施方式3的翻译系统中的翻译处理进行说明的第1流程图,图13是用于对本公开的实施方式3的翻译系统中的翻译处理进行说明的第2流程图。
此外,图12所示的步骤S61~步骤S66的处理与图8所示的步骤S31~步骤S36的处理相同,因此省略说明。
接着,在步骤S67中,翻译结果解析部23解析原文的语义。
接着,在步骤S68中,翻译结果解析部23解析逆向翻译文的语义。
接着,在步骤S69中,误译判断部16b判断原文的语义与逆向翻译文的语义是否相同。在此,在判断为原文的语义与逆向翻译文的语义相同的情况下(步骤S69:是),在步骤S70中,翻译结果发送部24将包含第1语言的原文、第2语言的翻译文和第1语言的逆向翻译文的翻译结果信息发送给翻译装置2。
接着,在步骤S71中,翻译装置2接收由服务器1b发送来的翻译结果信息。
接着,在步骤S72中,翻译装置2基于接收到的翻译结果信息,显示原文、翻译文以及逆向翻译文。
另外,在与步骤S71以及步骤S72的翻译装置2的处理并行进行的步骤S73中,服务器1b的误译判断部16b生成包含原文和翻译文的第1对译数据、以及包含逆向翻译文和翻译文的第2对译数据。误译判断部16b将生成的第1对译数据以及第2对译数据输出给对译语料库登记部20a。
接着,在步骤S74中,对译语料库登记部20a将由误译判断部16b生成的第1对译数据以及第2对译数据登记于对译语料库存储部19a所存储的对译语料库。
此外,在本实施方式3中,将使原文与翻译得正确的翻译文成对的第1对译数据、和使逆向翻译文与翻译文成对的第2对译数据登记于对译语料库,但本公开不特别限定于此,也可以不将第1对译数据以及第2对译数据登记于对译语料库。在该情况下,当在步骤S69中判断为原文的语义与逆向翻译文的语义相同时,结束翻译处理。
另一方面,在判断为原文的语义与逆向翻译文的语义不相同的情况下(步骤S69:否),在步骤S75中,误译判断部16b生成包含原文、与翻译文对应的误译文和逆向翻译文的对译数据。
接着,在步骤S76中,误译判断部16b将生成的对译数据存储于对译数据存储部22a。
此外,图13所示的步骤S77~步骤S84的处理与图9所示的步骤S49~步骤S56的处理相同,因此省略说明。
此外,在本实施方式3中,也与本实施方式1的变形例同样地,终端装置3也可以受理误译文以及逆向翻译文的修正、并且受理与原文相似的相似文的输入。在该情况下,多个修正对译数据的各个也可以包含修正翻译文、修正逆向翻译文和修正原文(原文的相似文),修正原文是与原文在语义上相同、在表现上不同的文句。
产业上的可利用性
本公开涉及的翻译方法、翻译装置以及翻译程序能够大量收集使原文与翻译文成对的例文,并且能够防止误译的发生,作为进行第1语言与不同于所述第1语言的第2语言之间的翻译处理的翻译方法、翻译装置以及翻译程序是有用的。

Claims (9)

1.一种翻译方法,是翻译装置中的翻译方法,所述翻译装置进行第1语言与不同于所述第1语言的第2语言之间的翻译处理,所述翻译方法包括:
取得作为翻译对象的所述第1语言的原文,
生成将所述原文翻译成所述第2语言而得到的翻译文,
在所述翻译文翻译得不正确的情况下,生成包含所述原文和与所述翻译文对应的误译文的对译数据,
向至少一个终端装置发送所述对译数据,
从所述至少一个终端装置接收包含所述原文和将所述误译文修正正确后的修正翻译文的至少一个修正对译数据,
将接收到的所述至少一个修正对译数据登记于存储部,所述存储部将所述第1语言的文与所述第2语言的翻译文成对地进行存储。
2.根据权利要求1所述的翻译方法,
所述至少一个修正对译数据包含所述修正翻译文和修正原文,所述修正原文是与所述原文在语义上相同、在表现上不同的文句。
3.根据权利要求2所述的翻译方法,
还包括:对接收到的所述至少一个修正对译数据所包含的所述修正原文的语义进行解析,
在包含具有相同语义的所述修正原文的修正对译数据的数量为预定数量以上的情况下,将该修正对译数据登记于所述存储部。
4.根据权利要求1至3中任一项所述的翻译方法,
还包括:将所述原文和所述翻译文提示给用户,
基于所提示的所述原文和所述翻译文,受理由所述用户对所述翻译文被翻译得是否正确的判定结果的输入,
在受理到所述翻译文被翻译得不正确这一判定结果的情况下,生成所述对译数据。
5.根据权利要求1至3中任一项所述的翻译方法,
还包括:生成将所述翻译文翻译成所述第1语言而得到的逆向翻译文,
将所述原文和所述逆向翻译文提示给用户,
基于所提示的所述原文和所述逆向翻译文,受理由用户对所述翻译文被翻译得是否正确的判定结果的输入,
在受理到所述翻译文被翻译得不正确这一判定结果的情况下,生成所述对译数据。
6.根据权利要求5所述的翻译方法,
在所述翻译文被翻译得不正确的情况下,生成包含所述原文、所述误译文和所述逆向翻译文的所述对译数据,
向所述至少一个终端装置发送所述对译数据,
从所述至少一个终端装置接收包含所述原文、将所述误译文修正正确后的修正翻译文、和将所述逆向翻译文修正正确后的修正逆向翻译文的所述至少一个修正对译数据,
将接收到的所述至少一个修正对译数据登记于所述存储部。
7.根据权利要求1至3中任一项所述的翻译方法,
还包括:生成将所述翻译文翻译成所述第1语言而得到的逆向翻译文,
解析所述原文的语义,并且解析所述逆向翻译文的语义,
判断所述原文的语义与所述逆向翻译文的语义是否相同,
在判断为所述原文的语义与所述逆向翻译文的语义不相同的情况下,生成所述对译数据。
8.一种翻译装置,是进行第1语言与不同于所述第1语言的第2语言之间的翻译处理的翻译装置,具备:
存储部,其将所述第1语言的文与所述第2语言的翻译文成对地进行存储;
取得部,其取得作为翻译对象的所述第1语言的原文;
翻译文生成部,其生成将所述原文翻译成所述第2语言而得到的翻译文;
对译数据生成部,其在所述翻译文翻译得不正确的情况下,生成包含所述原文和与所述翻译文对应的误译文的对译数据;
发送部,其向至少一个终端装置发送所述对译数据;
接收部,其从所述至少一个终端装置接收包含所述原文和将所述误译文修正正确后的修正翻译文的至少一个修正对译数据;以及
登记部,其将接收到的所述至少一个修正对译数据登记于所述存储部。
9.一种翻译程序,是用于进行第1语言与不同于所述第1语言的第2语言之间的翻译处理的翻译程序,使计算机作为如下单元发挥功能:
存储部,其将所述第1语言的文与所述第2语言的翻译文成对地进行存储;
取得部,其取得作为翻译对象的所述第1语言的原文;
翻译文生成部,其生成将所述原文翻译成所述第2语言而得到的翻译文;
对译数据生成部,其在所述翻译文翻译得不正确的情况下,生成包含所述原文和与所述翻译文对应的误译文的对译数据;
发送部,其向至少一个终端装置发送所述对译数据;
接收部,其从所述至少一个终端装置接收包含所述原文和将所述误译文修正正确后的修正翻译文的至少一个修正对译数据;以及
登记部,其将接收到的所述至少一个修正对译数据登记于所述存储部。
CN201810735086.0A 2017-07-14 2018-07-06 翻译方法、翻译装置以及记录介质 Active CN109255129B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-137828 2017-07-14
JP2017137828A JP7030434B2 (ja) 2017-07-14 2017-07-14 翻訳方法、翻訳装置及び翻訳プログラム

Publications (2)

Publication Number Publication Date
CN109255129A true CN109255129A (zh) 2019-01-22
CN109255129B CN109255129B (zh) 2023-11-07

Family

ID=64999537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810735086.0A Active CN109255129B (zh) 2017-07-14 2018-07-06 翻译方法、翻译装置以及记录介质

Country Status (3)

Country Link
US (1) US10832012B2 (zh)
JP (1) JP7030434B2 (zh)
CN (1) CN109255129B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111508484A (zh) * 2019-01-31 2020-08-07 阿里巴巴集团控股有限公司 语音数据的处理方法及装置
CN112215015A (zh) * 2020-09-02 2021-01-12 文思海辉智科科技有限公司 翻译文本修订方法、装置、计算机设备和存储介质
CN112434537A (zh) * 2020-11-24 2021-03-02 掌阅科技股份有限公司 翻译文本一致性校验方法、计算设备及存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6775202B2 (ja) * 2017-06-19 2020-10-28 パナソニックIpマネジメント株式会社 処理方法、処理装置、及び処理プログラム
JP7170984B2 (ja) * 2018-03-02 2022-11-15 国立研究開発法人情報通信研究機構 疑似対訳データ生成装置、機械翻訳処理装置、および疑似対訳データ生成方法
US10929617B2 (en) * 2018-07-20 2021-02-23 International Business Machines Corporation Text analysis in unsupported languages using backtranslation
JP7322428B2 (ja) * 2019-02-28 2023-08-08 富士フイルムビジネスイノベーション株式会社 学習装置及び学習プログラム並びに文生成装置及び文生成プログラム
US20220138088A1 (en) * 2019-03-08 2022-05-05 Micro Focus Llc Internationalization of automated test scripts
US11507760B2 (en) 2019-06-07 2022-11-22 Semiconductor Energy Laboratory Co., Ltd. Machine translation method, machine translation system, program, and non-transitory computer-readable storage medium
US20220300714A1 (en) * 2019-11-07 2022-09-22 Sony Group Corporation Information processing apparatus, information processing method, and information processing program
CN111368561A (zh) 2020-02-28 2020-07-03 北京字节跳动网络技术有限公司 平行语料获取方法、装置、电子设备、及存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040230418A1 (en) * 2002-12-19 2004-11-18 Mihoko Kitamura Bilingual structural alignment system and method
CN101034395A (zh) * 2007-03-30 2007-09-12 传神联合(北京)信息技术有限公司 一种待译文件处理系统及使用这种系统的文件处理方法
US20080195372A1 (en) * 2007-02-14 2008-08-14 Jeffrey Chin Machine Translation Feedback
CN101295298A (zh) * 2007-04-23 2008-10-29 株式会社船井电机新应用技术研究所 翻译系统、翻译系统的控制方法以及对译数据生成方法
US20110022381A1 (en) * 2009-07-21 2011-01-27 International Business Machines Corporation Active learning systems and methods for rapid porting of machine translation systems to new language pairs or new domains
CN102043774A (zh) * 2011-01-13 2011-05-04 北京交通大学 机器翻译测评装置和方法
CN102170553A (zh) * 2010-02-26 2011-08-31 夏普株式会社 会议系统、信息处理装置、会议辅助方法及信息处理方法
CN102591856A (zh) * 2011-01-04 2012-07-18 杨东佐 一种翻译系统及翻译方法
CN103150382A (zh) * 2013-03-14 2013-06-12 中国科学院计算技术研究所 基于开放知识库的短文本语义概念自动化扩展方法及系统
CN103440314A (zh) * 2013-08-27 2013-12-11 北京工业大学 一种基于Ontology的语义检索方法
CN103729347A (zh) * 2012-10-10 2014-04-16 株式会社东芝 机器翻译装置、方法及程序
CN103793322A (zh) * 2012-11-05 2014-05-14 深圳中兴网信科技有限公司 一种针对软件本地化测试中翻译问题的检测方法及系统
CN104391852A (zh) * 2014-09-15 2015-03-04 国家电网公司 一种建立关键词词库的方法和装置
CN104731777A (zh) * 2015-03-31 2015-06-24 网易有道信息技术(北京)有限公司 一种译文评价方法及装置
CN106202059A (zh) * 2015-05-25 2016-12-07 松下电器(美国)知识产权公司 机器翻译方法以及机器翻译装置
CN106383818A (zh) * 2015-07-30 2017-02-08 阿里巴巴集团控股有限公司 一种机器翻译方法及装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0968475B1 (en) * 1997-05-28 2001-12-19 Shinar Linguistic Technologies Inc. Translation system
JP2004156806A (ja) 2002-11-05 2004-06-03 Sanyo Electric Co Ltd 温冷熱システム
US7383542B2 (en) * 2003-06-20 2008-06-03 Microsoft Corporation Adaptive machine translation service
US7539619B1 (en) * 2003-09-05 2009-05-26 Spoken Translation Ind. Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy
US8898052B2 (en) * 2006-05-22 2014-11-25 Facebook, Inc. Systems and methods for training statistical speech translation systems from speech utilizing a universal speech recognizer
US8972268B2 (en) * 2008-04-15 2015-03-03 Facebook, Inc. Enhanced speech-to-speech translation system and methods for adding a new word
US8078451B2 (en) * 2006-10-27 2011-12-13 Microsoft Corporation Interface and methods for collecting aligned editorial corrections into a database
JP2008123234A (ja) 2006-11-10 2008-05-29 Nec Corp 翻訳サーバ装置、翻訳システム、翻訳方法、翻訳プログラム
US20090326913A1 (en) * 2007-01-10 2009-12-31 Michel Simard Means and method for automatic post-editing of translations
JP2009122989A (ja) 2007-11-15 2009-06-04 Junichi Shibuya 翻訳装置
US8930176B2 (en) * 2010-04-01 2015-01-06 Microsoft Corporation Interactive multilingual word-alignment techniques
US20130054224A1 (en) * 2011-08-30 2013-02-28 Dublin City University Method and system for enhancing text alignment between a source language and a target language during statistical machine translation
KR20130047471A (ko) * 2011-10-31 2013-05-08 한국전자통신연구원 자동번역 시스템의 패러프레이징 데이터 구축방법
US9152622B2 (en) * 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
JP6175900B2 (ja) 2013-05-23 2017-08-09 富士通株式会社 翻訳装置、方法、及びプログラム
US9213694B2 (en) * 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US9442922B2 (en) * 2014-11-18 2016-09-13 Xerox Corporation System and method for incrementally updating a reordering model for a statistical machine translation system
JP6655788B2 (ja) * 2016-02-01 2020-02-26 パナソニックIpマネジメント株式会社 対訳コーパス作成方法、該装置および該プログラムならびに機械翻訳システム
US10460040B2 (en) * 2016-06-27 2019-10-29 Facebook, Inc. Language model using reverse translations
US10248651B1 (en) * 2016-11-23 2019-04-02 Amazon Technologies, Inc. Separating translation correction post-edits from content improvement post-edits in machine translated content
US10679014B2 (en) * 2017-06-08 2020-06-09 Panasonic Intellectual Property Management Co., Ltd. Method for providing translation information, non-transitory computer-readable recording medium, and translation information providing apparatus

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040230418A1 (en) * 2002-12-19 2004-11-18 Mihoko Kitamura Bilingual structural alignment system and method
US20080195372A1 (en) * 2007-02-14 2008-08-14 Jeffrey Chin Machine Translation Feedback
CN101034395A (zh) * 2007-03-30 2007-09-12 传神联合(北京)信息技术有限公司 一种待译文件处理系统及使用这种系统的文件处理方法
CN101295298A (zh) * 2007-04-23 2008-10-29 株式会社船井电机新应用技术研究所 翻译系统、翻译系统的控制方法以及对译数据生成方法
US20110022381A1 (en) * 2009-07-21 2011-01-27 International Business Machines Corporation Active learning systems and methods for rapid porting of machine translation systems to new language pairs or new domains
CN102170553A (zh) * 2010-02-26 2011-08-31 夏普株式会社 会议系统、信息处理装置、会议辅助方法及信息处理方法
CN102591856A (zh) * 2011-01-04 2012-07-18 杨东佐 一种翻译系统及翻译方法
CN102043774A (zh) * 2011-01-13 2011-05-04 北京交通大学 机器翻译测评装置和方法
CN103729347A (zh) * 2012-10-10 2014-04-16 株式会社东芝 机器翻译装置、方法及程序
CN103793322A (zh) * 2012-11-05 2014-05-14 深圳中兴网信科技有限公司 一种针对软件本地化测试中翻译问题的检测方法及系统
CN103150382A (zh) * 2013-03-14 2013-06-12 中国科学院计算技术研究所 基于开放知识库的短文本语义概念自动化扩展方法及系统
CN103440314A (zh) * 2013-08-27 2013-12-11 北京工业大学 一种基于Ontology的语义检索方法
CN104391852A (zh) * 2014-09-15 2015-03-04 国家电网公司 一种建立关键词词库的方法和装置
CN104731777A (zh) * 2015-03-31 2015-06-24 网易有道信息技术(北京)有限公司 一种译文评价方法及装置
CN106202059A (zh) * 2015-05-25 2016-12-07 松下电器(美国)知识产权公司 机器翻译方法以及机器翻译装置
CN106383818A (zh) * 2015-07-30 2017-02-08 阿里巴巴集团控股有限公司 一种机器翻译方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
SIMON RECEVEUR等: "Turbo Automatic Speech Recognition", IEEE, vol. 24, no. 5, pages 846, XP011604437, DOI: 10.1109/TASLP.2016.2520364 *
王亚东等: "英汉红色文化平行语料库的构建及应用", 海外英语, no. 11, pages 192 *
王克非等: "用于翻译教学与研究的英汉对应语料库加工处理", 外语电化教学, no. 130, pages 3 *
王立群;: "依存关系正确理解的基础上的日中翻译", 电脑知识与技术, no. 28, pages 8011 *
苏劲松等: "引入基于主题复述知识的统计机器翻译模型", 浙江大学学报, vol. 48, no. 10, pages 1843 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111508484A (zh) * 2019-01-31 2020-08-07 阿里巴巴集团控股有限公司 语音数据的处理方法及装置
CN111508484B (zh) * 2019-01-31 2024-04-19 阿里巴巴集团控股有限公司 语音数据的处理方法及装置
CN112215015A (zh) * 2020-09-02 2021-01-12 文思海辉智科科技有限公司 翻译文本修订方法、装置、计算机设备和存储介质
CN112434537A (zh) * 2020-11-24 2021-03-02 掌阅科技股份有限公司 翻译文本一致性校验方法、计算设备及存储介质

Also Published As

Publication number Publication date
US20190018842A1 (en) 2019-01-17
CN109255129B (zh) 2023-11-07
US10832012B2 (en) 2020-11-10
JP2019020950A (ja) 2019-02-07
JP7030434B2 (ja) 2022-03-07

Similar Documents

Publication Publication Date Title
CN109255129A (zh) 翻译方法、翻译装置以及翻译程序
KR102401942B1 (ko) 번역품질 평가 방법 및 장치
TWI677796B (zh) 自然語言的語義提取方法及裝置和電腦儲存介質
CN110705301B (zh) 实体关系抽取方法及装置、存储介质、电子设备
US20190377788A1 (en) Methods and systems for language-agnostic machine learning in natural language processing using feature extraction
JP6182272B2 (ja) 自然表現の処理方法、処理及び応答方法、装置、及びシステム
CN104731777B (zh) 一种译文评价方法及装置
CN111931517B (zh) 文本翻译方法、装置、电子设备以及存储介质
CN107704453A (zh) 一种文字语义分析方法、文字语义分析终端及存储介质
TWI798652B (zh) 一種自動生成數據採集模組的方法和系統
CN109657251A (zh) 用于翻译语句的方法和装置
CN106383875A (zh) 基于人工智能的人机交互方法和装置
CN107861954A (zh) 基于人工智能的信息输出方法和装置
CN110489747A (zh) 一种图像处理方法、装置、存储介质及电子设备
CN107291775A (zh) 错误样本的修复语料生成方法和装置
WO2004055691A1 (ja) 翻訳支援システムおよびそのプログラム
JP2018197901A (ja) 翻訳文生成方法、翻訳文生成装置及び翻訳文生成プログラム
CN103064967A (zh) 一种用于建立用户二元关系库的方法与设备
CN110232328A (zh) 一种征信报告解析方法、装置及计算机可读存储介质
JP2022099042A (ja) 対話知識作成装置及び対話知識作成プログラム
CN108376071A (zh) 一种app识别方法及系统
KR20100096335A (ko) 한국어 단문 메시지 스팸 필터링 시스템 및 방법
CN111475403A (zh) 测试脚本的动态生成方法及相关装置
CN116822477B (zh) 一种法律文书自动生成系统
CN113703819B (zh) 一种动态消息解析方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant