CN109033091A - 翻译信息提供方法、程序以及装置 - Google Patents
翻译信息提供方法、程序以及装置 Download PDFInfo
- Publication number
- CN109033091A CN109033091A CN201810561965.6A CN201810561965A CN109033091A CN 109033091 A CN109033091 A CN 109033091A CN 201810561965 A CN201810561965 A CN 201810561965A CN 109033091 A CN109033091 A CN 109033091A
- Authority
- CN
- China
- Prior art keywords
- translation
- text
- converse
- language
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本公开涉及翻译信息提供方法、翻译信息提供程序以及翻译信息提供装置。翻译信息提供装置具备:正向翻译执行部,其生成将第一语言的第一原文翻译成第二语言而得到的第一翻译文;逆向翻译执行部,其生成将第一翻译文逆向翻译成第一语言而得到的第一逆向翻译文;以及翻译结果输出部,其输出第一原文和第一翻译文中的至少一方、以及作为第一逆向翻译文而与第一原文在语义上一致或者相似的逆向翻译文。
Description
技术领域
本公开涉及从原文生成翻译文的翻译信息提供方法、翻译信息提供程序以及翻译信息提供装置。
背景技术
近年来,将第1语言的语句(文)翻译成与第1语言不同的第2语言的语句的机器翻译正在被进行研究及开发。为了这种机器翻译的性能提高和/或用户体验的提升,提出了将翻译成第2语言的语句进一步逆向翻译成第1语言的语句并对逆向翻译的结果加以使用的方法。
例如专利文献1中公开了机器翻译文的评价装置,该评价装置评价将由第1语言表达的原文机器翻译成第2语言而得到的正向(顺向)翻译文是否优良,具备:正向机器翻译部,其取得原文并将原文机器翻译成第2语言的正向翻译文;n个逆向机器翻译部,各个逆向机器翻译部将正向翻译文机器翻译成第1语言从而生成逆向翻译文,其中n≥2;以及评价部,其基于表示所述n个逆向翻译部生成的n个逆向翻译文与所述原文的一致或者相似度的得分(score),评价正向翻译文是否优良。
另外,专利文献2中公开了机器翻译装置,该装置具有:输入单元,其从外部输入由第1语言表达的一个原文;翻译单元,其将原文分别翻译成由第2语言表达的多个翻译文;再翻译单元,其将各翻译文分别再翻译成由第1语言表达的各再翻译文;以及显示单元,其显示原文、各翻译文、各再翻译文,在机器翻译装置中,具备第1判断单元和显示控制单元,所述第1判断单元比较原文与各再翻译文,判断原文与再翻译文的差异,所述显示控制单元基于第1判断单元的判断结果,进行能够识别具有该差异的文句的识别显示。
另外,专利文献3中公开了翻译方法,该翻译方法包括:取得步骤,取得成为翻译对象的原文;双方向翻译步骤,按多个翻译策略(policy)的各个,执行正向的翻译来获得与原文对应的译文,进而执行逆向的翻译来从译文获得逆向译文;排序(ranking)步骤,根据按多个翻译策略得到的逆向译文与原文之间的相似度,将翻译策略进行排序;显示步骤,将按多个翻译策略得到的译文与排序进行关联而显示,其中,正向的翻译和逆向的翻译按各翻译策略一贯地进行。
另外,专利文献4中公开了机器翻译系统中的机器翻译方法,该机器翻译系统连接到输出语言信息的信息输出装置,进行第1语言与第2语言之间的翻译处理,该机器翻译方法包括:接收第1语言的翻译对象文;生成将接收到的翻译对象文向第2语言进行翻译而得到的多个不同的正向翻译文;对于多个不同的所述正向翻译文的各个,生成向第1语言进行逆向翻译而得到的多个逆向翻译文;当在信息输出装置中输出多个逆向翻译文时,受理到从多个逆向翻译文中选择一个逆向翻译文的操作的情况下,将与一个逆向翻译文对应的正向翻译文输出。
现有技术文献
专利文献1:日本专利第3936687号公报
专利文献2:日本特开2006-127356号公报
专利文献3:日本特开2016-71439号公报
专利文献4:日本特开2016-218995号公报
发明内容
发明所要解决的问题
然而,在上述的现有技术中,完全没有提出和提及涉及逆向翻译文本身的品质改善的课题。另外,关于对于个别翻译器中的逆向翻译结果的、由多义词的模糊(blur)翻译引起的翻译品质的体验上的降低,也并没有提出问题和公开解决办法。
本公开是解决上述现有的问题而做出的,目的在于提供即使在翻译文包含由一个词表示两个以上意思的多义词的情况下也能够基于原文的内容进行逆向翻译文的品质改善、并且能够避免由多义词的模糊翻译引起的翻译品质的体验上的降低的翻译信息提供方法、翻译信息提供程序以及翻译信息提供装置。
用于解决问题的技术方案
本公开的一个技术方案的翻译信息提供方法,是翻译多种语言的翻译信息提供装置的翻译信息提供方法,所述翻译信息提供方法包括:生成将第一语言的第一原文翻译成第二语言而得到的第一翻译文,生成将所述第一翻译文逆向翻译成所述第一语言而得到的第一逆向翻译文,输出所述第一原文和所述第一翻译文中的至少一方、以及作为所述第一逆向翻译文而与所述第一原文在语义上一致或者相似的逆向翻译文。
发明效果
根据本公开,即使在翻译文包含由一个词表示两个以上意思的多义词的情况下,也能够基于原文的内容进行逆向翻译文的品质改善,并且能够避免由多义词的模糊翻译引起的翻译品质的体验上的降低。
附图说明
图1是表示本公开的实施方式1中的翻译信息提供装置的构成的一例的框图。
图2是表示由图1所示的翻译信息提供装置进行的翻译信息提供处理的一例的流程图。
图3是表示由图1所示的翻译信息提供装置进行的另一翻译信息提供处理的一例的流程图。
图4是表示图1所示的显示部所显示的翻译信息画面的第1例的图。
图5是表示图1所示的显示部所显示的翻译信息画面的第2例的图。
图6是表示图1所示的显示部所显示的翻译信息画面的第3例的图。
图7是表示图1所示的显示部所显示的翻译信息画面的第4例的图。
图8是表示本公开的实施方式2中的翻译信息提供装置的构成的一例的框图。
图9是表示图8所示的显示部所显示的翻译信息画面的第1例的图。
图10是表示图8所示的显示部所显示的翻译信息画面的第2例的图。
图11是表示图8所示的显示部所显示的翻译信息画面的第3例的图。
图12是表示图8所示的显示部所显示的另一翻译信息画面的第1例的图。
图13是表示图8所示的显示部所显示的另一翻译信息画面的第2例的图。
图14是表示图8所示的显示部所显示的另一翻译信息画面的第3例的图。
图15是表示图8所示的显示部所显示的另一翻译信息画面的第4例的图。
图16是表示图8所示的显示部所显示的另一翻译信息画面的第5例的图。
图17是表示图8所示的显示部所显示的另一翻译信息画面的第6例的图。
标号说明
1、1a翻译信息提供装置;11翻译对象输入部;12正向翻译执行部;13逆向翻译执行部;14逆向翻译决定部;15翻译结果输出部;16显示部;17翻译对象文选择部。
具体实施方式
(成为本公开的基础的见解)
如上所述,在现有的翻译器中,完全没有提出和提及涉及逆向翻译文本身的品质改善的课题,关于对于个别翻译器中的逆向翻译结果的、由多义词的模糊翻译引起的翻译品质的体验上的降低,也并没有提出问题和公开解决办法。
另一方面,在实际使用翻译器的场景中,若考虑从源语言向目标语言进行翻译的情况,由于翻译器的利用者不一定具有目标语言侧的知识,因而存在许多尽管看到被翻译成目标语言的翻译文却也不知道意思、无法判断翻译得是否准确的情况。
于是,通过将翻译文进一步向源语言进行逆向翻译并比较逆向翻译文与原本的源语言文,替换为对目标语言的翻译结果进行确认。如此,在实际利用现场,常常通过如(A)源语言文→(B)向目标语言的翻译文→(C)向源语言的逆向翻译文这样进行两次翻译来推测向目标语言的翻译结果的妥当性。
然而,在(B)向目标语言的翻译文所包含的词句中包括具有多义性的多义词的情况下,(B)向目标语言的翻译文被逆向翻译成(C)向源语言的逆向翻译文时,会成为文整体的意思发生变动的原因。
例如列举如下例子:作为(B)向目标语言的翻译文所包含的词句,有多义词“Bathroom(浴室、洗手间、厕所)”时,在(C)向源语言的逆向翻译文中,“Bathroom”能够翻译成“お風呂(浴室)”、“トイレ(厕所)”这样的多个词汇。在该情况下,当原文是“トイレはどこですか?(厕所在哪?)”这一语句时,若进行翻译及逆向翻译,则会成为如下这样。
原文:トイレはどこですか?(厕所在哪?)
翻译文:Where is a bathroom?(厕所/浴室在哪?)
逆向翻译文:お風呂はどこですか?(浴室在哪?)
在上述例子中,原文与逆向翻译文在源语言侧不一定在语义上一致,所以成为即使翻译文是准确的但也会误推定为不适当的原因。这是不论是基于规则(rule-base)和/或基于用例的翻译系统、还是统计翻译和/或神经(neural)翻译都可能会产生的问题。
例如翻译文“Where is a bathroom?”想要表达的意思是“トイレはどこですか?”还是“お風呂はどこですか?”,仅仅看到翻译文(该情况下为英文),是无法判断的。因而,根据现存的翻译方法(基于规则和/或基于用例、或者统计翻译和/或神经翻译),在学习数据中含有持多义性的多义词的时候,无法判断它原本应该是哪个意思。
因此,在前面的翻译文“Where is a bathroom?”的情况下,即使看到该翻译文,根据现有的翻译方法,也无法判断应该是所具有的多个意思中的哪个意思,而仅能够从学习数据所包含的用例和/或对译,输出将与翻译文对应的内容根据某些指标(概率分布和/或词典的更在开头所记载的内容等)排序后的排在前面的。因此,关于由多义词的模糊翻译引起的翻译品质的体验上的降低,如何对逆向翻译文其本身进行品质改善成为在实际利用场景中的重要课题。
为了解决上述问题,在本公开中,例如设置将原文、正向的翻译文与逆向的逆向翻译文进行关联而存储的逆向翻译决定部,从逆向的逆向翻译文的候选中选择与原文一致或者相似的文,作为逆向的逆向翻译文进行输出并显示。
即,在逆向翻译文的候选中有与原文在语义上一致或者相似的逆向翻译候选文时,即使是该逆向翻译候选文对于作为逆向的翻译器单体来说未必被评价为最好的翻译结果(例如达不到作为翻译结果来输出的程度)的情况下,通过与原文的比较,该逆向翻译候选文也能够被采用为更适当的输出。
另外,在现有的翻译器中,正向的翻译结果也能够取多个候选,而关于根据逆向的逆向翻译文与原文的相似度采用哪个正向的翻译结果,通过采用能够使逆向翻译文与原文的相似性增高的正向翻译结果,也可预见正向以及逆向的各向的语言利用者的体验上的翻译品质的提高,但关于这一点,上述的现有技术中也没有做出问题提示和/或解决办法的公开。
为了解决上述问题,在本公开中,例如对原文J进行翻译,获得翻译文JE的集合{JE(k)|k=1、…、n},进而对各个JE(k)进行逆向翻译,获得逆向翻译文JEJ的集合{JE(k)J(i(k))|k=1、…、n,i(k)=1、…、m}。在此,(k)以及(i(k))是表示元素的下标,n以及m是大于等于1的整数。另外,设置将原文、正向的翻译候选文与相对于各正向的翻译候选文的逆向的逆向翻译候选文进行关联而存储的逆向翻译决定部,从逆向的逆向翻译候选文中选择与原文一致或者相似的逆向翻译文,提取与所选择的逆向翻译文对应的正向的翻译文,分别作为正向以及逆向的翻译文进行输出并显示。
如上所述,通过将原文与逆向翻译文进行关联并选择与原文一致或者相似的逆向翻译文,能够使体验上的翻译品质提高。其结果,能够以低成本实现高精度的翻译器、翻译显示设备、翻译显示系统以及翻译显示方法等。
基于上述见解,本申请发明人用心对在翻译文包含由一个词表示两个以上意思的多义词的情况下应该如何选择或者决定从该翻译文逆向翻译而得到的逆向翻译文进行了研究,其结果,完成了本公开。
本公开的一个技术方案的翻译信息提供方法,是翻译多种语言的翻译信息提供装置的翻译信息提供方法,所述翻译信息提供方法包括:生成将第一语言的第一原文翻译成第二语言而得到的第一翻译文,生成将所述第一翻译文逆向翻译成所述第一语言而得到的第一逆向翻译文,输出所述第一原文和所述第一翻译文中的至少一方、以及作为所述第一逆向翻译文而与所述第一原文在语义上一致或者相似的逆向翻译文。
通过这种构成,生成将第一语言的第一原文翻译成第二语言而得到的第一翻译文,生成将第一翻译文逆向翻译成第一语言而得到的第一逆向翻译文,输出第一原文和第一翻译文中的至少一方、以及作为第一逆向翻译文而与第一原文在语义上一致或者相似的逆向翻译文,因此,与原文或者翻译文一起输出的逆向翻译文在语义上与原文一致或者相似,能够进行逆向翻译文的品质改善。另外,在逆向翻译文的候选中有与原文在语义上一致或者相似的逆向翻译文时,即使在作为逆向的翻译,该逆向翻译文未必被评价为最好的翻译结果(例如达不到作为翻译结果来输出的程度)的情况下,通过与原文的比较,该逆向翻译文也能够被采用为更适当的输出。因此,即使在翻译文包含由一个词表示两个以上意思的多义词的情况下,也能够基于原文的内容进行逆向翻译文的品质改善,并且能够避免由多义词的模糊翻译引起的翻译品质的体验上的降低。
也可以为,生成将所述第一语言的第二原文翻译成所述第二语言而得到的第二翻译文,所述第二原文与所述第一原文在语义上不同,生成将所述第二翻译文逆向翻译成所述第一语言而得到的第二逆向翻译文,当所述第一翻译文与所述第二翻译文在表现上相同的情况下,输出所述第二原文和所述第二翻译文中的至少一方、以及作为所述第二逆向翻译文而与所述第一逆向翻译文在语义上不同并且与所述第二原文在语义上一致或者相似的逆向翻译文。
通过这种构成,生成将与第一原文在语义上不同的第一语言的第二原文翻译成第二语言而得到的第二翻译文,生成将第二翻译文逆向翻译成第一语言而得到的第二逆向翻译文,当第一翻译文与第二翻译文在表现上相同的情况下,输出第二原文和第二翻译文中的至少一方、以及作为第二逆向翻译文而与第一逆向翻译文在语义上不同并且与第二原文在语义上一致或者相似的逆向翻译文,因此,当第一翻译文以及第二翻译文中存在多义词时,在尽管第一原文与第二原文在语义上不同、但与它们分别对应的第一翻译文以及第二翻译文几乎相同的情形下,能够根据第二原文的内容,使相对于第二翻译文的第二逆向翻译文成为与相对于第一翻译文的第一逆向翻译文不同的译文。
也可以为,生成将所述第一翻译文逆向翻译成所述第一语言而得到的多个第一逆向翻译文,从所述多个第一逆向翻译文中,生成包括与所述第一原文在语义上一致或者相似的至少一个逆向翻译文的第一逆向翻译文集合,输出所述第一原文和所述第一翻译文中的至少一方以及所述第一逆向翻译文集合。
通过这种构成,生成将第一翻译文逆向翻译成第一语言而得到的多个第一逆向翻译文,从多个第一逆向翻译文中,生成包括与第一原文在语义上一致或者相似的至少一个逆向翻译文的第一逆向翻译文集合,输出第一原文和第一翻译文中的至少一方以及第一逆向翻译文集合,因此,能够从多个第一逆向翻译文中提取与第一原文在语义上一致或者相似的逆向翻译文作为更好的逆向翻译文并生成第一逆向翻译文集合,能够将第一逆向翻译文集合与第一原文或者第一翻译文相关联并进行输出。
也可以为,生成将所述第一原文翻译成所述第二语言而得到的多个第一翻译文,生成将所述多个第一翻译文逆向翻译成所述第一语言而得到的多个第一逆向翻译文,从所述多个第一逆向翻译文中,生成包括与所述第一原文在语义上一致或者相似的至少一个逆向翻译文的第一逆向翻译文集合,输出所述第一原文和所述第一翻译文中的至少一方以及所述第一逆向翻译文集合。
通过这种构成,生成将第一原文翻译成第二语言而得到的多个第一翻译文,生成将多个第一翻译文逆向翻译成第一语言而得到的多个第一逆向翻译文,从多个第一逆向翻译文中,生成包括与第一原文在语义上一致或者相似的至少一个逆向翻译文的第一逆向翻译文集合,输出第一原文和第一翻译文中的至少一方以及第一逆向翻译文集合,因此,能够相对于多个第一翻译文的每一个生成至少一个第一逆向翻译文,能够从根据多个第一翻译文生成的第一逆向翻译文中提取与第一原文在语义上一致或者相似的逆向翻译文作为更好的逆向翻译文并生成第一逆向翻译文集合,能够将第一逆向翻译文集合与第一原文或者第一翻译文相关联并进行输出。
也可以为,算出表示所述第一逆向翻译文与所述第一原文在语义上一致或者相似的程度的相似度,生成包括所述相似度比预定值高的至少一个逆向翻译文的第一逆向翻译文集合,输出所述第一原文和所述第一翻译文中的至少一方以及所述第一逆向翻译文集合。
通过这种构成,算出表示第一逆向翻译文与第一原文在语义上一致或者相似的程度的相似度,生成包括相似度比预定值高的至少一个逆向翻译文的第一逆向翻译文集合,输出第一原文和所述第一翻译文中的至少一方以及第一逆向翻译文集合,因此,能够生成并输出包括与第一原文在语义上一致或者相似的逆向翻译文的第一逆向翻译文集合。
也可以为,将所述第一原文以及所述第一逆向翻译文集合显示于显示部,在被输入了对于所述第一原文以及所述第一逆向翻译文集合的显示的预定确认结果的情况下,将所述第一翻译文显示于所述显示部。
通过这种构成,将第一原文以及第一逆向翻译文集合显示于显示部,在被输入了对于第一原文以及第一逆向翻译文集合的显示的预定确认结果的情况下,将第一翻译文显示于显示部,因此,能够在确认了第一原文与第一逆向翻译文集合在语义上一致或者相似之后显示第一翻译文,能够切实地避免由多义词的模糊翻译引起的翻译品质的体验上的降低。
也可以为,将所述第一原文以及所述第一逆向翻译文显示于显示部,在被输入了对于所述第一原文以及所述第一逆向翻译文的显示的预定确认结果的情况下,将所述第一翻译文显示于所述显示部。
通过这种构成,将第一原文以及第一逆向翻译文显示于显示部,在被输入了对于第一原文以及第一逆向翻译文的显示的预定确认结果的情况下,将第一翻译文显示于显示部,因此,能够在确认了第一原文与第一逆向翻译文在语义上一致或者相似之后显示第一翻译文,能够切实地避免由多义词的模糊翻译引起的翻译品质的体验上的降低。
也可以为,在被输入了所述预定确认结果的情况下,以与所述第一原文不同的朝向将所述第一翻译文显示于所述显示部。
通过这种构成,在被输入了预定确认结果的情况下,以与第一原文不同的朝向将第一翻译文显示于显示部,因此,当以第一语言为母语的用户与以第二语言为母语的用户面对面时,能够通过让以第一语言为母语的用户易于查看的方式显示第一原文,并且能够通过让以第二语言为母语的用户易于查看的方式显示第一翻译文。
另外,本公开不仅能够作为执行如上所述的特征性处理的翻译信息提供方法而实现,而且也能够作为使计算机执行这种翻译信息提供方法所包含的特征性处理的计算机程序而实现。另外,还能够作为具备与由翻译信息提供方法执行的特征性处理对应的特征性构成的翻译信息提供装置等而实现。因此,在以下的其他技术方案中,也能够实现与上述的翻译信息提供方法同样的效果。
本公开的另一技术方案涉及的翻译信息提供程序,是用于使计算机作为翻译多种语言的翻译信息提供装置而发挥功能的翻译信息提供程序,所述翻译信息提供程序使所述计算机执行处理,所述处理包括:生成将第一语言的第一原文翻译成第二语言而得到的第一翻译文,生成将所述第一翻译文逆向翻译成所述第一语言而得到的第一逆向翻译文,输出所述第一原文和所述第一翻译文中的至少一方、以及作为所述第一逆向翻译文而与所述第一原文在语义上一致或者相似的逆向翻译文。
本公开的另一技术方案涉及的翻译信息提供装置,是翻译多种语言的翻译信息提供装置,具备:正向翻译执行部,其生成将第一语言的第一原文翻译成第二语言而得到的第一翻译文;逆向翻译执行部,其生成将所述第一翻译文逆向翻译成所述第一语言而得到的第一逆向翻译文;以及翻译结果输出部,其输出所述第一原文和所述第一翻译文中的至少一方、以及作为所述第一逆向翻译文而与所述第一原文在语义上一致或者相似的逆向翻译文。
而且,毫无疑问也可以经由CD-ROM等计算机可读取的非瞬时性的记录介质或者互联网等通信网络来使如上所述的计算机程序流通。
另外,也可以作为使本公开的一个实施方式涉及的翻译信息提供装置的构成要素的一部分和除此以外的构成要素分散于多个计算机的系统来构成。
此外,以下说明的实施方式均用于表示本公开的一个具体例。在以下的实施方式中表示的数值、形状、构成要素、步骤、步骤的顺序等仅为一例,并非旨在限定本公开。另外,对于以下的实施方式中的构成要素中的、没有记载在表示最上位概念的独立权利要求中的构成要素,作为任意的构成要素进行说明。另外,在所有的实施方式中,也可以组合各自的内容。
以下,参照附图,对本公开的各实施方式进行说明。
(实施方式1)
图1是表示本公开的实施方式1中的翻译信息提供装置的构成的一例的框图。图1所示的翻译信息提供装置1具备翻译对象输入部11、正向翻译执行部12、逆向翻译执行部13、逆向翻译决定部14、翻译结果输出部15以及显示部16。
翻译对象输入部11受理由用户进行的预定操作输入,受理用户输入的翻译对象文并将其输出给正向翻译执行部12、逆向翻译决定部14以及翻译结果输出部15。例如“お手洗いはどこですか(洗手间在哪)”这一翻译对象文被输入到翻译对象输入部11。此外,翻译信息提供装置1输入输出以及生成显示的语言不特别限定于日语,也可以是英语、中文、韩语、法语、德语、意大利语、葡萄牙语、泰语、越南语、印尼语等其他语言。
正向翻译执行部12将由翻译对象输入部11输入的翻译对象文从源语言翻译成目标语言从而生成翻译文,并将生成的翻译文输出给逆向翻译执行部13以及翻译结果输出部15。在此,将由正向翻译执行部12翻译出的翻译文作为正向翻译文,翻译对象文是第一语言的第一原文的一例,正向翻译文是将第一语言的第一原文翻译成第二语言而得到的第一翻译文的一例。此外,正向翻译文不限于一个文,也可以生成多个正向翻译文作为翻译候选。
逆向翻译执行部13将在正向翻译执行部12中翻译出的正向翻译文逆向翻译成源语言从而生成翻译文,并将生成的翻译文输出给逆向翻译决定部14。在此,将由逆向翻译执行部13翻译出的翻译文作为逆向翻译文,逆向翻译文是将第一翻译文逆向翻译成第一语言而得到的第一逆向翻译文的一例。此外,相对于正向翻译文的一个文生成的逆向翻译文也不限于一个文,也可以生成多个逆向翻译文作为逆向翻译候选。
上述的正向翻译执行部12以及逆向翻译执行部13中的翻译对象文的翻译方法以及正向翻译文的逆向翻译方法能够使用基于规则以及基于用例的翻译和/或基于统计方法的机器翻译、神经网络式的翻译、通过众包(crowdsourcing)等的依靠人工的翻译等各种公知的手法。
此外,在生成多个正向翻译文时,也可以使用多个不同的翻译方法来生成多个正向翻译文。另外,在生成多个正向翻译文时,也可以根据一个翻译方法来生成多个正向翻译文的候选,并利用N-best等从其中选择和/或提取任意数量的正向翻译文。
另外,在生成多个逆向翻译文时,也可以使用多个不同的翻译方法来生成多个逆向翻译文。另外,在生成多个逆向翻译文时,也可以根据一个翻译方法来生成多个逆向翻译文的候选,并利用N-best等从其中选择和/或提取任意数量的逆向翻译文。另外,进行逆向翻译的翻译方法既可以使用与正向的翻译方法相同的方法,也可以使用不同的方法。
逆向翻译决定部14判定是否有多个逆向翻译文,在有多个逆向翻译文的情况下,对翻译对象文与逆向翻译文进行比较从而算出相似度,选择及决定与翻译对象文的相似度比预定值高的逆向翻译文作为逆向翻译结果文,并输出给翻译结果输出部15。另一方面,在逆向翻译文为一个文的情况下,逆向翻译决定部14将该逆向翻译文作为逆向翻译结果文输出给翻译结果输出部15。
在此,作为相似度的算出方法,可以使用基于翻译对象文与逆向翻译文的编辑距离的方法、选择包含在语言模型中的出现频次高的文字串的语句的方法、根据用户过去的输入和/或选择进行决定的方法、通过词句和/或语句的向量表示(分布式表示)上的运算来决定的方法等,另外,也可以使用各种公知的方法。再者,也可以采用要求用户进行选择输入的方法。
具体而言,逆向翻译决定部14将各文的向量表示(分布式表示)上的距离标准化(归一化)为0到1从而求取相似度。在该情况下,相似度越接近于1,语句彼此的距离越近,能够判断为相似度越高,在相似度为1时,能够判断为翻译对象文与逆向翻译文一致。此外,向量间的距离(相似度)的算出方法其本身例如可以使用向量的内积等公知的方法。
例如在相对于“トイレはどこですか?”这一翻译对象文而获得了第1逆向翻译文“トイレはどちらですか?”和第2逆向翻译文“お風呂はどこですか?”的情况下,逆向翻译决定部14求取第1以及第2逆向翻译文的各个与翻译对象文的向量表示上的相似度。在第1逆向翻译文与翻译对象文的相似度根据向量间的内积算出为0.9、第2逆向翻译文与翻译对象文的向量间的内积算出为0.3的情况下,第1逆向翻译文与翻译对象文的相似度比第2逆向翻译文与翻译对象文的相似度大,因而逆向翻译决定部14选择第1逆向翻译文作为更适当的逆向翻译结果文。
此外,逆向翻译决定部14中的逆向翻译结果文的决定方法也不特别限定于上述的例子,也可以使用向用户提示逆向翻译文并要求其进行选择输入的方法、和/或基于翻译对象文与逆向翻译文的编辑距离的方法、选择包含在语言模型中的出现频次高的文字串的语句的方法、根据用户过去的输入和/或选择进行决定的方法、通过词句和/或语句的向量表示(分布式表示)上的运算来决定的方法等,另外,也可以使用各种公知的方法。
翻译结果输出部15将翻译对象文、在逆向翻译决定部14中决定的逆向翻译结果文、和与该逆向翻译结果文对应的正向翻译文进行关联并作为输出文集(set)输出给显示部16。显示部16例如由预定的显示器(display)等构成,显示从翻译结果输出部15输出的输出文集。
此外,输出文集不特别限定于上述的例子,例如也可以将翻译对象文(第一原文)和正向翻译文(第一翻译文)中的至少一方、以及与翻译对象文在语义上一致或者相似的逆向翻译结果文(第一逆向翻译文)作为输出文集。
另外,翻译信息提供装置1的构成不特别限定于如上所述那样按每个功能由专用的硬件构成的例子,也可以构成为,具备CPU(Central Processing Unit,中央处理单元)、ROM(Read Only Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)以及辅助存储装置等的一台或者多台计算机或者服务器(信息处理装置)安装用于执行上述处理的翻译信息提供程序并作为翻译信息提供装置而发挥功能。另外,正向翻译执行部12、逆向翻译执行部13、逆向翻译决定部14以及翻译结果输出部15不特别限定于设置在翻译信息提供装置1的内部的例子,也可以为,在外部的服务器等设置正向翻译执行部12、逆向翻译执行部13、逆向翻译决定部14以及翻译结果输出部15,翻译信息提供装置1经由预定网络取得所需的信息。关于这几处,其他实施方式也是同样的。
接着,详细地说明由如上所述构成的翻译信息提供装置1进行的翻译信息提供处理。图2是表示由图1所示的翻译信息提供装置1进行的翻译信息提供处理的一例的流程图。
首先,在步骤S11中,翻译对象输入部11通过由用户进行的预定操作输入而被输入输入文J(翻译对象文),并将输入文J输出给正向翻译执行部12、逆向翻译决定部14以及翻译结果输出部15。
接着,在步骤S12中,正向翻译执行部12将一个输入文J翻译成目标语言,生成一个翻译文JE(正向翻译文)并输出给逆向翻译执行部13以及翻译结果输出部15。此外,正向翻译文的生成方法如前所述。
接着,在步骤S13中,逆向翻译执行部13将翻译文JE逆向翻译成源语言,生成包括m个逆向翻译文JEJ(逆向翻译文)的集合{JEJ(i)|i=1、…、m}(逆向翻译文集合)并输出给逆向翻译决定部14。此外,逆向翻译文的生成方法如前所述。
接着,在步骤S14中,逆向翻译决定部14判定逆向翻译文JEJ的集合{JEJ(i)|i=1、…、m}的元素数m是否为多个、即元素数m是否大于1,在逆向翻译文为一个的情况(m=1的情况)下,将该逆向翻译文JEJ(i)作为逆向翻译结果文JEJ(y),移至步骤S17,在有多个逆向翻译文JEJ(i)的情况(m>1的情况)下,移至步骤S15。
当有多个逆向翻译文JEJ(i)时(步骤S14:是),在步骤S15中,逆向翻译决定部14对m个逆向翻译文JEJ(i)的各个算出与输入文J的相似度。此外,相似度的算出方法如前所述。
接着,在步骤S16中,逆向翻译决定部14从逆向翻译文的集合{JEJ(i)|i=1、…、m}中选定相似度最高的一个逆向翻译文JEJ(i)作为逆向翻译结果文JEJ(y),并输出给翻译结果输出部15。
最后,在步骤S17中,翻译结果输出部15将所获得的逆向翻译结果文JEJ(y)、和输入文J输出给显示部16,显示部16将逆向翻译结果文JEJ(y)作为与输入文J对应的逆向翻译文进行关联而显示,并结束处理。
此外,在上述处理中,在步骤S14以及步骤S16中,将作为逆向翻译结果文JEJ(y)输出的逆向翻译文的数量设成了1,但也可以将多个文作为逆向翻译文进行输出。另外,在步骤S12中,将翻译文JE设成了一个文,但也可以如下这样将多个文作为翻译文。
图3是表示由图1所示的翻译信息提供装置1进行的另一翻译信息提供处理的一例的流程图。在此,图3所示的流程图与图2所示的流程图的不同之处在于,图2中的翻译文JE在图3中变成了被生成为多个翻译文的情形。
首先,在步骤S11中,翻译对象输入部11通过由用户进行的预定操作输入而被输入输入文J(翻译对象文),并将输入文J输出给正向翻译执行部12、逆向翻译决定部14以及翻译结果输出部15。
接着,在步骤S12a中,正向翻译执行部12将一个输入文J翻译成目标语言,生成包括n个翻译文JE(k)(正向翻译文)的集合{JE(k)|k=1、…、n}并输出给逆向翻译执行部13以及翻译结果输出部15。此外,在图2所示的步骤S12中,利用单一的翻译方法获得了单一的正向翻译文,但在步骤S12a中,如前述的正向翻译文的生成方法,既可以使用单一的翻译方法,也可以使用多个翻译方法。
接着,在步骤S13a中,逆向翻译执行部13将各翻译文JE(k)分别逆向翻译成源语言,生成逆向翻译文JEJ(逆向翻译文)的集合{JE(k)J(i(k))|k=1、…、n,i(k)=1、…、m}并输出给逆向翻译决定部14。此外,逆向翻译文的生成方法如前所述,能够组合使用任意的翻译方法。
接着,在步骤S14a中,逆向翻译决定部14判定逆向翻译文JEJ的集合{JE(k)J(i(k))|k=1、…、n,i(k)=1、…、m}的元素数是否为多个、即全部元素数是否大于1,在逆向翻译文为一个的情况下,将该逆向翻译文JE(k)J(i(k))作为逆向翻译结果文JE(x)J(y),移至步骤S17a,在有多个逆向翻译文JE(k)J(i(k))的情况下,移至步骤S15a。
当有多个逆向翻译文JE(k)J(i(k))时(步骤S14a:是),在步骤S15a中,逆向翻译决定部14对集合{JE(k)J(i(k))|k=1、…、n,i(k)=1、…、m}的各逆向翻译文JEJ算出与输入文J的相似度。此外,相似度的算出方法如前所述。
接着,在步骤S16a中,逆向翻译决定部14从逆向翻译文的集合{JE(k)J(i(k))|k=1、…、n,i(k)=1、…、m}中选定相似度最高的一个逆向翻译文JE(k)J(i(k))作为逆向翻译结果文JE(x)J(y),并输出给翻译结果输出部15。
最后,在步骤S17a中,翻译结果输出部15将所获得的逆向翻译结果文JE(x)J(y)、和输入文J输出给显示部16,显示部16将逆向翻译结果文JE(x)J(y)作为与输入文J对应的逆向翻译文进行关联而显示,进而将与逆向翻译结果文JE(x)J(y)对应的翻译文JE(x)作为与输入文J对应的翻译文进行关联而显示。
此外,在上述处理中,在步骤S14a以及步骤S16a中,将作为逆向翻译结果文JE(x)J(y)输出的逆向翻译文的数量设成了1,但也可以将多个文作为逆向翻译结果文进行输出。
通过上述处理,在本实施方式中,能够决定与输入文J在语义上一致或者相似的逆向翻译结果文JEJ(y)或者JE(x)J(y)。其结果,通过如(A)源语言文→(B)向目标语言的翻译文→(C)向源语言的逆向翻译文这样进行两次翻译,在推测向目标语言的翻译结果的妥当性时,即使在(B)向目标语言的翻译文所包含的词句中包括具有多义性的多义词的情况下,(A)源语言文与(C)向源语言的逆向翻译文在源语言侧也变得易于在语义上一致。其结果,能够防止(B)向目标语言的翻译文在被重新翻译成(C)向源语言的逆向翻译文时的文整体的意思发生变动,能够减少在(B)向目标语言的翻译文的翻译结果为正确回答的情况下由(A)源语言文与(C)向源语言的逆向翻译文的语义上的不一致导致的译文不适当这一误推定。
即,在现有的技术中,在前面的例子中列举的作为(B)向目标语言的翻译文所包含的词句而有多义词“Bathroom”时,在(C)向源语言的逆向翻译文中,能够将“Bathroom”翻译成“お風呂”和/或“トイレ”、“お手洗い”这样的多个词汇。因此,当(A)源语言文(输入文)为“トイレはどこですか?”这一语句时,若进行翻译及逆向翻译,则会成为如下这样。
输入:トイレはどこですか?
翻译文:Where is a bathroom?
逆向翻译文:お風呂はどこですか?
然而,通过上述处理,能够从(C)向源语言的逆向翻译文(多个逆向翻译文JEJ)中选定与(A)源语言文(输入文J)的相似度最高的逆向翻译文JEJ(y)或者JE(x)J(y),由此使能提示与(A)源语言文的“トイレはどこですか?”相同的“トイレはどこですか?”、或者较相近的“お手洗いはどこですか?”的(C)向源语言的逆向翻译文的可能性提高,能够减少由(A)源语言文与(C)向源语言的逆向翻译文的语义上的不一致导致的译文不适当这一误推定。另外,在图3所示的处理中,生成多个翻译文作为(B)向目标语言的翻译文,并将与在语义上和输入文J一致或者相似的逆向翻译结果文JE(x)J(y)对应的翻译文JE(x)设为了与输入文J对应的翻译文,因此能够从多个翻译文中选择准确的翻译文作为输入文J的翻译。
其结果,在本实施方式中,即使在翻译文包含由一个词表示两个以上意思的多义词的情况下,也能够基于原文的内容进行逆向翻译文的品质改善,并且能够避免由多义词的模糊翻译引起的翻译品质的体验上的降低。
此外,从翻译对象文选择逆向翻译文时所使用的信息不特别限定于上述的例子。例如,也可以使用原文(输入文)所包含的单词和/或文节(在日语中,由自然发音对文进行划分而得到的最小单位)其本身及其同义词。尤其优选使用名词以及固有名词、和/或如“?”、“ですか?”、“ますか?”(在日语中用于疑问句的句末)这样的表征疑问句的文节以及符号组。
在该情况下,原文所包含的单词以及文节的同义词例如通过参照翻译信息提供装置自身或者与翻译信息提供装置连接的外部装置所保存的同义词辞典(未图示)来确定。例如作为一例,成为如下这样。
原文(日语文):トイレはどこですか?
翻译文(英语文):Where is a bathroom?
逆向翻译文(日语文):
(1)お風呂はどこですか?
(2)お風呂はどこ?(浴室在哪儿?)
(3)バスルームはどこにありますか。(哪里有厕所。)
(4)トイレはどこでしょうか。(厕所在哪里呢。)
(5)どこにお風呂がありますか。(在哪里有浴室。)
(6)お手洗いはどこですか?
在上述例子中,作为选择逆向翻译文所使用的来自原文的信息例,“トイレ”、“どこですか”、“?”与从原文提取到的单词以及文节相符,“お手洗い”、“どこでしょうか?”与原文所包含的单词以及文节的同义词相符。因此,在逆向翻译文(1)中,“どこですか”、“?”与原文一致,在逆向翻译文(2)中,“?”与原文一致,在逆向翻译文(4)中,“どこでしょうか”与同义词一致,“トイレ”与原文一致,在逆向翻译文(6)中,“お手洗い”与同义词一致,“どこですか”、“?”与原文一致。其结果,与来自原文的信息的一致数量最多的逆向翻译文(6)被选择为逆向翻译文。假设在“(7)トイレはどこですか?”这一文也作为逆向翻译文而存在的情况下,“トイレ”、“どこですか”、“?”与原文一致,因此也可以使与原文的一致优先于同义词,选择逆向翻译文(7)作为逆向翻译文。
接着,具体地对通过上述的处理而显示于显示部16的翻译信息画面进行说明。图4是表示图1所示的显示部16所显示的翻译信息画面的第1例的图。图4所示的例子是如下例子:作为输入文(源语言文)而输入了“お手洗いはどこですか?”,作为翻译文而生成了“Where is a bathroom?”,作为与源语言文一致或者相似的逆向翻译文而选择了“お手洗いはどこですか?”。在该情况下,显示部16的翻译信息画面Da中显示出“入力文(输入文):お手洗いはどこですか?”、“翻訳文(翻译文):Where is a bathroom?”以及“逆翻訳文(逆向翻译文):お手洗いはどこですか?”。
图5是表示图1所示的显示部16所显示的翻译信息画面的第2例的图。图5所示的翻译信息画面Db示出输入了与图4所示的翻译信息画面Da的输入文不同的输入文(源语言文)后生成了相同的翻译文、但逆向翻译文不同的例子。即,图5所示的例子是如下例子:作为输入文而输入了“バスルームはどこですか?”,作为翻译文而生成了“Where is abathroom?”,作为与源语言文一致或者相似的逆向翻译文而选择了“バスルームはどこですか?”。在该情况下,显示部16的翻译信息画面Db中显示出“入力文:バスルームはどこですか?”、“翻訳文:Where is a bathroom?”以及“逆翻訳文:バスルームはどこですか?”。
如上所述,通过应用本实施方式的处理,翻译信息画面Da和翻译信息画面Db尽管显示了相同的翻译文,但其逆向翻译文显示了根据输入文而各不相同的逆向翻译文。
如此,在本实施方式中,生成将翻译信息画面Da的输入文进行翻译而得到的翻译信息画面Da的翻译文,生成将翻译信息画面Da的翻译文进行逆向翻译而得到的翻译信息画面Da的逆向翻译文,输出并显示翻译信息画面Da的输入文、翻译信息画面Da的翻译文、以及与翻译信息画面Da的输入文在语义上一致或者相似的翻译信息画面Da的逆向翻译文。另外,生成将与翻译信息画面Da的输入文在语义上不同的翻译信息画面Db的输入文进行翻译而得到的翻译信息画面Db的翻译文,生成将翻译信息画面Db的翻译文进行逆向翻译而得到的翻译信息画面Db的逆向翻译文,当翻译信息画面Da的翻译文与翻译信息画面Db的翻译文在表现上相同的情况下,输出并显示翻译信息画面Db的输入文、翻译信息画面Db的翻译文、以及与翻译信息画面Da的逆向翻译文在语义上不同并且与翻译信息画面Db的输入文在语义上一致或者相似的翻译信息画面Db的逆向翻译文。
图6是表示图1所示的显示部16所显示的翻译信息画面的第3例的图。图6所示的例子是如下例子:作为输入文(源语言文)而输入了“お手洗いはどこですか?”,作为翻译文而生成了“Where is a bathroom?”,作为与源语言文一致或者相似的逆向翻译文,选择了多个逆向翻译文“お手洗いはどこですか?”、“バスルームはどこですか?”以及“トイレはどこですか?”。在该情况下,显示部16的翻译信息画面Dc中显示出“入力文:お手洗いはどこですか?”、“翻訳文:Where is a bathroom?”以及“逆翻訳文:お手洗いはどこですか?バスルームはどこですか?トイレはどこですか?”。
如此,作为逆向翻译文也可以显示多个文,此时,也可以将显示的逆向翻译文根据与输入文的相似度来按照降序或者升序进行显示。
图7是表示图1所示的显示部16所显示的翻译信息画面的第4例的图。图7所示的例子是如下例子:作为输入文(源语言文)而输入了“お手洗いはどこですか?”,作为翻译文而生成了多个翻译文“Where is a bathroom?”、“Bathroom?”以及“Powder room(化妆间)?”,作为与源语言文一致或者相似的逆向翻译文,相对于翻译文“Where is a bathroom?”而选择了多个逆向翻译文“お手洗いはどこですか?”、“バスルームはどこですか?”以及“トイレはどこですか?”,相对于翻译文“Bathroom?”而选择了“バスルーム?”,相对于翻译文“Powder room?”而选择了“トイレ?”。
在该情况下,显示部16的翻译信息画面Dd中显示出“入力文:お手洗いはどこですか?”、“(A)翻訳文:Where is a bathroom?逆翻訳文:お手洗いはどこですか?トイレはどこですか?バスルームはどこですか?”;显示出“(B)翻訳文:Bathroom?逆翻訳文:バスルーム?”;显示出“(C)翻訳文:Powder room?逆翻訳文:トイレ?”。
如此,也可以进行多个翻译文的显示,还可以作为对于各翻译文的逆向翻译文来进行一个或者多个的显示,此时,所显示的翻译文也可以根据对应的逆向翻译文的与输入文的相似度来按照降序或者升序进行显示。
(实施方式2)
图8是表示本公开的实施方式2中的翻译信息提供装置的构成的一例的框图。图8所示的翻译信息提供装置1a具备翻译对象输入部11、正向翻译执行部12、逆向翻译执行部13、逆向翻译决定部14、翻译结果输出部15、显示部16以及翻译对象文选择部17。图8所示的翻译信息提供装置1a与图1所示的翻译信息提供装置1的不同之处在于追加了翻译对象文选择部17,除此之外是同样的,因此对相同部分赋予同一标号并省略详细说明。
翻译信息提供装置1a例如由平板电脑等构成,显示部16以及翻译对象文选择部17由触摸面板等构成。翻译信息提供装置1a由以第一语言、例如日语为母语的第1用户和以第二语言、例如英语为母语的第2用户来使用。此外,翻译信息提供装置1a输入输出以及生成显示的语言不特别限定于日语以及英语,也可以是中文、韩语、法语、德语、意大利语、葡萄牙语、泰语、越南语、印尼语等其他语言。
翻译对象输入部11受理第1用户输入的日语的翻译对象文或者第2用户输入的英语的翻译对象文并将其输出给正向翻译执行部12、逆向翻译决定部14以及翻译结果输出部15。正向翻译执行部12将正向翻译文输出给逆向翻译执行部13以及翻译结果输出部15,所述正向翻译文是将由翻译对象输入部11输入的翻译对象文从日语翻译成英语而得到的翻译文、或者从英语翻译成日语而得到的翻译文。逆向翻译执行部13将逆向翻译文输出给逆向翻译决定部14,所述逆向翻译文是将正向翻译文逆向翻译成日语或者英语而得到的翻译文。
逆向翻译决定部14判定是否有多个逆向翻译文,在有多个逆向翻译文的情况下,对翻译对象文与逆向翻译文进行比较从而算出相似度,将与翻译对象文的相似度比预定值高的逆向翻译文作为逆向翻译结果文输出给翻译结果输出部15。另一方面,在逆向翻译文为一个文的情况下,逆向翻译决定部14将该逆向翻译文作为逆向翻译结果文输出给翻译结果输出部15。翻译结果输出部15将翻译对象文、在逆向翻译决定部14中决定的逆向翻译结果文、和与该逆向翻译结果文对应的正向翻译文进行关联并作为输出文集输出给显示部16。
如上所述,翻译信息提供装置1a针对日语或者英语,与翻译信息提供装置1同样地执行图2以及图3所示的翻译信息提供处理,且步骤S17、S17a的处理变更为以下处理。
显示部16的显示画面被分成两部分,在第1显示画面中为第1用户显示日语,在第2显示画面中为第2用户显示英语。在显示部16中显示的语句由翻译对象文选择部17选择性地决定。在此,关于翻译对象文选择部17中的选择方法,既可以按任意顺序选择以时间序列包含于输出文集的任意语句,也可以先选择翻译对象文和逆向翻译结果文,之后再选择对应于逆向翻译结果文的正向翻译文。另外,也可以受理由用户进行的选择,根据用户选择来选择对应的逆向翻译结果文和/或对应于逆向翻译结果文的正向翻译文。
接着,具体地说明要求用户进行确认选择输入的方法。首先,显示部16显示从翻译结果输出部15输出的输出文集的翻译对象文(第一原文)以及逆向翻译结果文(第一逆向翻译文)。针对该逆向翻译结果文,第1用户判断该翻译是否良好,显示部16所显示的翻译信息画面具有能够选择此意的接口(interface)。
图9是表示图8所示的显示部16所显示的翻译信息画面的第1例的图。如图9所示,显示部16显示第1翻译信息画面D1a作为第1显示画面,显示第2翻译信息画面D2a作为第2显示画面。例如在第1翻译信息画面D1a中,作为翻译对象文而显示有“入力(输入):お手洗いはどこですか?”,作为逆向翻译结果文而显示有“逆翻訳(逆向翻译):お手洗いはどこですか?”。
另外,在第1翻译信息画面D1a中显示有:确认按钮B1,该按钮上写有“この翻訳でOK(此翻译没问题)”,用于第1用户在确认了翻译对象文以及逆向翻译结果文的显示后使与逆向翻译结果文对应的正向翻译文进行显示;以及修正按钮B2,其用于第1用户确认了翻译对象文以及逆向翻译结果文的显示,但由于逆向翻译结果文与翻译对象文不一致或者不相似,因而请求对逆向翻译结果文以及正向翻译文的修正。
此外,在第2翻译信息画面D2a中,由于还没有进行第1用户对于翻译对象文以及逆向翻译结果文的显示的确认,因而什么都没有显示。另外,作为修正按钮B2被选择的情况下的处理,能够进行各种处理,例如,显示部16可以显示输出文集中的成为下一候选的逆向翻译结果文,如果没有下一候选,那么也可以显示无法翻译等错误消息(error message)。
翻译对象文选择部17根据第1用户的操作,取得表示第1用户在确认了翻译对象文以及逆向翻译结果文的显示后请求对正向翻译文的显示的确认结果并输出给显示部16。显示部16在由翻译对象文选择部17输入了第1用户的确认结果的情况下,以与翻译对象文不同的朝向显示正向翻译文(第一翻译文)。
图10是表示图8所示的显示部16所显示的翻译信息画面的第2例的图。当第1用户确认了逆向翻译结果文并同意、且触摸(touch)了图10所示的第1翻译信息画面D1b的确认按钮B1时,确认按钮B1被强调显示,翻译对象文选择部17取得第1用户对于翻译对象文以及逆向翻译结果文的显示的确认结果并输出给显示部16。
图11是表示图8所示的显示部16所显示的翻译信息画面的第3例的图。当翻译对象文选择部17将第1用户对于翻译对象文以及逆向翻译结果文的显示的确认结果输出给显示部16时,如图11所示,作为第2显示画面而显示出第2翻译信息画面D2c,例如在第2翻译信息画面D2c中,作为正向翻译文,以与翻译对象文以及逆向翻译结果文不同的朝向显示出“Where is a bathroom?”。另外,在第1翻译信息画面D1c中,不显示确认按钮B1以及修正按钮B2,显示有翻译对象文和逆向翻译结果文。
在此,第2翻译信息画面D2c的正向翻译文在从图的上方查看而能准确读取的方向显示,第1翻译信息画面D1c的翻译对象文以及逆向翻译结果文在从图的下方查看而能准确读取的方向显示,正向翻译文以与翻译对象文相反方向的朝向显示。因此,在第1用户以及第2用户面对面、且翻译信息提供装置1a配置于第1用户以及第2用户之间的情况下,在第1用户易于查看的方向显示出日语的翻译对象文以及逆向翻译结果文,在第2用户易于查看的方向显示出英语的正向翻译文。此外,翻译对象文的显示的朝向和正向翻译文的显示的朝向不特别限定于上述的例子,也可以为相同的朝向。
如上所述,在本实施方式中,在第1用户将逆向翻译结果文判断为良好之后才显示被翻译到目标语言侧的与逆向翻译结果文对应的正向翻译文。通过采用这种构成,能够预先防止并非第1用户所期望(意图)的内容的翻译文传达给第2用户。
接着,对图8所示的显示部16所显示的另一翻译信息画面进行说明。图12~图17是表示图8所示的显示部16所显示的另一翻译信息画面的第1例~第6例的图。通过图12~图17所示的翻译信息画面,表示了各个的源语言不同的用户彼此(第1用户以及第2用户)使用各个的源语言确认逆向翻译并进行对话的例子。
首先,如图12所示,显示部16显示第1翻译信息画面D1d作为第1显示画面,显示第2翻译信息画面D2d作为第2显示画面。例如在第1翻译信息画面D1d中,作为翻译对象文而显示出“入力:お手洗いはどこですか?”,作为逆向翻译结果文而显示出“逆翻訳:お手洗いはどこですか?”,以日语作为源语言提示了翻译对象文和逆向翻译结果文。
另外,在第1翻译信息画面D1d中显示有:OK(确定)按钮B11,其用于第1用户在确认了翻译对象文以及逆向翻译结果文的显示后使与逆向翻译结果文对应的正向翻译文进行显示;以及BACK(返回)按钮B12,其用于第1用户确认了翻译对象文以及逆向翻译结果文的显示,但由于逆向翻译结果文与翻译对象文不一致或者不相似,因而请求对逆向翻译结果文以及正向翻译文的修正。
此外,在第2翻译信息画面D2d中,由于还没有进行第1用户对于翻译对象文以及逆向翻译结果文的显示的确认,因而什么都没有显示。另外,作为BACK按钮B12被选择的情况下的处理,能够进行各种处理,例如,显示部16可以显示输出文集中的成为下一候选的逆向翻译结果文,如果没有下一候选,那么也可以显示无法翻译等错误消息。
接着,当第1用户确认了逆向翻译结果文并同意、且触摸了图13所示的第1翻译信息画面D1e的OK按钮B11时,OK按钮B11被强调显示,翻译对象文选择部17取得第1用户对于翻译对象文以及逆向翻译结果文的显示的确认结果并输出给显示部16。
接着,如图14所示,作为第2显示画面而显示出第2翻译信息画面D2f,例如在第2翻译信息画面D2f中,作为英语的正向翻译文,以与日语的翻译对象文以及逆向翻译结果文不同的朝向显示出“Where is a bathroom?”。因此,与第1用户确认了的逆向翻译结果文对应的正向翻译文(例如英语)显示在第2用户易于查看的方向。另外,在第1翻译信息画面D1f中,不显示OK按钮B11以及BACK按钮B12,显示有日语的翻译对象文和逆向翻译结果文。
接着,当第2用户输入了英语的翻译对象文时,如图15所示,显示部16显示第2翻译信息画面D2g作为第2显示画面。例如在第2翻译信息画面D2g中,作为英语的翻译对象文而显示出“IN:Over there.”(输入:在那里。),作为英语的逆向翻译结果文而显示出“ReverseTranslation:It is over there.”(逆向翻译:它在那里。),以英语作为源语言提示出翻译对象文和逆向翻译结果文。
另外,在第2翻译信息画面D2g中显示有:OK按钮B21,其用于第2用户在确认了翻译对象文以及逆向翻译结果文的显示后使与逆向翻译结果文对应的正向翻译文进行显示;以及BACK按钮B22,其用于第2用户确认了翻译对象文以及逆向翻译结果文的显示,但由于逆向翻译结果文与翻译对象文不一致或者不相似,因而请求对逆向翻译结果文以及正向翻译文的修正。此外,作为BACK按钮B22被选择的情况下的处理,能够进行各种处理,例如,显示部16可以显示输出文集中的成为下一候选的逆向翻译结果文,如果没有下一候选,那么也可以显示无法翻译等错误消息。
接着,当第2用户确认了英语的逆向翻译结果文并同意、且触摸了图16所示的第2翻译信息画面D2h的OK按钮B21时,OK按钮B21被强调显示,翻译对象文选择部17取得第2用户对于翻译对象文以及逆向翻译结果文的显示的确认结果并输出给显示部16。
接着,如图17所示,作为第1显示画面而显示出第1翻译信息画面D1i,例如在第1翻译信息画面D1i中,作为日语的正向翻译文,以与英语的翻译对象文以及逆向翻译结果文不同的朝向显示出“向こうですよ。”(在那边。)。因此,与第2用户确认了的逆向翻译结果文对应的正向翻译文(例如日语)显示在第1用户易于查看的方向。另外,在第2翻译信息画面D2i中,不显示OK按钮B21以及BACK按钮B22,显示有英语的翻译对象文以及逆向翻译结果文。
如上所述,在本例中,在第1用户将逆向翻译结果文判断为良好之后才显示被翻译到目标语言侧的与逆向翻译结果文对应的正向翻译文。另外,在第2用户将逆向翻译结果文判断为良好之后才显示被翻译到目标语言侧的与逆向翻译结果文对应的正向翻译文。通过采用这种构成,能够预先防止并非第1用户以及第2用户所期望的内容的翻译文传达到对方侧,再者多个用户能够将各自的母语和/或擅长的语言作为源语言,确认逆向翻译并且提示向对方的语言的翻译文。由此,各个用户能够用母语来聊天。
此外,在本实施方式中,与实施方式1同样地使用了逆向翻译决定部14,但不特别限定于该例,可以进行如下等各种变更:省略逆向翻译决定部14,无需基于相似度来选定逆向翻译结果文,而是显示对于用户使用翻译对象文选择部17从逆向翻译执行部13所生成的逆向翻译文中确认了的逆向翻译文的正向翻译文。
Claims (10)
1.一种翻译信息提供方法,是翻译多种语言的翻译信息提供装置的翻译信息提供方法,所述翻译信息提供方法包括:
生成将第一语言的第一原文翻译成第二语言而得到的第一翻译文,
生成将所述第一翻译文逆向翻译成所述第一语言而得到的第一逆向翻译文,
输出所述第一原文和所述第一翻译文中的至少一方、以及作为所述第一逆向翻译文而与所述第一原文在语义上一致或者相似的逆向翻译文。
2.根据权利要求1所述的翻译信息提供方法,
生成将所述第一语言的第二原文翻译成所述第二语言而得到的第二翻译文,所述第二原文与所述第一原文在语义上不同,
生成将所述第二翻译文逆向翻译成所述第一语言而得到的第二逆向翻译文,
当所述第一翻译文与所述第二翻译文在表现上相同的情况下,输出所述第二原文和所述第二翻译文中的至少一方、以及作为所述第二逆向翻译文而与所述第一逆向翻译文在语义上不同并且与所述第二原文在语义上一致或者相似的逆向翻译文。
3.根据权利要求1所述的翻译信息提供方法,
生成将所述第一翻译文逆向翻译成所述第一语言而得到的多个第一逆向翻译文,
从所述多个第一逆向翻译文中,生成包括与所述第一原文在语义上一致或者相似的至少一个逆向翻译文的第一逆向翻译文集合,
输出所述第一原文和所述第一翻译文中的至少一方以及所述第一逆向翻译文集合。
4.根据权利要求1所述的翻译信息提供方法,
生成将所述第一原文翻译成所述第二语言而得到的多个第一翻译文,
生成将所述多个第一翻译文逆向翻译成所述第一语言而得到的多个第一逆向翻译文,
从所述多个第一逆向翻译文中,生成包括与所述第一原文在语义上一致或者相似的至少一个逆向翻译文的第一逆向翻译文集合,
输出所述第一原文和所述第一翻译文中的至少一方以及所述第一逆向翻译文集合。
5.根据权利要求1所述的翻译信息提供方法,
算出表示所述第一逆向翻译文与所述第一原文在语义上一致或者相似的程度的相似度,
生成包括所述相似度比预定值高的至少一个逆向翻译文的第一逆向翻译文集合,
输出所述第一原文和所述第一翻译文中的至少一方以及所述第一逆向翻译文集合。
6.根据权利要求5所述的翻译信息提供方法,
将所述第一原文以及所述第一逆向翻译文集合显示于显示部,
在被输入了对于所述第一原文以及所述第一逆向翻译文集合的显示的预定确认结果的情况下,将所述第一翻译文显示于所述显示部。
7.根据权利要求1所述的翻译信息提供方法,
将所述第一原文以及所述第一逆向翻译文显示于显示部,
在被输入了对于所述第一原文以及所述第一逆向翻译文的显示的预定确认结果的情况下,将所述第一翻译文显示于所述显示部。
8.根据权利要求6或7所述的翻译信息提供方法,
在被输入了所述预定确认结果的情况下,以与所述第一原文不同的朝向将所述第一翻译文显示于所述显示部。
9.一种翻译信息提供程序,是用于使计算机作为翻译多种语言的翻译信息提供装置而发挥功能的翻译信息提供程序,所述翻译信息提供程序使所述计算机执行处理,所述处理包括:
生成将第一语言的第一原文翻译成第二语言而得到的第一翻译文,
生成将所述第一翻译文逆向翻译成所述第一语言而得到的第一逆向翻译文,
输出所述第一原文和所述第一翻译文中的至少一方、以及作为所述第一逆向翻译文而与所述第一原文在语义上一致或者相似的逆向翻译文。
10.一种翻译信息提供装置,是翻译多种语言的翻译信息提供装置,具备:
正向翻译执行部,其生成将第一语言的第一原文翻译成第二语言而得到的第一翻译文;
逆向翻译执行部,其生成将所述第一翻译文逆向翻译成所述第一语言而得到的第一逆向翻译文;以及
翻译结果输出部,其输出所述第一原文和所述第一翻译文中的至少一方、以及作为所述第一逆向翻译文而与所述第一原文在语义上一致或者相似的逆向翻译文。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017-113677 | 2017-06-08 | ||
JP2017113677 | 2017-06-08 | ||
JP2018-012619 | 2018-01-29 | ||
JP2018012619A JP2018206356A (ja) | 2017-06-08 | 2018-01-29 | 翻訳情報提供方法、翻訳情報提供プログラム、及び翻訳情報提供装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109033091A true CN109033091A (zh) | 2018-12-18 |
Family
ID=64564050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810561965.6A Pending CN109033091A (zh) | 2017-06-08 | 2018-06-04 | 翻译信息提供方法、程序以及装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10679014B2 (zh) |
CN (1) | CN109033091A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046332A (zh) * | 2019-04-04 | 2019-07-23 | 珠海远光移动互联科技有限公司 | 一种相似文本数据集生成方法及装置 |
CN113051937A (zh) * | 2021-03-19 | 2021-06-29 | 北京大米科技有限公司 | 机器纠错方法、装置、电子设备和可读存储介质 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7030434B2 (ja) * | 2017-07-14 | 2022-03-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 翻訳方法、翻訳装置及び翻訳プログラム |
JP7170984B2 (ja) * | 2018-03-02 | 2022-11-15 | 国立研究開発法人情報通信研究機構 | 疑似対訳データ生成装置、機械翻訳処理装置、および疑似対訳データ生成方法 |
US10664656B2 (en) * | 2018-06-20 | 2020-05-26 | Vade Secure Inc. | Methods, devices and systems for data augmentation to improve fraud detection |
US11308289B2 (en) * | 2019-09-13 | 2022-04-19 | International Business Machines Corporation | Normalization of medical terms with multi-lingual resources |
KR20210037307A (ko) * | 2019-09-27 | 2021-04-06 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
US20220129645A1 (en) * | 2020-10-27 | 2022-04-28 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling same |
US11664010B2 (en) * | 2020-11-03 | 2023-05-30 | Florida Power & Light Company | Natural language domain corpus data set creation based on enhanced root utterances |
US11715475B2 (en) * | 2021-09-20 | 2023-08-01 | Beijing Didi Infinity Technology And Development Co., Ltd. | Method and system for evaluating and improving live translation captioning systems |
CN116522152B (zh) * | 2023-07-05 | 2023-11-10 | 深圳须弥云图空间科技有限公司 | 基于回译的翻译模型训练方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030093262A1 (en) * | 2001-11-15 | 2003-05-15 | Gines Sanchez Gomez | Language translation system |
CN102968411A (zh) * | 2012-10-24 | 2013-03-13 | 橙译中科信息技术(北京)有限公司 | 多语机器翻译智能辅助处理方法和系统 |
CN103729347A (zh) * | 2012-10-10 | 2014-04-16 | 株式会社东芝 | 机器翻译装置、方法及程序 |
US20160092437A1 (en) * | 2014-09-26 | 2016-03-31 | Panasonic Intellectual Property Corporation Of America | Translation method and translation system for translating input expression into expression in another language |
CN106202059A (zh) * | 2015-05-25 | 2016-12-07 | 松下电器(美国)知识产权公司 | 机器翻译方法以及机器翻译装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3936687B2 (ja) | 2003-08-29 | 2007-06-27 | 株式会社国際電気通信基礎技術研究所 | 機械翻訳文の評価方法、および機械翻訳文の評価装置 |
JP2006127356A (ja) | 2004-11-01 | 2006-05-18 | Brother Ind Ltd | 機械翻訳装置、プログラム及び記録媒体 |
US7848915B2 (en) * | 2006-08-09 | 2010-12-07 | International Business Machines Corporation | Apparatus for providing feedback of translation quality using concept-based back translation |
US8972268B2 (en) * | 2008-04-15 | 2015-03-03 | Facebook, Inc. | Enhanced speech-to-speech translation system and methods for adding a new word |
WO2009129315A1 (en) * | 2008-04-15 | 2009-10-22 | Mobile Technologies, Llc | System and methods for maintaining speech-to-speech translation in the field |
US8150677B2 (en) * | 2008-06-26 | 2012-04-03 | Microsoft Corporation | Machine translation using language order templates |
US9342499B2 (en) * | 2013-03-19 | 2016-05-17 | Educational Testing Service | Round-trip translation for automated grammatical error correction |
JP6175900B2 (ja) * | 2013-05-23 | 2017-08-09 | 富士通株式会社 | 翻訳装置、方法、及びプログラム |
JP6649124B2 (ja) | 2015-05-25 | 2020-02-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機械翻訳方法、機械翻訳装置及びプログラム |
US10460040B2 (en) * | 2016-06-27 | 2019-10-29 | Facebook, Inc. | Language model using reverse translations |
US10489507B2 (en) * | 2018-01-02 | 2019-11-26 | Facebook, Inc. | Text correction for dyslexic users on an online social network |
KR102516363B1 (ko) * | 2018-01-26 | 2023-03-31 | 삼성전자주식회사 | 기계 번역 방법 및 장치 |
-
2018
- 2018-05-24 US US15/988,499 patent/US10679014B2/en active Active
- 2018-06-04 CN CN201810561965.6A patent/CN109033091A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030093262A1 (en) * | 2001-11-15 | 2003-05-15 | Gines Sanchez Gomez | Language translation system |
CN103729347A (zh) * | 2012-10-10 | 2014-04-16 | 株式会社东芝 | 机器翻译装置、方法及程序 |
CN102968411A (zh) * | 2012-10-24 | 2013-03-13 | 橙译中科信息技术(北京)有限公司 | 多语机器翻译智能辅助处理方法和系统 |
US20160092437A1 (en) * | 2014-09-26 | 2016-03-31 | Panasonic Intellectual Property Corporation Of America | Translation method and translation system for translating input expression into expression in another language |
CN106202059A (zh) * | 2015-05-25 | 2016-12-07 | 松下电器(美国)知识产权公司 | 机器翻译方法以及机器翻译装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046332A (zh) * | 2019-04-04 | 2019-07-23 | 珠海远光移动互联科技有限公司 | 一种相似文本数据集生成方法及装置 |
CN110046332B (zh) * | 2019-04-04 | 2024-01-23 | 远光软件股份有限公司 | 一种相似文本数据集生成方法及装置 |
CN113051937A (zh) * | 2021-03-19 | 2021-06-29 | 北京大米科技有限公司 | 机器纠错方法、装置、电子设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US10679014B2 (en) | 2020-06-09 |
US20180357224A1 (en) | 2018-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109033091A (zh) | 翻译信息提供方法、程序以及装置 | |
US10311146B2 (en) | Machine translation method for performing translation between languages | |
De Deyne et al. | Predicting human similarity judgments with distributional models: The value of word associations. | |
US8700620B1 (en) | Artificial intelligence method and apparatus | |
KR20210152924A (ko) | 엔티티 연결 방법, 장치, 기기 및 저장 매체 | |
US9582502B2 (en) | Translation method and translation system for translating input expression into expression in another language | |
CN111666409B (zh) | 一种基于综合深度胶囊网络的复杂评论文本的整体情感智能分类方法 | |
CN111223498A (zh) | 情绪智能识别方法、装置及计算机可读存储介质 | |
US20210406473A1 (en) | System and method for building chatbot providing intelligent conversational service | |
CN111931517A (zh) | 文本翻译方法、装置、电子设备以及存储介质 | |
CN111382261B (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
Bentz | Adaptive languages: An information-theoretic account of linguistic diversity | |
CN114757176A (zh) | 一种获取目标意图识别模型的方法以及意图识别方法 | |
Aliwy et al. | Development of arabic sign language dictionary using 3D avatar technologies | |
US20220300708A1 (en) | Method and device for presenting prompt information and storage medium | |
CN111767394A (zh) | 一种基于人工智能专家系统的摘要提取方法及装置 | |
JP2018206356A (ja) | 翻訳情報提供方法、翻訳情報提供プログラム、及び翻訳情報提供装置 | |
CN109543176A (zh) | 一种基于图向量表征的丰富短文本语义方法及装置 | |
CN111400454A (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
CN108932233A (zh) | 翻译文生成方法、翻译文生成装置以及翻译文生成程序 | |
Mukherjee et al. | Intent classification from code mixed input for virtual assistants | |
KR102476208B1 (ko) | 한국어 명사 추출 토크나이저 기반의 워드클라우드 시스템 | |
Bilal et al. | Analyzing emergent users’ text messages data and exploring its benefits | |
CN116685966A (zh) | 调整查询生成模式 | |
Judge et al. | What is the potential for context aware communication aids? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |