CN105468585A - 机器翻译装置和机器翻译方法 - Google Patents
机器翻译装置和机器翻译方法 Download PDFInfo
- Publication number
- CN105468585A CN105468585A CN201510633868.XA CN201510633868A CN105468585A CN 105468585 A CN105468585 A CN 105468585A CN 201510633868 A CN201510633868 A CN 201510633868A CN 105468585 A CN105468585 A CN 105468585A
- Authority
- CN
- China
- Prior art keywords
- translation
- text
- result
- source language
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 169
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 230000008569 process Effects 0.000 claims description 41
- 238000012937 correction Methods 0.000 claims description 16
- 238000005520 cutting process Methods 0.000 claims description 11
- 230000002123 temporal effect Effects 0.000 claims description 9
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 4
- 238000003860 storage Methods 0.000 description 18
- 230000001360 synchronised effect Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000001052 transient effect Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 201000004792 malaria Diseases 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
Abstract
本发明涉及一种机器翻译装置和机器翻译方法。根据一个实施例,一种机器翻译装置包括:语音识别部,其接收源语言的语音输入,识别所述源语言的所述语音输入并且生成所述源语言的文本,所述源语言的所述语音输入是按次序的输入,所述源语言的所述文本是语音识别的结果和分析信息;分割部,其基于所述分析信息,判定待处理单位的分割位置和翻译顺序信息,所述待处理单位是语义单位,每个所述语义单位表示所述源语言的所述文本的部分含义;机器翻译部,其将所述待处理单位按次序翻译成目标语言;翻译控制部,其基于所述翻译顺序信息排列翻译后的单位,并且生成所述目标语言的文本;以及输出部,其输出所述目标语言的所述文本。
Description
技术领域
在此描述的实施例一般地涉及机器翻译装置和相关方法。
背景技术
近年来,开发了用于口语的自然语言处理。例如,用于使用个人数字助理翻译旅行会话的机器翻译技术是一个不断发展的领域。旅行会话中的句子和用户之间的对话通常很短。当完整地输入每个句子并且执行机器翻译处理时,在用户之间的意图交流的准确性方面几乎没有难度。
另一方面,具有口语的另一种表达,被称为独白,例如演讲报告或简介会。在独白中,一个说话者说出至少一段,该段具有涉及单个主题的数个句子。当独白经受机器翻译处理时,在说话者完全说出该段之前,段中的每个句子需要逐步经受机器翻译处理。逐步执行机器翻译处理实现说话者对听众进行意图传达的高准确性。这种机器翻译处理被称为“渐进翻译”或“同步翻译”。
同步翻译连续地输入话语作为源语言文本,将源语言文本分割成要适当地处理的单位,并且将这些单位翻译成目标语言。但是,口语不同于书面语(例如,校对者编辑的报纸文章和用户手册),并且口语没有指示分割句子和从句的标点符号。因此,在口语中难以适当地分割句子和从句。
为了解决上面的困难,第2007-18098号日本公开披露了由停顿(其间说话者停止说话的很短时间)和执行的形态分析来分割源语言文本,并且由预定模式修正分割位置以便将独白分割成待处理单位。
但是,仅渐进翻译各单位不会变换句子结构并且因此生成的机器翻译结果实现说话者对听众进行意图传达的低准确性。
例如,考虑以下情况:对话语进行语音识别处理,并且输入源语言文本(日语文本)“アプリの更新はバグの修正が遅れているので来週になりそうです”。分析该日语文本以便分割三个待处理单位(三个从句)“アプリの更新は//バグの修正が遅れているので//来週になりそうです”。“//”在此表示待处理单位的分割位置。渐进地翻译各单位可以获得采用英语的机器翻译结果“anupdateofapplication(应用的更新)//becauseabugfixingislate(因为错误修复较晚)//itwillbenextweek(它将在下周)”。但是,结果在以下方面模糊不清:单词“it(它)”表示“anupdateofapplication(アプリの更新)”还是“abugfixing(バグの修正)”,并且然后结果在意图交流方面有麻烦。
发明内容
各实施例提供机器翻译装置和相关方法,所述装置和方法能够针对连续输入的源语言文本检测待处理单位,并且基于所述待处理单位的顺序信息,控制每个所述待处理单位的翻译结果的序列顺序。
根据一个实施例,一种机器翻译装置包括:语音识别部,其接收源语言的语音输入,识别所述源语言的所述语音输入并且生成所述源语言的文本,所述源语言的所述语音输入是按次序的输入,所述源语言的所述文本是语音识别的结果和分析信息;分割部,其基于所述分析信息,判定待处理单位的分割位置和翻译顺序信息,所述待处理单位是语义单位,每个所述语义单位表示所述源语言的所述文本的部分含义;机器翻译部,其将所述待处理单位按次序翻译成目标语言;翻译控制部,其基于所述翻译顺序信息排列翻译后的单位,并且生成所述目标语言的文本;以及输出部,其输出所述目标语言的所述文本。
根据各实施例,能够提供一种机器翻译装置和相关方法,所述装置和方法能够使操作尽可能与口语保持同步,以便获得清晰的翻译结果,并且实现说话者与听众进行意图传达和交流的高准确性。
附图说明
图1示出一个实施例的完整机器翻译装置100;
图2示出完整分割部102;
图3示出分析部所分析的结果的一个实例;
图4示出训练集的文本语料库的一个实例;
图5示出翻译顺序判定部204中的判定规则的一个实例;
图6示出完整翻译控制部;
图7示出所述实施例的同步机器翻译处理的操作的流程图;
图8示出在同步机器翻译处理中控制翻译顺序的第一实例;
图9示出在语音输入具有时间延迟的情况下控制翻译顺序的第二实例;
图10示出在语音识别结果具有识别错误的情况下控制翻译顺序的第三实例;
图11是可以结合在此描述的一个或多个方面实现的实例计算环境的框图。
具体实施方式
(示例性实施例)
该实施例解释源语言是日语,并且目标语言是英语。但是机器翻译的语言对并不限于上面的情况。可以执行任何两种语言或方言之间的翻译。
图1示出一个实施例的机器翻译装置100的完整布置。装置100包括:语音识别部101,其接收源语言的语音输入;分割部102;翻译控制部103;机器翻译部104;输出部105,其输出目标语言的文本;以及修正部106。
部101接收源语言的语音输入作为到装置100的输入,并且生成(a)源语言的文本作为语音识别结果和(b)指示语音识别结果的置信度的似然。语音识别过程已知为各种常规技术,例如基于隐马尔可夫模型的方法。因为这些技术已知,所以省略详细解释。
分割部102接收(a)来自部101的源语言的文本和(b)来自部103的过去翻译的单位的时间信息,并且生成待处理单位。待处理单位包括(a)表示文本的部分含义的文本部分(例如,从句、词组等)和(b)表示是否可以更改翻译顺序的翻译顺序信息。
翻译控制部103从部102接收待处理单位,并且生成目标语言的文本,该文本是由部104翻译的机器翻译结果。
机器翻译部104从部103接收源语言的文本,使用机器翻译生成目标语言的文本,并且将目标语言的文本发送到部103。机器翻译处理已知为各种常规技术,例如基于规则的机器翻译、基于实例的机器翻译或统计机器翻译。因为这些技术已知,所以省略详细解释。
输出部105输出由部103生成的目标语言的文本。部105还可以输出部101识别的源语言的文本和似然。因此,如果似然小于或等于预定阈值,则可以注释并输出对应于该似然的源语言的文本的一部分,以便促使用户修正语音识别结果。要输出的文本可以从任何输出设备输出,这些输出设备例如包括显示设备(未示出)、打印机设备(未示出)或语音合成设备(未示出)。这些输出设备可以改变或同时使用。
修正部106响应用户的操作,并且在必要时修正语音识别结果。修正方式可以是诸如键盘设备(未示出)、鼠标设备之类的输入设备,或者使用语音输入设备的重述操作。此外,从部101接收修正候选者,并且促使用户选择一个候选者以便执行修正。
图2示出分割部102的完整布置。部102包括:分析部201,其从部101接收源语言的文本;分割位置判定部202;存储部203;翻译顺序判定部204;以及生成部205。
分析部201执行源语言的文本的形态分析以便分割词素单位并且获得单位的词性,执行源语言的文本的句法分析以便获得源语言的文本的从句和/或词组之间的语法关系,并且然后获得分析信息。
图3示出部201所分析的结果的一个实例。分析部210输入源语言句子301“アプリの更新はバグの修正が遅れているので来週になりそうです”,分析句子301并且然后输出分析结果302。分析结果302表示词素“ので”的词性是连词,词组“バグの修正が遅れているので”是句子301的部分含义(即,从句)并且“状语从句-原因”作为句法信息。
分割位置判定部202接收分析结果302,使用存储部203检查结果302,并且然后判定句子301的分割位置。
存储部203存储训练集的文本语料库构造的判定模型。图4示出训练集的文本语料库的一个实例。训练集的文本语料库包括多组训练集401,它们是具有话语的预定分割位置和时间信息的某些文本。训练集401将训练句子“原材料の納品が遅れているので製品の出荷が遅れそうです”分割成第一从句“原材料の納品が遅れているので”和第二从句“製品の出荷が遅れそうです”,并且存储说出的从句的时间信息。判定模型可以通过以下项构造:诸如条件随机场之类的机器学习技术,或者人类制定的规则。例如,人类制定的规则包括以下规则:在“ので”之前和之后分割作为对应于训练集401的判定标准。
翻译顺序判定部204判定翻译顺序信息,该信息表示是否可以更改由部202分割的待处理单位的翻译顺序。图5示出翻译顺序判定部204中的判定规则的一个实例。判定规则表示源语言(例如,日语)句子的结构和目标语言句子的顺序信息(即,采用要翻译成英语的顺序)。
当第一从句“原材料の納品が遅れているので”是待处理单位和句法信息“状语从句-原因”时,部204判定要翻译成目标语言的顺序信息是“可后置(Postpose)”。部202还具有以下功能:通过比较当前时间信息(即,部101接收源语言的语音输入时的时间)和与从部103接收的在过去时间内要处理的过去翻译的单元有关的另一个时间信息,修正翻译顺序信息。
部205从部202和部204接收判定结果并且生成待处理单位,这些待处理单位包括(a)源语言的一部分文本和(b)表示是否可以更改该部分文本的顺序的翻译顺序信息。
图6示出翻译控制部103的完整布置。部103包括接收部601、控制部602和缓冲器603。
接收部601从部102接收源语言文本的待处理单位,将源语言的单位输入到部104中,并且从部104获得目标语言的翻译结果。
分割部102基于待处理单位的翻译顺序信息,控制机器翻译的顺序。例如,当翻译顺序信息是“可后置(Postpose)”时,部602将当前翻译结果存储在缓冲器603中。当翻译顺序信息是“不可后置(Non-postpose)”时,部602将当前翻译结果添加到存储在缓冲器603中的过去翻译结果,并且生成目标语言的文本。部602将目标语言的文本输出到部105,并且将输出时间的信息输出到部102。
图7示出装置100的同步机器翻译处理的操作的流程图。
语音识别部101接收源语言的输入,并且执行语音识别(S701)。
分析部201分析源语言的文本(S702),并且生成结果。
分割位置判定部202从部201接收分析结果,并且判定要处理的源语言文本的单位(S703)。如果源语言的当前文本的结束位置未被判定为分割位置(S703中的否),则所述过程返回语音识别过程(S701)。
当源语言的当前文本的结束位置被判定为分割位置(S703中的是)时,部204执行待处理单位的翻译顺序判定(S704)。如果待处理单位被判定为“可后置”(S704中的可后置),则部204将翻译顺序信息设置为“可后置”。如果待处理单位被判定为“不可后置”(S704中的不可后置),则部204将翻译顺序信息设置为“不可后置”(S706)。
翻译顺序判定部204从当前时间信息和过去输出时间信息计算翻译间隔(即,时间差信息),并且将翻译间隔与预定阈值相比较(S707)。如果翻译间隔大于阈值(S707中的大于阈值),则部204将翻译顺序信息修正为“不可后置”(S708)。
生成部205接收分割位置信息和翻译顺序信息,并且生成待处理单位(S709)。
接收部601接收待处理单位。部104将输入源语言文本翻译成目标语言,并且生成机器翻译结果。
如果翻译顺序信息是“可后置”(S711中的可后置),则部602将翻译结果存储在缓冲器603中,并且所述过程返回到语音识别处理(S701)。如果翻译顺序信息是“不可后置”(S711中的不可后置),则部602将翻译结果添加到存储在缓冲器603中的另一翻译结果,并且生成目标源语言文本(S712)。
最后,输出部105接收目标源语言文本,并且采用目标语言执行输出(S713)。整个过程然后结束。
在该实施例的一个可选方面,如果部106修正语音识别结果,则整个过程类似于上面的解释。
根据上面的实施例,机器翻译装置检测待处理单位以便连续输入源语言文本,并且基于待处理单位的顺序信息,控制每个待处理单位的翻译结果的序列顺序。因此,机器翻译处理能够使操作尽可能与口语保持同步,能够获得清晰的翻译结果,并且能够实现说话者与听众进行意图传达和交流的高准确性。
在下文中描述该实施例的同步机器翻译处理的三个实例。
(第一实例)
图8示出在同步机器翻译处理中控制翻译顺序的第一实例。该实例以时间顺序解释以下处理:连续输入对应于源语言文本“アプリの更新はバグの修正が遅れているので来週になりそうです”的语音,并且部101正确地获得源语言文本。
在时间T1,分割部102获得待处理单位801“アプリの更新は//<翻译顺序信息:不可后置>”。在翻译顺序信息“不可后置”中,部103判定由部104翻译的翻译结果802“anupdateofapplications”的输出顺序是“不可延迟(Non-delay)”,并且将翻译结果802输出到部105(时间T2)。
在时间T3,部102获得待处理单位803“バグの修正が遅れているので//<翻译顺序信息:可后置>”。在翻译顺序信息“可后置”中,部103控制延迟翻译结果的输出(时间T4)。
在时间T5,部102获得待处理单位804“来週になりそうです//<翻译顺序信息:不可后置>”。在翻译顺序信息“不可后置”中,部103将待处理单位804的翻译结果添加到缓冲器603存储的其它翻译结果,并且输出翻译结果805“itwillbenextweek//becauseabugfixingislate”(时间T6)。最终翻译结果是“anupdateofapplication//itwillbenextweek//becauseabugfixingislate”。“Bugfixing(错误修复)”也被称为“bugfix(错误修复)”或“bug-fix(错误修复)”。
第一实例是结果词组远在主句之前被翻译,表示原因的状语从句修改了整个句子,并且能够获得实现说话者与听众进行意图传达的低歧义性和高准确性的翻译结果。
(第二实例)
图9示出在语音输入具有时间延迟的情况下控制翻译顺序的第二实例。该实例解释在语音输入具有诸如“停顿”、“补充”或“支吾”之类的时间延迟因素的情况下的同步翻译过程。在S707中的时间信息阈值为2.00秒(然而可以选择任何时间阈值)的情况下给出以下解释。
在时间T1,分割部102获得待处理单位901“アプリの更新は//<翻译顺序信息:不可后置>”。在翻译顺序信息“不可后置”中,部103输出由部104翻译的翻译结果902“anupdateofapplications”。时间T2是01:00。
假设在输出翻译结果902期间,通过获得下一个源语言文本并且在时间T3(03:05)执行分割过程,时间延迟因素发生时间延迟。在这种情况下,如果基于原始翻译顺序信息“可后置”而继续后续处理,则翻译结果的时间延迟增加更多,并且同步性受损。
为了解决上面的问题,第二实例基于上次翻译结果的输出时间信息和当前时间信息而计算翻译间隔,将翻译间隔与阈值相比较,并且修改翻译顺序信息。因此,第二实例获得待处理单位903“アプリの更新は//<翻译顺序信息:可后置>”,并且输出翻译结果904“becauseabugfixingislate”。
类似于第一实例,第二实例输出对应于待处理单位905“来週になりそうです//<翻译顺序信息:不可后置>”的翻译结果906“itwillbenextweek”,并且获得最终翻译结果“anupdateofapplication//becauseabugfixingislate//itwillbenextweek”。第二实例可以在发生语音输入的时间延迟的情况下确保同步性。
(第三实例)
图10示出在语音识别结果具有识别错误的情况下控制翻译顺序的第三实例。如果源语言文本是语音输入的语音识别结果,则语音识别结果可能包括错误并且需要在同步翻译处理期间被修正。这种情况具有的问题是同步性受损,因为包括错误的待处理单位的语音识别结果的修正已经完成,并且然后输出后续待处理单位的翻译结果。
该实例解释在以下情况下修正语音识别结果:在显示器(未示出)上显示结果,并且用户(操源语言的说话者)判定结果具有错误。还在显示器上显示结果的似然。
在时间T3错误地识别“バグの“種類”が~”并且通过键盘设备(未示出)将错误修正为“バグの“修正”が~”的情况下给出以下解释。但是输入修正的方法并不限于键盘设备。
在时间T1,部102获得待处理单位1001“アプリの更新は//<翻译顺序信息:不可后置>”。在翻译顺序信息“不可后置”中,部103输出由部104翻译的翻译结果1002“anupdateofapplications”。
在时间T3,部102获得待处理单位1003“バグの種類が遅れているので//<翻译顺序信息:可后置>”。在翻译顺序信息“可后置”中,部103控制延迟翻译结果的输出(时间T4)。
当待处理单位1003的似然低时,用户知道待处理单位1003具有语音识别结果错误,并且能够通过部106修正结果。部106的修正清除缓冲器603存储的翻译结果。
常规方法具有的问题是同步性受损,因为包括错误的待处理单位的语音识别结果的修正已经完成,并且然后输出后续待处理单位的翻译结果。
但是,该实例异步地控制待处理单位的输出,并且然后可以并行执行语音识别结果的修正和后续待处理单位的输入。包括语音识别错误的翻译结果的输出延迟可以避免误解,并且还具有以下效果:实现源语言说话者与听众进行意图传达的高准确性。
在时间T5,部102获得待处理单位1004“来週になりそうです//<翻译顺序信息:不可后置>”。在翻译顺序信息“不可后置”中,部103输出翻译结果1005“itwillbenextweek”(时间T6)。
在时间T7,语音识别结果的修正已经完成,获得待处理单位1006“バグの修正が遅れているので//<翻译顺序信息:可后置>”,输出修正后的翻译结果1007“becauseabugfixingislate”(时间T8)。即使在语音识别结果具有语音识别错误的情况下,该实例也可以确保同步性,并且实现说话者与听众进行意图传达的同步机器翻译的高准确性。
根据上述至少一个实施例的机器翻译装置,在诸如独白之类的同步翻译中,能够执行源语言文本的分割处理和机器翻译,以便能够实现独白说话者与听众进行意图传达的高交流性。
各实施例的流程图示出根据各实施例的方法和系统。将理解,流程图的每个方框以及流程图中各方框的组合,都能够由计算机程序指令实现。这些计算机程序指令可以加载到计算机或其它可编程装置上以生产出一种机器,从而使得在计算机或其它可编程装置上执行的指令产生实现一个或多个流程图方框中规定的功能的装置。也可以把这些计算机程序指令存储在非瞬时性计算机可读存储器中,这些指令使得计算机或其它可编程装置以特定方式工作,从而,存储在非瞬时性计算机可读存储器中的指令就产生出包括实现一个或多个流程图方框中规定的功能的指令装置的制造品(articleofmanufacture)。也可以把计算机程序指令加载到计算机或其它可编程装置/设备上,使得在计算机或其它可编程装置上执行一系列操作步骤/动作,以产生提供实现一个或多个流程图方框中规定的功能的步骤/操作的计算机可编程装置/设备。
(实例计算环境)
如前所述,有利的是,在此描述的技术可以应用于语言翻译和相关方法。因此,将理解,构想所有类型的手持式、便携式和其它计算设备和计算对象以便与各种非限制性实施例结合使用。因此,下面在图11中描述的以下通用远程计算机仅是一个实例,并且所公开的主题可以使用具有网络/总线互操作性和交互的任何客户机实现。因此,所公开的主题可以在其中涉及非常少或极少客户机资源的网络托管服务环境中实现,例如,其中客户机设备仅用作到网络/总线的接口的网络环境(例如放在设备中的对象)。
尽管不是必需,但所公开的主题的某些方面可以经由操作系统部分地实现以便由设备或对象的服务开发者使用,和/或包括在结合所公开的主题的组件(多个)操作的应用软件中。可以在诸如程序模块或组件之类的计算机可执行指令的通用上下文中描述软件,这些计算机可执行指令由诸如投影显示设备、观看设备或其它设备之类的一个或多个计算机执行。所属技术领域的技术人员将理解,所公开的主题可以使用其它计算机系统配置和协议实现。
因此,图11示出其中可以实现所公开的主题的某些方面的适合的计算系统环境1100的一个实例,然而如上面所示,计算系统环境1100仅是适合的设备计算环境的一个实例,并且并非旨在建议对所公开的主题的使用范围或功能的任何限制。计算系统环境1100也不应该被解释为具有与示例性计算系统环境1100中示出的任何一个组件或组件组合相关的任何相关性或要求。
参考图11,用于实现所公开的主题的示例性设备包括计算机1110形式的通用计算设备。计算机1110的组件可以包括但不限于处理单元1120、系统存储器1130,以及将不同系统组件(包括系统存储器)耦合到处理单元1120的系统总线1121。系统总线1121可以是几类总线结构中的任意一种,包括存储器总线或存储器控制器、外围总线,以及使用多种总线架构中的任意一种的局域总线。
计算机1110通常包括多种计算机可读介质。计算机可读介质可以是能够被计算机1110访问的任意可获得的介质。计算机可读介质例如可以包括但不限于计算机存储介质、非瞬时性介质和通信介质。计算机存储介质包括易失性和非易失性、可移动和不可移动介质,它们以任意方法或技术实现以便存储诸如计算机可读指令、数据结构、程序模块或其它数据之类的信息。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CDROM、数字多功能盘(DVD)或其它光盘存储装置、磁带盒、磁带、磁盘存储装置或其它磁存储器件,或者可以用于存储所需信息并且可以被计算机1110访问的任何其它介质。通信介质通常包含计算机可读指令、数据结构、程序模块,或者采用调制数据信号(例如载波或其它传输机制)的其它数据,并且包括任意信息传送介质。
系统存储器1130可以包括易失性和/或非易失性存储器形式的计算机存储介质,例如只读存储器(ROM)和/或随机存取存储器(RAM)。基本输入/输出系统(BIOS)可以存储在存储器1130中,BIOS包含有助于例如在启动期间在计算机1110中的元件之间传输信息的基本例程。存储器1130通常还包含可直接由处理单元1120访问和/或目前由处理单元1120处理的数据和/或程序模块。存储器1130例如还可以包括但不限于操作系统、应用程序、其它程序模块和程序数据。
计算机1110还可以包括其它可移动/不可移动、易失性/非易失性计算机存储介质。例如,计算机1110可以包括对不可移动、非易失性磁介质读写的硬盘驱动器、对可移动、非易失性磁盘读写的磁盘驱动器,和/或对可移动、非易失性光盘(例如CD-ROM或其它光介质)读写的光盘驱动器。可以用于示例性操作环境中的其它可移动/不可移动、易失性/非易失性计算机存储介质包括但不限于盒式磁带、闪存卡、数字多功能盘、数字视频磁带、固态RAM、固态ROM等。硬盘驱动器通常通过不可移动存储接口(例如接口)连接到系统总线1121,并且磁盘驱动器或光盘驱动器通常通过可移动存储接口(例如接口)连接到系统总线1121。
用户可以通过诸如键盘和指点设备(通常被称为鼠标、轨迹球或触摸板)之类的输入设备,将命令和信息输入到计算机1110中。其它输入设备可以包括麦克风、游戏杆、电玩控制板、卫星接收碟、扫描仪、无线设备小键盘、语音命令等。这些和其它输入设备通常通过耦合到系统总线1121的用户输入端1140和关联接口(多个)连接到处理单元1120,但可以连接到其它接口和总线结构,例如并行端口、游戏端口或通用串行总线(USB)。图形子系统也可以连接到系统总线1121。投影显示设备中的投影单元或者观看设备中的HUD或者其它类型显示设备也可以经由接口(例如输出接口1150,其又可以与视频存储器通信)连接到系统总线1121。除了显示器之外,计算机还可以包括其它外围输出设备,例如可以通过输出接口1150连接的扬声器。
计算机1110可以使用到一个或多个其它远程计算机(例如远程计算机1170,其又可以具有不同于计算机1110的介质能力)的逻辑连接,在联网或分布式环境中操作。远程计算机1170可以是个人计算机、服务器、路由器、网络PC、对等设备、个人数字助理(PDA)、蜂窝电话、手持式计算设备、投影显示设备、观看设备或其它通用网络节点或任何其它远程介质消费或传输设备,并且可以包括上面相对于计算机1110描述的任意或全部元件。图11中描述的逻辑连接包括网络1171,例如局域网(LAN)或广域网(WAN),但还可以包括其它有线或无线网络/总线。此类联网环境通常包括家庭、办公室、企业范围的计算机网络、内联网和因特网。
当用于LAN联网环境中时,计算机1110可以通过网络接口或适配器连接到LAN1171。当用于WAN联网环境中时,计算机1110通常可以包括通信组件,例如调制解调器,或者用于通过WAN(例如因特网)建立通信的其它手段。通信组件(例如无线通信组件、调制解调器等,它们可以是内部或外部的)可以经由输入端1140的用户输入接口或其它适当的机制连接到系统总线1121。在联网环境中,相对于计算机1110或其各部分描述的程序模块可以存储在远程存储设备中。将理解,示出和描述的网络连接是示例性的,并且可以使用在计算机之间建立通信链路的其它手段。
如在此使用的,术语“组件”、“系统”、“引擎”、“架构”等旨在指计算机或电子相关实体,指硬件、硬件和软件组合、软件(例如,在执行中)或固件。例如,组件可以是一个或多个晶体管、存储单元、晶体管或存储单元排列、门阵列、可编程门阵列、专用集成电路、控制器、处理器、在处理器上运行的过程、对象、可执行程序、访问半导体存储器或与半导体存储器对接的程序或应用、计算机等,或者其适合的组合。组件可以包括可擦写编程(例如,至少部分地存储在可擦写存储器中的过程指令)或硬编程(例如,在制造中烧录到不可擦写存储器中的过程指令)。
举例来说,从存储器执行的过程和处理器都可以是组件。再如,架构可以包括电子硬件排列(例如,并联或串联晶体管)、处理指令和处理器,处理器以适合于电子硬件排列的方式实现处理指令。此外,架构可以包括单个组件(例如,晶体管、门阵列,…)或组件排列(例如,串联或并联晶体管排列、与程序电路连接的门阵列、电源线、电气地、输入信号线和输出信号线等)。系统可以包括一个或多个组件以及一个或多个架构。一个实例系统可以包括切换块架构,其包括交叉输入/输出线和传输栅晶体管,以及电源(多个)、信号生成器(多个)、通信总线(多个)、控制器、I/O接口、地址寄存器等。将理解,定义中的某种重叠在预料之中,并且架构或系统可以是独立的组件,或者是另一个架构、系统等的组件。
除了以上所述之外,可以使用典型的制造、编程或工程技术,将所公开的主题实现为方法、装置或制造品,以便产生硬件、固件、软件或其任意适合的组合,从而控制电子设备以便实现所公开的主题。其中在此使用的术语“装置”和“制造品”旨在包含电子设备、半导体设备、计算机,或者可从任意计算机可读设备、载体或介质访问的计算机程序。计算机可读介质可以包括硬件介质或软件介质。此外,介质可以包括非瞬时性介质或传输介质。在一个实例中,非瞬时性介质可以包括计算机可读硬件介质。计算机可读硬件介质的具体实例可以包括但不限于磁存储器件(例如,硬盘、软盘、磁条…)、光盘(例如,高密度磁盘(CD)、数字多功能盘(DVD)…)、智能卡以及闪存设备(例如,卡、棒、键驱动器…)。计算机可读传输介质可以包括载波等。当然,所属技术领域的技术人员将认识到,可以对该配置进行许多修改而不偏离所公开的主题的范围或精神。
以上所述包括主题创新的实例。当然,不可能描述每个可想到的组件或方法组合以便描述主题创新,但所属技术领域的普通技术人员将认识到,主题创新的许多其它组合和排列是可能的。因此,所公开的主题旨在包含落入本公开的精神和范围内的所有此类改变、修改和变化。此外,在详细描述或权利要求中使用术语“包括”、“具有”及其变型的情况下,以类似于术语“包括”的方式,此类术语旨在是包括性的,如在权利要求中用作过渡词时解释“包括”那样。
此外,单词“示例性”在此用于表示用作实例、示例或说明。在此描述为“示例性”的任意方面或设计不一定被解释为优先或优于其它方面或设计。相反,单词“示例性”的使用旨在以具体方式提出概念。此外,在与电子存储器内的数据位有关的算法或过程操作方面提出了详细描述的某些部分。这些过程描述或表示是所属技术领域的技术人员采用的机制,用于有效地将其工作的实质传达给该领域的其他技术人员。过程在此通常被认为是导向期望结果的本身一致的序列操作。这些操作要求对物理量的物理操纵。通常,尽管不是必须,这些物理量采取能够被存储、传输、组合、比较和/或以其它方式操纵的电信号和/或磁信号的形式。
已证明将这些信号称为位、值、元素、符号、字符、术语、数字等很方便,这主要是为了日常使用。但是,应该牢记,所有这些和类似的术语都与适当的物理量关联,并且只是应用于这些物理量的方便标签。如从上面的讨论中显而易见的,除非具体说明,否则应该理解,在所公开的主题中,使用诸如“处理”、“计算”、“运算”、“判定”或“显示”之类的术语的讨论指处理系统和/或类似消费或工业电子设备或机器的操作和过程,这些系统或设备将电子设备(多个)的寄存器和存储器中表示为物理(电气/电子)量的数据操纵或变换成机器和/或计算机系统存储器或寄存器或其它此类信息存储、传输和/或显示设备中同样表示为物理量的其它数据。
至于上述组件、架构、电路、过程等执行的各种功能,除非另外指明,否则用于描述此类组件的术语(包括对“装置”的引用)旨在对应于执行所述组件(例如,功能等效物)的指定功能的任意组件,即使该组件在结构上并不等效于所公开的结构(其执行此处示出的实施例的示例性方面中的功能)。此外,尽管可以针对数种实现中的仅一种公开了特定特性,但此类特性可以与其它实现(可能对于任意给定或特定应用而言是所需和有利的)的一个或多个其它特性组合。还将认识到,各实施例包括系统以及计算机可读介质,该介质具有用于执行各种过程的操作和/或事件的计算机可执行指令。
尽管描述了某些实施例,但这些实施例仅通过实例的方式提供,并且它们并非旨在限制本发明的范围。实际上,可以以各种其它形式体现在此描述的新颖实施例;此外,可以对在此描述的实施例的形式进行各种省略、替换和更改而不偏离本发明的精神。所附权利要求及其等效物旨在覆盖落入本发明的精神和范围内的这些形式或修改。
Claims (11)
1.一种机器翻译装置,包括:
处理器,包括:
语音识别部,其接收源语言的语音输入,识别所述源语言的所述语音输入并且生成所述源语言的文本,所述源语言的所述语音输入是按次序的输入,所述源语言的所述文本是语音识别的结果和分析信息;
分割部,其基于所述分析信息,判定待处理单位的分割位置和翻译顺序信息,所述待处理单位是语义单位,每个所述语义单位表示所述源语言的所述文本的部分含义;
机器翻译部,其将所述待处理单位按次序翻译成目标语言;
翻译控制部,其基于所述翻译顺序信息排列翻译后的单位,并且生成所述目标语言的文本;以及
输出部,其输出所述目标语言的所述文本。
2.如权利要求1所述的装置,其中
所述待处理单位包括从句。
3.如权利要求1所述的装置,其中
所述分析信息包括所述源语言的所述文本的形态分析和句法分析的结果;
所述翻译顺序信息表示是否能够延迟要输出的顺序,所述要输出的顺序表示要从缓冲器输出的顺序,所述缓冲器包括要处理的当前单位的翻译结果;
所述分割部包括:分割位置判定部,其基于所述形态分析的结果判定所述待处理单位的分割位置;以及翻译顺序判定部,其基于所述句法分析的结果判定所述翻译顺序信息;
所述翻译控制部,
(a)如果能够延迟所述翻译顺序信息,则延迟输出所述要处理的当前单位的所述翻译结果,
(b)如果不能延迟所述翻译顺序信息,则将所述要处理的当前单位的所述翻译结果添加到另一个待处理单位的未输出翻译结果,以便生成所述目标语言的所述文本。
4.如权利要求3所述的装置,其中
所述分割部基于根据先前翻译的处理的时间信息与根据当前翻译的处理的另一个时间信息之间的差异,修正所述翻译顺序信息。
5.如权利要求3所述的装置,其中
所述句法分析的结果表示由所述分割位置分割的所述源语言的所述文本是否是从属从句。
6.如权利要求3所述的装置,进一步包括:
修正部,其修正所述语音识别部的结果;
所述翻译控制部根据所述翻译顺序信息,将由所述修正部修正的所述源语言的所述文本的翻译结果添加到当前翻译结果,以便生成所述目标语言的所述文本。
7.一种在处理器上执行的机器翻译方法,包括:
接收源语言的语音输入,识别所述源语言的所述语音输入并且生成所述源语言的文本,所述源语言的所述语音输入是按次序的输入,所述源语言的所述文本是语音识别的结果和分析信息;
基于所述分析信息,判定待处理单位的分割位置和翻译顺序信息,所述待处理单位是语义单位,每个所述语义单位表示所述源语言的所述文本的部分含义;
将所述待处理单位按次序翻译成目标语言;
基于所述翻译顺序信息排列翻译后的单位,并且生成所述目标语言的文本;以及
输出所述目标语言的所述文本。
8.如权利要求7所述的方法,其中
所述分析信息包括所述源语言的所述文本的形态分析和句法分析的结果;
所述翻译顺序信息表示是否能够延迟要输出的顺序,所述要输出的顺序表示要输出的顺序;
基于所述形态分析的结果判定所述待处理单位的分割位置,并且基于所述句法分析的结果判定所述翻译顺序信息;
(a)如果能够延迟所述翻译顺序信息,则延迟输出所述要处理的当前单位的所述翻译结果,以及
(b)如果不能延迟所述翻译顺序信息,则将所述要处理的当前单位的所述翻译结果添加到另一个待处理单位的未输出翻译结果,以便生成所述目标语言的所述文本。
9.如权利要求8所述的方法,进一步包括:
基于根据先前翻译的处理的时间信息与根据当前翻译的处理的另一个时间信息之间的差异,修正所述翻译顺序信息。
10.如权利要求8所述的方法,其中
所述句法分析的结果表示由所述分割位置分割的所述源语言的所述文本是否是从属从句。
11.如权利要求8所述的方法,进一步包括:
修正所述语音识别部的结果;以及
根据所述翻译顺序信息,将修正后的所述源语言的所述文本的翻译结果添加到当前翻译结果,以便生成所述目标语言的所述文本。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014-202631 | 2014-09-30 | ||
JP2014202631A JP6334354B2 (ja) | 2014-09-30 | 2014-09-30 | 機械翻訳装置、方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105468585A true CN105468585A (zh) | 2016-04-06 |
Family
ID=55584612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510633868.XA Pending CN105468585A (zh) | 2014-09-30 | 2015-09-29 | 机器翻译装置和机器翻译方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20160092438A1 (zh) |
JP (1) | JP6334354B2 (zh) |
CN (1) | CN105468585A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107632980A (zh) * | 2017-08-03 | 2018-01-26 | 北京搜狗科技发展有限公司 | 语音翻译方法和装置、用于语音翻译的装置 |
CN109426669A (zh) * | 2017-08-25 | 2019-03-05 | 松下电器(美国)知识产权公司 | 信息处理方法、信息处理装置以及记录有程序的记录介质 |
CN109582982A (zh) * | 2018-12-17 | 2019-04-05 | 北京百度网讯科技有限公司 | 用于翻译语音的方法和装置 |
CN109992753A (zh) * | 2019-03-22 | 2019-07-09 | 维沃移动通信有限公司 | 一种翻译处理方法及终端设备 |
CN110826345A (zh) * | 2019-11-14 | 2020-02-21 | 北京香侬慧语科技有限责任公司 | 一种机器翻译方法和装置 |
CN112037768A (zh) * | 2019-05-14 | 2020-12-04 | 北京三星通信技术研究有限公司 | 语音翻译方法、装置、电子设备及计算机可读存储介质 |
CN112055876A (zh) * | 2018-04-27 | 2020-12-08 | 语享路有限责任公司 | 利用语音识别技术的多方对话记录/输出方法及用于其的装置 |
CN112395889A (zh) * | 2019-08-01 | 2021-02-23 | 林超伦 | 机器同步翻译 |
CN112463917A (zh) * | 2019-09-09 | 2021-03-09 | 国际商业机器公司 | 经由目标探针的翻译引擎建议 |
CN112735417A (zh) * | 2020-12-29 | 2021-04-30 | 科大讯飞股份有限公司 | 语音翻译方法、电子设备、计算机可读存储介质 |
CN113076760A (zh) * | 2020-01-03 | 2021-07-06 | 阿里巴巴集团控股有限公司 | 翻译、商品检索方法、装置、电子设备及计算机存储介质 |
WO2024183766A1 (zh) * | 2023-03-08 | 2024-09-12 | 杭州阿里巴巴海外互联网产业有限公司 | 一种商品对象信息的翻译方法、设备和介质 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6470097B2 (ja) * | 2015-04-22 | 2019-02-13 | 株式会社東芝 | 通訳装置、方法およびプログラム |
KR102195627B1 (ko) * | 2015-11-17 | 2020-12-28 | 삼성전자주식회사 | 통역 모델 생성 장치 및 방법과, 자동 통역 장치 및 방법 |
WO2017130434A1 (ja) * | 2016-01-28 | 2017-08-03 | 楽天株式会社 | 多言語の固有表現認識モデルの転移を行うコンピュータシステム、方法、およびプログラム |
JP2017167805A (ja) | 2016-03-16 | 2017-09-21 | 株式会社東芝 | 表示支援装置、方法およびプログラム |
US10489516B2 (en) * | 2016-07-13 | 2019-11-26 | Fujitsu Social Science Laboratory Limited | Speech recognition and translation terminal, method and non-transitory computer readable medium |
JP6678545B2 (ja) * | 2016-09-12 | 2020-04-08 | 株式会社東芝 | 修正システム、修正方法及びプログラム |
CN110245358B (zh) * | 2018-03-09 | 2024-02-02 | 北京搜狗科技发展有限公司 | 一种机器翻译方法及相关装置 |
US20220222451A1 (en) * | 2019-05-31 | 2022-07-14 | Abelon Inc. | Audio processing apparatus, method for producing corpus of audio pair, and storage medium on which program is stored |
KR20210032809A (ko) | 2019-09-17 | 2021-03-25 | 삼성전자주식회사 | 동시 통역 방법 및 장치 |
CN111178090A (zh) * | 2019-12-05 | 2020-05-19 | 语联网(武汉)信息技术有限公司 | 一种用于企业名称翻译的方法及系统 |
US11972226B2 (en) | 2020-02-06 | 2024-04-30 | Google Llc | Stable real-time translations of audio streams |
US11367447B2 (en) * | 2020-06-09 | 2022-06-21 | At&T Intellectual Property I, L.P. | System and method for digital content development using a natural language interface |
KR20220042509A (ko) * | 2020-09-28 | 2022-04-05 | 주식회사 아모센스 | 음성 처리 장치 및 이의 작동 방법 |
CN112784612B (zh) * | 2021-01-26 | 2023-12-22 | 浙江香侬慧语科技有限责任公司 | 基于迭代修改的同步机器翻译的方法、装置、介质及设备 |
CN112818710A (zh) * | 2021-02-05 | 2021-05-18 | 中译语通科技股份有限公司 | 一种异步网络机器翻译请求的处理方法、装置 |
CN112929633A (zh) * | 2021-02-07 | 2021-06-08 | 北京有竹居网络技术有限公司 | 一种同声传译接收设备及方法 |
US20240111967A1 (en) * | 2021-02-24 | 2024-04-04 | National Institute Of Information And Communications Technology | Simultaneous translation device and computer program |
US20220293098A1 (en) * | 2021-03-15 | 2022-09-15 | Lenovo (Singapore) Pte. Ltd. | Dialect correction and training |
JP2022152805A (ja) * | 2021-03-29 | 2022-10-12 | 国立研究開発法人情報通信研究機構 | 同時翻訳システム及び方法 |
CN113642333A (zh) * | 2021-08-18 | 2021-11-12 | 北京百度网讯科技有限公司 | 显示方法和装置、语义单元检测模型的训练方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070100601A1 (en) * | 2005-10-27 | 2007-05-03 | Kabushiki Kaisha Toshiba | Apparatus, method and computer program product for optimum translation based on semantic relation between words |
CN101256559A (zh) * | 2007-02-27 | 2008-09-03 | 株式会社东芝 | 用于处理输入语音的装置和方法 |
CN103189860A (zh) * | 2010-11-05 | 2013-07-03 | Sk普兰尼特有限公司 | 组合句法转换模型与词汇转换模型的机器翻译装置和机器翻译方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9209346D0 (en) * | 1992-04-30 | 1992-06-17 | Sharp Kk | Machine translation system |
US6463404B1 (en) * | 1997-08-08 | 2002-10-08 | British Telecommunications Public Limited Company | Translation |
JP2001117920A (ja) * | 1999-10-15 | 2001-04-27 | Sony Corp | 翻訳装置および翻訳方法、並びに記録媒体 |
JP2007018098A (ja) * | 2005-07-05 | 2007-01-25 | Advanced Telecommunication Research Institute International | テキスト分割処理装置及びコンピュータプログラム |
US8666928B2 (en) * | 2005-08-01 | 2014-03-04 | Evi Technologies Limited | Knowledge repository |
US8145473B2 (en) * | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
JP5112116B2 (ja) * | 2008-03-07 | 2013-01-09 | 株式会社東芝 | 機械翻訳する装置、方法およびプログラム |
US20100121630A1 (en) * | 2008-11-07 | 2010-05-13 | Lingupedia Investments S. A R. L. | Language processing systems and methods |
JP6150268B2 (ja) * | 2012-08-31 | 2017-06-21 | 国立研究開発法人情報通信研究機構 | 単語登録装置及びそのためのコンピュータプログラム |
-
2014
- 2014-09-30 JP JP2014202631A patent/JP6334354B2/ja active Active
-
2015
- 2015-09-14 US US14/853,039 patent/US20160092438A1/en not_active Abandoned
- 2015-09-29 CN CN201510633868.XA patent/CN105468585A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070100601A1 (en) * | 2005-10-27 | 2007-05-03 | Kabushiki Kaisha Toshiba | Apparatus, method and computer program product for optimum translation based on semantic relation between words |
CN101256559A (zh) * | 2007-02-27 | 2008-09-03 | 株式会社东芝 | 用于处理输入语音的装置和方法 |
CN103189860A (zh) * | 2010-11-05 | 2013-07-03 | Sk普兰尼特有限公司 | 组合句法转换模型与词汇转换模型的机器翻译装置和机器翻译方法 |
Non-Patent Citations (1)
Title |
---|
俞经善: "机器翻译软件中调整词序的算法", 《船工科技》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107632980A (zh) * | 2017-08-03 | 2018-01-26 | 北京搜狗科技发展有限公司 | 语音翻译方法和装置、用于语音翻译的装置 |
CN109426669B (zh) * | 2017-08-25 | 2023-03-24 | 松下电器(美国)知识产权公司 | 信息处理方法、信息处理装置以及记录有程序的记录介质 |
CN109426669A (zh) * | 2017-08-25 | 2019-03-05 | 松下电器(美国)知识产权公司 | 信息处理方法、信息处理装置以及记录有程序的记录介质 |
CN112055876A (zh) * | 2018-04-27 | 2020-12-08 | 语享路有限责任公司 | 利用语音识别技术的多方对话记录/输出方法及用于其的装置 |
CN109582982A (zh) * | 2018-12-17 | 2019-04-05 | 北京百度网讯科技有限公司 | 用于翻译语音的方法和装置 |
CN109992753A (zh) * | 2019-03-22 | 2019-07-09 | 维沃移动通信有限公司 | 一种翻译处理方法及终端设备 |
CN109992753B (zh) * | 2019-03-22 | 2023-09-08 | 维沃移动通信有限公司 | 一种翻译处理方法及终端设备 |
CN112037768A (zh) * | 2019-05-14 | 2020-12-04 | 北京三星通信技术研究有限公司 | 语音翻译方法、装置、电子设备及计算机可读存储介质 |
CN112395889A (zh) * | 2019-08-01 | 2021-02-23 | 林超伦 | 机器同步翻译 |
CN112395889B (zh) * | 2019-08-01 | 2024-07-19 | 林超伦 | 机器同步翻译 |
CN112463917A (zh) * | 2019-09-09 | 2021-03-09 | 国际商业机器公司 | 经由目标探针的翻译引擎建议 |
CN110826345A (zh) * | 2019-11-14 | 2020-02-21 | 北京香侬慧语科技有限责任公司 | 一种机器翻译方法和装置 |
CN110826345B (zh) * | 2019-11-14 | 2023-09-05 | 北京香侬慧语科技有限责任公司 | 一种机器翻译方法和装置 |
CN113076760A (zh) * | 2020-01-03 | 2021-07-06 | 阿里巴巴集团控股有限公司 | 翻译、商品检索方法、装置、电子设备及计算机存储介质 |
CN113076760B (zh) * | 2020-01-03 | 2024-01-26 | 阿里巴巴集团控股有限公司 | 翻译、商品检索方法、装置、电子设备及计算机存储介质 |
CN112735417B (zh) * | 2020-12-29 | 2024-04-26 | 中国科学技术大学 | 语音翻译方法、电子设备、计算机可读存储介质 |
CN112735417A (zh) * | 2020-12-29 | 2021-04-30 | 科大讯飞股份有限公司 | 语音翻译方法、电子设备、计算机可读存储介质 |
WO2024183766A1 (zh) * | 2023-03-08 | 2024-09-12 | 杭州阿里巴巴海外互联网产业有限公司 | 一种商品对象信息的翻译方法、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2016071761A (ja) | 2016-05-09 |
JP6334354B2 (ja) | 2018-05-30 |
US20160092438A1 (en) | 2016-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105468585A (zh) | 机器翻译装置和机器翻译方法 | |
US11238232B2 (en) | Written-modality prosody subsystem in a natural language understanding (NLU) framework | |
US10127901B2 (en) | Hyper-structure recurrent neural networks for text-to-speech | |
Castilho et al. | A comparative quality evaluation of PBSMT and NMT using professional translators | |
EP3230896B1 (en) | Localization complexity of arbitrary language assets and resources | |
CN108985358B (zh) | 情绪识别方法、装置、设备及存储介质 | |
TWI753325B (zh) | 產生機器翻譯模型的計算裝置及方法及機器翻譯裝置 | |
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
US8805669B2 (en) | Method of and a system for translation | |
CN109992765A (zh) | 文本纠错方法及装置、存储介质和电子设备 | |
CN111079432B (zh) | 文本检测方法、装置、电子设备及存储介质 | |
US20190205396A1 (en) | Method and system of translating a source sentence in a first language into a target sentence in a second language | |
US9311299B1 (en) | Weakly supervised part-of-speech tagging with coupled token and type constraints | |
CN103714048A (zh) | 用于校正文本的方法和系统 | |
US20150364127A1 (en) | Advanced recurrent neural network based letter-to-sound | |
US20220414463A1 (en) | Automated troubleshooter | |
KR101709693B1 (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
CN102662934A (zh) | 一种在跨语言交流中对译文进行验证的方法和装置 | |
WO2024146328A1 (zh) | 翻译模型的训练方法、翻译方法及设备 | |
US20240160862A1 (en) | Electronic apparatus and method for machine translation | |
CN110991155B (zh) | 文本修正方法、设备及介质 | |
US20210312144A1 (en) | Translation device, translation method, and program | |
CN113901841A (zh) | 翻译方法、装置以及存储介质 | |
He | Automatic detection of grammatical errors in english verbs based on rnn algorithm: auxiliary objectives for neural error detection models | |
WO2022123716A1 (ja) | 述語項構造修正プログラム、述語項構造修正方法、および情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160406 |