CN112784612A - 基于迭代修改的同步机器翻译的方法、装置、介质及设备 - Google Patents

基于迭代修改的同步机器翻译的方法、装置、介质及设备 Download PDF

Info

Publication number
CN112784612A
CN112784612A CN202110102369.3A CN202110102369A CN112784612A CN 112784612 A CN112784612 A CN 112784612A CN 202110102369 A CN202110102369 A CN 202110102369A CN 112784612 A CN112784612 A CN 112784612A
Authority
CN
China
Prior art keywords
language
translation
input
historically
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110102369.3A
Other languages
English (en)
Other versions
CN112784612B (zh
Inventor
孙晓飞
周毅成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Xiangnong Huiyu Technology Co ltd
Original Assignee
Zhejiang Xiangnong Huiyu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Xiangnong Huiyu Technology Co ltd filed Critical Zhejiang Xiangnong Huiyu Technology Co ltd
Priority to CN202110102369.3A priority Critical patent/CN112784612B/zh
Publication of CN112784612A publication Critical patent/CN112784612A/zh
Application granted granted Critical
Publication of CN112784612B publication Critical patent/CN112784612B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请公开一种基于迭代修改的同步机器翻译的方法、装置、介质及设备,涉及同步翻译技术领域。该方法包括:在用户将多个第一语种文本部分按第一语种文本中的先后顺序依次输入的过程中,将当前新输入的第一语种文本部分的第二语种翻译结果添加到历史输入的所有第一语种文本部分的第二语种翻译结果的相应位置后的整体第二语种含义,与历史输入的所有第一语种文本部分的第二语种翻译结果的含义进行比较,从而判断历史输入的所有第一语种文本部分的第二语种翻译结果是否需要修改;以及若历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则进行相应的修改。本申请的方法用于提高同步机器翻译的效率和准确率。

Description

基于迭代修改的同步机器翻译的方法、装置、介质及设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种基于迭代修改的同步机器翻译的方法、装置、介质及设备。
背景技术
“同步机器翻译”是指翻译系统在用户输入待翻译句子的过程中,同步地给出翻译结果。
目前最重要的两种机器翻译方式:规则法和统计法;规则法(rule based machinetranslation,RBMT),依据语言规则对文本进行分析,再借助计算机程序进行翻译。多数商用机器翻译系统采用规则法。规则法机器翻译系统的运作通过三个连续的阶段实现:分析,转换,生成。直接翻译:简单的词到词的翻译。转换翻译:翻译过程要参考并兼顾到原文的词法、句法和语义信息。因为信息来源范围过于宽泛,语法规则过多且相互之间存在矛盾和冲突,转换翻译较为复杂且易出错。
统计法(statistical machine translation,SMT),通过对大量的平行语料进行统计分析,构建统计翻译模型(词汇、比对或是语言模式),进而使用此模型进行翻译,一般会选取统计中出现概率最高的词条作为翻译结果。假设要把一个英语句子A翻译成汉语,所有汉语句子B,都是A的可能或是非可能的潜在翻译。Pr(A)是类似A表达出现的概率,Pr(B|A)是A翻译成B出现的概率。找到两个参数的最大值,就能缩小句子及其对应翻译检索的范围,从而找出最合适的翻译。
现有技术中,用户输入带翻译的句子的时候,会产生一个输入的延迟,在这个延迟间隔内,翻译系统会实时地、同步地给出不完整输入的翻译,系统的工作量大、效率低。但其实语言之间的互译大部分是词与词之间的互译;在用户输入句子的过程中,大部分已经翻译出来的词实际上是不需要再修改的。
发明内容
本申请针对目前同步机器翻译系统的工作量大、效率低的问题,提供一种基于迭代修改的同步机器翻译的方法、装置、介质及设备,用于提高同步机器翻译的效率和准确率。
为实现上述目的,本申请采用的一个技术方案是:提供一种基于迭代修改的同步机器翻译的方法,其包括:历史翻译结果修改判断步骤,在用户将多个第一语种文本部分按在第一语种文本中的先后顺序依次输入的过程中,将当前新输入的第一语种文本部分的第二语种翻译结果添加到历史输入的所有第一语种文本部分的第二语种翻译结果的相应位置后的整体第二语种含义,与历史输入的所有第一语种文本部分的第二语种翻译结果的含义进行比较,从而判断历史输入的所有第一语种文本部分的第二语种翻译结果是否需要修改;以及历史翻译结果修改步骤,若历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则进行相应的修改。
本申请采用另一个技术方案是:提供一种基于迭代修改的同步机器翻译的装置,其包括:历史翻译结果修改判断模块,用于在用户将多个第一语种文本部分按在第一语种文本中的先后顺序依次输入的过程中,将当前新输入的第一语种文本部分的第二语种翻译结果添加到历史输入的所有第一语种文本部分的第二语种翻译结果的相应位置后的整体第二语种含义。与历史输入的所有第一语种文本部分的第二语种翻译结果的含义进行比较,从而判断历史输入的所有第一语种文本部分的第二语种翻译结果是否需要修改;以及历史翻译结果修改模块,用于若历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则进行相应的修改。
本申请采用另一个技术方案是:提供一种计算机可读存储介质,其中计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时可实现方案一中的基于迭代修改的同步机器翻译的方法。
本申请采用的另一个技术方案是:提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,该计算机指令被操作以执行方案一中的基于迭代修改的同步机器翻译的方法。
本申请的有益效果是:提供一种基于迭代修改的同步机器翻译的方法、装置、介质及设备,通过迭代对历史翻译结果进行调整和/或添加,有效的提高同步机器翻译的效率和准确率。
附图说明
图1是本申请一种基于迭代修改的同步机器翻译的方法的一个具体实施方式的流程示意图;
图2是本申请一种基于迭代修改的同步机器翻译的装置的一个具体实施方式的示意图。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
“同步机器翻译”是指翻译系统在用户输入待翻译句子的过程中,同步地给出翻译结果的任务。现有技术中,用户输入带翻译的句子的时候,会产生一个输入的延迟,在这个延迟间隔内,翻译系统会实时地、同步地给出不完整输入的翻译,系统的工作量大、效率低。
基于以上问题,本申请设计了一种基于迭代修改的同步机器翻译的方法、装置、介质及设备。在该方法中通过迭代修改历史翻译结果,有效的提高同步机器翻译的效率和准确率。
图1的流程示意图示出了本申请一种基于迭代修改的同步机器翻译的方法的一个具体实施方式。
在图1所示的具体实施方式中,本申请的基于迭代修改的同步机器翻译的方法包括历史翻译结果修改判断步骤S101、历史翻译结果修改步骤S102。
图1所示的历史翻译结果修改判断步骤S101包括:历史翻译结果修改判断步骤,在用户将多个第一语种文本部分按在第一语种文本中的先后顺序依次输入的过程中,将当前新输入的第一语种文本部分的第二语种翻译结果添加到历史输入的所有第一语种文本部分的第二语种翻译结果的相应位置后的整体第二语种含义,与历史输入的所有第一语种文本部分的第二语种翻译结果的含义进行比较,从而判断历史输入的所有第一语种文本部分的第二语种翻译结果是否需要修改。
在本申请的一个具体实施例中,在历史翻译结果修改判断步骤中,若整体第二语种含义与历史输入的所有第一语种文本部分的第二语种翻译结果的含义不一致,则判断历史输入的所有第一语种文本部分的第二语种翻译结果需要修改。其中,对历史输入的所有第一语种文本部分的第二语种翻译结果进行判断为下一步的修改提供基础,减少对历史文本的翻译结果的修改,提高翻译效率。
在本申请的一个具体实例中,优选的,以英汉翻译为例,用户输入“I likechinese”时,当前所有第一语种文本部分的第二语种翻译结果的含义为:“我喜欢中国人”;当用户继续输入“food”时,当前第一语种文本部分为“I like chinese food”,此时,当前第一语种文本部分整体的第二语种含义为“我喜欢中国菜”,历史输入的所有第一语种文本部分的第二语种翻译结果的含义为:“我喜欢中国人”;翻译系统将第一语种文本部分整体的第二语种的含义与历史输入的所有第一语种文本部分的第二语种翻译结果的含义进行对比,经对比发现“我喜欢中国人”与“我喜欢中国菜”不一致,因此,当前历史输入的所有第一语种文本部分的第二语种翻译结果需要进行修改。
在本申请的一个具体实施例中,历史翻译结果修改判断步骤进一步包括:若历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则判断历史输入的所有第一语种文本部分的第二语种翻译结果中的各个第二语种词是否需要进行修改。对历史输入的所有第一语种文本部分的第二语种翻译结果中的各个第二语种词是否需要修改,逐个进行判断,为后续的获得转缺德翻译结果提供基础。
在本申请的一个具体实例中,在上述具体实例中发现当前历史输入的所有第一语种文本部分的第二语种翻译结果需要进行修改;此时对当前历史输入的所有第一语种文本部分的第二语种翻译结果中“我”、“喜”、“欢”、“中”、“国”、“人”分别对比判断是否需要进行修改,经对比判断发现当前历史输入的所有第一语种文本部分的第二语种翻译结果中的“人”需要进行修改。
在本申请的一个具体实施例中,历史翻译结果修改判断步骤进一步包括:若历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则判断历史输入的所有第一语种文本部分的第二语种翻译结果当中相邻的两个第二语种词之间是否需要插入一个或多个第二语种词。对历史输入的所有第一语种文本部分的第二语种翻译结果当中相邻的两个第二语种词之间是否需要插入一个或多个第二语种词,逐个进行判断,为后续的获得转缺德翻译结果提供基础。
在本申请的一个具体实例中,在上述具体实例中发现当前历史输入的所有第一语种文本部分的第二语种翻译结果需要进行修改;此时对当前历史输入的所有第一语种文本部分的第二语种翻译结果中“我”之前、“我”与“喜”之间、“喜”与“欢”之间、“欢”与“中”之间、“中”与“国”之间、“国”与“人”之间以及“人”之后分别对比判断是否需要插入一个或多个第二语种词,经对比判断发现无需进行插入。
图1所示的历史翻译结果修改步骤S102包括:若历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则进行相应的修改。
在本申请的一个具体实施例中,历史翻译结果修改步骤进一步包括:若历史输入的所有第一语种文本部分第二语种翻译结果中相应的第二语种词需要修改,则对历史输入的所有第一语种文本部分的第二语种翻译结果中相应的第二语种进行相应的修改。对历史输入的所有第一语种文本部分的第二语种翻译结果中相应的第二语种进行相应的修改,提高了翻译结果的准确率。
在本申请的一个具体实施例中,对历史输入的所有第一语种文本部分的第二语种翻译结果中相应的第二语种词进行相应的修改的过程包括:对历史输入的所有的第一语种文本部分的第二语种翻译结果中相应的第二语种词进行保留、删除或替换。其中,对历史文本的翻译结果中各个词保留、删除或替换过程,减少了同步翻译机器翻译的工作量,提高了同步翻译机器的工作效率。
在本申请的一个具体实例中,在上述具体实例中发现当前历史输入的所有第一语种文本部分的第二语种翻译结果中的“人”需要进行修改,根据当前第一语种文本部分整体的第二语种含义“我喜欢中国菜”,将当前历史输入的所有第一语种文本部分的第二语种翻译结果中的“人”替换为“菜”,修改后的结果为“我喜欢中国菜”。
在本申请的一个具体实施例中,历史翻译结果修改步骤进一步包括:若历史输入的所有第一语种文本部分的第二语种翻译结果当中相邻的两个第二语种词之间需要插入一个或多个第二语种词,则在相应的相邻的两个第二语种词之间插入相应的一个或多个第二语种词。对历史文本的翻译结果中相邻词之间插入的过程,减少了同步翻译机器翻译的工作量,提高了同步翻译机器的工作效率。
在本申请的一个具体实例中,上述具体实例修改后的结果为“我喜欢中国菜”;当用户继续输入“so much”时,此时历史输入的所有第一语种文本部分的第二语种翻译结果的含义为:“我喜欢中国菜”,当前第一语种文本部分整体的第二语种含义为“我非常喜欢中国菜”,翻译系统经过翻译系统的逐项对比判断,发现历史输入的所有第一语种文本部分的第二语种翻译结果中“我”与“喜”之间需要进行插入;根据当前第一语种文本部分整体的第二语种含义“我非常喜欢中国菜”,将当前历史输入的所有第一语种文本部分的第二语种翻译结果中的“我”与“喜”之间插入“非常”,修改后的结果为“我非常喜欢中国菜”。
图2的流程示意图示出了本申请的一种基于迭代修改的同步机器翻译的装置的一个具体实施方式。
在图2所示的具体实施方式中,本申请的基于迭代修改的同步机器翻译的装置包括:历史翻译结果修改判断模块201、历史翻译结果修改模块202。
图2所示的历史翻译结果修改判断模块201包括:用于在用户将多个第一语种文本部分按在第一语种文本中的先后顺序依次输入的过程中,将当前新输入的第一语种文本部分的第二语种翻译结果添加到历史输入的所有第一语种文本部分的第二语种翻译结果的相应位置后的整体第二语种含义,与历史输入的所有第一语种文本部分的第二语种翻译结果的含义进行比较,从而判断历史输入的所有第一语种文本部分的第二语种翻译结果是否需要修改;以及图2所示的历史翻译结果修改模块202包括:历史翻译结果修改模块,用于若历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则进行相应的修改。
在本申请的一个具体实施方式中,本申请的基于迭代修改的同步机器翻译的装置中的历史翻译结果修改判断模块201以及历史翻译结果修改模块202,可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
本申请的一种基于迭代修改的同步机器翻译的装置,可用于执行上述任一实施例描述基于迭代修改的同步机器翻译的方法,其实现原理和技术效果类似,在此不再赘述。
在本申请的一个具体实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行任一实施例描述的一种基于迭代修改的同步机器翻译的方法。
在本申请的一个具体实施方式中,一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中,处理器操作计算机指令以执行任一实施例描述的一种基于迭代修改的同步机器翻译的方法。
本申请提出一种基于迭代修改的同步机器翻译方法、装置、介质及设备,支持在用户输入文本的过程中对当前翻译的文本进行迭代修改,从而实现更高效和更准确的翻译;本申请的迭代修改方法、装置、介质及设备可以简单地推广到其他任务,如文本摘要、语句压缩等。
本申请提供的方法以英汉互译为例,对于其它语种均可适用。本申请提供一种基于迭代修改的同步机器翻译的方法、装置、介质及设备,通过对历史文本的翻译结果的词的调整和/或添加,有效的提高同步机器翻译的效率和准确率。
在本申请所提供的实施方式中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (8)

1.一种基于迭代修改的同步机器翻译的方法,其将第一语种文本翻译为第二语种文本,其特征在于,包括:
历史翻译结果修改判断步骤,在用户将多个第一语种文本部分按在所述第一语种文本中的先后顺序依次输入的过程中,将当前新输入的第一语种文本部分的第二语种翻译结果添加到历史输入的所有第一语种文本部分的第二语种翻译结果的相应位置后的整体第二语种含义,与所述历史输入的所有第一语种文本部分的第二语种翻译结果的含义进行比较,从而判断所述历史输入的所有第一语种文本部分的第二语种翻译结果是否需要修改;以及
历史翻译结果修改步骤,若所述历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则进行相应的修改。
2.如权利要求1所述的基于迭代修改的同步机器翻译的方法,其特征在于,所述历史翻译结果修改判断步骤进一步包括:
若所述历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则判断所述历史输入的所有第一语种文本部分的第二语种翻译结果当中相邻的两个第二语种词之间是否需要插入一个或多个第二语种词;以及
若所述历史输入的所有第一语种文本部分的第二语种翻译结果当中相邻的两个第二语种词之间需要插入一个或多个第二语种词,则在相应的所述相邻的两个第二语种词之间插入相应的一个或多个第二语种词。
3.如权利要求1所述的基于迭代修改的同步机器翻译的方法,其特征在于,所述历史翻译结果修改步骤进一步包括:
若所述历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则判断所述历史输入的所有第一语种文本部分的第二语种翻译结果中的各个第二语种词是否需要进行修改;以及
若所述历史输入的所有第一语种文本部分第二语种翻译结果中相应的第二语种词需要修改,则对所述历史输入的所有第一语种文本部分的第二语种翻译结果中相应的第二语种进行相应的修改。
4.如权利要求1所述的基于迭代修改的同步机器翻译的方法,其特征在于,在所述历史翻译结果修改判断步骤中,
若所述整体第二语种含义与所述历史输入的所有第一语种文本部分的第二语种翻译结果的含义不一致,则判断所述历史输入的所有第一语种文本部分的第二语种翻译结果需要修改。
5.如权利要求3所述的基于迭代修改的同步机器翻译的方法,其特征在于,所述对所述历史输入的所有第一语种文本部分的第二语种翻译结果中相应的第二语种词进行相应的修改的过程包括:
对所述历史输入的所有的第一语种文本部分的第二语种翻译结果中相应的第二语种词进行保留、删除或替换。
6.一种基于迭代修改的同步机器翻译的装置,其将第一语种文本翻译为第二语种文本,其特征在于,包括:
历史翻译结果修改判断模块,用于在用户将多个第一语种文本部分按在所述第一语种文本中的先后顺序依次输入的过程中,将当前新输入的第一语种文本部分的第二语种翻译结果添加到历史输入的所有第一语种文本部分的第二语种翻译结果的相应位置后的整体第二语种含义,与所述历史输入的所有第一语种文本部分的第二语种翻译结果的含义进行比较,从而判断所述历史输入的所有第一语种文本部分的第二语种翻译结果是否需要修改;以及
历史翻译结果修改模块,用于若所述历史输入的所有第一语种文本部分的第二语种翻译结果需要修改,则进行相应的修改。
7.一种计算机可读存储介质,其存储有计算机指令,其特征在于,所述计算机指令被操作以执行权利要求1-5中任一项所述的基于迭代修改的同步机器翻译的方法。
8.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机指令,其中所述处理器操作所述计算机指令以执行权利要求1-5中任一项所述的基于迭代修改的同步机器翻译的方法。
CN202110102369.3A 2021-01-26 2021-01-26 基于迭代修改的同步机器翻译的方法、装置、介质及设备 Active CN112784612B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110102369.3A CN112784612B (zh) 2021-01-26 2021-01-26 基于迭代修改的同步机器翻译的方法、装置、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110102369.3A CN112784612B (zh) 2021-01-26 2021-01-26 基于迭代修改的同步机器翻译的方法、装置、介质及设备

Publications (2)

Publication Number Publication Date
CN112784612A true CN112784612A (zh) 2021-05-11
CN112784612B CN112784612B (zh) 2023-12-22

Family

ID=75757746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110102369.3A Active CN112784612B (zh) 2021-01-26 2021-01-26 基于迭代修改的同步机器翻译的方法、装置、介质及设备

Country Status (1)

Country Link
CN (1) CN112784612B (zh)

Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2408819A1 (en) * 2000-05-11 2001-11-15 University Of Southern California Machine translation techniques
WO2009151868A2 (en) * 2008-04-15 2009-12-17 Omega Cap Solutions Llc System and methods for maintaining speech-to-speech translation in the field
CN101957815A (zh) * 2009-07-13 2011-01-26 白劲实 基于正确翻译结果与对应关系的自动翻译方法与系统
US20110229036A1 (en) * 2010-03-17 2011-09-22 Ludwig-Maximilians-Universitat Munchen Method and apparatus for text and error profiling of historical documents
US20120029902A1 (en) * 2010-07-27 2012-02-02 Fang Lu Mode supporting multiple language input for entering text
US20120072204A1 (en) * 2010-09-22 2012-03-22 Voice On The Go Inc. Systems and methods for normalizing input media
CN102467498A (zh) * 2010-11-18 2012-05-23 阿里巴巴集团控股有限公司 翻译方法及装置
CN102662935A (zh) * 2012-04-08 2012-09-12 北京语智云帆科技有限公司 一种交互式的机器翻译方法和机器翻译系统
CN104391839A (zh) * 2014-11-13 2015-03-04 百度在线网络技术(北京)有限公司 机器翻译方法和装置
CN105190608A (zh) * 2013-03-19 2015-12-23 国际商业机器公司 可定制、低延迟交互式计算机辅助翻译
WO2016025243A1 (en) * 2014-08-15 2016-02-18 Google Inc. Techniques for automatically swapping languages and/or content for machine translation
US20160092438A1 (en) * 2014-09-30 2016-03-31 Kabushiki Kaisha Toshiba Machine translation apparatus, machine translation method and program product for machine translation
KR20170061064A (ko) * 2016-10-28 2017-06-02 엘에스디테크 주식회사 선택적 언어 인식 처리에 기반한 번역 방법
US9710429B1 (en) * 2010-11-12 2017-07-18 Google Inc. Providing text resources updated with translation input from multiple users
US10061771B1 (en) * 2017-05-18 2018-08-28 Shenzhen double monkey Technology Co., Ltd Double-sided display simultaneous translation device, method and apparatus and electronic device
US20190121860A1 (en) * 2017-10-20 2019-04-25 AK Innovations, LLC, a Texas corporation Conference And Call Center Speech To Text Machine Translation Engine
US20190155909A1 (en) * 2017-11-23 2019-05-23 Samsung Electronics Co., Ltd. Machine translation method and apparatus
CN109977426A (zh) * 2017-12-27 2019-07-05 北京搜狗科技发展有限公司 一种翻译模型的训练方法、装置以及机器可读介质
KR20190106853A (ko) * 2019-08-27 2019-09-18 엘지전자 주식회사 텍스트 인식 장치 및 방법
CN110377744A (zh) * 2019-07-26 2019-10-25 北京香侬慧语科技有限责任公司 一种舆情分类的方法、装置、存储介质及电子设备
CN110826345A (zh) * 2019-11-14 2020-02-21 北京香侬慧语科技有限责任公司 一种机器翻译方法和装置
CN111008524A (zh) * 2019-12-05 2020-04-14 网易(杭州)网络有限公司 语言翻译的处理方法和装置
US20200193097A1 (en) * 2018-12-17 2020-06-18 Beijing Baidu Netcom Science And Technology Co., Ltd. Text translation method, device,and storage medium
CN111339790A (zh) * 2020-02-25 2020-06-26 北京字节跳动网络技术有限公司 文本翻译方法、装置、设备及计算机可读存储介质
JP2020197592A (ja) * 2019-05-31 2020-12-10 パナソニックIpマネジメント株式会社 テキスト補正装置およびテキスト補正方法

Patent Citations (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2408819A1 (en) * 2000-05-11 2001-11-15 University Of Southern California Machine translation techniques
WO2009151868A2 (en) * 2008-04-15 2009-12-17 Omega Cap Solutions Llc System and methods for maintaining speech-to-speech translation in the field
CN101957815A (zh) * 2009-07-13 2011-01-26 白劲实 基于正确翻译结果与对应关系的自动翻译方法与系统
US20110229036A1 (en) * 2010-03-17 2011-09-22 Ludwig-Maximilians-Universitat Munchen Method and apparatus for text and error profiling of historical documents
US20120029902A1 (en) * 2010-07-27 2012-02-02 Fang Lu Mode supporting multiple language input for entering text
US20120072204A1 (en) * 2010-09-22 2012-03-22 Voice On The Go Inc. Systems and methods for normalizing input media
US9710429B1 (en) * 2010-11-12 2017-07-18 Google Inc. Providing text resources updated with translation input from multiple users
CN102467498A (zh) * 2010-11-18 2012-05-23 阿里巴巴集团控股有限公司 翻译方法及装置
CN102662935A (zh) * 2012-04-08 2012-09-12 北京语智云帆科技有限公司 一种交互式的机器翻译方法和机器翻译系统
CN105190608A (zh) * 2013-03-19 2015-12-23 国际商业机器公司 可定制、低延迟交互式计算机辅助翻译
WO2016025243A1 (en) * 2014-08-15 2016-02-18 Google Inc. Techniques for automatically swapping languages and/or content for machine translation
US20160092438A1 (en) * 2014-09-30 2016-03-31 Kabushiki Kaisha Toshiba Machine translation apparatus, machine translation method and program product for machine translation
CN104391839A (zh) * 2014-11-13 2015-03-04 百度在线网络技术(北京)有限公司 机器翻译方法和装置
KR20170061064A (ko) * 2016-10-28 2017-06-02 엘에스디테크 주식회사 선택적 언어 인식 처리에 기반한 번역 방법
US10061771B1 (en) * 2017-05-18 2018-08-28 Shenzhen double monkey Technology Co., Ltd Double-sided display simultaneous translation device, method and apparatus and electronic device
US20190121860A1 (en) * 2017-10-20 2019-04-25 AK Innovations, LLC, a Texas corporation Conference And Call Center Speech To Text Machine Translation Engine
US20190155909A1 (en) * 2017-11-23 2019-05-23 Samsung Electronics Co., Ltd. Machine translation method and apparatus
CN109977426A (zh) * 2017-12-27 2019-07-05 北京搜狗科技发展有限公司 一种翻译模型的训练方法、装置以及机器可读介质
US20200193097A1 (en) * 2018-12-17 2020-06-18 Beijing Baidu Netcom Science And Technology Co., Ltd. Text translation method, device,and storage medium
JP2020197592A (ja) * 2019-05-31 2020-12-10 パナソニックIpマネジメント株式会社 テキスト補正装置およびテキスト補正方法
CN110377744A (zh) * 2019-07-26 2019-10-25 北京香侬慧语科技有限责任公司 一种舆情分类的方法、装置、存储介质及电子设备
KR20190106853A (ko) * 2019-08-27 2019-09-18 엘지전자 주식회사 텍스트 인식 장치 및 방법
CN110826345A (zh) * 2019-11-14 2020-02-21 北京香侬慧语科技有限责任公司 一种机器翻译方法和装置
CN111008524A (zh) * 2019-12-05 2020-04-14 网易(杭州)网络有限公司 语言翻译的处理方法和装置
CN111339790A (zh) * 2020-02-25 2020-06-26 北京字节跳动网络技术有限公司 文本翻译方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN112784612B (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
JP5379155B2 (ja) Cjk名前検出
Brants TnT-a statistical part-of-speech tagger
WO2018205389A1 (zh) 语音识别方法、系统、电子装置及介质
US8990066B2 (en) Resolving out-of-vocabulary words during machine translation
KR101266361B1 (ko) 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법
EP1754169A2 (en) A system for multilingual machine translation from english to hindi and other indian languages using pseudo-interlingua and hybridized approach
Sun et al. Capturing paradigmatic and syntagmatic lexical relations: Towards accurate Chinese part-of-speech tagging
Carter et al. Syntactic discriminative language model rerankers for statistical machine translation
Bar-Haim et al. Choosing an optimal architecture for segmentation and POS-tagging of Modern Hebrew
JP5770753B2 (ja) Cjk名前検出
CN102135957A (zh) 一种翻译短句的方法及装置
KR102204395B1 (ko) 개체명 인식을 이용한 음성인식 띄어쓰기 보정 방법 및 시스템
CN115455981B (zh) 一种多语种语句的语义理解方法、装置、设备及存储介质
CN112784612B (zh) 基于迭代修改的同步机器翻译的方法、装置、介质及设备
CN114528824A (zh) 文本纠错方法、装置、电子设备及存储介质
KR101721536B1 (ko) 품사간 정렬 경향을 반영한 통계적 단어 정렬 방법 및 이를 이용한 기계 번역 장치
Tambouratzis Conditional Random Fields versus template-matching in MT phrasing tasks involving sparse training data
CN111178096A (zh) 一种基于语义相似度的cameo字典翻译方法
JP3919720B2 (ja) 換言装置及びコンピュータプログラム
KR20160085100A (ko) 하이브리드 번역 장치 및 그 방법
KR100779164B1 (ko) 기존 대역 전자사전의 어휘 대역어 공기 정보 및 확률정보를 이용한 복합명사 대역어 생성 장치 및 방법
Shen Research on the Application of Computer Big Data Technology in English Online Translation
JP4039205B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Damdoo et al. Probabilistic N-gram language model for SMS Lingo
JP2004326584A (ja) 対訳固有表現抽出装置及び方法、対訳固有表現抽出プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant