CN111191440B - 翻译中针对译文的量词纠错方法及系统 - Google Patents

翻译中针对译文的量词纠错方法及系统 Download PDF

Info

Publication number
CN111191440B
CN111191440B CN201911285025.XA CN201911285025A CN111191440B CN 111191440 B CN111191440 B CN 111191440B CN 201911285025 A CN201911285025 A CN 201911285025A CN 111191440 B CN111191440 B CN 111191440B
Authority
CN
China
Prior art keywords
translation
word
graduated
original text
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911285025.XA
Other languages
English (en)
Other versions
CN111191440A (zh
Inventor
周易
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iol Wuhan Information Technology Co ltd
Original Assignee
Iol Wuhan Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iol Wuhan Information Technology Co ltd filed Critical Iol Wuhan Information Technology Co ltd
Priority to CN201911285025.XA priority Critical patent/CN111191440B/zh
Publication of CN111191440A publication Critical patent/CN111191440A/zh
Application granted granted Critical
Publication of CN111191440B publication Critical patent/CN111191440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本发明实施例提供一种翻译中针对译文的量词纠错方法及系统,方法包括:根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值;将译文中对应的量词前的数值与换算后的量词前的数值进行比较,若比较结果不一致,则对译文中对应的量词前的数值进行纠正。本发明实施例能够自动对翻译引擎翻译后的译文中的量词转换过程中出现的错误进行纠正。

Description

翻译中针对译文的量词纠错方法及系统
技术领域
本发明属于翻译技术领域,尤其涉及一种翻译中针对译文的量词纠错方法及系统。
背景技术
在机器翻译的过程中,由于不同的国家地区,使用的量词不同,比如,有些国家地区使用摄氏度来度量温度,但是有些国家地区使用华摄度来度量温度。因此,将一个国家地区的语言通过机器翻译成另一个国家地区的语言时,量词也会发生变化。
通过机器将一国地区语言的量词前的数值转换为另一国家地区的量词前的数值时,会出现错误。为了保证翻译后的译文的正确性,目前针对翻译后的译文,采用人工逐一检查译文中的每一个量词前的数值是否正确,如果不正确,采用人工进行纠正。
上述采用人工进行纠正的方式非常繁琐,工作量大,正确率高。
发明内容
为克服上述现有问题或者至少部分地解决上述问题,本发明实施例提供一种翻译中针对译文的量词纠错方法及系统。
根据本发明实施例的第一方面,提供一种翻译中针对译文的量词纠错方法,包括:
根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值;
将译文中对应的量词前的数值与所述换算后的量词前的数值进行比较,若比较结果不一致,则对译文中对应的量词前的数值进行纠正。
在上述技术方案的基础上,本发明实施例还可以作出如下改进。
可选的,所述根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值之前还包括:
分别提取原文中的至少一个量词和译文中的至少一个量词,且将译文中的每一个量词与原文中的每一个量词一一对应。
可选的,所述分别提取原文中的至少一个量词和译文中的至少一个量词,且将译文中的每一个量词与原文中的每一个量词一一对应包括:
提取原文中的至少一个量词,且将至少一个量词按照在原文中的前后顺序进行排序;
提取原文对应的译文中的至少一个量词,且将至少一个量词按照在译文中的前后顺序进行排序;
按照原文中的至少一个量词的顺序和对应的译文中的至少一个量词的顺序,对原文中的每一个量词和译文中的每一个量词一一对应。
可选的,所述根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值还包括:
在AC自动机中保存有任意两个不同量词之间的换算关系;
相应的,所述根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值包括:
按照原文中的量词与译文中对应的量词之间的换算关系,对原文中的量词前的数值进行换算,得到换算后的量词前的数值。
可选的,所述对译文中对应的量词前的数值进行纠错包括:
采用所述换算后的量词前的数值替换译文中对应的量词前的数值,得到译文中对应的量词前的数值。
根据本发明实施例第二方面提供一种翻译中针对译文的量词纠错系统,包括:
换算模块,用于根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值;
纠正模块,用于将译文中对应的量词前的数值与所述换算后的量词前的数值进行比较,若比较结果不一致,则对译文中对应的量词前的数值进行纠正。
可选的,所述纠错系统还包括:
提取模块,用于分别提取原文中的至少一个量词和译文中的至少一个量词,且将译文中的每一个量词与原文中的每一个量词一一对应。
可选的,所述纠错系统还包括:
AC自动机,用于保存任意两个不同量词之间的换算关系;
相应的,所述换算模块用于:
按照原文中的量词与译文中对应的量词之间的换算关系,对原文中的量词前的数值进行换算,得到换算后的量词前的数值。
根据本发明实施例的第三个方面,还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器调用所述程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的翻译中针对译文的量词纠错方法。
根据本发明实施例的第四个方面,还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的翻译中针对译文的量词纠错方法。
本发明实施例提供一种翻译中针对译文的量词纠错方法及系统,该方法能够自动对翻译引擎翻译后的译文中的量词转换过程中出现的错误进行纠正,减轻了人工处理的繁琐,提高了纠错的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的翻译中针对译文的量词纠错方法整体流程示意图;
图2为本发明实施例提供的翻译中针对译文的量词纠错系统整体结构示意图;
图3为本发明实施例提供的电子设备整体结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
在本发明的一个实施例中提供一种翻译中针对译文的量词纠错方法,图1为本发明实施例提供的翻译中针对译文的量词纠错方法整体流程示意图,该方法包括:
根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值;
将译文中对应的量词前的数值与所述换算后的量词前的数值进行比较,若比较结果不一致,则对译文中对应的量词前的数值进行纠正。
可以理解的是,由于在不同的国家地区,使用的量词有可能不同,比如,不同国家地区的货币、度量、日期等单位不一致等情况。因此,在采用翻译引擎将一国语言翻译为另一国语言后,翻译后的译文中的量词前的数值有可能存在错误,会影响翻译的效果。因此,在本发明实施例中,根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值。将译文中对应的量词前的数值与根据原文中的量词前的数值换算的量词前的数值进行比较,若比较结果不一致,则对译文中对应的量词前的数值进行纠正,使得翻译后的译文中的量词前的数值与原文中量词前的数值相同。
本发明实施例能够自动对翻译引擎翻译后的译文中的量词转换过程中出现的错误进行纠正,减轻了人工处理的繁琐,提高了纠错的准确率。
作为一个可选的实施例,根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值之前还包括:
分别提取原文中的至少一个量词和译文中的至少一个量词,且将译文中的每一个量词与原文中的每一个量词一一对应。
可以理解的是,原文中可能包含多个量词,对应的译文中也包含多个量词,本发明实施例分别提取原文中的多个量词和对应的译文中的多个量词,且将原文中的多个量词与对应的译文中的多个量词进行一一对应。
作为一个可选的实施例,分别提取原文中的至少一个量词和译文中的至少一个量词,且将译文中的每一个量词与原文中的每一个量词一一对应包括:
提取原文中的至少一个量词,且将至少一个量词按照在原文中的前后顺序进行排序;
提取原文对应的译文中的至少一个量词,且将至少一个量词按照在译文中的前后顺序进行排序;
按照原文中的至少一个量词的顺序和对应的译文中的至少一个量词的顺序,对原文中的每一个量词和译文中的每一个量词一一对应。
可以理解的是,在分别提取原文中的多个量词和对应的译文中的多个量词时,将从原文中提取的多个量词按照每一个量词在原文中的顺序进行排序;同样的,将从对应的译文中提取的多个量词按照每一个量词在译文中的顺序进行排序。对于排序后的原文中的多个量词和排序后的译文中的多个量词,按照顺序将原文中的每一个量词和译文中的每一个量词进行一一对应。
需要说明的是,在提取原文中的多个量词和提取译文中的多个量词的同时,提取原文中每一个量词前的数值以及提取译文中每一个量词前的数值。
作为一个可选的实施例,所述根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值还包括:
在AC自动机中保存有任意两个不同量词之间的换算关系;
相应的,所述根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值包括:
按照原文中的量词与译文中对应的量词之间的换算关系,对原文中的量词前的数值进行换算,得到换算后的量词前的数值。
可以理解的是,其中,在AC自动机中保存有任意两个不同的量词之间的转换关系,对于原文和译文中的任一一对量词,在AC自动机中找到该一对量词的转换关系,根据该一对量词中属于原文的量词前的数值和该一对量词的转换关系,将原文中量词前的数值进行转换,得到转换后的数值,该数值的量词与译文中的量词相同。
随后将译文中的量词前的数值与原文中量词前的数值进行转换后的数值进行对比,如果一致,则表明翻译引擎对于原文中对应的量词翻译正确;若不一致,则表明翻译引擎对于原文中对应的量词翻译错误,需要纠正。
作为一个可选的实施例,所述对译文中对应的量词前的数值进行纠错包括:
采用换算后的量词前的数值替换译文中对应的量词前的数值,得到译文中对应的量词前的数值。
可以理解的是,如果翻译引擎翻译出的译文中的量词前的数值与原文中对应的量词前的数值不一致,则将从原文中换算后的量词前的数值替换译文中对应的量词前的数值,得到译文中对应的量词前的数值。
针对原文中的每一个量词与译文中的每一个量词,判断译文中的每一个量词的翻译是否正确,从而得出翻印引擎的翻译准确率。
在实际中,翻译引擎有很多种,针对每一种翻译引擎,可以计算其翻译正确率,根据每一个翻译引擎的正确率,在后续翻译过程中,选择一个翻译正确率最高的翻译引擎进行翻译。
在本发明的另一个实施例中提供一种翻译中针对译文的量词纠错系统,该系统用于实现前述各实施例中的方法。因此,在前述翻译中针对译文的量词纠错方法的各实施例中的描述和定义,可以用于本发明实施例中各个执行模块的理解。图2为本发明实施例提供的翻译中针对译文的量词纠错系统整体结构示意图,该装置包括:
换算模块21,用于根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值;
纠正模块22,用于将译文中对应的量词前的数值与所述换算后的量词前的数值进行比较,若比较结果不一致,则对译文中对应的量词前的数值进行纠正。
作为一个可选的实施例,本发明实施例提供的翻译中针对译文的量词纠错系统还包括提取模块23,其中,提取模块23,用于分别提取原文中的至少一个量词和译文中的至少一个量词,且将译文中的每一个量词与原文中的每一个量词一一对应。
作为一个可选的实施例,本发明实施例提供的翻译中针对译文的量词纠错系统还包括AC自动机24,其中,AC自动机24,用于保存任意两个不同量词之间的换算关系;
相应的,所述换算模块21用于:
按照原文中的量词与译文中对应的量词之间的换算关系,对原文中的量词前的数值进行换算,得到换算后的量词前的数值。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、通信接口(Communications Interface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行如下方法:根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值;将译文中对应的量词前的数值与所述换算后的量词前的数值进行比较,若比较结果不一致,则对译文中对应的量词前的数值进行纠正。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值;将译文中对应的量词前的数值与所述换算后的量词前的数值进行比较,若比较结果不一致,则对译文中对应的量词前的数值进行纠正。
本发明实施例提供的翻译中针对译文的量词纠错方法及系统,该方法能够自动对翻译引擎翻译后的译文中的量词转换过程中出现的错误进行纠正,减轻了人工处理的繁琐,提高了纠错的准确率。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种翻译中针对译文的量词纠错方法,其特征在于,包括:
在AC自动机中保存有任意两个不同量词之间的换算关系;
根据原文中的量词与译文中对应的量词之间的换算关系,对原文中的量词前的数值进行换算,得到换算后的量词前的数值;
将译文中对应的量词前的数值与所述换算后的量词前的数值进行比较,若比较结果不一致,则对译文中对应的量词前的数值进行纠正。
2.根据权利要求1所述的翻译中针对译文的量词纠错方法,其特征在于,所述根据原文中的量词与译文中对应的量词,对原文中的量词前的数值进行换算,得到换算后的量词前的数值之前还包括:
分别提取原文中的至少一个量词和译文中的至少一个量词,且将译文中的每一个量词与原文中的每一个量词一一对应。
3.根据权利要求2所述的翻译中针对译文的量词纠错方法,其特征在于,所述分别提取原文中的至少一个量词和译文中的至少一个量词,且将译文中的每一个量词与原文中的每一个量词一一对应包括:
提取原文中的至少一个量词,且将至少一个量词按照在原文中的前后顺序进行排序;
提取原文对应的译文中的至少一个量词,且将至少一个量词按照在译文中的前后顺序进行排序;
按照原文中的至少一个量词的顺序和对应的译文中的至少一个量词的顺序,对原文中的每一个量词和译文中的每一个量词一一对应。
4.根据权利要求1所述的翻译中针对译文的量词纠错方法,其特征在于,所述对译文中对应的量词前的数值进行纠错包括:
采用所述换算后的量词前的数值替换译文中对应的量词前的数值,得到译文中对应的量词前的数值。
5.一种翻译中针对译文的量词纠错系统,其特征在于,包括:
AC自动机,用于保存任意两个不同量词之间的换算关系;
换算模块,用于根据原文中的量词与译文中对应的量词之间的换算关系,对原文中的量词前的数值进行换算,得到换算后的量词前的数值;
纠正模块,用于将译文中对应的量词前的数值与所述换算后的量词前的数值进行比较,若比较结果不一致,则对译文中对应的量词前的数值进行纠正。
6.根据权利要求5所述的翻译中针对译文的量词纠错系统,其特征在于,所述纠错系统还包括:
提取模块,用于分别提取原文中的至少一个量词和译文中的至少一个量词,且将译文中的每一个量词与原文中的每一个量词一一对应。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至4任一项所述翻译中针对译文的量词纠错方法的步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至4任一项所述翻译中针对译文的量词纠错方法的步骤。
CN201911285025.XA 2019-12-13 2019-12-13 翻译中针对译文的量词纠错方法及系统 Active CN111191440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911285025.XA CN111191440B (zh) 2019-12-13 2019-12-13 翻译中针对译文的量词纠错方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911285025.XA CN111191440B (zh) 2019-12-13 2019-12-13 翻译中针对译文的量词纠错方法及系统

Publications (2)

Publication Number Publication Date
CN111191440A CN111191440A (zh) 2020-05-22
CN111191440B true CN111191440B (zh) 2024-02-20

Family

ID=70707406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911285025.XA Active CN111191440B (zh) 2019-12-13 2019-12-13 翻译中针对译文的量词纠错方法及系统

Country Status (1)

Country Link
CN (1) CN111191440B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743101B (zh) * 2021-08-17 2023-05-23 北京百度网讯科技有限公司 文本纠错方法、装置、电子设备和计算机存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62264367A (ja) * 1986-05-13 1987-11-17 Ricoh Co Ltd 日本語生成装置
CN1193779A (zh) * 1997-03-13 1998-09-23 国际商业机器公司 中文语句分词方法及其在中文查错系统中的应用
CN101019113A (zh) * 2004-08-11 2007-08-15 Sdl有限公司 用于翻译系统的计算机实现的方法
CN101950286A (zh) * 2010-09-14 2011-01-19 传神联合(北京)信息技术有限公司 软件翻译系统中的纠错模块及其纠错方法
WO2014110980A1 (zh) * 2013-01-21 2014-07-24 Liu Shugen 表意构件识别提取和基于表意构件的机译人校互动翻译方法
CN107885728A (zh) * 2017-12-11 2018-04-06 中译语通科技股份有限公司 一种基于译员在线翻译的qa自动检测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102637338B1 (ko) * 2017-01-26 2024-02-16 삼성전자주식회사 번역 보정 방법 및 장치와 번역 시스템

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62264367A (ja) * 1986-05-13 1987-11-17 Ricoh Co Ltd 日本語生成装置
CN1193779A (zh) * 1997-03-13 1998-09-23 国际商业机器公司 中文语句分词方法及其在中文查错系统中的应用
CN101019113A (zh) * 2004-08-11 2007-08-15 Sdl有限公司 用于翻译系统的计算机实现的方法
CN101950286A (zh) * 2010-09-14 2011-01-19 传神联合(北京)信息技术有限公司 软件翻译系统中的纠错模块及其纠错方法
WO2014110980A1 (zh) * 2013-01-21 2014-07-24 Liu Shugen 表意构件识别提取和基于表意构件的机译人校互动翻译方法
CN107885728A (zh) * 2017-12-11 2018-04-06 中译语通科技股份有限公司 一种基于译员在线翻译的qa自动检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
再谈量词使用中的错误;金锡谟;《新闻与写作》(第09期);37-39 *
汉维时间数字和量词的识别与翻译研究;阿依古丽・哈力克等;《中文信息学报》(第06期);190-200 *

Also Published As

Publication number Publication date
CN111191440A (zh) 2020-05-22

Similar Documents

Publication Publication Date Title
WO2013116022A1 (en) Resolving out-of-vocabulary words during machine translation
US11010554B2 (en) Method and device for identifying specific text information
CN110309516B (zh) 机器翻译模型的训练方法、装置与电子设备
KR20150036041A (ko) 구문 기반 사전 추출 및 번역 품질 평가 기법
CN111191469B (zh) 大规模语料清洗对齐方法及装置
CN110990276A (zh) 接口字段自动化测试方法、装置和存储介质
CN111191440B (zh) 翻译中针对译文的量词纠错方法及系统
CN111178098B (zh) 一种文本翻译方法、装置、设备及计算机可读存储介质
WO2015043071A1 (zh) 一种译文检查方法及其系统
CN111309596A (zh) 数据库测试方法、装置、终端设备及存储介质
CN109977430B (zh) 一种文本翻译方法、装置及设备
CN115906797A (zh) 文本实体对齐方法、装置、设备及介质
CN103440231A (zh) 用于比较文本的设备和方法
US20230368550A1 (en) Text extraction using optical character recognition
EP3617908A1 (en) Machine translation method and apparatus, and storage medium
CN115547508A (zh) 数据校正方法、装置、电子设备及存储介质
CN113191163B (zh) 一种翻译方法、翻译装置、翻译设备以及存储介质
CN114936567A (zh) 一种基于知识蒸馏的无监督机器翻译质量预估方法和装置
CN107977360B (zh) 一种影视剧本中人物阵营的识别和划分方法
CN113743409A (zh) 一种文本识别方法和装置
CN117235345B (zh) 开放版式文档ofd搜索方法、装置及电子设备
CN112395865B (zh) 报关单校验方法及装置
CN110716855B (zh) 处理器指令集测试方法及装置
JP7268119B2 (ja) テキスト内の数値コンテンツの誤り訂正方法、装置及び電子機器
CN115760006B (zh) 数据校正方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant