CN111178098B - 一种文本翻译方法、装置、设备及计算机可读存储介质 - Google Patents

一种文本翻译方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111178098B
CN111178098B CN201911411188.8A CN201911411188A CN111178098B CN 111178098 B CN111178098 B CN 111178098B CN 201911411188 A CN201911411188 A CN 201911411188A CN 111178098 B CN111178098 B CN 111178098B
Authority
CN
China
Prior art keywords
text
translated
target
translation
emotion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911411188.8A
Other languages
English (en)
Other versions
CN111178098A (zh
Inventor
段湘煜
周孝青
张民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201911411188.8A priority Critical patent/CN111178098B/zh
Publication of CN111178098A publication Critical patent/CN111178098A/zh
Application granted granted Critical
Publication of CN111178098B publication Critical patent/CN111178098B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种文本翻译方法,包括:对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别;利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本;将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本。本发明保证了文本翻译得到的目标文本与待翻译文本的情感一致性,较大地提高了文本翻译的准确率。本发明还公开了一种文本翻译装置、设备及存储介质,具有相应技术效果。

Description

一种文本翻译方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及翻译技术领域,特别是涉及一种文本翻译方法、装置、设备及计算机可读存储介质。
背景技术
传统的机器翻译方法为统计机器翻译方法(Statistical Machine Translation,简称SMT),从大规模平行语料中统计诸如词对、平行短语对、平行句法结构等的信息,以建立针对翻译过程的统计模型。但是该机器翻译方法仅是基于忠实度和流利度进行文本翻译,易出现翻译之后得到的前后文本之间的情感不一致的现象,文本翻译的准确率低。
综上所述,如何有效地解决现有的文本翻译方式仅是基于忠实度和流利度进行文本翻译,易出现翻译之后得到的前后文本之间的情感不一致的现象,文本翻译的准确率低等问题,是目前本领域技术人员急需解决的问题。
发明内容
本发明的目的是提供一种文本翻译方法,该方法保证了文本翻译得到的目标文本与待翻译文本的情感一致性,较大地提高了文本翻译的准确率;本发明的另一目的是提供一种文本翻译方法、装置、设备及计算机可读存储介质。
为解决上述技术问题,本发明提供如下技术方案:
一种文本翻译方法,包括:
对接收到的文本翻译请求进行解析,得到待翻译文本、所述待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;
利用文本翻译模型中所述第一语种类别对应的目标情感分类器对所述待翻译文本进行情感分类,得到目标情感类别;
利用所述文本翻译模型根据所述目标情感类别对所述待翻译文本进行情感标注,得到情感标注后待翻译文本;
将所述情感标注后待翻译文本输入至所述文本翻译模型中的目标翻译系统,得到目标文本;其中,所述目标翻译系统为将所述第一语种类别的语句翻译为所述第二语种类别的语句的翻译系统。
在本发明的一种具体实施方式中,在得到目标文本之后,还包括:
对所述目标文本进行准确性校验,得到校验结果;
当根据所述校验结果确定当次文本翻译的准确率小于预设值时,基于所述校验结果对所述文本翻译模型进行优化操作。
在本发明的一种具体实施方式中,对所述目标文本进行准确性校验,得到校验结果,包括:
计算目标文本对所述待翻译文本的BLEU值;
根据所述BLEU值对所述目标文本进行准确性校验,得到所述校验结果。
在本发明的一种具体实施方式中,在根据所述校验结果确定当次文本翻译的准确率大于等于所述预设值之后,还包括:
基于所述待翻译文本和所述目标文本对所述文本翻译模型中的语料库进行更新操作。
一种文本翻译装置,包括:
请求解析模块,用于对接收到的文本翻译请求进行解析,得到待翻译文本、所述待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;
情感类别获得模块,用于利用文本翻译模型中所述第一语种类别对应的目标情感分类器对所述待翻译文本进行情感分类,得到目标情感类别;
情感标注模块,用于利用所述文本翻译模型根据所述目标情感类别对所述待翻译文本进行情感标注,得到情感标注后待翻译文本;
目标文本获得模块,用于将所述情感标注后待翻译文本输入至所述文本翻译模型中的目标翻译系统,得到目标文本;其中,所述目标翻译系统为将所述第一语种类别的语句翻译为所述第二语种类别的语句的翻译系统。
在本发明的一种具体实施方式中,还包括:
校验模块,用于在得到目标文本之后,对所述目标文本进行准确性校验,得到校验结果;
模型优化模块,用于当根据所述校验结果确定当次文本翻译的准确率小于预设值时,基于所述校验结果对所述文本翻译模型进行优化操作。
在本发明的一种具体实施方式中,所述校验模块包括:
计算子模块,用于计算目标文本对所述待翻译文本的BLEU值;
校验子模块,用于根据所述BLEU值对所述目标文本进行准确性校验,得到所述校验结果。
在本发明的一种具体实施方式中,还包括:
语料库更新模块,用于在根据所述校验结果确定当次文本翻译的准确率大于等于所述预设值之后,基于所述待翻译文本和所述目标文本对所述文本翻译模型中的语料库进行更新操作。
一种文本翻译设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如前所述文本翻译方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述文本翻译方法的步骤。
应用本发明实施例所提供的方法,对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别;利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本;将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本;其中,目标翻译系统为将第一语种类别的语句翻译为第二语种类别的语句的翻译系统。通过对待翻译文本进行情感分类,并利用目标情感类别对待翻译文本进行情感标注,相较于现有的仅基于忠实度和流利度进行文本翻译的方式,保证了文本翻译得到的目标文本与待翻译文本的情感一致性,较大地提高了文本翻译的准确率。
相应的,本发明实施例还提供了与上述文本翻译方法相对应的文本翻译装置、设备和计算机可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中文本翻译方法的一种实施流程图;
图2为本发明实施例中文本翻译方法的另一种实施流程图;
图3为本发明实施例中一种文本翻译装置的结构框图;
图4为本发明实施例中一种文本翻译设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
参见图1,图1为本发明实施例中文本翻译方法的一种实施流程图,该方法可以包括以下步骤:
S101:对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别。
当需要进行文本翻译时,可以向文本翻译中心发送文本翻译请求,文本翻译请求中包含待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别。文本翻译中心接收文本翻译请求,并对文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别。如第一语种类别为中文,第二语种类别为英文,说明当前文本翻译请求为需要将待翻译文本由中文翻译为英文的文本翻译请求。
S102:利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别。
可以预先获取第一语种类别中两种情感标签分别对应的单语语料,利用带情感标签的单语语料对文本翻译模型进行训练,得到目标情感分类器。并可以预先获取第二语种类别中两种情感标签分别对应的单语语料,利用带情感标签的单语语料对文本翻译模型进行训练,得到第二语种类别对应的情感分类器。可以获取多个平行句对的数据集,利用两个情感分类器对平行句对的数据集进行情感标注,标注完成后,平行语料互为翻译,因此两者情感是一致的,过滤掉情感不一致的数据后,得到高质量的带伪情感标签的双语平行数据。例如,平行语料(A-B)表示双语互为翻译的两种语言A和语言B的文本,带情感标签的语料(B-P)是语言B的单语语料及其对应的情感标签P,和带情感标签的语料(A-P)是语言A的单语语料及其对应的情感标签P。
在解析得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别之后,可以利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别。
两情感类别包括正向情感和负向情感,例如,“苹果很好吃”为正向情感,“苹果很难吃”为负向情感。
S103:利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本。
在得到待翻译文本对应的目标情感类别之后,可以利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本。如当待翻译文本的目标情感类别为正向情感时,对待翻译文本进行情感标注得到正向情感待翻译文本,当待翻译文本的目标情感类别为负向情感时,对待翻译文本进行情感标注得到负向情感待翻译文本。
S104:将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本。
其中,目标翻译系统为将第一语种类别的语句翻译为第二语种类别的语句的翻译系统。
可以预先对文本翻译模型进行训练得到将第一语种类别的语句翻译为第二语种类别的语句对应的目标翻译系统。在得到情感标注后待翻译文本之后,可以将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,从而得到目标文本,目标文本即为待翻译文本对应的属目标情感类别的第二语种类别语料。通过构建多任务下的数据联合增强,即通过双语语料获取伪情感标签,通过机器翻译获取带情感标签的伪双语句对。能够同时联合训练机器翻译任务和情感分类任务,使得经翻译得到的目标文本既满足忠实度和流利度要求,同时又保证了翻译前后的情感一致,较大地提高了文本翻译的准确性。
应用本发明实施例所提供的方法,对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别;利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本;将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本;其中,目标翻译系统为将第一语种类别的语句翻译为第二语种类别的语句的翻译系统。通过对待翻译文本进行情感分类,并利用目标情感类别对待翻译文本进行情感标注,相较于现有的仅基于忠实度和流利度进行文本翻译的方式,保证了文本翻译得到的目标文本与待翻译文本的情感一致性,较大地提高了文本翻译的准确率。
需要说明的是,基于上述实施例一,本发明实施例还提供了相应的改进方案。在后续实施例中涉及与上述实施例一中相同步骤或相应步骤之间可相互参考,相应的有益效果也可相互参照,在下文的改进实施例中不再一一赘述。
实施例二:
参见图2,图2为本发明实施例中文本翻译方法的另一种实施流程图,该方法可以包括以下步骤:
S201:对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别。
S202:利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别。
S203:利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本。
S204:将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本。
其中,目标翻译系统为将第一语种类别的语句翻译为第二语种类别的语句的翻译系统。
S205:计算目标文本对待翻译文本的BLEU值。
在得到目标文本之后,可以计算目标文本对待翻译文本的BLEU(BilingualEvaluation Understudy)值。BLEU值为双语评价指标,用于衡量双语的翻译质量。
S206:根据BLEU值对目标文本进行准确性校验,得到校验结果。
在计算得到目标文本对待翻译文本的BLEU值之后,可以根据BLEU值对目标文本进行准确性校验,得到校验结果。
S207:当根据校验结果确定当次文本翻译的准确率小于预设值时,基于校验结果对文本翻译模型进行优化操作。
可以预先设置文本翻译的准确率阈值,在得到校验结果之后,当根据校验结果确定当次文本翻译的准确率小于预设值时,基于校验结果对文本翻译模型进行优化操作,如产生“奖赏”作为反馈给文本翻译模型。
S208:在根据校验结果确定当次文本翻译的准确率大于等于预设值之后,基于待翻译文本和目标文本对文本翻译模型中的语料库进行更新操作。
文本翻译模型中可以预存有语料库,在根据校验结果确定当次文本翻译的准确率大于等于预设值之后,基于待翻译文本和目标文本对文本翻译模型中的语料库进行更新操作。从而当再次接收到相同待翻译文本的文本翻译请求时,直接从语料库中调取目标文本并输出,提高了文本翻译效率。
相应于上面的方法实施例,本发明实施例还提供了一种文本翻译装置,下文描述的文本翻译装置与上文描述的文本翻译方法可相互对应参照。
参见图3,图3为本发明实施例中一种文本翻译装置的结构框图,该装置可以包括:
请求解析模块31,用于对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;
情感类别获得模块32,用于利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别;
情感标注模块33,用于利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本;
目标文本获得模块34,用于将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本;其中,目标翻译系统为将第一语种类别的语句翻译为第二语种类别的语句的翻译系统。
应用本发明实施例所提供的装置,对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别;利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本;将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本;其中,目标翻译系统为将第一语种类别的语句翻译为第二语种类别的语句的翻译系统。通过对待翻译文本进行情感分类,并利用目标情感类别对待翻译文本进行情感标注,相较于现有的仅基于忠实度和流利度进行文本翻译的方式,保证了文本翻译得到的目标文本与待翻译文本的情感一致性,较大地提高了文本翻译的准确率。
在本发明的一种具体实施方式中,该装置还可以包括:
校验模块,用于在得到目标文本之后,对目标文本进行准确性校验,得到校验结果;
模型优化模块,用于当根据校验结果确定当次文本翻译的准确率小于预设值时,基于校验结果对文本翻译模型进行优化操作。
在本发明的一种具体实施方式中,校验模块包括:
计算子模块,用于计算目标文本对待翻译文本的BLEU值;
校验子模块,用于根据BLEU值对目标文本进行准确性校验,得到校验结果。
在本发明的一种具体实施方式中,该装置还可以包括:
语料库更新模块,用于在根据校验结果确定当次文本翻译的准确率大于等于预设值之后,基于待翻译文本和目标文本对文本翻译模型中的语料库进行更新操作。
相应于上面的方法实施例,参见图4,图4为本发明所提供的文本翻译设备的示意图,该设备可以包括:
存储器41,用于存储计算机程序;
处理器42,用于执行上述存储器41存储的计算机程序时可实现如下步骤:
对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别;利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本;将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本;其中,目标翻译系统为将第一语种类别的语句翻译为第二语种类别的语句的翻译系统。
对于本发明提供的设备的介绍请参照上述方法实施例,本发明在此不做赘述。
相应于上面的方法实施例,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得到目标情感类别;利用文本翻译模型根据目标情感类别对待翻译文本进行情感标注,得到情感标注后待翻译文本;将情感标注后待翻译文本输入至文本翻译模型中的目标翻译系统,得到目标文本;其中,目标翻译系统为将第一语种类别的语句翻译为第二语种类别的语句的翻译系统。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不做赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置、设备及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种文本翻译方法,其特征在于,包括:
对接收到的文本翻译请求进行解析,得到待翻译文本、所述待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;
利用文本翻译模型中所述第一语种类别对应的目标情感分类器对所述待翻译文本进行情感分类,得到目标情感类别;
利用所述文本翻译模型根据所述目标情感类别对所述待翻译文本进行情感标注,得到情感标注后待翻译文本;
将所述情感标注后待翻译文本输入至所述文本翻译模型中的目标翻译系统,得到目标文本;其中,所述目标翻译系统为将所述第一语种类别的语句翻译为所述第二语种类别的语句的翻译系统。
2.根据权利要求1所述的文本翻译方法,其特征在于,在得到目标文本之后,还包括:
对所述目标文本进行准确性校验,得到校验结果;
当根据所述校验结果确定当次文本翻译的准确率小于预设值时,基于所述校验结果对所述文本翻译模型进行优化操作。
3.根据权利要求2所述的文本翻译方法,其特征在于,对所述目标文本进行准确性校验,得到校验结果,包括:
计算目标文本对所述待翻译文本的BLEU值;其中,所述BLEU值为双语评价指标,用于衡量双语的翻译质量;
根据所述BLEU值对所述目标文本进行准确性校验,得到所述校验结果。
4.根据权利要求2或3所述的文本翻译方法,其特征在于,在根据所述校验结果确定当次文本翻译的准确率大于等于所述预设值之后,还包括:
基于所述待翻译文本和所述目标文本对所述文本翻译模型中的语料库进行更新操作。
5.一种文本翻译装置,其特征在于,包括:
请求解析模块,用于对接收到的文本翻译请求进行解析,得到待翻译文本、所述待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;
情感类别获得模块,用于利用文本翻译模型中所述第一语种类别对应的目标情感分类器对所述待翻译文本进行情感分类,得到目标情感类别;
情感标注模块,用于利用所述文本翻译模型根据所述目标情感类别对所述待翻译文本进行情感标注,得到情感标注后待翻译文本;
目标文本获得模块,用于将所述情感标注后待翻译文本输入至所述文本翻译模型中的目标翻译系统,得到目标文本;其中,所述目标翻译系统为将所述第一语种类别的语句翻译为所述第二语种类别的语句的翻译系统。
6.根据权利要求5所述的文本翻译装置,其特征在于,还包括:
校验模块,用于在得到目标文本之后,对所述目标文本进行准确性校验,得到校验结果;
模型优化模块,用于当根据所述校验结果确定当次文本翻译的准确率小于预设值时,基于所述校验结果对所述文本翻译模型进行优化操作。
7.根据权利要求6所述的文本翻译装置,其特征在于,所述校验模块包括:
计算子模块,用于计算目标文本对所述待翻译文本的BLEU值;其中,所述BLEU值为双语评价指标,用于衡量双语的翻译质量;
校验子模块,用于根据所述BLEU值对所述目标文本进行准确性校验,得到所述校验结果。
8.根据权利要求6或7所述的文本翻译装置,其特征在于,还包括:
语料库更新模块,用于在根据所述校验结果确定当次文本翻译的准确率大于等于所述预设值之后,基于所述待翻译文本和所述目标文本对所述文本翻译模型中的语料库进行更新操作。
9.一种文本翻译设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述文本翻译方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述文本翻译方法的步骤。
CN201911411188.8A 2019-12-31 2019-12-31 一种文本翻译方法、装置、设备及计算机可读存储介质 Active CN111178098B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911411188.8A CN111178098B (zh) 2019-12-31 2019-12-31 一种文本翻译方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911411188.8A CN111178098B (zh) 2019-12-31 2019-12-31 一种文本翻译方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111178098A CN111178098A (zh) 2020-05-19
CN111178098B true CN111178098B (zh) 2023-09-12

Family

ID=70652338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911411188.8A Active CN111178098B (zh) 2019-12-31 2019-12-31 一种文本翻译方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111178098B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800780A (zh) * 2021-01-26 2021-05-14 浙江香侬慧语科技有限责任公司 一种多语种机器翻译方法、装置、存储介质及设备
CN116611459B (zh) * 2023-07-19 2024-03-15 腾讯科技(深圳)有限公司 翻译模型的训练方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699528A (zh) * 2013-12-30 2014-04-02 北京百度网讯科技有限公司 翻译译文的提供方法、装置和系统
CN104050160A (zh) * 2014-03-12 2014-09-17 北京紫冬锐意语音科技有限公司 一种机器与人工翻译相融合的口语翻译方法和装置
CN105320960A (zh) * 2015-10-14 2016-02-10 北京航空航天大学 一种基于投票的跨语言主客观情感分类方法
CN106383818A (zh) * 2015-07-30 2017-02-08 阿里巴巴集团控股有限公司 一种机器翻译方法及装置
CN108536756A (zh) * 2018-03-16 2018-09-14 苏州大学 基于双语信息的情绪分类方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2054817A4 (en) * 2006-08-18 2009-10-21 Ca Nat Research Council MEANS AND METHOD FOR DRIVING A STATISTICAL MACHINE TRANSLATION SYSTEM

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699528A (zh) * 2013-12-30 2014-04-02 北京百度网讯科技有限公司 翻译译文的提供方法、装置和系统
CN104050160A (zh) * 2014-03-12 2014-09-17 北京紫冬锐意语音科技有限公司 一种机器与人工翻译相融合的口语翻译方法和装置
CN106383818A (zh) * 2015-07-30 2017-02-08 阿里巴巴集团控股有限公司 一种机器翻译方法及装置
CN105320960A (zh) * 2015-10-14 2016-02-10 北京航空航天大学 一种基于投票的跨语言主客观情感分类方法
CN108536756A (zh) * 2018-03-16 2018-09-14 苏州大学 基于双语信息的情绪分类方法及系统

Also Published As

Publication number Publication date
CN111178098A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
JP6607902B2 (ja) フレーズに基づく辞書抽出及び翻訳品質評価
US8046211B2 (en) Technologies for statistical machine translation based on generated reordering knowledge
CN110543643B (zh) 文本翻译模型的训练方法及装置
US10789431B2 (en) Method and system of translating a source sentence in a first language into a target sentence in a second language
CN108090043B (zh) 基于人工智能的纠错举报处理方法、装置及可读介质
CN107861954B (zh) 基于人工智能的信息输出方法和装置
Specia et al. Improving the confidence of machine translation quality estimates
CN110555213B (zh) 文本翻译模型的训练方法、文本翻译方法及装置
US11709893B2 (en) Search method, electronic device and storage medium
CN111178098B (zh) 一种文本翻译方法、装置、设备及计算机可读存储介质
CN109359308B (zh) 机器翻译方法、装置及可读存储介质
CN111144137B (zh) 机器翻译后编辑模型语料的生成方法及装置
CN110751234A (zh) Ocr识别纠错方法、装置及设备
CN112836525A (zh) 一种基于人机交互机器翻译系统及其自动优化方法
CN110807338B (zh) 英汉机器翻译术语一致性自修正系统及方法
CN109657244B (zh) 一种英文长句自动切分方法及系统
CN107491441B (zh) 一种基于强制解码的动态抽取翻译模板的方法
CN115438678B (zh) 机器翻译方法、装置、电子设备及存储介质
EP3617908A1 (en) Machine translation method and apparatus, and storage medium
CN114254658A (zh) 翻译评测训练数据的生成方法及装置、设备和存储介质
CN114861628A (zh) 训练机器翻译模型的系统、方法、电子设备及存储介质
CN113988047A (zh) 一种语料筛选方法和装置
CN110147556B (zh) 一种多向神经网络翻译系统的构建方法
CN113822053A (zh) 一种语法错误检测方法、装置、电子设备及存储介质
CN111797638B (zh) 一种单词级质量标签的生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant