CN111797638B - 一种单词级质量标签的生成方法及装置 - Google Patents

一种单词级质量标签的生成方法及装置 Download PDF

Info

Publication number
CN111797638B
CN111797638B CN202010584479.3A CN202010584479A CN111797638B CN 111797638 B CN111797638 B CN 111797638B CN 202010584479 A CN202010584479 A CN 202010584479A CN 111797638 B CN111797638 B CN 111797638B
Authority
CN
China
Prior art keywords
quality
machine translation
word
generating
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010584479.3A
Other languages
English (en)
Other versions
CN111797638A (zh
Inventor
毛红保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iol Wuhan Information Technology Co ltd
Original Assignee
Iol Wuhan Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iol Wuhan Information Technology Co ltd filed Critical Iol Wuhan Information Technology Co ltd
Priority to CN202010584479.3A priority Critical patent/CN111797638B/zh
Publication of CN111797638A publication Critical patent/CN111797638A/zh
Application granted granted Critical
Publication of CN111797638B publication Critical patent/CN111797638B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/51Translation evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Abstract

本发明提供一种单词级质量标签的生成方法及装置,方法包括:步骤1:基于参考译文对机翻译文进行质量评分,得到第一质量分;步骤2:对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文;步骤3:基于所述参考译文对所述编辑操作后的所述机翻译文进行质量评分,得到第二质量分;步骤4:获取所述第二质量分相对于所述第一质量分的变化量;步骤5:基于所述变化量生成所述目标单词的质量标签。本发明能够提高单词级质量标签的生成效率。

Description

一种单词级质量标签的生成方法及装置
技术领域
本发明涉及机器翻译领域,特别涉及一种单词级质量标签的生成方法及装置。
背景技术
基于质量评估模型评估机器翻译译文的质量,是近几年机器翻译领域的研究热点。训练质量评估模型时,需要三元组数据:原文、机翻译文(机器翻译文、机器翻译译文)和参考译文(后编辑译文)。在进行单词级质量评估时,训练数据中还需包含机翻译文中每个单词的质量标签(如OK或BAD)。
目前在生成机翻译文中单词的质量标签时,普遍使用的是基于翻译错误率(TER,Translation Error Rate)的方法,即假设将机翻译文编辑为参考译文,机翻译文中的单词是否需要被编辑作为该单词标注为OK或BAD的依据。
TER的计算已经被证明是一个NP完全问题,只能使用启发式方法才能获得多项式时间复杂度的近似解,该方法复杂度较高,导致生成单词级质量标签的效率不高。
发明内容
本发明的目的是提供一种单词级质量标签的生成方法及装置,能够提高单词级质量标签的生成效率。
第一方面,本发明实施例提供一种单词级质量标签的生成方法,包括:
步骤1:基于参考译文对机翻译文进行质量评分,得到第一质量分;
步骤2:对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文;
步骤3:基于所述参考译文对所述编辑操作后的所述机翻译文进行质量评分,得到第二质量分;
步骤4:获取所述第二质量分相对于所述第一质量分的变化量;
步骤5:基于所述变化量生成所述目标单词的质量标签。
可选地,所述基于所述变化量生成所述目标单词的质量标签,之后包括:
对于所述机翻译文中去除所述目标单词后剩余的每个单词,执行步骤2至步骤5,直至生成所述机翻译文中每个单词的质量标签。
可选地,所述基于参考译文对机翻译文进行质量评分,得到第一质量分,包括:
计算机翻译文和参考译文之间的双语评估替换BLEU值,所述BLEU值用于表征所述机翻译文相对应所述参考译文的第一质量分。
可选地,所述对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文,包括:
从所述机翻译文中删除任意一个目标单词,得到删除后的所述机翻译文。
可选地,所述获取所述第二质量分相对于所述第一质量分的变化量,包括:
将所述第二质量分减去所述第一质量分,得到质量分差值,所述质量分差值用于表征所述第二质量分相对于所述第一质量分的变化量。
可选地,所述基于所述变化量生成所述目标单词的质量标签,包括:
若所述质量分差值小于预设阈值,则生成将所述目标单词标注为OK的质量标签;
若所述质量分差值不小于所述预设阈值,则生成将所述目标单词标注为BAD的质量标签。
第二方面,本发明实施例提供一种单词级质量标签的生成装置,包括:
第一处理模块,用于基于参考译文对机翻译文进行质量评分,得到第一质量分;
编辑模块,用于对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文;
第二处理模块,用于基于所述参考译文对所述编辑操作后的所述机翻译文进行质量评分,得到第二质量分;
获取模块,用于获取所述第二质量分相对于所述第一质量分的变化量;
生成模块,用于基于所述变化量生成所述目标单词的质量标签。
可选地,所述装置还包括:
第三处理模块,用于对于所述机翻译文中去除所述目标单词后剩余的每个单词,执行所述编辑模块、第二处理模块、获取模块及生成模块中的动作,直至生成所述机翻译文中每个单词的质量标签。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法。
本发明实施例提供的单词级质量标签的生成方法及装置,针对机翻译文中的任意一个目标单词,会进行相应地编辑操作,得到编辑后的机翻译文,根据编辑操作前的机翻译文的质量得分和编辑操作后的机翻译文的质量得分之间的变化量来衡量目标单词对机翻译文质量的影响,最后将变化量转换为质量标签。上述编辑操作方法和计算变化量的方法复杂度低,从而能够提高单词级质量标签的生成效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种单词级质量标签的生成方法流程图;
图2为本发明实施例提供的一种单词级质量标签的生成装置结构示意图;
图3为本发明实施例提供的一种电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例公开了一种单词级质量标签的生成方法,包括:
101、基于参考译文对机翻译文进行质量评分,得到第一质量分;
随着机器翻译技术的飞速发展,机器翻译质量评价这一研究课题应运而生,对于机翻译文,我们需要衡量其翻译质量。在评估机翻译文的翻译质量时,可以基于参考译文对机翻译文进行质量评分,评分越高,说明机翻译文的翻译质量越高。
参考译文是经专业人员对原文进行翻译、校对过的标准译文,为文本形式。
机翻译文是经机器(如翻译机)对原文进行翻译的译文。
102、对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文;
在基于参考译文对机翻译文进行质量评分,得到第一质量分后,对机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的机翻译文。
编辑操作包括但不限于删除、替换、修改。
103、基于所述参考译文对所述编辑操作后的所述机翻译文进行质量评分,得到第二质量分;
对于编辑操作后的机翻译文,我们需要衡量其翻译质量。在评估机翻译文的翻译质量时,同样可以基于参考译文对机翻译文进行质量评分,评分越高,说明编辑操作后的机翻译文的翻译质量越高。
104、获取所述第二质量分相对于所述第一质量分的变化量;
在得到第一质量分和第二质量分后,可以按照一定计算规则获取第二质量分相对于第一质量分的变化量。
105、基于所述变化量生成所述目标单词的质量标签。
由于该变化量可以用来衡量目标单词对机翻译文质量的影响,所以能够基于该变化量生成目标单词的质量标签。
可见,本申请实施例提供的单词级质量标签的生成方法,针对机翻译文中的任意一个目标单词,会进行相应地编辑操作,得到编辑后的机翻译文,根据编辑操作前的机翻译文的质量得分和编辑操作后的机翻译文的质量得分之间的变化量来衡量目标单词对机翻译文质量的影响,最后将变化量转换为质量标签。上述编辑操作方法和计算变化量的方法复杂度低,从而能够提高单词级质量标签的生成效率。
在前述方法实施例的基础上,在步骤105之后,还包括:
对于所述机翻译文中去除所述目标单词后剩余的每个单词,执行步骤102至步骤105,直至生成所述机翻译文中每个单词的质量标签。
具体地,在生成目标单词的质量标签后,针对机翻译文中去除该目标单词后剩余的每个单词,都会采用生成目标单词的质量标签相同的方式,直至机翻译文中的每个单词都生成有相应的质量标签。
在前述方法实施例的基础上,步骤101中基于参考译文对机翻译文进行质量评分,得到第一质量分,包括:
计算机翻译文和参考译文之间的双语评估替换(BLEU,Bilinguai EvaluationUnderstudy)值,所述BLEU值用于表征所述机翻译文相对应所述参考译文的第一质量分。
具体地,调用自然语言处理工具包(NLTK,Natural Language Toolkit),通过NLTK计算机翻译文和参考译文之间的BLEU值,即获得机翻译文相对于参考译文的句子质量得分。
NLTK是一个高效的Python构建的平台,用来处理人类自然语言数据。它提供了易于使用的接口,通过这些接口可以访问多个语料库和词汇资源,还有一套用于分类、标记化、词干标记、解析和语义推理的文本处理库,以及工业级自然语言处理(NLP,NaturalLanguage Processing)库的封装器和一个活跃的讨论论坛。
在自然语言处理中的机器翻译任务中,BLEU非常常见,它用于评估模型生成的句子和实际句子的差异的指标,通常取值范围在0到1之间,如果两个句子完成匹配,那么BLEU值是1,反之,如果两个句子完美不匹配,那么BLEU值是0。
在前述方法实施例的基础上,步骤102中对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文,包括:
从所述机翻译文中删除任意一个目标单词,得到删除后的所述机翻译文。
例如,假设目标单词为机翻译文中的第i个单词,选用编辑操作为删除,即直接删除机翻译文中的第i个单词,得到删除后的机翻译文。
相应地,在步骤103中,可以基于步骤101中的参考译文对删除后的机翻译文进行质量评分。
在前述方法实施例的基础上,步骤104中获取所述第二质量分相对于所述第一质量分的变化量,包括:
将所述第二质量分减去所述第一质量分,得到质量分差值,所述质量分差值用于表征所述第二质量分相对于所述第一质量分的变化量。
具体地,将第二质量分减去第一质量分,得到质量分差值,即机翻译文中的目标单词编辑操作之后,机翻译文质量得分的变化量,该变化量指示了机翻译文中的目标单词对句子质量的影响,该影响可以用来衡量目标单词的质量。
在前述方法实施例的基础上,步骤105中基于所述变化量生成所述目标单词的质量标签,包括:
若所述质量分差值小于预设阈值,则生成将所述目标单词标注为OK的质量标签;
若所述质量分差值不小于所述预设阈值,则生成将所述目标单词标注为BAD的质量标签。
具体地,考虑到需要将机翻译文中的目标单词标注为OK或者BAD这样的二义值,因此设定一个阈值,当质量分差值小于该阈值时,将目标单词标注为OK,否则将目标单词标注为BAD。
基于上述实施例的内容,本发明实施例提供了一种单词级质量标签的生成装置,该单词级质量标签的生成装置用于执行上述方法实施例中提供的单词级质量标签的生成方法。参见图2,该装置包括:
第一处理模块201,用于基于参考译文对机翻译文进行质量评分,得到第一质量分;
编辑模块202,用于对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文;
第二处理模块203,用于基于所述参考译文对所述编辑操作后的所述机翻译文进行质量评分,得到第二质量分;
获取模块204,用于获取所述第二质量分相对于所述第一质量分的变化量;
生成模块205,用于基于所述变化量生成所述目标单词的质量标签。
可见,本申请实施例提供的单词级质量标签的生成装置,针对机翻译文中的任意一个目标单词,会进行相应地编辑操作,得到编辑后的机翻译文,根据编辑操作前的机翻译文的质量得分和编辑操作后的机翻译文的质量得分之间的变化量来衡量目标单词对机翻译文质量的影响,最后将变化量转换为质量标签。上述编辑操作方法和计算变化量的方法复杂度低,从而能够提高单词级质量标签的生成效率。
在一些可选实施例中,该装置还包括:
第三处理模块,用于对于所述机翻译文中去除所述目标单词后剩余的每个单词,执行所述编辑模块202、第二处理模块203、获取模块204及生成模块205中的动作,直至生成所述机翻译文中每个单词的质量标签。
本发明实施例的单词级质量标签的生成装置,可以用于执行前述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、通信接口(Communications Interface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行如下方法:基于参考译文对机翻译文进行质量评分,得到第一质量分;对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文;基于所述参考译文对所述编辑操作后的所述机翻译文进行质量评分,得到第二质量分;获取所述第二质量分相对于所述第一质量分的变化量;基于所述变化量生成所述目标单词的质量标签。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各实施例提供的方法,例如包括:基于参考译文对机翻译文进行质量评分,得到第一质量分;对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文;基于所述参考译文对所述编辑操作后的所述机翻译文进行质量评分,得到第二质量分;获取所述第二质量分相对于所述第一质量分的变化量;基于所述变化量生成所述目标单词的质量标签。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种单词级质量标签的生成方法,其特征在于,包括:
步骤1:基于参考译文对机翻译文进行质量评分,得到第一质量分;
步骤2:对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文;
步骤3:基于所述参考译文对所述编辑操作后的所述机翻译文进行质量评分,得到第二质量分;
步骤4:获取所述第二质量分相对于所述第一质量分的变化量;
步骤5:基于所述变化量生成所述目标单词的质量标签。
2.根据权利要求1所述的单词级质量标签的生成方法,其特征在于,所述基于所述变化量生成所述目标单词的质量标签,之后包括:
对于所述机翻译文中去除步骤5中生成有所述质量标签的所述目标单词后剩余的每个单词,执行步骤2至步骤5,直至生成所述机翻译文中每个单词的质量标签。
3.根据权利要求1所述的单词级质量标签的生成方法,其特征在于,所述基于参考译文对机翻译文进行质量评分,得到第一质量分,包括:
计算机翻译文和参考译文之间的双语评估替换BLEU值,所述BLEU值用于表征所述机翻译文相对应所述参考译文的第一质量分。
4.根据权利要求1所述的单词级质量标签的生成方法,其特征在于,所述对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文,包括:
从所述机翻译文中删除任意一个目标单词,得到删除后的所述机翻译文。
5.根据权利要求1所述的单词级质量标签的生成方法,其特征在于,所述获取所述第二质量分相对于所述第一质量分的变化量,包括:
将所述第二质量分减去所述第一质量分,得到质量分差值,所述质量分差值用于表征所述第二质量分相对于所述第一质量分的变化量。
6.根据权利要求5所述的单词级质量标签的生成方法,其特征在于,所述基于所述变化量生成所述目标单词的质量标签,包括:
若所述质量分差值小于预设阈值,则生成将所述目标单词标注为OK的质量标签;
若所述质量分差值不小于所述预设阈值,则生成将所述目标单词标注为BAD的质量标签。
7.一种单词级质量标签的生成装置,其特征在于,包括:
第一处理模块,用于基于参考译文对机翻译文进行质量评分,得到第一质量分;
编辑模块,用于对所述机翻译文中的任意一个目标单词进行编辑操作,得到编辑操作后的所述机翻译文;
第二处理模块,用于基于所述参考译文对所述编辑操作后的所述机翻译文进行质量评分,得到第二质量分;
获取模块,用于获取所述第二质量分相对于所述第一质量分的变化量;
生成模块,用于基于所述变化量生成所述目标单词的质量标签。
8.根据权利要求7所述的单词级质量标签的生成装置,其特征在于,所述装置还包括:
第三处理模块,用于对于所述机翻译文中去除步骤5中生成有所述质量标签的所述目标单词后剩余的每个单词,执行所述编辑模块、第二处理模块、获取模块及生成模块中的动作,直至生成所述机翻译文中每个单词的质量标签。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的单词级质量标签的生成方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述单词级质量标签的生成方法的步骤。
CN202010584479.3A 2020-06-23 2020-06-23 一种单词级质量标签的生成方法及装置 Active CN111797638B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010584479.3A CN111797638B (zh) 2020-06-23 2020-06-23 一种单词级质量标签的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010584479.3A CN111797638B (zh) 2020-06-23 2020-06-23 一种单词级质量标签的生成方法及装置

Publications (2)

Publication Number Publication Date
CN111797638A CN111797638A (zh) 2020-10-20
CN111797638B true CN111797638B (zh) 2023-11-03

Family

ID=72804592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010584479.3A Active CN111797638B (zh) 2020-06-23 2020-06-23 一种单词级质量标签的生成方法及装置

Country Status (1)

Country Link
CN (1) CN111797638B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101482861A (zh) * 2008-01-09 2009-07-15 中国科学院自动化研究所 一种汉英词语自动对齐方法
CN101923540A (zh) * 2010-07-20 2010-12-22 陈洁 语言翻译质量审核方法
JP2011242895A (ja) * 2010-05-14 2011-12-01 Nippon Telegr & Teleph Corp <Ntt> 機械翻訳装置、機械翻訳方法、およびそのプログラム
CN102999483A (zh) * 2011-09-16 2013-03-27 北京百度网讯科技有限公司 一种文本矫正的方法和装置
KR20140066921A (ko) * 2012-11-23 2014-06-03 삼성전자주식회사 번역 평가 장치 및 번역 평가 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101482861A (zh) * 2008-01-09 2009-07-15 中国科学院自动化研究所 一种汉英词语自动对齐方法
JP2011242895A (ja) * 2010-05-14 2011-12-01 Nippon Telegr & Teleph Corp <Ntt> 機械翻訳装置、機械翻訳方法、およびそのプログラム
CN101923540A (zh) * 2010-07-20 2010-12-22 陈洁 语言翻译质量审核方法
CN102999483A (zh) * 2011-09-16 2013-03-27 北京百度网讯科技有限公司 一种文本矫正的方法和装置
KR20140066921A (ko) * 2012-11-23 2014-06-03 삼성전자주식회사 번역 평가 장치 및 번역 평가 방법

Also Published As

Publication number Publication date
CN111797638A (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN110543643B (zh) 文本翻译模型的训练方法及装置
CN107861954B (zh) 基于人工智能的信息输出方法和装置
CN110555213B (zh) 文本翻译模型的训练方法、文本翻译方法及装置
CN110209802B (zh) 一种提取摘要文本的方法及装置
CN111160041B (zh) 语义理解方法、装置、电子设备和存储介质
WO2022148104A1 (zh) 基于预训练模型的机器翻译方法及系统
CN105144149A (zh) 翻译词序信息输出装置、翻译词序信息输出方法及存储介质
CN112883193A (zh) 一种文本分类模型的训练方法、装置、设备以及可读介质
CN111144137B (zh) 机器翻译后编辑模型语料的生成方法及装置
CN113705196A (zh) 基于图神经网络的中文开放信息抽取方法和装置
US9547645B2 (en) Machine translation apparatus, translation method, and translation system
CN110516251B (zh) 一种电商实体识别模型的构建方法、构建装置、设备和介质
CN114254658A (zh) 翻译评测训练数据的生成方法及装置、设备和存储介质
CN112836525B (zh) 一种基于人机交互机器翻译系统及其自动优化方法
CN111178098B (zh) 一种文本翻译方法、装置、设备及计算机可读存储介质
CN104572629B (zh) 生成单语解析模型的方法和装置以及语言转换装置
WO2021211300A1 (en) System and method for summerization of customer interaction
CN111797638B (zh) 一种单词级质量标签的生成方法及装置
CN103914447B (zh) 信息处理设备和信息处理方法
CN110309513B (zh) 一种文本依存分析的方法和装置
CN114997164A (zh) 文本生成方法及装置
CN115017876A (zh) 一种自动生成情感文本的方法及终端
CN110750989B (zh) 一种语句分析的方法及装置
CN112836528A (zh) 机器翻译后编辑方法及系统
Tammewar et al. Can distributed word embeddings be an alternative to costly linguistic features: A study on parsing hindi

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant