CN114595702A - 一种文本翻译模型训练方法、文本翻译方法及相关装置 - Google Patents
一种文本翻译模型训练方法、文本翻译方法及相关装置 Download PDFInfo
- Publication number
- CN114595702A CN114595702A CN202210195799.9A CN202210195799A CN114595702A CN 114595702 A CN114595702 A CN 114595702A CN 202210195799 A CN202210195799 A CN 202210195799A CN 114595702 A CN114595702 A CN 114595702A
- Authority
- CN
- China
- Prior art keywords
- text
- language text
- language
- translation model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 173
- 238000012549 training Methods 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000013507 mapping Methods 0.000 claims abstract description 66
- 238000002372 labelling Methods 0.000 claims abstract description 23
- 230000011218 segmentation Effects 0.000 claims description 64
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供一种文本翻译模型训练方法、文本翻译方法及相关装置,能够获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;根据映射关系对第一语言文本进行标注,得到第一语言文本的标签,标签为第一语言文本对应的目标语言文本;根据第一语言文本和标签对文本翻译模型进行训练,得到训练后的文本翻译模型。由于本申请实施例能够通过映射关系对第一语言文本进行标注,从而得到第一语言文本的标签,如此采用第一语言文本和标签对文本翻译模型进行训练,能够得到翻译精度高的训练后的文本翻译模型,通过采用训练后的文本翻译模型进行翻译,能够提高翻译的准确性和效率。
Description
技术领域
本申请涉及人工智能技术领域,具体涉及一种文本翻译模型训练方法、文本翻译方法及相关装置,该相关装置包括文本翻译模型训练装置、文本翻译装置、计算机设备和计算机可读存储介质。
背景技术
随着信息化的发展,应用系统越来越繁杂,但是应用和应用之间进行交互需要通过应用的特征串来实现。特征串可以理解为代码,其包括应用的一些重要的配置信息或者基础数据参数信息。
目前很多时候直接使用中文来对应用的特征串进行描述,可以理解为是使用中文来作为应用的特征串的标识。在应用和应用之间交互的时候,需要通过传递特征串来实现,但是在传递特征串会使用到对特征串进行描述的中文。由于应用系统对中文识别会涉及到对中文的转码问题,导致出现辨识度不够的问题。因此,传递特征串的时候通常会用采用相近含义的英文或拼音,数字,比如少儿教育频道,在传递的特征串的时候使用ChildenEduChannel进行描述。现有会采用人工的方式将中文转化为非中文的形式,但是,采用人工的方式,在开发过程中,可能会由不同的开发人人员将中文转化为非中文的形式,这样存在容易出错以及速度慢的问题。
发明内容
本申请实施例提供一种文本翻译模型训练方法、文本翻译方法及相关装置,该相关装置包括文本翻译模型训练装置、文本翻译装置、计算机设备和计算机可读存储介质,能够提高文本翻译的效率和准确性。
一种文本翻译模型训练方法,包括:
获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;
根据所述映射关系对所述第一语言文本进行标注,得到所述第一语言文本的标签,所述标签为所述第一语言文本对应的目标语言文本;
根据所述第一语言文本和所述标签对文本翻译模型进行训练,得到训练后的文本翻译模型。
相应地,本申请实施例提供一种文本翻译模型训练装置,包括:
第一获取单元,用于获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;
标注单元,用于根据所述映射关系对所述第一语言文本进行标注,得到所述第一语言文本的标签,所述标签为所述第一语言文本对应的目标语言文本;
第一训练单元,用于根据所述第一语言文本和所述标签对文本翻译模型进行训练,得到训练后的文本翻译模型。
在一些实施例中,第一获取单元,具体可以用于获取双语文本,所述双语文本包括第二语言文本和第三语言文本,所述第二语言文本为与所述第一语言文本语言相同的文本,所述第三语言文本为与所述目标语言文本的语言相同的语言文本;对所述第二语言文本进行分词处理,得到第一分词结果;对所述第三语言文本进行分词处理,得到第二分词结果;将所述第一分词结果和所述第二分词结果进行对齐,得到对齐结果;根据所述对齐结果生成所述预设第一语言文本和预设目标语言文本之间的映射关系。
在一些实施例中,第一获取单元,具体可以用于将所述第一分词结果和所述第二分词结果进行对齐,得到初始对齐结果;根据所述第二语言文本的语法规则,对所述初始对齐结果进行对齐,得到对齐结果。
在一些实施例中,第一获取单元,具体可以用于根据所述对齐结果,得到所述第一分词结果和所述第二分词结果的映射关系;根据所述第一分词结果和所述第二分词结果的映射关系生成所述预设第一语言文本和预设目标语言文本之间的映射关系。
在一些实施例中,第一训练单元,具体可以用于通过所述文本翻译模型对所述第一语言文本进行翻译,得到实际翻译文本;计算所述实际翻译文本和所述第一语言文本的标签之间的损失值;根据所述损失值调整所述文本翻译模型的模型参数,得到训练后的文本翻译模型。
在一些实施例中,文本翻译模型训练装置还包括第二训练单元,第二训练单元用于获取训练数据,所述训练数据包括第四语言文本和第五语言文本,所述第四语言文本为与所述第一语言文本的语言相同的语言文本,所述第五语言文本为与所述标签的语言相同的语言文本;根据所述训练数据对初始的文本翻译模型进行训练,得到文本翻译模型。
在一些实施例中,标注单元,用于根据所述映射关系,确定所述第一语言文本对应的预设目标语言文本;根据所述预设目标语言文本对所述第一语言文本进行标注,得到所述第一语言文本对应的目标语言文本;将所述目标语言文本作为所述第一语言文本的标签。
相应地,本申请实施例提供一种文本翻译装置,包括:
第二获取单元,用于获取待翻译文本;
翻译单元,用于通过前述的训练后的文本翻译模型对所述待翻译文本进行文本翻译,得到目标翻译文本。
此外,本申请实施例还提供一种计算机设备,包括存储器和处理器;存储器存储有计算机程序,处理器用于运行存储器内的计算机程序,以执行本申请实施例提供的任一种文本翻译模型训练方法或本申请实施例提供的任一种文本翻译方法。
此外,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序适于处理器进行加载,以执行本申请实施例提供的任一种文本翻译模型训练方法或本申请实施例提供的任一种文本翻译方法。
本申请实施例能够获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;根据映射关系对第一语言文本进行标注,得到第一语言文本的标签,标签为第一语言文本对应的目标语言文本;根据第一语言文本和标签对文本翻译模型进行训练,得到训练后的文本翻译模型。由于本申请实施例能够通过映射关系对第一语言文本进行标注,从而得到第一语言文本的标签,如此采用第一语言文本和标签对文本翻译模型进行训练,能够得到翻译精度高的训练后的文本翻译模型,通过采用训练后的文本翻译模型进行翻译,能够提高翻译的准确性和效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的文本翻译模型训练方法的场景示意图;
图2是本申请实施例提供的文本翻译模型训练方法的流程示意一图;
图3是本申请实施例提供的文本翻译模型训练方法的流程示意二图;
图4是本申请实施例提供的文本翻译模型训练装置的结构示意图;
图5是本申请实施例提供的文本翻译装置的结构示意图;
图6是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种文本翻译模型训练方法、装置、计算机设备和计算机可读存储介质。其中,该文本翻译模型训练装置可以集成在计算机设备中,该计算机设备可以是服务器,也可以是终端等设备。
其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
例如,参见图1,以文本翻译模型训练装置集成在计算机设备,计算机设备为智能电视机为例,智能电视机获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;根据映射关系对第一语言文本进行标注,得到第一语言文本的标签;根据第一语言文本和标签对文本翻译模型进行训练,得到训练后的文本翻译模型。
其中,预设第一语言文本可以为中文、日语等。
其中,第一语言文本为与预设第一语言文本的语言相同的文本。
其中,预设目标语言文本可以为英文、葡萄牙文等。
其中,目标语言文本为与预设目标语言文本的语言相同的文本。
其中,标签为第一语言文本对应的目标语言文本
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本实施例将从文本翻译模型训练装置的角度进行描述,该文本翻译模型训练装置具体可以集成在计算机设备中,该计算机设备可以是服务器,也可以是终端等设备;其中,该终端可以包括平板电脑、笔记本电脑、以及个人计算机(PC,Personal Computer)、可穿戴设备、虚拟现实设备或其他可以获取数据的智能设备等设备。
如图2所示,该文本翻译模型训练方法的具体流程如下:
101、获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本。
其中,预设第一语言文本可以为中文。预设目标语言文本可以为英文。
其中,第一语言文本为与预设第一语言文本的语言相同的文本。
102、根据映射关系对第一语言文本进行标注,得到第一语言文本的标签。
其中,标签为第一语言文本对应的目标语言文本。
其中,目标语言文本为与预设目标语言文本的语言相同的文本。
103、根据第一语言文本和标签对文本翻译模型进行训练,得到训练后的文本翻译模型。
本申请实施例能够获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;根据映射关系对第一语言文本进行标注,得到第一语言文本的标签,标签为第一语言文本对应的目标语言文本;根据第一语言文本和标签对文本翻译模型进行训练,得到训练后的文本翻译模型。由于本申请实施例能够通过映射关系对第一语言文本进行标注,从而得到第一语言文本的标签,如此采用第一语言文本和标签对文本翻译模型进行训练,能够得到翻译精度高的训练后的文本翻译模型,通过采用训练后的文本翻译模型进行翻译,能够提高翻译的准确性和效率。
根据上面实施例所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该文本翻译模型训练装置具体集成在计算机设备为例进行说明。
如图5所示,一种文本翻译模型训练方法,具体流程如下:
S201、计算机设备获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本。
具体地,本申请实施例获取预设第一语言文本和预设目标语言文本之间的映射关系的具体过程可以如下:
计算机设备获取双语文本,双语文本包括第二语言文本和第三语言文本;对第二语言文本进行分词处理,得到第一分词结果;对第三语言文本进行分词处理,得到第二分词结果;将第一分词结果和第二分词结果进行对齐,得到对齐结果;根据对齐结果生成预设第一语言文本和预设目标语言文本之间的映射关系。
其中,第二语言文本为与第一语言文本语言相同的文本,第三语言文本为与目标语言文本的语言相同的语言文本。
其中,计算机设备根据第二语言文本中词的词性对词进行分词处理,得到第一分词结果。计算机设备根据第三语言文本中词的词性对词进行分词处理,得到第二分词结果。第二语言文本中词的词性可以预先进行标注。第三语言文本中词的词性可以预先进行标注。
其中,计算机设备可以根据词性将第一分词结果和第二分词结果进行对齐,得到对齐结果。比如,第二语言文本为“中文”,“中文”的词性为名词,“中文”对应的第三语言文本为“Chinese”,“Chinese”的词性为名词。对齐结果是“中文”和“Chinese”对齐。
具体地,计算机设备将第一分词结果和第二分词结果进行对齐,得到对齐结果的过程可以如下:
计算机设备将第一分词结果和第二分词结果进行对齐,得到初始对齐结果;根据第二语言文本的语法规则,对初始对齐结果进行对齐,得到对齐结果。
其中,计算机设备可以根据词性将第一分词结果和第二分词结果进行对齐,得到初始对齐结果。例如,第二语言文本为“我爱中文”,其中,“我”的词性是人称代词,“爱”的词性是动词,“中文”的词性是名词。“我爱中文”对应的第三语言文本是“I love Chinese”,其中,“I”的词性是人称代词,“love”的词性是动词,“Chinese”的词性是名词。初始对齐结果是:“我”和“I”对齐,“爱”和“love”对齐,“中文”和“Chinese”对齐。计算机设备按照语法规则对初始对齐结果进行对齐,得到对齐结果,例如,“我爱中文”根据语法规则“主谓宾”对初始对齐结果进行对齐,得到对齐结果,对齐结果是“我爱中文”和“I love Chinese”对齐。
具体地,计算机设备根据对齐结果,得到第一分词结果和第二分词结果的映射关系;根据第一分词结果和第二分词结果的映射关系生成预设第一语言文本和预设目标语言文本之间的映射关系。
本申请实施例可以根据词得到第一分词结果和第二分词结果的映射关系,例如,“喜欢”和“like”,“中文”和“Chinese”呈映射关系。本申请实施例可以根据句子得到第一分词结果和第二分词结果的映射关系,例如,“我喜欢中文”和“I love Chinese”呈映射关系。
S202、计算机设备根据映射关系对第一语言文本进行标注,得到第一语言文本的标签。
具体地,计算机设备根据映射关系,确定第一语言文本对应的预设目标语言文本;根据预设目标语言文本对第一语言文本进行标注,得到第一语言文本对应的目标语言文本;将目标语言文本作为第一语言文本的标签。
其中,标签为第一语言文本对应的目标语言文本。
例如,第一语言文本为“电视机”,确定第一语言文本对应的预设目标语言文本为“TV”。根据“TV”对“电视机”进行标注,从而确定“电视机”的标签为“TV”。
S203、计算机设备通过文本翻译模型对第一语言文本进行翻译,得到实际翻译文本。
其中,文本翻译模型可以为CNN模型,也可以为RNN模型。
S204、计算机设备计算实际翻译文本和第一语言文本的标签之间的损失值。
其中,本申请实施例可以采用损失函数得到实际翻译文本和第一语言文本的标签之间的损失值,损失函数可以为交叉熵损失函数,也可以为均方误差损失函数,具体可以根据需求来选择。
S205、计算机设备根据损失值调整文本翻译模型的模型参数,得到训练后的文本翻译模型。
另外,本申请实施例在获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本之前,计算机设备可以获取训练数据;根据训练数据对初始的文本翻译模型进行训练,得到文本翻译模型。如此,本申请通过对初始的文本翻译模型进行训练,可以得到优化的文本翻译模型。然后,本申请实施例通过采用第一语言文本和标签对文本翻译模型进行进一步的训练,能够得到翻译精度更高的训练后的文本翻译模型,通过采用训练后的文本翻译模型进行翻译,能够提高翻译的准确性和效率。
其中,训练数据包括第四语言文本和第五语言文本。第四语言文本为与第一语言文本的语言相同的语言文本,第五语言文本为与标签的语言相同的语言文本。
本申请实施例能够获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;根据映射关系对第一语言文本进行标注,得到第一语言文本的标签,标签为第一语言文本对应的目标语言文本;根据第一语言文本和标签对文本翻译模型进行训练,得到训练后的文本翻译模型。由于本申请实施例能够通过映射关系对第一语言文本进行标注,从而得到第一语言文本的标签,如此采用第一语言文本和标签对文本翻译模型进行训练,能够得到翻译精度高的训练后的文本翻译模型,通过采用训练后的文本翻译模型进行翻译,能够提高翻译的准确性和效率。
另外,本申请实施例对上述训练好的文本翻译模型应用,在本实施例中,将以该文本翻译装置具体集成在计算机设备为例进行说明,计算机设备可以为终端,也可以为服务器。
具体地,计算机设备获取待翻译文本;通过上述训练后的文本翻译模型对待翻译文本进行文本翻译,得到目标翻译文本。如此,可以提高待翻译文本的翻译效率和准确性。
其中,待翻译文本可以为用来描述特征串的中文,也可以为任一种需要翻译的中文或非中文,可以根据具体需求设定。其中,特征串包括用于不同应用之间进行交互的代码。
为了更好地实施以上方法,本申请实施例还提供一种文本翻译模型训练装置,该文本翻译模型训练装置可以集成在计算机设备,比如服务器或终端等设备中,该终端可以包括平板电脑、笔记本电脑和/或个人计算机等。
例如,如图4所示,该文本翻译模型训练装置可以包括第一获取单元301、标注单元302、第一训练单元303和第二训练单元304,如下:
(1)第一获取单元301;
第一获取单元301,可以用于获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本。
在一些实施例中,第一获取单元301可以用于获取双语文本,双语文本包括第二语言文本和第三语言文本,第二语言文本为与第一语言文本语言相同的文本,第三语言文本为与目标语言文本的语言相同的语言文本;对第二语言文本进行分词处理,得到第一分词结果;对第三语言文本进行分词处理,得到第二分词结果;将第一分词结果和第二分词结果进行对齐,得到对齐结果;根据对齐结果生成预设第一语言文本和预设目标语言文本之间的映射关系。
在一些实施例中,第一获取单元301可以用于将第一分词结果和第二分词结果进行对齐,得到初始对齐结果;根据第二语言文本的语法规则,对初始对齐结果进行对齐,得到对齐结果。
在一些实施例中,第一获取单元301可以用于根据对齐结果,得到第一分词结果和第二分词结果的映射关系;根据第一分词结果和第二分词结果的映射关系生成预设第一语言文本和预设目标语言文本之间的映射关系。
(2)标注单元302;
标注单元302,可以用于根据映射关系对第一语言文本进行标注,得到第一语言文本的标签,标签为第一语言文本对应的目标语言文本。
在一些实施例中,标注单元302,可以用于根据映射关系,确定第一语言文本对应的预设目标语言文本;根据预设目标语言文本对第一语言文本进行标注,得到第一语言文本对应的目标语言文本;将目标语言文本作为第一语言文本的标签。
(3)第一训练单元303;
第一训练单元303,可以用于根据第一语言文本和标签对文本翻译模型进行训练,得到训练后的文本翻译模型。
在一些实施例中,第一训练单元303具体可以用于通过文本翻译模型对第一语言文本进行翻译,得到实际翻译文本;计算实际翻译文本和第一语言文本的标签之间的损失值;根据损失值调整文本翻译模型的模型参数,得到训练后的文本翻译模型。
(4)第二训练单元304;
第二训练单元304,可以用于获取训练数据,训练数据包括第四语言文本和第五语言文本,第四语言文本为与第一语言文本的语言相同的语言文本,第五语言文本为与标签的语言相同的语言文本;根据训练数据对初始的文本翻译模型进行训练,得到文本翻译模型。
由上可知,本申请实施例的第一获取单元301可以用于获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;标注单元302可以用于根据映射关系对第一语言文本进行标注,得到第一语言文本的标签,标签为第一语言文本对应的目标语言文本;第一训练单元303可以用于根据第一语言文本和标签对文本翻译模型进行训练,得到训练后的文本翻译模型。由于本申请实施例能够通过映射关系对第一语言文本进行标注,从而得到第一语言文本的标签,如此采用第一语言文本和标签对文本翻译模型进行训练,能够得到翻译精度高的训练后的文本翻译模型,通过采用训练后的文本翻译模型进行翻译,能够提高翻译的准确性和效率。
为了更好地实施以上方法,本申请实施例还提供一种文本翻译模型训练装置,该文本翻译装置可以集成在计算机设备,比如服务器或终端等设备中,该终端可以包括平板电脑、笔记本电脑和/或个人计算机等。
例如,如图5所示,该文本翻译模型训练装置可以包括第二获取单元S301、翻译单元S302,如下:
(1)第二获取单元S301;
第二获取单元S301,可以用于获取待翻译文本。
(2)翻译单元S302;
翻译单元S302,可以用于通过前述的训练后的文本翻译模型对所述待翻译文本进行文本翻译,得到目标翻译文本。
由上可知,本申请实施例的第二获取单元S301可以用于获取待翻译文本;翻译单元S302可以用于通过前述的训练后的文本翻译模型对所述待翻译文本进行文本翻译,得到目标翻译文本。由于本申请实施例通过训练后的文本翻译模型对待翻译文本进行文本翻译,能够提高待翻译文本转化为目标翻译文本的效率,并减少出错率。
本申请实施例还提供一种计算机设备,如图6所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图6中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和计算机程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
计算机设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息通讯,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器401会按照如下的指令,将一个或一个以上的计算机程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的计算机程序,从而实现各种功能,比如:
获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;根据映射关系对第一语言文本进行标注,得到第一语言文本的标签,标签为第一语言文本对应的目标语言文本;根据第一语言文本和标签对文本翻译模型进行训练,得到训练后的文本翻译模型。
比如:
获取待翻译文本;通过前述的训练后的文本翻译模型对待翻译文本进行文本翻译,得到目标翻译文本。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成,或通过计算机程序控制相关的硬件来完成,该计算机程序可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种文本翻译模型训练方法或一种文本翻译方法。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种文本翻译模型训练方法中的步骤,因此,可以实现本申请实施例所提供的任一种文本翻译模型训练方法所能实现的有益效果;或可以执行本申请实施例所提供的一种文本翻译方法中的步骤,因此,可以实现本申请实施例所提供的任一种文本翻译方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
其中,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
以上对本申请实施例所提供的一种文本翻译模型训练方法、文本翻译方法及相关装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (11)
1.一种文本翻译模型训练方法,其特征在于,包括:
获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;
根据所述映射关系对所述第一语言文本进行标注,得到所述第一语言文本的标签,所述标签为所述第一语言文本对应的目标语言文本;
根据所述第一语言文本和所述标签对文本翻译模型进行训练,得到训练后的文本翻译模型。
2.根据权利要求1所述的文本翻译模型训练方法,其特征在于,所述获取预设第一语言文本和预设目标语言文本之间的映射关系,包括:
获取双语文本,所述双语文本包括第二语言文本和第三语言文本,所述第二语言文本为与所述第一语言文本语言相同的文本,所述第三语言文本为与所述目标语言文本的语言相同的语言文本;
对所述第二语言文本进行分词处理,得到第一分词结果;
对所述第三语言文本进行分词处理,得到第二分词结果;
将所述第一分词结果和所述第二分词结果进行对齐,得到对齐结果;
根据所述对齐结果生成所述预设第一语言文本和预设目标语言文本之间的映射关系。
3.根据权利要求2所述的文本翻译模型训练方法,其特征在于,所述将所述第一分词结果和所述第二分词结果进行对齐,得到对齐结果,包括:
将所述第一分词结果和所述第二分词结果进行对齐,得到初始对齐结果;
根据所述第二语言文本的语法规则,对所述初始对齐结果进行对齐,得到对齐结果。
4.根据权利要求2所述的文本翻译模型训练方法,其特征在于,所述根据所述对齐结果生成所述预设第一语言文本和预设目标语言文本之间的映射关系,包括:
根据所述对齐结果,得到所述第一分词结果和所述第二分词结果的映射关系;
根据所述第一分词结果和所述第二分词结果的映射关系生成所述预设第一语言文本和预设目标语言文本之间的映射关系。
5.根据权利要求1所述的文本翻译模型训练方法,其特征在于,所述根据所述第一语言文本和所述标签对文本翻译模型进行训练,得到训练后的文本翻译模型,包括:
通过所述文本翻译模型对所述第一语言文本进行翻译,得到实际翻译文本;
计算所述实际翻译文本和所述第一语言文本的标签之间的损失值;
根据所述损失值调整所述文本翻译模型的模型参数,得到训练后的文本翻译模型。
6.根据权利要求1所述的文本翻译模型训练方法,其特征在于,所述获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本之前,包括:
获取训练数据,所述训练数据包括第四语言文本和第五语言文本,所述第四语言文本为与所述第一语言文本的语言相同的语言文本,所述第五语言文本为与所述标签的语言相同的语言文本;
根据所述训练数据对初始的文本翻译模型进行训练,得到文本翻译模型。
7.根据权利要求1所述的文本翻译模型训练方法,其特征在于,所述根据所述映射关系对所述第一语言文本进行标注,得到所述第一语言文本的标签,包括:
根据所述映射关系,确定所述第一语言文本对应的预设目标语言文本;
根据所述预设目标语言文本对所述第一语言文本进行标注,得到所述第一语言文本对应的目标语言文本;
将所述目标语言文本作为所述第一语言文本的标签。
8.一种文本翻译方法,其特征在于,包括:
获取待翻译文本;
通过如权利要求1至7任一项所述的训练后的文本翻译模型对所述待翻译文本进行文本翻译,得到目标翻译文本。
9.一种文本翻译模型训练装置,其特征在于,包括:
第一获取单元,用于获取预设第一语言文本和预设目标语言文本之间的映射关系,以及获取第一语言文本;
标注单元,用于根据所述映射关系对所述第一语言文本进行标注,得到所述第一语言文本的标签,所述标签为所述第一语言文本对应的目标语言文本;
第一训练单元,用于根据所述第一语言文本和所述标签对文本翻译模型进行训练,得到训练后的文本翻译模型。
10.一种计算机设备,其特征在于,包括存储器和处理器;所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行权利要求1至7任一项所述的文本翻译模型训练方法,或权利要求8所述的文本翻译方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1至7任一项所述的文本翻译模型训练方法,或权利要求8所述的文本翻译方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210195799.9A CN114595702A (zh) | 2022-03-01 | 2022-03-01 | 一种文本翻译模型训练方法、文本翻译方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210195799.9A CN114595702A (zh) | 2022-03-01 | 2022-03-01 | 一种文本翻译模型训练方法、文本翻译方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114595702A true CN114595702A (zh) | 2022-06-07 |
Family
ID=81808024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210195799.9A Pending CN114595702A (zh) | 2022-03-01 | 2022-03-01 | 一种文本翻译模型训练方法、文本翻译方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114595702A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116486421A (zh) * | 2023-04-28 | 2023-07-25 | 书行科技(北京)有限公司 | 图像翻译和检测方法、图像模型训练方法及相关产品 |
-
2022
- 2022-03-01 CN CN202210195799.9A patent/CN114595702A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116486421A (zh) * | 2023-04-28 | 2023-07-25 | 书行科技(北京)有限公司 | 图像翻译和检测方法、图像模型训练方法及相关产品 |
CN116486421B (zh) * | 2023-04-28 | 2024-03-22 | 书行科技(北京)有限公司 | 一种图像翻译模型的训练方法及相关产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102401942B1 (ko) | 번역품질 평가 방법 및 장치 | |
US10679148B2 (en) | Implicit bridging of machine learning tasks | |
US12039286B2 (en) | Automatic post-editing model for generated natural language text | |
US20140316764A1 (en) | Clarifying natural language input using targeted questions | |
CN109522552B (zh) | 一种医疗信息的归一化方法、装置、介质及电子设备 | |
US11423089B2 (en) | System and method for determining application programming interface and object bindings on natural language processed inputs | |
CN109558604B (zh) | 一种机器翻译方法、装置、电子设备及存储介质 | |
WO2018045646A1 (zh) | 基于人工智能的人机交互方法和装置 | |
US11216292B2 (en) | Adapting client application of feature phone based on experiment parameters | |
US11288460B2 (en) | Translation support system, etc | |
JP7335300B2 (ja) | 知識事前訓練モデルの訓練方法、装置及び電子機器 | |
CN109858045B (zh) | 机器翻译方法和装置 | |
CN112069206B (zh) | 基于rpa及ai的数据查询方法、装置、介质及计算设备 | |
JP2021111420A (ja) | テキストエンティティの語義記述処理方法、装置及び機器 | |
CN113139391A (zh) | 翻译模型的训练方法、装置、设备和存储介质 | |
CN109657127B (zh) | 一种答案获取方法、装置、服务器及存储介质 | |
WO2020052060A1 (zh) | 用于生成修正语句的方法和装置 | |
CN114595702A (zh) | 一种文本翻译模型训练方法、文本翻译方法及相关装置 | |
CN113609873A (zh) | 翻译模型训练方法、装置及介质 | |
US20230124296A1 (en) | Method of natural language processing by performing semantic analysis using syntactic information, and an apparatus for the same | |
US10726211B1 (en) | Automated system for dynamically generating comprehensible linguistic constituents | |
US20230084438A1 (en) | Method of generating text, method of training model, electronic device, and medium | |
CN108932326B (zh) | 一种实例扩展方法、装置、设备和介质 | |
CN115116429A (zh) | 中英文混合识别方法、装置和计算机设备 | |
CN115599898A (zh) | 一种智能问答实现方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |