CN108345590B - 一种翻译方法、装置、电子设备以及存储介质 - Google Patents

一种翻译方法、装置、电子设备以及存储介质 Download PDF

Info

Publication number
CN108345590B
CN108345590B CN201711460034.9A CN201711460034A CN108345590B CN 108345590 B CN108345590 B CN 108345590B CN 201711460034 A CN201711460034 A CN 201711460034A CN 108345590 B CN108345590 B CN 108345590B
Authority
CN
China
Prior art keywords
source
text
vocabulary
probability
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711460034.9A
Other languages
English (en)
Other versions
CN108345590A (zh
Inventor
施亮亮
王宇光
姜里羊
阳家俊
李响
卫林钰
陈伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201711460034.9A priority Critical patent/CN108345590B/zh
Publication of CN108345590A publication Critical patent/CN108345590A/zh
Application granted granted Critical
Publication of CN108345590B publication Critical patent/CN108345590B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明实施例提供了一种翻译方法、装置、电子设备以及存储介质,以提高翻译的准确性。所述的方法包括:依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于在翻译文本中作为源词汇的译文;依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值;依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。能够减少替代符查询源文本中对应的源词汇的偏差,提高翻译的准确性。

Description

一种翻译方法、装置、电子设备以及存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及一种翻译方法、一种翻译装置、一种电子设备,以及一种存储介质。
背景技术
机器翻译又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。
但是,人类的自然语言非常复杂,每种语言的词语数量非常庞大,鉴于计算机系统资源和计算能力的限制,因此需要对词表进行削减。这也导致机器翻译过程中一些词表中没有的词汇需要用替代符代替,而替代符无法表示语义信息,因此还需要回到源文本中查询其对应的词汇,对该词汇进行转换从而得到翻译文本。但是,采用替代符查询源文本中对应源词汇时,往往容易出现偏差,影响翻译的准确性。
发明内容
本发明实施例所要解决的技术问题是提供一种翻译方法,以提高翻译的准确性。
相应的,本发明实施例还提供了一种翻译装置、一种电子设备及一种存储介质,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种翻译方法,所述的方法包括:依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于在翻译文本中作为源词汇的译文;依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值;依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
可选的,所述依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中各源词汇的概率,包括:依据源文本和翻译文本,确定对应的对齐矩阵,所述对齐矩阵包括:源文本中各源词汇、翻译文本中各翻译词汇、以及所述源词汇和翻译词汇的对齐概率;在所述对齐矩阵中,分别查询所述替代符对应源文本中各源词汇的对齐概率。
可选的,所述依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值,包括:确定所述源文本中各源词汇的调整权重;采用所述调整权重对相应源词汇和替代符的对齐概率进行加权,确定对应的调整概率值。
可选的,所述确定所述源文本中各源词汇的调整权重,包括:获取所述源文本中各源词汇的词频,依据所述词频确定对应源词汇的调整权重,其中,所述源词汇的词频越小,对应调整权重越大。
可选的,所述依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇,包括:将所述概率调整值最大的源词汇,作为所述替代符在所述源文本中对应的源词汇。
可选的,还包括:依据所述源词汇调整所述翻译文本。
可选的,所述依据源词汇调整所述翻译文本,包括以下至少一种:将所述翻译文本中的替代符替换为所述源词汇;将所述翻译文本中的替代符替换为所述源词汇的变形词汇。
本发明实施例还公开了一种翻译装置,包括:概率确定模块,用于依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于在翻译文本中作为源词汇的译文;概率调整模块,用于依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值;源词汇确定模块,用于依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
可选的,所述概率确定模块,包括:对齐矩阵确定子模块,用于依据源文本和翻译文本,确定对应的对齐矩阵,所述对齐矩阵包括:源文本中各源词汇、翻译文本中各翻译词汇、以及所述源词汇和翻译词汇的对齐概率;对齐概率确定子模块,用于在所述对齐矩阵中,分别查询所述替代符对应源文本中各源词汇的对齐概率。
可选的,所述概率调整模块,包括:权重确定子模块,用于确定所述源文本中各源词汇的调整权重;加权调整子模块,用于采用所述调整权重对相应源词汇和替代符的对齐概率进行加权,确定对应的调整概率值。
可选的,所述权重确定子模块,用于获取所述源文本中各源词汇的词频,依据所述词频确定对应源词汇的调整权重,其中,所述源词汇的词频越小,对应调整权重越大。
可选的,所述源词汇确定模块,用于将所述概率调整值最大的源词汇,作为所述替代符在所述源文本中对应的源词汇。
可选的,还包括:翻译文本调整模块,用于依据所述源词汇调整所述翻译文本。
可选的,所述翻译文本调整模块,用于将所述翻译文本中的替代符替换为所述源词汇;和/或,将所述翻译文本中的替代符替换为所述源词汇的变形词汇。
本发明实施例还公开了一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本发明实施例中任一所述的翻译方法。
本发明实施例还公开了一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于作为在翻译文本中作为源词汇的译文;依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值;依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
可选的,所述依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中各源词汇的概率,包括:依据源文本和翻译文本,确定对应的对齐矩阵,所述对齐矩阵包括:源文本中各源词汇、翻译文本中各翻译词汇、以及所述源词汇和翻译词汇的对齐概率;在所述对齐矩阵中,分别查询所述替代符对应源文本中各源词汇的对齐概率。
可选的,所述依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值,包括:确定所述源文本中各源词汇的调整权重;采用所述调整权重对相应源词汇和替代符的对齐概率进行加权,确定对应的调整概率值。
可选的,所述确定所述源文本中各源词汇的调整权重,包括:获取所述源文本中各源词汇的词频,依据所述词频确定对应源词汇的调整权重,其中,所述源词汇的词频越小,对应调整权重越大。
可选的,所述依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇,包括:将所述概率调整值最大的源词汇,作为所述替代符在所述源文本中对应的源词汇。
可选的,还包含用于进行以下操作的指令:依据所述源词汇调整所述翻译文本。
可选的,所述依据源词汇调整所述翻译文本,包括以下至少一种:将所述翻译文本中的替代符替换为所述源词汇;将所述翻译文本中的替代符替换为所述源词汇的变形词汇。
本发明实施例包括以下优点:
本发明实施例可依据源文本和翻译文本的对齐矩阵,确定替代符对应源文本中源词汇的对齐概率,并且确定每个源词汇的调整权重,从而对相应的对齐概率进行调整,得到概率调整值,即综合对齐矩阵和源词汇的调整权重来调整对齐的概率,然后基于概率调整值确定所述替代符在所述源文本中对应的源词汇,能够减少替代符查询源文本中对应的源词汇的偏差,提高翻译的准确性。
附图说明
图1是本发明的一种翻译方法实施例的步骤流程图;
图2是本发明的另一种翻译方法实施例的步骤流程图;
图3是本发明的一种翻译装置实施例的结构框图;
图4是本发明的另一种翻译装置实施例的结构框图;
图5是根据一示例性实施例示出的一种用于翻译的电子设备的结构框图;
图6是本发明实施例中服务器的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
人类的自然语言非常复杂,每种语言的词语数量非常庞大,鉴于计算机系统资源和计算能力的限制,因此需要对词表进行削减,其中,对于对机器翻译的词表的削减,可依据各种需求设定,例如将词频较低的词汇删除等。以词频为例,词频低的词汇在翻译中出现的概率也较低,如一些生僻词等,反之词频越高在翻译中出现的概率也越高,如你、我、他等词汇出现概率很高,因此可从词表中删除词频较低的词汇来减少数据量。
在机器翻译过程中,对于需要翻译的源文本可通过机器翻译,自动得到相应的翻译文本,则源文本中的词汇称为源词汇,翻译文本中的词汇称为翻译词汇,其中,翻译文本为源文本的译文,如对于英译中,源文本为英文,翻译文本为中文。并且在翻译过程中一些无法识别的词汇,如词表中没有的词汇,会用替代符作为译文,则即替代符可在翻译文本中作为源词汇的译文。其中,词表中没有的词汇可称为未登录词,在翻译过程中未登录词可采用替代符作为译文,替代符可通过各种符号或符号组合表征,例如替代符为“UNK”。源词汇可包括:字、词、标点符号等自然语言的内容,相应翻译词汇也可包括字、词、标点符号等自然语言的内容,例如中文的标点“。”翻译为英文为“.”。
本发明实施例可依据源文本和翻译文本的对齐矩阵,确定替代符对应源文本中源词汇的对齐概率,并且确定每个源词汇的调整权重,从而对相应的对齐概率进行调整,得到概率调整值,基于概率调整值确定所述替代符在所述源文本中对应的源词汇,综合对齐矩阵和源词汇的参数调整概率,能够减少替代符查询源文本中对应的源词汇的偏差,提高翻译的准确性。
参照图1,示出了本发明的一种翻译方法实施例的步骤流程图,具体可以包括如下步骤:
步骤102,依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率。
通过机器翻译得到源文本对应的翻译文本后,若翻译文本中存在替代符,则可确定源文本和翻译文本的对齐矩阵。该对齐矩阵用于确定源词汇和翻译词汇对齐的概率,从而基于该对齐矩阵可以确定翻译词汇对应的源词汇。所述对齐矩阵包括:所述源词汇和翻译词汇的对齐概率,也可包括源文本中各源词汇、翻译文本中各翻译词汇。然后可在该对齐矩阵中确定翻译文本中替代符针对源文本中源词汇的对齐概率。
例如,源文本为“五道口与龙泽相距11.2公里。”,机器翻译得到的翻译文本为“thewudaokou is UNK kilometer from the longze.”,其中,“UNK”为替代符的一种示例。则一种对齐矩阵的示例如表1所示。
Figure BDA0001530076320000061
表1
则可确定出UNK对应源词汇“五道口、与、龙泽、相距、11.2、公里、。”的对齐概率分别为0.04、0.03、0.08、0.02、0.37、0.41和0.05。
步骤104,依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值。
若仅依据对齐矩阵的对齐概率确定替代符所对应的源词汇,则可能出现偏差的概率较大,因此本发明实施例还设置有调整权重,该调整权重用于对对齐概率进行调整。其中,调整权重可依据源词汇的各种参数确定,例如源词汇的词频,源词汇对应不同翻译词汇的对齐概率等。因此在得到源文本中各源词汇对应的调整权重后,可针对每个源词汇的调整权重,对该源词汇对应替代符的对齐概率进行调整,得到替代符和该源词汇调整后的对齐概率即概率调整值。
步骤106,依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
分别确定出替代符对应每个源词汇的概率调整值后,可按照该概率调整值选择替代符在源文本中所对应的源词汇。从而后续可基于对应的源词汇确定翻译要转换的词汇,通过该转换的词汇更新翻译文本。
综上,可依据源文本和翻译文本的对齐矩阵,确定替代符对应源文本中源词汇的对齐概率,并且确定每个源词汇的调整权重,从而对相应的对齐概率进行调整,得到概率调整值,即综合对齐矩阵和源词汇的调整权重来调整对齐的概率,然后基于概率调整值确定所述替代符在所述源文本中对应的源词汇,能够减少替代符查询源文本中对应的源词汇的偏差,提高翻译的准确性。
本发明实施例中,可依据各源词汇的参数确定调整权重,从而对该源词汇和替代符的对齐概率进行调整,提高对齐概率的准确性。
在一个可选实施例中,可依据源词汇的词频确定对应的调整权重。词频越高用替代符作为译文的概率越低,反之,词频越低用替代符作为译文的概率越高,因此可设置源词汇的词频越小,对应调整权重越大。
还可依据其他参数确定源词汇的调整权重,例如综合比较一个源词汇对应各翻译词汇的对齐概率,从而确定出调整权重。其中,一个源词汇对应一个翻译词汇的可能性越大,其对应替代符的可能性就相应减少,因此可据此设置调整权重。还可基于其他参数确定,本发明实施例对此不作限定。
参照图2,示出了本发明的另一种翻译方法实施例的步骤流程图,具体可以包括如下步骤:
步骤202,依据源文本和翻译文本,确定对应的对齐矩阵。
步骤204,在所述对齐矩阵中,分别查询所述替代符对应源文本中各源词汇的对齐概率。
通过机器翻译得到源文本对应的翻译文本后,若翻译文本中存在替代符,则可依据源文本和翻译文本,确定对应的对齐矩阵。例如将源词汇和翻译词汇两两计算匹配的对齐概率,从而得到对齐矩阵。所述对齐矩阵包括:源文本中各源词汇、翻译文本中各翻译词汇、以及所述源词汇和翻译词汇的对齐概率。然后可在该对齐矩阵中查询替代符,再确定该替代符对应源文本中各源词汇的对齐概率。如表1中替代符UNK对应源文本中各源词汇“五道口、与、龙泽、相距、11.2、公里、。”的对齐概率分别为0.04、0.03、0.08、0.02、0.37、0.41和0.05。
步骤206,确定所述源文本中各源词汇的调整权重。
在获取替代符和源文本的对齐概率后,可基于源词汇确定对齐概率的调整权重,即获取各源词汇对应的参数,依据该参数确定调整权重。例如可综合比较一个源词汇对应各翻译词汇的对齐概率,从而确定出调整权重。
在一个可选实施例中,所述确定所述源文本中各源词汇的调整权重,包括:获取所述源文本中各源词汇的词频,依据所述词频确定对应源词汇的调整权重,其中,所述源词汇的词频越小,对应调整权重越大。即基于词汇的训练数据集查询各源词汇对应的词频,然后依据词频计算对应源词汇的调整权重,词频越高用替代符作为译文的概率越低,反之,词频越低用替代符作为译文的概率越高,因此可设置源词汇的词频越小,对应调整权重越大。
其中,按照词频确定调整权重的方式有多种,如可对词频进行变换处理,如反比变换等,从而得到对应源词汇的调整权重。也可设置一定的阈值范围,基于不同的阈值范围设置不同的调整权重。
本发明实施例中,有时源文本中源词汇较多,因此也可按照对齐概率进行筛选来删除部分源词汇,例如按照对齐概率的大小,筛选出前N个替代符对应源词汇的对齐概率,又如筛选出替代符对应源词汇对齐概率大于筛选阈值的。然后对筛选出的替代符对应源词汇的对齐概率,按照概率调整值进行调整。
步骤208,采用所述调整权重对相应源词汇和替代符的对齐概率进行加权,确定对应的调整概率值。
再采用各源词汇对应的调整权重,对该源词汇和替代符的对齐概率进行加权计算,如将调整权重和对应对齐概率相乘,得到对应的调整概率值。一个示例中,替代符UNK对应源文本中各源词汇“五道口、与、龙泽、相距、11.2、公里、。”的调整权重分别为0.18、0.01、0.20、0.10、0.90、0.10和0.02。则相应调整概率值的示例如表2所示:
源词汇 对齐概率 调整权重 概率调整值
五道口 0.04 0.18 0.0072
0.03 0.01 0.0003
龙泽 0.08 0.20 0.0160
相距 0.02 0.10 0.0020
11.2 0.37 0.90 0.3330
公里 0.41 0.10 0.0410
0.05 0.02 0.0010
表2
从而替代符UNK对应源文本中各源词汇“五道口、与、龙泽、相距、11.2、公里、。”的概率调整值分别为0.0072、0.0003、0.0160、0.0020、0.3330、0.0410和0.0010。通过调整权重的加权处理,可对各源词汇和替代符的对齐概率进行调整,从而提高对齐概率的准确性。
步骤210,将所述概率调整值最大的源词汇,作为所述替代符在所述源文本中对应的源词汇。
从替代符和源词汇的概率调整值中确定最大的概率调整值,将该最大的概率调整值对应的源词汇作为替代符在所述源文本中对应的源词汇。从而通过上述方式可反向查询到替代符所对应的源词汇。
步骤212,依据所述源词汇调整所述翻译文本。
对于替代符在所述源文本中对应的源词汇,可基于该源词汇调整翻译文本,其中,包括以下至少一种调整步骤:将所述翻译文本中的替代符替换为所述源词汇;将所述翻译文本中的替代符替换为所述源词汇的变形词汇。直接将替代符对应源词汇添加到翻译文本中,例如上述表2中确定替代符在所述源文本中对应的源词汇为“11.2”,则将“11.2”添加到翻译文本中,得到该源文本的译文。也可依据该源词汇确定出变形词汇,该变形词汇可依据翻译方式、语言类型等确定,从而将替代符替换为变形词汇,得到该源文本对应的译文,完成对源文本的翻译。例如在中译英过程中,将中文的源词汇转换成拼音形式,将转换得到的拼音词汇作为变形词汇。
其中,在翻译文本中使用源词汇或源词汇的变形词汇,可依据翻译方式、语言类型等确定,如上例在英译中时中文词汇采用拼音代替;又如在中译日时,对于无法识别的中文直接添加到翻译文本中。
从而在机器翻译过程中,对于翻译文本中的替代符,可确定替代符和源词汇的对齐概率,然后采用源词汇的调整权重对对齐概率进行调整,得到相应的调整权重值,从而提高替代符和源词汇对齐概率的准确性,进而提高确定替代符所对应的源词汇的准确性,使得后续调整的翻译文本更加准确。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
本发明实施例还提供了一种翻译装置,应用于电子设备,包括服务器(集群)、终端设备等,如移动终端、台式电脑、计算机等设备中。
参照图3,示出了本发明的一种数据排列装置实施例的结构框图,具体可以包括如下模块:
概率确定模块302,用于依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于在翻译文本中作为源词汇的译文。
概率调整模块304,用于依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值。
源词汇确定模块306,用于依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
综上,可依据源文本和翻译文本的对齐矩阵,确定替代符对应源文本中源词汇的对齐概率,并且确定每个源词汇的调整权重,从而对相应的对齐概率进行调整,得到概率调整值,即综合对齐矩阵和源词汇的调整权重来调整对齐的概率,然后基于概率调整值确定所述替代符在所述源文本中对应的源词汇,能够减少替代符查询源文本中对应的源词汇的偏差,提高翻译的准确性。
参照图4,示出了本发明的另一种数据排列装置实施例的结构框图,具体可以包括如下模块:
概率确定模块302,用于依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于在翻译文本中作为源词汇的译文。
概率调整模块304,用于依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值。
源词汇确定模块306,用于依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
翻译文本调整模块308,用于依据所述源词汇调整所述翻译文本。
其中,所述概率确定模块302,包括:对齐矩阵确定子模块3022和对齐概率确定子模块3024,其中:
对齐矩阵确定子模块3022,用于依据源文本和翻译文本,确定对应的对齐矩阵,所述对齐矩阵包括:源文本中各源词汇、翻译文本中各翻译词汇、以及所述源词汇和翻译词汇的对齐概率。
对齐概率确定子模块3024,用于在所述对齐矩阵中,分别查询所述替代符对应源文本中各源词汇的对齐概率。
所述概率调整模块304,包括:权重确定子模块3042和加权调整子模块3044,其中:
权重确定子模块3042,用于确定所述源文本中各源词汇的调整权重。
加权调整子模块3044,用于采用所述调整权重对相应源词汇和替代符的对齐概率进行加权,确定对应的调整概率值。
所述权重确定子模块3042,用于获取所述源文本中各源词汇的词频,依据所述词频确定对应源词汇的调整权重,其中,所述源词汇的词频越小,对应调整权重越大。
所述源词汇确定模块306,用于将所述概率调整值最大的源词汇,作为所述替代符在所述源文本中对应的源词汇。
所述翻译文本调整模块308,用于将所述翻译文本中的替代符替换为所述源词汇;和/或,将所述翻译文本中的替代符替换为所述源词汇的变形词汇。
从而在机器翻译过程中,对于翻译文本中的替代符,可确定替代符和源词汇的对齐概率,然后采用源词汇的调整权重对对齐概率进行调整,得到相应的调整权重值,从而提高替代符和源词汇对齐概率的准确性,进而提高确定替代符所对应的源词汇的准确性,使得后续调整的翻译文本更加准确。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图5是根据一示例性实施例示出的一种用于翻译的电子设备800的结构框图。例如,电子设备500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,电子设备500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,输入/输出(I/O)的接口512,传感器组件514,以及通信组件516。
处理组件502通常控制电子设备500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件502可以包括一个或多个处理器520来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理部件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在设备500的操作。这些数据的示例包括用于在电子设备500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件506为电子设备500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为电子设备500生成、管理和分配电力相关联的组件。
多媒体组件508包括在所述电子设备500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当设备500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当电子设备500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
I/O接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为电子设备500提供各个方面的状态评估。例如,传感器组件514可以检测到设备500的打开/关闭状态,组件的相对定位,例如所述组件为电子设备500的显示器和小键盘,传感器组件514还可以检测电子设备500或电子设备500一个组件的位置改变,用户与电子设备500接触的存在或不存在,电子设备500方位或加速/减速和电子设备500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件516被配置为便于电子设备500和其他设备之间有线或无线方式的通信。电子设备500可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件516还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由电子设备500的处理器520执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种翻译方法,所述方法包括:依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于作为在翻译文本中作为源词汇的译文;依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值;依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
可选的,所述依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中各源词汇的概率,包括:依据源文本和翻译文本,确定对应的对齐矩阵,所述对齐矩阵包括:源文本中各源词汇、翻译文本中各翻译词汇、以及所述源词汇和翻译词汇的对齐概率;在所述对齐矩阵中,分别查询所述替代符对应源文本中各源词汇的对齐概率。
可选的,所述依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值,包括:确定所述源文本中各源词汇的调整权重;采用所述调整权重对相应源词汇和替代符的对齐概率进行加权,确定对应的调整概率值。
可选的,所述确定所述源文本中各源词汇的调整权重,包括:获取所述源文本中各源词汇的词频,依据所述词频确定对应源词汇的调整权重,其中,所述源词汇的词频越小,对应调整权重越大。
可选的,所述依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇,包括:将所述概率调整值最大的源词汇,作为所述替代符在所述源文本中对应的源词汇。
可选的,还包含用于进行以下操作的指令:依据所述源词汇调整所述翻译文本。
可选的,所述依据源词汇调整所述翻译文本,包括以下至少一种:将所述翻译文本中的替代符替换为所述源词汇;将所述翻译文本中的替代符替换为所述源词汇的变形词汇。
图6是本发明实施例中服务器的结构示意图。该服务器600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)622(例如,一个或一个以上处理器)和存储器632,一个或一个以上存储应用程序642或数据644的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器632和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器622可以设置为与存储介质630通信,在服务器600上执行存储介质630中的一系列指令操作。
服务器600还可以包括一个或一个以上电源626,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口658,一个或一个以上键盘656,和/或,一个或一个以上操作系统641,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本发明实施例还公开了一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于作为在翻译文本中作为源词汇的译文;依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值;依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
可选的,所述依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中各源词汇的概率,包括:依据源文本和翻译文本,确定对应的对齐矩阵,所述对齐矩阵包括:源文本中各源词汇、翻译文本中各翻译词汇、以及所述源词汇和翻译词汇的对齐概率;在所述对齐矩阵中,分别查询所述替代符对应源文本中各源词汇的对齐概率。
可选的,所述依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值,包括:确定所述源文本中各源词汇的调整权重;采用所述调整权重对相应源词汇和替代符的对齐概率进行加权,确定对应的调整概率值。
可选的,所述确定所述源文本中各源词汇的调整权重,包括:获取所述源文本中各源词汇的词频,依据所述词频确定对应源词汇的调整权重,其中,所述源词汇的词频越小,对应调整权重越大。
可选的,所述依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇,包括:将所述概率调整值最大的源词汇,作为所述替代符在所述源文本中对应的源词汇。
可选的,还包含用于进行以下操作的指令:依据所述源词汇调整所述翻译文本。
可选的,所述依据源词汇调整所述翻译文本,包括以下至少一种:将所述翻译文本中的替代符替换为所述源词汇;将所述翻译文本中的替代符替换为所述源词汇的变形词汇。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种翻译方法和装置、一种电子设备以及一种存储介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (22)

1.一种翻译方法,其特征在于,所述的方法包括:
依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于在翻译文本中作为源词汇的译文;
依据各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值;所述调整权重的确定因子包括:源词汇的词频、和/或、源词汇对应不同翻译词汇的对齐概率;
依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
2.根据权利要求1所述的方法,其特征在于,所述依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中各源词汇的概率,包括:
依据源文本和翻译文本,确定对应的对齐矩阵,所述对齐矩阵包括:源文本中各源词汇、翻译文本中各翻译词汇、以及所述源词汇和翻译词汇的对齐概率;
在所述对齐矩阵中,分别查询所述替代符对应源文本中各源词汇的对齐概率。
3.根据权利要求1所述的方法,其特征在于,所述依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值,包括:
确定所述源文本中各源词汇的调整权重;
采用所述调整权重对相应源词汇和替代符的对齐概率进行加权,确定对应的调整概率值。
4.根据权利要求3所述的方法,其特征在于,所述确定所述源文本中各源词汇的调整权重,包括:
获取所述源文本中各源词汇的词频,依据所述词频确定对应源词汇的调整权重,其中,所述源词汇的词频越小,对应调整权重越大。
5.根据权利要求1所述的方法,其特征在于,所述依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇,包括:
将所述概率调整值最大的源词汇,作为所述替代符在所述源文本中对应的源词汇。
6.根据权利要求1所述的方法,其特征在于,还包括:
依据所述源词汇调整所述翻译文本。
7.根据权利要求6所述的方法,其特征在于,所述依据源词汇调整所述翻译文本,包括以下至少一种:
将所述翻译文本中的替代符替换为所述源词汇;
将所述翻译文本中的替代符替换为所述源词汇的变形词汇。
8.一种翻译装置,其特征在于,包括:
概率确定模块,用于依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于在翻译文本中作为源词汇的译文;
概率调整模块,用于依据各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值;所述调整权重的确定因子包括:源词汇的词频、和/或、源词汇对应不同翻译词汇的对齐概率;
源词汇确定模块,用于依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
9.根据权利要求8所述的装置,其特征在于,所述概率确定模块,包括:
对齐矩阵确定子模块,用于依据源文本和翻译文本,确定对应的对齐矩阵,所述对齐矩阵包括:源文本中各源词汇、翻译文本中各翻译词汇、以及所述源词汇和翻译词汇的对齐概率;
对齐概率确定子模块,用于在所述对齐矩阵中,分别查询所述替代符对应源文本中各源词汇的对齐概率。
10.根据权利要求9所述的装置,其特征在于,所述概率调整模块,包括:
权重确定子模块,用于确定所述源文本中各源词汇的调整权重;
加权调整子模块,用于采用所述调整权重对相应源词汇和替代符的对齐概率进行加权,确定对应的调整概率值。
11.根据权利要求10所述的装置,其特征在于,
所述权重确定子模块,用于获取所述源文本中各源词汇的词频,依据所述词频确定对应源词汇的调整权重,其中,所述源词汇的词频越小,对应调整权重越大。
12.根据权利要求8所述的装置,其特征在于,
所述源词汇确定模块,用于将所述概率调整值最大的源词汇,作为所述替代符在所述源文本中对应的源词汇。
13.根据权利要求8所述的装置,其特征在于,还包括:
翻译文本调整模块,用于依据所述源词汇调整所述翻译文本。
14.根据权利要求13所述的装置,其特征在于,
所述翻译文本调整模块,用于将所述翻译文本中的替代符替换为所述源词汇;和/或,将所述翻译文本中的替代符替换为所述源词汇的变形词汇。
15.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-7任一所述的翻译方法。
16.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中源词汇的对齐概率,其中,所述替代符用于作为在翻译文本中作为源词汇的译文;
依据各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值;所述调整权重的确定因子包括:源词汇的词频、和/或、源词汇对应不同翻译词汇的对齐概率;
依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇。
17.根据权利要求16所述的电子设备,其特征在于,所述依据源文本和翻译文本的对齐矩阵,确定所述翻译文本中替代符对应源文本中各源词汇的概率,包括:
依据源文本和翻译文本,确定对应的对齐矩阵,所述对齐矩阵包括:源文本中各源词汇、翻译文本中各翻译词汇、以及所述源词汇和翻译词汇的对齐概率;
在所述对齐矩阵中,分别查询所述替代符对应源文本中各源词汇的对齐概率。
18.根据权利要求16所述的电子设备,其特征在于,所述依据所述各源词汇的调整权重,分别对所述替代符对应源词汇的对齐概率进行调整,确定对应的概率调整值,包括:
确定所述源文本中各源词汇的调整权重;
采用所述调整权重对相应源词汇和替代符的对齐概率进行加权,确定对应的调整概率值。
19.根据权利要求18所述的电子设备,其特征在于,所述确定所述源文本中各源词汇的调整权重,包括:
获取所述源文本中各源词汇的词频,依据所述词频确定对应源词汇的调整权重,其中,所述源词汇的词频越小,对应调整权重越大。
20.根据权利要求16所述的电子设备,其特征在于,所述依据所述概率调整值,确定所述替代符在所述源文本中对应的源词汇,包括:
将所述概率调整值最大的源词汇,作为所述替代符在所述源文本中对应的源词汇。
21.根据权利要求16所述的电子设备,其特征在于,还包含用于进行以下操作的指令:
依据所述源词汇调整所述翻译文本。
22.根据权利要求21所述的电子设备,其特征在于,所述依据源词汇调整所述翻译文本,包括以下至少一种:
将所述翻译文本中的替代符替换为所述源词汇;
将所述翻译文本中的替代符替换为所述源词汇的变形词汇。
CN201711460034.9A 2017-12-28 2017-12-28 一种翻译方法、装置、电子设备以及存储介质 Active CN108345590B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711460034.9A CN108345590B (zh) 2017-12-28 2017-12-28 一种翻译方法、装置、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711460034.9A CN108345590B (zh) 2017-12-28 2017-12-28 一种翻译方法、装置、电子设备以及存储介质

Publications (2)

Publication Number Publication Date
CN108345590A CN108345590A (zh) 2018-07-31
CN108345590B true CN108345590B (zh) 2022-05-31

Family

ID=62962507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711460034.9A Active CN108345590B (zh) 2017-12-28 2017-12-28 一种翻译方法、装置、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN108345590B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274826B (zh) * 2020-01-19 2021-02-05 南京新一代人工智能研究院有限公司 一种基于语义信息融合的低频词翻译方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4961755B2 (ja) * 2006-01-23 2012-06-27 富士ゼロックス株式会社 単語アライメント装置、単語アライメント方法、単語アライメントプログラム
US9020804B2 (en) * 2006-05-10 2015-04-28 Xerox Corporation Method for aligning sentences at the word level enforcing selective contiguity constraints
CN101482861B (zh) * 2008-01-09 2011-06-01 中国科学院自动化研究所 一种汉英词语自动对齐方法
CN101667174A (zh) * 2008-09-01 2010-03-10 株式会社东芝 用于提高多语语料库中词对齐质量的方法及装置
CN101676898B (zh) * 2008-09-17 2011-12-07 中国科学院自动化研究所 一种借助网络知识辅助的汉英机构名翻译方法及装置
KR101266361B1 (ko) * 2009-09-10 2013-05-22 한국전자통신연구원 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법
CN106776583A (zh) * 2015-11-24 2017-05-31 株式会社Ntt都科摩 机器翻译评价方法和设备及机器翻译方法和设备
CN105550174A (zh) * 2015-12-30 2016-05-04 哈尔滨工业大学 基于样本重要性的自动机器翻译领域自适应方法
CN107329960B (zh) * 2017-06-29 2019-01-01 哈尔滨工业大学 一种上下文敏感的神经网络机器翻译中未登录词翻译装置和方法
CN107491444B (zh) * 2017-08-18 2020-10-27 南京大学 基于双语词嵌入技术的并行化词对齐方法

Also Published As

Publication number Publication date
CN108345590A (zh) 2018-07-31

Similar Documents

Publication Publication Date Title
CN107291690B (zh) 标点添加方法和装置、用于标点添加的装置
CN107102746B (zh) 候选词生成方法、装置以及用于候选词生成的装置
CN107221330B (zh) 标点添加方法和装置、用于标点添加的装置
JP2017535007A (ja) 分類器トレーニング方法、種類認識方法及び装置
CN107291704B (zh) 处理方法和装置、用于处理的装置
US20210158126A1 (en) Method and device for compressing a neural network model for machine translation and storage medium
CN109961791B (zh) 一种语音信息处理方法、装置及电子设备
CN107564526B (zh) 处理方法、装置和机器可读介质
CN107274903B (zh) 文本处理方法和装置、用于文本处理的装置
CN108304412B (zh) 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
CN109144285B (zh) 一种输入方法和装置
CN109558599B (zh) 一种转换方法、装置和电子设备
CN110874145A (zh) 一种输入方法、装置及电子设备
CN111160047A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN111753917A (zh) 数据处理方法、装置及存储介质
CN111831806A (zh) 语义完整性确定方法、装置、电子设备和存储介质
CN108733657B (zh) 神经机器翻译中注意力参数的修正方法、装置及电子设备
CN108345590B (zh) 一种翻译方法、装置、电子设备以及存储介质
CN109887492B (zh) 一种数据处理方法、装置和电子设备
CN111104807A (zh) 一种数据处理方法、装置和电子设备
CN109979435B (zh) 数据处理方法和装置、用于数据处理的装置
CN111739535A (zh) 一种语音识别方法、装置和电子设备
CN114462410A (zh) 实体识别方法、装置、终端及存储介质
CN110837741B (zh) 一种机器翻译方法、装置及系统
CN111414766B (zh) 一种翻译方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant