CN103605644A - 一种基于相似度匹配的枢轴语言翻译方法和装置 - Google Patents
一种基于相似度匹配的枢轴语言翻译方法和装置 Download PDFInfo
- Publication number
- CN103605644A CN103605644A CN201310636884.5A CN201310636884A CN103605644A CN 103605644 A CN103605644 A CN 103605644A CN 201310636884 A CN201310636884 A CN 201310636884A CN 103605644 A CN103605644 A CN 103605644A
- Authority
- CN
- China
- Prior art keywords
- language
- pivot
- phrase
- translation rule
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 239000013598 vector Substances 0.000 claims abstract description 68
- 230000008878 coupling Effects 0.000 claims description 11
- 238000010168 coupling process Methods 0.000 claims description 11
- 238000005859 coupling reaction Methods 0.000 claims description 11
- 230000013011 mating Effects 0.000 claims description 7
- 239000002131 composite material Substances 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010276 construction Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
一种基于相似度匹配的枢轴语言翻译方法和装置,本发明属于机器翻译技术领域,涉及一种基于相似度匹配的枢轴语言翻译方法和装置。解决现有翻译方法和装置在源语言-目标语翻译规则库构建中要求源语言到枢轴语的翻译规则与该枢轴语到目标语的翻译规则,中的枢轴语短语必须完全相同而导致的潜在翻译规则丢失问题。通过用向量表示枢轴语短语并利用向量夹角余弦值对枢轴语进行匹配关联,建立源语言-目标语翻译规则库,通过源语言-目标语翻译规则库进行自然语言翻译。并根据上述步骤功能模块化制成基于相似度匹配的枢轴语言翻译装置。本发明用于自然语言翻译。
Description
技术领域
本发明属于机器翻译技术领域,涉及一种基于相似度匹配的枢轴语言翻译方法和装置。
背景技术
基于统计的机器翻译技术兴起于20世纪90年代,它可以从双语平行语料库中自动提取翻译规则,不需要人工干预,具有广泛的语言适用性,是当前使用最为广泛的机器翻译系统。基于统计的机器翻译系统的翻译质量很大程度上取决于双语平行语料库的质量。语料库的质量越高、数据数量越高,则使用该语料库所获得的统计机器翻译系统的翻译质量越高。但对于大多数语言对都面临着无法获得足够数量的高质量语料的问题。
针对语料稀疏的问题,目前普遍采用的解决方案是引入第三种语言,即枢轴语言。对于枢轴语言的引入,存在着下列两个方面的要求:
第一,源语言与枢轴语言之间存在着大量高质量双语平行语料,满足构建源语言到枢轴语言翻译系统的需要;
第二,枢轴语言与目标语言之间存在着大量高质量双语平行语料,满足构建枢轴语言到目标语言翻译系统的需要。
给定满足上述条件的枢轴语言,如果存在一个源语言到枢轴语的翻译规则(规则1)及一个该枢轴语到目标语的翻译规则(规则2),那么可以构建出一个源语言到目标语的翻译规则。该方法严格要求规则1与规则2中的枢轴语短语完全相同。这会导致一些潜在的源语言到目标语翻译规则丢失。
发明内容
本发明为解决现有翻译方法和装置在源语言-目标语翻译规则库构建中要求源语言到枢轴语的翻译规则与该枢轴语到目标语的翻译规则,即规则1和规则2中的枢轴语短语必须完全相同而导致的的潜在翻译规则丢失问题,而提出一种基于相似度匹配的枢轴语言翻译方法和装置。
本发明中一种基于相似度匹配的枢轴语言翻译方法,具体是按照以下步骤进行:
步骤一、建立源语言-目标语翻译规则库,具体包括以下步骤:
步骤一一、建立源语言-枢轴语翻译规则库,在源语言-枢轴语翻译规则库中,将枢轴语短语表示为向量形式;
步骤一二、建立枢轴语-目标语翻译规则库,在枢轴语-目标语翻译规则库中,将枢轴语短语表示为向量形式;
步骤一三、在源语言-枢轴语翻译规则库中查找与源语言短语语义匹配的至少一个第一枢轴语短语的向量表示;
步骤一四、在枢轴语-目标语翻译规则库中查找与第一枢轴语短语具有向量相似性的至少一个第二枢轴语短语的向量表示;所述的具有向量相似性的判断依据是指两个向量之间的夹角的余弦值大于0.8。
步骤一五、在枢轴语-目标语翻译规则库中查找与第二枢轴语短语的向量表示匹配的目标语短语;
步骤一六、将各所述源语言短语与目标语短语组成源语言-目标语翻译规则库;
步骤二、根据步骤一中建立的源语言-目标语翻译规则库对源语言进行翻译。
本发明中一种基于相似度匹配的枢轴语言翻译装置,所述装置包括:
一、枢轴语言短语向量表示模块410,用于在源语言-枢轴语翻译规则库中将枢轴语短语表示为向量形式以及在枢轴语-目标语翻译规则库中将枢轴语短语表示为向量形式;
二、枢轴语言短语查找模块420,用于在源语言-枢轴语言翻译规则库中查找与第一源语言短语语义匹配的至少一个第一枢轴语言短语的向量表示;
三、向量相似度计算模块430,用于计算枢轴语-目标语翻译规则库中的枢轴语短语与第一枢轴语短语的语义相似度;
四、目标语短语查找模块440,用于在枢轴语-目标语翻译规则库中查找与第一枢轴语短语具有语义相似度的目标语短语;
五、短语对组合模块450,用于将所述第一源语言短语与第一目标语短语组合,形成至少一个源语言短语与目标语短语之间的短语对;
六、短语对存储模块460,用于将形成的至少一个源语言短语与目标语言短语之间的短语对存储至源语言-目标语翻译规则库。
七、目标语短语输出模块470,用于根据源语言-目标语翻译规则库将与源语言对应的目标语输出,完成翻译处理。
本发明优点:
本发明通过对源语言-枢轴语翻译规则库以及枢轴语-目标语翻译规则库中的枢轴语短语进行向量表示,并计算各枢轴语短语之间的语义相似度来构建源语言-目标语翻译规则库,解决了枢轴语翻译方法中要求的源语言到枢轴语的翻译规则与该枢轴语到目标语的翻译规则,即规则1和规则2中的枢轴语短语必须完全相同而导致的潜在翻译规则丢失问题。
附图说明
图1基于相似度匹配的枢轴语言翻译方法流程图;
图2基于相似度匹配的枢轴语言翻译方法装置结构示意图。
具体实施方式
具体实施方式一:本具体实施方式中一种基于相似度匹配的枢轴语言翻译方法,具体是按照以下步骤进行:
步骤一、建立源语言-目标语翻译规则库,具体包括以下步骤:
步骤一一、建立源语言-枢轴语翻译规则库,在源语言-枢轴语翻译规则库中,将枢轴语短语表示为向量形式;
步骤一二、建立枢轴语-目标语翻译规则库,在枢轴语-目标语翻译规则库中,将枢轴语短语表示为向量形式;
步骤一三、在源语言-枢轴语翻译规则库中查找与源语言短语语义匹配的至少一个第一枢轴语短语的向量表示;
步骤一四、在枢轴语-目标语翻译规则库中查找与第一枢轴语短语具有向量相似性的至少一个第二枢轴语短语的向量表示;所述的具有向量相似性的判断依据是指两个向量之间的夹角的余弦值大于0.8。
步骤一五、在枢轴语-目标语翻译规则库中查找与第二枢轴语短语的向量表示匹配的目标语短语;
步骤一六、将各所述源语言短语与目标语短语组成源语言-目标语翻译规则库。
步骤二、根据步骤一中所建立的源语言-目标语翻译规则库对源语言进行翻译。
具体实施方式二:本具体实施方式中一种基于相似度匹配的枢轴语言翻译装置,所述装置包括:
一、枢轴语言短语向量表示模块410,用于在源语言-枢轴语翻译规则库中将枢轴语短语表示为向量形式以及在枢轴语-目标语翻译规则库中将枢轴语短语表示为向量形式;
二、枢轴语言短语查找模块420,其功能为:在源语言-枢轴语言翻译规则库中查找与第一源语言短语语义匹配的至少一个第一枢轴语言短语的向量表示;
三、向量相似度计算模块430,用于计算枢轴语-目标语翻译规则库中的枢轴语短语与第一枢轴语短语的语义相似度;
四、目标语短语查找模块440,用于在枢轴语-目标语翻译规则库中查找与第一枢轴语短语具有语义相似度的目标语短语;
五、短语对组合模块450,用于将所述第一源语言短语与第一目标语短语组合,形成至少一个源语言短语与目标语短语之间的短语对;
六、短语对存储模块460,用于将形成的至少一个源语言短语与目标语言短语之间的短语对存储至源语言-目标语翻译规则库;
七、目标语短语输出模块470,用于根据源语言-目标语翻译规则库将与源语言对应的目标语输出,完成翻译处理。
实施例
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例1
人类语言也称自然语言,是以文字的形式存在。为了计算语言自己的相似度,需要将人类语言表示为向量的形式。对于将人类语言使用向量进行表示,有多种方法可以实现此过程,本实例使用了基于深度学习的词向量表示形式,并将其扩展到短语表示中。本实施例中以英语作为枢轴语言的一条中文“开始”到西班牙文“iniciar”翻译规则的建立过程为例具体说明本发明技术方案,具体包括以下步骤(如图1所示):
步骤一,建立源语言-枢轴语言翻译规则库,在源语言-枢轴语翻译规则库中,将枢轴语短语表示为向量形式。
步骤二,在枢轴语-目标语翻译规则库中,将枢轴语短语表示为向量形式。
表1
中文 | 英文 |
开始 | start |
在表1中文-英文翻译规则表中,枢轴语言英文“start”可被表示为如下的向量形式“0.433052-0.104664-0.1361490.063134-0.306746-0.1942390.2290370.1616950.505429-0.033528”。
步骤三,在源语言-枢轴语翻译规则库中查找与源语言短语语义匹配的至少一个第一枢轴语短语的向量表示。即找到“开始”对应的枢轴语的向量表示“0.433052-0.104664-0.1361490.063134-0.306746-0.1942390.2290370.1616950.505429-0.033528”。
步骤四,在枢轴语-目标语翻译规则库中查找与第一枢轴语短语具有向量相似性的至少一个第二枢轴语短语的向量表示。查找得到第一枢轴语言短语的向量表示后,利用得到的所述第一枢轴语言短语在枢轴语-目标语言翻译规则库中查找与所述第一枢轴语言短语具有相同语义的第二枢轴语短语。所述第二枢轴语短语的数量为至少一个。可以对每个第一枢轴语言短语分别进行匹配,也可以是从中筛选部分第一枢轴语言短语进行匹配。例如,可根据统计的短语使用频率,选择使用频率高的短语进行匹配。步骤S140需要计算枢轴语-目标语翻译规则库中所有枢轴语短语的向量表示与第一枢轴语短语的向量表示之间的相似度。在本实例中,使用了两个向量之间的夹角的余弦值作为向量相似度度量。
两个向量之间的夹角的余弦值的计算公式如下所示:
其中A和B分别代表第一枢轴语短语的向量表示和第二枢轴语短语的向量表示,n为向量维度;向量A=(A1,A2,……,An),向量B=(B1,B2,……,Bn);
在上述建立中文-西班牙文翻译规则库的例子中,英文“start”与“begin”的向量相似度依余弦公式算得为“0.956”,两向量夹角的余弦值大于0.8,因此具有语义相似度。
步骤五,在枢轴语-目标语翻译规则库中查找与各所述第二枢轴语短语的向量表示匹配的至少一个目标语短语。
表2
英文西班牙文begininiciar |
在表2英文-西班牙文翻译规则表中,枢轴语言英文“begin”可被表示为如下的向量形式“0.426532-0.026144-0.2050520.189409-0.301474-0.2202700.1690510.0262810.405093-0.041793”。
在上述建立中文-西班牙文翻译规则库的例子中,短语“begin”即为第二枢轴语,西班牙文“iniciar”具有语义相似度的目标语短语,其相似度判断方法与步骤S140中所述方法相同。
步骤六,将形成的至少一个源语言短语与目标语言短语之间的短语对存储至源语言-目标语言翻译规则库;所述的源语言-目标语言翻译规则库是用于存储由源语言短语及与其语义匹配的目标语言短语的短语对的数据库。得到源语言短语与目标语言短语之间的短语对后,将源语言短语与目标语言短语之间的短语对存储至源语言-目标语言翻译规则库,作为进行源语言与目标语言之间进行基于统计的机器翻译系统使用的翻译规则库。
在上述建立中文-西班牙文翻译规则库的例子中,最终得到的表3中文-西班牙文翻译规则表,如下所示:
表3
中文 | 西班牙文 |
开始 | iniciar |
最后,根据最终得到的中文-西班牙文翻译规则表如表3所示,将中文“开始”翻译成西班牙文“iniciar”。
实施例2
本实施例中各模块或各步骤可以用通用的计算装置来实现,也可以将它们分布在多个计算装置所组成的网络上;可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行;可以将它们分别制作成各个集成电路模块;可以将它们中的多个模块或步骤制作成单个集成电路模块来实现。
本实施例中一种基于相似度匹配的枢轴语言翻译装置包括以下部分:
一、枢轴语言短语向量表示模块410,用于在源语言-枢轴语翻译规则库中,将枢轴语短语表示为向量形式以及在枢轴语-目标语翻译规则库中,将枢轴语短语表示为向量形式。
二、枢轴语言短语查找模块420,用于在源语言-枢轴语翻译规则库中查找与第一源语言短语语义匹配的至少一个第一枢轴语短语的向量表示。
三、向量相似度计算模块430,用于计算枢轴语-目标语翻译规则库中所有枢轴语短语与第一枢轴语短语之间的相似度。
四、目标语言短语查找模块440,用于在枢轴语-目标语翻译规则库中查找与第一枢轴语短语具有语义相似性的至少一个第一目标语短语。
五、短语对组合模块450,用于将所述第一源语言短语与第一目标语短语组合,形成至少一个源语言短语与目标语短语之间的短语对。
六、短语对存储模块460,用于将形成的至少一个源语言短语与目标语言短语之间的短语对存储至源语言-目标语言翻译规则库。
七、目标语短语输出模块470,用于根据源语言-目标语翻译规则库将与源语言对应的目标语输出,完成翻译处理。
本发明实施例提供的基于相似度匹配的枢轴语翻译方法和装置,通过对源语言-枢轴语翻译规则库以及枢轴语-目标语翻译规则库中的枢轴语短语进行向量表示,并计算各枢轴语短语之间的语义相似度来构建源语言-目标语翻译规则库,解决了枢轴语翻译方法中的潜在翻译规则丢失问题。
以上实施例,并非本发明本身,凡是利用本发明中所述方法所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均在本发明保护范围之内。本发明不限制于任何特定的硬件和软件的结合。
Claims (3)
1.一种基于相似度匹配的枢轴语言翻译方法,其特征在于具体是按照以下步骤进行:
步骤一、建立源语言-目标语翻译规则库,具体包括以下步骤:
步骤一一、建立源语言-枢轴语翻译规则库,在源语言-枢轴语翻译规则库中,将其中的枢轴语短语表示为向量形式;
步骤一二、建立枢轴语-目标语翻译规则库,在枢轴语-目标语翻译规则库中,将其中的枢轴语短语表示为向量形式;
步骤一三、在源语言-枢轴语翻译规则库中查找与源语言短语语义匹配的至少一个第一枢轴语短语的向量表示;
步骤一四、在枢轴语-目标语翻译规则库中查找与第一枢轴语短语具有向量相似性的至少一个第二枢轴语短语的向量表示,并关联第一枢轴语短语与第二枢轴语短语;所述的具有向量相似性的判断依据是指两个向量之间的夹角的余弦值大于0.8;所述的向量夹角余弦的计算公式为:
其中,A和B分别代表第一枢轴语短语的向量表示和第二枢轴语短语的向量表示,n为向量维度;
步骤一五、在枢轴语-目标语翻译规则库中查找与第二枢轴语短语的向量表示匹配的目标语短语;
步骤一六、将各所述源语言短语与目标语短语组成源语言-目标语翻译规则库;
步骤二、根据步骤一所建立的源语言-目标语翻译规则库对源语言进行翻译。
2.根据权利要求1中所述一种基于相似度匹配的枢轴语言翻译方法,其特征在于步骤一中所使用的向量表示形式为基于深度学习的词向量表示形式。
3.一种基于相似度匹配的枢轴语言翻译装置,其特征在于包括以下功能模块:
枢轴语言短语向量表示模块(410),用于在源语言-枢轴语翻译规则库中将枢轴语短语表示为向量形式以及在枢轴语-目标语翻译规则库中将枢轴语短语表示为向量形式;
枢轴语言短语查找模块(420),用于在源语言-枢轴语言翻译规则库中查找与第一源语言短语语义匹配的至少一个第一枢轴语言短语的向量表示;
向量相似度计算模块(430),用于计算枢轴语-目标语翻译规则库中的枢轴语短语与第一枢轴语短语的语义相似度;
目标语短语查找模块(440),用于在枢轴语-目标语翻译规则库中查找与第一枢轴语短语具有语义相似度的目标语短语;
短语对组合模块(450),用于将所述源语言短语与目标语短语组合,形成至少一个源语言短语与目标语短语之间的短语对;
短语对存储模块(460),用于将形成的至少一个源语言短语与目标语言短语之间的短语对存储至源语言-目标语翻译规则库;
目标语短语输出模块(470),用于根据源语言-目标语翻译规则库将与源语言对应的目标语输出,完成翻译处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310636884.5A CN103605644B (zh) | 2013-12-02 | 2013-12-02 | 一种基于相似度匹配的枢轴语言翻译方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310636884.5A CN103605644B (zh) | 2013-12-02 | 2013-12-02 | 一种基于相似度匹配的枢轴语言翻译方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103605644A true CN103605644A (zh) | 2014-02-26 |
CN103605644B CN103605644B (zh) | 2017-02-01 |
Family
ID=50123873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310636884.5A Active CN103605644B (zh) | 2013-12-02 | 2013-12-02 | 一种基于相似度匹配的枢轴语言翻译方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103605644B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016082406A1 (zh) * | 2014-11-28 | 2016-06-02 | 华为技术有限公司 | 确定语义匹配度的方法和装置 |
CN106570094A (zh) * | 2016-10-31 | 2017-04-19 | 广东电网有限责任公司惠州供电局 | 定值项匹配方法及匹配系统 |
CN108804427A (zh) * | 2018-06-12 | 2018-11-13 | 深圳市译家智能科技有限公司 | 语音机器翻译方法及装置 |
CN108874786A (zh) * | 2018-06-12 | 2018-11-23 | 深圳市译家智能科技有限公司 | 机器翻译方法及装置 |
CN110489753A (zh) * | 2019-08-15 | 2019-11-22 | 昆明理工大学 | 改进特征选择的神经结构对应学习跨领域情感分类方法 |
CN110765784A (zh) * | 2019-09-12 | 2020-02-07 | 内蒙古工业大学 | 一种基于对偶学习的蒙汉机器翻译方法 |
CN111796830A (zh) * | 2020-06-08 | 2020-10-20 | 成都数之联科技有限公司 | 一种协议解析处理方法、装置、设备及介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920472B (zh) * | 2018-07-04 | 2020-01-10 | 哈尔滨工业大学 | 一种基于深度学习的机器翻译系统的融合系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020165708A1 (en) * | 2001-05-03 | 2002-11-07 | International Business Machines Corporation | Method and system for translating human language text |
US20060217963A1 (en) * | 2005-03-23 | 2006-09-28 | Fuji Xerox Co., Ltd. | Translation memory system |
CN102591857A (zh) * | 2011-01-10 | 2012-07-18 | 富士通株式会社 | 一种平行语料资源获取方法及系统 |
CN102622342A (zh) * | 2011-01-28 | 2012-08-01 | 上海肇通信息技术有限公司 | 中间语系统、中间语引擎、中间语翻译系统和相应方法 |
CN103092831A (zh) * | 2013-01-25 | 2013-05-08 | 哈尔滨工业大学 | 一种用于统计机器翻译的参数调整方法 |
-
2013
- 2013-12-02 CN CN201310636884.5A patent/CN103605644B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020165708A1 (en) * | 2001-05-03 | 2002-11-07 | International Business Machines Corporation | Method and system for translating human language text |
US20060217963A1 (en) * | 2005-03-23 | 2006-09-28 | Fuji Xerox Co., Ltd. | Translation memory system |
CN102591857A (zh) * | 2011-01-10 | 2012-07-18 | 富士通株式会社 | 一种平行语料资源获取方法及系统 |
CN102622342A (zh) * | 2011-01-28 | 2012-08-01 | 上海肇通信息技术有限公司 | 中间语系统、中间语引擎、中间语翻译系统和相应方法 |
CN103092831A (zh) * | 2013-01-25 | 2013-05-08 | 哈尔滨工业大学 | 一种用于统计机器翻译的参数调整方法 |
Non-Patent Citations (1)
Title |
---|
熊文新: "中间语言机器翻译的有关问题", 《语言文字应用》, no. 3, 31 August 1998 (1998-08-31) * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10467342B2 (en) | 2014-11-28 | 2019-11-05 | Huawei Technologies Co., Ltd. | Method and apparatus for determining semantic matching degree |
US11138385B2 (en) | 2014-11-28 | 2021-10-05 | Huawei Technologies Co., Ltd. | Method and apparatus for determining semantic matching degree |
WO2016082406A1 (zh) * | 2014-11-28 | 2016-06-02 | 华为技术有限公司 | 确定语义匹配度的方法和装置 |
CN106570094A (zh) * | 2016-10-31 | 2017-04-19 | 广东电网有限责任公司惠州供电局 | 定值项匹配方法及匹配系统 |
CN106570094B (zh) * | 2016-10-31 | 2019-06-28 | 广东电网有限责任公司惠州供电局 | 定值项匹配方法及匹配系统 |
CN108874786A (zh) * | 2018-06-12 | 2018-11-23 | 深圳市译家智能科技有限公司 | 机器翻译方法及装置 |
CN108804427A (zh) * | 2018-06-12 | 2018-11-13 | 深圳市译家智能科技有限公司 | 语音机器翻译方法及装置 |
CN108874786B (zh) * | 2018-06-12 | 2022-05-31 | 深圳市译家智能科技有限公司 | 机器翻译方法及装置 |
CN110489753A (zh) * | 2019-08-15 | 2019-11-22 | 昆明理工大学 | 改进特征选择的神经结构对应学习跨领域情感分类方法 |
CN110489753B (zh) * | 2019-08-15 | 2022-06-14 | 昆明理工大学 | 改进特征选择的神经结构对应学习跨领域情感分类方法 |
CN110765784A (zh) * | 2019-09-12 | 2020-02-07 | 内蒙古工业大学 | 一种基于对偶学习的蒙汉机器翻译方法 |
CN111796830A (zh) * | 2020-06-08 | 2020-10-20 | 成都数之联科技有限公司 | 一种协议解析处理方法、装置、设备及介质 |
CN111796830B (zh) * | 2020-06-08 | 2023-09-19 | 成都数之联科技股份有限公司 | 一种协议解析处理方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103605644B (zh) | 2017-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103605644A (zh) | 一种基于相似度匹配的枢轴语言翻译方法和装置 | |
Jiang et al. | FreebaseQA: A new factoid QA data set matching trivia-style question-answer pairs with Freebase | |
Colombo et al. | Automatic text evaluation through the lens of Wasserstein barycenters | |
CN103530284B (zh) | 短句切分装置、机器翻译系统及对应切分方法和翻译方法 | |
US20140100843A1 (en) | Machine translation apparatus, method and program | |
US10824816B2 (en) | Semantic parsing method and apparatus | |
CN106598940A (zh) | 基于全局优化关键词质量的文本相似度求解算法 | |
Kunchukuttan et al. | Sata-anuvadak: Tackling multiway translation of indian languages | |
CN103577399A (zh) | 双语语料库的数据扩充方法和装置 | |
CN103473280A (zh) | 一种网络可比语料的挖掘方法及装置 | |
CN102681983A (zh) | 一种文本数据的对齐方法和装置 | |
CN101290616A (zh) | 一种统计机器翻译方法和系统 | |
CN105068997A (zh) | 平行语料的构建方法及装置 | |
CN104268133A (zh) | 机器翻译方法及系统 | |
US20150161109A1 (en) | Reordering words for machine translation | |
CN111090734A (zh) | 基于层级注意力机制优化机器阅读理解能力的方法和系统 | |
Raju et al. | Statistical machine translation system for indian languages | |
CN117271736A (zh) | 一种问答对的生成方法和系统、电子设备及存储介质 | |
Lai et al. | Pcbert: parent and child bert for Chinese few-shot ner | |
Sun | [Retracted] Analysis of Chinese Machine Translation Training Based on Deep Learning Technology | |
CN114490984A (zh) | 基于关键词指导的问答知识抽取方法、装置、设备及介质 | |
Sen et al. | Iitp English-Hindi machine translation system at wat 2016 | |
Wołk et al. | Real-time statistical speech translation | |
JP2017010274A (ja) | 対応付け装置及びプログラム | |
CN105260483A (zh) | 一种面向微博文本的跨语言话题检测装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190612 Address after: 150000 Heilongjiang Harbin Dalian economic and Trade Zone, the North Road and Xingkai Road intersection Patentee after: HIT ROBOT GROUP Co.,Ltd. Address before: 150001 No. 92 West straight street, Nangang District, Heilongjiang, Harbin Patentee before: Harbin Institute of Technology |
|
PP01 | Preservation of patent right | ||
PP01 | Preservation of patent right |
Effective date of registration: 20240626 Granted publication date: 20170201 |