CN104572632A - 一种确定具有专名译文的词汇的翻译方向的方法 - Google Patents

一种确定具有专名译文的词汇的翻译方向的方法 Download PDF

Info

Publication number
CN104572632A
CN104572632A CN201410819734.2A CN201410819734A CN104572632A CN 104572632 A CN104572632 A CN 104572632A CN 201410819734 A CN201410819734 A CN 201410819734A CN 104572632 A CN104572632 A CN 104572632A
Authority
CN
China
Prior art keywords
translation
vocabulary
translated
proper name
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410819734.2A
Other languages
English (en)
Other versions
CN104572632B (zh
Inventor
江潮
张芃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iol Wuhan Information Technology Co ltd
Original Assignee
Language Network (wuhan) Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Language Network (wuhan) Information Technology Co Ltd filed Critical Language Network (wuhan) Information Technology Co Ltd
Priority to CN201410819734.2A priority Critical patent/CN104572632B/zh
Publication of CN104572632A publication Critical patent/CN104572632A/zh
Application granted granted Critical
Publication of CN104572632B publication Critical patent/CN104572632B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

一种确定具有专名译文的词汇的翻译方向的方法,包括:当检测出待翻译词汇是否具有专名译文时,获取所述待翻译词汇的关联文本,并从所述关联文本中找出与该待翻译词汇的专名译文相关联的特征词;以找出的所述特征词,在用于判定该待翻译词汇是否按照其专名译文进行翻译的决策树中,依照所述决策树的生成顺序依次判定;根据判定结果,确定所述待翻译词汇当前是否应采用其专名译文进行翻译。本发明保证了不同语境下专名翻译的准确性,并且无需再通过人工对翻译稿件预处理,降低了劳动成本,并且大大提升了翻译效率,提高了翻译结果的准确性。

Description

一种确定具有专名译文的词汇的翻译方向的方法
技术领域
本发明属于翻译技术领域,尤其是一种确定具有专名译文的词汇的翻译方向的方法。
背景技术
专名的翻译是翻译中一个重要的方面,由于其特殊性,虽然许多专名虽然按音译翻译不是完全准确,但长期以来约定俗成是固定翻译的,所以应该以固定的翻译结果出现,否则对于译文的理解就会产生很大的偏差,比如按韦氏拼音拼写的“蒋介石”的英文名“Chiang Kai-shek”被误译成“常凯申”就是一种非常严重的误翻译。专名的翻译包括人名、地名、机构名、媒体名、文艺作品名、品牌名等各类专有名词的翻译,在文字系统相同和相似的语言间,由于书同文的便利,源语言名称往往能够以原文的书写形式被目的语直接借用,而在文字系统各不相同的语言间,由于文字兼容性不足,导致在专名翻译中音译、语义翻译、重新命名等多样化转换方式的存在,从而使得专名翻译的规范化存在困难。
由于大量的专名与普通名词在形式上是一致的,只是普通名词在特定场合、特定环境下的一种使用,对于这些专名的翻译是采用普通翻译还是专名翻译,需要根据上下文的情况来具体而为。比如:“Holmes”这个词作为一般人名翻译成“赫尔莫斯”或“霍莫斯”都可以,但作为专有名词则只能翻译成“福尔摩斯”,同样“Watson’s”是翻译成“沃森的”还是翻译成“屈臣氏”、“McDonald”是翻译成“麦克唐纳”还是翻译成“麦当劳”等等都需要根据该词所在文档的具体上下文情况而定。
目前一个翻译任务往往是多人或多个小组共同完成,对其中专名的翻译进行统一、准确的规范化翻译是提高翻译质量、保持翻译一致性的重要手段。以往对于这种需要进行统一翻译的关键词汇,首先是由翻译助理对文档进行标注或者通过计算机自动标注,然后由翻译专家对这些标注出专名给出标准的翻译结果,这样做虽然可以保证翻译的准确性,但增加了翻译流程中的人工处理环节,延缓了翻译处理流程,同时也增加了成本。
发明内容
本发明的目的之一是提供一种确定具有专名译文的词汇的翻译方向的方法,以解决现有技术中对于专名词汇的翻译效率低的问题。
在一些说明性实施例中,所述确定具有专名译文的词汇的翻译方向的方法,其特征在于,包括:当检测出待翻译词汇是否具有专名译文时,获取所述待翻译词汇的关联文本,并从所述关联文本中找出与该待翻译词汇的专名译文相关联的特征词;以找出的所述特征词,在用于判定该待翻译词汇是否按照其专名译文进行翻译的决策树中,依照所述决策树的生成顺序依次判定;根据判定结果,确定所述待翻译词汇当前是否应采用其专名译文进行翻译。
与现有技术相比,本发明的说明性实施例包括以下优点:
本发明保证了不同语境下专名翻译的准确性,并且无需再通过人工对翻译稿件预处理,降低了劳动成本,并且大大提升了翻译效率,翻译结果可靠性强。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是按照本发明的说明性实施例的流程图;
图2是按照本发明的说明性实施例的流程图;
图3是按照本发明的说明性实施例的决策树示例图。
具体实施方式
在以下详细描述中,提出大量特定细节,以便于提供对本发明的透彻理解。但是,本领域的技术人员会理解,即使没有这些特定细节也可实施本发明。在其它情况下,没有详细描述众所周知的方法、过程、组件和电路,以免影响对本发明的理解。
如图1所示,公开一种确定具有专名译文的词汇的翻译方向的方法,包括:
S11、当检测出待翻译词汇是否具有专名译文时,获取所述待翻译词汇的关联文本,并从所述关联文本中找出与该待翻译词汇的专名译文相关联的特征词;
其中,对词汇的是否具有专名译文的判定可以通过,与专名进行匹配确定,若匹配到即判定成功,否则判定失败。
S12、以找出的所述特征词,在用于判定该待翻译词汇是否按照其专名译文进行翻译的决策树中,依照所述决策树的生成顺序依次判定;
S13、根据判定结果,确定所述待翻译词汇当前是否应采用其专名译文进行翻译。
本发明保证了不同语境下专名翻译的准确性,并且无需再通过人工对翻译稿件预处理,降低了劳动成本,并且大大提升了翻译效率,翻译结果可靠性强。
在一些说明性实施例中,在所述以找出的所述特征词,在用于判定该待翻译词汇是否按照其专名译文进行翻译的决策树中,依照所述决策树的生成顺序依次判定之前,还包括:从历史翻译数据库中随机抽取一定数量的包含有所述待翻译词汇的特定段落;对选取的所述特定段落进行至少一次数据筛选,确定出用于判定的所述特征词。
其中,所述特定段落为待翻译词汇在语料库中的所在句、所在的自然段或该词汇在语料库中前后一定范围的词汇集合。
在一些说明性实施例中,所述对选取的所述特定段落进行至少一次数据筛选,确定出用于判定的所述特征词,具体包括:
S21、对选取的每个特定段落进行分词处理,去除其中的停用词,将剩余的词汇作为候选关联词;
其中,具体包括:保留为名称、动词、形容词、副词、习语或缩略语的词汇。
S22、保留出现概率高于第一阈值的候选关联词作为关联词,并计算出每个所述关联词与所述待翻译词汇在按照专名译文翻译和未按照专名译文翻译两种状态的互信息;
S23、得到的所述互信息高于第二阈值的关联词作为该词义的所述特征词。
在一些说明性实施例中,所述计算出每个所述关联词与所述待翻译词汇在按照专名译文翻译和未按照专名译文翻译两种状态的互信息,具体包括:将所述特定段落中的所述待翻译词汇按照所述专名译文翻译和未按照所述专名译文翻译划分,分别计算出所述按照所述专名译文翻译和所述未按照所述专名译文翻译两种状态的先验概率;
按照如下公式计算第j个所述关联词与所述两种状态的互信息I(Ri,wj):
I ( R i , w j ) = log P ( w j | R i ) P ( w j ) ;
其中,P(Ri)为所述按照所述专名译文翻译状态R1或所述未按照所述专名译文翻译状态R2的先验概率,i=1或2;P(wj)为第j个关联词wj在所述选取的所述特定段落中的出现概率,j为关联词的序号。
在一些说明性实施例中,在所述以找出的所述特征词,在用于判定该待翻译词汇是否按照其专名译文进行翻译的决策树中,依照所述决策树的生成顺序依次判定之前,还包括:根据确定的所述特征词,利用ID3算法或C4.5算法构建所述决策树。
其中,具体包括:将与所述两种状态具有对应关系的特征词作为所述决策树的判定结点上的特征项;根据所述特征项的信息增益或信息增益比从大到小的顺序生成所述决策树;其中,每个所述特征项对应有判定其取值结果的第三阈值。
其中,构建的决策树例如图3所示。
以下对上述过程,进行详细描述:
首先,对一些术语进行说明:
信息熵
设X是一个取有限个值的离散随机变量,其概率分布为P(X=xi)=pi,i=1,2,…,n,则随机变量X的信息熵定义为:
H ( X ) = - Σ i = 1 n p i log p i
熵越大表明随机变量不确定性越大,从定义可知0≤H(X)≤logn,且令0log0=0。
条件熵
设随机变量(X,Y),其联合概率分布为P(X=xi,Y=yi)=pij,i=1,2,…,n;j=1,2,…,m,在随机变量X给定的条件下随机变量Y的条件熵H(Y|X)定义为:
H ( Y | X ) = Σ i = 1 n p i H ( Y | X = x i )
其中,pi=P(X=xi),令0log0=0,条件熵表示在已知随机变量X的条件下随机变量Y的不确定性。
信息增益
特征A对训练数据集D的信息增益g(D,A),定义为集合D的信息熵H(D)和条件熵H(D|A)之差,即
g(D,A)=H(D)-H(D|A)
一般的,信息熵H(Y)与条件熵H(Y|X)称为互信息,决策树学习中的信息增益等价于训练数据集中类与特征的互信息。
信息增益比
特征A对训练数据集D的信息增益比gr(D,A),定义为其信息增益g(D,A)与训练数据集D的信息熵H(D)之比,即
g r ( D , A ) = g ( D , A ) H ( D )
一、特征选择和数据处理
专名的翻译与其语义环境相关联,通过确定专名的特征词汇,然后再通过这些特征词汇来确定在该语境环境下该词汇是否已专名来进行翻译。以下以一个候选专名词汇w为例具体阐述其特征词汇的获取方法:
将翻译参考文档库中已翻译的包含候选专名词汇w的文本训练段落(训练段落可以是包含专名候选词汇的自然句、自然段落或专名候选词汇前后一定范围的词汇集合)作为训练文本集;
该训练文本段落集合为R,统计R中的段落数|R|;
根据该候选专名词汇是否按专名进行翻译,将R划分为2个子集R1,R2,计算该候选专名是否按专名进行翻译的先验概率P(Ri)=|Ri|/|R|(i∈{1,2});
对段落集R进行分词,去除其中的停用词,保留名称、动词、形容词、副词、习语、缩略语等,获得候选关联词集合,计算该集合里的每个词的出现概率,计算方法为:若该词汇在R中的某段落出现,则其出现次数加1,出现概率为其在R中出现的总次数除以R中的语句数|R|;
取其中出现概率大于阀值的候选关联词汇,从而得到候选专名w的关联词汇集W={w1,w2,…,wn},其出现概率记为P(wj)(j∈{1,2,…,n});
计算关联词汇wj(j∈{1,2,…,n})在专名候选词w按专名和不按专名翻译两种状态下的出现概率P(wj|Ri)(i∈{1,2},j∈{1,2,…,n}),计算方法为统计关联词汇wj(j∈{1,2,…,n})在集合Ri(i∈{1,2})中的出现次数tij(i∈{1,2,…,k},j∈{1,2,…,n},则P(wj|Ri)=tij/|Ri|;
计算专名候选词汇w按专名和不按专名翻译两种状态下和关联词汇wj(j∈{1,2,…,n})的互信息I(Ri,wj),计算方法如下:
I ( R i , w j ) = log P ( w j | R i ) P ( w j )
对于专名候选词汇w,将I(Ri,wj)大于阀值Ipro的关联词汇wj作为按专名和不按专名翻译两种状态下的特征词汇;
将每个特征词汇作为决策树的一个特征项,所有的特征项构成了决策树的特征项集A,特征项的取值为是或否,代表该特征项值I(Ri,wj)是否大于其对应的特征项阀值Ik(k∈{1,2,…,|A|}),且Ik≥Ipro
二、构建决策树
生成决策树
输入:
训练集:包含词汇w的语句集R
分类:共有2个分类Ci(i∈{1,2}),分别对应专名候选词汇w是否按专名进行翻译
特征集:将所有I(Ri,wj)大于阀值的关联词汇wj作为其特征项集A
阀值:TH
输出:专名词义判定决策树T
算法流程:
若语句集R中的候选专名词汇w的词义都属于同一类Ci,将决策树T置为单结点树,以Ci作为该结点的类别,生成决策树T;
如果将决策树T置为单结点树,并将R中|Ri|最大的词义类作为类Ci,将该结点的类别记为Ci,生成决策树T;
否则按1所述的信息增益比计算方法计算特征集A中各个特征对R的信息增益比,选择信息增益比最大的特征Aj
如果Aj的信息增益比小于阀值TH,将T置为单结点树,并将R中|Ri|最大的词义类作为类Ci,将该结点的类别记为Ci,生成决策树T;
否则,根据特征Aj取值为是或否,将R划分为2个非空子集Ryes和Rno,分别将两个子集中词义数最大的类作为标记,构建子结点,由结点及其子结点构成决策树T,生成决策树T;
对这两个结点,分别以Ryes和Rno为训练集,以A-{Aj}为特征集,递归调用步骤1)~5),得到子树Ti,生成Ti
三、通过决策树对输入段落中的候选专名词进行判定
对输入段落进行分词,获取其中属于特征词汇的词,得到该语句中包含的特征词汇子集Ainput
集合Ainput的元素按其在决策树中自顶向下的次序进行排序,并按此顺序在决策树T中进行判断,若判断能直到决策树的叶子结点,则得到判定结果,得到该专名候选词汇是否按专名进行判断的结果;
若通过该集合Ainput中的特征词汇无法得到确定的判断结果,则输入段落中的专名候选词汇转人工处理。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种确定具有专名译文的词汇的翻译方向的方法,其特征在于,包括:
当检测出待翻译词汇是否具有专名译文时,获取所述待翻译词汇的关联文本,并从所述关联文本中找出与该待翻译词汇的专名译文相关联的特征词;
以找出的所述特征词,在用于判定该待翻译词汇是否按照其专名译文进行翻译的决策树中,依照所述决策树的生成顺序依次判定;;
根据判定结果,确定所述待翻译词汇当前是否应采用其专名译文进行翻译。
2.根据权利要求1所述的方法,其特征在于,在所述以找出的所述特征词,在用于判定该待翻译词汇是否按照其专名译文进行翻译的决策树中,依照所述决策树的生成顺序依次判定之前,还包括:
从历史翻译数据库中随机抽取一定数量的包含有所述待翻译词汇的特定段落;
对选取的所述特定段落进行至少一次数据筛选,确定出用于判定的所述特征词。
3.根据权利要求2所述的方法,其特征在于,所述对选取的所述特定段落进行至少一次数据筛选,确定出用于判定的所述特征词,具体包括:
对选取的每个特定段落进行分词处理,去除其中的停用词,将剩余的词汇作为候选关联词;
保留出现概率高于第一阈值的候选关联词作为关联词,,并计算出每个所述关联词与所述待翻译词汇在按照专名译文翻译和未按照专名译文翻译两种状态的互信息;
得到的所述互信息高于第二阈值的关联词作为该词义的所述特征词。
4.根据权利要求3所述的方法,其特征在于,所述计算出每个所述关联词与所述待翻译词汇在按照专名译文翻译和未按照专名译文翻译两种状态的互信息,具体包括:
将所述特定段落中的所述待翻译词汇按照所述专名译文翻译和未按照所述专名译文翻译划分,分别计算出所述按照所述专名译文翻译和所述未按照所述专名译文翻译两种状态的先验概率;
按照如下公式计算第j个所述关联词与所述两种状态的互信息I(Ri,wj):
I ( R i , w j ) = log P ( w j | R i ) P ( w j ) ;
其中,P(Ri)为所述按照所述专名译文翻译状态R1或所述未按照所述专名译文翻译状态R2的先验概率,i=1或2;P(wj)为第j个关联词wj在所述选取的所述特定段落中的出现概率,j为关联词的序号。
5.根据权利要求3所述的方法,其特征在于,在所述以找出的所述特征词,在用于判定该待翻译词汇是否按照其专名译文进行翻译的决策树中,依照所述决策树的生成顺序依次判定之前,还包括:
根据确定的所述特征词,利用ID3算法或C4.5算法构建所述决策树。
6.根据权利要求5所述的方法,其特征在于,所述根据确定的所述特征词,利用ID3算法或C4.5算法构建所述决策树,具体包括:
将与所述两种状态具有对应关系的特征词作为所述决策树的判定结点上的特征项;
根据所述特征项的信息增益或信息增益比从大到小的顺序生成所述决策树;
其中,每个所述特征项对应有判定其取值结果的第三阈值。
7.根据权利要求6所述的方法,其特征在于,所述根据判定结果,确定所述待翻译词汇当前是否应采用其专名译文进行翻译,具体包括:
以所述关联文本中找出的特征词,在所述决策树上按该决策树的生成顺序依次进行判定;
结果满足该决策树上叶子结点的判定,则判定所述待翻译词汇按照其专名译文进行翻译。
8.根据权利要求3所述的方法,其特征在于,所述对选取的每个特定段落进行分词处理,去除其中的停用词,将剩余的词汇作为候选关联词,具体包括:
保留为名称、动词、形容词、副词、习语或缩略语的词汇。
9.根据权利要求2所述的方法,其特征在于,所述特定段落为待翻译词汇在语料库中的所在句、所在的自然段或该词汇在语料库中前后一定范围的词汇集合。
CN201410819734.2A 2014-12-25 2014-12-25 一种确定具有专名译文的词汇的翻译方向的方法 Active CN104572632B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410819734.2A CN104572632B (zh) 2014-12-25 2014-12-25 一种确定具有专名译文的词汇的翻译方向的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410819734.2A CN104572632B (zh) 2014-12-25 2014-12-25 一种确定具有专名译文的词汇的翻译方向的方法

Publications (2)

Publication Number Publication Date
CN104572632A true CN104572632A (zh) 2015-04-29
CN104572632B CN104572632B (zh) 2017-07-04

Family

ID=53088735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410819734.2A Active CN104572632B (zh) 2014-12-25 2014-12-25 一种确定具有专名译文的词汇的翻译方向的方法

Country Status (1)

Country Link
CN (1) CN104572632B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107870905A (zh) * 2017-12-04 2018-04-03 语联网(武汉)信息技术有限公司 一种特定词汇的识别方法
CN108628838A (zh) * 2017-03-22 2018-10-09 湖南本来文化发展有限公司 采用决策树c4.5挖掘算法翻译俄语和粤语的app
CN108628840A (zh) * 2017-03-22 2018-10-09 湖南本来文化发展有限公司 采用决策树c4.5挖掘算法翻译四川口音和俄语的方法
CN109657252A (zh) * 2018-12-25 2019-04-19 北京微播视界科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
CN109829173A (zh) * 2019-01-21 2019-05-31 中国测绘科学研究院 一种英文地名翻译方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1928862A (zh) * 2005-09-08 2007-03-14 富士通株式会社 基于数据挖掘获取词或词组单元译文信息的系统和方法
CN102662490A (zh) * 2012-04-08 2012-09-12 北京语智云帆科技有限公司 一种具有辅助翻译功能的输入方法
CN103678288A (zh) * 2013-11-30 2014-03-26 武汉传神信息技术有限公司 一种专名自动翻译的方法
CN104239293A (zh) * 2014-08-18 2014-12-24 武汉传神信息技术有限公司 一种基于机器翻译的专名翻译方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1928862A (zh) * 2005-09-08 2007-03-14 富士通株式会社 基于数据挖掘获取词或词组单元译文信息的系统和方法
CN102662490A (zh) * 2012-04-08 2012-09-12 北京语智云帆科技有限公司 一种具有辅助翻译功能的输入方法
CN103678288A (zh) * 2013-11-30 2014-03-26 武汉传神信息技术有限公司 一种专名自动翻译的方法
CN104239293A (zh) * 2014-08-18 2014-12-24 武汉传神信息技术有限公司 一种基于机器翻译的专名翻译方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王昊贤,李广建: "基于关联规则的术语自动抽取研究", 《图书与情报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108628838A (zh) * 2017-03-22 2018-10-09 湖南本来文化发展有限公司 采用决策树c4.5挖掘算法翻译俄语和粤语的app
CN108628840A (zh) * 2017-03-22 2018-10-09 湖南本来文化发展有限公司 采用决策树c4.5挖掘算法翻译四川口音和俄语的方法
CN107870905A (zh) * 2017-12-04 2018-04-03 语联网(武汉)信息技术有限公司 一种特定词汇的识别方法
CN109657252A (zh) * 2018-12-25 2019-04-19 北京微播视界科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
CN109829173A (zh) * 2019-01-21 2019-05-31 中国测绘科学研究院 一种英文地名翻译方法及装置
CN109829173B (zh) * 2019-01-21 2023-09-29 中国测绘科学研究院 一种英文地名翻译方法及装置

Also Published As

Publication number Publication date
CN104572632B (zh) 2017-07-04

Similar Documents

Publication Publication Date Title
CN107480143B (zh) 基于上下文相关性的对话话题分割方法和系统
US20210064821A1 (en) System and method to extract customized information in natural language text
CN106547739A (zh) 一种文本语义相似度分析方法
WO2009035863A2 (en) Mining bilingual dictionaries from monolingual web pages
Kausar et al. ProSOUL: a framework to identify propaganda from online Urdu content
CN103678271B (zh) 一种文本校正方法及用户设备
CN104572632B (zh) 一种确定具有专名译文的词汇的翻译方向的方法
CN113704416A (zh) 词义消歧方法、装置、电子设备及计算机可读存储介质
Chau et al. Vnlawbert: A vietnamese legal answer selection approach using bert language model
CN107357895A (zh) 一种基于词袋模型的文本表示的处理方法
CN105389303B (zh) 一种异源语料自动融合方法
Wong et al. iSentenizer‐μ: Multilingual Sentence Boundary Detection Model
CN114997288A (zh) 一种设计资源关联方法
CN117291192B (zh) 一种政务文本语义理解分析方法及系统
CN104572633A (zh) 一种确定多义词词义的方法
Wang A cross-domain natural language interface to databases using adversarial text method
Sagcan et al. Toponym recognition in social media for estimating the location of events
CN110929509B (zh) 一种基于louvain社区发现算法的领域事件触发词聚类方法
CN112270189A (zh) 一种提问式的分析节点生成方法、系统及存储介质
CN111858860B (zh) 搜索信息处理方法及系统、服务器、计算机可读介质
Hemmer et al. Estimating Post-OCR Denoising Complexity on Numerical Texts
CN114896966B (zh) 一种中文文本语法错误定位方法、系统、设备及介质
CN111104520A (zh) 一种基于人物身份的人物实体链接方法
Putra et al. Sentence boundary disambiguation for Indonesian language
Kapočiūtė-Dzikienė et al. Character-based machine learning vs. language modeling for diacritics restoration

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: WUHAN TRANSN INFORMATION TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: YULIANWANG (WUHAN) INFORMATION TECHNOLOGY CO., LTD.

Effective date: 20150805

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150805

Address after: 430073 East Lake Hubei Development Zone, Optics Valley Software Park, a phase of the west, South Lake Road South, Optics Valley Software Park, No. 2, No. 5, layer 205, six

Applicant after: WUHAN TRANSN INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 430073 East Lake Hubei Development Zone, Optics Valley Software Park, a phase of the west, South Lake Road South, Optics Valley Software Park, No. 2, No. 6, layer 206, six

Applicant before: IOL (WUHAN) INFORMATION TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 430070 East Lake Hubei Development Zone, Optics Valley Software Park, a phase of the west, South Lake Road South, Optics Valley Software Park, No. 2, No. 5, layer 205, six

Patentee after: IOL (WUHAN) INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 430073 East Lake Hubei Development Zone, Optics Valley Software Park, a phase of the west, South Lake Road South, Optics Valley Software Park, No. 2, No. 5, layer 205, six

Patentee before: WUHAN TRANSN INFORMATION TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method for determining translation direction of word with proper noun translation

Effective date of registration: 20190927

Granted publication date: 20170704

Pledgee: Guanggu Branch of Wuhan Rural Commercial Bank Co.,Ltd.

Pledgor: IOL (WUHAN) INFORMATION TECHNOLOGY Co.,Ltd.

Registration number: Y2019420000020

PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20200930

Granted publication date: 20170704

Pledgee: Guanggu Branch of Wuhan Rural Commercial Bank Co.,Ltd.

Pledgor: IOL (WUHAN) INFORMATION TECHNOLOGY Co.,Ltd.

Registration number: Y2019420000020

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A method of determining the translation of proper names

Effective date of registration: 20201030

Granted publication date: 20170704

Pledgee: Guanggu Branch of Wuhan Rural Commercial Bank Co.,Ltd.

Pledgor: IOL (WUHAN) INFORMATION TECHNOLOGY Co.,Ltd.

Registration number: Y2020420000074

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20211102

Granted publication date: 20170704

Pledgee: Guanggu Branch of Wuhan Rural Commercial Bank Co.,Ltd.

Pledgor: IOL (WUHAN) INFORMATION TECHNOLOGY Co.,Ltd.

Registration number: Y2020420000074

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A method for determining the translation direction of words with proper name translation

Effective date of registration: 20211105

Granted publication date: 20170704

Pledgee: Guanggu Branch of Wuhan Rural Commercial Bank Co.,Ltd.

Pledgor: IOL (WUHAN) INFORMATION TECHNOLOGY Co.,Ltd.

Registration number: Y2021420000120

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230619

Granted publication date: 20170704

Pledgee: Guanggu Branch of Wuhan Rural Commercial Bank Co.,Ltd.

Pledgor: IOL (WUHAN) INFORMATION TECHNOLOGY Co.,Ltd.

Registration number: Y2021420000120

PC01 Cancellation of the registration of the contract for pledge of patent right