CN109829173B - 一种英文地名翻译方法及装置 - Google Patents
一种英文地名翻译方法及装置 Download PDFInfo
- Publication number
- CN109829173B CN109829173B CN201910056128.2A CN201910056128A CN109829173B CN 109829173 B CN109829173 B CN 109829173B CN 201910056128 A CN201910056128 A CN 201910056128A CN 109829173 B CN109829173 B CN 109829173B
- Authority
- CN
- China
- Prior art keywords
- place name
- name
- place
- transliteration
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明涉及一种英文地名翻译方法及装置,该方法包括:获取待翻译地名词组信息;根据地名词组信息区分地名专名部分和地名通名部分;根据地名专名部分进行音译,得到音译结果;结合音译结果和地名通名部分进行翻译,得到地名翻译结果。采用上述方法或装置能够自动完成英文地名翻译,减少地名生成时的人力消耗,提高翻译效率。
Description
技术领域
本发明涉及地名翻译技术领域,具体涉及一种英文地名翻译方法及装置。
背景技术
随着人们生活工作的需求,进行英文地名的翻译的需求也日益增加。地名翻译指的是将某一个地理实体在某一种语言上的表达转化为另一种语言的表达。通常来说,地名被分为地名通名和地名专名,地名通名是概括某种地物共性(类别)的通用词,起定性作用;地名专名是指代某一地理实体并用以区分同类地物的专用词,起定位作用。其中,地名自动翻译或称机器地名翻译,是机器翻译中命名实体翻译的一部分。然而该部分是所有命名实体翻译中最难的一项。首先,地名组成复杂,不同尺度下的地名构成具有很大差别。其次,地名的翻译需要考虑通名和专名两个部分,即音译与意译两个部分。但是现有的相关研究的通用机器翻译大多均不能独立的解决地名的翻译问题。目前业界更多的是依靠人工进行地名的翻译,此种翻译方式效率极低,实用性差。
发明内容
有鉴于此,本发明的目的在于克服现有技术的不足,提供一种英文地名翻译方法及装置。解决了依靠人工翻译,效率低的问题。
为实现以上目的,本发明采用如下技术方案:
一种英文地名翻译方法,包括:
获取待翻译地名词组信息;
根据所述地名词组信息区分地名专名部分和地名通名部分;
根据所述地名专名部分进行音译,得到音译结果;
结合所述音译结果和所述地名通名部分进行翻译,得到地名翻译结果。
可选的,所述根据所述地名词组信息区分地名专名部分和地名通名部分,包括:
利用预设地名通名模板库对所述待翻译地名词组信息进行结构分解,得到地名条目结构树;
确定所述地名条目结构树的叶节点为所述地名专名部分;
确定所述地名条目结构树的分支节点为所述地名通名部分。
可选的,所述根据所述地名专名部分进行音译,得到音译结果,包括:
根据所述地名专名部分生成地名专名音标;
对所述地名专名音标进行音节划分,得到地名专名音节;
根据所述地名专名音节利用预设音译规则进行翻译,得到所述音译结果。
可选的,所述结合所述音译结果和所述地名通名部分进行翻译,得到地名翻译结果,包括:
利用预设通名翻译模板对所述地名通名部分进行翻译,得到通名翻译结果;
结合所述通名翻译结果与所述音译结果确定最终翻译结果,得到地名翻译结果。
可选的,所述利用预设地名通名模板库对所述待翻译地名词组信息进行结构分解,得到地名条目结构树,包括:
根据所述待翻译地名词组信息确定所有符合预设条件的地名通名模板;
根据各所述地名通名模板确定所有的通名结构分解方案;
计算各所述地名通名模板对应的对数频率;
对同一所述结构分解方案内的各所述对数频率求和得到对应所述结构分解方案的对数频率值;
确定所述对数频率值最大的所述结构分解方案为所述地名条目结构树。
一种英文地名翻译装置,包括:
词组信息获取模块,用于获取待翻译地名词组信息;
词组信息分解模块,用于根据所述地名词组信息区分地名专名部分和地名通名部分;
音译模块,用于根据所述地名专名部分进行音译,得到音译结果;
翻译结果获取模块,用于结合所述音译结果和所述地名通名部分进行翻译,得到地名翻译结果。
可选的,所述词组信息分解模块包括:
结构树构建单元,用于利用预设地名通名模板库对所述待翻译地名词组信息进行结构分解,得到地名条目结构树;
地名专门部分确定单元,用于确定所述地名条目结构树的叶节点为所述地名专名部分;
地名通名部分确定单元,用于确定所述地名条目结构树的分支节点为所述地名通名部分。
可选的,所述音译模块,包括:
音标生成单元,用于根据所述地名专名部分生成地名专名音标;
音节生成单元,用于对所述地名专名音标进行音节划分,得到地名专名音节;
音译结果获取单元,用于根据所述地名专名音节利用预设音译规则进行翻译,得到所述音译结果。
可选的,所述翻译结果获取模块,包括:
通名翻译结果获取单元,用于利用预设通名翻译模板对所述地名通名部分进行翻译,得到通名翻译结果;
地名翻译结果确定单元,用于结合所述通名翻译结果与所述音译结果确定最终翻译结果,得到地名翻译结果。
可选的,所述结构树构建单元,包括:
根据所述待翻译地名词组信息确定所有符合预设条件的地名通名模板;
根据各所述地名通名模板确定所有的通名结构分解方案;
计算各所述地名通名模板对应的对数频率;
对同一所述结构分解方案内的各所述对数频率求和得到对应所述结构分解方案的对数频率值;
确定所述对数频率值最大的所述结构分解方案为所述地名条目结构树。
本申请提供的技术方案可以包括以下有益效果:
本申请中公开了一种英文地名翻译方法,包括:获取待翻译地名词组信息;根据地名词组信息区分地名专名部分和地名通名部分;根据地名专名部分进行音译,得到音译结果;结合音译结果和地名通名部分进行翻译,得到地名翻译结果。上述英文地名翻译方法将待翻译地名区分为地名专名部分和地名通名部分,对地名专名部分进行音译后,得到的音译结果结合地名通名部分再进行翻译,最终得到地名翻译结果。采用上述英文地名翻译方法能解决现在英文地名翻译主要为人工进行,效率低下的问题,极大地提高了地名翻译效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的英文地名翻译方法流程图;
图2是本发明一实施例提供的英文地名翻译装置结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
图1是本发明一实施例提供的英文地名翻译方法流程图。参见图1,一种英文地名翻译方法,包括:
步骤101:获取待翻译地名词组信息;
步骤102:根据所述地名词组信息区分地名专名部分和地名通名部分;
步骤103:根据所述地名专名部分进行音译,得到音译结果;
步骤104:结合所述音译结果和所述地名通名部分进行翻译,得到地名翻译结果。
其中,更进一步地,步骤102具体包括:
利用预设地名通名模板库对所述待翻译地名词组信息进行结构分解,得到地名条目结构树;
确定所述地名条目结构树的叶节点为所述地名专名部分;
确定所述地名条目结构树的分支节点为所述地名通名部分。
现详细介绍步骤102:根据给定的一条输入地名词组,即地名词组信息,利用预先得到的预设地名通名模板库,实现地名词组的结构分解从而生成地名条目结构树。本申请中为了实现对地名词组的结构分解,借鉴句法分析的“投射性(projective)假设”。本方法对地名提出如下假设:
1、地名是由若干个地名通名模板构成,这些模板互不交叉
2、地名模板的占位符部分也是一个地名通名模板;
3、每个单独的词可以看成是一个特殊的地名通名模板
基于以上假设,本发明提出了地名词组结构分解方法:找一系列的地名通名模板来不重、不漏、不交叉地覆盖地名词组中的每个词,使得这些地名通名模板的概率对数之和最大。具体来说可以分为两步:
1、扫描中地名条目中所有可能出现的地名模板情况;
2、按照所有可能出现的地名通名模板,遍历所有合法的结构分解方案对于每种分解方案计算其对数频率(即对频率取对数):分解方案中所有模板概率对数之和。寻找对数频率最大的分解方案,最为分解结果,并生成地名条目结构树。
例如:对于地名“Isle of west burrafirth”一共有三种符合假设的合法的通名结构分解方案(记为A,B,C),分别对分解方案计算其对数频率和:
方案A:由两个地名通名模板(Isle of[X]、west[X])和一个单独的词(burrafirth)组成,其通名模板的对数频率为-7.37185、-5.05360。单独的词对数频率采用一个人为给定的先验值,本文为-11.00944(即假设单独的词频数为1/2算出的对数频率)。则该方案A的对数频率和为
-7.37185+(-5.05360)+(-11.00944)=-23.43489
方案B:由两个地名通名模板([X]of[Y]、west[X])和两个单独的词(isle,burrafirth)组成,其地名通名模板的对数频率为-5.31908、-5.05360。则该方案B的对数频率和为
-5.31908+(-5.05360)+2*(-11.00944)=-32.39156
方案C:由一个地名通名模板([X]west[Y])和三个单独的词(isle,of,burrafirth)组成,其地名通名模板的对数频率为-6.36505。则该方案C的对数频率和为
-6.36505+3*(-11.00944)=-38.08192
由上述计算可得方案A对数频率和最大,所以方案A为生成的句结构树为最后的地名结构树
最终,获得对于给定的待翻译地名词组信息的地名结构树。结构树中叶节点(即最末端节点)中代表的词应为音译的地名专名部分、分支节点中模板对应的词应为意译的地名通名部分。
其中,预设地名通名模板库的建立过程如下:
通过对大量地名语料进行数据挖掘,利用互信息与有向无环图进行计算,从中提取出地名的构成规则、识别为模板。例如:[X]Lodge、[X]oil field等形式(其中形如[X],[Y]为占位符)。具体提取方法为如下:互信息(Mutual Information,)是信息论里一种有用的信息度量,它可以看成是一个随机变量中包含的关于另一个随机变量的信息量,或者说是一个随机变量由于已知另一个随机变量而减少的不肯定性。在该方法中,将构成地名的词看作随机变量,从地名语料中,以每条地名为单位,分别统计构成地名的词出现频率(即Pa或Pb)与词与词之间的共现频率(即Pab)。在统计完成后,对于任意的有序词对a,b计算其互信息/>设定合适阈值组T后,记录Pab>T1且MIab>T2的有序词对(a,b)到集合G中。之后再次遍历所有句子,对于每一个句子构成一个有向无环图,句子中的词当作图上的点:对于句子中的有序词对(a,b)若(a,b)∈G,那么就给图上添加一条“a-->b”的有向边。找出图上所有的路径,对于每一条路径按照访问节点对应的词生成一个地名通名模板(如果跨过了相邻节点,那么就插入一个占位符),地名模板进行统计。统计各个地名模板的频率,将候选地名模板按频率降序排列,设定合适的阈值,取频率大于阈值的作为地名通名模板即可。
更进一步地,步骤103具体包括:
根据所述地名专名部分生成地名专名音标;
对所述地名专名音标进行音节划分,得到地名专名音节;
根据所述地名专名音节利用预设音译规则进行翻译,得到所述音译结果。
地名输入:将英文的地名专名部分输入至翻译技术模型。
音标生成:把英文的地名专名部分中的专名一一生成为音标的过程,该过程将单词与发音信息建立起联系。在这个过程中对于常见的(被词典收录的)单词可以通过查询的方式获取音标,但对于字典未收录的地名专名词(如:Tollamhuic)则需要采用算法生成音标。
音节划分:将生成的音标进行音节的划分,音节划分需要尽可能的少划分出音节,以达到音译的尽可能简短的要求。
音节汉字译写:将音节按照某种规则译写为的过程汉字,从而得到翻译结果。目前该规则主要使用的是国家标准(《外语地名汉字译写导则》(GB/T17693.3-2009))制定的英汉译写表。
结果输出:将最终音译结果进行输出。
更进一步地,步骤104具体包括:
利用预设通名翻译模板对所述地名通名部分进行翻译,得到通名翻译结果;
结合所述通名翻译结果与所述音译结果确定最终翻译结果,得到地名翻译结果。
现详细介绍步骤104:首先利用通用机器翻译,获得每个地名通名模板的翻译(比如:[X]railway station->[X]火车站,st[X]roman catholic church->圣,[X]罗马天主教堂,port[X]->[X]港等)对于输入地名解析完成的地名结构树,逐步分层获得输入地名的翻译结果。例如“Isle of west burrafirth”其地名结构树为:
其中涉及两个预设通名翻译模板,Isle of[X]、west[X]其翻译为:[X]岛、西[X],burrafirth音译结果为巴勒弗斯。其嵌套翻译过程为:
Isle of[west burrafirth]->[west burrafirth]岛
[west[burrafirth]]岛->[西[burrafirth]]岛
[西[burrafirth]]岛->[西[巴勒弗斯]]岛
[西[巴勒弗斯]]岛->西巴勒弗斯岛
由此得到“Isle ofwest burrafirth”的地名翻译结果为“西巴勒弗斯岛”。
采用上述英文地名翻译方法通过对待翻译地名词组信息进行专名、通名的划分,结合专名的音译结果与通名进行地名翻译,解决现在英文地名翻译主要为人工进行,效率低下的问题。对于待翻译的英文地名,通过上述方法能够自动完成英文地名翻译,减少地名生成时的人力消耗,并提高翻译效率。
图2是本发明一实施例提供的英文地名翻译装置结构图。参见图2,一种英文地名翻译装置,包括:
词组信息获取模块201,用于获取待翻译地名词组信息;
词组信息分解模块202,用于根据所述地名词组信息区分地名专名部分和地名通名部分;
音译模块203,用于根据所述地名专名部分进行音译,得到音译结果;
翻译结果获取模块204,用于结合所述音译结果和所述地名通名部分进行翻译,得到地名翻译结果。
其中,词组信息分解模块202包括:
结构树构建单元,用于利用预设地名通名模板库对所述待翻译地名词组信息进行结构分解,得到地名条目结构树;
地名专门部分确定单元,用于确定所述地名条目结构树的叶节点为所述地名专名部分;
地名通名部分确定单元,用于确定所述地名条目结构树的分支节点为所述地名通名部分。
更进一步地,结构树构建单元,包括:
根据所述待翻译地名词组信息确定所有符合预设条件的地名通名模板;
根据各所述地名通名模板确定所有的通名结构分解方案;
计算各所述地名通名模板对应的对数频率;
对同一所述结构分解方案内的各所述对数频率求和得到对应所述结构分解方案的对数频率值;
确定所述对数频率值最大的所述结构分解方案为所述地名条目结构树。
音译模块203具体包括:
音标生成单元,用于根据所述地名专名部分生成地名专名音标;
音节生成单元,用于对所述地名专名音标进行音节划分,得到地名专名音节;
音译结果获取单元,用于根据所述地名专名音节利用预设音译规则进行翻译,得到所述音译结果。
翻译结果获取模块204具体包括:
通名翻译结果获取单元,用于利用预设通名翻译模板对所述地名通名部分进行翻译,得到通名翻译结果;
地名翻译结果确定单元,用于结合所述通名翻译结果与所述音译结果确定最终翻译结果,得到地名翻译结果。
上述英文地名翻译装置通过实现英文地名的机器翻译,解决现在英文地名翻译主要为人工进行,效率低下问题。对于待翻译的英文地名,通过上述装置可以将自动完成英文地名翻译,减少地名生成时的人力消耗,并提高翻译效率。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (4)
1.一种地名翻译方法,其特征在于,包括:
获取待翻译地名词组信息;根据所述地名词组信息区分地名专名部分和地名通名部分;
根据所述地名专名部分进行音译,得到音译结果;
统计各个地名模板的频率,将候选地名模板按频率降序排列,设定合适的阈值,取频率大于阈值的作为地名通名模板,利用预设通名翻译模板对所述地名通名部分进行翻译,得到通名翻译结果;结合所述通名翻译结果与所述音译结果确定最终翻译结果,得到地名翻译结果;
所述根据所述地名词组信息区分地名专名部分和地名通名部分,包括:利用预设地名通名模板库对所述待翻译地名词组信息进行结构分解,得到地名条目结构树;确定所述地名条目结构树的叶节点为所述地名专名部分;确定所述地名条目结构树的分支节点为所述地名通名部分;
所述利用预设地名通名模板库对所述待翻译地名词组信息进行结构分解,得到地名条目结构树,包括:根据所述待翻译地名词组信息确定所有符合预设条件的地名通名模板;根据各所述地名通名模板确定所有的通名结构分解方案;计算各所述地名通名模板对应的对数频率;对同一所述结构分解方案内的各所述对数频率求和得到对应所述结构分解方案的对数频率值;确定所述对数频率值最大的所述结构分解方案为所述地名条目结构树。
2.根据权利要求1所述的地名翻译方法,其特征在于,所述根据所述地名专名部分进行音译,得到音译结果,包括:
根据所述地名专名部分生成地名专名音标;
对所述地名专名音标进行音节划分,得到地名专名音节;
根据所述地名专名音节利用预设音译规则进行翻译,得到所述音译结果。
3.一种地名翻译装置,其特征在于,包括:
词组信息获取模块,用于获取待翻译地名词组信息;
词组信息分解模块,用于根据所述地名词组信息区分地名专名部分和地名通名部分;所述词组信息分解模块包括:结构树构建单元,用于利用预设地名通名模板库对所述待翻译地名词组信息进行结构分解,得到地名条目结构树;地名专门部分确定单元,用于确定所述地名条目结构树的叶节点为所述地名专名部分;地名通名部分确定单元,用于确定所述地名条目结构树的分支节点为所述地名通名部分;所述结构树构建单元,包括:根据所述待翻译地名词组信息确定所有符合预设条件的地名通名模板;根据各所述地名通名模板确定所有的通名结构分解方案;计算各所述地名通名模板对应的对数频率;对同一所述结构分解方案内的各所述对数频率求和得到对应所述结构分解方案的对数频率值;确定所述对数频率值最大的所述结构分解方案为所述地名条目结构树;
音译模块,用于根据所述地名专名部分进行音译,得到音译结果;
翻译结果获取模块,用于统计各个地名模板的频率,将候选地名模板按频率降序排列,设定合适的阈值,取频率大于阈值的作为地名通名模板,利用预设通名翻译模板对所述地名通名部分进行翻译,得到通名翻译结果;结合所述通名翻译结果与所述音译结果确定最终翻译结果,得到地名翻译结果。
4.根据权利要求3所述的地名翻译装置,其特征在于,所述音译模块,包括:
音标生成单元,用于根据所述地名专名部分生成地名专名音标;
音节生成单元,用于对所述地名专名音标进行音节划分,得到地名专名音节;
音译结果获取单元,用于根据所述地名专名音节利用预设音译规则进行翻译,得到所述音译结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910056128.2A CN109829173B (zh) | 2019-01-21 | 2019-01-21 | 一种英文地名翻译方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910056128.2A CN109829173B (zh) | 2019-01-21 | 2019-01-21 | 一种英文地名翻译方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109829173A CN109829173A (zh) | 2019-05-31 |
CN109829173B true CN109829173B (zh) | 2023-09-29 |
Family
ID=66861824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910056128.2A Active CN109829173B (zh) | 2019-01-21 | 2019-01-21 | 一种英文地名翻译方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109829173B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111950903B (zh) * | 2020-08-12 | 2023-04-07 | 中铁二院工程集团有限责任公司 | 一种基于模板生成铁路工程定额和工程数量的方法及装置 |
CN112084796B (zh) * | 2020-09-15 | 2021-04-09 | 南京文图景信息科技有限公司 | 一种基于Transformer深度学习模型的多语种地名词根汉译方法 |
CN113361288B (zh) * | 2021-06-30 | 2024-03-12 | 民政部地名研究所 | 基于字组的自动化外语地名汉字译写方法 |
AU2021104429A4 (en) * | 2021-07-22 | 2021-09-16 | Chinese Academy Of Surveying And Mapping | Machine Translation Method for French Geographical Names |
NL2031111B1 (en) * | 2022-02-28 | 2023-09-07 | Chinese Acad Surveying & Mapping | Translation method, device, apparatus and medium for spanish geographical names |
CN117592462B (zh) * | 2024-01-18 | 2024-04-16 | 航天宏图信息技术股份有限公司 | 基于地物群的开源地名数据的相关性处理方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1296231A (zh) * | 1999-11-12 | 2001-05-23 | 株式会社日立制作所 | 地名表示词典生成方法和地名表示词典生成装置 |
JP2001175655A (ja) * | 1999-12-17 | 2001-06-29 | Matsushita Electric Ind Co Ltd | 機械翻訳装置 |
JP2002197084A (ja) * | 2001-11-22 | 2002-07-12 | Logo Vista Corp | 自動自然言語翻訳システム |
JP2009059291A (ja) * | 2007-09-03 | 2009-03-19 | Just Syst Corp | 訳語検索支援装置、訳語検索支援方法および訳語検索支援プログラム |
CN102117270A (zh) * | 2011-03-29 | 2011-07-06 | 中国科学院自动化研究所 | 一种基于模糊树到精确树的统计机器翻译方法 |
CN104572632A (zh) * | 2014-12-25 | 2015-04-29 | 语联网(武汉)信息技术有限公司 | 一种确定具有专名译文的词汇的翻译方向的方法 |
JP2016164707A (ja) * | 2015-03-06 | 2016-09-08 | 国立研究開発法人情報通信研究機構 | 自動翻訳装置及び翻訳用モデル学習装置 |
CN109241542A (zh) * | 2018-08-20 | 2019-01-18 | 九江学院 | 一种用于英语翻译的文本数据处理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8478581B2 (en) * | 2010-01-25 | 2013-07-02 | Chung-ching Chen | Interlingua, interlingua engine, and interlingua machine translation system |
-
2019
- 2019-01-21 CN CN201910056128.2A patent/CN109829173B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1296231A (zh) * | 1999-11-12 | 2001-05-23 | 株式会社日立制作所 | 地名表示词典生成方法和地名表示词典生成装置 |
JP2001175655A (ja) * | 1999-12-17 | 2001-06-29 | Matsushita Electric Ind Co Ltd | 機械翻訳装置 |
JP2002197084A (ja) * | 2001-11-22 | 2002-07-12 | Logo Vista Corp | 自動自然言語翻訳システム |
JP2009059291A (ja) * | 2007-09-03 | 2009-03-19 | Just Syst Corp | 訳語検索支援装置、訳語検索支援方法および訳語検索支援プログラム |
CN102117270A (zh) * | 2011-03-29 | 2011-07-06 | 中国科学院自动化研究所 | 一种基于模糊树到精确树的统计机器翻译方法 |
CN104572632A (zh) * | 2014-12-25 | 2015-04-29 | 语联网(武汉)信息技术有限公司 | 一种确定具有专名译文的词汇的翻译方向的方法 |
JP2016164707A (ja) * | 2015-03-06 | 2016-09-08 | 国立研究開発法人情報通信研究機構 | 自動翻訳装置及び翻訳用モデル学習装置 |
CN109241542A (zh) * | 2018-08-20 | 2019-01-18 | 九江学院 | 一种用于英语翻译的文本数据处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109829173A (zh) | 2019-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109829173B (zh) | 一种英文地名翻译方法及装置 | |
CN110502642B (zh) | 一种基于依存句法分析与规则的实体关系抽取方法 | |
CN104239286A (zh) | 同义短语的挖掘方法和装置及搜索相关内容的方法和装置 | |
CN107004000A (zh) | 一种语料生成装置和方法 | |
CN103116578A (zh) | 一种融合句法树和统计机器翻译技术的翻译方法与装置 | |
CN102779135B (zh) | 跨语言获取搜索资源的方法和装置及对应搜索方法和装置 | |
CN110046261A (zh) | 一种建筑工程多模态双语平行语料库的构建方法 | |
CN102214166A (zh) | 基于句法分析和层次模型的机器翻译系统和方法 | |
CN105138514A (zh) | 一种基于词典的正向逐次加一字最大匹配中文分词方法 | |
CN101667177A (zh) | 双语文本的对齐方法及装置 | |
KR20110027361A (ko) | 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법 | |
CN106021224A (zh) | 一种双语篇章标注方法 | |
CN113807105B (zh) | 一种法语地名机器翻译方法 | |
CN101763403A (zh) | 面向多语言信息检索系统的查询翻译方法 | |
CN109815503B (zh) | 一种人机交互翻译方法 | |
CN103488629A (zh) | 一种机器翻译中翻译单元表的抽取方法 | |
Islam et al. | Construction of English-Bodo parallel text corpus for statistical machine translation | |
NL2031111B1 (en) | Translation method, device, apparatus and medium for spanish geographical names | |
CN107590132B (zh) | 一种自动更正部分文字的方法-由英文词性判断 | |
Gete et al. | TANDO: A corpus for document-level machine translation | |
CN112380877B (zh) | 一种用于篇章级英译中机器翻译测试集的构建方法 | |
Zong et al. | Research on alignment in the construction of parallel corpus | |
CN102193915B (zh) | 一种计算机中译英翻译中基于分词网的词对齐融合方法 | |
Dolev | Using Multilingual Word Embeddings for Similarity-Based Word Alignments in a Zero-Shot Setting: Tested on the Case of German–Romansh | |
Lepage et al. | A measure of the number of true analogies between chunks in japanese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |