CN102637167B - 多语种互译方法 - Google Patents

多语种互译方法 Download PDF

Info

Publication number
CN102637167B
CN102637167B CN201110439961.9A CN201110439961A CN102637167B CN 102637167 B CN102637167 B CN 102637167B CN 201110439961 A CN201110439961 A CN 201110439961A CN 102637167 B CN102637167 B CN 102637167B
Authority
CN
China
Prior art keywords
lexical
languages
textual analysis
user
inter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110439961.9A
Other languages
English (en)
Other versions
CN102637167A (zh
Inventor
忻尚明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zeng Minsheng
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201110439961.9A priority Critical patent/CN102637167B/zh
Publication of CN102637167A publication Critical patent/CN102637167A/zh
Application granted granted Critical
Publication of CN102637167B publication Critical patent/CN102637167B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种多语种互译方法,包括如下步骤:①对互译语言的词库中所包含的词条进行标记;②对步骤①中所述每个词条对应的各项释义都建立释义标记;③建立互译语种公共对应关系表,在表中存放代表相同释义的不同互译语言的标记对应关系数据;④接收用户输入的出发语词条信息;⑤根据步骤④中的出发语信息在出发语种词库中搜索词条,并将搜索结果显示给用户;⑥根据用户所选择的释义项,搜索其在词库中对应的释义标记;⑦根据搜索到的释义标记在互译语种公共对应关系表中搜索用户所需的释义标记;⑧根据搜索到的释义标记在目的语种词库中调取对应的词条信息,并将其显示给用户。该方法可以避免因“一词多义”而导致的多语种互译翻译错误。

Description

多语种互译方法
技术领域
本发明涉及一种语言翻译方法,特别涉及一种多语种互译方法。
背景技术
在电子词典、机器翻译软件等技术领域,语言翻译方法是一项很关键的技术,直接决定了最终产品的质量好坏和水平高低。
现有的翻译类产品无论是设备还是软件,都有很多种,但是其翻译方法则基本上都采用了类似的“从词到词”的手段,即在不同语言的词库之间建立起词条对应表,通过表中设定的不同语言词条标记之间的对应关系来建立起不同语种词库的对应关系,当用户输入需要翻译的词语后,翻译设备或者翻译软件会根据此词语在目标语言的词库范围内寻找匹配的词语,并把所寻找到的匹配词语显示给用户。这种“从词到词”的翻译方法具有很大的弊端。因为由于语言发展和使用的需要,单一的“词”从最初浅显单一的本义逐渐衍生出多种复杂的含义,最终形成了现代语言“一词多义”的特点。而“从词到词”的翻译方法,忽略了语言的这个特点。这种弊端对只提供一语单向翻译的软件而言,从翻译结果来看并没有明显的体现。例如:在一款英翻汉软件中,输入英文单词“book”得到汉语词条;“书”,从软件结果来看,是完全正确的。但当词出现在句子之中时,这种“从词到词”这种翻译方法的缺点就体现得非常明显。例如,当用户想理解英文句子:“I want to book a room.”中的“book”的意思,使用翻译软件得到的是汉语词条:“书”,这种翻译结果显然就是错误的。就算得到了“书”和“预定”两个词条,也会对用户造成理解困扰,不能达到准确翻译的目的。“从词到词”的翻译方法,割裂了语言和使用者的关系,是落后的翻译方法。
而这种“从词到词”翻译方法的弊端在进行多语互译的时候,表现得更为明显。按照“从词到词”的工作原理,在需要多种语言之间进行相互翻译的场合,必须在每两种语言之间都建立词条对应表。而由于任何一种语言均普遍存在着“一词多义”的情况,再加上不同语种之间的语法规则差异性影响(例如,德、俄、法等语种的词都有阴、阳性变化,而汉语却没有),这些两两组合对应的的词条对应表并不能联合组成统一的对应关系。如果用这种没有统一联系性的翻译方法去做多语互译,那么发生翻译错误的几率,会因为互译语种的增加而成正比增长。这也是到目前为止,没有较好的多语互译方法的主要原因。
发明内容
本发明是为了克服上述现有技术中的缺陷,提供一种多语种互译方法,可以避免因为一词多义或一字多义造成的多语言互译翻译错误。
为实现上述目的,本发明公开如下技术内容:
一种多语种互译方法,包括如下步骤:
①将互译语言的词库中所包含的所有词条进行标记,每个词条有且仅对应一个词条标记;
②为步骤①中所述每个词条所对应的各项释义建立释义标记,每个释义有且仅对应一个释义标记;
③建立互译语种公共对应关系表,在表中存放代表相同释义的不同互译语种词库中的所述释义标记之间的对应关系数据;
④接收用户输入的出发语种词条信息;
⑤根据步骤④中的出发语种词条信息在对应该出发语种的语种词库中搜索该词条及其所对应的所有释义项数据,并将搜索结果显示给用户,同时提醒用户选择需要进行翻译的释义项;
⑥根据用户所选择的释义项,搜索该释义项在出发语种的词库中对应的释义标记;
⑦根据步骤⑥中所搜索到的释义标记在所述互译语种公共对应关系表中搜索匹配的对应关系数据,并根据此对应关系数据调取用户所需目的语种的释义标记;
⑧根据步骤⑦中所调取的目的语种的释义标记分别调取匹配的目的语种词条信息,并将其显示给用户。
优选地,在所述步骤⑦中还包含如下步骤:
a.向用户发出指定目的语种的请求;
b.在所述互译语种公共对应关系表中搜索匹配的对应关系数据,并根据此对应关系数据调取用户所需目的语种的释义标记。
与现有技术相比,本发明具有如下有益效果:
用一个统一的互译语种公共对应表来代替原有的不同语种词条对应表,可以形成统一的词条释义对应关系,然后以词的某一条释义作为检索条件在互译语言之间进行检索和匹配,从而有效避免在多语种互译时由于一词多义和语法规则差异造成的互译错误和多余信息出现,不仅提高了准确度,还能够简化互译流程。
具体实施方式
下面对本发明的优选具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
一种多语种互译方法,包括如下步骤:
①将互译语言的词库中所包含的所有词条进行标记,每个词条有且仅对应一个词条标记;
②为步骤①中所述每个词条所对应的各项释义建立释义标记,每个释义有且仅对应一个释义标记;
③建立互译语种公共对应关系表,在表中存放代表相同释义的不同互译语种词库中的所述释义标记之间的对应关系数据;
④接收用户输入的出发语种词条信息;
⑤根据步骤④中的出发语种词条信息在对应该出发语种的语种词库中搜索该词条及其所对应的所有释义项数据,并将搜索结果显示给用户,同时提醒用户选择需要进行翻译的释义项;
⑥根据用户所选择的释义项,搜索该释义项在出发语种的词库中对应的释义标记;
⑦根据步骤⑥中所搜索到的释义标记在所述互译语种公共对应关系表中搜索匹配的对应关系数据,并根据此对应关系数据调取用户所需目的语种的释义标记;
⑧根据步骤⑦中所调取的目的语种的释义标记分别调取匹配的目的语种词条信息,并将其显示给用户。
上述步骤①至③的目的是建立基础数据库和互译语种公共对应关系表,从而为实现“从释义到释义”的互译做好准备。在将本方法适用到软件或者设备中时,步骤①至③的内容需要事先做好,以便于使用者从步骤④开始进入互译流程。
在参加互译的语言较多时,为了避免输入一个词条后显示过多的信息,在所述步骤⑦中还包含如下步骤:
a.向用户发出指定目的语种的请求;
b.在所述互译语种公共对应关系表中搜索匹配的对应关系数据,并根据此对应关系数据调取用户所需目的语种的释义标记。
通过步骤⑦-b,可以使用户仅仅看到所需要的语种信息,有助于节省用户的时间和精力。
以上公开的仅为本发明较优的具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (2)

1.一种多语种互译方法,其特征在于,包括如下步骤:
①将互译语言的词库中所包含的所有词条进行标记,每个词条有且仅对应一个词条标记;
②为步骤①中所述每个词条所对应的各项释义建立释义标记,每个释义有且仅对应一个释义标记;
③建立互译语种公共对应关系表,在表中存放代表相同释义的不同互译语种词库中的所述释义标记之间的对应关系数据;
④接收用户输入的出发语种词条信息;
⑤根据步骤④中的出发语种词条信息在对应该出发语种的语种词库中搜索该词条及其所对应的所有释义项的数据,并将搜索结果显示给用户,同时提醒用户选择需要进行翻译的释义项;
⑥根据用户所选择的释义项,搜索该释义项在出发语种的词库中对应的释义标记;
⑦根据步骤⑥中所搜索到的释义标记在所述互译语种公共对应关系表中搜索匹配的对应关系数据,并根据此对应关系数据调取用户所需目的语种的释义标记;
⑧根据步骤⑦中所调取的目的语种的释义标记分别调取匹配的目的语种词条信息,并将其显示给用户。
2.根据权利要求1所述的多语种互译方法,其特征在于,在所述步骤⑦中还包含如下步骤:
a.向用户发出指定目的语种的请求;
b.在所述互译语种公共对应关系表中搜索匹配的对应关系数据,并根据此对应关系数据调取用户所需目的语种的释义标记。
CN201110439961.9A 2011-12-23 2011-12-23 多语种互译方法 Active CN102637167B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110439961.9A CN102637167B (zh) 2011-12-23 2011-12-23 多语种互译方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110439961.9A CN102637167B (zh) 2011-12-23 2011-12-23 多语种互译方法

Publications (2)

Publication Number Publication Date
CN102637167A CN102637167A (zh) 2012-08-15
CN102637167B true CN102637167B (zh) 2015-02-18

Family

ID=46621564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110439961.9A Active CN102637167B (zh) 2011-12-23 2011-12-23 多语种互译方法

Country Status (1)

Country Link
CN (1) CN102637167B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108133019A (zh) * 2017-12-25 2018-06-08 中译语通科技(青岛)有限公司 一种多语地名存储系统的构建方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793368B (zh) * 2012-10-31 2016-12-21 上海佑译信息科技有限公司 一种在自动化翻译处理中自动保护标记语言中标记的方法
CN104537066B (zh) * 2014-12-30 2017-10-03 郑州中业科技股份有限公司 基于多语言翻译的近义词关联方法
CN111274828B (zh) * 2020-01-21 2021-02-02 陈刚 基于留言的语言翻译方法、系统、计算机程序和手持终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101030198A (zh) * 2006-03-02 2007-09-05 王启亨 在网络应用中实现跨语种交流的方法和系统
CN101105791A (zh) * 2007-08-08 2008-01-16 北京唐风汉语教育科技有限公司 基于多媒体的支持多平台多终端的多语种互译的方法
US7512532B2 (en) * 2001-01-19 2009-03-31 Nec Corporation Translation server, translation method and program therefor
CN101957815A (zh) * 2009-07-13 2011-01-26 白劲实 基于正确翻译结果与对应关系的自动翻译方法与系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7512532B2 (en) * 2001-01-19 2009-03-31 Nec Corporation Translation server, translation method and program therefor
CN101030198A (zh) * 2006-03-02 2007-09-05 王启亨 在网络应用中实现跨语种交流的方法和系统
CN101105791A (zh) * 2007-08-08 2008-01-16 北京唐风汉语教育科技有限公司 基于多媒体的支持多平台多终端的多语种互译的方法
CN101957815A (zh) * 2009-07-13 2011-01-26 白劲实 基于正确翻译结果与对应关系的自动翻译方法与系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108133019A (zh) * 2017-12-25 2018-06-08 中译语通科技(青岛)有限公司 一种多语地名存储系统的构建方法

Also Published As

Publication number Publication date
CN102637167A (zh) 2012-08-15

Similar Documents

Publication Publication Date Title
CN105468900B (zh) 一种基于知识库的智能病历录入平台
US8706472B2 (en) Method for disambiguating multiple readings in language conversion
CN102662937B (zh) 自动翻译系统及其自动翻译方法
CN103488648B (zh) 一种多语种混合检索方法和系统
CN102789504A (zh) 一种基于xml规则的中文语法校正方法与系统
CN104011712A (zh) 对跨语言查询建议的查询翻译进行评价
CN102637167B (zh) 多语种互译方法
CN102750351A (zh) 基于规则的地址信息匹配方法
JP2009151777A (ja) 音声言語パラレルコーパスのアライメント方法及び装置
US20170357642A1 (en) Cross Lingual Search using Multi-Language Ontology for Text Based Communication
Shiwen et al. Rule-based machine translation
CN101359339A (zh) 一种关键词自动扩展查询方法及其装置
Bhatti et al. Phonetic based soundex & shapeex algorithm for sindhi spell checker system
US10346545B2 (en) Method, device, and recording medium for providing translated sentence
Warburton Processing terminology for the translation pipeline
CN102609410A (zh) 规范文档辅助写作系统及规范文档生成方法
Rösener Computational linguistics in the translator’s workflow—combining authoring tools and translation memory systems
CN107169124A (zh) 一种双语双解词典的查询方法
CN104239294A (zh) 藏汉翻译系统的多策略藏语长句切分方法
JPH08106474A (ja) 類似例文検索結果表示方法及び装置
Fan et al. Automatic extraction of bilingual terms from a chinese-japanese parallel corpus
CN102364469B (zh) 一种对例句检索结果进行排序的方法及装置
JP5039114B2 (ja) 機械翻訳装置及びプログラム
Lin et al. Automatic Dish Name Extraction from User-generated Content Using LLM
Pishartoy et al. Extending capabilities of English to Marathi machine translator

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: CENG MINSHENG

Free format text: FORMER OWNER: DONGGUAN KANGMING ELECTRONICS CO., LTD.

Effective date: 20141229

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20141229

Address after: 523000, room 18, 601 Sunny Bay Garden, Dongguan, Guangdong, Dongcheng District

Applicant after: Zeng Minsheng

Address before: 523000 Guangdong city of Dongguan province Dongcheng District Wentang village industrial zone two soap

Applicant before: Dongguan Kangming electronics Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant