CN101686234A - 实现多语种信息交流的系统 - Google Patents

实现多语种信息交流的系统 Download PDF

Info

Publication number
CN101686234A
CN101686234A CN200810222956A CN200810222956A CN101686234A CN 101686234 A CN101686234 A CN 101686234A CN 200810222956 A CN200810222956 A CN 200810222956A CN 200810222956 A CN200810222956 A CN 200810222956A CN 101686234 A CN101686234 A CN 101686234A
Authority
CN
China
Prior art keywords
translation
information
client
engine
plurilingual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200810222956A
Other languages
English (en)
Inventor
武纪东
李予
吴迎东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Western Post Office
Original Assignee
Beijing Western Post Office
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Western Post Office filed Critical Beijing Western Post Office
Priority to CN200810222956A priority Critical patent/CN101686234A/zh
Publication of CN101686234A publication Critical patent/CN101686234A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种实现多语种信息交流的系统,该系统采用浏览器/服务器(B/S)结构,包括一服务器端和至少一客户端,该客户端包括至少一显示设备和至少一输入设备,该客户端通过因特网、内部局域网或数据线连接于该服务器端;客户端的输入设备将某一语种信息通过因特网、内部局域网或数据线输出给服务器端,服务器端对接收的该语种信息进行翻译,得到另一语种信息,并将该另一语种信息通过因特网、内部局域网或数据线输出给客户端的显示设备进行显示,实现多语种信息之间的相互交流。利用本发明,实现了不同语言人员之间交流内容的即时翻译,有效地解决了不同语言人员之间信息交流沟通的问题。

Description

实现多语种信息交流的系统
技术领域
本发明涉及多语种之间信息处理技术领域,尤其涉及一种实现多语种信息交流的系统。
背景技术
2008年是奥运之年,届时将有大量的外国游客来到北京,邮政服务作为对外服务的一个窗口行业,迎来了机会,也面临着挑战。目前邮政员工的外语水平普遍不高,熟练使用英语的人员紧缺,尤其是掌握小语种的工作人员更少之又少。
而邮政服务网点众多,奥运场馆、签约酒店、支局、邮电所在奥运期间均需要外语服务人员,此类人员缺口极大,很难在短时间内补足人员缺口,沟通问题已成为迎接奥运工作中的重点和难点。
针对目前的情况进行深入分析,采用机器翻译技术是一个很好的选择,开发一个实现多语种信息交流的系统,以实现在语言不通的情况下能够顺畅的交流。该系统采用机器翻译技术,提供实时翻译功能,解决语言沟通的问题,并且可以通过单机、网络两种方式,应用于邮政的各个服务网点。
发明内容
(一)要解决的技术问题
有鉴于此,本发明的目的在于提供一种实现多语种信息交流的系统,以实现不同语言人员之间交流内容的即时翻译,解决不同语言人员之间信息交流沟通的问题。
(二)技术方案
为达到上述目的,本发明提供的技术方案如下:
一种实现多语种信息交流的系统,该系统采用浏览器/服务器(B/S)结构,包括一服务器端和至少一客户端,该客户端包括至少一显示设备和至少一输入设备,该客户端通过因特网、内部局域网或数据线连接于该服务器端;
客户端的输入设备将某一语种信息通过因特网、内部局域网或数据线输出给服务器端,服务器端对接收的该语种信息进行翻译,得到另一语种信息,并将该另一语种信息通过因特网、内部局域网或数据线输出给客户端的显示设备进行显示,实现多语种信息之间的相互交流。
上述方案中,该客户端的输入设备将某一语种信息通过因特网、内部局域网或数据线输出给服务器端的同时,在客户端的显示设备上显示该语种信息。
上述方案中,该服务器端包括一机器翻译引擎、一实例模式库、一规则知识库、一统计知识库、一译文优选模块和一翻译结果输出模块,该机器翻译引擎进一步包括一基于规则的机器翻译子引擎和一基于启发式类比的翻译处理子引擎;其中,实例模式库、规则知识库、统计知识库和译文优选模块分别连接于机器翻译引擎,翻译结果输出模块直接或者通过译文优选模块间接连接于机器翻译引擎。
上述方案中,该服务器端在接收到客户端输入的某一语种信息后,机器翻译引擎先在实例模式库中对该语种信息进行精确匹配,如果匹配成功,能够在实例模式库中查找到与该语种信息相一致的信息,则直接获取翻译结果,并通过翻译结果输出模块将翻译结果输出给客户端的显示设备;如果匹配失败,则采用并行处理技术,机器翻译引擎调用自身基于规则的机器翻译子引擎和基于启发式类比的翻译处理子引擎,同时对接收自客户端的某一语种信息分别进行翻译处理,基于规则的机器翻译子引擎和基于启发式类比的翻译处理子引擎将各自的翻译结果输出给译文优选模块,译文优选模块调用统计知识库择优选择翻译结果,并通过翻译结果输出模块将选择的翻译结果输出给客户端的显示设备。
上述方案中,该机器翻译引擎调用基于启发式类比的翻译处理子引擎对接收自客户端的某一语种信息进行翻译处理,具体包括:
机器翻译引擎预先采用基于多层次模板的双语语句词对齐方法,建立实例模式源文译文的双语词对齐关系,实现对当前实例模式的翻译模式分析,为启发式类比译文转换奠定基础;
基于启发式类比的翻译处理子引擎在对接收自客户端的某一语种信息进行翻译处理时,采用基于多层次特征的相似度计算方法,计算接收自客户端的某一语种信息与实例模式源文的相似度,建立接收自客户端的某一语种信息与实例模式源文的类比映射关系;
基于启发式类比的翻译处理子引擎根据建立的该类比映射关系,采用类比推理方法构造机器翻译译文。
上述方案中,该机器翻译引擎调用基于规则的机器翻译子引擎对接收自客户端的某一语种信息进行翻译处理,具体包括:基于规则的机器翻译子引擎在对接收自客户端的某一语种信息进行翻译处理时,先对接收的源语言文本进行语法和语义分析,生成深层源语言表示,然后基于规则知识库对生成的深层源语言表示进行转换,生成目标语言深层表示,再基于规则知识库将目标语言深层表示转换成目标语言文本,形成机器翻译译文。
上述方案中,该服务器端为一运行有多语种多策略机器翻译软件的系统主机。
上述方案中,该显示设备为显示器;该输入设备为键盘,或者为鼠标,或者为键盘和鼠标。
上述方案中,该系统进一步包括一服务器维护终端,连接于服务器端,用于对服务器端进行维护和日志管理,更新服务器端中各数据库保存的信息;该服务器端进一步包括一人机互动组件,连接于服务器维护终端,实现服务器维护终端与服务器端之间的交互。
上述方案中,该某一语种信息及另一语种信息中的语种,至少为中文、英文、日文、法文、俄文和西班牙文中的任意一种。
(三)有益效果
从上述技术方案可以看出,本发明结合邮政实际应用需求,进行深度的开发和集成,确保项目成果的实用性。具体来说有以下几个方面的优点:
1、本发明提供的这种实现多语种信息交流的系统,实现了不同语言人员之间交流内容的即时翻译,有效地解决了不同语言人员之间信息交流沟通的问题。
2、本发明提供的这种实现多语种信息交流的系统,使用已有成熟技术,技术稳定可靠,准确性高。
3、本发明提供的这种实现多语种信息交流的系统,部署的服务采用Tomcat,代码和文档都是开放的,对以后项目的维护人员提供了比较简便的维护手段。
4、本发明提供的这种实现多语种信息交流的系统,词典知识针对邮政领域进行了专门的整理和收集,集成了大量的专业词汇和术语,确保了在该领域应用的正确性。
5、本发明提供的这种实现多语种信息交流的系统,为了系统的词汇知识的扩展,设计了自定义词汇的功能,可以在系统使用的过程中进行词汇和短语、术语等的添加,保证了系统的扩展性。
6、本发明提供的这种实现多语种信息交流的系统,使用的翻译技术可以拓展出文件翻译、合同翻译、邮件翻译、网页翻译、双语聊天、双语论坛、双语搜索、智能辅助翻译、语音翻译、外语培训等多方面的应用,有较广阔的应用前景。
附图说明
图1是本发明提供的多策略机器翻译的功能结构示意图;
图2是本发明提供的多策略机器翻译译文生成处理的原理图;
图3是本发明提供的实现多语种信息交流系统的结构示意图;
图4是依照本发明实施例提供的实现多语种信息交流系统的结构示意图。
具体实施方式
多语言信息处理是一个很有挑战性的研究领域,各种理论和相关的技术也在不断的发展、完善和融合。本发明坚持以应用服务为根本的原则,实现以多语言翻译为中心的、其它各种辅助访问和信息浏览应用技术为功能的高度集成的综合性系统。
下面首先介绍本发明的理论基础。
(1)、多语言翻译的解决途径
以多语言机器翻译技术为基础,结合本发明的实际需求,从计算语言学和工程学两个方面进行研究和开发。语言学方面将在现有基础上继续研究符合本系统特别需求的汉、英、日等语言的特点,形成翻译需求相关的理论基础和解决方案;工程学方面,利用成熟的产品开发技术将我们的研究基础整合到所需软件产品的开发中。
(2)、以应用为导向的多语言信息服务中心的解决途径
本发明提供的实现多语种信息交流系统以多语言服务为中心,利用多语言的翻译平台进行信息的交流。其主要技术包括翻译相关的技术、网站信息访问。其中,翻译技术:本发明将利用多策略翻译技术克服采用单一策略翻译方法中出现的问题,并采用自行研究的基于语法、语义理解的算法进行模式近似度计算;对于大规模的数据存取,将采用自行研究的优化算法进行多种语言信息的存取,并已经将这些内容实现到现有的系统中。网站信息访问和服务集成:本发明将采用分布式管理和软件调度等策略解决大用户量的信息访问瓶颈。
基于上述理论基础,以下介绍本发明的核心技术基础。
(1)、智能型机器翻译系统理论体系:包括实现多知识一体化表达的“SC文法体系”、实现多路径动态自动选择的“语法、语义和简单常识一体化分析”、实现主特征相容合一功能的“基于不完备知识的分析转换机制”、实现上下文相关条件测试和问题局部化处理的“基于规则的超前与反馈分析”等系统创新思想。实现了语法语义和简单常识的一体化表达、分析过程中语法语义和简单常识层面的自动选择和变换、知识不完备时基于主特征的自动分析转换,突破了机器翻译研究中大规模知识的表示处理、复杂多义区分和上下文相关特征的关联处理等关键理论难题。
(2)、大规模机器翻译系统工程开发环境:采用多层次的属性特征体系和与其相适应的可变换层次语言描述方案,实现了灵活的知识表达;分散使用特殊规则的多义处理技术;面向多用户分时操作的知识一致性保护及协调机制,适合于大规模工程化开发的开放式系统总体结构;提高了大规模知识获取的质量和效率;实现了面向多语种、多专业的翻译处理环境、知识处理环境及多用户开发环境。
(3)、大容量具有多种语言特征的词典知识库、语料库:建立了多语种大型具有多种语言特征信息的机器翻译知识库系统,包括词典知识库、多知识一体化表示的语言分析规则库、各种词法分析规则库和译文生成规则库等。
(4)、多语种词法分析技术:设计实现了具有上下文相关处理能力的基于多知识规则分析的英语、德语、俄语、日语词法分析技术和汉语自动分词和词法预处理技术。
(5)、多语种译文生成技术:设计实现了基于分析一体化和生成特征的英语、日语、法语、西班牙语的译文生成技术。
源语言经过语法、语义分析,生成深层的源语言表示。再经过转换和生成步骤,生成目标语言。多语多策略机器翻译是本发明集成关键核心技术,其功能是实现对不同语种、不同专业、不同表示形式的文本信息的快速高效翻译处理。为了确保知识的一致性,实现多种知识之间的相互转换,实现多种机器翻译方法的有机融合,提高翻译系统性能,本发明在有效利用已有的基于SC文法规则的智能机器翻译技术基础上,充分发挥规则分析的现有技术优势,同时集成基于实例类比推理的机器翻译方法,以及对各种语言现象的统计信息,实现多种翻译策略的有机融合,提高实际翻译系统的翻译质量与速度。同时还将基于规则分析方面的积累,实现多种翻译知识的动态转换,确保系统处理能力的不断提升。
本发明提供的实现多语种信息交流系统主要包括以下几个部分:
1.多种翻译策略的有机集成和交叉应用
2.基于规则方法的分析转换机制
3.实例模式的启发式类比匹配
4.实例模式的类比译文生成
下面,将详细描述本发明提供的实现多语种信息交流系统的总体模块设计及实现。
为了有机地集成多种翻译策略,本发明提供的实现多语种信息交流系统主要基于规则分析方法和类比推理方法,结合语料统计知识,根据处理速度和可信度等因素,由系统对多个可能的处理结果进行优化和选择。
在翻译处理过程中,系统首先在实例库中精确匹配,以期利用以往知识直接得到翻译结果。否则,在求得该语句模式之后,基于启发式信息查找近似模式,采用基于多特征相容匹配的语句相似度计算方法,通过类比推理构造满足经验阈值要求的翻译结果。与此同时,利用基于规则的分析方法构造翻译结果。系统根据两种方法的处理效果和效率择优选取,提高了机器翻译的质量与速度。系统采取多重保护措施和检验机制,确保各类知识库的正确性。多策略机器翻译的功能结构如图1所示。
●启发式类比匹配
若只对实例模式进行精确匹配,其处理能力十分有限。而采用近似类比推理的翻译,不但需要建立能够深刻描绘语言知识的模式库,而且需要合理计算两种语言模式之间的相似程度并基于类比推理构造机器翻译译文。
1)、找相似模式
本发明提供的实现多语种信息交流系统,采用基于多层次特征的相似度计算输入语句与实例模式源文的相似度,从而建立二者的类比映射关系,通常这个映射是一个近似映射关系。
本发明提供的实现多语种信息交流系统,综合考察语句在词法、语法和语义三个语言层次特征的相似度,合理扩展了语句相似度的度量尺度。算法不仅考虑词的局部相似性,还从语句整体出发,宏观考察语句在整体上的相似情况,从而提高了相似度计算的性能,提高了基于实例翻译的处理能力。
2)、建立类比相似关系
本发明提供的实现多语种信息交流系统,采用基于多层次模板的双语语句词对齐方法建立实例模式源文译文的双语词对齐关系,从而实现对当前实例模式的翻译模式分析,为类比译文转换奠定基础。
本发明提供的实现多语种信息交流系统,在对齐处理中借助词汇、短语和子句三个层次的模板,通过词法标注和模板匹配,建立双语语句实词间的对应关系。方法不依赖于大规模双语语料库,因此非常适合在多策略机助翻译系统中应用;算法只需要一部双语词典、一部语义词典和少量的语言模板,从而降低了语言分析的复杂度,提高了双语词对应的效率。
3)、多策略译文生成
基于规则的分析方法依赖对原文的理解结果构造译文,实例推理方法基于相似情况进行推理替换,而语料库统计方法基于最大可能原则选择结果,其依赖知识、生成基础各不相同。为了提高多策略机器翻译的译文质量,系统采用并行处理技术,以规则分析和类比推理两种方法为主,结合统计知识,各种机器翻译方法并行工作,最后从多个译文中选择最优结果。多策略机器翻译译文生成处理原理如图2所示。
图2中,RBS表示规则知识库,RBMT表示基于规则的机器翻译引擎,FCBS表示实例模式库,HATM表示基于启发式类比的翻译处理引擎,SBK表示统计知识库。
多策略机器翻译系统的实现主要考虑以下处理因素:
记忆搜索函数:搜索成功将启动启发式类比翻译处理机制实现多策略的机器翻译译文生成,否则多策略机器翻译系统通过基于规则的语言生成技术实现多策略的机器翻译译文生成。
相似度阈值:超过相似度阈值的类比构造译文优先输出。
译文可信度:在基于规则的机器翻译译文可信度高时优选基于规则的机器翻译译文输出。
缺省处理:上述条件都不满足时,输出基于规则机器翻译译文。
图3示出了本发明提供的实现多语种信息交流系统的结构示意图。该系统采用浏览器/服务器(B/S)结构,包括一服务器端和至少一客户端,该客户端包括至少一显示设备和至少一输入设备,该客户端通过因特网、内部局域网或数据线连接于该服务器端。客户端的输入设备将某一语种信息通过因特网、内部局域网或数据线输出给服务器端,服务器端对接收的该语种信息进行翻译,得到另一语种信息,并将该另一语种信息通过因特网、内部局域网或数据线输出给客户端的显示设备进行显示,实现多语种信息之间的相互交流。
该客户端的输入设备将某一语种信息通过因特网、内部局域网或数据线输出给服务器端的同时,在客户端的显示设备上显示该语种信息。
该服务器端包括一机器翻译引擎、一实例模式库、一规则知识库、一统计知识库、一译文优选模块和一翻译结果输出模块,该机器翻译引擎进一步包括一基于规则的机器翻译子引擎和一基于启发式类比的翻译处理子引擎。其中,实例模式库、规则知识库、统计知识库和译文优选模块分别连接于机器翻译引擎,翻译结果输出模块直接或者通过译文优选模块间接连接于机器翻译引擎。
该服务器端在接收到客户端输入的某一语种信息后,机器翻译引擎先在实例模式库中对该语种信息进行精确匹配,如果匹配成功,能够在实例模式库中查找到与该语种信息相一致的信息,则直接获取翻译结果,并通过翻译结果输出模块将翻译结果输出给客户端的显示设备;如果匹配失败,则采用并行处理技术,机器翻译引擎调用自身基于规则的机器翻译子引擎和基于启发式类比的翻译处理子引擎,同时对接收自客户端的某一语种信息分别进行翻译处理,基于规则的机器翻译子引擎和基于启发式类比的翻译处理子引擎将各自的翻译结果输出给译文优选模块,译文优选模块调用统计知识库择优选择翻译结果,并通过翻译结果输出模块将选择的翻译结果输出给客户端的显示设备。
上述该机器翻译引擎调用基于启发式类比的翻译处理子引擎对接收自客户端的某一语种信息进行翻译处理,具体包括:
机器翻译引擎预先采用基于多层次模板的双语语句词对齐方法,建立实例模式源文译文的双语词对齐关系,实现对当前实例模式的翻译模式分析,为启发式类比译文转换奠定基础;
基于启发式类比的翻译处理子引擎在对接收自客户端的某一语种信息进行翻译处理时,采用基于多层次特征的相似度计算方法,计算接收自客户端的某一语种信息与实例模式源文的相似度,建立接收自客户端的某一语种信息与实例模式源文的类比映射关系;
基于启发式类比的翻译处理子引擎根据建立的该类比映射关系,采用类比推理方法构造机器翻译译文。
上述该机器翻译引擎调用基于规则的机器翻译子引擎对接收自客户端的某一语种信息进行翻译处理,具体包括:基于规则的机器翻译子引擎在对接收自客户端的某一语种信息进行翻译处理时,先对接收的源语言文本进行语法和语义分析,生成深层源语言表示,然后基于规则知识库对生成的深层源语言表示进行转换,生成目标语言深层表示,再基于规则知识库将目标语言深层表示转换成目标语言文本,形成机器翻译译文。
在实际应用中,该服务器端一般为一运行有多语种多策略机器翻译软件的系统主机。该显示设备一般为显示器;该输入设备一般为键盘,或者为鼠标,或者为键盘和鼠标。
另外,该系统进一步包括一服务器维护终端,连接于服务器端,用于对服务器端进行维护和日志管理,更新服务器端中各数据库保存的信息。该服务器端进一步包括一人机互动组件,连接于服务器维护终端,实现服务器维护终端与服务器端之间的交互。
该某一语种信息及另一语种信息中的语种,至少为中文、英文、日文、法文、俄文和西班牙文中的任意一种。
以下举具体的实施例,将本发明提供的实现多语种信息交流的系统与具体的邮政服务相结合,并参照附图,对本发明进一步详细说明。
如图4所示,图4是依照本发明实施例提供的实现多语种信息交流系统的结构示意图。外宾和工作人员通过客户端登录实现多语种信息交流的系统(即多语信息翻译平台),该多语信息翻译平台将各自输入的内容进行翻译后显示在客户端显示设备(例如显示器)上,以达到在语言不通的情况下仍能顺畅交流的目的。
多语信息翻译平台可以在内部网中搭建,内部网中的终端均可以登录该平台进行交流,通过开放权限也可以实现外网用户的访问及使用。另外,该多语信息翻译平台还可以以单机形式实现。
多语信息翻译平台在内部网中搭建时,客户端通过内部局域网连接于服务器端。多语信息翻译平台通过开放权限实现外网用户的访问及使用时,客户端通过因特网连接于服务器端。多语信息翻译平台以单机形式实现时,客户端通过数据线连接于该服务器端。
多语信息翻译平台简单易用。首页为欢迎及语种选择界面,在首页用多个语言列出登录链接,在进入主界面的同时也进行了语言的选择,例如,点击日语的登录链接,进入后界面外宾部分语言及提示为日语,外宾输入日语后,点击翻译即可翻译成汉语,工作人员就可以看到经过翻译的外宾信息,此时工作人员就可以用中文回答外宾的提问,输入完成后,点击发送即可将文字翻译成日文并显示,实现了即时的交流。
本实施例提供的实现多语种信息交流的系统有三类用户:外宾、接待人员和系统管理员。这些用户一般有如下几种使用方式:
外宾和接待人员:是该平台的主要使用者,使用该平台实现使用不同语言人员的顺畅交流;
系统管理人员:可以使用用户字典和日志管理功能。通过使用用户字典管理平台对邮政专有术语进行管理,以达到逐步优化翻译质量的目的;通过使用日志管理功能可以查询和管理日志。因此,该类人员需要对系统的运行机制很熟悉,而且直接参与系统运行。
对于整个平台来说,重要的是功能及界面的友好性,客户端的操作应该越简单越好,采用B/S模式进行设计,客户端只需要普通的浏览器就可以,大部分功能实现在中间服务上进行。
本系统的最终用户都是在浏览器中进行的操作,因此所有的功能都是部署在网站程序上,具体的分层关系如下:
Figure A20081022295600151
在本实施例中,本发明提供的实现多语种信息交流的系统能够实现以下功能:
1、多语即时翻译功能
此项功能为本系统的主要功能,主要是为外宾和工作人员提供一个交流的平台,将外宾和工作人员的交流内容进行翻译,以达到相互理解和交流的目的。本系统是基于B/S结构,用户只要输入相应网页的URL地址即可进入平台,选择好语言方向,输入交流内容,点击翻译提交,多语言翻译引擎便可以自动地把该内容翻译为对方的语言并显示。翻译的语言方向包括英语←→汉语、日语←→汉语、俄语←→汉语、法语←→汉语、西班牙语←→汉语等。
2、邮政语言库的建立
增加邮政专用语及相关语料,可以大幅提高在邮政语境下的翻译质量。项目组整理、研发,完成了邮政语言库的开发工作,即相关专业词汇的添加、语料的调试、特殊句型的处理。已添加邮政专业词汇1591个,包括邮政日常用语、服务用语、专业术语及奥运用语等方面的词汇。调试语料3000多句,主要涉及到函件业务、报刊订阅、邮政储蓄、窗口投递、奥运及体育等方面的句型语料。修改规则360多条,主要处理了名词句型和动名词句型。提高翻译质量,需要不断丰富邮政语言库的内容,这是一项长期的工作,我们将根据用户会话记录,不断地添加邮政用语,使平台更适合于窗口服务。
3、用户字典功能
该功能主要是为用户提供一个专业术语添加管理的平台,可以不断的充实翻译系统的专业词汇,翻译质量可以逐步提高。此工具只在服务器端部署使用。
管理员可以不断地积累常用的专有词汇,通过用户字典平台添加到翻译服务器上,在翻译时优先考虑用户字典中的译文,以提供更加准确、专业的翻译。
管理员可以添加和删除词汇,也可以对整个用户字典进行导出、导入和清空的操作,这样就可以轻松的对用户字典进行备份和迁移了。
本发明提供的实现多语种信息交流的系统,其开发需求与思路是来自邮政行业服务的实际需求。随着世界全球一体化进程的加快,语言沟通成为一切政治、经济活动开展的根本。该系统可实现并满足了邮政服务与国际沟通的需求,解决语言交流即可有效开展多层次业务合作,
本发明提供的实现多语种信息交流的系统,是针对奥运服务开发的,但也不仅仅服务适用于奥运,它为今后邮政形象与服务质量的提升提供了长期的语言保障,同时本系统也可根据业务的具体进展而加以细化与完善。随着奥运的召开,中国与世界的交流会进一步加深,因而本系统语言翻译功能的实际应用将是长期与持续的。具体到邮政各级服务人员,可将语言的学习融会到实际工作中,工作的同时日积月累的增强语言交流的能力。
本发明提供的实现多语种信息交流系统的开发及应用,充分体现了科技奥运理念,并解决了实际服务工作中的语言难题,有着良好效果。但它又不仅仅针对奥运,它的开发,大大提升了涉外服务质量。也为今后的涉外服务提供了有效的技术手段。由此可见,邮政多语互译平台的开发意义重大。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1、一种实现多语种信息交流的系统,其特征在于,该系统采用浏览器/服务器(B/S)结构,包括一服务器端和至少一客户端,该客户端包括至少一显示设备和至少一输入设备,该客户端通过因特网、内部局域网或数据线连接于该服务器端;
客户端的输入设备将某一语种信息通过因特网、内部局域网或数据线输出给服务器端,服务器端对接收的该语种信息进行翻译,得到另一语种信息,并将该另一语种信息通过因特网、内部局域网或数据线输出给客户端的显示设备进行显示,实现多语种信息之间的相互交流。
2、根据权利要求1所述的实现多语种信息交流的系统,其特征在于,该客户端的输入设备将某一语种信息通过因特网、内部局域网或数据线输出给服务器端的同时,在客户端的显示设备上显示该语种信息。
3、根据权利要求1所述的实现多语种信息交流的系统,其特征在于,该服务器端包括一机器翻译引擎、一实例模式库、一规则知识库、一统计知识库、一译文优选模块和一翻译结果输出模块,该机器翻译引擎进一步包括一基于规则的机器翻译子引擎和一基于启发式类比的翻译处理子引擎;
其中,实例模式库、规则知识库、统计知识库和译文优选模块分别连接于机器翻译引擎,翻译结果输出模块直接或者通过译文优选模块间接连接于机器翻译引擎。
4、根据权利要求3所述的实现多语种信息交流的系统,其特征在于,该服务器端在接收到客户端输入的某一语种信息后,机器翻译引擎先在实例模式库中对该语种信息进行精确匹配,如果匹配成功,能够在实例模式库中查找到与该语种信息相一致的信息,则直接获取翻译结果,并通过翻译结果输出模块将翻译结果输出给客户端的显示设备;如果匹配失败,则采用并行处理技术,机器翻译引擎调用自身基于规则的机器翻译子引擎和基于启发式类比的翻译处理子引擎,同时对接收自客户端的某一语种信息分别进行翻译处理,基于规则的机器翻译子引擎和基于启发式类比的翻译处理子引擎将各自的翻译结果输出给译文优选模块,译文优选模块调用统计知识库择优选择翻译结果,并通过翻译结果输出模块将选择的翻译结果输出给客户端的显示设备。
5、根据权利要求4所述的实现多语种信息交流的系统,其特征在于,该机器翻译引擎调用基于启发式类比的翻译处理子引擎对接收自客户端的某一语种信息进行翻译处理,具体包括:
机器翻译引擎预先采用基于多层次模板的双语语句词对齐方法,建立实例模式源文译文的双语词对齐关系,实现对当前实例模式的翻译模式分析,为启发式类比译文转换奠定基础;
基于启发式类比的翻译处理子引擎在对接收自客户端的某一语种信息进行翻译处理时,采用基于多层次特征的相似度计算方法,计算接收自客户端的某一语种信息与实例模式源文的相似度,建立接收自客户端的某一语种信息与实例模式源文的类比映射关系;
基于启发式类比的翻译处理子引擎根据建立的该类比映射关系,采用类比推理方法构造机器翻译译文。
6、根据权利要求4所述的实现多语种信息交流的系统,其特征在于,该机器翻译引擎调用基于规则的机器翻译子引擎对接收自客户端的某一语种信息进行翻译处理,具体包括:
基于规则的机器翻译子引擎在对接收自客户端的某一语种信息进行翻译处理时,先对接收的源语言文本进行语法和语义分析,生成深层源语言表示,然后基于规则知识库对生成的深层源语言表示进行转换,生成目标语言深层表示,再基于规则知识库将目标语言深层表示转换成目标语言文本,形成机器翻译译文。
7、根据权利要求3所述的实现多语种信息交流的系统,其特征在于,该服务器端为一运行有多语种多策略机器翻译软件的系统主机。
8、根据权利要求1所述的实现多语种信息交流的系统,其特征在于,该显示设备为显示器;该输入设备为键盘,或者为鼠标,或者为键盘和鼠标。
9、根据权利要求1所述的实现多语种信息交流的系统,其特征在于,该系统进一步包括一服务器维护终端,连接于服务器端,用于对服务器端进行维护和日志管理,更新服务器端中各数据库保存的信息;
该服务器端进一步包括一人机互动组件,连接于服务器维护终端,实现服务器维护终端与服务器端之间的交互。
10、根据权利要求1所述的实现多语种信息交流的系统,其特征在于,该某一语种信息及另一语种信息中的语种,至少为中文、英文、日文、法文、俄文和西班牙文中的任意一种。
CN200810222956A 2008-09-24 2008-09-24 实现多语种信息交流的系统 Pending CN101686234A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810222956A CN101686234A (zh) 2008-09-24 2008-09-24 实现多语种信息交流的系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810222956A CN101686234A (zh) 2008-09-24 2008-09-24 实现多语种信息交流的系统

Publications (1)

Publication Number Publication Date
CN101686234A true CN101686234A (zh) 2010-03-31

Family

ID=42049206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810222956A Pending CN101686234A (zh) 2008-09-24 2008-09-24 实现多语种信息交流的系统

Country Status (1)

Country Link
CN (1) CN101686234A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567310A (zh) * 2010-12-17 2012-07-11 张龙哺 基于智能知识库的网络化人工智能翻译系统及其翻译方法
CN104462074A (zh) * 2014-12-26 2015-03-25 北京奇虎科技有限公司 一种进行网页数据翻译的方法、装置和浏览器客户端
CN104834633A (zh) * 2015-05-29 2015-08-12 厦门大学 一种云翻译输入法及系统
CN107293297A (zh) * 2017-06-29 2017-10-24 深圳双猴科技有限公司 一种一对多麦克风控制方法及系统
CN107943798A (zh) * 2017-11-23 2018-04-20 深圳哇哇鱼网络科技有限公司 检查输入文本语言并自动同步翻译的系统及方法
CN110008468A (zh) * 2019-03-04 2019-07-12 广州虎牙信息科技有限公司 语言系统管理方法、信息转换方法、服务器以及存储介质
CN111401085A (zh) * 2020-04-24 2020-07-10 南京莱科智能工程研究院有限公司 基于混合策略的移动设备机器翻译系统
CN111753560A (zh) * 2020-06-28 2020-10-09 语联网(武汉)信息技术有限公司 一种并行多源输入方式下的自适应翻译系统
CN112818708A (zh) * 2021-01-19 2021-05-18 传神语联网网络科技股份有限公司 多终端多语种视频会议的语音翻译实时处理系统与方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567310A (zh) * 2010-12-17 2012-07-11 张龙哺 基于智能知识库的网络化人工智能翻译系统及其翻译方法
CN102567310B (zh) * 2010-12-17 2016-08-31 张龙哺 基于智能知识库的网络化人工智能翻译系统及其翻译方法
CN104462074A (zh) * 2014-12-26 2015-03-25 北京奇虎科技有限公司 一种进行网页数据翻译的方法、装置和浏览器客户端
CN104462074B (zh) * 2014-12-26 2018-04-10 北京奇虎科技有限公司 一种进行网页数据翻译的方法、装置和浏览器客户端
CN104834633A (zh) * 2015-05-29 2015-08-12 厦门大学 一种云翻译输入法及系统
CN107293297A (zh) * 2017-06-29 2017-10-24 深圳双猴科技有限公司 一种一对多麦克风控制方法及系统
CN107943798A (zh) * 2017-11-23 2018-04-20 深圳哇哇鱼网络科技有限公司 检查输入文本语言并自动同步翻译的系统及方法
WO2019101004A1 (zh) * 2017-11-23 2019-05-31 深圳哇哇鱼网络科技有限公司 检查输入文本语言并自动同步翻译的系统及方法
CN110008468A (zh) * 2019-03-04 2019-07-12 广州虎牙信息科技有限公司 语言系统管理方法、信息转换方法、服务器以及存储介质
CN111401085A (zh) * 2020-04-24 2020-07-10 南京莱科智能工程研究院有限公司 基于混合策略的移动设备机器翻译系统
CN111753560A (zh) * 2020-06-28 2020-10-09 语联网(武汉)信息技术有限公司 一种并行多源输入方式下的自适应翻译系统
CN111753560B (zh) * 2020-06-28 2024-05-10 语联网(武汉)信息技术有限公司 一种并行多源输入方式下的自适应翻译系统
CN112818708A (zh) * 2021-01-19 2021-05-18 传神语联网网络科技股份有限公司 多终端多语种视频会议的语音翻译实时处理系统与方法
CN112818708B (zh) * 2021-01-19 2023-09-08 传神语联网网络科技股份有限公司 多终端多语种视频会议的语音翻译实时处理系统与方法

Similar Documents

Publication Publication Date Title
CN101686234A (zh) 实现多语种信息交流的系统
CN201255881Y (zh) 实现多语种信息交流的系统
JPH02291076A (ja) 自然言語解析装置
CN108491399A (zh) 基于语境迭代分析的汉译英机器翻译方法
CN1492354A (zh) 多国文字信息搜索方法和多国文字信息搜索引擎系统
Boguslavsky et al. Creating a Universal Networking Language module within an advanced NLP system
Kouremenos et al. A prototype Greek text to Greek Sign Language conversion system
Sun [Retracted] Analysis of Chinese Machine Translation Training Based on Deep Learning Technology
Tahir et al. Knowledge based machine translation
Strong 1973 student paper award. An alogorithm for generating structural surrogates of english text
Bick Dan2eng: wide-coverage Danish-English machine translation
Lamba et al. Answer-agnostic question generation in privacy policy domain using sequence-to-sequence and transformer models
Iswarya et al. Adapting hybrid machine translation techniques for cross-language text retrieval system
CN1296588A (zh) 开放式全息模板式人机对话语言翻译方法及全息语义标注系统
Yan et al. A corpus-based approach to linguistic function
Hettige et al. Existing systems and approaches for machine translation: A review
Guo et al. A review of the development and application of natural language processing
Zou [Retracted] Analysis of Machine Translation and Post‐Translation Editing Ability Using Semantic Information Entropy Technology
Sun Online algorithm design of english translation of film and television works under the background of media cultural information
Zhang et al. Research on the Application of Computer Artificial Intelligence Machine Translation System in the Sci-tech Journals
Liu A Corpus-Based Study on Nanchang Red Tourism Translation under the Background of the “100th Anniversary of the Founding of the Communist Party of China”
Zhai Application of Artificial Intelligence Technology in Tourism English Translation
Sun A Study on the Application of Computer-assisted Translation in Henan Museum Translation
Zhang Comparison between Human Translation and Machine Translation in Translating the Publicity Text of Haihunhou Museum
Zeng The Design of English Translation Software Based on Machine Learning Technology

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100331