CN102567310B - 基于智能知识库的网络化人工智能翻译系统及其翻译方法 - Google Patents
基于智能知识库的网络化人工智能翻译系统及其翻译方法 Download PDFInfo
- Publication number
- CN102567310B CN102567310B CN201010593281.8A CN201010593281A CN102567310B CN 102567310 B CN102567310 B CN 102567310B CN 201010593281 A CN201010593281 A CN 201010593281A CN 102567310 B CN102567310 B CN 102567310B
- Authority
- CN
- China
- Prior art keywords
- translation
- sentence
- bilingual
- service end
- clause
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
基于智能知识库的网络化人工智能翻译系统,包括:一个翻译服务端和至少一个翻译客户端,其特征在于:所述翻译服务端包括智能翻译知识库;所述翻译客户端包括词库;所述翻译客户端通过计算机网络与所述翻译服务端联接;所述翻译客户端将当前要翻译的句子发送到所述翻译服务端;所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句式,并将所检索出的最接近的双语句式返回给所述翻译客户端;所述翻译客户端对所述的双语句式进行智能翻译处理,得出所述要翻译句子的译文。
Description
发明领域
本发明涉及计算机翻译技术领域、人工智能计算机翻译技术和网络翻译技术(云翻译技术),更具体地,涉及基于智能知识库的网络化人工智能翻译系统。
发明背景
自从上个世纪30年代,人们就提出了机器翻译的设想。随着计算机技术的发展,先后出现了各种类型的计算机翻译系统和技术,比如ED(电子词典)、MT(机器翻译)、TM(翻译存储器)、IT(交互翻译)和CAT(计算机辅助翻译)等等。
这些系统分别用不同的方法针对自然语言的某些方面进行语言转换工作。其中,电子词典只能对单词进行翻译或查找。
传统的MT技术是基于语法规则对语言进行转换,其中语法规则是语言专家撰写的,并由程序员写在翻译程序中的,它只能由程序员添加和修改。由于语言的丰富性和灵活性,靠少量的语法规则是不可能覆盖所有的语言现象的。因此传统的MT技术不能获得好的翻译质量,尤其是针对长句子和句型复杂的句子。
随着计算机运算速度和记录介质的存储容量的迅速提高,人们于上世纪90年代提出了基于统计的翻译技术,即翻译存储器技术(TM)。其基本思路是海量存储双语句对,对于已经翻译过或已存储的原文句子,只要提取出相应的译文,就能得到准确的翻译结果。因此,TM技术为计算机翻译技术指出了一条高质量准确翻译的方向。
图1A示出传统的采用TM翻译技术的翻译方案。其中,TM翻译模式将输入的原文句子与语料库的双语句对的原文部分相比较(匹配)。如果完全匹配或满足规定的匹配率,则将双语句对的译文部分作为TM翻译结果输出。对于不完全匹配的句子,传统的TM翻译系统只能给出所记忆的最接近的参考例句,不能解决不匹配部分的准确翻译问题。
图1B显示了传统的句对记录方法所记录的句对例子。即在左边部分记录原文,在右边部分记录译文,中间用分隔符分开。其中,原文和译文都是常规的文字内容,即单词(字)、标点符号等。其中,除了原文与译文之间的分隔符之外,不存在其它用于帮助翻译的信息。因此,这种句对的作用是非常有限的。也就是说,除了相同的句子能给出准确的翻译结果外,对于类似的句子也不能给出准确的翻译结果。
比如,在语料库中记忆了图1B所示的句对:
he bought a gold_watch for his wife.^他为他的妻子买了一块金表。
如果当前要翻译的句子为:
I bought a gold-ring for my wife.
采用TM匹配翻译,系统给出的结果只能是上面所示句对中的译文结果,即“他为他的妻子买了一块金表”。因此,该结果只能作为参考,还必须人工修改才能得到正确的结果:“我为我的妻子买了一个金戒指。”。
因此,使用传统的TM技术,就必须积累所有可能出现的句子和翻译句对。但由于语言的灵活性和丰富性,以及各个作者写作的随意性,要积累某种翻译语言对中所有句子几乎是不可能完成的事情。这是因为所说句子量是无限的或不可估量的。在实践中,我们在某个专业中积累了几十万个句对,花费了许多人力和财力,但在进行翻译测试时,只有千分之几的覆盖率。因此,TM计算机翻译技术又碰到了巨大的障碍。由此,人们反过来又想起传统MT技术的好处了,即用少量的语法规则或句型来覆盖更多的句子。或者将MT技术与TM技术结合起来,形成多策略的翻译技术。
另外,近几年也出现了一些TM改进技术,比如将句型用于TM技术方案,其目的是用句型库中存储的句型来覆盖更多的句子。其原理是将翻译的例句抽象成为一个句型,在翻译时也先将要翻译的句子进行语法分析并抽象为一个语法树结构,然后再用上述句型与要翻译的句子进行译文的创建(翻译)。这种方法实际上又回到了传统MT技术的老路上,首先是因为将例句抽象成语法句型是一件很费时且费力的工作,而且不能自动进行。目前还没有看到实用化的句型积累方法和工具。
发明内容
本申请的发明人,基于多年对人类大脑的翻译思维以及外语学习和记忆的研究,提出了一整套模拟人脑记忆和存储翻译知识的体系,即博典(Bodian)智能化知识库体系,及其相应的超级智能计算机翻译技术(TM++)。该智能化知识库体系中,句对不是简单的原文加译文形式,也不是上面所说的抽象化句型,而一种基于实例的模式化句对,或者称为模式化的实例。该模式化句对的优点是:1、将复杂抽象的语法具体化和实例化,便于理解和实施;2、在智能化翻译技术中,该模式化句对非常适用,因为它兼翻译实例和翻译句型于一体,既保留具体翻译句对的独特性又具有翻译句型的普遍性。具体可参见图2B和2C显示的基于实例的模式化句对(简称为模式化句对)的一些例子。在本申请中,为了更简化,上述基于实例的模式化句对可简称为“句式”。
本申请的发明人还发明了多种方法、装置和系统来实现所述智能化知识库体系和应用所述智能化知识库体系。利用这些突破了计算机智能翻译的跨世纪技术难关的方法和系统,可将智能化知识库的知识积累面向所有用户,用户可以随时更新,知识库不固化于软件中。这彻底摆脱了传统翻译软件由语言专家制定翻译规则或句型并由软件专业技术人员写入或更新的束缚,并将大大加快智能化知识库的开发和完善速度。因此,为早日实现高质量的全自动机器翻译提供了可行的技术解决方案。
进一步,本申请人还提出了共建共享、协同作业的方法来快速积累专业人士的高智力翻译成果的思路。
本申请的发明目的是要提供一种基于智能知识库的网络化人工智能翻译系统及其翻译方法。利用该系统和方法,通过共建共享机制,可以快速地积累专业人士的高智力翻译成果。并且在提高译者的翻译效率和质量的同时,还能快速提高计算机自动翻译质量。
按照本发明的一方面的基于智能知识库的网络化人工智能翻译系统,包括:一个翻译服务端和至少一个翻译客户端,其特征在于:所述翻译服务端包括智能翻译知识库;所述翻译客户端通过计算机网络与所述翻译服务端联接;所述翻译客户端将当前要翻译的句子发送到所述翻译服务端,所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句式,并对所述双语句式进行智能翻译处理,得出所述要翻译句子的译文,并将所述译文返回给所述翻译客户端。
按照本发明的另一方面的基于智能知识库的网络化人工智能翻译系统,包括:一个翻译服务端和至少一个翻译客户端,其特征在于:所述翻译服务端包括智能翻译知识库;所述翻译客户端包括词库;所述翻译客户端通过计算机网络与所述翻译服务端联接;所述翻译客户端将当前要翻译的句子发送到所述翻译服务端,所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句式,并将所检索出的最接近的双语句式返回给所述翻译客户端;所述翻译客户端对所述的双语句式进行智能翻译处理,得出所述要翻译句子的译文。
按照上述的基于智能知识库的网络化人工智能翻译系统,其特征在于,所述翻译服务端包括术语表,在接收到从翻译客户端发来的所述要翻译的句子时,在所述术语表中查找相关的术语,并在返回双语句式或译文的同时,还返回查找出来的相关的术语。
按照上述的基于智能知识库的网络化人工智能翻译系统,其特征在于,所述翻译客户端将确认的双语句式形式的翻译结果上传给翻译服务端。
用于上述的基于智能知识库的网络化人工智能翻译系统的翻译服务端,其特征在于,它包括基于智能知识库的翻译系统,其中配置有智能知识库和/或术语表,并可将翻译客户端上传的双语句式实时地记忆到所述智能知识库中。
用于上述的基于智能知识库的网络化人工智能翻译系统的翻译客户端。
按照本发明的一方面的基于智能知识库的网络化人工智能翻译系统的翻译方法,所述网络化人工智能翻译系统包括:一个翻译服务端和至少一个翻译客户端;所述翻译服务端包括智能翻译知识库;所述翻译客户端通过计算机网络与所述翻译服务端联接;其特征在于,所述翻译方法包括如下步骤:步骤S1,所述翻译客户端将当前要翻译的句子发送到所述翻译服务端;步骤S2,所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句式;步骤S3,所述翻译服务器对所述双语句式进行智能翻译处理,得出所述要翻译句子的译文,并将所述译文返回给所述翻译客户端。
按照本发明的另一方面的基于智能知识库的网络化人工智能翻译系统的翻译方法,所述网络化人工智能翻译系统包括:一个翻译服务端和至少一个翻译客户端;所述翻译服务端包括智能翻译知识库;所述翻译客户端包括词库;所述翻译客户端通过计算机网络与所述翻译服务端联接;其特征在于,所述翻译方法包括如下步骤:步骤S1,所述翻译客户端将当前要翻译的句子发送到所述翻译服务端;步骤S2,所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句对或双语句式,并将所检索出的最接近的双语句式返回给所述翻译客户端;步骤S3’,所述翻译客户端对所述的双语句式进行智能翻译处理,得出所述要翻译句子的译文。
按照上述的基于智能知识库的网络化人工智能翻译系统的翻译方法,其特征在于,还包括:步骤S4,翻译客户端将确认的双语句式形式的翻译结果上传给翻译服务端。
按照上述的基于智能知识库的网络化人工智能翻译系统的翻译方法,其中所述翻译服务端还包括术语表,其特征在于,所述翻译方法还包括:步骤S4’,所述翻译服务端在所述术语表中查找相关的术语,并在返回双语句对或双语句式的同时,还返回查找出来的相关的术语。
值得说明的是本申请人申请的名称为“双语句对模式化存储方法以及翻译方法和翻译系统”的中国专利申请200910162384.6号,以及名称为“模式化双语句对形成方法及其形成装置”的中国专利申请号200910180877.2的全部内容都作为参考引入到本申请中。
附图说明
图1A是传统TM计算机翻译技术解决方案的方框图。
图1B是用传统TM技术的句对示意图。
图2A是本发明中采用的基于智能知识库的翻译系统的一种实施例。
图2B显示了本发明中采用的智能知识库中双语模式化句对的例子。
图2C显示了本发明中采用的智能知识库中双语模式化句对的另一个例子。
图2D显示了本发明中采用的智能知识库中句式库的一个例子。
图2E显示了本发明中采用的智能知识库的神经网络中用于检索句式的索引表的一个例子。
图3是本发明中采用的基于智能知识库的翻译系统的另一种实施例。
图4显示了本发明的基本智能知识库的网络化人工智能翻译系统的第一实施例。
图5A是图4所示实施例的翻译方法的第一实施例的流程图。
图5B是图5A所示实施例的进一步实施例的流程图。
图5C是图5A所示实施例的另一个进一步实施例的流程图。
图6显示了本发明的基本智能知识库的网络化人工智能翻译系统的第二实施例。
图7A是图6所示实施例的翻译方法的第一实施例的流程图。
图7B是图7A所示实施例的进一步实施例的流程图。
图7C是图7A所示实施例的另一个进一步实施例的流程图。
图8是一个翻译客户端(软件)按第一模式操作的一个具体例子。
图9是一个翻译客户端(软件)按第二模式操作的一个具体例子。
下面将结合附图对本发明的各个方面及具体实施方式和实施例进行详细说明。
实施方式
参见图2A,其中显示了本发明中采用的基于智能知识库的翻译系统的一种实施例。
如图2A所示,本发明中采用的基于智能知识库的翻译系统,包括:匹配模块、智能翻译处理模块、智能知识库。所述智能知识库主要包括句式库、词库和神经网络。所述神经网络包括用于词库、句式库搜索的索引表以及词与句式的对应表等,以便快速地查找到所需的句式。
所述匹配模块接收输入的原文句子,以及来自句式库的所述双语模式化句对(句式),并将输入的原文句子与所述双语模式化句对中的原文部分进行匹配。如果匹配满足预定的匹配标准,则将原文句子和该双语模式化句对中的译文部分送到智能翻译处理模块。所述匹配可以是精确匹配、模糊匹配、单词匹配、句子匹配等。关于匹配和匹配标准的详细说明可参见本申请人申请的名称为“双语句对模式化存储方法以及翻译方法和翻译系统”的中国专利申请200910162384.6号中的详细描述。
借助于智能知识库中的词库,智能翻译处理模块对所述译文部分中的模式化单元进行智能翻译处理;并将完成所有智能翻译处理的所述译文的结果作为当前输入句的译文输出。所述智能翻译处理(即模式化单元翻译处理)是针对当前翻译句与匹配参考句之间不同之处,对模式化单元(可替换单元)进行的翻译替换处理,其目的是根据匹配的参考例句形成准确的翻译结果(译文)。
所述智能翻译处理包括:原文单元的词典查找、译文单元的替换操作。所述原文单元的词典查找可以是常规的词典查找步骤,即利用原文单元中的原文内容(比如单词、词组或短语等),在词典或词库中查找相应的释义和说明等内容,其中可包括词性、属性、特性等附加信息。所述的译文单元的替换操作即用上述查找到的释义替代模式化单元中的译文内容。如果所述释义有多个时,可选择第一个释义来进行替换操作。根据需要,所述的智能翻译处理还可包括相关原文信息替换操作和去模式化操作等。
根据需要,本系统也可直接输出句式(双语模式化句对)或其译文结果,比如在翻译服务器中,为了减少负荷,翻译服务器可直接输出句式,而让智能翻译处理放到翻译客户端去完成。
有关智能翻译处理的详细说明及相关的内容可参阅上述中国专利申请200910162384.6号。
另外,需要说明的是,在句式库中,可以存储句式(双语模式化句对),也可存储常规的句对。也就是说,本发明中所述的智能知识库是兼容常规句对的。
图2B显示了智能知识库中双语模式化句对的例子。具体为:
he bought a gold_watch for his wife.^{\he|0|他/}为{\his|5|他的/}{\wife|6|妻子/}买了一{\gold watch|3|金表/}。
在图2B的例子中,第二部分(译文)中具有模式化单元:{\he|0|他/}、{\his|5|他的/}、{\wife|6|妻子/}、{\gold watch|3|金表/}等。其它部分为非模式化单元,即常规单元。虽然在第一部分(原文)没有明显标出模式化单元,但在第二部分译文中的模式化单元所指第一部分(原文)的那些单词或词组被暗示为可替换的。它们是第0位的he、第5位的his、第6位的wife、第3位的gold-watch。
基于上述双语模式化句对(句式),只要识别不同的词/词组并在译文中相应位置处的可替换单元进行替换处理,最后去除多余信息,即可准确地得出如下各句以及类似的成千上万句子的译文:
1、I bought a gold-watch for my wife.^我为我妻子买了一金表。
2、I bought a gold-ring for my wife.^我为我妻子买了一戒指。
3、We bought a house for our parents.^我们为我们的父母买了一房子。
4、Jack bought a flight ticket for his girl friend.^杰克为他的女朋友买了一飞机票。
当然,在第一部分的记录的所述原文中,除了记录常规单元之外,也还可记录模式化单元。所述常规单元意指不可变的部分,即常规的原文。所述模式化单元意指可被替换的部分,即该部分原文可被其它内容替换。同理,所述常规单元和模式化单元的数量可以是任意的,它们是由句子的结构和翻译的需要而定的。
图2C显示了本发明中采用的智能知识库中双语模式化句对的另一个例子。在图2C中显示了在第一部分即原文中对模式化单元即可替换的单词或词组进行标注的例子。如图所示,标注方式如下:{\he|pron/}、{\gold_watch |noun/}、{\his|prond|/}、{\wife|noun|/}。当然还可采用其它的标注方式,其目的只要是利于被识别和被替换。
更多关于模式化句对(句式)的详细信息和相关信息可参考上述中国专利申请200910162384.6号。
图2C显示了本发明中采用的智能知识库中句式库的一个例子。其中显示了一个句式(模式化句对)列表。列表中每个句式前端具有相应的序号。当然,为了使上述句式能被更好地利用,在其中还可以记录一些附加信息,比如:该句的单元总数、修改标记、质量等级、用户名、更新日期、语种编号等等。所述附加信息可放在模式化句对的开头、结尾、或其它位置,只要它与所述模式化句对有对应关系。
所述智能知识库中的所述神经网络用于搜索句式库的索引表,例如,该表中包括各单词/词组与包含该单词/词组的句式构成的索引项,如图2E所示。在图2E中,显示了智能知识库的神经网络中用于检索句式的索引表的一个例子,为了清楚说明,其中只是选取了相关的一些条目。通过这些索引条目,可以很容易进行检索,例如:我们要检索与“I warn themnot to be late.”最匹配的句式。根据图2E的索引表,具有单词“I”的句式有001、009、010、014、019和021;具有单词“warn”的句式有014;具有单词“them”的句式有001;具有单词“late”的句式有014;其它依此类推。对上述各索引项进行归纳分析,可得到同时包含句子“I warn themnot to be late.”中最多单词数的句式是014。也就是说,与句子“I warn themnot to be late.”最匹配的句式为“I warn him not to be late.^{\I|0|我/}曾警告{\him|2|他/}不要迟到。”。找到该句式后,只要对差别之词“him”->“them”及其译文“他”->“他们”进行替换,就可得出准确的翻译结果(译文)。
图3显示了本发明中采用的基于智能知识库的翻译系统的另一种实施例。
在该实施例中,除了图2A所示实施例中的各个模块之外,还包括术语表功能模块,系统将输入的原文输入到术语表功能模块中,查找出该原文中的术语并将查找出的术语输出。
本发明中所述的术语是指特定专业或特定翻译项目中被指定为必须翻译成给定释义的词或词组,比如:AI-translation^人工智能翻译。在所述术语表中,记录了多个术语。
另外,在图3所示的实施例中,术语表功能模块的输出(即查找到的术语)还输出给智能翻译处理模块,以便用于智能翻译处理。
图4显示了本发明的基本智能知识库的网络化人工智能翻译系统的第一实施例。
从图4中可看出,本发明的基于智能知识库的网络化人工智能翻译系统包括一个翻译服务端(即安装有翻译服务端程序的计算机网络服务器,也理解为翻译服务端程序),多个翻译客户端(安装有翻译客户端程序的计算机终端或任意可联网的PC机,也可理解为翻译客户端程序)。翻译服务端包括一个或多个图2A或图3所示的基于智能知识库的智能翻译系统,其中配置有一个或多个智能知识库。翻译客户端可以是高级的翻译系统、简易的辅助翻译系统、或者就是一个浏览器。
所述翻译服务端,它包括基于智能知识库的翻译系统,其中可配置有智能知识库和/或术语表,并可将翻译客户端上传的双语句式实时地记忆到所述智能知识库中,即可对所述智能知识库进行实时更新。因此可实时地提高翻译质量。
当所述智能知识库的知识量达到很高时,可以采取云计算的翻译方法(即“云翻译”方法),比如采用多个翻译服务端分散地进行匹配翻译。
翻译客户端通过计算机网络与翻译服务端联接,其联接方式可以是有线方式或无线方式。翻译客户端与翻译服务端之间的通信可以采用TCP/IP协议或其它的通信协议。翻译客户端与翻译服务端之间的架构采用C/S架构。对于那些不需要上传翻译结果(双语句对或句式)的翻译客户端,则也可以采用B/S架构,即翻译客户端就可以是一个浏览器。
图5A显示了图4所示实施例的翻译方法的第一实施例的流程图。按照本发明该实施例的翻译方法,包括下列步骤:
步骤S1,所述翻译客户端将当前要翻译的句子发送到所述翻译服务端。当前要翻译的句子可以是通过翻译模块自动从要翻译的文章或资料中提取的,也可以是用户从要翻译的文章或资料中手动选择的,或者是用户在某个特定文本框(区域)中输入的。参见图8,其中,当前要翻译的句子为“With millions of people playing World of Warcraft,it is simplyimpossible for everyone to play together in the same place.”。
步骤S2,所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句式。针对如图8所示的具体实例,翻译服务器检索出的双语句式为:
With thousands of people playing network game,it is simply impossiblefor everyone to play together in the same place.^对于{\everyone|13|每个人/}来说,与{\thousands|1|数千/}{\people|3|人/}在{\same|19|相同的/}{\place|20|地方/}一起玩{\network|5|网络/}{\game|6|游戏/}简直就是{\impossible|11|不可能的事情/}。
步骤S3,所述翻译服务器对所述双语句式进行智能翻译处理,得出所述要翻译句子的译文,并将所述译文返回给所述翻译客户端。所述智能翻译处理可借助于智能知识库中的词库进行。对于上述要翻译的句子和匹配出的双语句式,只需将差别之处“network”和“game”->“Worldof Warcraft”的释义“网络”和“游戏”->“魔兽”进行替换,即可得出准确的译文。如图8所示,翻译服务端所得出并下传的翻译结果(译文)显示在翻译客户端的译文区(最上端的文本框),该翻译结果为:“对于每个人来说,与数百万人在相同的地方一起玩魔兽简直就是不可能的。”。从该翻译结果看,采用智能知识库的自动翻译结果是非常准确的。
图5B显示了图5A所示实施例的进一步实施例的流程图。其中,除了图5A所示的步骤S1至S3之外,还包括:
步骤S4:翻译客户端将确认的双语句式形式的翻译结果上传给翻译服务端。该步骤的实现可以是在用户确认翻译当前句时,自动执行的;也可以是用户为了上传而特别执行的。所述的双语句式可以是翻译客户端程序在用户翻译过程(特别是交互翻译过程)中依据单词的词义、词性和/或其它属性而产生的,用户不需要特别的操作。当然,用户也可对双语句式的产生过程进行控制,比如利用某个控制键来对某个词或词组是否变成可替换单元进行控制。有关双语句式的产生方法的详细描述可参阅本申请人申请的名称为“模式化双语句对形成方法及其形成装置”的中国专利申请号200910180877.2。
图5C显示了图5A所示实施例的另一个进一步实施例的流程图。其中,除了步骤S1至步骤S3之外,还包括:
步骤S4’,在接收到从翻译客户端发来的所述要翻译的句子时,所述翻译服务端在所述术语表中查找相关的术语,并在返回双语句对或双语句式的同时,还返回查找出来的相关的术语。具体实例,请参见图9,其中,在上述的译文框中显示的翻译服务器结果框中,可以看出术语“World of Warcraft^魔兽^SS”。其中“SS”是术语标志。
图6显示了本发明的基本智能知识库的网络化人工智能翻译系统的第二实施例。该实施例是图4所示实施例的改型,它与图4所示实施例的不同之处在于:翻译客户端也配置了智能知识库以及基于智能知识库的智能翻译系统,或者至少配置了智能翻译处理模块以及用于该模块的词库。由此,翻译客户端的功能增强了,可以对翻译服务端下传的双语句式进行智能翻译处理。采用这种资源配置结构,翻译服务端可以只下传双语句式,因此可省略模块智能翻译处理步骤,将该步骤下放(转移)到翻译客户端,因此翻译服务端的运行负载可有效降低。
图7A显示了图6所示实施例的翻译方法的第一实施例的流程图。按照本发明该实施例的翻译方法,包括下列步骤:
步骤S1,所述翻译客户端将当前要翻译的句子发送到所述翻译服务端。当前要翻译的句子可以是通过翻译模块自动从要翻译的文章或资料中提取的,也可以是用户从要翻译的文章或资料中手动选择的,或者是用户在某个特定文本框(区域)中输入的。参见图8,其中,当前要翻译的句子为“With millions of people playing World of Warcraft,it is simplyimpossible for everyone to play together in the same place.”。
步骤S2,所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句式,并将其返回给翻译客户端。针对如图8所示的具体实例,翻译服务器检索出的双语句式为:
With thousands of people playing network game,it is simply impossiblefor everyone to play together in the same place.^对于{\everyone|13|每个人/}来说,与{\thousands|1|数千/}{\people|3|人/}在{\same|19|相同的/}{\place|20|地方/}一起玩{\network|5|网络/}简直就是{\impossible|11|不可能的事情/}。
步骤S3’,所述翻译客户端对接收到的所述双语句式进行智能翻译处理,得出所述要翻译句子的译文。所述智能翻译处理可借助于智能知识库中的词库进行。对于上述要翻译的句子和匹配出的双语句式,只需将差别之处“network”和“game”->“World of Warcraft”的释义“网络”和“游戏”->“魔兽”进行替换,即可得出准确的译文。如图8所示,翻译服务端所得出的翻译结果显示在翻译客户端的译文区(最上端的文本框),该翻译结果为:“对于每个人来说,与数百万人在相同的地方一起玩魔兽简直就是不可能的。”。从该翻译结果看,采用智能知识库的自动翻译结果是非常准确的。
图7B显示了图7A所示实施例的进一步实施例的流程图。其中,除了图7A所示的步骤S1至S3’之外,还包括:
步骤S4:翻译客户端将确认的双语句式形式的翻译结果上传给翻译服务端。该步骤的实现可以是在用户确认翻译当前句时,自动执行的;也可以是用户为了上传而特别执行的。所述的双语句式可以是翻译客户端程序在用户翻译过程(特别是交互翻译过程)中依据单词的词义、词性和/或其它属性而产生的,用户不需要特别的操作。当然,用户也可对双语句式的产生过程进行控制,比如利用某个控制键来对某个词或词组是否变成可替换单元进行控制。有关双语句式的产生方法的具体细节可参阅中国专利申请号200910180877.2。
图7C是图7A所示实施例的另一个进一步实施例的流程图。其中,在步骤S2与步骤S3’之间,增加了下述步骤:
步骤S2’,在接收到从翻译客户端发来的所述要翻译的句子时,所述翻译服务端在所述术语表中查找相关的术语,并在返回双语句对或双语句式的同时,还返回查找出来的相关的术语。具体实例,请参见图9,其中,在上述的译文框中显示的翻译服务器结果框中,可以看出术语“Worldof Warcraft^魔兽^SS”。其中“SS”是术语标志。
图8显示了一个示例性的翻译客户端(软件)按第一模式操作的一个具体例子。在所述第一模式下,翻译客户端直接接收来自翻译服务端的翻译结果。其中,当前要翻译的句子为“With millions of people playingWorld of Warcraff,it is simply impossible for everyone to play together in thesame place.”。翻译结果为:“对于每个人来说,与数百万人在相同的地方一起玩魔兽简直就是不可能的。”
图9显示了一个示例性的翻译客户端(软件)按第二模式操作的一个具体例子。在所述第二模式下,翻译客户端接收来自翻译服务端下传的双语句式。在所示的具体翻译实例中,所述双语句式为:With thousandsof people playing network game,it is simply impossible for everyone to playtogether in the same place.^对于{\everyone|13|每个人/}来说,与{\thousands|1|数千/}{\people|3|人/}在{\same|19|相同的/}{\place|20|地方/}一起玩{\network|5|网络/}{\game|6|游戏/}简直就是{\impossible|11|不可能的事情/}。但为了清晰明了,在界面(译文区中)上将上述双语句式显示为:
With thousands of people playing network game,it is simply impossiblefor everyone to play together in the same place.
对于每个人来说,与数千人在相同的地方一起玩网络游戏简直就是不可能的事情。
在上述双语句式的译文部分用分隔符来表示可替换的单元(可替换单元的概念可参阅上述中国专利申请200910162384.6号。
当用户点击上述双语句式时,系统可借助于翻译客户端中所配置的智能知识库(词库)对上述双语句式进行智能翻译处理,从面得出当前翻译句的译文。参见图8,该译文为“对于每个人来说,与数百万人在相同的地方一起玩魔兽简直就是不可能的。”。
在图9中,还可看出,与所述双语句式一起,翻译服务端还下传了当前翻译句中的术语:“World of Warcraft^魔兽^SS”。其中“SS”是术语标志。
虽然上面对本申请的各个方面及实施方式和实施例进行了详细描述,但本申请的发明并不限制于此。本专业的技术人员可以做出各种变化、改形或修改。只要这些变化、改型或修改不脱离本发明的精神和原理,它们就应被包括在本发明的范围之内。
Claims (10)
1.一种基于智能知识库的网络化人工智能翻译系统,包括:一个翻译服务端和至少一个翻译客户端,其特征在于:
所述翻译服务端包括智能知识库;
所述翻译客户端通过计算机网络与所述翻译服务端联接;
所述翻译客户端将当前要翻译的句子发送到所述翻译服务端,所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句式,并对所述双语句式进行智能翻译处理,得出所述要翻译句子的译文,并将所述译文返回给所述翻译客户端。
2.一种基于智能知识库的网络化人工智能翻译系统,包括:一个翻译服务端和至少一个翻译客户端,其特征在于:
所述翻译服务端包括智能知识库;
所述翻译客户端包括词库;
所述翻译客户端通过计算机网络与所述翻译服务端联接;
所述翻译客户端将当前要翻译的句子发送到所述翻译服务端,所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句式,并将所检索出的最接近的双语句式返回给所述翻译客户端;
所述翻译客户端对所述的双语句式进行智能翻译处理,得出所述要翻译句子的译文。
3.按照权利要求1或2的基于智能知识库的网络化人工智能翻译系统,其特征在于,所述翻译服务端包括术语表,在接收到从翻译客户端发来的所述要翻译的句子时,在所述术语表中查找相关的术语,并在返回双语句式或译文的同时,还返回查找出来的相关的术语。
4.按照权利要求1或2的基于智能知识库的网络化人工智能翻译系统,其特征在于,所述翻译客户端将确认的双语句式形式的翻译结果上传给翻译服务端。
5.用于权利要求1或2的基于智能知识库的网络化人工智能翻译系统的翻译服务端,其特征在于,它包括基于智能知识库的翻译系统,其中配置有智能知识库和/或术语表,并可将翻译客户端上传的双语句式实时地记忆到所述智能知识库中。
6.用于权利要求1或2的基于智能知识库的网络化人工智能翻译系统的翻译客户端。
7.一种基于智能知识库的网络化人工智能翻译系统的翻译方法,所述网络化人工智能翻译系统包括:一个翻译服务端和至少一个翻译客户端;所述翻译服务端包括智能知识库;所述翻译客户端通过计算机网络与所述翻译服务端联接;其特征在于,所述翻译方法包括如下步骤:
步骤S1,所述翻译客户端将当前要翻译的句子发送到所述翻译服务端;
步骤S2,所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句式;
步骤S3,所述翻译服务器对所述双语句式进行智能翻译处理,得出所述要翻译句子的译文,并将所述译文返回给所述翻译客户端。
8.一种基于智能知识库的网络化人工智能翻译系统的翻译方法,所述网络化人工智能翻译系统包括:一个翻译服务端和至少一个翻译客户端;所述翻译服务端包括智能知识库;所述翻译客户端包括词库;所述翻译客户端通过计算机网络与所述翻译服务端联接;其特征在于,所述翻译方法包括如下步骤:
步骤S1,所述翻译客户端将当前要翻译的句子发送到所述翻译服务端;
步骤S2,所述翻译服务端利用接收到的要翻译的句子从所述智能知识库中检索出最接近的双语句对或双语句式,并将所检索出的最接近的双语句式返回给所述翻译客户端;
步骤S3’,所述翻译客户端对所述的双语句式进行智能翻译处理,得出所述要翻译句子的译文。
9.按照权利要求7或8的基于智能知识库的网络化人工智能翻译系统的翻译方法,其特征在于,还包括:
步骤S4,翻译客户端将确认的双语句式形式的翻译结果上传给翻译服务端。
10.按照权利要求7或8的基于智能知识库的网络化人工智能翻译系统的翻译方法,其中所述翻译服务端还包括术语表,其特征在于,所述翻译方法还包括:
步骤S4’,所述翻译服务端在所述术语表中查找相关的术语,并在返回双语句对或双语句式的同时,还返回查找出来的相关的术语。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010593281.8A CN102567310B (zh) | 2010-12-17 | 2010-12-17 | 基于智能知识库的网络化人工智能翻译系统及其翻译方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010593281.8A CN102567310B (zh) | 2010-12-17 | 2010-12-17 | 基于智能知识库的网络化人工智能翻译系统及其翻译方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102567310A CN102567310A (zh) | 2012-07-11 |
CN102567310B true CN102567310B (zh) | 2016-08-31 |
Family
ID=46412752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010593281.8A Active CN102567310B (zh) | 2010-12-17 | 2010-12-17 | 基于智能知识库的网络化人工智能翻译系统及其翻译方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102567310B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793322A (zh) * | 2012-11-05 | 2014-05-14 | 深圳中兴网信科技有限公司 | 一种针对软件本地化测试中翻译问题的检测方法及系统 |
CN103218354A (zh) * | 2013-03-28 | 2013-07-24 | 曾立人 | 一种在线翻译记忆交换方法和系统 |
CN104424179A (zh) * | 2013-08-30 | 2015-03-18 | 湖北金像无人航空科技服务有限公司 | 一种在网络论坛楼层内实现多语言人工翻译的方法 |
JP6226321B2 (ja) * | 2013-10-23 | 2017-11-08 | 株式会社サン・フレア | 翻訳支援システム、翻訳支援システムのサーバー、翻訳支援システムのクライアント、翻訳支援システムの制御方法、及びそのプログラム |
CN106528546A (zh) * | 2016-10-31 | 2017-03-22 | 用友网络科技股份有限公司 | 一种erp术语机器翻译方法 |
CN108519979A (zh) * | 2018-02-28 | 2018-09-11 | 成都优译信息技术股份有限公司 | 一种cat系统中翻译记忆库和mt结合的方法及系统 |
CN108491400A (zh) * | 2018-04-09 | 2018-09-04 | 江苏省舜禹信息技术有限公司 | 一种辅助翻译智能系统及方法 |
CN111008524A (zh) * | 2019-12-05 | 2020-04-14 | 网易(杭州)网络有限公司 | 语言翻译的处理方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06251057A (ja) * | 1993-02-23 | 1994-09-09 | Ibm Japan Ltd | 機械翻訳方法及び機械翻訳装置 |
CN1429370A (zh) * | 2000-05-17 | 2003-07-09 | 微软公司 | 将文本输入与词汇知识库相匹配并利用匹配结果的系统和方法 |
CN1652106A (zh) * | 2004-02-04 | 2005-08-10 | 北京赛迪翻译技术有限公司 | 基于语言知识库的机器翻译方法与装置 |
CN101430683A (zh) * | 2007-11-09 | 2009-05-13 | 英业达股份有限公司 | 翻译软件的词库切换系统及其方法 |
CN101686234A (zh) * | 2008-09-24 | 2010-03-31 | 北京市西区邮电局 | 实现多语种信息交流的系统 |
-
2010
- 2010-12-17 CN CN201010593281.8A patent/CN102567310B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06251057A (ja) * | 1993-02-23 | 1994-09-09 | Ibm Japan Ltd | 機械翻訳方法及び機械翻訳装置 |
CN1429370A (zh) * | 2000-05-17 | 2003-07-09 | 微软公司 | 将文本输入与词汇知识库相匹配并利用匹配结果的系统和方法 |
CN1652106A (zh) * | 2004-02-04 | 2005-08-10 | 北京赛迪翻译技术有限公司 | 基于语言知识库的机器翻译方法与装置 |
CN101430683A (zh) * | 2007-11-09 | 2009-05-13 | 英业达股份有限公司 | 翻译软件的词库切换系统及其方法 |
CN101686234A (zh) * | 2008-09-24 | 2010-03-31 | 北京市西区邮电局 | 实现多语种信息交流的系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102567310A (zh) | 2012-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102567310B (zh) | 基于智能知识库的网络化人工智能翻译系统及其翻译方法 | |
CN112199511B (zh) | 跨语言多来源垂直领域知识图谱构建方法 | |
CN107766371B (zh) | 一种文本信息分类方法及其装置 | |
Völkel et al. | Semantic wikipedia | |
CN110347894A (zh) | 基于爬虫的知识图谱处理方法、装置、计算机设备及存储介质 | |
CN110990590A (zh) | 一种基于强化学习和迁移学习的动态金融知识图谱构建方法 | |
EP1672537A2 (en) | Data semanticizer | |
De Beul et al. | An ontology for video human movement representation based on benesh notation | |
CN111222340A (zh) | 基于多标准主动学习的乳腺电子病历实体识别系统 | |
CN113177124A (zh) | 一种垂直领域知识图谱构建方法及系统 | |
CN105843793B (zh) | 在自动模型产生期间检测和创建合适行概念的方法和系统 | |
CN109376775A (zh) | 在线新闻多模态情感分析方法 | |
Dang et al. | MOOC-KG: A MOOC knowledge graph for cross-platform online learning resources | |
Li et al. | Automatic approach for constructing a knowledge graph of knee osteoarthritis in Chinese | |
CN116244344B (zh) | 基于用户需求的检索方法、装置以及电子设备 | |
CN114911893A (zh) | 基于知识图谱的自动化构建知识库的方法及系统 | |
Subramanian et al. | Development of multi-lingual models for detecting hope speech texts from social media comments | |
US10924551B2 (en) | IRC-Infoid data standardization for use in a plurality of mobile applications | |
CN116523041A (zh) | 装备领域知识图谱构建方法、检索方法、系统及电子设备 | |
CN102043773B (zh) | 模式化双语句对形成方法及其形成装置 | |
Huang et al. | Design knowledge graph-aided conceptual product design approach based on joint entity and relation extraction | |
Vargas-Vera et al. | MnM: A tool for automatic support on semantic markup | |
Patel et al. | GEDset: Automatic Dataset Builder for Machine Translation System with Specific Reference to Gujarati-English | |
Wang et al. | Evolution of the Internet’s Support for Chinese Enterprises’ Innovation Based on Big Data | |
Rheams | Creating an influencer-relationship model to locate actors in environmental communications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |