CN1237254A - 关于自动语言翻译的方法和装置 - Google Patents
关于自动语言翻译的方法和装置 Download PDFInfo
- Publication number
- CN1237254A CN1237254A CN97199304A CN97199304A CN1237254A CN 1237254 A CN1237254 A CN 1237254A CN 97199304 A CN97199304 A CN 97199304A CN 97199304 A CN97199304 A CN 97199304A CN 1237254 A CN1237254 A CN 1237254A
- Authority
- CN
- China
- Prior art keywords
- entry
- database
- nominal
- language
- descriptor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
语言翻译通过按照强制性的语法和构造成允许一种语言中的语言单元直接替代另一种语言中的对应的语言单元的词汇表来表示天然语言句子而被完成。最好是,词汇表被表示成一系列物理上和逻辑上有区别的数据库,每个包含的词条表示一种按语法定义的形式类。翻译即是在参考语言的词条和在一种和多种目标语言的对应词条之间的直接的查寻。
Description
发明的领域
本发明一般涉及自动语言翻译,特别涉及用于翻译按照严格的语法组合的受约束的语言结构。
发明的背景
自从运输工具的改进开始明显地降低越境贸易的不便和费用的时候起,通用的交流工具的客观需要就已经被认识。例如,在1960年,国际(社会)曾作出努力企图使世界语作为通用语言。当着此项努力最终失败了时,遍及世界的一百万到一千五百万的大量的流利的演说家以及此项努力的广度表明了问题的严重性。世界语没有成功因为它既需要接受新的语法又需接受新的词汇,对于想要成为演说家的人而言后者具有更大的挑战性。
当前,信息能够在世界范围更为流畅自如和快速地传播,这增大了对于通用交流工具的需求。最新的努力已最大程度地集中在语言间的自动翻译上。当前在使用的系统通常都存储了、在源和目标语言中的,几百万个常用单词,短语及组合,对于精度和强度依赖于待译文本的状况。按照定义这种系统是不完备的,因为没有一个系统能够存储每个可能的单词组合,并且它们的用途也随其设计者和使用者的语言风格而变。对人而言检查和修改输出的译文几乎总是必要的。此外这些系统还在一个时刻翻译一个词(并因此而工作缓慢),以及对每一种目标语言需要一个分别的独立的数据库。而且,因为它们的程序设计成去识别特殊的语言特性以及从一种语言到另一种语言的其特定的变换,所以每一种翻译必须单独地进行。换言之,对于多重翻译所需的时间是分别完成每一种翻译的时间的和。
因为许许多多的理由,翻译是困难的,包括在语言之间缺乏一对一的词的对应,在每一种语言中都存在同音异义词,以及天然的语法有特异性的这个事实;它们不遵从一组严格的,将会使得直接的词到词的替代易于实现的规则。许多人工智能研究的努力已经朝向对这些特性风格的计算机式的“理解”,以及他们的有限的成绩表明该问题的复杂性。
发明
本发明提供一种人造的语法用以表示在天然语法中所传达的思想和信息。但在结构格式上适合于自动翻译。按照本发明,句子按加的被条理化的自然词汇表的固定系列规则来构成。在易于被词汇表的本国讲者理解的意义上,该语法是清晰的,但是在它的表达复杂概念的能力方面是复杂的,因为句子是按照固定的规则从条理化的词汇表产生,它们能够容易地从一种语言翻译为另一种。优先地,词汇表被表示为一系列物理上或逻辑上有差别的数据库。每一个数据库包含表示按照语法中所定义的形式分类所表示的项目。翻译即是在参考句子的词条和在一种或多种目标语言中的对应词条之间的直接的查寻。
不同于天然的语法,本发明采用有限的(虽然可变化和可扩展)专门词汇,一组严谨的形式分类以及用于句子构造的有限的和严谨的规则。开始于来自四个形式类中的一个的一个词通过反复应用四个扩展规则能够构成句子,四个扩展规则管理能够组合来自不同的类的词汇的方法。产生的“句子”,虽然不像他们想要表达的自然语言的句子,仍然能够准确地和易理解地表达自然语言句子的含意的全部内容。本发明使用比学习新词汇表相对容易的一种新语法,特别是被高度限制到一种精确规则不多的语法。结果,在熟悉这种语法之后,用户能够容易地利用本发明所描述的方法组合句子。
因此,利用本发明,一个自然语言的句子被翻译或分解成(典型地)本发明的较简单的语法但保留了原文的词汇。虽然可能以某种程度的自动化完成此事,本发明的所有的益处几乎都是用发明的易于学习和应用的语法通过人工开发而直接实现的一无论是基本的翻译还是直接的组合。并且,因为翻译即是来自不同语言的同义的词条的简单替代,输入句子的多重语言翻译几乎是立刻就被完成的。
翻译的输出结果由目标语言的本国讲者来理解就如同原文作者理解输入的原文那样地容易。因此,用本发明的语法方式,通过简明的符合语法的语言进行会话是可能的。将这些语句传给会话者用于翻译和应答,并翻译应答者的应答。例如,一个出生在美国没有德语知识的商人能够与出生在德国的谈话者进行会议,利用一台按照本发明的膝上型计算机作为翻译设备,经由计算机交换想法。的确,同一想法可以同时地被传递给多个每一个讲不同语言的对话者。同样也可以同时地和多重地翻译他们的个别的应答。通信者能够用本国语言通过电子邮件交换信息,按照本发明的语法简单地将信息公式化,拥有实现了本发明的电子邮件系统的讲不同语言的收件人接收翻译为本国语言的信息,并且他们的答复在答复者收到回件时自动地被翻译为原先发送者的语言。在此种方式中,每个通信人只接触到他或她的本国的语言。
即使在要求最终用本来语言输出的情况中采用本发明也是有益的,因为对这种格式的翻译是易于实现的。例如,新闻报导者可能用本发明的语法中的词汇发稿一个故事,以便传递给许许多多服务于不同国家的听众的局。在送到不同的局时该故事立刻被翻译为适当的语言,在那里它还可能进一步被加工成适合于向听众通信的形式。如果进一步的翻译被要求时所需要的专长就性质来说主要是编辑,比起例如对真正的语言翻译而言需要较少的专门训练,的确,通讯媒体已经雇用人员从事类似的编辑和校订取自电信服务的原始新闻材料的工作。
按照本发明,句子是由“语言单元”组成的,每个单元可以是一个或几个词,来自所允许的形式类。这些类是“主题”或名词性词,其含有,例如,人,地点,物品,动作或思想的意义;“连接词”表示两个(或多个)名词性词之间的关系;“描述词”修饰一个或多个名词性词的状态;以及“逻辑连接词”形成名词性词组。在全部四类中的所有词条的清单提供出本发明的全部专用词汇。为了按照本发明构造一个句子,来自诸形式类的词条与被按照下面详细说明的四条扩展规则组合,这些规则能够以逐级方式明确地被采用以产生句子,但是更具体地讲,一旦用户习惯了该语法,句子被凭感觉构造并且,如果必要的话,再接着做检验使适合扩展规则。
因此,本发明克服了前面提出过的曾经阻碍真正强大的翻译系统出现的三个障碍。通过代之以一个固定的语法克服了不同语法的特殊的实况,以及一对一的对应问题通过一个特定的且有限的数据库完成寻址。同音异义词的处理方式是将一个词的不同含义作明确的标号并要求对指定的意义作明确的选择。这些能力允许本发明方便地和廉价地应用于许多语言,即使是外国的语言;反过来,现有的系统由于在其设计中的固有的费用几乎都是专用性地指向主要的语言。
有代表性的硬件装置包括一系列的逻辑上物理上性质不同的电子的数据库,在其中存储词汇表,一个计算机的存储部分用来接收用参考语言和按本发明构成的语言表示的输入;以及分析手段(一般是一个按照所存储的计算机指令操作的处理器)用于(ⅰ)按输入寻址数据库以检索与其对应的在目标语言中的词条,以及(ⅱ)通过用等价的目标词条代替输入来翻译句子。
附图的简要说明
下面的发明说明参考附图,其中
图1图示说明本发明的扩展规则的使用,以及
图2本发明采用的硬件系统的示意图表示。
一个原理性实施例的详细说明
本发明有的系统利用一种词典和一组强制性的语法规则。该词典包括被分为四类的语言单元,每类语言单元是(1)单词,比如“狗”或“政府”,或(2)词的组合,比如“停车场”或“总理”;或(3)专有名称;或(4)本发明独有的释义的词;或(5)具有多重意义的词的一种形式。在后面的情况中,词的每种释义表示一种不同的语言单元,不同的释义可以表示为不同形式类中词条。为了自动化的目标,每个释义是有区别的,例如用出现在词的未尾处的句点的数目(来区别)。对于第一(人为设计的)释义的词条不带句点被列表,表示第二释义的词条被列表时在其未尾处带一个句点,如此等等。换句话说,不同的词意能够数字地被识别,例如,用下标。
发明所独有的词可能组成总词典的很小的一部分,并且这些词中没有一个是对于发明特殊的或与它所依据的天然语言相异的。而发明中特有的词是在含义上被扩展了,以限制在词典中名词的总数。例如,在推荐的增补中,词“利用”被扩展含有为达到主要的预定的目的而使用某件物品的含义,因此在句子“杰克利用书”中该词含有读的意思。词“在…上”可以被用来包含时间的意义(例如(我玩球)在昨天)。但是,如果希望使用方便,发明的专有词能够被统统去掉因而词典被扩大了。
本发明将所提供的词汇的整个词典分为四类:“事件”或名词性词其意指例如,人,地点,物品,活动或思想,在这里用码T来识别;“连接词”接定两个(或多个)名词性词之间的关系(包括具体被称作前置词和连词的词,以及用行动、存在、或存在的状态来表示的描述关系的词汇),在这里用C标识;“描述词”修饰一个或多个名词性词的状态(包括具体被称作形容词,副词和不及物动词的词),此处用D标识;建立名词性词组的“逻辑连接词”此处用C标识。名词性词,连接词和描述词的推荐表分别陈列在后面附录1-3中。推荐的逻辑连接词是“和”和“或”。
自然,词典不能和没有包含可能的专有名称的表;代之以,专有名称,像其它发明识别不了的词一样,被退回到角括号(angleGracket)内以表示翻译不进行。系统也不识别动词时态;在现在时态中连接词被表示为短语,因为时态易于从上下内容理解。但是,时态仍然可以通过指明时间、日和/或日期来表示。
按照本发明的句子是由词典中的词汇根据四项扩展规则来构成的。最基本的句子产生自下列的三种结构之一(这些结构的任一种能够从T词汇按照随后要陈述的扩展规则产生)。这些结构,其表示为携带信息所考虑的最小的可能的词组,是更复杂语句的组件。其结构的简单性便于立即翻译为会话,自然语句;因此即使是按照本发明的复杂句子,通过对更基本的句子成份的组件分析易于转换成自然语言的等价物(利用后面描述的最佳表达式来简化过程)。
基本结构1(BS1)通过在名词性词后放置一个描述词形成结构TD而被形成。BS1语句例如“狗棕色”和“帐单游泳”易于翻译为英语句子“狗是棕色的”(或短语“棕色的狗”)和“游泳的帐单”。
BS2通过在两个名词性词之间放置一个连接词形成TCT结构而被形成。BS2语句例如“狗吃食物”易于翻译成英语等价物。
BS3是通过在两个名词性词之间放置一个逻辑连接词构成一个用TCT…表示的系列而被形成,该系列能够是一个简单的连接,例如“Bob和Ted或者是复合结构例如”Bob和Ted和A1和Jill或“红或兰或绿”。
包括一个或多个在上面陈列的基本结构的句子可以利用下列的规则作扩展。
规则Ⅰ:对一个名词性词,加一个描述词(T→TD)
按照规则1,任何来自名词类的语言单元能够被扩展进入由一个表自描述词类的新条目跟随的初始条目中,该新条目修饰初始条目,例如,“狗”变成“狗大的”。像本发明的所有规则一样,规则1没有将其应用限制于一个弧立的名词性词(虽然这就是BS1句子如何被形成的);代之以,它能被应用于任意的名词性词而不管在其较大语句中的位置。因此,按照规则1,TD1→(TD2)D1,例如,“狗大的”变成“(狗棕色)大的”(对应于英语句子,“棕色的狗是大的”)。
在连续形容的情况中加的秩序可能是或可能不是重要的,由于这些形容词是独立地修饰T;例如,在“(狗大的)综色”中,形容词“大的”区别这条狗与其它的狗,而综色可能描述被认为是听者不了解的别的方面的特点。在D词为一个不及物动词的场会,加的秩序几乎总是重要的。例如,按照规则1,通过加描述词“快”扩展TD句子“狗跑”(对应于“狗跑着”或“跑着的狗”),构成“(狗快)跑”(对应于“快速的狗跑着”)。为了表述“狗跑得快”,必须用描述词“跑”以“(狗跑)快”的形式扩展TD句“狗快”。
将规则1应用到结构BS2产生TCT→(TD)CT。例如,“狗吃食物”变成“(狗大)吃食物”。规则1也能应用于TCT型组合的名词性词,因此BS3型的结构变成TCT→(TCT)D。例如,“母亲和父亲”变成“(母亲和父亲)开车”。在此方式中,多重的名词性词能够被合并,为着修饰的目的,或者连续地或者交替地。还应该指出,具有及物意义的动词,例如:开车,被作为连接词以及描述词包括入数据库中。另一个例子是动词“倾覆”,该词能是不及物的(“船倾覆”)以及及物的(“船长倾覆船”)。
规则Ⅱa:对于名词性词,加一个连接词和另一个名词性词(T→TCT)。
按照规则Ⅱa,任何来自名词类的语言单元能够用一个被两个名词性词条包围的连接词来代替,其中一个名词性词条是初始的语言单元。例如,“房屋”变成“山丘上的房屋”。将扩展规则Ⅱa应用到BS1产生TD→(TCT)D;例如,“黑暗的房屋”变成“(山丘上的房屋)黑暗的”或“山丘上的房屋是黑暗的”。
规则Ⅱa能够被用来加一个及物动词和它的宾语。例如,组合词“母亲和父亲”能被扩展为“(母亲和父亲)驾驶小汽车”。
规则Ⅱb:对一个名词性词,加一个逻辑连接词和另一个名词性词(T→TCT)。
按照规则Ⅱb,任何来自名词类的语言单元能够用一个被两个名词性词,其中一个是初始语言单元,包围着的连接词来代替。例如“狗”变成“狗和猫”。
再者,为了规则Ⅱa和规则Ⅱb的目的,名词性词能是一个包括两个或多个名词性词通过一个连接词连接的组合。例如,扩展“(约翰和比尔)去市场”满足规则Ⅱa,接下来应用规则Ⅰ,这个句子能被进一步扩展为“((约翰和比尔)去市场)一起”。
规则Ⅲ :对一个描述词,加一个逻辑连接词和另一个描述词(D→DCD)。
按照规则Ⅲ ,一个描述词能够用一个由两个描述词,其中一个是初始的,包围着的逻辑连接词所替换。例如“大的”变成“大的和棕色的”。应用规则3到BS1产生TD→T(DCD)。例如“狗大的”(等同于“狗是大的”,或“大的狗”)变成“狗(大的和棕色的)”(等同于“狗是大的和棕色的”或“大的和棕色的狗”)。
应用这些规则去形成按照本发明可接受的句子的方法显示在图1中。由一个名词性词例如猫,出现在110处,开始,通过遵循扩散规则Ⅰ,Ⅱa和Ⅱb能够形成三个基本结构中的任何一个,正如在112、114、116处所显示的,分别产生“猫有条纹的”(BS1),“在长沙发上的猫”(BS2)或“猫和仆人”(BS3)。在118和119处重复应用扩展规则Ⅱa产生TC1T1→(T1C1T1)C2T2型或“((猫在沙发上)吃老鼠)”以及(TC1T1)C2T2→((TC1T1)C2T2)C3T2型或“(((猫在长沙发上)吃老鼠)带尾巴)”。扩展规则Ⅰ能够在任意点上应用于T语言单元,如像在122处所显示的(修饰初始T,猫,产生“(快乐的猫在长沙发上”)和在124处(修饰“吃老鼠”)。规则Ⅲ也能被应用,如在126处显示的(进一步修饰猫产生“(((快乐和带条纹的猫)在长沙发上)”)和在128处显示的(进一步修饰“吃老鼠”)。
扩展规则Ⅰ能够被反复地应用如在112、130处所显示的以进一步修饰初始T(虽然,正如在130处所强调的,描述词不一定是形容词)。扩展规则Ⅱa适合于表现修饰过的T的行为(如在132处所显示的),并且规则Ⅰ能够被用于修饰新引入的T(如在134处显示的)。规则Ⅰ还能被用于修饰一个由规则Ⅱb形成的复合的主语,(在本发明的广义上讲),如在136所显示的。
语言单元被组合时的顺序能够强烈地影响含义。例如扩展TC1T1→(TC1T1)C2T2能够取多种形式。结构“猫发现(球在长沙发上)”传递的意思不同于“猫发现球(在长发上)”。在前句中球明确地在长沙发上,而在后一句中行为发生在长沙发上。句子“(约翰想要小汽车)快些”表示行为应该快些完成,而“约翰想要(小汽车快些)”意思是小汽车应开快些。
前面所说的扩展规则的更多的精心结构的例子出现在附录4中,它们说明本发明在表示自然语言论述中的实用性。
本发明的有代表性的硬件装置示于图2中。正如图中所表示的,系统包括一个主双向总线200,所有系统的部件通过总线通信。实现发明的主系列指令以及下面讨论的数据库保存大容量的存储器件202(比如硬盘或光存储单元)上以及在工作期间保存在主系统的存储器204中。这些指令的执行和本发明功能的实现是通过中央处理器(CPU)206完成的。
用户通过键盘210和位置敏感器件(例如鼠标)212与系统联系。两者中任一器件的输出都能用来指示信息或选择显示屏214的特定区域以控制要由系统完成的功能。
主存储器204包含一组模块,其控制CPU206的工作以及它的其它硬件组件的相互关系。操作系统220控制低级的、基本的系统功能的执行比如存储器分配,文件管理和大容量存储器件20的操作。实现一系列存储指令分析模块225在较高的水平上控制由本发明实现的主要功能的执行,就像在下面讨论的那样;以及定义用户接口230的指令允许在显示屏214上直接的人-机对话。用户接口230在显示屏214上生成字词和图形画面,提示用户操作,并接受来自键盘210和/或位置敏感器件212的用户命令。
主存储器204还包括一个限定一系列有能力存储本发明的语言单元的数据库的部分,象征性地用参考数字2351,2352,2352,2354表示。这些数据库235可能是在实际上有差别的(也即在存储器件202上在不同的存储区和作为分别的文件存储)或者是在逻辑上有差别的(即以一个结构表的形式存储在单一的存储区,该表可以像多元数据库那样被编址),每个数据库包含至少在两种语言中的相应于一个特定类的全部语言单元。换言之,每个数据库被组织成一个表,表的每一列列出在单一语言中一特殊类的所有语言单元,因此每一行包含了在系统有能力翻译的各种语言中表示的同一语言单元。在所说明的实施中,名词性词被包含在数据库2351中,并且这个数据库在单种语言(英语)中的内容的代表性例子-即在这个将会是多列工作数据库中的一列的内容列出在附录1中;连接词被包含在数据库2352中,它的作为例子的一列展示在附录2中;描述词包含在数据库2353中,它的作为例子的一列展示在附录3中;而逻辑连接词(最简单地为,“和”和“或”)包含在数据库2354中。
输入缓冲器240经由键盘从用户那里接收一个输入句子,此句子最好是按照本发明构造并按下面的说明格式化。在此情况下,分析模块225初步地检查该输入句有关结构性能,接下去,模块225以重复的方式处理该输入句的语言单元,寻址数据库以找出在给定语言中对应于每个语言单元的词条,以及在目标语言中对应的词条。分析模块225通过利用来自目标语言的词条代替输入的词条翻译该句。译文输入到一个输出缓冲器245内,该缓冲器的内容在显示屏214上显示。
必须了解到虽然主存储器204的模块已被分别地说明过,这仅仅为着表达清楚起见;只要系统完成所有必需的功能,它们在系统内如何分布以及编程的结构都不是重要的。
为了简化由模块225进行的方便的分析,输入句最好用特征的,易于处理的格式构造,此格式既便于单个语言单元的直接的识别,也便于简单地确认单元系列具有符合本发明的扩展原则的语言句的资格。在一种逼近中(“照片形式”),一个句子的每个语言单元出现于一个分别的行中。如果已经做了扩展,用一个星号(*)来标志该处发生过扩展;也即是*被用来将基本的语言结构连接在一起以形成一个较大的句子。例如,从图1中的词条抽取。
猫 带条纹的
*发现*
球 红色
表示132步和134步的结果。
另一方面,句子能够被表示为代数的(“风景”)格式其中扩展是通过将扩展词括在括号中来识别:
(猫 带条纹的)发现(球 红色)
在任一情况中,用户的输入彼处理成字符串,并用标准的串-分析程序,模块225识别分别的语言单元和扩展点。然后将这些与对应于允许的扩展规则的样板相比较以确认句子,接下去进行数据库查找和翻译。如果句子不能符合发明的规则,模块225通过显示屏214提醒用户。
按照这些表示格式的任一种,在英语中的复数则通过在单数名词的末尾加“/S”来标注(例如“nation/s”)。在其它语言中,形成复数的最通用的方法被使用;例如,在法语中,和在英语中一样加“/S”;但在意大利语中加“/i”,数字被数字地表示。
另一方面,分析模块225能够被配置成可处理非格式化的输入语句。为实现这一点,模块225在数据库235中查找每个输入词(或者,如果适当的话,词组)并且建立一个用组成句子的语言类表示的句子的表达式-也即用每个单元的语言的类符号代替该单元。然后模块225评定产生的类语句能否按照所允许的扩展规则被生成,并且如果能,将语言单元分组以便于查找和翻译。提供的输出或者以对应于输入的非结构性格式或者以上面陈述的格式中的一种的方式给出。推荐后一种方式,因为在一种语言中的词串很难与完全通过替代而产生的另一语言中的词串在意义上相对应;一般地以隔离语言单元和突出扩展的方式表示的输出较易理解。
本发明可以加进附加的特点以简化操作。例如,如上面所指出的,具有多重意义的词通过尾随的句点来区分;自然,按照该词的一个具体的含义的句点的数目代表一种任意的选择。因此,一个附加的数据库能够包括一个名义词的字典,词的每个含义的发明认可的格式置于各个定义的旁边。当用户选择定义中的某一个时用户接口230判读用户在其上的点击,并将该词的适当的编码输入进输入缓冲器240。
类似地,因为经济和操作速度的考虑限制了数据库的总的期望的大小,数据库235之一能够被设置成一个近义词词典,对于一个不识别的输入词它给出最接近的本发明识别的语言单元,在操作中,当紧随由分析模块225为在数据库中定位一个词作的不成功的努力之后,模块225能够被编程以查阅近义词词典数据库235并返回一个词的清单,事实上,这些词确定出现在语言单元数据库中。
模块225还能包括某些应用即识别和修正(例如,由用户认可之后)在句子结构上常常作出的错误。例如,本发明通常用动词“有”表示一个指名的人的所有权,因此句子“Paul’s计算机是快速的”被表示为(用代数格式表示)“Paul有(计算机快速的)”或“(计算机Paul的)快速的”;如果人是非指名的,可以用普通的物主代词(例如“(计算机我的)快速的”)。因此,模块225能够被配置成能识别诸如“Paul’s”的结构且返回符合本发明的适当的结构。
所以,应该看出前面所述表示了一种对于多种语言之间翻译的简便的和快速的方法。文中采用的术语和表达式是作为说明的术语而不作限制来使用的,并且,在应用此类术语和表达式时,不存在排斥任何与所显示和说明的特征或它的部分内容相等同的东西的倾向。但是它承认在本发明的权利要求的领域之内各种不同的改进是可能的。例如,本发明的各种模块能够利用适当的软件程序,或者作为硬件电路,或者作为混合的硬件-软件组合在通用计算机上被完成。
附录1附录1
名词性词男演员地址广告建议非洲下午年龄目的空气飞机机场阿尔及利亚高度铝大使总量动物足踝回答蚁房间欲望苹果任命杏四月建筑师阿根廷争论手臂军队到达艺术艺术家亚洲雅典人八月婶母澳大利亚澳地利作者权力崩落
附录1
第二页宝贝背背包包面包师阳台球香蕉绷带银行大麦谷仓桶篮子洗澡浴衣澡盆电池海滩豆熊胡须床卧室蜜蜂牛肉啤酒甜菜开始行为比利时钟带利益斜料自行车帐单台球鸟出生生日气泡毛毯血短外套船身体
附录1
第三页玻利维亚炸弹骨书边瓶底部碗箱男孩手镯脑刹车黄铜巴西面包早餐呼吸砖桥扫帚兄弟刷子建筑物保加利亚子弹公共汽车屠夫黄油蝴蝶钮扣卷心菜船舱咖啡蛋糕骆驼照像机营加拿大运河蜡烛手杖首都首领小汽车卡片纸板货物
附录1
第4页木匠地毯胡萝卜现金猫牛菜花地窖墓地链椅子脸颊乳酪化学樱桃国际象棋胸膛小鸡孩子智利下颏中国巧克力圣诞节教堂雪茄香烟园公民钟衣服云丁香俱乐部煤外套蟑螂可可咖啡衣领哥伦比亚彩色梳子舒适比赛计算机音乐会
附录1
第5页条件连接会话烹调铜复制件开塞钻谷物价值棉花长沙发国家勇气堂兄弟母牛粉碎机鹤奶油木笼罪行古巴黄瓜杯子帘捷克斯洛伐克损坏跳舞危险日期女儿天死亡债务十二月决定度丹麦牙医出发沙漠甜点心腹泻字典消化餐厅午餐方向
附录1
第6页疾病盘距离文件狗驴门拉梦衣服司机鼓鸭灰尘鹰耳赚地震厄瓜多尔教育鳝鱼蛋埃及肘电学电梯端敌人能量发动机工程师英格兰入口信封埃塞俄比亚欧洲原谅展览出口费用输出眼脸工厂下落家庭农场
附录1
第7页父亲二月渡口图手指指甲芬兰火鱼拳头跳蚤洪水地板粉化槽飞食物脚足球森林叉狐狸法国星期五朋友蛙前部水果葬礼游戏花园大蒜汽油量规德国礼物女孩玻璃眼镜手套胶山羊上帝金鹅政府
附录1
第8页葡萄葡萄柚草希腊组警卫客人指导枪体育冰雹头发理发师半锤子手手帕港口收获(带边的)帽子他头健康心脏后跟这里高速路洞孔假日荷兰蜜蜂马赛马医院旅馆小时房屋饥饿丈夫我冰冰激凌冰岛思想输入印度印度尼西亚
附录1
第9页通知墨水昆虫保险翻译员发明伊朗伊拉克爱尔兰铁岛以色列它意大利一月日本宝石职业笑话约旦果汁七月六月肯尼亚钥匙肾种类国王厨房膝小刀科威特带子梯子湖泊羔羊语言律师领导叶子皮黎巴嫩腿柠檬信利比里亚图书馆
附录1
第10页利比亚许可证生命光灯泡闪电石灰亚麻布狮嘴唇液体肝起居室龙虾锁看织机爱运气行李午餐肺机器杂志魔术处女邮件马来西亚马耳他男人地图进行市场婚姻火柴垫子五月肉医学会议公成员纪念物金属墨西哥中部牛奶
附录1
第11页分钟错误星期一钱猴子月月亮早晨摩洛哥蚊母亲山鼠口电影磨菇芥末钉子指甲锉姓名自然颈项练针邻居尼泊尔荷兰新西兰报纸尼加拉瓜尼日利亚夜晚笨蛋中午北美洲北极挪威鼻十一月数目护士螺帽橡树桨燕麦十月办公室
附录1
第12页油橄榄葱头橙矿石牛包疼痛绘画一对巴基斯坦薄烤饼恐慌裤子纸降落伞双亲停车部分鹧鸪护照豌豆和平梨农民笔铅笔人民胡椒波斯秘鲁药剂学菲律宾医生钢琴画猪鸽子枕头飞行员针松树管植物平台玩玩牌
附录1
第13页快乐梅袋毒药波兰警官搬运工葡萄牙邮局明信片壹土豆粉末监狱问题性质钱包四分之一王后问题兔无线电破布雨雨衣鼠剃刀接收电唱机冰箱宗教裂缝餐馆结果稻米环危险江河火箭滚动屋顶房间根绳索橡皮罗马尼亚俄罗斯
附录1
第14页锈马鞍悲哀安全安全带水手盐沙子星斯六酱油沙特阿拉伯香肠尺度围巾学校科学剪刀苏格兰螺钉海洋自己九月形状她羊衬衫鞋肩边签名丝银姊妹位置尺寸皮肤skis天空雪橇嗅觉烟蛇雪肥皂短袜苏打士兵
附录1
第15页解决儿子歌声音汤南非南美洲南极苏联空间西班牙香料匙春天楼梯印章星淀粉站大块肉片钢枝条证券市场胃石头贮存暴风雨故事火炉街道学生地下铁道糖夏天太阳星期日惊奇沼泽瑞典瑞士叙利亚桌尾巴裁缝味觉税荼
附录1
第16页教师电话电视帐篷试验泰国剧场他们小偷大腿事物渴线咽喉拇指雷声星期四票带子虎时间时间表锡疲劳烤面包烟草今天脚趾化妆西红柿明天舌工具牙齿牙刷顶部毛巾城镇玩具训练树旅行麻烦真理星期二突尼斯火鸡
附录1
第17页电视节目打字机雨伞叔叔联邦乌拉圭我们预防注射蔬菜天鹅绒委内瑞拉牺牲者观察乡村醋小提琴声音待者墙战争浪费手表水我天气婚礼星期三星期重量小麦那里谁妻子风窗冬季妇女木材羊毛词工作年昨天你南斯拉夫
附录2
第1页能够大约在…上横过害怕在…后反对允许回答阻止到达问在…上烘烤是因为变成在…前开始在…后面相信赌背叛在…中间谴责打扰打破拿来燃烧但是买叫被叫倾覆捕获搬运捉住原因改变爬高关闭烹调计算
附录2
第2页切割涉及减少打破释放讨论向下饮驱赶落下吃检查说明发现结束固定为了对于忘记从…时来自油炸给进入穿过走向悬挂恨有听帮助打打猎如果在…里在…前面为了…目的包括增加杀死亲吻知道学习离开喜欢住进寻找
附图2
第3页用…制成做遇见多于移动靠近需要占据属于…的在…上方外面支付玩准备印允许证明拉推放置读减少拒绝记住重复骑烤说看卖送缝刮射将要唱微笑讲偷刺停止学习取教扔至
附录2
第4页触翻译试关开在…下理解直到利用估价访问想要洗涤当…时赢和…一起为…工作写
附录3
第1页附录3
描述词国外缺席的再同意活的所有的几乎单独也总是愤怒的另一任何争论人造的自动的有用的向后的坏的害羞的美丽的开始黑的盲的金黄色的兰色的沸腾的钻孔的生来的勇敢的破的褐色的燃烧颠覆仔细小心的改变便宜的清洁的清澈的冷的控诉继续正确的
附录3
第2页咳嗽疯狂的呼喊好奇的潮湿的危险的黑暗的死的聋的减少深的不完美的不同的困难的脏的下降溺死干的早的东方的容易的空的足够的贵重的终止极端的远的快的肥胖的少数的第一平的飞行的禁止的外国的易碎的自由的新鲜的有趣的奇特的高兴的好的告别绿色的灰的生长的犯罪的
附录3
第3页挂发生快乐的硬的健康的重的饥饿的违法的重要的增加聪明的有趣的妒忌吻大小最后的迟的笑懒的左边的法律的长的恶劣的可能平均的更多的很多的无言的彼此的我的神经的中性的决不新的其次的好的北方的不现在常常同意老的开我们的许可的粉红色的玩
附录3
第4页清贫穷的便携的可能的先前的安静的红色的休息富的正确的熟练的圆周运行不愉快的安全的短的有病的类似的就座睡慢的慢慢地小的微笑柔软的一些有时酸的南方的特殊的站立强壮的甜蜜的游泳谈话告诉感谢在那里厚的薄的思考疲倦的一起太多透明的旅行丑陋的
附录3
第5页上楼焦急等待走温暖的弱小西边的湿的白色的为什么焦急的错误的黄色的年青的你的
附录4
第1页附录4
扎伊尔的卫生官员说到目前已有97人死于Ebola病毒。吉恩-特木芬(Jean Tamfun),曾在1976年帮助鉴别该病毒的病毒学家,批评政府的隔离区和路障是无效的,星期六位于Kikwith区的隔离区正式地被撤消。
卫生官员/扎伊尔的
*说*
人97
*死亡
*因为*
名叫ebola的病毒
吉恩-特木芬是*
在扎伊尔的病毒学家
他帮助*
科学地鉴别*
名叫ebola的病毒
*在1976年
吉恩特木芬批评*
扎伊尔的政府
他说*
隔离区*
*和*
路障无效的
政府结束*
隔离区在*
名叫kikwith的区域
*在星期六
Claims (20)
1.一个将信息从初始语言翻译为第二语言的方法,方法包括:
a.提供用参考和目标语言表示的名词性词、连接词、描述词和逻辑连接词的数据库的参考和目标组,每个名词性词数据库包括一系列的名词词条,每个连接词数据库包括一系列的连接词词条,每个词条指明至少两个名词性的词之间的关系,每个描述词数据库包括一系列的描述名词性词的描述词词条,而每个逻辑连接词数据库包括一系列建立组的词条,数据库的参考组的词条与数据库的目标组的词条相对应;
b.在参考语言中产生的句子包括许多来自数据库参考组的词条;
c.利用参考词条寻址数据库的目标组以检索与其对应的目标词条;以及
d.通过用目标词条代替参考词条翻译句子。
2.权利要求1的方法,其中语句是通过从名词性词的数据库选择一个条目并应用下列规则中的至少一条扩展该语句而产生的。
a.对一个名词性词条,加一个来自描述词数据库的描述词词条;
b.对一个名词性词条,加一个来自连接词数据库的连接词词条和另一个来自名词性词数据库的名词性词条;
c.对一个名词性词条,加一个来自逻辑连接词数据库的逻辑连接词和另一个来自名词性词数据库的名词性词条;
d.对一个描述词词条,加一个来自逻辑-连接词数据库的逻辑-连接词和另外一个来自描述词数据库的描述词词条。
3.权利要求1的方法,其中名词性词条给人、地、物、动作或思想命名。
4.权利要求3的方法,其中名词性词条包括在后面附录1中列出的词汇。
5.权利要求1的方法,其中连接词词条表示动作、存在或存在的状态。
6.权利要求5的方法,其中连接词词条包括在后面附录2中列出的词汇。
7.权利要求1的方法,其中描述词词条说明名词性词条的性质,数量,状态或类型。
8.权利要求7的方法,其中描述词词条包括列在后面附录3中的词汇。
9.权利要求1的方法,其中逻辑-连接词数据库由词条和、或组成。
10.用来将信息从第一语言翻译为第二语言的装置,该装置包括:
a.第一数据库装置包括一系列的参考和至少一种目标语言中的名词性词条;
b.第二数据库装置包括一系列在参考语言和至少一种目标语言中的连接词词条,该连接词词条的每条指定至少两个名词性词条之间的关系。
c.第三数据库装置包括一系列的在参考语言和至少一种目标语言中的描述词词条,该描述词词条说明名词性词条;
d.第四数据库装置,包括一系列建成组的词条;
e.用于接收参考语言的输入的装置,该输入包括来自数据库装置的词条;
f.用来(ⅰ)根据输入寻址数据库的目标组以检索与其对应的目标词条和(ⅱ)通过用目标词条代替输入翻译语句的分析装置;
11.权利要求10的装置,其中分析装置被配置成能确保输入符合按照下列扩展规则构造的语句:
a.对一个名词性词条,加一个来自第三数据库装置的描述词词条;
b.对一个名词性词条,加一个来自第二数据库装置的连接词词条和另一个来自第一数据库装置的名词性词条;
c.对一个名词性词条,加一个来自第四数据库装置的词条和另一个来自第一数据库的名词性词条;以及
d.对一个描述词词条,加一个来自第四数据库装置的词条和另一个来自第三数据库装置的描述词词条。
12.权利要求10的装置,其中名词性词条为人、地、物、动作或思想命名。
13.权利要求12的装置,其中第一数据库装置包括在后面附录1中列出的词汇。
14.权利要求10的装置,其中连接词词条表示行动、存在或存在的状态。
15.权利要求14的装置,其中第二数据库装置包括在后面附录2中列出的词汇。
16.权利要求10的装置,其中描述词词条说明名词性词条的性质、数量、状态或类型。
17.权利要求16的装置,其中第三数据库装置包括在后面附录3中列出的词汇。
18.权利要求10的装置,其中第四数据库装置由词条和、或组成。
19.权利要求10的装置进一步包括用于识别的近义词汇,对一个与数据库词条中任何一个都不匹配的输入词,识别一个在意义上最接近输入词的数据库词条。
20.权利要求10的装置进一步包括用于显示译文的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/740,654 | 1996-10-31 | ||
US08/740,654 US5884247A (en) | 1996-10-31 | 1996-10-31 | Method and apparatus for automated language translation |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1237254A true CN1237254A (zh) | 1999-12-01 |
Family
ID=24977479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97199304A Pending CN1237254A (zh) | 1996-10-31 | 1997-10-28 | 关于自动语言翻译的方法和装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5884247A (zh) |
EP (1) | EP0935782A1 (zh) |
JP (1) | JP2001503175A (zh) |
CN (1) | CN1237254A (zh) |
AU (1) | AU721926B2 (zh) |
BR (1) | BR9712854A (zh) |
CA (1) | CA2270191A1 (zh) |
WO (1) | WO1998019254A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1530861B (zh) * | 2003-02-24 | 2010-05-26 | 微软公司 | 语言翻译方法及其系统 |
CN107291703A (zh) * | 2017-05-17 | 2017-10-24 | 百度在线网络技术(北京)有限公司 | 翻译服务应用中的发音方法及装置 |
CN112906406A (zh) * | 2021-03-30 | 2021-06-04 | 携程旅游信息技术(上海)有限公司 | 酒店房型名称的翻译方法、系统、设备和介质 |
Families Citing this family (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5822720A (en) | 1994-02-16 | 1998-10-13 | Sentius Corporation | System amd method for linking streams of multimedia data for reference material for display |
DE69932803T2 (de) * | 1998-02-02 | 2007-03-15 | Pulsepoint Communications, Carpenteria | Dynamisch ladbare satzbuchbibliotheken für gesprochene sprachgrammatik in einem interaktiven system |
US6092074A (en) | 1998-02-10 | 2000-07-18 | Connect Innovations, Inc. | Dynamic insertion and updating of hypertext links for internet servers |
WO2000036535A1 (en) * | 1998-12-16 | 2000-06-22 | Cvbase Ag | Method and system for structured processing of personal information |
US6901367B1 (en) * | 1999-01-28 | 2005-05-31 | International Business Machines Corporation | Front end translation mechanism for received communication |
US6243669B1 (en) | 1999-01-29 | 2001-06-05 | Sony Corporation | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation |
US6356865B1 (en) | 1999-01-29 | 2002-03-12 | Sony Corporation | Method and apparatus for performing spoken language translation |
US6223150B1 (en) | 1999-01-29 | 2001-04-24 | Sony Corporation | Method and apparatus for parsing in a spoken language translation system |
US6266642B1 (en) * | 1999-01-29 | 2001-07-24 | Sony Corporation | Method and portable apparatus for performing spoken language translation |
US6278968B1 (en) | 1999-01-29 | 2001-08-21 | Sony Corporation | Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system |
US6282507B1 (en) | 1999-01-29 | 2001-08-28 | Sony Corporation | Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection |
US6442524B1 (en) | 1999-01-29 | 2002-08-27 | Sony Corporation | Analyzing inflectional morphology in a spoken language translation system |
US6374224B1 (en) | 1999-03-10 | 2002-04-16 | Sony Corporation | Method and apparatus for style control in natural language generation |
US7590538B2 (en) * | 1999-08-31 | 2009-09-15 | Accenture Llp | Voice recognition system for navigating on the internet |
US7222075B2 (en) * | 1999-08-31 | 2007-05-22 | Accenture Llp | Detecting emotions using voice signal analysis |
US6353810B1 (en) | 1999-08-31 | 2002-03-05 | Accenture Llp | System, method and article of manufacture for an emotion detection system improving emotion recognition |
US6151571A (en) * | 1999-08-31 | 2000-11-21 | Andersen Consulting | System, method and article of manufacture for detecting emotion in voice signals through analysis of a plurality of voice signal parameters |
US6427137B2 (en) | 1999-08-31 | 2002-07-30 | Accenture Llp | System, method and article of manufacture for a voice analysis system that detects nervousness for preventing fraud |
US6463415B2 (en) | 1999-08-31 | 2002-10-08 | Accenture Llp | 69voice authentication system and method for regulating border crossing |
US6275806B1 (en) * | 1999-08-31 | 2001-08-14 | Andersen Consulting, Llp | System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters |
US6697457B2 (en) | 1999-08-31 | 2004-02-24 | Accenture Llp | Voice messaging system that organizes voice messages based on detected emotion |
US6301554B1 (en) * | 1999-09-23 | 2001-10-09 | Wordstream, Inc. | Language translation using a constrained grammar in the form of structured sentences formed according to pre-defined grammar templates |
WO2001031550A1 (en) * | 1999-10-15 | 2001-05-03 | Primuslabs.Com | Electronic commerce food safety management system and method |
US6928448B1 (en) | 1999-10-18 | 2005-08-09 | Sony Corporation | System and method to match linguistic structures using thesaurus information |
US6721697B1 (en) | 1999-10-18 | 2004-04-13 | Sony Corporation | Method and system for reducing lexical ambiguity |
US6778949B2 (en) | 1999-10-18 | 2004-08-17 | Sony Corporation | Method and system to analyze, transfer and generate language expressions using compiled instructions to manipulate linguistic structures |
CN1271545C (zh) * | 1999-11-17 | 2006-08-23 | 联合国 | 语言翻译系统 |
US6704700B1 (en) * | 1999-11-17 | 2004-03-09 | United Nations | System for creating expression in universal language, and recorded medium on which translation rules used for the system are recorded |
JP2001195115A (ja) | 2000-01-06 | 2001-07-19 | Canon Inc | 工数自動設定システム、工数自動設定方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体 |
JP2001195463A (ja) * | 2000-01-06 | 2001-07-19 | Canon Inc | 作業標準作成システム、作業標準作成方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体 |
JP2001195462A (ja) * | 2000-01-06 | 2001-07-19 | Canon Inc | 組立情報管理システムと組立情報管理のためのクライアントサーバ型分散システム |
JP2001256333A (ja) * | 2000-01-06 | 2001-09-21 | Canon Inc | 作業割付システム、作業割付方法、分散型クライアントサーバシステム及びコンピュータプログラム記憶媒体 |
JP2001245269A (ja) * | 2000-02-25 | 2001-09-07 | Sony Corp | コミュニケーション・データ作成装置及び作成方法、コミュニケーション・データ再生装置及び再生方法、並びに、プログラム記憶媒体 |
US20020002452A1 (en) * | 2000-03-28 | 2002-01-03 | Christy Samuel T. | Network-based text composition, translation, and document searching |
US20030200535A1 (en) * | 2000-06-09 | 2003-10-23 | Mcnamara Benedict Bede | System for program source code conversion |
JP2002024141A (ja) * | 2000-07-05 | 2002-01-25 | Nec Corp | 電子メールの翻訳を代行する方法、そのための装置及びシステム |
US7389221B1 (en) | 2000-07-17 | 2008-06-17 | Globalenglish Corporation | System and method for interactive translation |
US7660740B2 (en) | 2000-10-16 | 2010-02-09 | Ebay Inc. | Method and system for listing items globally and regionally, and customized listing according to currency or shipping area |
US7792676B2 (en) * | 2000-10-25 | 2010-09-07 | Robert Glenn Klinefelter | System, method, and apparatus for providing interpretive communication on a network |
US7392287B2 (en) * | 2001-03-27 | 2008-06-24 | Hemisphere Ii Investment Lp | Method and apparatus for sharing information using a handheld device |
US20020173946A1 (en) * | 2001-03-28 | 2002-11-21 | Christy Samuel T. | Translation and communication of a digital message using a pivot language |
US20020169592A1 (en) * | 2001-05-11 | 2002-11-14 | Aityan Sergey Khachatur | Open environment for real-time multilingual communication |
US7050964B2 (en) * | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
US7734459B2 (en) | 2001-06-01 | 2010-06-08 | Microsoft Corporation | Automatic extraction of transfer mappings from bilingual corpora |
US7130861B2 (en) * | 2001-08-16 | 2006-10-31 | Sentius International Corporation | Automated creation and delivery of database content |
US7392173B2 (en) * | 2001-09-06 | 2008-06-24 | International Business Machines Corporation | Method and system of presenting a document to a user |
US7752266B2 (en) * | 2001-10-11 | 2010-07-06 | Ebay Inc. | System and method to facilitate translation of communications between entities over a network |
US20030101046A1 (en) * | 2001-11-28 | 2003-05-29 | Mark Krasnov | Word, expression, and sentence translation management tool |
US7272377B2 (en) * | 2002-02-07 | 2007-09-18 | At&T Corp. | System and method of ubiquitous language translation for wireless devices |
GB0204246D0 (en) * | 2002-02-22 | 2002-04-10 | Mitel Knowledge Corp | System and method for message language translation |
US8078505B2 (en) * | 2002-06-10 | 2011-12-13 | Ebay Inc. | Method and system for automatically updating a seller application utilized in a network-based transaction facility |
US7941348B2 (en) * | 2002-06-10 | 2011-05-10 | Ebay Inc. | Method and system for scheduling transaction listings at a network-based transaction facility |
US20030229554A1 (en) * | 2002-06-10 | 2003-12-11 | Veres Robert Dean | Method and system for composing transaction listing descriptions for use in a network-based transaction facility |
US8719041B2 (en) | 2002-06-10 | 2014-05-06 | Ebay Inc. | Method and system for customizing a network-based transaction facility seller application |
US20040199421A1 (en) * | 2003-04-04 | 2004-10-07 | Oda Lisa Maureen | Method and system to discharge a liability associated with a proprietary currency |
US9881308B2 (en) | 2003-04-11 | 2018-01-30 | Ebay Inc. | Method and system to facilitate an online promotion relating to a network-based marketplace |
AU2003276690A1 (en) * | 2003-05-14 | 2004-12-03 | Dharamdas Gautam Goradia | System for building and sharing a databank of jokes and/or such humor |
US7742985B1 (en) | 2003-06-26 | 2010-06-22 | Paypal Inc. | Multicurrency exchanges between participants of a network-based transaction facility |
US7751805B2 (en) * | 2004-02-20 | 2010-07-06 | Google Inc. | Mobile image-based information retrieval system |
US7565139B2 (en) * | 2004-02-20 | 2009-07-21 | Google Inc. | Image-based search engine for mobile phones with camera |
US8421872B2 (en) * | 2004-02-20 | 2013-04-16 | Google Inc. | Image base inquiry system for search engines for mobile telephones with integrated camera |
US20070159522A1 (en) * | 2004-02-20 | 2007-07-12 | Harmut Neven | Image-based contextual advertisement method and branded barcodes |
US9189568B2 (en) | 2004-04-23 | 2015-11-17 | Ebay Inc. | Method and system to display and search in a language independent manner |
US7882116B2 (en) * | 2005-05-18 | 2011-02-01 | International Business Machines Corporation | Method for localization of programming modeling resources |
US8265924B1 (en) | 2005-10-06 | 2012-09-11 | Teradata Us, Inc. | Multiple language data structure translation and management of a plurality of languages |
US7917286B2 (en) | 2005-12-16 | 2011-03-29 | Google Inc. | Database assisted OCR for street scenes and other images |
US10062062B1 (en) | 2006-05-25 | 2018-08-28 | Jbshbm, Llc | Automated teller machine (ATM) providing money for loyalty points |
US9704174B1 (en) | 2006-05-25 | 2017-07-11 | Sean I. Mcghie | Conversion of loyalty program points to commerce partner points per terms of a mutual agreement |
US8684265B1 (en) | 2006-05-25 | 2014-04-01 | Sean I. Mcghie | Rewards program website permitting conversion/transfer of non-negotiable credits to entity independent funds |
US8668146B1 (en) | 2006-05-25 | 2014-03-11 | Sean I. Mcghie | Rewards program with payment artifact permitting conversion/transfer of non-negotiable credits to entity independent funds |
US7703673B2 (en) | 2006-05-25 | 2010-04-27 | Buchheit Brian K | Web based conversion of non-negotiable credits associated with an entity to entity independent negotiable funds |
US8639782B2 (en) | 2006-08-23 | 2014-01-28 | Ebay, Inc. | Method and system for sharing metadata between interfaces |
US9471562B2 (en) | 2006-10-10 | 2016-10-18 | Abbyy Infopoisk Llc | Method and system for analyzing and translating various languages with use of semantic hierarchy |
US8195447B2 (en) | 2006-10-10 | 2012-06-05 | Abbyy Software Ltd. | Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US8078450B2 (en) * | 2006-10-10 | 2011-12-13 | Abbyy Software Ltd. | Method and system for analyzing various languages and constructing language-independent semantic structures |
US9047275B2 (en) | 2006-10-10 | 2015-06-02 | Abbyy Infopoisk Llc | Methods and systems for alignment of parallel text corpora |
US8145473B2 (en) | 2006-10-10 | 2012-03-27 | Abbyy Software Ltd. | Deep model statistics method for machine translation |
US9892111B2 (en) | 2006-10-10 | 2018-02-13 | Abbyy Production Llc | Method and device to estimate similarity between documents having multiple segments |
US8892423B1 (en) | 2006-10-10 | 2014-11-18 | Abbyy Infopoisk Llc | Method and system to automatically create content for dictionaries |
US9235573B2 (en) | 2006-10-10 | 2016-01-12 | Abbyy Infopoisk Llc | Universal difference measure |
US9588958B2 (en) | 2006-10-10 | 2017-03-07 | Abbyy Infopoisk Llc | Cross-language text classification |
US8548795B2 (en) * | 2006-10-10 | 2013-10-01 | Abbyy Software Ltd. | Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system |
US9984071B2 (en) | 2006-10-10 | 2018-05-29 | Abbyy Production Llc | Language ambiguity detection of text |
US8214199B2 (en) * | 2006-10-10 | 2012-07-03 | Abbyy Software, Ltd. | Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions |
US9189482B2 (en) | 2012-10-10 | 2015-11-17 | Abbyy Infopoisk Llc | Similar document search |
US20080086298A1 (en) * | 2006-10-10 | 2008-04-10 | Anisimovich Konstantin | Method and system for translating sentences between langauges |
US9053090B2 (en) | 2006-10-10 | 2015-06-09 | Abbyy Infopoisk Llc | Translating texts between languages |
US9645993B2 (en) | 2006-10-10 | 2017-05-09 | Abbyy Infopoisk Llc | Method and system for semantic searching |
US9495358B2 (en) | 2006-10-10 | 2016-11-15 | Abbyy Infopoisk Llc | Cross-language text clustering |
US9633005B2 (en) | 2006-10-10 | 2017-04-25 | Abbyy Infopoisk Llc | Exhaustive automatic processing of textual information |
US8959011B2 (en) | 2007-03-22 | 2015-02-17 | Abbyy Infopoisk Llc | Indicating and correcting errors in machine translation systems |
US8812296B2 (en) | 2007-06-27 | 2014-08-19 | Abbyy Infopoisk Llc | Method and system for natural language dictionary generation |
US7962324B2 (en) * | 2007-08-28 | 2011-06-14 | International Business Machines Corporation | Method for globalizing support operations |
US9262409B2 (en) | 2008-08-06 | 2016-02-16 | Abbyy Infopoisk Llc | Translation of a selected text fragment of a screen |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
RU2592395C2 (ru) | 2013-12-19 | 2016-07-20 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Разрешение семантической неоднозначности при помощи статистического анализа |
RU2586577C2 (ru) | 2014-01-15 | 2016-06-10 | Общество с ограниченной ответственностью "Аби ИнфоПоиск" | Фильтрация дуг в синтаксическом графе |
US9508360B2 (en) * | 2014-05-28 | 2016-11-29 | International Business Machines Corporation | Semantic-free text analysis for identifying traits |
RU2596600C2 (ru) | 2014-09-02 | 2016-09-10 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы обработки изображений математических выражений |
US10178473B2 (en) | 2014-09-05 | 2019-01-08 | Plantronics, Inc. | Collection and analysis of muted audio |
US9626358B2 (en) | 2014-11-26 | 2017-04-18 | Abbyy Infopoisk Llc | Creating ontologies by analyzing natural language texts |
US9431003B1 (en) | 2015-03-27 | 2016-08-30 | International Business Machines Corporation | Imbuing artificial intelligence systems with idiomatic traits |
US9683862B2 (en) * | 2015-08-24 | 2017-06-20 | International Business Machines Corporation | Internationalization during navigation |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0782498B2 (ja) * | 1985-01-14 | 1995-09-06 | 株式会社日立製作所 | 機械翻訳システム |
JPS6337472A (ja) * | 1986-08-01 | 1988-02-18 | Hitachi Ltd | 冠詞設定方式 |
US4864503A (en) * | 1987-02-05 | 1989-09-05 | Toltran, Ltd. | Method of using a created international language as an intermediate pathway in translation between two national languages |
JP2534360B2 (ja) * | 1988-09-26 | 1996-09-11 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 接続方法、ノ―ド接続方法、デ―タ処理方法、及び木内にノ―ドを挿入する方法 |
SE466029B (sv) * | 1989-03-06 | 1991-12-02 | Ibm Svenska Ab | Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem |
EP0473864A1 (en) * | 1990-09-04 | 1992-03-11 | International Business Machines Corporation | Method and apparatus for paraphrasing information contained in logical forms |
US5497319A (en) * | 1990-12-31 | 1996-03-05 | Trans-Link International Corp. | Machine translation and telecommunications system |
JPH05120324A (ja) * | 1991-10-30 | 1993-05-18 | Sharp Corp | 言語処理方式 |
JP3038079B2 (ja) * | 1992-04-28 | 2000-05-08 | シャープ株式会社 | 自動翻訳装置 |
ES2101613B1 (es) * | 1993-02-02 | 1998-03-01 | Uribe Echebarria Diaz De Mendi | Metodo de traduccion automatica interlingual asistida por ordenador. |
US5659765A (en) * | 1994-03-15 | 1997-08-19 | Toppan Printing Co., Ltd. | Machine translation system |
US5587903A (en) * | 1994-06-22 | 1996-12-24 | Yale; Thomas W. | Artificial intelligence language program |
-
1996
- 1996-10-31 US US08/740,654 patent/US5884247A/en not_active Expired - Fee Related
-
1997
- 1997-10-28 BR BR9712854-6A patent/BR9712854A/pt unknown
- 1997-10-28 WO PCT/US1997/019428 patent/WO1998019254A1/en not_active Application Discontinuation
- 1997-10-28 JP JP10520670A patent/JP2001503175A/ja active Pending
- 1997-10-28 CA CA002270191A patent/CA2270191A1/en not_active Abandoned
- 1997-10-28 CN CN97199304A patent/CN1237254A/zh active Pending
- 1997-10-28 EP EP97912946A patent/EP0935782A1/en not_active Withdrawn
- 1997-10-28 AU AU50009/97A patent/AU721926B2/en not_active Ceased
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1530861B (zh) * | 2003-02-24 | 2010-05-26 | 微软公司 | 语言翻译方法及其系统 |
CN107291703A (zh) * | 2017-05-17 | 2017-10-24 | 百度在线网络技术(北京)有限公司 | 翻译服务应用中的发音方法及装置 |
CN107291703B (zh) * | 2017-05-17 | 2021-06-08 | 百度在线网络技术(北京)有限公司 | 翻译服务应用中的发音方法及装置 |
CN112906406A (zh) * | 2021-03-30 | 2021-06-04 | 携程旅游信息技术(上海)有限公司 | 酒店房型名称的翻译方法、系统、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
AU721926B2 (en) | 2000-07-20 |
CA2270191A1 (en) | 1998-05-07 |
WO1998019254A1 (en) | 1998-05-07 |
AU5000997A (en) | 1998-05-22 |
JP2001503175A (ja) | 2001-03-06 |
BR9712854A (pt) | 1999-12-07 |
EP0935782A1 (en) | 1999-08-18 |
US5884247A (en) | 1999-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1237254A (zh) | 关于自动语言翻译的方法和装置 | |
Price | A comprehensive French grammar | |
Liberman et al. | The stress and structure of modified noun phrases in English | |
Aĭkhenvalʹd et al. | The Manambu language of East Sepik, Papua New Guinea | |
Muzale et al. | Researching and documenting the languages of Tanzania | |
Yorkston et al. | A comparison of standard and user vocabulary lists | |
Van Roey | French-English contrastive lexicology: An introduction | |
Burton | Mastering English Grammar | |
ZAREEI et al. | PATTERNS OF THE IRANIAN ADVANCED LEARNERS'PROBLEMS WITH ENGLISH COLLOCATIONS: A FOCUS ON LEXICAL COLLOCATIONS | |
Kulemeka | The status of the ideophone in Chichewa | |
Chulanova | Lexicology in theory, practice and tests | |
Carlin | Speech community formation: a sociolinguistic profile of the Trio of Suriname | |
Berlinski | Fieldwork: A Novel | |
Collette | Nakota Linguistic Acculturation | |
Cannon | Northern Dene Astronomical and Sky-Related Knowledge: A Comparative Anthropological Study | |
Sipka | The geography of words: vocabulary and meaning in the world's languages | |
Evans et al. | Teacher's Guide | |
Piankova | Perfect Compositions | |
Єфремова et al. | Seminars in Lexicology: Teaching Aid for Students | |
Baxter | Kristang (Malacca Creole Portuguese) | |
O'Neill | All strangers are kin: Adventures in Arabic and the Arab world | |
MXPA99003732A (en) | Method and apparatus for automated language translation | |
Herrera | LATINX POETICS: Essays on the Art of Poetry | |
Hays | Drive | |
Arnaiz | The Collected Works |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |