CN1834955A - 多语种翻译存储器、翻译方法以及翻译程序 - Google Patents
多语种翻译存储器、翻译方法以及翻译程序 Download PDFInfo
- Publication number
- CN1834955A CN1834955A CNA2005100938291A CN200510093829A CN1834955A CN 1834955 A CN1834955 A CN 1834955A CN A2005100938291 A CNA2005100938291 A CN A2005100938291A CN 200510093829 A CN200510093829 A CN 200510093829A CN 1834955 A CN1834955 A CN 1834955A
- Authority
- CN
- China
- Prior art keywords
- dictionary
- trie structure
- translation
- language
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
多语种翻译存储器、翻译方法以及翻译程序。适于句子翻译的基于实例记忆的翻译存储器包括:第一语言的第一检索词典,具有第一词典TRIE结构和第一索引TRIE结构;以及第二语言的第二检索词典,具有第二词典TRIE结构和第二索引TRIE结构。第一词典TRIE结构和第二词典TRIE结构分别在其从根节点到多个叶子节点的各路径上存储子字符串。第一索引TRIE结构和第二索引TRIE结构分别存储用于指出存储在第一词典TRIE结构和第二词典TRIE结构中的子字符串的索引信息。存储在第一检索词典中的索引信息包括对用于指出第二检索词典中的作为对第一检索词典中的子字符串的译文子字符串的索引信息进行标识的标识信息。
Description
技术领域
本发明涉及将原始语言的句子、字符串或者文章翻译成目标语言的句子、字符串或者文章的多语种翻译装置,更具体地,涉及用于利用TRIE结构的翻译存储器的技术。
背景技术
将原始语言翻译成目标语言的机器翻译技术包括词对词直接翻译技术、基于分析的翻译技术和中间语言方法、基于统计的翻译技术、基于实例句子的翻译技术等。
对于词对词直接翻译技术,是将构成原始语言句子中的各个词直接翻译成目标语言的词,并根据统计数据或者预定规则生成目标语言的译文。
对于基于分析的翻译技术和中间语言方法,是对原始语言句子进行分词·标注分析、句法分析以及语义分析,并转换为目标语言的语义、句法、语素,然后生成目标语言中的译文。对于中间语言方法,是对原始语言的句子进行分析并将其转换为中间语言,根据转换的中间语言生成目标语言中的译文。
对于基于统计的翻译技术,是利用语言模型和翻译模型将原始语言翻译成目标语言。对于基于实例的翻译技术,像人类学习外语的过程一样,是参照对翻译的实例对例句进行学习而构成的知识库来将原始语言的输入句子翻译为目标语言的句子。
在上述的翻译技术中,中间语言方法的若干专利文献已公开。例如,日本专利申请特开平第6-32508号公报(以下称作文献1)提供了一种自动翻译系统,该自动翻译系统可以利用一种中间语言同时把一种原始语言翻译成两种或更多种目标语言。该翻译系统,对于原语言的文本数据,可进行高精度地分析和语义理解,能明确地表现知识信息,并以高水平的“翻译质量/时间”将以原始语言书写的文献翻译成多种目标语言。
日本专利申请特开昭第62-251875号公报(以下称作文献2)描述了一种电子翻译装置,该电子翻译装置根据与输入的原始语言相关的信息来提取标准化的中间语言,并根据提取的标准化中间语言生成与提取的标准化中间语言对应的目标语言的信息。
日本专利申请特开平第5-290082号公报(以下称作文献3)提供了一种用于机器翻译的翻译模式,根据该翻译模式用户可以容易地写作并有效地检索。将句子模板存储在具有树结构的检索词典中,将输入的文本句子与检索词典进行匹配。如果成功,则获得另一语言的对应句子模板,利用该对应句子的模板构成目标语言的文本句子。如果不成功,则利用基于语言分析的机器翻译技术和生成方法来进行翻译。
此外,翻译存储器的技术包括字符索引方法和词索引方法。根据字符索引方法,通过针对翻译对的双语语料库中包括的所有字符创建字符索引来实现翻译存储器。根据词索引方法,通过针对翻译对的双语语料库中包括的所有词创建词索引来实现翻译存储器。
注意,常规的翻译技术具有以下缺陷。可以以相对容易的方式来构建词对词直接翻译技术,然而同时,不能保证翻译准确度。中间语言方法可以对多语机器翻译起作用,然而句法分析和语义分析的技术并不成熟,实际应用非常困难。此外,对于中间语言方法,高度的语言分析和中间语言生成技术是必不可少的,并且,中间语言方法不能应用于许多领域的翻译,难以增强其功能,并且也很难对翻译工具进行维护。
文献3中公开的技术利用树结构来存储句子模板。如果在比较句子模板时发现了部分模板,则用一个变量来代替该部分模板,使得能够扩大该模板的表达范围。然而,如果没有将句子中包括的词作为部分模板登录在树结构中,则存在如下的问题:即使存在对应于句子的模板,也不能找到该模板。在文献3的图7所示的树结构中,在句子“改进接触点”中“改进……”的模板被找到。然而,如果没有登录“改进功能”中的部分模板“功能”,则不能匹配“改进……”模板。此外,即使在树结构的较下级树中登录了“功能”的部分模板,也不能匹配“改进……”模板。这引起了另一问题:为了覆盖较广范围表达,必需大量的登录句子模板。
利用字符索引方法的实例翻译存储器在实时翻译方面有困难。利用词索引方法的实例翻译存储器除了在实时翻译方面的困难之外,还不能用于多语翻译系统。
发明内容
鉴于上述背景,提出了本发明以解决上述问题,本发明提供了可以将原始语言的句子准确地翻译成目标语言的句子的翻译存储器、翻译系统以及翻译程序。
本发明还提供了可以将原始语言的句子同时翻译为多种目标语言的句子的翻译存储器、翻译系统以及翻译程序。
本发明进一步提供了可以减小双语检索词典等的存储容量并且可以高速进行翻译的翻译存储器、翻译系统以及翻译程序。
根据本发明的一个方面,可以提供一种适于句子翻译的基于实例记忆的实例翻译存储器,其包括:第一语言的第一检索词典,具有第一词典TRIE结构和第一索引TRIE结构;以及第二语言的第二检索词典,具有第二词典TRIE结构和第二索引TRIE结构。第一词典TRIE结构和第二词典TRIE结构分别在其从根节点到多个叶子节点的各路径上存储有各子字符串。第一索引TRIE结构和第二索引TRIE结构分别存储第一词典TRIE结构和第二词典TRIE结构中的子字符串的索引信息。存储在第一检索词典中的索引信息包括对用于指出第二检索词典中的作为对第一检索词典中的子字符串的译文子字符串的索引信息进行标识的标识信息。采用词典TRIE结构和索引TRIE结构的双结构,以使得可以检索子字符串、可以尽可能地减小存储容量,并且可以加速基于句子的翻译。
根据本发明另一方面,可以提供一种机器翻译系统,其包括:上述的翻译存储器;翻译引擎(engine),接收翻译存储器所不能翻译的句子并翻译该句子;以及输出部,输出由翻译存储器翻译的句子或者输出用翻译引擎翻译的句子。
根据本发明的另一方面,可以提供一种适于句子翻译的基于实例记忆的翻译存储器,其包括检索词典,该检索词典分别具有用于第一语言和第二语言的词典TRIE结构和索引TRIE结构。第一语言和第二语言各自的词典TRIE结构在从其根节点到多个叶子节点的各路径上存储着子字符串。第一语言和第二语言各自的索引TRIE结构存储有用于指出第一语言和第二语言中的对应一种的子字符串的第一索引信息。该第一索引信息包括标识用于指出第二语言的子字符串的第二索引信息的标识信息。在一个词典TRIE结构中存储多种语言的多个字符串,在一个索引TRIE结构中存储多种语言的多项索引信息。这使得可以减小存储容量并加速翻译过程。
根据本发明的另一方面,可以提供一种可由计算机读取以执行用于将原始语言翻译为目标语言的翻译程序的存储介质,该存储介质的功能包括以下步骤:将第一语言和第二语言的子字符串存储在第一词典TRIE结构和第二词典TRIE结构中的从根节点到多个叶子节点的各路径上;以及在第一检索词典和第二检索词典中的第一索引TRIE结构和第二索引TRIE结构中建立指出存储在第一词典TRIE结构和第二词典TRIE结构中的子字符串的索引信息。
附图说明
根据以下附图来详细说明本发明的实施例,在附图中:
图1表示根据本发明第一实施例的机器翻译系统的整体配置;
图2表示翻译存储器引擎的配置;
图3表示本发明实施例的翻译存储器引擎的硬件配置;
图4表示翻译存储器的检索词典的配置;
图5表示TRIE结构的示例;
图6是示出词典TRIE结构的图;
图7是示出索引TRIE结构的图;
图8是构建词典TRIE结构的流程图;
图9是示出对字符串进行分割的示例的图;
图10表示将翻译数据登录在检索词典中的示例;
图11A表示词典TRIE结构中的节点的物理结构;
图11B表示索引TRIE结构;
图12A和12B表示标志和语言ID;
图13A表示词典TRIE结构中的节点的逻辑结构;
图13B表示索引TRIE结构中的节点的逻辑结构;
图14是示出如何标注节点ID的图;
图15表示节点记录的排列;
图16表示检索词典的处理流程;
图17是示出将语言i的文本句子翻译为语言j的另一文本句子的操作的流程图;
图18表示日语与汉语之间的翻译示例;
图19是示出日语和汉语的词典TRIE结构和索引TRIE结构的图;
图20表示日语与英语之间的翻译示例;
图21是示出日语和英语的词典TRIE结构和索引TRIE结构的图;
图22表示根据本发明第二实施例的用于翻译存储器的检索词典;
图23A表示根据本发明第三实施例的用于翻译存储器的检索词典;
图23B表示根据本发明第三实施例的语言i的语言TRIE结构的节点结构;以及
图24A和24B表示本发明第三实施例的变型例。
具体实施方式
现在将参照附图对本发明的实施例进行说明。
图1表示根据本发明第一实施例的机器翻译系统1的整体配置。机器翻译系统1不能正确地翻译文献的所有部分。如果强迫翻译无法翻译的部分,这将使用户迷惑,并且这可能对理解原始内容造成不利影响。因此,机器翻译系统1设计为能够区分翻译结果是否成功,能提供翻译结果的可信度。此外,翻译系统具备学习功能,从而可以自动收集无法翻译的部分,并对无法翻译的部分进行人工翻译修改,通过自动学习人工翻译修改过的译文数据,可以改进翻译系统的翻译性能。
机器翻译系统1包括翻译存储器引擎12、分词·标注分析部分14、基于模板的翻译引擎16、基于chunk的示例翻译引擎18、基于分析的或者词对词直接翻译引擎20、以及目标语言文本形成部22。翻译存储器引擎12对从原始语言文本句子输入部10输入的各个句子进行翻译。对于不能在翻译存储器引擎12的数据库中相匹配的部分(即,不能准确翻译的部分)输入到分词·标注分析部14,以对输入部分的语素进行分析。然后在将分析·标注分析部14中分析的输入句子的分析结果输入到基于模板的翻译引擎16中以基于模板进行翻译。如果基于模板的翻译引擎16不能翻译该分析结果,则将对输入句子的分词·标注分析的结果输入到基于chunk的实例翻译引擎18,利用基于chunk的实例句对(词的组合或者诸如名词短语的短语)来进行翻译。如果基于chunk的实例翻译引擎18不能翻译分词·标注分析的结果,则将分词·标注分析的结果输入到基于分析的或者词对词直接翻译引擎20以根据分析或者词来翻译。目标语言文本形成部22形成目标语言的文本句子。
将在翻译存储器引擎12、基于模板的翻译引擎16或者基于chunk的实例翻译引擎18中能够成功翻译的翻译结果数据分别输入到目标语言文本形成部22。目标语言文本形成部22根据翻译结果数据形成目标语言的文本。这里,对成功地进行了翻译的部分提供标识,以明示翻译结果的准确性。另一方面,由基于分析的或者词对词直接翻译引擎20翻译的翻译结果数据仅仅作为参考在目标语言文本形成部22输出。这使得用户能够查看并且知道翻译文本中哪部分为可靠或者不可靠。
收集部24收集在基于chunk的实例翻译引擎18中翻译失败的文本数据。对收集到的不能翻译的部分进行人工翻译。人工翻译的结果输出到学习引擎26。学习引擎26根据正确的翻译将翻译数据进行学习,并把学习结果登录到翻译词典28。
图2表示根据本实施例的翻译存储器引擎的配置。翻译存储器引擎12包括与N(1,2,……,N)种语言相对应的检索词典12-1、12-2、……、和12-N。将检索词典12-1的输出输入到检索词典12-2并且将检索词典12-N的输出输入到检索词典12-1。可以把检索词典12-1到12-N这N个检索词典连接起来以形成双向循环。从原始语言文本句子输入部分10输入文本句子,翻译存储器引擎12能够用检索词典12-1将该文本句子翻译为语言1,还能够用检索词典12-2将语言1的翻译结果翻译为语言2。换言之,可以同时将输入的文本句子翻译为N种语言。目标语言文本形成部分22输出用户指定的目标语言的翻译。目标语言不限于单种语言,可以包括两种或更多种。
图3表示翻译存储器引擎12的硬件配置。翻译存储器引擎12包括:输入装置30、显示装置32、主存储装置34、外部存储装置36、中央处理单元(CPU)38、以及连接前述装置和单元的总线40。输入装置30可以是通过键操作输入单词的键盘、对文件中所列的单词进行光学读取的光学读取器、或者其他硬件或软件的计算结果。
显示装置32包括输出原始语言的文本句子或者从原始语言翻译出的目标语言的句子的显示器等。主存储装置34包括用于存储数据(例如用于控制翻译存储器的程序和计算结果)的ROM或者RAM。外部存储装置36例如包括诸如硬盘的大容量存储装置,以存储句子翻译所必需的诸如检索词典12-1到12-N的翻译词典。CPU(中央处理单元)38根据存储在主存储装置34中的程序对各个装置或者单元进行控制。
接下来,对翻译存储器引擎进行更详细的说明。图4表示翻译存储器的检索词典的配置。检索词典12-1到12-N各自包括词典TRIE结构100-1到100-N以及索引TRIE结构200-1到200-N。词典TRIE结构100-1按照TRIE结构存储与语言1相关的子字符串。索引TRIE结构200-1按照TRIE结构存储用于指出词典TRIE结构100-1中的子字符串的索引信息。在各种语言中都建有具有词典TRIE结构和索引TRIE结构的双TRIE结构。
TRIE结构是语言信息处理领域中的合并了检索关键字组中的公用字符串的树结构。图5示出了其中包括5个检索关键字“AB”、“ABCD”、“ABCE”、“ABXY”以及“ABXZ”的TRIE结构的示例。图5中的$可以用作表示词后缀的特殊字符。在基于TRIE结构的检索中,当从左起顺序地扫描要搜索的字符串时,从存有字符信息的根节点(节点N1)到各节点N2~N13对树进行追踪,并提取与要检索的字符串相匹配的词。根据TRIE结构,可以在与要检索的字符串成比例的时间段内而不依赖于检索关键字的数量迅速地对字符进行检索。
图6是示出词典TRIE结构的图。词典TRIE结构在从根节点110到叶子节点120-1至120-N的路径上存储多个子字符串。例如,对从叶子节点120-1到根节点的路径进行追踪可得到该路径上的节点中包括的子字符串M10、M11、……、M1n。以同样的方式,对从叶子节点120-2到根节点的路径进行追踪可得到该路径上的节点中包括的子字符串M20、M21、……、M2n。可以根据需要确定从根节点到叶子节点的路径上存在的节点的数量,即子字符串的字符的数量。
图7是示出索引TRIE结构的图。索引TRIE结构使得可以检索并给出词典TRIE结构中包括的字符串。索引TRIE结构中的各个节点是用于存储字符串的索引信息。索引信息包括用于识别词典TRIE结构的叶子节点的信息。例如,节点222-2存储索引信息IN2,索引信息IN2包括词典TRIE结构的叶子节点120-2的信息。节点220-2存储索引信息IN1,索引信息IN1包括词典TRIE结构的端节点120-1的信息。换言之,索引信息IN2可以指出M20、M21、……、M2n的子字符串,索引信息IN1可以指出M10、M11、……、以及M1n的子字符串。以这种方式,可以通过索引TRIE结构中的从叶子节点到根节点的路径中包括的索引信息指出由词典TRIE结构中的各个子字符串所组成的句子。
此外,索引TRIE结构中的叶子节点220-1、220-2、……、220-N链接到另一索引TRIE结构中的叶子节点230-1、230-2、……、230-N。该链接指出了原始语言的句子与目标语言的翻译句子之间的关系。例如,叶子节点220-2包括设置在另一语言的索引TRIE结构中的叶子节点230-1的信息以链接到叶子节点230-1。由从叶子节点230-1到根节点212的路径上的各节点中存储的索引信息IN1、IN2以及IN3所给出的各子字符串所组成的句子,是从叶子节点220-2到根节点210的路径上的各节点中存储的索引信息IN1、IN2、IN3以及IN4所给出的各子字符串的译文。
下面将对词典TRIE结构的创建流程进行说明。参照图8,新注册或者添加词典TRIE结构。从用于翻译存储器的双语数据文件输入数据(步骤S101)。CPU 38在数据格式转换中将输入的数据转换为统一码(Unicode)。并生成字符串J和另一字符串C。字符串C是对字符串J的译文。
然后,CPU 38从左到右将字符串J分为具有长度mj的kj个子字符串J1、J2、……、Jkj,如图9所示(步骤S103)。以同样的方式,CPU 38从左到右将字符串C分为具有长度mc的kc个子字符串C1、C2、……、Ckc。
接下来,CPU 38对子字符串J1、J2、……、Jkj或者子字符串C1、C2、……、Ckc是否包括在各自对应语言的检索词典中进行检查(步骤S104)。如果没有检测到字符串J和C,则CPU 38将子字符串J1、J2、……、Jkj或者子字符串C1、C2、……、Ckc分别登录在对应的检索词典中,将信息存储在日志文件中并结束过程(步骤S106)。
相反地,如果子字符串J1、J2、……、Jkj或者子字符串C1、C2、……、Ckc包括在各自对应语言的检索词典中,则CPU 38将信息存储在日志文件中并结束过程(步骤S106)。
用户能够对存储在外部存储装置36中的检索词典的内容进行编辑。使得能用显示装置32显示现有检索词典中注册的字符串,并可用输入装置30进行校正。
图10表示在检索词典中登录的翻译数据的示例。在图10中,100-J是语言J的词典TRIE结构,词典100-C是语言C的词典TRIE结构。如上所述,从翻译数据输入两种语言之一的语言J的字符串,将语言J的字符串分割为子字符串J1、J2、……、Jkj并将其追加到词典TRIE结构100-J中。另一方面,将作为对字符串J的翻译的字符串C分割为子字符串C1、C2、……、Ckc并将其追加到词典TRIE结构100-C中。
在词典TRIE结构100-J中子字符串J1、J2、……、Jkj被存储在从根节点到叶子节点的路径上。由此形成语言J的索引TRIE结构200-J。以同样的方式,在词典TRIE结构100-C中子字符串C1、C2、……、Ckc被存储在从根节点到叶子节点的路径上。由此形成语言C的索引TRIE结构200-C。
接下来,建立语言J的索引TRIE结构中的叶子节点与语言C的索引TRIE结构中的叶子节点之间的链接关系。以这种方式,根据翻译数据将检索词典构建为对应于多种语言。
此外,关于分割子字符串的方法,例如,可以预定子字符串中包括的字符个数。在这种情况下,输入句子除以预定数的值为子字符串的个数。另一种方法,可以预定子字符串的个数。在这种情况下,将输入句子除以子字符串个数的值设为子字符串中的字符个数。子字符串中的字符个数在语言J与语言C之间可以是相同的,或者可以不同。
接下来,对TRIE结构中的节点的结构定义进行说明。存在两种节点的结构定义,一种为物理结构,另一种为逻辑结构。图11A表示词典TRIE结构中节点的物理结构。词典TRIE节点ID 300表示用于标识该节点的信息(ID)。字符信息302表示该节点中包括的字符是日语汉字字符、日语平假名字符、日语片假名字符、还是字母。如图12A所示,字符串标志304是表示该节点是否是字符串中的最末节点的标志。如果标志是0,这表示字符串的末尾。如果标志是1,这不表示字符串的末尾。例如,词典TRIE结构中的叶子节点的标志为0,其他节点的标志为1。
如图12B所示,译文语言ID 306标识语言种类。例如,将日语设为1,汉语设为2,英语设为3。此外,还设有最左子节点的存储器指针308,父节点的存储器指针310、以及右兄弟节点的存储器指针312,这些是TRIE结构中的必要信息。
图11B示出了索引TRIE结构。索引TRIE节点ID 320是用于标识该节点的信息。词典TRIE节点指针321是用于标识与该节点对应的词典TRIE结构中的节点的信息。也就是说,该信息给出了该节点是否是词典TRIE结构中的叶子节点的信息。句子标志322是用于指出该节点是否是叶子节点的信息。然后,还包括译文语言ID 324、最左子节点的存储器指针326、父节点的存储器指针328、以及右兄弟节点的存储器指针330。译文索引TRIE节点ID的指针332是给出译文语言的索引TRIE结构中的对应叶子节点的信息。
图13A示出了词典TRIE结构中的节点的逻辑结构。标号340表示上述的节点中存储的字符信息。标号342表示字符串标志+子节点标志+译文语言ID。如上所述,如果字符串标志是“1”,则该节点是中间节点,如果字符串标志是“0”,则该节点表示字符串的结尾,即,从根节点到该节点的路径上的信息代表一个字符串。如果子节点标志是“0”,这表示该节点没有子节点。如果子节点标志是“1”,这表示该节点有子节点。译文语言ID与上述相同,还包括父节点ID 344和右兄弟节点345。
图13B表示索引TRIE结构中的节点的逻辑结构。词典TRIE节点ID350是该节点相对应的词典TRIE节点结构中的叶子节点ID。句子标志是表示该节点是否是句子的末尾的信息。索引TRIE结构的叶子节点表示句子的末尾,例如,叶子节点的标志是“1”而其他节点的标志是“0”。索引TRIE父节点ID 352是用于给出该节点的父节点的信息。此外,还存储有子标志+索引TRIE右兄弟节点ID 354和译文索引TRIE节点ID 356。
下面,对如何标注节点ID进行说明。图14是示出如何标注节点ID的说明图。按照深度优先顺序对TRIE结构进行检索,根据检索顺序使编号从1或0开始递增,然后标注上节点ID。在标注上节点ID之后,根据节点ID顺序设置并存储对应于节点ID的记录。记录是根据节点ID顺序来排列的,这样可以迅速地访问节点ID所指出的节点信息。
图16示出了检索词典的处理流程。在新追加数据时,先将从图3所示的输入装置30输入的句子分割为子字符串。然后按照图11A所示的节点物理结构的定义来构成词典TRIE结构中的词信息记录(步骤S201)。
接下来,按照深度优先顺序对物理TRIE结构中的所有节点标注ID(步骤S202)。然后,使用物理TRIE结构和节点ID构建逻辑TRIE结构和词信息记录(步骤S203)。由此建立词典TRIE结构和索引TRIE结构(步骤S204)。
在追加和编辑时,先将现有的词典TRIE结构和现有的索引TRIE结构转换为存储器上的物理结构(步骤S205)。然后在存储器上的物理TRIE结构中编辑或者追加句子或子字符串(步骤S206)。这此,必须将TRIE结构的根节点设为空(Null),并且必须从左到右地按照字符信息值的升序来排列各节点的各个子节点。例如,对于需要两个字节来表示一个字符的语言,词典TRIE结构中的每个节点以两个字节代表一个字符。
现在对多语检索词典的设置进行说明。
(1)针对语言1、语言2、……、语言N将语言1、语言2、……、语言N的文本句对分别分割为多个子字符串。将分割的子字符串用于构建各种语言的词典TRIE结构和索引TRIE结构。
(2)对N个翻译词典TRIE结构和索引TRIE结构的节点分别标注节点ID。
(3)存储TRIE结构:TRIE结构的节点信息为固定长度,所以将一个节点信息看作一个记录。按照节点ID的顺序设置TRIE结构的节点信息。这使得能够根据节点ID取出节点ID标示的节点信息。
(4)使用具有语言1的文本句子—语言2的文本句子……语言N的文本句子的多种语言翻译句对的集合,将语言i(i=1,2,……,以及N)的文本句子与语言i的词典TRIE结构进行匹配,若匹配成功,使用通过上述匹配而获得的k个节点ID(ID1(i)、ID2(i)、……、IDk(i))与语言i的索引TRIE结构进行匹配。
(5)如果匹配成功,则获得索引TRIE结构中匹配上的节点ID。把获得的节点ID设置为I(i)。将译文索引TRIE节点ID(译文语言标示i+1)表示为T(i),由此,T(1)=I(2),T(2)=T(3),……,T(N)=I(1)。
参照图17对将语言i的文本句子翻译为语言j的文本句子的翻译流程进行说明。输入文本句子(步骤S301)。将该文本句子分割为子字符串(步骤S302)。将由此分割的子字符串分别与语言i的词典TRIE结构进行匹配(步骤S303)。
如果匹配成功(步骤S304),则使用通过上述匹配而获得的k个节点ID(ID1(i)、ID2(i)、……、IDk(i))与语言i的索引TRIE结构进行匹配。如果匹配成功(步骤S306),则根据与语言i的索引TRIE结构的节点I(i)对应的译文索引TRIE节点ID的值T(i),获得语言i+1的索引TRIE结构中的节点I(i+1)的值T(i+1)(步骤S307)。
如果j等于i+1(步骤S308),则获得从节点I(i+1)到根节点的路径上的信息,并且获得语言j的词典TRIE结构中的h个节点ID(步骤S309)。使用ID1(j)、ID2(j)、……、以及IDh(j),从语言j的词典TRIE结构中获得译文,并输出由此获得的译文(步骤S310)。如果j不等于i+1,则返回步骤S307。这样,将语言i的文本句子翻译为语言j的文本句子。
现在对日语与汉语之间的机器翻译的示例进行说明。该示例可以应用于用双字节来表示一个字符的语言之间的机器翻译。首先,对建立翻译词典的操作进行说明。对日语和汉语的文本句对集合中的各个句对,分别将其分割为日语和汉语的多个子字符串。使用被分割好的子字符串来构建对应语言的词典TRIE结构和索引TRIE结构。将针对如图18所示的文本句子示例来说明怎样从日语翻译成汉语。如图18所示,将日语的文本句子分割为子字符串J1到J7。如图18所示,将汉语的文本句子分割为子字符串C1到C6,将这二者都存储在各自的词典TRIE结构中。这里,将子字符串中的字符个数设为5。
图19是示出日语和汉语的词典TRIE结构和索引TRIE结构的图。对日语和汉语的词典TRIE结构和索引TRIE结构标注节点ID。
对于每一对日语文本句子和汉语文本句子的对译句对,先将对译句对中的日语文本句子与日语的词典TRIE结构进行匹配。然后将由此获得的日语词典TRIE结构中的7个节点ID(ID1(1)、ID2(1)、……、ID7(1))与日语的索引TRIE结构进行匹配。当在日语的索引TRIE结构中匹配成功时取出节点ID1(1)。
再将上述对译句对中的汉语文本句子与汉语的词典TRIE结构进行匹配。将由此获得的6个节点ID(ID1(2)、ID2(2)、……、ID6(2))与汉语的索引TRIE结构进行匹配。当在汉语的索引TRIE结构中匹配成功时获得节点ID1(2)。假定汉语索引TRIE结构中的节点I(1)的节点ID表示为T(1),则T(1)等于I(2)。假定日语的索引TRIE结构中的节点I(2)的节点ID表示为T(2),则T(2)等于I(1)。
接下来说明翻译操作。将日语文本句子分割为子字符串J。将分割的子字符串J1、J2、……、以及J7与日语的词典TRIE结构进行匹配,获得ID1(1)、ID2(1)、……、ID7(1)。
然后,将ID1(1)、ID2(1)、……、ID7(1)作为子字符串与日语的索引TRIE结构进行匹配。通过该匹配获得节点I(1)。通过译文索引TRIE结构中的节点ID(1)的值获得汉语的索引TRIE结构中的节点I(2)。
在汉语的索引TRIE结构中从节点I(2)到根节点对汉语的索引TRIE结构进行回溯,获得汉语的词典TRIE结构中的节点ID(ID1(2)、ID2(2)、……、ID6(2))。使用节点ID(ID1(2)、ID2(2)、……、ID6(2))从汉语的词典TRIE结构提取汉语译文。
现在对日语与英语之间的机器翻译的示例进行说明。该示例可以应用于用双字节来表示一个字符的语言与用单字节来表示一个字符的另一种语言之间的机器翻译。首先,对建立翻译词典的操作进行说明。分别把日语和英语的文本句子组分割为日语和英语的多个子字符串。使用被分割好的子字符串来构建对应语言的词典TRIE结构和索引TRIE结构。将针对如图20所示的文本句子示例来说明怎样从日语翻译成英语。如图20所示,将日语的文本句子分割为子字符串J1到J5。如图20所示,将英语的文本句子分割为E1到E4,将这二者都存储在各自的词典TRIE结构中。这里,将日语的子字符串中的字符个数设为5,将英语的子字符串中的字符个数设为10。
图21是示出日语和英语的词典TRIE结构和索引TRIE结构的图。对日语和英语的词典TRIE结构和索引TRIE结构标注节点ID。
对于每一对日语文本句子和英语文本句子的对译句对,先将其中的日语文本句子与日语的词典TRIE结构进行匹配。然后将由此获得的日语词典TRIE结构中的5个节点ID(ID1(1)、ID2(1)、……、ID5(1))与日语的索引TRIE结构进行匹配。当在日语的索引TRIE结构中匹配成功时获得节点ID1(1)。
再将上述对译句对中的英语文本句子与英语的词典TRIE结构进行匹配。将由此获得的4个节点ID(ID1(2)、ID2(2)、……、ID4(2))与英语的索引TRIE结构进行匹配。当在英语的索引TRIE结构中匹配成功时获得节点ID1(2)。假定在英语的索引TRIE结构中的节点I(1)的节点ID表示为T(1),则T(1)等于I(2)。假定在日语的索引TRIE结构中的节点I(2)的节点ID表示为T(2),则T(2)等于I(1)。
接下来说明翻译操作。将日语文本句子分割为子字符串J。将分割的子字符串J1、J2、……以及J5与日语的词典TRIE结构进行匹配,获得ID1(1)、ID2(1)、……、以及ID5(1)。
然后,将ID1(1)、ID2(1)、……、ID5(1)作为子字符串与日语的索引TRIE结构进行匹配。通过该匹配获得节点I(1)。通过翻译索引TRIE结构中的节点I(1)的值获得英语的索引TRIE结构中的节点I(2)。
在英语的索引TRIE结构中从节点I(2)到根节点对英语的索引TRIE结构进行回溯,获得英语的词典TRIE结构中的节点ID(ID1(2)、ID2(2)、……、ID4(2))。使用节点ID(ID1(2)、ID2(2)、……、以及ID4(2))从英语的词典TRIE结构提取英语译文。
根据本发明的本实施例,翻译存储器能够实现多语翻译,并能准确且迅速地翻译多种语言,此外,翻译词典的大小可以减小到传统TRIE结构的翻译词典的一半或三分之一。特别是,本发明的翻译存储器适合于成语、谚语、技术领域的报告、手册、技术文献等。此外,具有学习能力,通过学习对译句对,可使其能够在学习之后进行更准确的翻译。本发明的翻译存储器可以应用于建立多语种词到词直接翻译词典和基于模板的多语种实例机器翻译装置。
下面将对本发明的第二实施例进行说明。词典TRIE结构和索引TRIE结构可对应多种语言(优选为包括两种语言)。
参照图22,将表示第一语言的句子的字符串J分割为子字符串J1、J2、……、以及Jk1,将子字符串J1、J2、……、Jk1输入词典TRIE结构400。将表示第二语言的句子的字符串C分割为子字符串C1、C2、……、Ck2,将子字符串C1、C2、……、Ck2输入词典TRIE结构400。
在词典TRIE结构400中从根节点到节点IDi的路径上存储记录Ji的信息,根据ID1、ID2、……、以及IDk1建立索引TRIE结构410。在词典TRIE结构400中的从根节点到节点IDj的路径上存储记录Cj的信息,根据ID1、ID2、……、以及IDk1建立索引TRIE结构410。然后,将两种语言的信息之间的关系添加到索引TRIE结构。这使得可以使词典TRIE结构和索引TRIE结构对应于两种语言。
现在对本发明的第三实施例进行说明。根据本发明的第三实施例,词典TRIE结构和索引TRIE结构包括在一个结构中。图23A示出了根据本发明第三实施例的用于翻译存储器的检索词典。这里,为了简化,示出语言i和语言j的检索词典。
将语言i的句子的字符串Si登录到语言TRIE结构400-i。将字符串Si的信息存储在语言i的语言TRIE结构400-i中的从根节点到叶子节点IDi的路径上。以同样的方式,将字符串Sj的信息存储在语言j的语言TRIE结构400-j中的从根节点到叶子节点IDj的路径上。
图23B示出了语言i的语言TRIE结构的节点结构。节点结构包括节点ID 402、字符信息404、句子标志+子节点标志+译文语言ID 406、与语言j的检索词典对应的译文句子的节点ID 408、父节点410、以及右兄弟节点412。
为了进行翻译,输入字符串Si,从语言i的TRIE结构400-i的根节点开始搜索节点IDi,从节点IDi获得译文信息IDj。通过从语言j的TRIE结构的节点IDj向根节点进行反向扫描,获得译文句子Sj。
如果根据本发明第三实施例,检索词典限于两种语言,则可以如图24A所示地构成TRIE结构。将语言1的句子J和语言2的句子C分别输入词典TRIE结构500以建立检索词典。在TRIE结构500中,从根节点到节点IDj的路径上存储有关句子J的信息。在TRIE结构500中,从根节点到节点IDc的路径上存储有关句子C的信息。图24B表示其节点结构。在这种情况下,译文句子的节点ID 502对应于语言1或者语言2的译文信息。
为了进行翻译,从TRIE结构500的根节点开始搜索句子J,获得节点IDj,并且获得IDj节点中存储的译文句子的信息IDc。可以通过从语言j的TRIE结构500的节点Idc向根节点进行反向扫描来获得译文句子C。
使用本实施例的翻译存储器,可以获得以下的效果。第一实施例的翻译存储器的空间量与字符索引方法的几乎相等,然而,已经发现使用第一实施例的翻译存储器的翻译速率比字符索引方法的翻译速率快24,000倍。此外,与单词索引方法相比,可以大大减小存储容量,并且翻译速率比单词索引方法快几乎500倍。此外,第一实施例的翻译存储器的存储容量比第三实施例的翻译存储器的存储容量小56%。第一实施例的翻译速率比第三实施例的翻译速率约快4倍。
关于上述方面的翻译存储器,可以针对每种语言构建检索词典,可任意选择目标语言。换言之,本发明的翻译存储器是多语种翻译存储器。
关于上述方面的翻译存储器,用户输入任意语言的句子,获得其在对应语言中的翻译。用户能够选择目标语言。
关于上述方面的翻译存储器,如果词典TRIE结构在每个子字符串中具有5个字符,则将输入的句子按5个字符分割,在词典TRIE结构中对具有5个字符的子字符串进行检索。
本发明的翻译存储器可以应用于多语种机器翻译系统,例如,基于模板的或基于实例的多语种机器翻译,或者基于chunk的实例多语种机器翻译。此外,本发明的翻译存储器可以应用于扫描(scan)翻译,根据扫描翻译,像复印那样实时地对文本进行翻译以获得电子数据,还可以应用于具有扫描翻译装置的多语翻译业务,所述扫描翻译装置具有自动判断翻译结果的可信度功能和自动回收不能翻译的功能。此外,用于执行翻译存储器的软件可以安装在计算机上,或者可以用作移动或者便携式电子词典。
虽然已经示出并说明了本发明的一些实施例,但是本领域技术人员应该理解,可以在不脱离本发明的原则和精神的情况下对这些实施例进行修改,本发明的范围在权利要求及其等同物中限定。
在此通过引用全部并入2005年3月14日提交的包括说明书、权利要求书、附图和摘要的日本专利申请No.2005-071068中的全部公开内容。
Claims (18)
1、一种适于句子翻译的基于实例记忆的翻译存储器,其包括:
第一语言的第一检索词典,具有第一词典TRIE结构和第一索引TRIE结构;以及
第二语言的第二检索词典,具有第二词典TRIE结构和第二索引TRIE结构,
第一词典TRIE结构和第二词典TRIE结构分别在其从根节点到多个叶子节点的各路径上存储子字符串,
第一索引TRIE结构和第二索引TRIE结构分别存储用于指出存储在第一词典TRIE结构和第二词典TRIE结构中的子字符串的索引信息,
存储在第一检索词典中的索引信息包括标识信息,该标识信息对用于指出第二检索词典中的作为对第一检索词典中的子字符串的译文子字符串的索引信息进行标识。
2、根据权利要求1所述的翻译存储器,其中,索引信息通过词典TRIE结构中的从根节点到叶子节点的路径来指出子字符串。
3、根据权利要求2所述的翻译存储器,其中,索引信息包括用于识别词典TRIE结构中的叶子节点的节点ID信息项。
4、根据权利要求1所述的翻译存储器,其中,第一检索词典中的索引信息包括与第二检索词典的索引TRIE结构中对应的节点ID信息项。
5、根据权利要求1所述的翻译存储器,其中,索引信息通过索引TRIE结构中的从根节点到叶子节点的路径来指出由组成句子的多个子字符串。
6、根据权利要求1所述的翻译存储器,还包括具有第三语言的第三词典TRIE结构和第三索引TRIE结构的第三检索词典,
第三词典TRIE结构在其从根节点到多个叶子节点的各路径上存储子字符串,
第三索引TRIE结构存储用于指出存储在第三词典TRIE结构中的子字符串的索引信息,
存储在第三检索词典中的索引信息包括对用于指出第三检索词典中的作为对第一检索词典中的子字符串的译文子字符串的索引信息进行标识的标识信息。
7、根据权利要求1所述的翻译存储器,还包括:
输入部,输入可以是第一语言或者第二语言的原始语言的句子;
分割部,将输入部输入的句子分割为多个子字符串;
检索部,将分割部分割的多个子字符串与第一检索词典中的第一词典TRIE结构进行比较,并检索出子字符串的索引信息;
提取部,根据检索部检索到的索引信息在第二检索词典中的第二索引TRIE结构中指定对应的索引信息,根据指定的索引信息在第二词典TRIE结构中指出子字符串,并且提取第二语言中的句子;以及
输出部,输出提取部提取的句子。
8、根据权利要求7所述的翻译存储器,其中,各个子字符串中包括的字符个数等于第一词典TRIE结构到第三词典TRIE结构中的每一个从根节点到叶子节点的路径所存储的字符个数。
9、根据权利要求1所述的翻译存储器,还包括从第一检索词典到第N检索词典以对应于N种语言,其中N表示至少为2的整数;
其中,索引信息给出了各个检索词典之间的至少一个翻译关系。
10、一种适于句子翻译的基于实例记忆的翻译存储器,其包括检索词典,所述检索词典分别具有用于第一语言和第二语言的词典TRIE结构和索引TRIE结构,
第一语言和第二语言中的词典TRIE结构在其从根节点到多个叶子节点的各路径上存储子字符串,
第一语言和第二语言中的索引TRIE结构分别存储用于给出第一语言和第二语言所对应的子字符串的索引信息,
第一索引信息包括对用于给出第二语言的子字符串的第二索引信息进行标识的标识信息。
11、一种机器翻译系统,包括:
用于基于实例记忆的的翻译存储器;
翻译引擎,接收翻译存储器所不能翻译的句子并翻译该句子;以及
输出部,输出由翻译存储器翻译的句子或者输出用翻译引擎翻译的句子,
所述翻译存储器包括:
第一语言的第一检索词典,具有第一词典TRIE结构和第一索引TRIE结构;以及
第二语言的第二检索词典,具有第二词典TRIE结构和第二索引TRIE结构,
第一词典TRIE结构和第二词典TRIE结构分别在其从根节点到多个叶子节点的各路径上存储子字符串,
第一索引TRIE结构和第二索引TRIE结构分别存储用于指出存储在第一词典TRIE结构和第二词典TRIE结构中的子字符串的索引信息,
存储在第一检索词典中的索引信息包括对用于指出第二检索词典中的作为对第一检索词典中的子字符串的译文子字符串的索引信息进行标识的标识信息。
12、根据权利要求11所述的机器翻译系统,翻译引擎包括基于模板的翻译引擎、基于chunk的实例翻译引擎、基于分析的翻译引擎、以及词对词直接翻译引擎中的至少一个。
13、一种翻译方法,包括以下步骤:
将第一语言和第二语言的子字符串分别存储在第一词典TRIE结构和第二词典TRIE结构中的从根节点到多个叶子节点的各路径上;并且
在第一检索词典和第二检索词典中分别建立第一索引TRIE结构和第二索引TRIE结构,包括用于给出分别存储在第一词典TRIE结构和第二词典TRIE结构中的子字符串的索引信息。
14、根据权利要求13所述的翻译方法,其中,第一检索词典中的索引信息包括对用于给出第二检索词典中的作为对第一检索词典中的子字符串的翻译的子字符串的索引信息进行标识的标识信息。
15、根据权利要求13所述的翻译方法,还包括以下步骤:
输入可以是第一语言或者第二语言的原始语言的句子;
将已输入的句子分割为多个子字符串;
将分割的多个子字符串与第一检索词典中的第一词典TRIE结构进行比较,并检索出子字符串的索引信息;
根据检索到的索引信息在第二检索词典中的第二索引TRIE结构中指定对应的索引信息;
根据指定的索引信息在第二词典TRIE结构中指出子字符串;
提取第二语言中的译文句子;以及
输出提取的译文句子。
16、一种可由计算机读取以执行用于将原始语言翻译为目标语言的翻译程序的存储介质,该存储介质的功能包括:
将第一语言和第二语言的子字符串存储在第一词典TRIE结构和第二词典TRIE结构中的从根节点到多个叶子节点的各路径上;以及
在第一检索词典和第二检索词典中的第一索引TRIE结构和第二索引TRIE结构中建立给出存储在第一词典TRIE结构和第二词典TRIE结构中的子字符串的索引信息。
17、根据权利要求16所述的存储介质,其中,第一检索词典中的索引信息包括对用于指出第二检索词典中的作为对第一检索词典中的子字符串的译文子字符串的索引信息进行标识的标识信息。
18、根据权利要求16所述的存储介质,还包括:
输入可以是第一语言或者第二语言的原始语言的句子;
将已输入的句子分割为多个子字符串;
将分割的多个子字符串与第一检索词典中的第一词典TRIE结构进行比较,并检索出子字符串的索引信息;
根据搜索到的索引信息在第二检索词典中的第二索引TRIE结构中指定对应的索引信息;
根据指定的索引信息在第二词典TRIE结构中指出子字符串;
提取第二语言的译文句子;以及
输出提取的译文句子。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005071068A JP4404211B2 (ja) | 2005-03-14 | 2005-03-14 | マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム |
JP2005071068 | 2005-03-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1834955A true CN1834955A (zh) | 2006-09-20 |
CN100511215C CN100511215C (zh) | 2009-07-08 |
Family
ID=36972140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100938291A Expired - Fee Related CN100511215C (zh) | 2005-03-14 | 2005-08-30 | 多语种翻译存储器和翻译方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7707026B2 (zh) |
JP (1) | JP4404211B2 (zh) |
CN (1) | CN100511215C (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012071922A1 (zh) * | 2010-12-02 | 2012-06-07 | 无敌科技(西安)有限公司 | 一种实现高命中率的逐词比对方法 |
CN103294682A (zh) * | 2012-02-24 | 2013-09-11 | 摩根全球购物有限公司 | 多语言检索方法、计算机可读储存媒体及网络搜寻系统 |
CN104679642A (zh) * | 2013-11-26 | 2015-06-03 | 国际商业机器公司 | 日志分析系统中的日志的与语言无关的处理方法和系统 |
CN107077466A (zh) * | 2014-11-10 | 2017-08-18 | 甲骨文国际公司 | 计算机自然语言处理中通用本体的词元映射 |
CN110895660A (zh) * | 2018-08-23 | 2020-03-20 | 澳门大学 | 一种基于句法依存关系动态编码的语句处理方法及装置 |
CN116933807A (zh) * | 2023-09-14 | 2023-10-24 | 成都帆点创想科技有限公司 | 一种文本翻译方法、装置、设备及可读存储介质 |
Families Citing this family (212)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
JP4911028B2 (ja) * | 2005-02-24 | 2012-04-04 | 富士ゼロックス株式会社 | 単語翻訳装置、翻訳方法および翻訳プログラム |
JP4626356B2 (ja) * | 2005-03-25 | 2011-02-09 | 富士ゼロックス株式会社 | 付加情報を含む電子文書を編集する方法、装置およびプログラム |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US7676359B2 (en) * | 2005-10-06 | 2010-03-09 | International Business Machines Corporation | System and method for synchronizing languages and data elements |
KR100643801B1 (ko) * | 2005-10-26 | 2006-11-10 | 엔에이치엔(주) | 복수의 언어를 연동하는 자동완성 추천어 제공 시스템 및방법 |
US20080004858A1 (en) * | 2006-06-29 | 2008-01-03 | International Business Machines Corporation | Apparatus and method for integrated phrase-based and free-form speech-to-speech translation |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
KR100724141B1 (ko) * | 2006-12-29 | 2007-05-31 | 주식회사 네오패드 | 한글 표출 장치 및 그 방법 |
US8074172B2 (en) | 2007-01-05 | 2011-12-06 | Apple Inc. | Method, system, and graphical user interface for providing word recommendations |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
JP2008305167A (ja) * | 2007-06-07 | 2008-12-18 | Toshiba Corp | 原言語文を目的言語文に機械翻訳する装置、方法およびプログラム |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8232973B2 (en) | 2008-01-09 | 2012-07-31 | Apple Inc. | Method, device, and graphical user interface providing word recommendations for text input |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
JP5791861B2 (ja) * | 2008-07-25 | 2015-10-07 | シャープ株式会社 | 情報処理装置および情報処理方法 |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
JP2010055235A (ja) * | 2008-08-27 | 2010-03-11 | Fujitsu Ltd | 翻訳支援プログラム、及び該システム |
US7593844B1 (en) * | 2008-09-22 | 2009-09-22 | International Business Machines Corporation | Document translation systems and methods employing translation memories |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
TW201020816A (en) * | 2008-11-25 | 2010-06-01 | Univ Nat Taiwan | Information retrieval oriented translation apparatus and methods, and storage media |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8176080B2 (en) * | 2009-03-06 | 2012-05-08 | Hewlett-Packard Development Company, L.P. | Desensitizing character strings |
US20100235780A1 (en) * | 2009-03-16 | 2010-09-16 | Westerman Wayne C | System and Method for Identifying Words Based on a Sequence of Keyboard Events |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9189475B2 (en) * | 2009-06-22 | 2015-11-17 | Ca, Inc. | Indexing mechanism (nth phrasal index) for advanced leveraging for translation |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
DE202011111062U1 (de) | 2010-01-25 | 2019-02-19 | Newvaluexchange Ltd. | Vorrichtung und System für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8773706B2 (en) * | 2010-03-29 | 2014-07-08 | Konica Minolta Laboratory U.S.A., Inc. | Apparatus, systems, and methods for dynamic language customization |
US8484016B2 (en) * | 2010-05-28 | 2013-07-09 | Microsoft Corporation | Locating paraphrases through utilization of a multipartite graph |
JP5928673B2 (ja) * | 2010-12-09 | 2016-06-01 | 株式会社サン・フレア | 中継サーバ |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
JP5747508B2 (ja) * | 2011-01-05 | 2015-07-15 | 富士ゼロックス株式会社 | 対訳情報検索装置、翻訳装置及びプログラム |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8954315B2 (en) | 2011-10-10 | 2015-02-10 | Ca, Inc. | System and method for mixed-language support for applications |
US20130138421A1 (en) * | 2011-11-28 | 2013-05-30 | Micromass Uk Limited | Automatic Human Language Translation |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US8732207B2 (en) | 2012-07-02 | 2014-05-20 | International Business Machines Corporation | Attribute-based linked tries for rule evaluation |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
EP3008964B1 (en) | 2013-06-13 | 2019-09-25 | Apple Inc. | System and method for emergency calls initiated by voice command |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
JP6165671B2 (ja) * | 2014-05-08 | 2017-07-19 | 株式会社インフィニトラベルインフォメーション | 運賃規則翻訳システム、運賃規則翻訳方法、及び運賃規則翻訳プログラム |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
CN105138521B (zh) * | 2015-08-27 | 2017-12-22 | 武汉传神信息技术有限公司 | 一种翻译行业风险项目通用推荐译员方法 |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10261995B1 (en) * | 2016-09-28 | 2019-04-16 | Amazon Technologies, Inc. | Semantic and natural language processing for content categorization and routing |
US10235362B1 (en) | 2016-09-28 | 2019-03-19 | Amazon Technologies, Inc. | Continuous translation refinement with automated delivery of re-translated content |
US10223356B1 (en) | 2016-09-28 | 2019-03-05 | Amazon Technologies, Inc. | Abstraction of syntax in localization through pre-rendering |
US10229113B1 (en) | 2016-09-28 | 2019-03-12 | Amazon Technologies, Inc. | Leveraging content dimensions during the translation of human-readable languages |
US10275459B1 (en) | 2016-09-28 | 2019-04-30 | Amazon Technologies, Inc. | Source language content scoring for localizability |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
KR102637337B1 (ko) * | 2016-12-09 | 2024-02-16 | 삼성전자주식회사 | 자동 통역 방법 및 장치, 및 기계 번역 방법 |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US11449495B2 (en) * | 2017-02-01 | 2022-09-20 | United Parcel Service Of America, Inc. | Indexable database profiles comprising multi-language encoding data and methods for generating the same |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10769386B2 (en) * | 2017-12-05 | 2020-09-08 | Sap Se | Terminology proposal engine for determining target language equivalents |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
JP6517414B1 (ja) * | 2018-08-24 | 2019-05-22 | グレイステクノロジー株式会社 | ドキュメント作成支援システム |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
US11960850B2 (en) * | 2020-02-21 | 2024-04-16 | International Business Machines Corporation | Multilingual simultaneous interpretation using a distributed ledger |
US20230334268A1 (en) * | 2022-04-19 | 2023-10-19 | Sap Se | Logical pointers supporting reuse of text translations |
WO2024085460A1 (ko) * | 2022-10-19 | 2024-04-25 | 삼성전자주식회사 | 이미지 내에 포함된 글자들을 식별하기 위한 전자 장치 및 그 방법 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58201175A (ja) * | 1982-05-20 | 1983-11-22 | Kokusai Denshin Denwa Co Ltd <Kdd> | 機械翻訳方式 |
JPS62251875A (ja) | 1986-04-24 | 1987-11-02 | Kenzo Ikegami | 電子翻訳装置 |
US5523946A (en) * | 1992-02-11 | 1996-06-04 | Xerox Corporation | Compact encoding of multi-lingual translation dictionaries |
JP3189186B2 (ja) | 1992-03-23 | 2001-07-16 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | パターンに基づく翻訳装置 |
DE4218421A1 (de) | 1992-06-04 | 1993-12-09 | Heidelberger Druckmasch Ag | Bogenführung im Ausleger einer Druckmaschine |
JP3152868B2 (ja) | 1994-11-16 | 2001-04-03 | 富士通株式会社 | 検索装置および辞書/テキスト検索方法 |
JPH1011447A (ja) * | 1996-06-21 | 1998-01-16 | Ibm Japan Ltd | パターンに基づく翻訳方法及び翻訳システム |
US6507678B2 (en) * | 1998-06-19 | 2003-01-14 | Fujitsu Limited | Apparatus and method for retrieving character string based on classification of character |
US6584458B1 (en) * | 1999-02-19 | 2003-06-24 | Novell, Inc. | Method and apparatuses for creating a full text index accommodating child words |
US6675169B1 (en) * | 1999-09-07 | 2004-01-06 | Microsoft Corporation | Method and system for attaching information to words of a trie |
US6393389B1 (en) * | 1999-09-23 | 2002-05-21 | Xerox Corporation | Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions |
US7050964B2 (en) | 2001-06-01 | 2006-05-23 | Microsoft Corporation | Scaleable machine translation system |
US7734459B2 (en) | 2001-06-01 | 2010-06-08 | Microsoft Corporation | Automatic extraction of transfer mappings from bilingual corpora |
US8214196B2 (en) * | 2001-07-03 | 2012-07-03 | University Of Southern California | Syntax-based statistical translation model |
CN1578954B (zh) * | 2001-10-29 | 2010-04-14 | 英国电讯有限公司 | 计算机语言翻译扩展系统 |
JP2006134051A (ja) | 2004-11-05 | 2006-05-25 | Fuji Xerox Co Ltd | 翻訳装置、翻訳方法およびプログラム |
-
2005
- 2005-03-14 JP JP2005071068A patent/JP4404211B2/ja not_active Expired - Fee Related
- 2005-08-30 CN CNB2005100938291A patent/CN100511215C/zh not_active Expired - Fee Related
- 2005-09-01 US US11/216,057 patent/US7707026B2/en not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012071922A1 (zh) * | 2010-12-02 | 2012-06-07 | 无敌科技(西安)有限公司 | 一种实现高命中率的逐词比对方法 |
CN103294682A (zh) * | 2012-02-24 | 2013-09-11 | 摩根全球购物有限公司 | 多语言检索方法、计算机可读储存媒体及网络搜寻系统 |
CN104679642A (zh) * | 2013-11-26 | 2015-06-03 | 国际商业机器公司 | 日志分析系统中的日志的与语言无关的处理方法和系统 |
US9852129B2 (en) | 2013-11-26 | 2017-12-26 | International Business Machines Corporation | Language independent processing of logs in a log analytics system |
US9881005B2 (en) | 2013-11-26 | 2018-01-30 | International Business Machines Corporation | Language independent processing of logs in a log analytics system |
CN107077466A (zh) * | 2014-11-10 | 2017-08-18 | 甲骨文国际公司 | 计算机自然语言处理中通用本体的词元映射 |
CN110895660A (zh) * | 2018-08-23 | 2020-03-20 | 澳门大学 | 一种基于句法依存关系动态编码的语句处理方法及装置 |
CN110895660B (zh) * | 2018-08-23 | 2024-05-17 | 澳门大学 | 一种基于句法依存关系动态编码的语句处理方法及装置 |
CN116933807A (zh) * | 2023-09-14 | 2023-10-24 | 成都帆点创想科技有限公司 | 一种文本翻译方法、装置、设备及可读存储介质 |
CN116933807B (zh) * | 2023-09-14 | 2023-12-29 | 成都帆点创想科技有限公司 | 一种文本翻译方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4404211B2 (ja) | 2010-01-27 |
US7707026B2 (en) | 2010-04-27 |
US20060206304A1 (en) | 2006-09-14 |
JP2006252428A (ja) | 2006-09-21 |
CN100511215C (zh) | 2009-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1834955A (zh) | 多语种翻译存储器、翻译方法以及翻译程序 | |
US8239188B2 (en) | Example based translation apparatus, translation method, and translation program | |
CN1928862A (zh) | 基于数据挖掘获取词或词组单元译文信息的系统和方法 | |
CN1205572C (zh) | 对拼写、打字和转换错误具有容错能力的将一种文本形式转换为另一种文本形式的语言输入体系结构 | |
JP5870790B2 (ja) | 文章校正装置、及び文章校正方法 | |
CN1253820C (zh) | 交叉语言信息检索设备和方法 | |
CN1670723A (zh) | 改进的拼写检查系统和方法 | |
CN1770144A (zh) | 机器翻译系统及方法 | |
CN101065746A (zh) | 文件自动丰富的方法和系统 | |
CN101079028A (zh) | 一种统计机器翻译中的在线翻译模型选择方法 | |
CN1475907A (zh) | 基于例子的机器翻译系统 | |
CN111858935A (zh) | 一种航班点评的细粒度情感分类系统 | |
CN1993692A (zh) | 字符显示系统 | |
CN101079268A (zh) | 进行手语合成与显示的系统和方法 | |
CN113806531A (zh) | 药物关系分类模型构建方法、药物关系分类方法及系统 | |
CN1554058A (zh) | 借助多语文本输入的第三语言文本生成算法及其设备和程序 | |
Simard | Building and using parallel text for translation | |
US20040122660A1 (en) | Creating taxonomies and training data in multiple languages | |
CN1702650A (zh) | 用于将日文翻译成中文的设备和方法以及计算机程序产品 | |
CN1542648A (zh) | 用于词分析的系统和方法 | |
CN1102779C (zh) | 中文简繁体字文件转换装置 | |
CN1955979A (zh) | 文章标题及关联信息的自动抽取装置、抽取方法及抽取程序 | |
CN1226692C (zh) | 基于语义语言的机器翻译系统及方法 | |
CN113722421A (zh) | 一种合同审计方法和系统,及计算机可读存储介质 | |
CN1302415C (zh) | 一种英汉翻译机器的实现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090708 Termination date: 20170830 |
|
CF01 | Termination of patent right due to non-payment of annual fee |