CN101124579A - 单词翻译装置、翻译方法以及翻译程序 - Google Patents
单词翻译装置、翻译方法以及翻译程序 Download PDFInfo
- Publication number
- CN101124579A CN101124579A CNA2006800055811A CN200680005581A CN101124579A CN 101124579 A CN101124579 A CN 101124579A CN A2006800055811 A CNA2006800055811 A CN A2006800055811A CN 200680005581 A CN200680005581 A CN 200680005581A CN 101124579 A CN101124579 A CN 101124579A
- Authority
- CN
- China
- Prior art keywords
- word
- translation
- information
- language
- information record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了单词翻译装置、翻译方法以及翻译程序,该单词翻译装置将第一语言单词检索TRIE结构(100)、第二语言单词检索TRIE结构(200)、第一语言单词信息记录(110)、第二语言单词信息记录(210)存储在双语对照字典中。第一语言单词检索TRIE结构(100)用以检索第一语言的单词。第二语言单词检索TRIE结构(200)用以检索第二语言的单词。第一语言单词信息记录(110)包括识别存储在第一语言单词检索TRIE结构(100)中的各单词的翻译的第一翻译信息。第二语言单词信息记录(210)包括识别存储在第二语言单词检索TRIE结构(200)中的各单词的翻译的第二翻译信息。通过参照第一和第二单词信息记录(110)和(210),能够高精度高速度地在第一和第二语言之间执行单词翻译。
Description
技术领域
本发明总的来讲涉及一种单词翻译装置,更具体地讲,涉及一种两种或更多种语言之间的翻译技术,所述单词翻译装置将源语言的每个单词翻译成目标语言的单词。
背景技术
通过单词翻译技术,在双语对照字典中查阅该第一语言的输入单词,并且从该双语对照字典中提取出该单词的第二语言的翻译。然后输出该提取出的翻译。通过句子翻译技术,按照语素对第一语言的输入句子进行分析,并且提取出组成该句子的单词组。从双语对照字典检索出该提取的单词的翻译,并且基于单词之间的链接形成句子形式的翻译。例如,非专利参考文献1公开了一种利用单词之间的链接的机器翻译系统。
这种单词和句子翻译技术应用于电子单词翻译装置和计算机中。在电子单词翻译装置中,两种或更多种语言的双语对照字典存储在存储器中。当用户输入第一语言的单词时,从这些双语对照字典中提取出该单词的翻译,并且将其显示在显示器上。
专利参考文献1公开了一种技术,该技术能够为各用户省去在电子字典装置中执行检索时选择字典的类型的麻烦。基于用户输入的检索词,在这些字典中检索指示词,并且将包含该指示词的字典的内容进行集总显示。
[专利参考文献1]
第2000-276479号日本专利公开
[非专利参考文献1]
Suzuki and Tochinai,″Machine Translation System Using ConjunctiveRelations of Words″,IPSJ Transctions,Vol.29,No.4,1988.
发明内容
本发明要解决的问题
正常设计的各双语对照字典涉及将一种语言翻译成另一种语言(诸如日文到英文或英文到日文),并且单词信息被双重记录在双语对照字典中。例如,当执行从英文到日文的翻译时,不共享当执行从日文到英文的翻译时使用的单词信息。结果,字典的生产成本变高。另外,由于双语对照字典不能够彼此参照,所以出现从双语对照字典丢失信息的问题。例如,日英字典中的具有相同意义的一对单词可能不存在于英日字典中。在专利参考文献1中公开的电子装置中,英日翻译字典和日英翻译字典彼此独立使用,上述问题没有解决。
句子翻译的终极目标是获得准确的翻译的句子。然而,实际上不能够容易地获得准确的翻译。在翻译文档中,一些句子是准确的,但是一些句子不是准确的,并且用户很难确定哪些句子是准确的。非专利参考文献1没有公开或建议解决这个问题的任何结构。
因此,本发明的目的在于提供一种涉及在两种语言或多于两种的语言之间实现翻译的双语或多语对照字典的单词翻译装置、翻译方法、以及翻译程序。
解决该问题的方法
本发明提供了一种单词翻译装置,所述单词翻译装置能够在语言之间执行单词翻译,所述单词翻译装置包括:存储单元,用于至少将第一单词检索结构、第二单词检索结构、第一单词和翻译信息记录、以及第二单词和翻译信息记录存储在字典中,其中,所述第一单词检索结构设置用于检索第一语言的单词,所述第二单词检索结构设置用于检索第二语言的单词,所述第一单词和翻译信息记录包括关于存储在所述第一单词检索结构中的单词的单词关联信息和翻译信息,所述第二单词和翻译信息记录包括关于存储在所述第二单词检索结构中的单词的单词关联信息和翻译信息。当将给定语言的单词翻译成另一种语言的单词时,在所述源语言的单词检索结构中检索所述单词。如果在所述源语言的单词检索结构中存在所述对应的单词,则从所述单词和翻译信息记录中获得对应的单词信息和翻译信息。基于所获得的翻译信息,从所述另外语言的单词检索结构中获得所述对应的翻译信息。如果在所述源语言的单词检索结构中不存在对应的单词,则所述源语言的单词原样输出。
在本发明的单词翻译装置中,所述第一和第二单词检索结构包括用于识别单词和翻译信息记录的单词和翻译信息记录识别信息。
在本发明的单词翻译装置中,所述第一和第二单词翻译信息记录分别包括用于识别存储在所述第一和第二单词检索结构中的单词的单词识别信息。
在本发明的单词翻译装置中,所述第一和第二单词和翻译信息记录分别包括关于存储在所述第一和第二单词检索结构中的单词的关联信息。
在本发明的单词翻译装置中,所述第一单词和翻译信息记录包括用于识别存储在所述第二单词和翻译信息记录中的翻译信息的翻译识别信息,并且所述第二单词和翻译信息记录包括用于识别存储在所述第一单词和翻译信息记录中的翻译信息的翻译识别信息。
在本发明的单词翻译装置中,所述第一和第二单词和翻译信息记录包括用于对各翻译的同义词进行识别的识别信息。
在本发明的单词翻译装置中,所述第一和第二单词和翻译信息记录包括用于识别进行翻译的语言的种类的识别信息。
在本发明的单词翻译装置中,当主题单词具有多于一种的词性时,所述第一和第二单词和翻译信息记录包括存储与各词性(POS)相关的一条单词关联信息和一条翻译信息的记录。
在本发明的单词翻译装置中,所述各个词性的记录通过指针与所述一条单词关联信息关联。
更加优选的是,所述单词翻译装置还包括:输入单元,用于输入单词;查阅单元,用于在存储于所述第一单词检索结构中的单词中查阅所输入的单词;提取单元,用于基于与所述单词关联的所述第一单词和翻译信息记录从存储在所述第二单词检索结构中的翻译中提取翻译;以及输出单元,用于输出所述提取的翻译。通过这种结构,能够高速度高精度地翻译每个输入的单词。更加优选的是,所述提取单元基于与所述查阅单元查阅的所述单词关联的所述第一单词信息记录提取所述第二单词信息和翻译信息。另选地,所述第一单词和翻译信息记录的所述翻译信息可以包括链接信息,所述链接信息用于识别存储在所述第二单词检索结构或第二单词和翻译信息记录中的翻译;以及所述提取单元可以基于所述链接信息提取所述翻译或所述第二单词和翻译信息记录。
本发明的另一种在两种或更多种语言之间执行单词翻译的单词翻译装置包括:存储单元,用于在字典中存储N种语言的单词检索TRIE结构以及与所述N种语言的所述各自的单词检索结构相关联的所述N种语言的单词信息记录,N是大于等于2的整数。所述N种语言的单词信息记录中的一种语言的单词信息记录包括用于识别两种或更多种语言中的一种语言的翻译的翻译信息。通过这种结构,本发明的单词翻译装置不仅仅能够在两种语言之间也能够在三种或更多种语言(多语对照字典)之间执行单词翻译。
本发明的机器翻译系统包括:翻译单元,用于输入句子和翻译所述句子;以及根据权利要求1到10中的任何一个所述的单词翻译装置,用于输入所述翻译单元没有翻译出的单词并且翻译所述单词。在所述机器翻译系统中,所述翻译单元包括翻译存储器引擎、基于句型的翻译引擎、以及基于语块示例的翻译引擎中的至少一个。更加优选的是,所述机器翻译系统还包括区别输出单元,所述区别输出单元区别没有由所述翻译单元翻译的单词的翻译和其它翻译,并且输出所述翻译。通过这种结构,能够执行高准确翻译,并且用户能够容易地确定哪个翻译具有高可信度以及哪个翻译具有低可信度。
本发明的另一种在两种或更多种语言之间执行单词翻译的单词翻译装置包括:存储单元,用于存储为各语言设置的单词检索字典数据以及为存储在为各种语言设置的所述单词检索字典数据中的各单词设置的链接信息,并且指示一种语言单词和另一种语言单词的翻译之间的关系。
通过这种结构,一种语言的单词与另一种语言的单词通过所述链接信息进行链接。因此,能够执行两种语言或多于两种的语言之间的翻译。
更加优选的是,在所述单词翻译装置中,所述链接信息包括:识别信息,用于识别所述一种语言的单词;识别信息,用于识别所述另一种语言;指针,用于指向与所述另一种语言的翻译相关的链接信息;以及指针,指向与所述一种语言的单词的同义词相关的链接信息。
更加优选的是,在所述单词翻译装置中,所述链接信息包括父链接信息和子链接信息。所述父链接信息包括指向与所述一种语言的单词的同义词相关的所述子链接信息的指针。所述子链接信息包括:识别信息,用于识别所述另一种语言;指针,用于指向所述对应的父链接信息;指针,用于指向与所述另一种语言的翻译相关的所述子链接信息;以及指针,用于指向与另一同义词相关的所述子链接信息。
更加优选的是,在所述单词翻译装置中,当所述单词具有多种词性时,为每种词性设置所述链接信息。所述单词检索字典数据包括对所述各种语言设置的并且用于检索单词的单词检索结构和为所述每种语言设置并且存储与所述单词有关的信息的单词信息记录。
更加优选的是,所述单词信息记录包括所述链接信息。例如,所述单词检索结构可以包括单词TRIE结构或哈希函数结构。
更加优选的是,在所述单词翻译装置中,所述单词检索字典数据包括:与对应语言的各单词的第一字符有关的列表信息和与所述单词有关列表信息。所述第一字符列表信息包括与所述第一字符相关的信息、以所述第一字符开始的单词的数目、指向与以所述第一字符开始的单词有关的列表信息中的某一位置的指针。所述单词列表信息包括指向与所述单词有关的链接信息的指针。
更加优选的是,所述链接信息与包括与存储在所述单词检索字典数据中的单词有关的信息的所述单词信息记录相关联。
更加优选的是,所述单词翻译装置还包括:输入单元,用于输入所述一种语言的单词;查阅单元,用于在与所述一种语言相关的所述单词检索字典数据中查阅所述一种语言的输入单词;以及提取单元,用于基于与被找出的所述一种语言的所述单词相关的所述链接信息,从与所述另一种语言相关的所述单词检索字典数据提取所述另一种语言的翻译。通过这种结构,能够高精确度地执行单词翻译。更加优选的是,所述提取单元基于与被所述查阅单元查阅出的所述一种语言的单词信息记录相关的所述链接信息提取所述另一种语言的单词信息记录。另外,所述提取单元可以基于与被所述查阅单元查阅出的所述一种语言的单词信息记录有关的所述链接信息,从所述另一种语言的所述单词检索结构提取翻译。
本发明的用于在两种或更多种语言之间翻译单词的单词翻译方法,包括如下步骤:将第一单词检索结构、第二单词检索结构、第一单词信息记录和第二单词信息记录存储在字典中。所述第一单词检索结构被设置用于检索第一语言的单词,所述第二单词检索结构被设置用于检索第二语言的单词,所述第一单词信息记录包括用于识别存储在所述第一单词检索结构中的单词的翻译的第一翻译信息,所述第二单词信息记录包括用于识别存储在所述第二单词检索结构中的单词的翻译的第二翻译信息。
所述的单词翻译方法还包括如下步骤:输入单词;在存储于所述第一单词检索结构中的所述单词中查阅所输入的单词;基于所查阅出的单词的所述第一单词信息记录,从所述第二单词检索结构提取翻译;以及输出所提取出的翻译。更加优选的是,所述单词检索字典数据包括为各语言设置的单词信息记录并且存储单词检索结构和与单词有关的信息。所述单词信息记录包括所述链接信息。在所述提取步骤中,基于所述一种语言的所述单词信息记录的链接信息提取所述另一种语言的所述单词信息记录。
本发明的用于在两种或更多种语言之间翻译单词的单词翻译方法包括如下步骤:将单词检索字典数据和链接信息存储在存储单元中。所述单词检索字典数据为所述各语言设置,所述链接信息是为存储在对所述每种语言设置的所述单词检索字典数据中的每个单词设置的并且指示一种语言的单词和另一种语言的单词的翻译之间的关系。
更加优选的是,所述翻译方法还包括如下步骤:输入一种语言的单词;在为所述一种语言设置的所述单词检索字典数据中查阅所述一种语言的输入单词;以及基于与所述一种语言的所查阅出的单词的所述链接信息,从为所述另一种语言设置的所述单词检索字典数据中提取另一种语言的翻译。
本发明的在两种或更多种语言之间翻译单词的单词翻译程序可被运行以执行行如下步骤:将第一单词检索结构、第二单词检索结构、第一单词信息记录和第二单词信息记录存储在字典中。所述第一单词检索结构被设置用于检索第一语言的单词,所述第二单词检索结构被设置用于检索第二语言的单词,所述第一单词信息记录包括用于识别存储在所述第一单词检索结构中的单词的翻译的第一翻译信息,所述第二单词信息记录包括用于识别存储在所述第二单词检索结构中的单词的翻译的第二翻译信息。
本发明的另一种在两种或更多种语言之间翻译单词的单词翻译程序可被运行以执行如下步骤:将单词检索字典数据和链接信息存储在存储单元中。所述单词检索字典数据是为所述各语言设置的,所述链接信息是对存储在对所述每种语言设置的所述单词检索字典数据中的每个单词设置的并且指示一种语言的单词和另一种语言的单词的翻译之间的关系。
更加具体地讲,执行翻译程序以执行如下步骤:输入一种语言的单词;在为所述一种语言设置的所述单词检索字典数据中查阅所述一种语言的输入单词;以及基于与查阅出的所述一种语言的单词的所述链接信息,从为所述另一种语言设置的所述单词检索字典数据提取另一种语言的翻译。
本发明的有益效果
根据本发明,对各种语言设置单词检索字典数据和链接信息。因此,能够高精度高速度地执行语言之间的翻译。此外,本发明的单词翻译装置不仅能够应用于双语对照单词翻译还能够应用于多语对照单词翻译。
附图说明
图1示出了根据本发明示例性实施方式的机器翻译系统的结构;
图2示出了两种语言之间的单词翻译装置的结构;
图3示出了根据本发明示例性实施方式的单词指导机器引擎的硬件结构;
图4示出了根据本发明示例性实施方式的TRIE结构;
图5详细示出了TRIE结构;
图6示出了单词信息记录的结构;
图7示出了单词标记的解释;
图8A示出了子标记的解释;
图8B示出了语言ID的解释;
图9示出了单词信息记录ID的结构;
图10A到10C示出了TRIE结构的字符信息的结构;
图11示出了结点记录ID分配;
图12示出了结点ID的阵列;
图13示出了用于存储单词信息记录的方法的第一实施例;
图14示出了用于存储单词信息记录的方法的第二实施例;
图15是单词翻译操作的流程图;
图16示出了根据本发明的第二示例性实施方式的多语对照单词翻译装置的多语对照字典;
图17示出了在本发明的第三示例性实施方式中使用的多语对照单词翻译字典的结构;
图18是多语对照单词翻译字典的第一实施例的概念图;
图19是多语对照单词翻译字典的第二实施例的概念图;
图20示出了基于哈希函数的单词检索字典的结构;
图21A到21C示出了采用阵列结构基础的单词信息记录的结构;
图22示出了采用双阵列结构基础的单词信息记录的结构;
图23示出了采用双阵列结构基础的同义词信息记录的结构;
图24示出了采用阵列结构基础的在日文和中文之间的单词翻译中使用的双语对照字典的结构;
图25示出了采用双阵列结构基础的在日文和中文之间的单词翻译中使用的双语对照字典的结构;
图26示出了采用阵列结构基础的在日文和英文之间的单词翻译中使用的双语对照字典的结构;以及
图27示出了采用双阵列结构基础的在日文和英文之间的单词翻译中使用的双语对照字典的结构。
具体实施方式
下面,对照附图来描述本发明的优选示例性实施方式。图1示出了根据本发明示例性实施方式的机器翻译系统的全部结构。该机器翻译系统1不能够翻译文档的所有部分。如果对不能够翻译的部分进行强制翻译,则结果会使得用户困惑,并且会不利地影响对源句子的内容的理解。因此,翻译结果分成成功和失败,并且对翻译结果分配信用等级。另外,该翻译系统配备有学习功能,用于自动地收集不能够翻译的部分并且对这些不能够翻译的部分给出准确的翻译。这样,增强了翻译性能。
该机器翻译系统1包括:翻译存储器引擎12,用于翻译经由源语言文本句子输入单元10输入的各个句子;语素分析单元14,用于接收没有包含在该翻译存储器引擎12中的数据库中的部分或没有被准确翻译出的部分,并且分析该部分的语素;基于句型的翻译引擎16,用于接收经由语素分析单元14分析的句子或单词,并且基于句型来翻译该句子或单词;基于语块(chunk-based)的翻译引擎18,用于根据基于语块的示例句子(单词的组合或短语(诸如名词短语))来翻译没有被基于句型的翻译引擎16翻译出的部分;基于分析/单词指导翻译引擎20,用于接收没有被基于语块的翻译引擎18翻译出的单词并且基于分析或逐字来翻译该单词;以及目标语言文本句子创建单元22,用于创建目标语言文本句子。该基于语块的翻译引擎18具有翻译提取功能。该翻译提取功能将包含在句子中的各单词串与从该单词串翻译出的单词串进行关联。该基于分析/单词指导翻译引擎20将翻译提取功能应用到从该句子提取的各单词串并且获得该单词串的翻译。
与由翻译存储器引擎12、基于句型的翻译引擎16以及基于语块示例的翻译引擎18成功翻译出的部分相关的翻译数据被输入到目标语言文本句子创建单元22。基于该翻译数据,该目标语言文本句子创建单元22创建目标语言的文本句子。这里,将保证准确度的标识分配到成功翻译出的部分。经由基于分析/单词指导翻译引擎20获得的翻译数据仅仅作为引导性翻译(guide translation)从目标语言文本句子创建单元22输出。从而,用户能够迅速地区别文本翻译中的可信翻译结果和不可靠翻译结果。同时,不能由基于语块示例的翻译引擎18翻译的部分由收集单元24进行收集。该收集的不能翻译的各部分然后由人类翻译员进行准确翻译,并且将结果输入到学习引擎26。基于该准确翻译,学习引擎26将双语对照数据写入双语对照字典28中。
图2示出了作为这个示例性实施方式的优选变型的两种语言之间的单词翻译装置的结构。在两种语言之间翻译单词的功能设置在单词指导翻译引擎20中。在该单词翻译装置中,源语言文本输入单元10将各文本或单词输入到语素分析单元14。这里,属性(诸如“名词”或“动词”)附到各单词上,然后将该单词输入到单词指导翻译引擎20。通过使用双语对照字典,单词指导翻译引擎20将源语言的各输入单词翻译成目标语言的单词,然后将结果输入到目标语言文本句子创建单元22。单词指导翻译引擎20使用的双语对照字典可以是学习引擎26学习过的双语对照字典28。
图3示出了两种语言之间的单词翻译装置的硬件结构。该单词翻译装置包括:输入单元30、显示单元32、主存储单元34、外部存储单元36、中央处理单元38以及连接这些单元的总线40。该输入单元30可以是键盘或者是光读取器,通过该键盘由键操作输入各单词,该光读取器光学地读取包含在文档中的各单词或者由其它硬件或软件执行的操作的结果(诸如基于语块示例的翻译引擎的输出)。
该显示单元32包括显示器等,用于输出从源语言翻译出的目标语言的各单词。该主存储单元34包括ROM或RAM,并且存储用于控制单词翻译的程序和诸如操作结果的数据。外部存储单元36包括诸如硬盘的大容量存储装置。用于翻译单词所必需的双语对照字典存储在该大容量存储装置中。该CPU(中央处理单元)38根据存储在主存储单元34中的程序来控制各单元。
接下来,将详细描述根据这个示例性实施方式的单词指导翻译引擎。图4示出了设置在单词指导翻译引擎20中的双语对照字典的单词检索TRIE结构和单词信息记录结构的概念。该双语对照字典包括:第一语言单词检索TRIE结构100和与该单词检索TRIE结构100相关联的第一语言单词信息记录110、以及第二语言单词检索TRIE结构200和与该单词检索TRIE结构200相关联的第二语言单词信息记录210。
在语言信息处理的领域,TRIE结构是通过组合在检索关键词的组中共有的字符串获得的树结构。例如,图5示出了从五个检索关键词“あい”、“あいさい”、“あいさつ”、“あいのこ”和“あいのり”形成的TRIE结构。图5中的符号“$”可以用作表示单词的末端的特殊字符。当采用TRIE结构来执行检索时,从左侧开始扫描检索字符串,并且扫描器沿着该树从根部(结点N1)开始向分配到结点N2到N13的各结点的字符移动。这样,提取出了与检索字符串对应的单词。通过采用TRIE结构,能够在与检索字符串的长度成比例的时间段内执行检索,而不管检索关键词的数目如何。
返回图4,根据这个示例性实施方式的双语对照字典包括:第一语言单词检索TRIE结构100(以下称作第一TRIE结构)、存储与包含在第一TRIE结构100中的各单词相关的翻译信息的第一语言单词信息记录110、第二语言单词检索TRIE结构200(以下称作第二TRIE结构)、以及存储与包含在第二TRIE结构200中的各单词相关的翻译信息的第二语言单词信息记录210。
在第一语言是日文、第二语言是中文的情况下,当日文单词“アメリカ(美国)”存储在第一TRIE结构100中时,中文单词“美国”存储在第二TRIE结构200中。在包含在第一单词信息记录110和第二单词信息记录210中的翻译信息中,日文单词“アメリカ”与中文单词“美国”彼此关联。
例如,当输入日文单词“アメリカ”的检索字符串时,CPU 38从左侧(从字符“ア”)扫描检索字符串:单词“アメリカ”,并且从第一TRIE结构的根部开始从一个结点移动到一个结点。CPU 38然后确定是否存在与单词“アメリカ”对应的单词或路径。如果存在对应的路径或单词,则参照与单词“アメリカ”对应的单词信息记录110,从而识别出第二TRIE结构200中的中文路径或单词“美国”。这样,获得了单词“アメリカ”的中文翻译。当输入中文的单词“美国”的检索字符串时,与单词“美国”对应的单词信息记录210被参照,从而识别出第一TRIE结构100中的与单词“美国”的日语翻译对应的路径。因此,获得了单词“美国”的日文翻译。这样,第一和第二单词信息记录110和210彼此链接,从而防止在这两种语言中翻译信息的丢失。
当单词“アメリカ”的同义词“米国”存储在第一TRIE结构100中时,单词信息记录210中的关于中文单词“美国”的翻译信息与这两科单词链接。因此,能够从中文单词“美国”获得日文单词“アメリカ”和“米国”。
如上所述,为了基于存储在第一TRIE结构100中的单词来识别存储在第二TRIE结构200中的单词,产生了第一语言单词信息记录110。为了基于存储在第二TRIE结构200中的单词来识别存储在第一TRIE结构100中的单词,产生了第二语言单词信息记录210。图6示出了单词信息记录的结构。该单词信息记录包括:字符信息300、单词标记+子标记+语言ID 302、单词信息记录ID 304、父结点ID 306、以及相邻兄弟结点ID 308。
该字符信息300指示包含在结点中的字符的类型,诸如日本汉字、平假名、片假名或字母表。该单词标记+子标记+翻译语言ID 302由一个字节形成,并且单词标记由两个比特形成。如图7所示,当单词标记是“0”时,对应的结点是中间结点。当单词标记是“1”时,对应的结点是单词结点(显示在从根部到该对应的结点的路径上的信息表示单词)。当单词标记是“2”时,对应的结点是发音结点(显示在从根部到对应结点的路径上的信息表示发音)。当单词标记是“3”时,对应结点是单词发音结点(显示在从根部到对应结点的路径上的信息表示单词及其发音)。
所述子标记由一个比特形成。如图8A所示,当子标记是“0”时,对应结点不存在任何下位结点。当子标记是“1”时,在对应结点至少还存在一个下位结点。
所述翻译语言ID标识进行翻译的语言。如图8B所示,当语言ID是“1”时,该语言是日文。当语言ID是“2”时,该语言是中文。当语言ID是3时,该语言是英文。
如图9所示,所述单词信息记录ID 304包括:单词ID、发音ID、词性ID、优先级等级、同义词信息(单词数目)、概念ID、左链接信息ID、右链接信息ID、翻译语言ID、翻译ID、下一个同义词信息记录ID以及备注。该单词ID是结点ID,用于识别存储在TRIE结构中的各单词。在图4示出的第一TRIE结构中的单词“アメリカ”的情况下,例如,单词ID是存储单词的最后字符的结点的ID。所述发音ID指示单词的发音,用于区别日本汉字的发音和平假名等的发音。该词性ID识别单词的词性,诸如名称、动词或形容词。
所述同义词信息指示同义词的数目。在图4示出的第一TRIE结构中的单词“アメリカ”的情况下,例如,同义词的数目是“1”(“米国”)。所述概念ID、左链接信息ID、右链接信息ID不是必需的,但是在基于分析进行翻译时是有用的。
所述翻译语言ID识别用于书写翻译后的单词的语言。在日文单词“アメリカ”翻译成中文的情况下,该翻译语言ID是表示中文的ID。在这种情况下,该翻译ID是存储中文单词“美国”的最后字符的结点的ID。所述下一个同义词信息记录ID是识别与对应单词的翻译同义的下一个单词的记录的ID。例如,如果在中文“美国”的单词记录中,翻译后的日文单词是“アメリカ”并且该日文单词的同义词是“米国”,则该同义词记录ID是识别日文单词“米国”的ID。所述备注是注释等,但不是必需的。
父结点ID 306是对用于识别主题单词的结点之上的结点进行识别的ID。该相邻兄弟结点ID 308是与该主题结点共享相同父结点的相邻结点的ID。这些结点ID是TRIE结构中必需的信息,但是不会直接影响单词翻译。在相似发声单词的情况下,这些单词的数目可以包含在单词信息记录中。在这种情况下,与单词信息记录对应的TRIE结构与大于一个的单词相关联。
如图4所示,当存储在第一TRIE结构100中的单词“アメリカ”的单词信息记录是k时,该单词信息记录k包含指示单词“アメリカ”的从根部起的路径的信息、以及翻译信息(翻译语言ID、翻译ID、以及同义词信息记录ID)。当存储在第二TRIE结构200中的单词“美国”的单词信息记录是h时,单词信息记录h包含指示单词“美国”的从根部起的路径的信息以及翻译信息。该单词信息记录h还包含作为同义词信息记录ID的日文单词“米国”的单词信息记录k+1。这样,经由第一和第二单词信息记录,第一和第二语言的翻译后的单词在这两个方向上进行链接,并且能够肯定地对任何一种语言迅速进行翻译。
现在参照图10A到图10C描述TRIE结构的字符信息的结构。在图10A中,TRIE结构中的各结点示出为由两个字节形成的一个字符。在图10B中,各语言转换成Unicode,并且高字节(高8比特)或低字节(低8比特)分配到各结点。从而,每个字符由一个高字节和一个低字节形成。采用图10B所示的结构与采用图10A所示的结构相比较,由于TRIE结构的水平方向上的结点的数目变得较小(256),所以检索速度变得更高。然而,由于深度方向上结点的数目变得更大,所以信息量增加。图10C所示的结构是图10A所示结构和图10B所示结构的组合。
接下来描述结点ID分配。图11示出了结点ID分配方法。在每个TRIE结构中,首先按照深度顺序执行检索,并且检索号从“1”或“0”增加。这样,结点ID分配到各个结点。在分配完结点ID以后,如图12所示,根据结点ID来排列和存储与结点ID对应的记录。由于按照结点ID来排列记录,所以与各结点ID对应的结点信息能够被立即访问。在这个示例性实施方式中,仅仅获得了翻译,而不能够准确获得诸如图9所示的单词的发音和词性的单词信息(翻译信息)。如果期望获得如图9所示的关于翻译的准确信息,则应该采用根据第二和第三示例性实施方式(以后描述)的单词检索结构和单词信息记录结构。
接下来,描述单词记录存储。当第一语言单词和第二语言单词之间一对一对应时,各单词具有一个单词信息记录。然而,许多单词会具有多于一个的词性(或含义),并且许多翻译关系不能够由一对一对应所表示。
如果单词k具有多于一个的词性,并且词性之一具有多于一种的翻译,则对单词k需要准备多于一个的信息记录,并且经由指针串联链接这些记录。然后将翻译信息存储在各对应记录中。如图13所示,关于词性1和翻译1的信息存储在第一语言的单词k的记录中,并且关于词性1和翻译2的信息存储在经由指针与以上记录进行链接的记录中。这里,该指针可以是图6所示的下一个同义词信息记录ID。接下来,描述单词选择的规则。优选的是,仅仅翻译名词、代词、形容词、副词、动词以及特定术语。如果翻译关系指示一对一对应,则选择首要对应翻译。如果存在一对n对应(n>1),则检查n个单词的类属性,并且选择具有与源语言的单词相同的词性的各单词。如果仅仅存在具有与源语言的单词相同的词性的一种翻译,则选择该单个单词。如果存在具有与源语言的单词相同的词性的两个或更多个单词,则可以根据优先级等级来选择可能的翻译,或者可以任意地选择可能的翻译。
在中文单词“美国”要翻译成日文单词“アメリカ”和“米国”的实施例情况下,对于中文字典中的单词“美国”产生两个记录320和322,并且这两个记录320和322经由指针彼此链接。在日文字典中,对单词“米国”产生记录330,对单词“アメリカ”产生记录332。中文单词“美国”的记录320包含与日文单词“アメリカ”相关的翻译信息,并且中文单词“美国”的记录322包含与日文单词“米国”相关的翻译信息。
日文单词“アメリカ”和“米国”的记录330和332与有关于中文单词“美国”的翻译信息相关联,从而如图13中的虚线所示,中文单词“美国”被参照。
接下来描述用于存储单词信息记录的其它方法。在图13所示的实施例中,产生了相同记录,从而使用的存储器的量变得较大。为了节省存储器空间,对于单词k仅仅使用一个信息记录,并且基于单词k的单个信息记录来识别包含与同义词信息阵列中的单词相关的翻译信息的两个或更多个记录。然后将最少量的翻译信息记录在同义词信息阵列中。如图14所示,准备了第一语言的单词k的信息记录和同义词信息阵列。同义词信息阵列中的记录例如包括关于词性1的翻译2、词性1的翻译3、以及词性2的翻译1的信息。同义词信息阵列中的各记录包括最少量的翻译信息,该最少量的翻译信息为优先级等级、概念ID、语言ID、翻译ID以及下一个同义词信息记录指针。
在如图14所示基于中文单词“美国”检索日文单词的情况下,为中文单词“美国”创建了记录320,并且创建了要被包含在同义词信息阵列中的记录324。根据记录320,日文单词“米国”被参照,根据同义词信息阵列中的记录324,日文单词“アメリカ”被参照。
接下来,描述了单词选择的规则。优选的是,仅仅翻译名词、代词、形容词、副词、动词和特定术语。如果翻译关系指示一对一对应,则选择该单个对应单词。如果存在一对n对应(n>1),则检查n个单词的类属性,并且可以从具有与源语言的单词相同的词性的单词一个接一个地选择出可能的翻译。或者,可以任意地选择可能的翻译。
图15是单词翻译装置的操作的流程图。首先,当输入了作为源语言的文本句子的分析结果的单词或由用户指定的单词时(步骤S101),CPU38识别源语言的类型(步骤S102)。CPU 38然后选择对应于识别出的语言的双语对照字典的TRIE结构(步骤S103),并且将输入单词与存储在TRIE结构中的单词进行比较(步骤S104)。如果在TRIE结构中存在对应单词(步骤S105),则CPU 38参照对应单词的单词信息记录(步骤S106)并且根据单词信息记录从被参照的目标语言的TRIE结构中提取单词(步骤S107)。提取出的单词由目标语言文本句子创建单元22进行显示(步骤S108)。
如果输入的单词不存在(步骤S105),则将翻译失败输出到该显示器。在这种情况下,通过人类翻译员将恰当的翻译附到该输入的单词上。然后该翻译被登记在双语对照字典中,并且由学习功能进行学习(步骤S108)。
接下来将描述本发明的第二示例性实施方式。该第二示例性实施方式有关多语对照翻译或N种语言之间的单词翻译。图16示出了在多语对照翻译中使用的多语对照字典的结构。如图16所示,创建了第一语言的TRIE结构,第二语言的TRIE结构,第N语言的TRIE结构,并且存储了各种语言的单词检索TRIE。同时,创建了第一语言单词信息记录410、第二语言单词信息记录510和第N语言单词信息记录610以匹配各个TRIE结构。
各单词信息记录包含关于多于一种语言的翻译信息。例如,日文的单词信息记录包含存储英文翻译信息的记录和存储中文翻译信息的记录。采用这种结构,能够基于日文单词来检测到英文或中文的单词。用户能够发出关于是要查找英文单词还是要查找中文单词的指令。还能够执行从英文到日文的单词翻译以及从中文到日文的单词翻译。在这个示例性实施方式中用于存储单词信息记录的方法可以与图13或14所示的方法相同。
如上所述,当为各种语言创建了单词检索TRIE结构和单词信息记录时,能够在几种语言之间执行单词翻译。因此,能够实现较高的可用性。
接下来,将描述本发明的第三示例性实施方式。图17示出了要在第三示例性实施方式中使用的多语对照单词翻译字典300的结构。该多语对照单词翻译字典300形成有为第一到第N语言设置的第一语言单词检索字典312-1到第N语言单词检索字典312-N(以下,在适当的情况下,将该第一语言单词检索字典312-1到第N语言单词检索字典312-N集总地称作“单词检索字典312”)、以及为第一语言到第N语言设置的第一语言单词翻译链接信息314-1到第N语言单词翻译链接信息(以下,在适当的情况下,将第一语言单词翻译链接信息314-1到第N语言单词翻译链接信息314-N集总地称作“单词翻译链接信息314”)。
各单词检索字典312具有基于哈希函数或TRIE结构的结构。该单词翻译链接信息314指示一种语言的各单词和另外语言的各对应单词之间的关联。该单词翻译链接信息314具有基于连续结构的结构或基于双连续结构的结构,该连续结构仅仅具有由单词信息记录形成的单词信息阵列列表,该双连续结构具有由单词信息记录形成的单词信息阵列列表和由同义词信息记录形成的同义词阵列列表。
图18是多语对照单词翻译字典300的第一实施例结构的概念图。在图18所示的实施例结构中,各单词检索字典基于TRIE结构。当在两种语言之间进行翻译时,第一语言单词检索字典具有第一语言单词检索TRIE结构(第一TRIE结构),并且第一语言单词翻译链接信息由与包含在第一TRIE结构中的单词有关的信息(单词信息记录)形成。该单词信息记录包含指示与第二语言的单词关联的指针。同样,第二语言单词检索字典具有第二语言单词检索TRIE结构(第二TRIE结构),并且第二语言单词翻译链接信息由与包含在第二TRIE结构中的单词相关的信息(单词信息记录)形成。该单词信息记录包含指示与第一语言的单词关联的指针。在图18中,第一语言的单词k与第二语言的单词h+1是翻译关系,并且彼此关联。在单词存在两个或更多个词性并且词性存在两个或更多个翻译的情况下,针对各个词性和各个翻译准备该单词的单词信息记录,并且该单词信息记录通过包含在单词信息记录中的指针彼此链接。
图6是多语对照单词翻译字典300的第二实施例结构的概念图。在图19所示的实施例结构中,各单词检索字典基于哈希函数,并且该单词翻译链接信息基于连续结构。
在基于哈希函数的这个结构中,在两种语言之间要执行翻译的情况下,该第一语言单词检索字典具有包含指针信息的单词列表,该指针信息与第一语言的单词和与这些单词对应的单词翻译信息字典中的单词信息记录有关。同样,该第二语言单词检索字典具有包含指针信息的单词列表,该指针信息与第二语言的单词以及与这些单词对应的该单词翻译信息字典中的单词信息记录有关。与第一语言和第二语言有关的单词翻译链接信息与图18所示的信息结构相同,因此,这里省去了对其的解释。以后将详细描述哈希函数单元320。
图20示出了基于哈希函数的单词检索字典的结构。该哈希函数单元320将对应语言的所有字符码转换成连续字符码。第一字符列表包含:与单词(其为由该哈希函数单元320从字符码转换出来的多个字符)的第一字符有关的信息、从该第一字符开始的单词的数目、以及与和从该第一字符开始的单词对应的该单词列表中的记录有关的指针信息。该单词列表包含与各单词有关的信息、单词发音信息、以及与这些单词对应的单词翻译链接信息中的单词信息的记录ID。
当要执行单词翻译时,该单词指导翻译引擎20识别与输入的单词的第一字符对应的第一字符列表中的记录。基于识别出的记录中的单词的数目和关于单词列表的指针信息,该单词指导翻译引擎20检测与从输入单词的第一字符开始的单词对应的单词列表中的记录。该单词指导翻译引擎20然后将输入的单词与所有识别出的记录中的单词信息相比较,并且识别该输入单词。
接下来描述要由单词指导翻译引擎20执行的单词翻译的实施例。当对单词翻译链接信息采用阵列结构基础时,各单词信息记录具有图21A所示的结构。各单词信息记录由单词信息记录ID唯一识别,并且包含主题单词的单词ID、发音ID、词性ID、优先级等级、同义词信息、单词/语块识别标记、区域分类ID、概念ID、左链接信息ID、右链接信息ID、翻译语言ID、翻译信息记录ID、下一个同义词信息记录ID以及备注。如果不存在与下一个同义词对应的单词信息记录,则下一个同义词信息记录ID是“0”。所述翻译语言ID包括图21B所示的语言ID和图21C所示的子标记。这些与图8A和8B所示的语言ID和子标记相同。
在对单词翻译链接信息采用双阵列结构基础的情况下,各单词信息记录具有图22所示的结构。各单词信息记录由单词信息记录ID唯一识别,并且包含主题单词的单词ID、发音ID、词性ID、优先级等级、同义词信息、单词/语块识别标记、区域分类ID、概念ID、左链接信息ID、右链接信息ID、同义词信息记录ID以及备注。在对单词翻译链接信息采用双阵列结构基础的情况下,各同义词信息记录具有图23所示的结构。各同义词信息记录由同义词信息记录ID唯一识别,并且包含主题翻译的语言ID、父单词的单词信息记录ID、主题翻译的同义词信息记录ID、以及下一个同义词的同义词信息记录ID。如果不存在与下一个同义词对应的同义词信息记录,则下一个同义词的同义词信息记录ID是“0”。
图24示出了在对单词翻译链接信息采用阵列结构基础的情况下的在日文和中文之间进行单词翻译使用的双语对照字典的结构。在日文单词检索字典的TRIE结构中,日文单词“アメリカ”和作为单词“アメリカ”的同义词的日文单词“米国”被存储。在中文单词检索字典的TRIE结构中,中文单词“美利坚合众国”和作为单词“美利坚合众国”的同义词的中文单词“美国”被存储。单词“アメリカ”的中文书写如下:
美利坚合众国
在这种情况下,日文单词翻译链接信息包含:与单词“アメリカ”对应的、单词信息记录ID为“330”的单词信息记录和单词信息记录ID为“333”的单词信息记录,与单词“米国”对应的、单词信息记录ID为“444”的单词信息记录和单词信息记录ID为“451”的单词信息记录。
该中文单词翻译链接信息包含:与单词“美利坚合众国”对应的、单词信息记录ID为“100”的单词信息记录和单词信息记录ID为“101”的单词信息记录,以及与单词“美国”对应的单词信息记录ID为“400”的单词信息记录和单词信息记录ID为“541”的单词信息记录。日文单词“アメリカ”与日文单词“米国”是同义词,并且中文单词“美利坚合众国”与中文单词“美国”是同义词。
日文单词翻译链接信息中的ID为“330”的单词信息记录包含:日文主题单词“アメリカ”的单词ID“5”、作为翻译语言的中文语言的语言ID“2”、作为翻译语言的中文单词“美利坚合众国”的单词信息记录的ID“100”、以及下一个同义词的单词信息记录的ID“333”。日文单词翻译链接信息中的ID为“333”的单词信息记录包含:主题单词“アメリカ”的单词ID“5”、作为翻译语言的中文语言的语言ID“2”、”作为翻译语言的中文的单词“美利坚合众国”的同义词的中文单词“美国”或作为日文单词“アメリカ”的同义词的日文单词“米国”的翻译的翻译语言的中文单词“美国”的单词信息记录的ID“541”、以及指示不存在下一个同义词单词的单词信息记录的下一个同义词单词信息记录ID“0”。
另外,日文单词翻译链接信息中的ID为“444”的单词信息记录包含:日文主题单词“米国”的单词ID“7”、作为翻译语言的中文语言的语言ID“2”、作为翻译语言的中文单词“美国”的单词信息记录的ID“400”、以及下一个同义词单词的单词信息记录的ID“451”。日文单词翻译链接信息中的ID为“451”的单词信息记录包含:主题单词“米国”的单词ID“7”、作为翻译语言的中文语言的语言ID“2”、作为翻译语言的中文单词“美国”的同义词的中文单词“美利坚合众国”或作为作为日文单词“米国”的同义词的日文单词“アメリカ”的翻译的作为翻译语言的中文单词“美利坚合众国”的单词信息记录的ID“101”、以及指示不存在下一个同义词的单词信息记录的下一个同义词信息记录ID“0”。
同时,中文单词翻译链接信息中的ID为“100”的单词信息记录包含:中文主题单词“美利坚合众国”的单词ID“7”、作为翻译语言的日文语言的语言ID“1”、作为翻译语言的日文单词“アメリカ”的单词信息记录的ID“330”、以及下一个同义词的单词信息记录的ID“101”。中文单词翻译链接信息中的ID为“101”的单词信息记录包含:主题单词“美利坚合众国”的单词ID“7”、作为翻译语言的日文的语言ID“1”、作为翻译语言日文的单词“アメリカ”的同义词的单词“米国”或作为作为中文单词“美利坚合众国”的同义词的中文单词“美国”的翻译的作为翻译语言日文的单词“米国”的单词信息记录的ID“451”、以及指示不存在下一个同义词的单词信息记录的下一个同义词信息记录ID“0”。
另外,中文单词翻译链接信息中的ID为“400”的单词信息记录包含:中文主题单词“美国”的单词ID“9”、作为翻译语言的日文的语言ID“1”、作为翻译语言日文的单词“USA”的单词信息记录的ID“444”、以及下一个同义词的单词信息记录的ID“541”。中文单词翻译链接信息中的ID为“541”的单词信息记录包含:中文主题单词“美国”的单词ID“7”、作为翻译语言的日文的语言ID“1”、作为翻译语言日文的单词“米国”的同义词的单词“アメリカ”或作为中文单词“美国”的同义词的中文单词“美利坚合众国”的翻译的作为翻译语言的日文单词“アメリカ”的单词信息记录的ID“333”、以及指示不存在下一个同义词的单词信息记录的下一个同义词信息记录ID“0”。
如上所述,日文单词和中文单词通过日文和中文单词翻译链接信息彼此链接。当将中文单词“美利坚合众国”翻译成日文时,单词指导翻译引擎20检测中文单词翻译链接信息中包含中文单词“美利坚合众国”的单词ID“7”和日文的语言ID“1”的ID为“100”的单词信息记录。该单词指导翻译引擎20然后查找作为包含在ID为“100”的单词信息记录中的下一个同义词的单词信息记录的ID为“101”的单词信息记录。基于与作为包含在ID为“100”的单词信息记录中的翻译的日文单词对应的单词信息记录ID“330”,该单词指导翻译引擎20查找日文单词翻译链接信息中的ID为“330”的单词信息记录。另外,基于与作为包含在ID为“101”中的单词信息记录中的翻译的日文单词对应的单词信息记录ID“451”,该单词指导翻译引擎20查找日文单词翻译链接信息中的ID为“451”单词信息记录。基于包含在ID为“330”的单词信息记录中的单词ID“5”,该单词指导翻译引擎20从日文单词检索字典中提取单词“アメリカ”。基于包含在ID为“451”的单词信息记录中的单词ID“7”,该单词指导翻译引擎20从日文单词检索字典中提取单词“米国”。通过这种操作,中文单词“美利坚合众国”翻译成了日文单词“アメリカ”和“米国”。
图25示出了在对单词翻译链接信息采用双阵列结构基础的情况下的要在日文和中文之间的单词翻译中使用的双语对照字典的结构。由于日文和中文单词检索字典的TRIE结构与图23所示的结构相同,所以这里省去了对其的描述。
该日文单词翻译链接信息包含:与单词“アメリカ”对应的单词信息记录ID为“330”的单词信息记录和与单词“米国”对应的单词信息记录ID为“444”的单词信息记录。该日文单词翻译链接信息还包含ID为“ 01”和“02”并且将ID为“330”的单词信息记录作为父记录的同义词信息记录以及ID为“14”和“15”并且将ID“333”的单词信息记录作为父记录的同义词信息记录。
该中文单词翻译链接信息包含:与单词“美利坚合众国”对应的单词信息记录ID为“100”的单词信息记录以及与单词“美国”对应的单词信息记录ID为“211”的单词信息记录。该中文单词翻译链接信息还包含:ID为“04”和“05”并且将ID为“100”的单词信息记录作为父记录的同义词信息记录、以及ID为“214”和“215”并且将ID为“211”的单词信息记录作为父记录的同义词信息记录。
日文单词翻译链接信息中的ID为“330”的单词信息记录包含:日文主题单词“アメリカ”的单词ID“5”、作为子记录的同义词信息记录的ID“01”。该ID为“01”的同义词信息记录包含:作为翻译语言的中文的语言ID“2”、作为父记录的单词信息记录的ID“330”、与作为翻译语言的中文的该主题单词的同义词的中文单词“美国”对应的单词信息记录的子记录(即同义词信息记录)的ID“214”、以及下一个同义词的同义词信息记录的ID“02”。ID为“02”的同义词信息记录包含:作为翻译语言的中文的语言ID“2”、作为父记录的单词信息记录的ID“330”、与作为翻译语言的中文单词“美利坚合众国”对应的该单词信息记录的子记录(即同义词信息记录)的ID“05”、以及指示不存在下一个同义词的同义词信息记录的下一个同义词信息记录ID“0”。
日文单词翻译链接信息中的ID为“333”单词信息记录包含:日文主题单词“米国”的单词ID“7”、以及作为子记录的同义词信息记录的ID“15”。ID为“15”的同义词信息记录包含:作为翻译语言的中文的语言ID“2”、作为父记录的单词信息记录的ID“333”、与作为翻译语言的中文的该主题单词的同义词的中文单词“美利坚合众国”对应的单词信息记录的子记录(即同义词信息记录)的ID“04”、以及下一个同义词的同义词信息记录的ID“15”。ID为“15”的同义词信息记录包含:作为翻译语言的中文的语言ID“2”、作为父记录的单词信息记录的ID“333”、与作为翻译语言的中文单词“美国”对应的单词信息记录的子记录(即同义词信息记录)的ID“215”、以及指示不存在下一个同义词的同义词信息记录的下一个同义词信息记录ID“0”。
同时,中文单词翻译链接信息中的ID为“100”的单词信息记录包含:中文主题单词“美利坚合众国”的单词ID“7”、以及作为子记录的同义词信息记录的ID“04”。ID为“04”的同义词信息记录包含:作为翻译语言的日文的语言ID“1”、父单词信息记录的ID“100”、与作为翻译语言的日文的该主题单词的同义词日文单词“米国”对应的单词信息记录的子记录(即同义词信息记录)的ID“14”、以及下一个同义词的同义词信息记录ID“05”。ID为“05”的同义词信息记录包含:作为翻译语言的日文的语言ID“1”、父单词信息记录的ID“100”、与作为翻译语言的日文的单词“アメリカ”对应的单词信息记录的子记录(即同义词信息记录)的ID“02”、以及指示不存在下一个同义词的同义词信息记录的下一个同义词信息记录ID“0”。
中文单词翻译链接信息中的ID为“211”的单词信息记录包含:中文主题单词“美国”的单词ID“9”、作为子记录的同义词信息记录的ID“214”。ID为“214”的同义词信息记录包含:作为翻译语言的日文的语言ID“1”、父单词信息记录的ID“211”、与作为翻译语言的日文的该主题单词的日文同义词单词“アメリカ”对应的单词信息记录的子记录(即同义词信息记录)的ID“01”、以及下一个同义词单词的同义词信息记录的ID“215”。ID为“215”的同义词信息记录包含:作为翻译语言的日文的语言ID“1”、父单词信息记录的ID“211”、与作为翻译语言的日文单词“米国”对应的单词信息记录的子记录(即同义词信息记录)的ID“15”、以及指示不存在下一个同义词的同义词信息记录的下一个同义词信息记录ID“0”。
如上所述,日文单词和中文单词通过日文和中文单词翻译链接信息相互链接。当中文单词“美利坚合众国”翻译成日文时,该单词指导翻译引擎20查找中文单词翻译链接信息中的包含中文单词“美利坚合众国”的单词ID“7”的ID为“100”的单词信息记录。基于包含在ID为“100”的单词信息记录中的同义词信息记录ID“04”,该单词指导翻译引擎20查找ID为“04”的同义词信息记录。基于与包含在ID为“04”的同义词信息记录中的下一个同义词单词对应的同义词信息记录ID“05”,该单词指导翻译引擎20查找ID为“05”的同义词信息记录。基于在找到的ID为“04”和“05”的同义词信息记录中包含的、同义词信息记录(其为与作为翻译的日文单词对应的单词信息记录的子记录)的ID“02”和“14”,该单词指导翻译引擎20查找作为与日文单词对应的单词信息记录的子记录的ID为“02”和“04”的同义词信息记录。基于包含在找到的ID为“02”和“04”的同义词信息记录中的父单词信息记录ID“330”和“333”,该单词指导翻译引擎20查找ID为“330”和ID为“333”的单词信息记录。基于包含在ID为“330”的单词信息记录中的单词ID“5”,该单词指导翻译引擎20从日文单词检索字典提取单词“アメリカ”。基于包含在ID为“451”的单词信息记录中的单词ID“7”,该单词指导翻译引擎20从日文单词检索字典提取单词“米国”。通过这种操作,中文单词“美利坚合众国”被翻译成日文单词“アメリカ”和“米国”。
图26示出了在对单词翻译链接信息采用阵列结构基础的情况下的要在日文和英文之间的单词翻译中使用的双语对照字典的结构。在日文单词检索字典的TRIE结构中,存储了日文单词“アメリカ”和作为单词“アメリカ”的同义词的日文单词“米国”。在英文单词检索字典的TRIE结构中,存储了单词“America(美国)”和作为单词“America”的同义词的单词“USA”。
在这种情况下,日文单词翻译链接信息包含:与日文单词“アメリカ”对应的单词信息记录ID为“340”的单词信息记录、单词信息记录ID为“343”的单词信息记录,与日文单词“米国”对应的单词信息记录ID为“464”的单词信息记录、单词信息记录ID为“471”的单词信息记录。
该英文单词翻译链接信息包含:与单词“America”对应的单词信息记录ID为“200”的单词信息记录、单词信息记录ID为“201”的单词信息记录,与单词“USA”对应的单词信息记录ID为“500”的单词信息记录以及单词信息记录ID为“641”的单词信息记录。日文单词“アメリカ”与日文单词“米国”同义,并且英文单词“America”也与英文单词“USA”同义。
日文单词翻译链接信息中的ID为“330”的单词信息记录包含:日文主题单词“アメリカ”的单词ID“5”、作为翻译语言的英文的语言ID“3”、作为翻译语言的英文的单词“America”的单词信息记录的ID“200”、以及下一个同义词的单词信息记录的ID“343”。日文单词翻译链接信息中的ID为“343”的单词信息记录包含:日文主题单词“アメリカ”的单词ID“5”、作为翻译语言的英文的语言ID“3”、作为翻译语言的英文单词“America”的同义词的单词“USA”或作为日文单词“アメメリカ”的同义词的日文单词“米国”的翻译的英文单词“USA”的单词信息记录的ID“641”、以及指示不存在下一个同义词的单词信息记录的下一个同义词信息记录ID“0”。
另外,日文单词翻译链接信息中的ID为“464”单词信息记录包含:日文主题单词“米国”的单词ID“7”、作为翻译语言的英文的语言ID“3”、作为翻译语言的英文单词“USA”的单词信息记录的ID“500”、以及下一个同义词的单词信息记录的ID“471”。日文单词翻译链接信息中的ID为“471”中的单词信息记录包含:日文主题单词“米国”的单词ID“7”、作为翻译语言的英文的语言ID“3”、作为翻译语言的英文的单词“USA”的同义词的英文单词“America”的(或作为日文的单词“米国”的同义词的日文单词“アメリカ”的翻译的)作为翻译语言的英文单词“America”的单词信息记录的ID“201”、以及指示不存在下一个同义词的单词信息记录的下一个同义词信息记录ID“0”。
同时,英文单词翻译链接信息中的ID为“200”的单词信息记录包含:英文主题单词“America”的单词ID“8”、作为翻译语言的日文的语言ID“1”、作为翻译语言的日语的单词“アメリカ”的单词信息记录的ID“340”、以及下一个同义词的单词信息记录的ID“201”。英文单词翻译链接信息中的ID为“201”的单词信息记录包含:英文主题单词“America”的单词ID“8”、作为翻译语言的日文的语言ID“1”、作为翻译语言的日文单词“アメリカ”的同义词的单词“米国”的(或作为英文单词“America”的同义词的英文单词“USA”的翻译的)作为翻译语言的日文单词“米国”的单词信息记录的ID“471”、以及指示不存在下一个同义词的单词信息记录的下一个同义词信息记录ID“0”。
另外,英文单词翻译链接信息中的ID为“500”的单词信息记录包含:英文主题单词“USA”的单词ID“11”、作为翻译语言的日文的语言ID“1”、作为翻译语言的日文单词“米国”的单词信息记录的ID“464”、以及下一个同义词的单词信息记录的ID“641”。英文单词翻译链接信息中的ID为“641”的单词信息记录包含:英文主题单词“USA”的单词ID“11”、作为翻译语言的日文的语言ID“1”、作为翻译语言的日文单词“米国”的同义词的单词“アメリカ”的(或作为英文单词“USA”的同义词的英文单词“America”的翻译的作为翻译语言的日文单词“アメリカ”)的单词信息记录的ID“343”、以及指示不存在下一个同义词的单词信息记录的下一个同义词信息记录ID“0”。
如上所述,日文单词和英文单词通过日文和英文单词翻译链接信息彼此链接。当英文单词“America”翻译成日文时,单词指导翻译引擎20在英文单词翻译链接信息中查找包含英文单词“America”的单词ID“8”、以及日文语言的语言ID“1”的单词信息记录(其ID为“200”)。该单词指导翻译引擎20然后检测ID为“201”的单词信息记录,该ID为“201”的单词信息记录是包含在ID为“200”的单词信息记录中的下一个同义词的单词信息记录。基于与作为包含在ID为“200”的单词信息记录中的翻译的日文单词对应的单词信息记录ID“340”,单词指导翻译引擎20检测日文单词翻译链接信息中的ID为“340”的单词信息记录。另外,基于与包含在ID为“201”的单词信息记录中的作为翻译的日文单词对应的单词信息记录ID“471”,单词指导翻译引擎20检测日文单词翻译链接信息中的ID为“471”的单词信息记录。基于包含在ID为“340”的单词信息记录中的单词ID“5”,单词指导翻译引擎20从日文单词检索字典中提取单词“アメリカ”。基于包含在ID为“471”的单词信息记录中的单词ID“7”,单词指导翻译引擎20从日文单词检索字典提取单词“米国”。通过这种操作,英文单词“America”翻译成日文单词“アメリカ”和“米国”。
图27示出了在对单词翻译链接信息采用双阵列结构基础的情况下,单词指导翻译引擎20在日文和英文之间的单词翻译中使用的双语对照字典的结构。由于日文和英文单词检索字典的TRIE结构与图23所示的结构相同,所以这里省去了对其的描述。
日文单词翻译链接信息包含:与单词“アメリカ”对应的单词信息记录ID为“331”的单词信息记录、与单词“米国”对应的单词信息记录ID为“334”的单词信息记录。该日文单词翻译链接信息还包含:ID为“03”和“04”并且以ID为“331”的单词信息记录为父记录的同义词信息记录、以及ID为“16”和“17”并且以ID为“334”的单词信息记录为父记录的同义词信息记录。
该英文单词翻译链接信息包含:与单词“America”对应的单词信息记录ID为“101”的单词信息记录和与单词“USA”对应的单词信息记录ID为“212”的单词信息记录。该英文单词翻译链接信息还包含:ID为“06”和“07”并且以ID为“101”的单词信息记录为父记录的同义词信息记录、和ID为“216”和“217”并且以ID为“212”的单词信息记录为父记录的同义词信息记录。
日文单词翻译链接信息中的ID为“331”的单词信息记录包含:日文主题单词“アメリカ”的单词ID“5”、以及作为子记录的同义词信息记录的ID“03”。ID为“03”的同义词信息记录包含:作为翻译语言的英文的语言ID“3”、作为父记录的单词信息记录的ID“331”、与英文单词“USA”(其为作为翻译语言的该英文主题单词的同义词)对应的单词信息记录的子记录(即同义词信息记录)的ID“216”、以及下一个同义词的同义词信息记录的ID“04”。该ID为“04”的同义词信息记录包含:作为翻译语言的英文的语言ID“3”、作为父记录的单词信息记录的ID“331”、作为与翻译语言的英文单词“America”对应的单词信息记录的子记录的同义词信息记录的ID“07”、以及指示不存在下一个同义词的同义词信息记录的下一个同义词信息记录ID“0”。
日文单词翻译链接信息中的ID为“334”的单词信息记录包含:日文主题单词“米国”的单词ID“7”、以及作为子记录的同义词信息记录的ID“16。”ID为“16”的同义词信息记录包含:作为翻译语言的英文的语言ID“3”、作为父记录的单词信息记录的ID“334”、作为与英文单词“America”(其为翻译语言的该英文主题单词的同义词)对应的单词信息记录的子记录的同义词信息记录的ID“06”、以及下一个同义词的同义词信息记录的ID“17。”该ID为“17”的同义词信息记录包含:作为翻译语言的英文的语言ID“3”、作为父记录的单词信息记录的ID“334”、作为与作为翻译语言的英文单词“USA”对应的单词信息记录的子记录的同义词信息记录的ID“217”、以及指示不存在下一个同义词的同义词信息记录的下一个同义词信息记录ID“0”。
同时,英文单词翻译链接信息中的ID为“101”的单词信息记录包含:英文主题单词“America”的单词ID“8”、以及作为子记录的同义词信息记录的ID“06”。ID为“06”的同义词信息记录包含:作为翻译语言的日文的语言ID“1”、父单词信息记录的ID“101”、与日文单词“USA”(其为翻译语言的该日文主题单词的同义词)对应的单词信息记录的子记录(即同义词信息记录)的ID“16”、以及下一个同义词的同义词信息记录的ID“07”。该ID为“07”的同义词信息记录包含:作为翻译语言的日文的语言ID“1”、父单词信息记录的ID“101”、与作为翻译语言的日文单词“America”对应的单词信息记录的子记录(即同义词信息记录)的ID“04”、以及指示不存在下一个同义词的同义词信息记录的下一个同义词信息记录ID“0”。
英文单词翻译链接信息中的ID为“212”的单词信息记录包含:英文主题单词“USA”的单词ID“11”、以及作为子记录的同义词信息记录的ID“216”。该ID为“216”的同义词信息记录包含:作为翻译语言的日文的语言ID“1”、父单词信息记录的ID“212”、与日文单词“アメリカ”(即作为翻译语言的该日文主题单词的同义词)对应的单词信息记录的子记录(即同义词信息记录)的ID“03”、以及下一个同义词的同义词信息记录的ID“217”。该ID为217的同义词信息记录包含:作为翻译语言的日文的语言ID“1”、父单词信息记录的ID“212”、作为与作为翻译语言的日文单词“USA”对应的单词信息记录的子记录的同义词信息记录的ID“17”、以及指示不存在下一个同义词的同义词信息记录的下一个同义词信息记录ID“0”。
如上所述,日文单词和英文单词通过日文和英文单词翻译链接信息彼此链接。当英文单词“America”翻译成日文时,该单词指导翻译引擎20查找英文单词翻译链接信息中的包含英文单词“America”的单词ID“7”的单词信息记录(其ID为“101”)。基于包含在ID为“101”的单词信息记录中的同义词信息记录ID“06”,该单词指导翻译引擎20查找ID为“06”的同义词信息记录。基于与包含在ID为“06”的同义词信息记录中的下一个同义词对应的同义词信息记录ID“07”,该单词指导翻译引擎20查找ID为“07”的同义词信息记录。基于与包含在找到的ID为“06”和“07”的同义词信息记录中的作为翻译的日文单词对应的单词信息记录的子记录的同义词信息记录ID“04”和“16”,该单词指导翻译引擎20查找作为与日文单词对应的单词信息记录的子记录的ID为“04”和“16”的同义词信息记录。基于包含在找到的ID为“04”和“06”的同义词信息记录中的父单词信息记录ID“331”和“334”,该单词指导翻译引擎20检测ID为“331”和ID为“334”的单词信息记录。基于包含在ID为“331”的单词信息记录中的单词ID“5”,该单词指导翻译引擎20从日文单词检索字典提取单词“アメリカ”。基于包含在ID为“334”的单词信息记录中的单词ID“7”,该单词指导翻译引擎20从日文单词检索字典提取单词“米国”。通过这种操作,英文单词“America”被翻译成了日文单词“アメリカ”和“米国”。
该单词指导翻译引擎20将通过上述翻译过程获得的单词输出到目标语言文本句子创建单元22。如果存在两种或更多种翻译,则单词指导翻译引擎20比较源语言的主题单词的词性属性和每种翻译的词性属性,并且可以仅仅输出这些种翻译中的具有与源语言的主题单词相同的词性属性的翻译。如果存在具有与源语言的主题单词相同的词性属性的两种或更多种翻译,则单词指导翻译引擎20可以任意选择并且输出其中一种翻译。如果不存在作为翻译结果的单词,则单词指导翻译引擎20将源语言的主题单词输出到目标语言文本句子创建单元22。基于各输入单词和各翻译,单词指导翻译引擎20能够从外部知识数据库(未示出)获得多种信息,诸如统计信息和语法信息。
如上所述,一种语言的单词与另外语言的单词通过单词翻译链接信息进行链接。因此,能够在两种语言或三种语言或更多种语言之间进行翻译。
尽管已经显示和描述了本发明的一些示例性实施方式,但是本发明不限于这些实施例,并且在不脱离本发明的原理和精神的情况下可以对这些实施方式进行改变,本发明的范围由权利要求限定。
根据本发明的单词翻译装置可以用于补充翻译存储器引擎、基于句型的翻译引擎、基于语块的翻译引擎和基于分析翻译引擎(见图1),或者可以与翻译引擎、基于句型的翻译引擎或基于语块的翻译引擎结合使用。所述单词翻译装置可以形成为独立结构。可以通过将执行单词翻译装置的功能的软件安装到计算机上来实现所述单词翻译装置,或者所述单词翻译装置可以用作便携式电子字典。
Claims (37)
1.一种单词翻译装置,所述单词翻译装置能够执行多种语言之间的单词翻译,所述单词翻译装置包括:
存储单元,用于至少将第一单词检索结构、第二单词检索结构、第一单词和翻译信息记录、以及第二单词信息记录存储在字典中,其中,所述第一单词检索结构被设置用于检索第一语言的单词,所述第二单词检索结构被设置用于检索第二语言的单词,所述第一单词和翻译信息记录包括与存储在所述第一单词检索结构中的单词相关的单词关联信息和翻译信息,所述第二单词信息记录包括与存储在所述第二单词检索结构中的单词相关的单词关联信息和翻译信息。
2.如权利要求1所述的单词翻译装置,其中,所述第一单词检索结构和第二单词检索结构包括用于识别单词和翻译信息记录的单词和翻译信息记录识别信息。
3.如权利要求1所述的单词翻译装置,其中,所述第一单词和翻译信息记录与所述第二单词和翻译信息记录分别包括用于识别存储在所述第一单词检索结构和第二单词检索结构中的单词的单词识别信息。
4.如权利要求1所述的单词翻译装置,其中,所述第一单词和翻译信息记录和第二单词和翻译信息记录分别包括与存储在所述第一单词检索结构和第二单词检索结构中的单词相关的关联信息。
5.如权利要求1所述的单词翻译装置,其中:
所述第一单词和翻译信息记录包括用于识别存储在所述第二单词和翻译信息记录中的翻译信息的翻译识别信息;以及
所述第二单词和翻译信息记录包括用于识别存储在所述第一单词和翻译信息记录中的翻译信息的翻译识别信息。
6.如权利要求1到4中的任何一个所述的单词翻译装置,其中,所述第一单词和翻译信息记录与第二单词和翻译信息记录都包括识别各翻译的同义词的信息。
7.如权利要求1到5中的任何一个所述的单词翻译装置,其中,所述第一单词和翻译信息记录与所述第二单词和翻译信息记录都包括用于识别进行翻译的语言的种类的识别信息。
8.如权利要求1到3中的任何一个所述的单词翻译装置,其中,当主题单词具有多种词性时,所述第一单词和翻译信息记录与所述第二单词和翻译信息记录都包括用于存储与各词性相关的一条单词关联信息和一条翻译信息的记录。
9.如权利要求8所述的单词翻译装置,其中,所述各词性的记录通过指针与所述一条单词关联信息关联。
10.如权利要求1到9中的任何一个所述的单词翻译装置,所述装置还包括:
输入单元,用于输入单词;
查阅单元,用于在所述第一单词检索结构中存储的单词中查阅所输入的单词;
提取单元,用于基于与所述单词关联的所述第一单词信息记录从存储在所述第二单词检索结构中的翻译中提取翻译;以及
输出单元,用于输出所提取出的翻译。
11.如权利要求10所述的单词翻译装置,其中,所述提取单元基于与所述查阅单元所查阅的所述单词相关联的所述第一单词信息记录提取所述第二单词信息记录。
12.如权利要求10或11所述的单词翻译装置,其中:
所述第一单词信息记录的所述翻译信息包括链接信息,所述链接信息用于识别存储在所述第二单词检索结构或第二单词信息记录中的翻译;以及
所述提取单元基于所述链接信息提取所述翻译或所述第二单词信息记录。
13.一种单词翻译装置,所述单词翻译装置执行多种语言之间的单词翻译,所述单词翻译装置包括:
存储单元,用于在字典中存储N种语言的单词检索结构以及与所述N种语言的各自的单词检索结构相关联的所述N种语言的单词信息记录,N是2或大于2的整数,
所述N种语言的所述单词信息记录中的一种语言的所述单词信息记录包括翻译信息,该翻译信息用于识别所述多种语言中的所述一种语言的翻译。
14.一种单词翻译装置,所述单词翻译装置执行多种语言之间的单词翻译,所述单词翻译装置包括:
存储单元,用于存储为各语言设置的单词检索字典数据以及链接信息,所述链接信息是为存储在为各种语言设置的所述单词检索字典数据中的各单词设置的、并且指示一种语言中的单词和另一种语言中的所述单词的翻译之间的关系。
15.如权利要求14所述的单词翻译装置,其中,所述链接信息包括:识别信息,用于识别所述一种语言的单词;识别信息,用于识别所述另一种语言;指针,用于指向与所述另一种语言的翻译相关的链接信息;以及指针,指向与所述一种语言的单词的同义词相关的链接信息。
16.如权利要求14所述的单词翻译装置,其中:
所述链接信息包括父链接信息和子链接信息;
所述父链接信息包括指向与所述一种语言的单词的同义词相关的所述子链接信息的指针;
所述子链接信息包括:识别信息,用于识别所述另一种语言;指针,用于指向所述对应的父链接信息;指针,用于指向与所述另一种语言的翻译相关的子链接信息;以及指针,用于指向与另一同义词相关的子链接信息。
17.如权利要求14到16中的任何一个所述的单词翻译装置,其中,当所述单词具有多种词性时,为各词性设置所述链接信息。
18.如权利要求14到17中的任何一个所述的单词翻译装置,其中,所述单词检索字典数据包括单词检索结构和单词信息记录,所述单词检索结构是为所述各种语言设置的并且用于检索单词,所述单词信息记录是为所述各种语言设置的并且存储与所述单词相关的信息。
19.如权利要求18所述的单词翻译装置,其中,所述单词信息记录包括所述链接信息。
20.如权利要求18所述的单词翻译装置,其中,所述单词检索结构包括单词TRIE结构或哈希函数结构。
21.如权利要求14到20中的任何一个所述的单词翻译装置,其中:
所述单词检索结构包括与所述对应语言的各单词的第一字符相关的列表信息和与所述单词相关的列表信息;
所述第一字符列表信息包括与所述第一字符相关的信息、以所述第一字符开始的单词的数目、指向与以所述第一字符开始的单词相关的列表信息中的某一位置的指针;以及
所述单词列表信息包括指向与所述单词相关的链接信息的指针。
22.如权利要求14到21中的任何一个所述的单词翻译装置,所述单词翻译装置还包括:
输入单元,用于输入所述一种语言的单词;
查阅单元,用于在与所述一种语言相关的所述单词检索字典数据中查阅所输入的所述一种语言的单词;以及
提取单元,用于基于与所查阅的所述一种语言的单词相关的所述链接信息,从与所述另一种语言相关的所述单词检索字典数据中提取所述另一种语言的翻译。
23.如权利要求22所述的单词翻译装置,其中,所述提取单元基于与所述查阅单元查阅的所述一种语言的单词信息记录相关的所述链接信息,提取所述另一种语言的单词信息记录。
24.如权利要求22所述的单词翻译装置,其中,所述提取单元基于与所述查阅单元查阅的所述一种语言的单词信息记录相关的所述链接信息,从所述另一种语言的所述单词检索结构提取翻译。
25.一种机器翻译系统,所述机器翻译系统包括:
翻译单元,用于输入句子并且翻译所述句子;以及
如权利要求1到24中的任何一个所述的所述单词翻译装置,用于输入所述翻译单元未翻译出的单词并且翻译所述单词。
26.如权利要求25所述的机器翻译系统,其中,所述翻译单元包括翻译存储器引擎、基于句型的翻译引擎和基于语块示例的翻译引擎中的至少一个。
27.如权利要求26所述的机器翻译系统,所述机器翻译系统还包括:
区别输出单元,用于区别不是由所述翻译单元翻译出的所述单词的翻译和其它翻译,并且输出所述翻译。
28.一种用于在多种语言之间翻译单词的单词翻译方法,所述单词翻译方法包括如下步骤:
将第一单词检索结构、第二单词检索结构、第一单词信息记录和第二单词信息记录存储在字典中,所述第一单词检索结构被设置用于检索第一语言的单词,所述第二单词检索结构被设置用于检索第二语言的单词,所述第一单词信息记录包括用于识别存储在所述第一单词检索结构中的单词的翻译的第一翻译信息,所述第二单词信息记录包括用于识别存储在所述第二单词检索结构中的单词的翻译的第二翻译信息。
29.如权利要求28所述的单词翻译方法,还包括如下步骤:
输入单词;
在存储于所述第一单词检索结构中的所述单词中查阅所输入的单词;
基于所查阅的单词的所述第一单词信息记录,从所述第二单词检索结构中提取翻译;以及
输出所提取出的翻译。
30.一种在多种语言之间翻译单词的翻译方法,所述翻译方法包括如下步骤:
将单词检索字典数据和链接信息存储在存储单元中,所述单词检索字典数据是为所述各种语言设置的,所述链接信息是为存储在为所述各种语言设置的所述单词检索字典数据中的各单词设置的、并且指示一种语言的单词和该单词的另一种语言的翻译之间的关系。
31.如权利要求29所述的翻译方法,所述翻译方法还包括如下步骤:
输入一种语言的单词;
在为所述一种语言设置的所述单词检索字典数据中查阅所述一种语言的输入单词;以及
基于与所查阅的所述一种语言的单词相关的所述链接信息,从为所述另一种语言设置的所述单词检索字典数据中提取所述另一种语言的翻译。
32.如权利要求31所述的翻译方法,其中:
所述单词检索字典数据包括单词信息记录,所述单词信息记录是为各种语言设置的,并且存储单词检索结构和与单词有关的信息;
所述单词信息记录包括所述链接信息;以及
所述提取步骤包括:基于所述一种语言的所述单词信息记录的链接信息提取所述另一种语言的所述单词信息记录。
33.一种在多种语言之间翻译单词的单词翻译程序,执行所述程序以执行如下步骤:
将第一单词检索结构、第二单词检索结构、第一单词信息记录和第二单词信息记录存储在字典中,所述第一单词检索结构被设置用于检索第一语言的单词,所述第二单词检索结构被设置用于检索第二语言的单词,所述第一单词信息记录包括用于识别存储在所述第一单词检索结构中的单词的翻译的第一翻译信息,所述第二单词信息记录包括用于识别存储在所述第二单词检索结构中的单词的翻译的第二翻译信息。
34.如权利要求31所述的单词翻译程序,其中,执行所述程序以另外执行如下步骤:
输入单词;
在存储于所述第一单词检索结构中的所述单词中查阅所输入的单词;
基于所述查阅的单词的所述第一单词信息记录,从所述第二单词检索结构提取翻译;以及
输出所提取出的翻译。
35.一种在多种语言之间翻译单词的翻译程序,执行所述程序以执行如下步骤:
将单词检索字典数据和链接信息存储在存储单元中,所述单词检索字典数据是为所述各种语言设置的,所述链接信息是对存储在为所述各种语言设置的所述单词检索字典数据中的各单词设置的并且指示一种语言的单词和另一种语言的该单词的翻译之间的关系。
36.一种翻译程序,执行所述程序以执行如下步骤:
输入一种语言的单词;
将所述一种语言的输入单词参照到为所述一种语言设置的所述单词检索字典数据;以及
基于与所述一种语言的所述参照的单词有关的所述链接信息,从为所述另一种语言设置的所述单词检索字典数据中提取另一种语言的翻译。
37.如权利要求36所述的翻译程序,其中:
所述单词检索字典数据包括为各种语言设置的单词信息记录并且存储单词检索结构和与单词有关的信息;
所述单词信息记录包括所述链接信息;以及
所述提取步骤包括:基于所述一种语言的所述单词信息记录的链接信息提取所述另一种语言的所述单词信息记录。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005048595 | 2005-02-24 | ||
JP048595/2005 | 2005-02-24 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101124579A true CN101124579A (zh) | 2008-02-13 |
Family
ID=36927370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800055811A Pending CN101124579A (zh) | 2005-02-24 | 2006-02-22 | 单词翻译装置、翻译方法以及翻译程序 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8041557B2 (zh) |
JP (1) | JP4911028B2 (zh) |
CN (1) | CN101124579A (zh) |
WO (1) | WO2006090732A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101419605B (zh) * | 2008-04-30 | 2012-10-10 | 中山大学 | 一种实现重复单词列表的电子词典的查询方法 |
CN103294682A (zh) * | 2012-02-24 | 2013-09-11 | 摩根全球购物有限公司 | 多语言检索方法、计算机可读储存媒体及网络搜寻系统 |
CN107146487A (zh) * | 2017-07-21 | 2017-09-08 | 锦州医科大学 | 一种英语语音翻译方法 |
CN107894983A (zh) * | 2017-11-08 | 2018-04-10 | 深圳市沃特沃德股份有限公司 | 引擎的切换方法与装置 |
Families Citing this family (194)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
JP2007193438A (ja) * | 2006-01-17 | 2007-08-02 | Casio Comput Co Ltd | 電子辞書装置及び検索制御プログラム |
JP2008065395A (ja) * | 2006-09-04 | 2008-03-21 | Fuji Xerox Co Ltd | 翻訳装置、翻訳方法および翻訳プログラム |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8074172B2 (en) | 2007-01-05 | 2011-12-06 | Apple Inc. | Method, system, and graphical user interface for providing word recommendations |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8232973B2 (en) | 2008-01-09 | 2012-07-31 | Apple Inc. | Method, device, and graphical user interface providing word recommendations for text input |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
TWI376656B (en) * | 2008-09-11 | 2012-11-11 | Shing Lung Chen | Foreign-language learning method utilizing an original language to review corresponding foreign languages and foreign-language learning database system thereof |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
KR20100037813A (ko) * | 2008-10-02 | 2010-04-12 | 삼성전자주식회사 | 통계적 자동 번역 장치 및 방법 |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US20100235780A1 (en) * | 2009-03-16 | 2010-09-16 | Westerman Wayne C | System and Method for Identifying Words Based on a Sequence of Keyboard Events |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8543598B2 (en) * | 2010-03-01 | 2013-09-24 | Microsoft Corporation | Semantic object characterization and search |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
JP5747508B2 (ja) * | 2011-01-05 | 2015-07-15 | 富士ゼロックス株式会社 | 対訳情報検索装置、翻訳装置及びプログラム |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US11410072B2 (en) * | 2011-10-21 | 2022-08-09 | Educational Testing Service | Computer-implemented systems and methods for detection of sentiment in writing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
JP2014075073A (ja) | 2012-10-05 | 2014-04-24 | Fuji Xerox Co Ltd | 翻訳処理装置及びプログラム |
EP3809407A1 (en) | 2013-02-07 | 2021-04-21 | Apple Inc. | Voice trigger for a digital assistant |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101922663B1 (ko) | 2013-06-09 | 2018-11-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
JP2016521948A (ja) | 2013-06-13 | 2016-07-25 | アップル インコーポレイテッド | 音声コマンドによって開始される緊急電話のためのシステム及び方法 |
AU2014306221B2 (en) | 2013-08-06 | 2017-04-06 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9966065B2 (en) | 2014-05-30 | 2018-05-08 | Apple Inc. | Multi-command single utterance input method |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10592614B1 (en) * | 2017-01-19 | 2020-03-17 | Amdocs Development Limited | System, method, and computer program for translating unified ticketing system (UTS) messages |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
CN108959276A (zh) * | 2018-07-23 | 2018-12-07 | 传神语联网网络科技股份有限公司 | 一种用于翻译的术语发现方法及其系统 |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
CN116933807B (zh) * | 2023-09-14 | 2023-12-29 | 成都帆点创想科技有限公司 | 一种文本翻译方法、装置、设备及可读存储介质 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62165238A (ja) * | 1986-01-16 | 1987-07-21 | Sharp Corp | 電子辞書の検索方法 |
JPH01234975A (ja) * | 1988-03-11 | 1989-09-20 | Internatl Business Mach Corp <Ibm> | 日本語文章分割装置 |
JPH01291363A (ja) | 1988-05-18 | 1989-11-22 | Matsushita Electric Ind Co Ltd | 辞書検索装置 |
JP2815911B2 (ja) | 1989-07-19 | 1998-10-27 | 三洋電機株式会社 | 電子辞書 |
JPH03118661A (ja) * | 1989-09-29 | 1991-05-21 | Matsushita Electric Ind Co Ltd | 単語検索装置 |
US5301109A (en) * | 1990-06-11 | 1994-04-05 | Bell Communications Research, Inc. | Computerized cross-language document retrieval using latent semantic indexing |
US5229936A (en) * | 1991-01-04 | 1993-07-20 | Franklin Electronic Publishers, Incorporated | Device and method for the storage and retrieval of inflection information for electronic reference products |
JPH0594471A (ja) * | 1991-02-04 | 1993-04-16 | Oki Electric Ind Co Ltd | 共起辞書作成装置 |
JPH05108621A (ja) | 1991-10-18 | 1993-04-30 | Dainippon Printing Co Ltd | 電子辞書・事典装置 |
JPH05120325A (ja) * | 1991-10-29 | 1993-05-18 | Meidensha Corp | 電子化辞書 |
JPH05266069A (ja) | 1992-03-23 | 1993-10-15 | Nec Corp | 中国語と日本語との間の双方向機械翻訳方式 |
JPH0736882A (ja) * | 1993-07-19 | 1995-02-07 | Fujitsu Ltd | 辞書検索装置 |
JPH07168848A (ja) * | 1993-12-16 | 1995-07-04 | Fujitsu Ltd | 単語辞書検索装置 |
JP2975529B2 (ja) * | 1994-05-31 | 1999-11-10 | シャープ株式会社 | 電子化辞書検索装置 |
JP3152868B2 (ja) * | 1994-11-16 | 2001-04-03 | 富士通株式会社 | 検索装置および辞書/テキスト検索方法 |
JPH09198394A (ja) * | 1996-01-23 | 1997-07-31 | Matsushita Electric Ind Co Ltd | 2分探索検索装置 |
FI982095A (fi) * | 1998-09-29 | 2000-03-30 | Nokia Networks Oy | Menetelmä muistin toteuttamiseksi ja muistijärjestely |
JP2000276479A (ja) | 1999-03-24 | 2000-10-06 | Sharp Corp | 電子辞書装置及び電子辞書プログラムを記録した記録媒体 |
US6393389B1 (en) * | 1999-09-23 | 2002-05-21 | Xerox Corporation | Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions |
US6904402B1 (en) * | 1999-11-05 | 2005-06-07 | Microsoft Corporation | System and iterative method for lexicon, segmentation and language model joint optimization |
JP4066600B2 (ja) * | 2000-12-20 | 2008-03-26 | 富士ゼロックス株式会社 | 多言語文書検索システム |
EP1306775A1 (en) * | 2001-10-29 | 2003-05-02 | BRITISH TELECOMMUNICATIONS public limited company | Machine translation |
AU2003269808A1 (en) * | 2002-03-26 | 2004-01-06 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
GB0413743D0 (en) * | 2004-06-19 | 2004-07-21 | Ibm | Method and system for approximate string matching |
JP4404211B2 (ja) * | 2005-03-14 | 2010-01-27 | 富士ゼロックス株式会社 | マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム |
GB0513225D0 (en) * | 2005-06-29 | 2005-08-03 | Ibm | Method and system for building and contracting a linguistic dictionary |
-
2006
- 2006-02-22 WO PCT/JP2006/303155 patent/WO2006090732A1/ja active Application Filing
- 2006-02-22 US US11/817,008 patent/US8041557B2/en not_active Expired - Fee Related
- 2006-02-22 CN CNA2006800055811A patent/CN101124579A/zh active Pending
- 2006-02-22 JP JP2007504746A patent/JP4911028B2/ja not_active Expired - Fee Related
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101419605B (zh) * | 2008-04-30 | 2012-10-10 | 中山大学 | 一种实现重复单词列表的电子词典的查询方法 |
CN103294682A (zh) * | 2012-02-24 | 2013-09-11 | 摩根全球购物有限公司 | 多语言检索方法、计算机可读储存媒体及网络搜寻系统 |
CN107146487A (zh) * | 2017-07-21 | 2017-09-08 | 锦州医科大学 | 一种英语语音翻译方法 |
CN107894983A (zh) * | 2017-11-08 | 2018-04-10 | 深圳市沃特沃德股份有限公司 | 引擎的切换方法与装置 |
Also Published As
Publication number | Publication date |
---|---|
US8041557B2 (en) | 2011-10-18 |
JP4911028B2 (ja) | 2012-04-04 |
US20090106018A1 (en) | 2009-04-23 |
WO2006090732A1 (ja) | 2006-08-31 |
JPWO2006090732A1 (ja) | 2008-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101124579A (zh) | 单词翻译装置、翻译方法以及翻译程序 | |
CN100511215C (zh) | 多语种翻译存储器和翻译方法 | |
CN100474301C (zh) | 基于数据挖掘获取词或词组单元译文信息的系统和方法 | |
JP4504555B2 (ja) | 翻訳支援システム | |
CN100562870C (zh) | 翻译装置和翻译方法 | |
KR100453227B1 (ko) | 번역 지원 시스템에서의 유사 문장 검색 방법 | |
US5285386A (en) | Machine translation apparatus having means for translating polysemous words using dominated codes | |
US8311799B2 (en) | Example-based translation using common and uncommon portions of an input sentence | |
JP2742115B2 (ja) | 類似文書検索装置 | |
KR101266361B1 (ko) | 구조화된 번역 메모리 기반의 자동 번역 시스템 및 자동 번역 방법 | |
Kumar et al. | A study of spell checking techniques for indian languages | |
JP5107556B2 (ja) | 改善された中国語−英語翻訳ツール | |
Lim et al. | Automatic genre detection of web documents | |
JP4088171B2 (ja) | テキスト解析装置、方法、プログラム及びそのプログラムを記録した記録媒体 | |
Baishya et al. | Present state and future scope of Assamese text processing | |
Iswarya et al. | Adapting hybrid machine translation techniques for cross-language text retrieval system | |
Rapp | A Part-of-Speech-Based Search Algorithm for Translation Memories. | |
Ogden et al. | CRL's TREC-8 Systems Cross-Lingual IR, and Q&A. | |
KR102338949B1 (ko) | 기술문서 번역 지원 시스템 | |
Fang et al. | Web-based terminology translation mining | |
JP3419748B2 (ja) | 辞書作成装置および方法と辞書作成プログラムを記録した記録媒体 | |
Fang et al. | Web Translation Mining Based on Suffix Arrays. | |
KR20040050394A (ko) | 원시언어를 대상언어로 번역하기 위한 번역엔진 장치 및그 번역방법 | |
JP2608384B2 (ja) | 機械翻訳装置及びその方法 | |
Mayavathi et al. | QUALITY TRANSLATION USING THE VAUQUOIS TRIANGLE FOR ENGLISH TO TAMIL |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20080213 |