JPWO2006090732A1 - 単語翻訳装置、翻訳方法および翻訳プログラム - Google Patents

単語翻訳装置、翻訳方法および翻訳プログラム Download PDF

Info

Publication number
JPWO2006090732A1
JPWO2006090732A1 JP2007504746A JP2007504746A JPWO2006090732A1 JP WO2006090732 A1 JPWO2006090732 A1 JP WO2006090732A1 JP 2007504746 A JP2007504746 A JP 2007504746A JP 2007504746 A JP2007504746 A JP 2007504746A JP WO2006090732 A1 JPWO2006090732 A1 JP WO2006090732A1
Authority
JP
Japan
Prior art keywords
word
translation
information
language
information record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007504746A
Other languages
English (en)
Other versions
JP4911028B2 (ja
Inventor
劉 紹明
紹明 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2007504746A priority Critical patent/JP4911028B2/ja
Publication of JPWO2006090732A1 publication Critical patent/JPWO2006090732A1/ja
Application granted granted Critical
Publication of JP4911028B2 publication Critical patent/JP4911028B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

単語翻訳装置は、第1言語の単語を検索するための第1言語の単語検索トライ構造100、第2言語の単語を検索するための第2言語の単語検索トライ構造200、第1言語の単語検索トライ構造100に格納された単語についての訳語を識別するための第1の訳語情報を含む第1言語の単語情報レコード110、および第2の単語検索トライ構造に格納された単語についての訳語を識別するための第2の訳語情報を含む第2言語の単語情報レコード210を対訳辞書に記憶している。第1、第2の単語情報レコード110、210を参照することで、第1、第2言語間の双方向の単語翻訳を高精度にかつ高速に実現することができる。

Description

本発明は、原言語の単語を目的言語の単語に翻訳する単語翻訳装置に関し、特に複数言語相互間の翻訳技術に関する。
単語翻訳技術は、入力された第1の言語単語を対訳辞書を参照し、そこから第2の言語の訳語を引き出し、これを出力するものである。また、文の翻訳技術は、入力された第1言語の文を形態素解析し、文を構成する単語集合を抽出し、対訳辞書を利用して抽出された単語の訳語を引き出し、訳語の接続関係を利用して訳文を生成するものである。例えば非特許文献1は、語の接続関係を利用した機械翻訳システムを開示している。
このような単語翻訳技術や文の翻訳技術は、電子単語翻訳装置やコンピュータ装置において実用化されている。例えば、電子単語翻訳装置は、複数の言語に関する対訳辞書をメモリ内に記憶し、ユーザが第1の言語単語を入力すると、その単語の訳語を対訳辞書を参照して抽出し、これをディスプレイに表示する。
特許文献1は、電子辞書において検索を行うときに、ユーザが辞書の種類を選択する手間を省くものである。すなわち、ユーザが入力した検索語に基づいて、複数の辞書に含まれる見出し語を検索し、検索された見出し語が含まれる複数の辞書内容を一括して表示させている。
特開2000−276479号 鈴木、栃内、「語の接続関係を利用した機械翻訳システム」、情報処理学会論文誌、Vol.29、No.4、1988
一般に、対訳辞書の構成は、言語対毎(例えば、日英、英日など)に構成され、単語情報を二重に記録し、日英または英日からの翻訳時に、単語情報を共用しない構造になっている。このため、辞書の構築コストは高くなっている。また、対訳辞書は双方向に検索可能な構成になっていないため対訳辞書に情報漏れという問題がある。例えば、日英に存在する対訳対が、英日に存在しない場合がある。特許文献1の電子辞書では、英日翻訳辞書と日英翻訳辞書をそれぞれ独自の翻訳に適用しているので、上記した課題を依然として解決するものではない。
また、文の翻訳技術として、最終的な目的は正確な翻訳文を取り出すことであるが、すべてにおいて正確な翻訳を得ることが容易でないのが現状である。このため、翻訳された文書には、正解な訳文と不正解な訳文とが混在し、ユーザは、どこまでが正解な訳文なのかを判断することが難くなっている。非特許文献1は、このような課題を解決する構成を開示し、または示唆するものではない。
本発明は、上記従来の課題を解決するために成されたものであり、2言語間または複数言語間において双方向の翻訳を可能とする対訳辞書を備えた単語翻訳装置、翻訳方法および翻訳プログラムを提供することを目的とする。
さらに本発明は、高速に単語の翻訳を行うことができる単語翻訳装置、翻訳方法および翻訳プログラムを提供することを目的とする。
本発明は、複数言語間において単語の翻訳を行う単語翻訳装置であって、少なくとも、第1の言語の単語を検索するための第1の単語検索構造、第2の言語の単語を検索するための第2の単語検索構造、第1の単語検索構造に格納された単語についての単語関連情報と訳語情報を含む第1の単語・訳語情報レコード、および第2の単語検索構造に格納された単語についての単語関連情報と訳語情報を含む第2の単語情報レコードを辞書に記憶する記憶手段を備える。任意の言語の単語からもう一方の言語の訳語を引き出すときに、単語を原言語の単語検索構造と照合し、照合が成功した場合は、対応した単語情報と訳語情報を単語・訳語情報レコードから取り出し、取り出された訳語情報からもう一方の言語の単語検索構造の訳語情報を得ることができる。原言語の単語を単語検索構造において照合が失敗した場合は、原言語の単語をそのまま出力する。
また、本発明の単語翻訳装置は、第1、第2の単語検索構造が、単語・訳語情報レコードを識別するための単語・訳語情報レコード識別情報を含む。
また、本発明の単語翻訳装置は、第1、第2の単語・訳語情報レコードが、それぞれ第1、第2の単語検索構造に含まれる単語を識別する単語識別情報を含む。
また、本発明の単語翻訳装置は、第1、第2の単語・訳語情報レコードが、それぞれ第1、第2の単語検索構造に含まれる単語の関連情報を含む。
また、本発明の単語翻訳装置は、第1の単語・訳語情報レコードが、第2の単語・訳語情報レコードに含まれる訳語情報を識別するための訳語識別情報を含み、第2の単語・訳語情報レコードが、第1の単語・訳語情報レコードに含まれる訳語情報を識別するための訳語識別情報を含む。
また、本発明の単語翻訳装置は、第1、第2の単語・訳語情報レコードが、訳語に関連する多義語を識別するための識別情報を含む。
また、本発明の単語翻訳装置は、第1、第2の単語・訳語情報レコードが、訳語の言語種を識別するための識別情報を含む。
また、本発明の単語翻訳装置は、第1、第2の単語・訳語情報レコードが、1つの単語が複数の品詞を有する場合に、各品詞毎に、単語関連情報と訳語情報を記憶するレコードを有する。
また、本発明の単語翻訳装置は、各品詞毎のレコードが、当該1つの単語関連情報とポインタによって関連付けされている。
好ましくは、単語翻訳装置はさらに、単語を入力する入力手段と、入力された単語を第1の単語検索トライ構造に格納された単語と照合する照合手段と、照合された単語についての第1の単語情報レコードに基づき第2の単語検索トライ構造に格納された訳語を抽出する抽出手段と、抽出された訳語を出力する出力手段とを有する。これにより、入力された単語の訳語を高速かつ高精度に得ることができる。好ましくは、前記抽出手段は、前記照合手段により照合された単語についての第1の単語情報レコードに基づき第2の単語情報レコードを抽出する。また、第1の単語情報レコードの訳語情報は、第2の単語検索構造に格納された訳語または第2の単語情報レコードを識別するためのリンク情報を含み、前記抽出手段は、前記リンク情報に基づき前記訳語または第2の単語情報レコードを抽出するようにしてもよい。
本発明に係る複数言語間において単語の翻訳を行う単語翻訳装置は、Nカ国言語(Nは、2以上の整数)についての単語検索トライ構造と、Nカ国言語の単語検索トライ構造に対応するNカ国言語の単語情報レコードとを辞書に記憶する記憶手段を含み、Nカ国言語の単語情報レコードのうち所定言語の単語情報レコードは、所定単語についての訳語を識別する訳語情報を複数言語について記憶する。これは、本発明に係る単語翻訳装置が、2言語間のみならず複数言語間(マルチリンガル)の単語翻訳に対応可能であることを規定している。
さらに本発明に係る機械翻訳システムは、文章を入力し、当該文章の翻訳を行う翻訳手段と、翻訳手段によって翻訳できなかった単語を入力し、当該単語の翻訳を行う請求項1ないし10いずれか1つに記載の単語翻訳装置とを有する。翻訳手段は、翻訳メモリエンジン、パターンベース翻訳エンジン、またはチャンクベース例文翻訳エンジンのいずれか1つを含む。好ましくは、翻訳手段によって翻訳できなかった単語についての訳語を、他の訳語と識別して出力する識別出力手段を含む。これにより、高精度の翻訳を行うことができるとともに、ユーザは、どの訳語の信頼性が高く、どの訳語の信頼性が低いのかを容易に判別することができる。
本発明に係る、複数言語間において単語の翻訳を行う単語翻訳装置は、前記言語毎に設けられる単語検索辞書データと、前記言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報とを記憶する記憶手段を有する。
これにより、リンク情報によって一の言語の単語と他の言語における訳語との関連付けがなされるため、2言語間又は複数言語間において双方向の翻訳が可能となる。
好ましくは、単語翻訳装置は、前記リンク情報が、前記一の言語の単語の識別情報と、前記他の言語の識別情報と、前記他の言語における訳語に対応するリンク情報を指し示すポインタと、前記一の言語の単語に関連する多義語に対応するリンク情報を指し示すポインタとを含む。
好ましくは、単語翻訳装置は、前記リンク情報が、親リンク情報と子リンク情報とを有し、前記親リンク情報は、前記一の単語の識別情報と、前記一の単語に関連する多義語に対応する子リンク情報を指し示すポインタとを含み、前記子リンク情報は、前記他の言語の識別情報と、対応する親リンク情報を指し示すポインタと、前記他の言語における訳語に対応する子リンク情報を指し示すポインタと、他の多義語に対応する子リンク情報を指し示すポインタとを含む。
好ましくは、単語翻訳装置は、前記単語が複数の品詞を有する場合、前記リンク情報は、前記品詞毎に設けられる。前記単語検索辞書データは、前記複数言語毎に、単語を検索するための単語検索構造と単語に関する情報を記憶した単語情報レコードとを有する。
好ましくは、単語情報レコードは、前記リンク情報を含む。単語検索構造は、例えば、単語トライ構造またはハッシュ関数構造を含む。
好ましくは、単語翻訳装置は、前記単語検索辞書データが、対応する言語の単語の第1文字のリスト情報と、前記単語のリスト情報とを有し、前記第1文字リスト情報は、前記第1文字の情報、前記第1文字から始まる単語数、前記第1文字から始まる単語のリスト情報における位置を指し示すポインタを含み、前記単語のリスト情報は、前記単語に対応するリンク情報を指し示すポインタを含む。
好ましくは、前記リンク情報は、前記単語検索辞書データに含まれる単語に関する情報を表す単語情報レコードと対応付けられる。
好ましくは、単語翻訳装置は、一の言語の単語を入力する入力手段と、前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合手段と、前記照合された一の言語の単語に対応するリンク情報に基づいて、他の言語に対応する単語検索辞書データから前記他の言語における訳語を抽出する抽出手段とを有する。これにより、単語の翻訳を高精度に行うことができる。好ましくは、前記抽出手段は、前記照合手段により照合された一の言語の単語情報レコードのリンク情報に基づいて他の言語の単語情報レコードを抽出する。また、前記抽出手段は、前記照合手段により照合された一の言語の単語情報レコードのリンク情報に基づいて他の言語の単語検索構造の訳語を抽出することができる。
本発明に係る複数言語間において単語の翻訳を行う単語翻訳方法は、第1の言語の単語を検索するための第1の単語検索構造を記憶し、第2の言語の単語を検索するための第2の単語検索構造を作成し記憶し、第1の単語検索構造に格納された単語についての訳語を識別するための第1の訳語情報を含む第1の単語情報レコードを記憶し、かつ第2の単語検索構造に格納された単語についての訳語を識別するための第2の訳語情報を含む第2の単語情報レコードを辞書に記憶するステップを備えたものである。
単語翻訳方法はさらに、単語を入力する入力ステップ、入力された単語を第1の単語検索構造に格納された単語と照合するステップ、照合された単語についての第1の単語情報レコードに基づき第2の単語検索構造に格納された訳語を抽出するステップ、抽出された訳語を出力するステップを含む。好ましくは、前記単語検索辞書データは、言語毎に単語検索構造と単語に関する情報を記憶した単語情報レコードを含み、前記単語情報レコードは前記リンク情報を含み、前記抽出するステップは、一の言語の単語情報レコードの前記リンク情報に基づいて他の言語の単語情報レコードを抽出する。
本発明に係る、複数言語間において単語の翻訳を行う単語翻訳方法は、前記言語毎に設けられる単語検索辞書データと、前記言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報と、を記憶手段に記憶させる記憶ステップを有する。
好ましくは、単語翻訳方法は、一の言語の単語を入力する入力ステップと、前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合ステップと、前記照合された一の言語の単語に対応するリンク情報に基づいて、他の言語に対応する単語検索辞書データから前記他の言語における訳語を抽出する抽出ステップとを有する。
さらに本発明に係る複数言語間において単語の翻訳を行う単語翻訳プログラムは、第1の言語の単語を検索するための第1の単語検索構造を記憶し、第2の言語の単語を検索するための第2の単語検索構造を作成し記憶し、第1の単語検索構造に格納された単語についての訳語を識別するための第1の訳語情報を含む第1の単語情報レコードを記憶し、かつ第2の単語検索構造に格納された単語についての訳語を識別するための第2の訳語情報を含む第2の単語情報レコードを辞書に記憶するステップを備えている。
本発明に係る、複数の言語間において単語の翻訳を行う単語翻訳プログラムは、前記言語毎に設けられる単語検索辞書データと、前記言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報とを記憶手段に記憶させる記憶ステップを備える。
好ましくは、単語翻訳プログラムは、一の言語の単語を入力する入力ステップと、前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合ステップと、前記照合された一の言語の単語に対応するリンク情報に基づいて、他の言語に対応する単語検索辞書データから前記他の言語における訳語を抽出する抽出ステップとを備える。
本発明によれば、言語毎に単語検索辞書データとリンク情報とが設けられることによって、言語間の双方向翻訳を情報漏れなく、高精度にかつ高速に行うことができる。さらに、本発明の単語翻訳装置は、2言語間のみならずマルチリンガルの単語翻訳にも適用することができる。
本発明の実施例に係る機械翻訳システムの構成を示す図である。 2言語相互間の単語翻訳装置の構成を示す図である。 本発明の実施例に係る単語直訳機械エンジンのハードウエア構成を示す図である。 本発明の実施例に係る単語検索トライ構造を示す図である。 トライ構造を説明する図である。 単語情報レコードの構造を示す図である。 単語フラグを説明する図である。 図8(a)は子供フラグを説明する図、図8(b)は言語IDを説明する図である。 単語情報レコードIDを説明する図である。 トライ構造の文字情報の構造を説明する図である。 ノードレコードIDの付与を説明する図である。 ノードレコードの配列を示す図である。 第1の単語情報レコードの格納方法を説明する図である。 第2の単語情報レコードの格納方法を説明する図である。 単語の翻訳動作を説明するフローである。 本発明の第2の実施例に係るNカ国言語間の単語翻訳装置の対訳辞書を説明する図である。 本発明の第3の実施例において用いられるNカ国言語単語対訳辞書の構造を示す図である。 Nカ国言語単語対訳辞書の第1の構成の概念図である。 Nカ国言語単語対訳辞書の第2の構成の概念図である。 ハッシュ関数ベースでの単語検索辞書の詳細な構成を示す図である。 配列構造ベースが採用される場合における単語情報レコードの構造を示す図である。 二重配列構造ベースが採用される場合における単語情報レコードの構造を示す図である。 二重配列構造ベースが採用される場合における多義語情報レコードの構造を示す図である。 配列構造ベースが採用される場合における、日本語と中国語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。 二重配列構造ベースが採用される場合における、日本語と中国語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。 配列構造ベースが採用される場合における、日本語と英語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。 二重配列構造ベースが採用される場合における、日本語と英語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。
以下、本発明の最良の実施形態について図面を参照して説明する。図1は、本発明の実施例に係る機械翻訳システムの全体構成を示す図である。機械翻訳システム1は、文書のすべての部分を正しく翻訳することはできない。翻訳できない部分に無理に翻訳すると、ユーザを混迷させ、原文の内容の把握に悪い影響を与えてしまう。そこで、翻訳結果において、正解または失敗の区別、あるいは信頼性の高低を与えるようにしている。また、翻訳システムに学習機能を設け、翻訳できない部分を自動的に回収し、正確な対訳を付与することで、翻訳の性能を向上させている。
機械翻訳システム1は、原言語テキスト文入力部10から入力された文単位の文を翻訳する翻訳メモリエンジン12、翻訳メモリエンジン12のデータベースにおいて照合できなかった部分、つまり正確に翻訳をできなかった部分を入力しこれの形態素解析を行う形態素解析部14と、形態素解析部14で解析された文または単語を入力しパターンベースで翻訳をするパターンベース翻訳エンジン16と、パターンベース翻訳エンジン16で翻訳できなかった部分をチャンクベース例文(単語の組合せまたは名詞句のようなフレーズ)で翻訳するチャンクベース翻訳エンジン18と、チャンクベース翻訳エンジン18で翻訳できなかった単語を入力し、解析ベースまたは単語ベースで翻訳する解析ベースまたは単語直訳翻訳エンジン20と、目的言語テキスト文を作成する目的言語テキスト作成部22とを有している。なお、チャンクベース翻訳エンジン18は、訳語引き出し関数を保持している。この訳語引き出し関数は、文に含まれる単語の列と、当該単語の列を翻訳した単語の列とを対応付けるものであり、解析ベースまたは単語直訳翻訳エンジン20は、訳語引き出し関数を文から切り出した単語の列に適用して、当該単語の列の翻訳結果を得る。
翻訳メモリエンジン12、パターンベース翻訳エンジン16、チャンクベース例文翻訳エンジン18により翻訳が成功した部分の翻訳データは、目的言語テキスト作成部22に入力される。目的言語テキスト作成部22は、これらの翻訳データに基づき目的言語のテキストを作成する。このとき、翻訳成功した部分については、正確に翻訳されたことがわかるような識別を与える。一方、解析ベースまたは単語直訳翻訳エンジン20によって翻訳された翻訳データは、目的言語テキスト文作成部22において、参考程度の翻訳として出力される。これにより、ユーザは、テキスト訳文において、どこが信頼できる翻訳結果であり、どこが信頼できない翻訳結果かを一見して把握することができる。一方、チャンクベース例文翻訳エンジン18で翻訳失敗した部分は、回収部24によって回収される。回収された翻訳失敗部分は、翻訳者によって正確な翻訳がなされ、その結果が、学習エンジン26に出力される。学習エンジン26は、正確な翻訳に基づき、対訳データを対訳辞書28へ書き込む。
図2は、本実施例の好ましい2言語相互間の単語翻訳装置の構成を示す図である。2言語相互間の単語翻訳機能は、単語直訳翻訳エンジン20に包含されている。単語翻訳装置において、原言語テキスト入力部10からテキスト分または単語が形態素解析部14に入力される。単語は、そこで属性(名詞や動詞など)を付与され、単語直訳翻訳エンジン20に入力される。単語直訳翻訳エンジン20は、入力された原言語の単語を対訳辞書を用いて目的言語の単語に翻訳し、その結果を目的言語テキスト作成部22へ出力する。単語直訳翻訳エンジン20の対訳辞書は、学習エンジン26により学習された対訳辞書28を用いることができる。
図3は、2言語相互間の単語翻訳装置のハードウエア構成を示す図である。単語翻訳装置は、入力装置30、表示装置32、主記憶装置34、外部記憶装置36、中央処理装置(CPU)38、これらを接続するバス40を含んでいる。入力装置30、キー操作により単語を入力するキーボード、原稿に記載された単語を光学的に読み取る光学式読取装置、あるいは、チャンクベース例文翻訳エンジンの出力のように他のハードウエアまたはソフトウエアの演算結果であってもよい。
表示装置32は、原言語の単語を翻訳した目的言語の単語を出力するディスプレイ等を含む。主記憶装置34は、ROMまたはRAMを含み、単語の翻訳を制御するためのプログラムや演算結果等のデータを記憶する。外部記憶装置36は、例えばハードディスク等の大容量記憶装置を含み、ここには、単語の翻訳に必要な対訳辞書が記憶されている。CPU(Central Processing Unit)38は、主記憶装置34に記憶されたプログラムに従い各部を制御する。
次に、本実施例に係る単語直訳翻訳エンジンの詳細について説明する。図4は、単語直訳翻訳エンジン20に含まれる対訳辞書の単語検索トライ構造および単語情報レコード構造の概念を説明する図である。対訳辞書には、第1言語の単語検索トライ構造100およびこれに対応する第1言語の単語情報レコード110と、第2言語の単語検索トライ構造200およびこれに対応する第2言語の単語情報レコード210とを有している。
トライ構造(TRIE structure)とは、言語情報処理分野において、検索キー集合の共通部分の文字列を併合して得られる木構造のことである。例えば、「あい」、「あいさい」、「あいさつ」、「あいのこ」、「あいのり」の5つの検索キーから生成したトライ構造は図5に示すようになる。図中の$は、単語の末尾を表わす特殊文字として用いてもよい。トライ構造を用いて検索するには、検索文字列を左から順に走査しながら、木の根(ノードN1)から各ノードN2〜N13に付与された文字を手がかりに木をたどり、検索文字列に照合する単語を抽出する。トライ構造を用いると、検索キーの数によらず検索文字列に比例した時間で検索ができる。
再び図4に戻って説明する。2言語相互間での翻訳を行うため、本実施例に係る対訳辞書は、第1言語の単語検索トライ構造(以下、第1のトライ構造という)100と、第1のトライ構造100に含まれる各単語の訳語情報を記憶する第1の言語の単語情報レコード110と、第2言語の単語検索トライ(以下、第2のトライ構造という)200と、第2のトライ構造200に含まれる各単語の訳語情報を記憶する第2言語の単語情報レコード210を格納している。
例えば、第1言語が日本語であり、第2言語が中国語であるとき、第1のトライ構造100に「アメリカ」という単語が格納されていると、第2のトライ構造200には、その訳語である「美国」が格納されている。「アメリカ」と「美国」との関係は、第1、第2の単語情報レコード110、210に含まれる訳語情報にいって相互にリンク付けされる。
例えば、「アメリカ」の検索文字列が入力されると、CPU38は、検索文字列「アメリカ」を左から順に(「ア」から順に)走査しながら、第1のトライ構造のルートから各ノードをたどり、「アメリカ」に一致する単語またはパスが存在するか否かを判別する。一致するパスが存在しているとき、すなわち単語が存在しているとき、「アメリカ」に対応する単語情報レコード110を参照することで、第2のトライ構造200における訳語である「美国」であるパスを識別し、訳語「美国」を得る。一方、「美国」の検索文字列が入力されると、上記とは反対に、「美国」に対応する単語情報レコード210を参照することで、第1のトライ構造100における訳語である「アメリカ」のパスを識別し、訳語「アメリカ」を得る。このように、第1、第2の単語情報レコード110、210を双方向にリンク付けすることで、相互方向の対訳情報漏れを防止している。
また、第1のトライ構造100に格納される「アメリカ」と同義語である「米国」(ここでは漢字で示すが、ひらがなでも良い)が格納されているとき、「美国」の単語情報レコード210の訳語情報には、多義語を識別するリンク付けが成されているため、「美国」の訳語から、「アメリカ」および「米国」を得ることができる。
上記したように、第1のトライ構造100に記憶された単語から第2のトライ構造の単語を識別するために、第1言語の単語情報レコード110が生成され、第2のトライ構造200に記憶された単語から第1のトライ構造の単語を識別するために、第2言語の単語情報レコード210が生成される。図6は、単語情報レコードの構造を示す図である。単語情報レコードは、文字情報300、単語フラグ+子供フラグ+言語ID302、単語k情報レコードのID304、親ノードID306、右兄弟ノードID308を有する。
文字情報300は、ノードに含まれる文字が漢字、ひらがな、カタカナ、アルファベットかを示すものである。単語フラグ+子供フラグ+訳語言語ID302は、1バイトから構成され、そのうち単語フラグは2ビットから構成される。単語フラグは、図7に示すように、単語フラグが「0」のとき、中間ノードを意味し、単語フラグが「1」のとき、単語ノードを意味し(根から該ノードまでのパス上の情報が単語を表す)、単語フラグが「2」のとき、発音ノードを意味し(根から該ノードまでのパス上の情報が発音を表す)、単語フラグが「3」のとき、単語発音ノードを意味する(根から該ノードまでのパス上の情報が単語と発音を表す)。
子供フラグは1ビットから構成され、図8(a)に示すように、子供フラグが「0」のとき、当該ノードよりも下の階層にノードを含まないことを意味し、子供フラグ「1」のとき、当該ノードよりも下の階層にノードを含んでいることを意味する。
訳語言語IDは、訳語の言語表記を示す識別であり、例えば、図8(b)に示すように、言語IDが「1」のとき、日本語を示し、言語IDが「2」のとき中国語を示し、言語IDが「3」のとき英語を示す。
単語情報レコードID304は、図9に示すように、単語ID、発音ID、品詞ID、優先順位、多義性情報(語数)、概念ID、左連結情報ID、右連結情報ID、訳語言語ID、訳語ID、次の多義語情報レコードID、および説明を含んでいる。単語IDは、トライ構造に格納された単語を識別するためのノードIDである。例えば、図4に示す第1のトライ構造の「アメリカ」の場合、単語IDは、単語の末端「カ」を格納するノードIDである。発音IDは、単語の発音を表すもので、例えば、漢字やひらがなによって発音が異なるためである。品詞IDは、単語の品詞、例えば、名詞、動詞、形容詞等を識別するIDである。
多義性情報は、単語が多義語であるとき、多義語の数を示す。例えば、図4の第1のトライ構造の「アメリカ」であれば、多義語の数は1(「米国」)となる。概念ID、左連結情報ID、右連結情報IDは、必須のものではないが、解析ベースの翻訳を行うときに有用なIDである。
訳語言語IDは、訳語の言語表記を識別するIDであり、「アメリカ」から「美国」への翻訳であれば、中国語を識別するIDとなる。訳語IDは、当該単語の訳語を識別するIDである。すなわち、「アメリカ」の訳語が「美国」であれば、訳語IDは、「美国」の末端「国」を格納するノードIDである。多義語情報レコードは、当該単語の訳語と多義語である次のレコードを識別するIDである。例えば「美国」の単語レコードにおいて、訳語が「アメリカ」であり、その多義語が「米国」であれば、多義語レコードIDは、「米国」を識別するIDとなる。説明は、注釈等を含むものであって、必ずしも必須ではない。
親ノードID306は、当該単語を識別するノードより階層の上のノードを識別するIDであり、右兄弟ノードID308は、当該ノードと共通の親ノードを有する左右のノードIDである。これらのノードIDは、トライ構造に必要な情報であって、単語の翻訳に直接関係するものではない。なお、同音の単語が複数存在する場合には、その単語の数を単語情報レコードに含ませるようにしてもよい。この場合には、単語情報レコードに対応するトライ構造には、複数の単語が対応することになる。
図4に示すように、例えば、第1のトライ構造100に格納された「アメリカ」の単語情報レコードをkとすると、単語情報レコードkは、「アメリカ」のルートからのパスを示す情報と、これの訳語情報(訳語言語ID、訳語IDおよび多義語情報レコードID)を含んでいる。一方、第2のトライ構造200に格納された「美国」の単語情報レコードをhとすると、単語情報レコードhは、「美国」のルートからのパスを示す情報と、これの訳語情報を含んでいる。また、単語情報レコードhは、「米国」の単語情報レコードk+1を、多義語情報レコードIDとして含んでいる。こうして、第1言語および第2言語の双方の訳語が第1、第2の単語情報レコードを介して双方向にリンク付けされ、双方向からの翻訳時に訳語を漏れなく高速に検索することができる。
次に、トライ構造の文字情報の構造を図10を参照して説明する。図10(a)に示す方法は、トライ構造の各ノードを、2バイトにより1文字を表している。図10(b)に示す方法は、すべての言語をユニコード(Unicode)に変換し、各ノードに高バイト(上位8ビット)と低バイト(下位8ビット)を格納し、高バイトおよび低バイトにより1文字を表している。図10(b)の方法は、図10(a)の方法に比べて、トライ構造の水平方向のノードが減るため(256通り)、検索速度は速くなるが、ノードが深さ方向に深くなるため、情報量は増加する。図10(c)に示す方法は、図10(a)の方法と図10(b)の方法をミックスしたものである。
次にノードIDの付与方法について説明する。図11は、ノードIDの付与方法を示す図である。トライ構造では、深さ優先探索し、探索の順番によって番号を1あるいは0から順に増加させ、ノードIDを付与する。ノードIDを付与したならば、図12に示すように、ノードIDに対応するレコードをノードIDの順番に従い配列し、格納する。ノードIDの順番でレコードを配列させることで、ノードIDが指すノード情報に瞬時にアクセスすることができる。なお、本実施例では訳語だけが得られ、図9に示すような単語の情報(訳語の情報)、即ち、単語の発音、品詞(属性)などは正確に得られない。図9に示すような訳語の正確な情報が必要な場合は、後述する第2及び第3の実施例のような単語検索構造及び単語情報レコード構造を用いれば良い。
次に、単語レコードの格納方法について説明する。第1の言語の単語と第2の言語の単語が1対1に対応しているときは、それぞれの単語情報レコードは単一でよいが、一般には、単語には複数の品詞(複数の意味)を持つものも多く、対訳は、複数対複数の関係になることが多い。
単語kの品詞が複数であり、ある品詞の訳語が複数の場合には、単語kの情報レコードを複数用意し、各レコードの間を直列の指針(ポインタ)で連結し、それぞれのレコードに対応している訳語情報を記憶するようにする。図13に示すように、第1の言語の単語kのレコードには、品詞1とその対訳語1の情報が記憶され、さらにポインタによって関連付けされたレコードには、品詞1とその対訳語2が記憶される。ポインタは、図6に示した次の多義語情報レコードIDを用いることができる。次に、単語の選択ルールについて説明する。好ましくは、名詞、代名詞、形容詞、副詞、動詞、専門用語だけ翻訳する。対訳の関係が1対1の場合は、一義的に対応する訳語を選択する。一方、1対nの場合(n>1)は、n個の訳語の品詞属性を比較して、原言語の単語の品詞が同じ品詞のものから選択する.そのとき,同じ品詞の訳語が一つの場合は,その訳語を選択する.複数の場合は、優先順位で候補を選択したり、あるいは任意の1個の候補を選択する。
例えば、中国語の「美国」から、日本語の「米国」、「アメリカ」への翻訳を例にすると、中国対訳辞書には、「美国」についての2つのレコード320、322が生成され、それらがポインタにて関連付けされている。日本語対訳辞書には、「米国」についてのレコード330と「アメリカ」についてのレコード332が生成されている。[美国]のレコード320は、「アメリカ」の訳語情報を含み、「美国」のレコード322は、「米国」の訳語情報を含む。
日本語の「アメリカ」、「米国」のレコード330、332は、破線で示すように、「美国」の訳語情報、すなわち「美国」を参照するように関連付けされている。
次に、他の単語情報レコードの格納方法について説明する。上記した図13に示す例では、同一のレコードを複数用いるため、メモリ容量が大きくなる。そこで、メモリ空間を節約するために、他の格納方法は、単語kの情報レコードを一用い、その単語kの情報レコードから、多義語情報配列内の複数の訳語情報をそれぞれ含む複数のレコードを識別するようにし、多義語情報配列に最小限の訳語情報を記録する。図14に示すように、第1言語の単語kの情報レコードと多義語情報配列とを用意する。多義語情報配列のレコードは、例えば、品詞1の訳語2、品詞1の訳語3、品詞2の訳語1等の情報を含んでいる。多義語情報配列のレコードは、最小限の訳語情報として、優先順位、概念ID、言語ID、訳語ID、および次の多義語情報レコード指針を含んでいる。
例えば図14に示すように、中国語の「美国」から日本語の訳語を検索する場合、「美国」の単語情報レコード320が作成され、さらに多義語情報配列に含まれるレコード324が作成される。レコード320によって、「米国」が参照され、多義語情報配列のレコード324によって「アメリカ」が参照される。
次に、単語の選択ルールについて説明する。好ましくは、名詞、代名詞、形容詞、副詞、動詞、専門用語だけ翻訳する。対訳の関係が、1対1の場合は、一義的に対応する訳語を選択する。一方、1対nの場合(n>1)は、n個の訳語の品詞属性を比較して、原言語の単語の品詞が同じ品詞のものから順に候補を選択したり、あるいは任意の1個の候補を選択する。
図15は、単語翻訳装置の動作を説明するフローチャートである。まず、原言語のテキスト文を解析した単語またはユーザにより特定された単語が入力されると(ステップS101)、CPU38は、原言語の種類を特定する(ステップS102)。次に、CPU38は、特定された言語種に該当する訳語辞書のトライ構造を選択し(ステップS103)、そのトライ構造に格納された単語と入力された単語との照合を行う(ステップS104)。CPU38は、トライ構造内に単語が存在するとき(ステップS105)、当該単語についての単語情報レコードを参照し(ステップS106)、単語情報レコードで参照される目的言語のトライ構造から訳語を抽出する(ステップS107)。抽出された訳語は、目的言語テキスト文作成部22によってディスプレイ上に表示される(ステップS108)。
一方、入力された単語が存在しないとき(ステップS105)、翻訳失敗の表示が出力される。この場合、翻訳者によって、入力された単語に適切な訳語が付与され、これが訳語辞書に登録され、学習機能が与えられる(ステップS108)。
次に本発明の第2の実施例について説明する。第2の実施例は、マルチリンガル、すなわちNカ国言語間の単語翻訳を可能にするもので、その対訳辞書の構成を図16に示す。同図に示すように、第1言語のトライ構造400、第2言語のトライ構造500、および第N言語のトライ構造600を作成し、各言語の単語検索トライを記憶する。同時に、各トライ構造と対となるべく、第1言語の単語情報レコード410、第2言語の単語情報レコード510、および第N言語の単語情報レコード610を作成する。
単語情報レコードには、複数の言語への対訳情報が混在されている。例えば、日本語の単語情報レコードには、英語の訳語情報を記録するレコードと、中国語の訳語情報を記録するレコードが含まれている。これにより、日本語の単語から、英語または中国語の訳語を検索することができる。英語または中国語のいずれかを検索するかは、ユーザの指示に応じて行うことができる。また、英語から日本語および中国語から日本語への単語翻訳も可能である。単語情報レコードの格納方法は、上記した図13に示す方法または図14に示す方法のいずれを用いることも可能である。
このように各言語毎に単語検索トライと単語情報レコードを作成することで、複数言語間において単語翻訳を双方向で行うことができ、より利便性を高めることができる。
次に、第3実施例について説明する。図17は、第3実施例において用いられるNカ国言語単語対訳辞書300の構造を示す図である。Nカ国言語単語対訳辞書300は、第1言語乃至第N言語のそれぞれに対応する第1言語単語検索辞書312−1乃至第N言語単語検索辞書312−N(以下、これら第1言語単語検索辞書312−1乃至第N言語単語検索辞書312−Nをまとめて、適宜「単語検索辞書312」と称する)と、第1言語乃至第N言語のそれぞれに対応する第1言語単語訳語リンク情報314−1乃至第N言語単語訳語リンク情報314−N(以下、これら第1言語単語訳語リンク情報314−1乃至第N言語単語訳語リンク情報314−Nをまとめて、適宜「単語訳語リンク情報314」と称する)とによって構成される。
単語検索辞書312は、トライ構造ベース又はハッシュ(Hash)関数ベースの構成となっている。一方、単語訳語リンク情報314は、対応する一の言語の単語と他の言語における訳語との関連付けを表すものであり、単語情報レコードによって構成される単語情報配列表のみを有する配列構造ベースの構成、又は、単語情報レコードによって構成される単語情報配列表と多義語情報レコードによって構成される多義語配列表とを有する二重配列構造ベースの構成となっている。
図18は、Nカ国言語単語対訳辞書300の第1の構成の概念図である。図18は、単語検索辞書がトライ構造ベースである場合を示す。2言語相互間での翻訳が行われる場合、第1言語の単語検索辞書は、第1言語の単語検索トライ構造(「第1のトライ構造)を有し、第1言語の単語訳語リンク情報は、第1のトライ構造に含まれる各単語の情報(単語情報レコード)により構成され、その単語情報レコードは第2言語における訳語との関連付けを表すポインタを含んでいる。同様に、第2言語の単語検索辞書は、第2言語の単語検索トライ構造(第2のトライ構造)を有し、第2言語の単語訳語リンク情報は、第2のトライ構造に含まれる各単語の情報(単語情報レコード)により構成され、その単語情報レコードには第1言語における訳語との関連付けを表すポインタを含んでいる。図18では、第1言語の単語kと第2言語の単語h+1とが単語と訳語の関係にあり、これらの関連付けがなされている。更には、ある単語の品詞が複数存在し、更にある品詞の訳語が複数存在する場合には、その単語に対応する単語情報レコードが品詞毎且つ訳語毎に複数用意され、これら複数の単語情報レコードの間は、単語情報レコードに含まれるポインタによって関連付けがなされる。
図19は、Nカ国言語単語対訳辞書300の第2の構成の概念図である。図6は、単語検索辞書がハッシュ関数ベースであり、単語訳語リンク情報が配列構造ベースである。
ハッシュ関数ベースでは、2言語相互間での翻訳が行われる場合、第1言語の単語検索辞書は、第1言語の単語とその単語に対応する単語訳語情報辞書の単語情報レコードへの指針(ポインタ)情報を含む単語リストを有する。同様に、第2言語の単語検索辞書は、第2言語の単語とその単語に対応する単語訳語情報辞書の単語情報レコードへの指針(ポインタ)情報を含む単語リストを有する。第1言語及び第2言語の単語訳語リンク情報は、図18と同様であるので、その説明は省略する。また、ハッシュ関数部320の詳細については後述する。
図20は、ハッシュ関数ベースでの単語検索辞書の詳細な構成を示す図である。ハッシュ関数部320は、対応する言語の全ての文字コードを連続する文字コードに変換するものである。第1文字表は、ハッシュ関数部320によって文字コードが変換された文字である単語の第1文字の情報、その第1文字から開始する単語の数、その第1文字から開始する単語に対応する単語リスト内のレコードへの指針(ポインタ)情報を含む。単語リストは、その単語の情報、単語発音情報、その単語に対応する単語訳語リンク情報内の単語情報のレコードIDを含む。
単語翻訳の際、単語直訳翻訳エンジン20は、入力した単語の第1文字に対応する第1文字表内のレコードを特定する。次に、単語直訳翻訳エンジン20は、特定したレコード内の単語の数と、単語リストへのポインタ情報とに基づいて、入力した単語の第1文字から開始する単語に対応する単語リスト内のレコードを特定する。更に、単語直訳翻訳エンジン20は、入力した単語とその特定した全てのレコード内の単語情報とを照合し、入力した単語を特定する。
次に、単語直訳翻訳エンジン20による単語翻訳の実施例について説明する。以下において、単語言語リンク情報に配列構造ベースが採用される場合における、単語情報レコードは、図21(a)に示す構造を有しており、単語情報レコードのIDによって一意に特定され、対応する単語の単語ID、発音ID、品詞ID、優先順位、多義性情報、単語/Chunk識別フラグ、領域分類ID、概念ID、左連結情報ID、右連結情報ID、訳語言語ID、訳語情報レコードID、次の多義語情報レコードID、および説明を含んでいる。なお、次の多義語に対応する単語情報レコードが存在しない場合には、次の多義語情報レコードIDは「0」となる。また、訳語言語IDは、図21(b)に示す言語IDと図21(c)に示す子供フラグを有する。これらは、上述した図8における言語ID及び子供フラグと同様である。
一方、単語言語リンク情報に二重配列構造ベースが採用される場合における、単語情報レコードは、図22に示す構造を有しており、単語情報レコードのIDによって一意に特定され、対応する単語の単語ID、発音ID、品詞ID、優先順位、多義性情報、単語/Chunk識別フラグ、領域分類ID、概念ID、左連結情報ID、右連結情報ID、多義語情報レコードID、および説明を含んでいる。また、単語言語リンク情報に二重配列構造ベースが採用される場合における、多義語情報レコードは、図23に示す構造を有しており、多義語情報レコードのIDによって一意に特定され、訳語の言語ID、親である単語情報レコードのID、訳語の多義語情報レコードのID、次の多義語の多義語情報レコードのIDを有する。なお、次の多義語に対応する多義語情報レコードが存在しない場合には、次の多義語の多義語情報レコードのIDは「0」となる。
図24は、単語訳語リンク情報に配列構造ベースが採用される場合における、日本語と中国語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。日本語の単語検索辞書内のトライ構造には、「アメリカ」とその同義語「米国」という単語が格納されている。一方、中国語の単語検索辞書内のトライ構造には、「アメリカ」の中国語訳である「美利▲加▼合▼衆▲国」とその同義語「米国」の中国語訳である「美国」という単語が格納されている。なお、「美利▲加▼合▼衆▲国」は、下記中国語を意味している。
外1
Figure 2006090732
この場合、日本語の単語訳語リンク情報には、単語「アメリカ」に対応する単語情報レコードID330の単語情報レコードと単語情報レコードID333の単語情報レコードとが含まれ、単語「米国」に対応する単語情報レコードID444の単語情報レコードと単語情報レコードID451の単語情報レコードとが含まれる。
一方、中国語の単語訳語リンク情報には、単語「美利▲加▼合▼衆▲国」に対応する単語情報レコードID100の単語情報レコードと単語情報レコードID101の単語情報レコードとが含まれ、単語「美国」に対応する単語情報レコードID400の単語情報レコードと単語情報レコードID541の単語情報レコードとが含まれる。なお、日本語の単語「アメリカ」の訳語である中国語の単語は「美利▲加▼合▼衆▲国」、日本語の単語「米国」の訳語である中国語の単語は「美国」であり、「アメリカ」と「米国」は同義語であり、「美利▲加▼合▼衆▲国」と「美国」は同義語である。
日本語の単語訳語リンク情報におけるID330の単語情報レコードは、対応する単語「アメリカ」の単語ID「5」、訳語である中国語の言語ID「2」、訳語である中国語の単語「美利▲加▼合▼衆▲国」に対応する単語情報レコードのID「100」、及び、次の多義語に対応する単語情報レコードのID「333」を有する。また、日本語の単語訳語リンク情報におけるID333の単語情報レコードは、対応する単語「アメリカ」の単語ID「5」、訳語である中国語の言語ID「2」、訳語である中国語の単語「美利▲加▼合▼衆▲国」の多義語「美国」、換言すれば、単語「アメリカ」の多義語「米国」の訳語である中国語の単語「美国」に対応する単語情報レコードのID「541」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。
また、日本語の単語訳語リンク情報におけるID444の単語情報レコードは、対応する単語「米国」の単語ID「7」、訳語である中国語の言語ID「2」、訳語である中国語の単語「美国」に対応する単語情報レコードのID「400」、及び、次の多義語に対応する単語情報レコードのID「451」を有する。また、日本語の単語訳語リンク情報におけるID451の単語情報レコードは、対応する単語「米国」の単語ID「7」、訳語である中国語の言語ID「2」、訳語である中国語の単語「美国」の多義語「美利▲加▼合▼衆▲国」、換言すれば、単語「米国」の多義語「アメリカ」の訳語である中国語の単語「美利▲加▼合▼衆▲国」に対応する単語情報レコードのID「101」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。
一方、中国語の単語訳語リンク情報におけるID100の単語情報レコードは、対応する単語「美利▲加▼合▼衆▲国」の単語ID「7」、訳語である日本語の言語ID「1」、訳語である日本語の単語「アメリカ」に対応する単語情報レコードのID「330」、及び、次の多義語に対応する単語情報レコードのID「101」を有する。また、中国語の単語訳語リンク情報におけるID101の単語情報レコードは、対応する単語「美利▲加▼合▼衆▲国」の単語ID「7」、訳語である日本語の言語ID「1」、訳語である日本語の単語「米国」の多義語「アメリカ」、換言すれば、単語「美利▲加▼合▼衆▲国」の多義語「美国」の訳語である日本語の単語「米国」に対応する単語情報レコードのID「451」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。
また、中国語の単語訳語リンク情報におけるID400の単語情報レコードは、対応する単語「美国」の単語ID「9」、訳語である日本語の言語ID「1」、訳語である日本語の単語「米国」に対応する単語情報レコードのID「444」、及び、次の多義語に対応する単語情報レコードのID「541」を有する。また、中国語の単語訳語リンク情報におけるID541の単語情報レコードは、対応する単語「美国」の単語ID「7」、訳語である日本語の言語ID「1」、訳語である日本語の単語「米国」の多義語「アメリカ」、換言すれば、単語「美国」の多義語「美利▲加▼合▼衆▲国」の訳語である日本語の単語「アメリカ」に対応する単語情報レコードのID「333」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。
このように、日本語及び中国語の単語訳語リンク情報によって、日本語の単語と中国語の単語との関連付けがなされる。単語直訳翻訳エンジン20は、中国語の単語「美利▲加▼合▼衆▲国」を日本語に翻訳する場合、中国語の単語訳語リンク情報における単語「美利▲加▼合▼衆▲国」の単語ID「7」と日本語の言語ID「1」を含むID100の単語情報レコードを特定する。次に、単語直訳翻訳エンジン20は、ID100の単語情報レコードに含まれる、次の多義語に対応する単語情報レコードのID「101」の単語情報レコードを特定する。更に、単語直訳翻訳エンジン20は、ID100の単語情報レコードに含まれる訳語である日本語の単語に対応する単語情報レコードのID「330」により日本語の単語訳語リンク情報におけるID330の単語情報レコードを特定するとともに、ID101の単語情報レコードに含まれる訳語である日本語の単語に対応する単語情報レコードのID「451」により日本語の単語訳語リンク情報におけるID451の単語情報レコードを特定する。そして、単語直訳翻訳エンジン20は、ID330の単語情報レコードに含まれる単語ID「5」によって日本語の単語検索辞書における単語「アメリカ」を抽出するとともに、ID451の単語情報レコードに含まれる単語ID「7」によって日本語の単語検索辞書における単語「米国」を抽出する。このような処理によって、中国語の単語「美利▲加▼合▼衆▲国」は日本語の単語「アメリカ」及び「米国」に翻訳される。
図25は、単語訳語リンク情報に二重配列構造ベースが採用される場合における、日本語と中国語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。日本語及び中国語の単語検索辞書内のトライ構造は、図23と同様であるので、その説明は省略する。
日本語の単語訳語リンク情報には、単語「アメリカ」に対応する単語情報レコードID330の単語情報レコードと、単語「米国」に対応する単語情報レコードID444の単語情報レコードが含まれる。更に、日本語の単語訳語リンク情報には、ID330の単語情報レコードを親とするID01及び02の多義語情報レコードと、ID333の単語情報レコードを親とするID14及び15の多義語情報レコードとが含まれる。
一方、中国語の単語訳語リンク情報には、単語「美利▲加▼合▼衆▲国」に対応する単語情報レコードID100の単語情報レコードと、単語「美国」に対応する単語情報レコードID211の単語情報レコードとが含まれる。更に、中国語の単語訳語リンク情報には、ID100の単語情報レコードを親とするID04及び05の多義語情報レコードと、ID211の単語情報レコードを親とするID214及び215の多義語情報レコードとが含まれる。
日本語の単語訳語リンク情報におけるID330の単語情報レコードは、対応する単語「アメリカ」の単語ID「5」、子である多義語情報レコードのID「01」を有する。ID01の多義語情報レコードは、訳語である中国語の言語ID「2」、親である単語情報レコードのID「330」、訳語である中国語の単語の多義語「美国」に対応する単語情報レコードの子である多義語情報レコードのID「214」、次の多義語に対応する多義語情報レコードのID「02」を有する。また、ID02の多義語情報レコードは、訳語である中国語の言語ID「2」、親である単語情報レコードのID「330」、訳語である中国語の単語「美利▲加▼合▼衆▲国」に対応する単語情報レコードの子である多義語情報レコードのID「05」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。
また、日本語の単語訳語リンク情報におけるID333の単語情報レコードは、対応する単語「米国」の単語ID「7」、子である多義語情報レコードのID「15」を有する。ID15の多義語情報レコードは、訳語である中国語の言語ID「2」、親である単語情報レコードのID「333」、訳語である中国語の単語の多義語「美利▲加▼合▼衆▲国」に対応する単語情報レコードの子である多義語情報レコードのID「04」、次の多義語に対応する多義語情報レコードのID「15」を有する。また、ID15の多義語情報レコードは、訳語である中国語の言語ID「2」、親である単語情報レコードのID「333」、訳語である中国語の単語「美国」に対応する単語情報レコードの子である多義語情報レコードのID「215」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。
一方、中国語の単語訳語リンク情報におけるID100の単語情報レコードは、対応する単語「美利▲加▼合▼衆▲国」の単語ID「7」、子である多義語情報レコードのID「04」を有する。ID04の多義語情報レコードは、訳語である日本語の言語ID「1」、親である単語情報レコードのID「100」、訳語である日本語の単語の多義語「米国」に対応する単語情報レコードの子である多義語情報レコードのID「14」、次の多義語に対応する多義語情報レコードのID「05」を有する。また、ID05の多義語情報レコードは、訳語である日本語の言語ID「1」、親である単語情報レコードのID「100」、訳語である日本語の単語「アメリカ」に対応する単語情報レコードの子である多義語情報レコードのID「02」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。
また、中国語の単語訳語リンク情報におけるID211の単語情報レコードは、対応する単語「美国」の単語ID「9」、子である多義語情報レコードのID「214」を有する。ID214の多義語情報レコードは、訳語である日本語の言語ID「1」、親である単語情報レコードのID「211」、訳語である日本語の単語の多義語「アメリカ」に対応する単語情報レコードの子である多義語情報レコードのID「01」、次の多義語に対応する多義語情報レコードのID「215」を有する。また、ID215の多義語情報レコードは、訳語である日本語の言語ID「1」、親である単語情報レコードのID「211」、訳語である日本語の単語「米国」に対応する単語情報レコードの子である多義語情報レコードのID「15」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。
このように、日本語及び中国語の単語訳語リンク情報によって、日本語の単語と中国語の単語との関連付けがなされる。単語直訳翻訳エンジン20は、中国語の単語「美利▲加▼合▼衆▲国」を日本語に翻訳する場合、中国語の単語訳語リンク情報における単語「美利▲加▼合▼衆▲国」の単語ID「7」を含むID100の単語情報レコードを特定する。次に、単語直訳翻訳エンジン20は、ID100の単語情報レコードに含まれる、多義語情報レコードのID「04」によりID04の多義語情報レコードを特定する。更に、単語直訳翻訳エンジン20は、ID04の多義語情報レコードに含まれる、次の多義語に対応する多義語情報レコードのID「05」によりID05の多義語情報レコードを特定する。そして、単語直訳翻訳エンジン20は、特定したID04及びID05の多義語情報レコードに含まれる、訳語である日本語の単語に対応する単語情報レコードの子である多義語情報レコードのID「02」及び「14」により、日本語の単語に対応する単語情報レコードの子であるID02及びID04の多義語情報レコードを特定する。次に、単語直訳翻訳エンジン20は、特定したID02及びID04の多義語情報レコードに含まれる、親である単語情報レコードのID「330」及びID「333」によりID330及びID333の単語情報レコードを特定する。そして、単語直訳翻訳エンジン20は、ID330の単語情報レコードに含まれる単語ID「5」によって日本語の単語検索辞書における単語「アメリカ」を抽出するとともに、ID451の単語情報レコードに含まれる単語ID「7」によって日本語の単語検索辞書における単語「米国」を抽出する。このような処理によって、中国語の単語「美利▲加▼合▼衆▲国」は日本語の単語「アメリカ」及び「米国」に翻訳される。
図26は、単語訳語リンク情報に配列構造ベースが採用される場合における、単語直訳翻訳エンジン20による日本語と英語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。日本語の単語検索辞書内のトライ構造には、「アメリカ」とその同義語「米国」という単語が格納されている。一方、英語の単語検索辞書内のトライ構造には、「アメリカ」の英語訳である「America」とその同義語「米国」の英語訳である「USA」という単語が格納されている。
この場合、日本語の単語訳語リンク情報には、単語「アメリカ」に対応する単語情報レコードID340の単語情報レコードと単語情報レコードID343の単語情報レコードとが含まれ、単語「米国」に対応する単語情報レコードID464の単語情報レコードと単語情報レコードID471の単語情報レコードとが含まれる。
一方、英語の単語訳語リンク情報には、単語「America」に対応する単語情報レコードID200の単語情報レコードと単語情報レコードID201の単語情報レコードとが含まれ、単語「USA」に対応する単語情報レコードID500の単語情報レコードと単語情報レコードID641の単語情報レコードとが含まれる。なお、日本語の単語「アメリカ」の訳語である英語の単語は「America」、日本語の単語「米国」の訳語である英語の単語は「USA」であり、「アメリカ」と「米国」は同義語であり、「America」と「USA」は同義語である。
日本語の単語訳語リンク情報におけるID330の単語情報レコードは、対応する単語「アメリカ」の単語ID「5」、訳語である英語の言語ID「3」、訳語である英語の単語「America」に対応する単語情報レコードのID「200」、及び、次の多義語に対応する単語情報レコードのID「343」を有する。また、日本語の単語訳語リンク情報におけるID343の単語情報レコードは、対応する単語「アメリカ」の単語ID「5」、訳語である英語の言語ID「3」、訳語である英語の単語「America」の多義語「USA」、換言すれば、単語「アメリカ」の多義語「米国」の訳語である英語の単語「USA」に対応する単語情報レコードのID「641」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。
また、日本語の単語訳語リンク情報におけるID464の単語情報レコードは、対応する単語「米国」の単語ID「7」、訳語である英語の言語ID「3」、訳語である英語の単語「USA」に対応する単語情報レコードのID「500」、及び、次の多義語に対応する単語情報レコードのID「471」を有する。また、日本語の単語訳語リンク情報におけるID471の単語情報レコードは、対応する単語「米国」の単語ID「7」、訳語である英語の言語ID「3」、訳語である英語の単語「USA」の多義語「America」、換言すれば、単語「米国」の多義語「アメリカ」の訳語である英語の単語「America」に対応する単語情報レコードのID「201」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。
一方、英語の単語訳語リンク情報におけるID200の単語情報レコードは、対応する単語「America」の単語ID「8」、訳語である日本語の言語ID「1」、訳語である日本語の単語「アメリカ」に対応する単語情報レコードのID「340」、及び、次の多義語に対応する単語情報レコードのID「201」を有する。また、英語の単語訳語リンク情報におけるID201の単語情報レコードは、対応する単語「America」の単語ID「8」、訳語である日本語の言語ID「1」、訳語である日本語の単語「米国」の多義語「アメリカ」、換言すれば、単語「America」の多義語「USA」の訳語である日本語の単語「米国」に対応する単語情報レコードのID「471」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。
また、英語の単語訳語リンク情報におけるID500の単語情報レコードは、対応する単語「USA」の単語ID「11」、訳語である日本語の言語ID「1」、訳語である日本語の単語「米国」に対応する単語情報レコードのID「464」、及び、次の多義語に対応する単語情報レコードのID「641」を有する。また、英語の単語訳語リンク情報におけるID641の単語情報レコードは、対応する単語「USA」の単語ID「11」、訳語である日本語の言語ID「1」、訳語である日本語の単語「米国」の多義語「アメリカ」、換言すれば、単語「USA」の多義語「America」の訳語である日本語の単語「アメリカ」に対応する単語情報レコードのID「343」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。
このように、日本語及び英語の単語訳語リンク情報によって、日本語の単語と英語の単語との関連付けがなされる。単語直訳翻訳エンジン20は、英語の単語「America」を日本語に翻訳する場合、英語の単語訳語リンク情報における単語「America」の単語ID「8」と日本語の言語ID「1」を含むID200の単語情報レコードを特定する。次に、単語直訳翻訳エンジン20は、ID200の単語情報レコードに含まれる、次の多義語に対応する単語情報レコードのID「201」の単語情報レコードを特定する。更に、単語直訳翻訳エンジン20は、ID200の単語情報レコードに含まれる訳語である日本語の単語に対応する単語情報レコードのID「340」により日本語の単語訳語リンク情報におけるID340の単語情報レコードを特定するとともに、ID201の単語情報レコードに含まれる訳語である日本語の単語に対応する単語情報レコードのID「471」により日本語の単語訳語リンク情報におけるID471の単語情報レコードを特定する。そして、単語直訳翻訳エンジン20は、ID340の単語情報レコードに含まれる単語ID「5」によって日本語の単語検索辞書における単語「アメリカ」を抽出するとともに、ID471の単語情報レコードに含まれる単語ID「7」によって日本語の単語検索辞書における単語「米国」を抽出する。このような処理によって、英語の単語「America」は日本語の単語「アメリカ」及び「米国」に翻訳される。
図27は、単語訳語リンク情報に二重配列構造ベースが採用される場合における、単語直訳翻訳エンジン20による日本語と英語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。日本語及び英語の単語検索辞書内のトライ構造は、図23と同様であるので、その説明は省略する。
日本語の単語訳語リンク情報には、単語「アメリカ」に対応する単語情報レコードID331の単語情報レコードと、単語「米国」に対応する単語情報レコードID334の単語情報レコードが含まれる。更に、日本語の単語訳語リンク情報には、ID331の単語情報レコードを親とするID03及び04の多義語情報レコードと、ID334の単語情報レコードを親とするID16及び17の多義語情報レコードとが含まれる。
一方、英語の単語訳語リンク情報には、単語「America」に対応する単語情報レコードID101の単語情報レコードと、単語「USA」に対応する単語情報レコードID212の単語情報レコードとが含まれる。更に、英語の単語訳語リンク情報には、ID101の単語情報レコードを親とするID06及び07の多義語情報レコードと、ID212の単語情報レコードを親とするID216及び217の多義語情報レコードとが含まれる。
日本語の単語訳語リンク情報におけるID331の単語情報レコードは、対応する単語「アメリカ」の単語ID「5」、子である多義語情報レコードのID「03」を有する。ID03の多義語情報レコードは、訳語である英語の言語ID「3」、親である単語情報レコードのID「331」、訳語である英語の単語の多義語「USA」に対応する単語情報レコードの子である多義語情報レコードのID「216」、次の多義語に対応する多義語情報レコードのID「04」を有する。また、ID04の多義語情報レコードは、訳語である英語の言語ID「3」、親である単語情報レコードのID「331」、訳語である英語の単語「America」に対応する単語情報レコードの子である多義語情報レコードのID「07」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。
また、日本語の単語訳語リンク情報におけるID334の単語情報レコードは、対応する単語「米国」の単語ID「7」、子である多義語情報レコードのID「16」を有する。ID16の多義語情報レコードは、訳語である英語の言語ID「3」、親である単語情報レコードのID「334」、訳語である英語の単語の多義語「America」に対応する単語情報レコードの子である多義語情報レコードのID「06」、次の多義語に対応する多義語情報レコードのID「17」を有する。また、ID17の多義語情報レコードは、訳語である英語の言語ID「3」、親である単語情報レコードのID「334」、訳語である英語の単語「USA」に対応する単語情報レコードの子である多義語情報レコードのID「217」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。
一方、英語の単語訳語リンク情報におけるID101の単語情報レコードは、対応する単語「America」の単語ID「8」、子である多義語情報レコードのID「06」を有する。ID06の多義語情報レコードは、訳語である日本語の言語ID「1」、親である単語情報レコードのID「101」、訳語である日本語の単語の多義語「米国」に対応する単語情報レコードの子である多義語情報レコードのID「16」、次の多義語に対応する多義語情報レコードのID「07」を有する。また、ID07の多義語情報レコードは、訳語である日本語の言語ID「1」、親である単語情報レコードのID「101」、訳語である日本語の単語「アメリカ」に対応する単語情報レコードの子である多義語情報レコードのID「04」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。
また、英語の単語訳語リンク情報におけるID212の単語情報レコードは、対応する単語「USA」の単語ID「11」、子である多義語情報レコードのID「216」を有する。ID216の多義語情報レコードは、訳語である日本語の言語ID「1」、親である単語情報レコードのID「212」、訳語である日本語の単語の多義語「アメリカ」に対応する単語情報レコードの子である多義語情報レコードのID「03」、次の多義語に対応する多義語情報レコードのID「217」を有する。また、ID217の多義語情報レコードは、訳語である日本語の言語ID「1」、親である単語情報レコードのID「212」、訳語である日本語の単語「米国」に対応する単語情報レコードの子である多義語情報レコードのID「17」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。
このように、日本語及び英語の単語訳語リンク情報によって、日本語の単語と英語の単語との関連付けがなされる。単語直訳翻訳エンジン20は、英語の単語「America」を日本語に翻訳する場合、英語の単語訳語リンク情報における単語「America」の単語ID「7」を含むID101の単語情報レコードを特定する。次に、単語直訳翻訳エンジン20は、ID101の単語情報レコードに含まれる、多義語情報レコードのID「06」によりID06の多義語情報レコードを特定する。更に、単語直訳翻訳エンジン20は、ID06の多義語情報レコードに含まれる、次の多義語に対応する多義語情報レコードのID「07」によりID07の多義語情報レコードを特定する。そして、単語直訳翻訳エンジン20は、特定したID06及びID07の多義語情報レコードに含まれる、訳語である日本語の単語に対応する単語情報レコードの子である多義語情報レコードのID「04」及び「16」により、日本語の単語に対応する単語情報レコードの子であるID04及びID16の多義語情報レコードを特定する。次に、単語直訳翻訳エンジン20は、特定したID04及びID06の多義語情報レコードに含まれる、親である単語情報レコードのID「331」及びID「334」によりID331及びID334の単語情報レコードを特定する。そして、単語直訳翻訳エンジン20は、ID331の単語情報レコードに含まれる単語ID「5」によって日本語の単語検索辞書における単語「アメリカ」を抽出するとともに、ID334の単語情報レコードに含まれる単語ID「7」によって日本語の単語検索辞書における単語「米国」を抽出する。このような処理によって、英語の単語「America」は日本語の単語「アメリカ」及び「米国」に翻訳される。
単語直訳翻訳エンジン20は、上述した翻訳により得られた訳語を目的言語テキスト文作成部22へ出力する。なお、訳語が複数存在する場合には、単語直訳翻訳エンジン20は、翻訳対象の単語の品詞属性と訳語の品詞属性とを比較して、訳語のうち、翻訳対象の単語と品詞属性が同一のもののみを選択して出力するようにしてもよい。更に、翻訳対象の単語と品詞属性が同一の訳語が複数存在する場合には、単語直訳翻訳エンジン20は、任意の1つを選択して出力するようにしてもよい。また、翻訳結果の単語が存在しない場合には、単語直訳翻訳エンジン20は、翻訳対象の単語をそのまま目的言語テキスト文作成部22へ出力する。また、単語直訳翻訳エンジン20は、入力した単語と訳語に基づいて、外部の知識データベース(図示せず)から統計情報、文法上放蕩の各種情報を取得することが可能である。
このように、単語訳語リンク情報によって一の言語の単語と他の言語における訳語との関連付けがなされるため、2言語間又は複数言語間において双方向の翻訳が可能となる。
以上、本発明の好ましい実施の形態について詳述したが、本発明に係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
本発明に係る単語翻訳装置は、翻訳メモリエンジン、パターンベース翻訳エンジン、チャンクベース翻訳エンジン、解析ベース翻訳エンジンを補完するように用いたり(図1を参照)、あるいは、翻訳エンジン、パターンベース翻訳エンジン、チャンクベース翻訳エンジンのいずれかと組み合わせて用いたり、または単体として構成してもよい。さらに、単語翻訳装置は、その機能を実行するソフトウエアをコンピュータに搭載させたり、あるいは携帯用もしくはポータブル用の電子辞書として利用することもできる。

Claims (37)

  1. 複数言語間において単語の翻訳を行う単語翻訳装置であって、
    少なくとも、第1の言語の単語を検索するための第1の単語検索構造、第2の言語の単語を検索するための第2の単語検索構造、第1の単語検索構造に格納された単語についての単語関連情報と訳語情報を含む第1の単語・訳語情報レコード、および第2の単語検索構造に格納された単語についての単語関連情報と訳語情報を含む第2の単語情報レコードを辞書に記憶する記憶手段を備えた、単語翻訳装置。
  2. 第1、第2の単語検索構造は、単語・訳語情報レコードを識別するための単語・訳語情報レコード識別情報を含む、請求項1に記載の単語翻訳装置。
  3. 第1、第2の単語・訳語情報レコードは、それぞれ第1、第2の単語検索構造に含まれる単語を識別する単語識別情報を含む、請求項1に記載の単語翻訳装置。
  4. 第1、第2の単語・訳語情報レコードは、それぞれ第1、第2の単語検索構造に含まれる単語の関連情報を含む、請求項1に記載の単語翻訳装置。
  5. 第1の単語・訳語情報レコードは、第2の単語・訳語情報レコードに含まれる訳語情報を識別するための訳語識別情報を含み、第2の単語・訳語情報レコードは、第1の単語・訳語情報レコードに含まれる訳語情報を識別するための訳語識別情報を含む、請求項1に記載の単語翻訳装置。
  6. 第1、第2の単語・訳語情報レコードは、訳語に関連する多義語を識別するための識別情報を含む、請求項1ないし4いずれか1つに記載の単語翻訳装置。
  7. 第1、第2の単語・訳語情報レコードは、訳語の言語種を識別するための識別情報を含む、請求項1ないし5いずれか1つに記載の単語翻訳装置。
  8. 第1、第2の単語・訳語情報レコードは、1つの単語が複数の品詞を有する場合に、各品詞毎に,単語関連情報と訳語情報を記憶するレコードを有する、請求項1ないし3いずれか1つに記載の単語翻訳装置。
  9. 各品詞毎のレコードは、当該1つの単語関連情報とポインタによって関連付けされている、請求項8に記載の単語翻訳装置。
  10. 単語翻訳装置はさらに、単語を入力する入力手段と、入力された単語を第1の単語検索構造に格納された単語と照合する照合手段と、照合された単語についての第1の単語情報レコードに基づき第2の単語検索構造に格納された訳語を抽出する抽出手段と、抽出された訳語を出力する出力手段と、を有する請求項1ないし9いずれか1つに記載の単語翻訳装置。
  11. 前記抽出手段は、前記照合手段により照合された単語についての第1の単語情報レコードに基づき第2の単語情報レコードを抽出する、請求項10に記載の単語翻訳装置。
  12. 第1の単語情報レコードの訳語情報は、第2の単語検索構造に格納された訳語または第2の単語情報レコードを識別するためのリンク情報を含み、前記抽出手段は、前記リンク情報に基づき前記訳語または第2の単語情報レコードを抽出する、請求項10または11に記載の単語翻訳装置。
  13. 複数言語間において単語の翻訳を行う単語翻訳装置であって、
    Nカ国言語(Nは、2以上の整数)についての単語検索構造と、Nカ国言語の単語検索構造に対応するNカ国言語の単語情報レコードとを辞書に記憶する記憶手段を含み、
    Nカ国言語の単語情報レコードのうち所定言語の単語情報レコードは、所定単語についての訳語を識別する訳語情報を複数言語について記憶する、単語翻訳装置。
  14. 複数言語間において単語の翻訳を行う単語翻訳装置であって、
    前記複数言語毎に設けられる単語検索辞書データと、
    前記複数言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報と、を記憶する記憶手段を備えた、単語翻訳装置。
  15. 前記リンク情報は、
    前記一の言語の単語の識別情報と、前記他の言語の識別情報と、前記他の言語における訳語に対応するリンク情報を指し示すポインタと、前記一の言語の単語に関連する多義語に対応するリンク情報を指し示すポインタとを含む、請求項14に記載の単語翻訳装置。
  16. 前記リンク情報は、親リンク情報と子リンク情報とを有し、
    前記親リンク情報は、前記一の単語の識別情報と、前記一の単語に関連する多義語に対応する子リンク情報を指し示すポインタとを含み、
    前記子リンク情報は、前記他の言語の識別情報と、対応する親リンク情報を指し示すポインタと、前記他の言語における訳語に対応する子リンク情報を指し示すポインタと、他の多義語に対応する子リンク情報を指し示すポインタとを含む、請求項14に記載の単語翻訳装置。
  17. 前記単語が複数の品詞を有する場合、前記リンク情報は、前記品詞毎に設けられる、請求項14ないし16のいずれか1つに記載の単語翻訳装置。
  18. 前記単語検索辞書データは、
    前記複数言語毎に、単語を検索するための単語検索構造と単語に関する情報を記憶した単語情報レコードとを有する、請求項14ないし17のいずれか1つに記載の単語翻訳装置。
  19. 前記単語情報レコードは、前記リンク情報を含むことを特徴とする請求項18に記載の単語翻訳装置。
  20. 前記単語検索構造は、単語トライ構造またはハッシュ関数構造を含む、請求項18に記載の単語翻訳装置。
  21. 前記単語検索構造は、
    対応する言語の単語の第1文字のリスト情報と、前記単語のリスト情報とを有し、
    前記第1文字リスト情報は、前記第1文字の情報、前記第1文字から始まる単語数、前記第1文字から始まる単語のリスト情報における位置を指し示すポインタを含み、
    前記単語のリスト情報は、前記単語に対応するリンク情報を指し示すポインタを含む、請求項14ないし20のいずれか1つに記載の単語翻訳装置。
  22. 一の言語の単語を入力する入力手段と、
    前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合手段と、
    前記照合された一の言語の単語に対応するリンク情報に基づいて、他の言語に対応する単語検索辞書データから前記他の言語における訳語を抽出する抽出手段とを有する、請求項14ないし21のいずれか1つに記載の単語翻訳装置。
  23. 前記抽出手段は、前記照合手段により照合された一の言語の単語情報レコードのリンク情報に基づいて他の言語の単語情報レコードを抽出する、請求項22に記載の単語翻訳装置。
  24. 前記抽出手段は、前記照合手段により照合された一の言語の単語情報レコードのリンク情報に基づいて他の言語の単語検索構造の訳語を抽出する、請求項22に記載の単語翻訳装置。
  25. 文章を入力し、当該文章の翻訳を行う翻訳手段と、
    翻訳手段によって翻訳できなかった単語を入力し、当該単語の翻訳を行う請求項1ないし24のいずれか1つに記載の単語翻訳装置と、
    を有する機械翻訳システム。
  26. 翻訳手段は、翻訳メモリエンジン、パターンベース翻訳エンジン、またはチャンクベース例文翻訳エンジンのいずれか1つを含む、請求項25に記載の機械翻訳システム。
  27. 機械翻訳システムはさらに、翻訳手段によって翻訳できなかった単語についての訳語を、他の訳語と識別して出力する識別出力手段を含む、請求項26に記載の機械翻訳システム。
  28. 複数言語間において単語の翻訳を行う単語翻訳方法であって、
    第1の言語の単語を検索するための第1の単語検索構造を記憶し、第2の言語の単語を検索するための第2の単語検索構造を作成し記憶し、第1の単語検索構造に格納された単語についての訳語を識別するための第1の訳語情報を含む第1の単語情報レコードを記憶し、かつ第2の単語検索構造に格納された単語についての訳語を識別するための第2の訳語情報を含む第2の単語情報レコードを辞書に記憶するステップを備えた、単語翻訳方法。
  29. 単語翻訳方法はさらに、単語を入力する入力ステップ、入力された単語を第1の単語検索構造に格納された単語と照合するステップ、照合された単語についての第1の単語情報レコードに基づき第2の単語検索構造に格納された訳語を抽出するステップ、抽出された訳語を出力するステップを含む、請求項28に記載の単語翻訳方法。
  30. 複数言語間において単語の翻訳を行う翻訳方法であって、
    前記言語毎に設けられる単語検索辞書データと、
    前記言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報と、
    を記憶手段に記憶させる記憶ステップを有することを特徴とする翻訳方法。
  31. 一の言語の単語を入力する入力ステップと、
    前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合ステップと、
    前記照合された一の言語の単語に対応するリンク情報に基づいて、他の言語に対応する単語検索辞書データから前記他の言語における訳語を抽出する抽出ステップとを有することを特徴とする請求項29に記載の翻訳方法。
  32. 前記単語検索辞書データは、言語毎に単語検索構造と単語に関する情報を記憶した単語情報レコードを含み、前記単語情報レコードは前記リンク情報を含み、前記抽出するステップは、一の言語の単語情報レコードの前記リンク情報に基づいて他の言語の単語情報レコードを抽出する、請求項31に記載の翻訳方法。
  33. 複数言語間において単語の翻訳を行う単語翻訳プログラムであって、
    第1の言語の単語を検索するための第1の単語検索構造を記憶し、第2の言語の単語を検索するための第2の単語検索構造を作成し記憶し、第1の単語検索構造に格納された単語についての訳語を識別するための第1の訳語情報を含む第1の単語情報レコードを記憶し、かつ第2の単語検索構造に格納された単語についての訳語を識別するための第2の訳語情報を含む第2の単語情報レコードを辞書に記憶するステップを備えた、単語翻訳プログラム。
  34. 単語翻訳方法はさらに、単語を入力する入力ステップ、入力された単語を第1の単語検索構造に格納された単語と照合するステップ、照合された単語についての第1の単語情報レコードに基づき第2の単語検索構造に格納された訳語を抽出するステップ、抽出された訳語を出力するステップを含む、請求項31に記載の単語翻訳プログラム。
  35. 複数言語間において単語の翻訳を行う翻訳プログラムであって、
    前記言語毎に設けられる単語検索辞書データと、
    前記言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報と、
    を記憶手段に記憶させる記憶ステップを備えた、翻訳プログラム。
  36. 一の言語の単語を入力する入力ステップと、
    前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合ステップと、
    前記照合された一の言語の単語に対応するリンク情報に基づいて、他の言語に対応する単語検索辞書データから前記他の言語における訳語を抽出する抽出ステップとを備えた、翻訳プログラム。
  37. 前記単語検索辞書データは、言語毎に単語検索構造と単語に関する情報を記憶した単語情報レコードを含み、前記単語情報レコードは前記リンク情報を含み、前記抽出するステップは、一の言語の単語情報レコードの前記リンク情報に基づいて他の言語の単語情報レコードを抽出する、請求項36に記載の翻訳プログラム。
JP2007504746A 2005-02-24 2006-02-22 単語翻訳装置、翻訳方法および翻訳プログラム Expired - Fee Related JP4911028B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007504746A JP4911028B2 (ja) 2005-02-24 2006-02-22 単語翻訳装置、翻訳方法および翻訳プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005048595 2005-02-24
JP2005048595 2005-02-24
JP2007504746A JP4911028B2 (ja) 2005-02-24 2006-02-22 単語翻訳装置、翻訳方法および翻訳プログラム
PCT/JP2006/303155 WO2006090732A1 (ja) 2005-02-24 2006-02-22 単語翻訳装置、翻訳方法および翻訳プログラム

Publications (2)

Publication Number Publication Date
JPWO2006090732A1 true JPWO2006090732A1 (ja) 2008-07-24
JP4911028B2 JP4911028B2 (ja) 2012-04-04

Family

ID=36927370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007504746A Expired - Fee Related JP4911028B2 (ja) 2005-02-24 2006-02-22 単語翻訳装置、翻訳方法および翻訳プログラム

Country Status (4)

Country Link
US (1) US8041557B2 (ja)
JP (1) JP4911028B2 (ja)
CN (1) CN101124579A (ja)
WO (1) WO2006090732A1 (ja)

Families Citing this family (198)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
JP2007193438A (ja) * 2006-01-17 2007-08-02 Casio Comput Co Ltd 電子辞書装置及び検索制御プログラム
JP2008065395A (ja) * 2006-09-04 2008-03-21 Fuji Xerox Co Ltd 翻訳装置、翻訳方法および翻訳プログラム
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8074172B2 (en) 2007-01-05 2011-12-06 Apple Inc. Method, system, and graphical user interface for providing word recommendations
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8232973B2 (en) 2008-01-09 2012-07-31 Apple Inc. Method, device, and graphical user interface providing word recommendations for text input
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
CN101419605B (zh) * 2008-04-30 2012-10-10 中山大学 一种实现重复单词列表的电子词典的查询方法
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
TWI376656B (en) * 2008-09-11 2012-11-11 Shing Lung Chen Foreign-language learning method utilizing an original language to review corresponding foreign languages and foreign-language learning database system thereof
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
KR20100037813A (ko) * 2008-10-02 2010-04-12 삼성전자주식회사 통계적 자동 번역 장치 및 방법
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US20100235780A1 (en) * 2009-03-16 2010-09-16 Westerman Wayne C System and Method for Identifying Words Based on a Sequence of Keyboard Events
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US8543598B2 (en) * 2010-03-01 2013-09-24 Microsoft Corporation Semantic object characterization and search
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
JP5747508B2 (ja) * 2011-01-05 2015-07-15 富士ゼロックス株式会社 対訳情報検索装置、翻訳装置及びプログラム
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US11410072B2 (en) * 2011-10-21 2022-08-09 Educational Testing Service Computer-implemented systems and methods for detection of sentiment in writing
CN103294682A (zh) * 2012-02-24 2013-09-11 摩根全球购物有限公司 多语言检索方法、计算机可读储存媒体及网络搜寻系统
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
JP2014075073A (ja) 2012-10-05 2014-04-24 Fuji Xerox Co Ltd 翻訳処理装置及びプログラム
KR102118209B1 (ko) 2013-02-07 2020-06-02 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101809808B1 (ko) 2013-06-13 2017-12-15 애플 인크. 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
TWI566107B (zh) 2014-05-30 2017-01-11 蘋果公司 用於處理多部分語音命令之方法、非暫時性電腦可讀儲存媒體及電子裝置
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10592614B1 (en) * 2017-01-19 2020-03-17 Amdocs Development Limited System, method, and computer program for translating unified ticketing system (UTS) messages
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
CN107146487B (zh) * 2017-07-21 2019-03-26 锦州医科大学 一种英语语音翻译方法
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
CN107894983A (zh) * 2017-11-08 2018-04-10 深圳市沃特沃德股份有限公司 引擎的切换方法与装置
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
CN108959276A (zh) * 2018-07-23 2018-12-07 传神语联网网络科技股份有限公司 一种用于翻译的术语发现方法及其系统
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
CN116933807B (zh) * 2023-09-14 2023-12-29 成都帆点创想科技有限公司 一种文本翻译方法、装置、设备及可读存储介质

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62165238A (ja) * 1986-01-16 1987-07-21 Sharp Corp 電子辞書の検索方法
JPH01234975A (ja) * 1988-03-11 1989-09-20 Internatl Business Mach Corp <Ibm> 日本語文章分割装置
JPH01291363A (ja) * 1988-05-18 1989-11-22 Matsushita Electric Ind Co Ltd 辞書検索装置
JP2815911B2 (ja) * 1989-07-19 1998-10-27 三洋電機株式会社 電子辞書
JPH03118661A (ja) * 1989-09-29 1991-05-21 Matsushita Electric Ind Co Ltd 単語検索装置
US5301109A (en) * 1990-06-11 1994-04-05 Bell Communications Research, Inc. Computerized cross-language document retrieval using latent semantic indexing
US5229936A (en) * 1991-01-04 1993-07-20 Franklin Electronic Publishers, Incorporated Device and method for the storage and retrieval of inflection information for electronic reference products
JPH0594471A (ja) * 1991-02-04 1993-04-16 Oki Electric Ind Co Ltd 共起辞書作成装置
JPH05108621A (ja) * 1991-10-18 1993-04-30 Dainippon Printing Co Ltd 電子辞書・事典装置
JPH05120325A (ja) * 1991-10-29 1993-05-18 Meidensha Corp 電子化辞書
JPH05266069A (ja) 1992-03-23 1993-10-15 Nec Corp 中国語と日本語との間の双方向機械翻訳方式
JPH0736882A (ja) * 1993-07-19 1995-02-07 Fujitsu Ltd 辞書検索装置
JPH07168848A (ja) * 1993-12-16 1995-07-04 Fujitsu Ltd 単語辞書検索装置
JP2975529B2 (ja) * 1994-05-31 1999-11-10 シャープ株式会社 電子化辞書検索装置
JP3152868B2 (ja) * 1994-11-16 2001-04-03 富士通株式会社 検索装置および辞書/テキスト検索方法
JPH09198394A (ja) * 1996-01-23 1997-07-31 Matsushita Electric Ind Co Ltd 2分探索検索装置
FI982095A (fi) * 1998-09-29 2000-03-30 Nokia Networks Oy Menetelmä muistin toteuttamiseksi ja muistijärjestely
JP2000276479A (ja) * 1999-03-24 2000-10-06 Sharp Corp 電子辞書装置及び電子辞書プログラムを記録した記録媒体
US6393389B1 (en) * 1999-09-23 2002-05-21 Xerox Corporation Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US6904402B1 (en) * 1999-11-05 2005-06-07 Microsoft Corporation System and iterative method for lexicon, segmentation and language model joint optimization
JP4066600B2 (ja) * 2000-12-20 2008-03-26 富士ゼロックス株式会社 多言語文書検索システム
EP1306775A1 (en) * 2001-10-29 2003-05-02 BRITISH TELECOMMUNICATIONS public limited company Machine translation
WO2004001623A2 (en) * 2002-03-26 2003-12-31 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
GB0413743D0 (en) * 2004-06-19 2004-07-21 Ibm Method and system for approximate string matching
JP4404211B2 (ja) * 2005-03-14 2010-01-27 富士ゼロックス株式会社 マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
GB0513225D0 (en) * 2005-06-29 2005-08-03 Ibm Method and system for building and contracting a linguistic dictionary

Also Published As

Publication number Publication date
US20090106018A1 (en) 2009-04-23
JP4911028B2 (ja) 2012-04-04
CN101124579A (zh) 2008-02-13
US8041557B2 (en) 2011-10-18
WO2006090732A1 (ja) 2006-08-31

Similar Documents

Publication Publication Date Title
JP4911028B2 (ja) 単語翻訳装置、翻訳方法および翻訳プログラム
JP4404211B2 (ja) マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム
US5895446A (en) Pattern-based translation method and system
US5640575A (en) Method and apparatus of translation based on patterns
JP3356536B2 (ja) 機械翻訳装置
JP4694111B2 (ja) 用例ベースの機械翻訳システム
JP5235344B2 (ja) 機械翻訳を行う装置、方法およびプログラム
KR100530154B1 (ko) 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치
JPS62163173A (ja) 機械翻訳方法
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JP2008065395A (ja) 翻訳装置、翻訳方法および翻訳プログラム
US20030200079A1 (en) Cross-language information retrieval apparatus and method
JPS6175957A (ja) 機械翻訳処理装置
JP2632806B2 (ja) 言語解析装置
JP5909123B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
KR20010103411A (ko) 번역 효율이 향상된 언어 번역 시스템 및 방법
KR102338949B1 (ko) 기술문서 번역 지원 시스템
JP2006134051A (ja) 翻訳装置、翻訳方法およびプログラム
JP2608384B2 (ja) 機械翻訳装置及びその方法
KR20130042822A (ko) 패턴 기반 번역과 번역 예문 기반 번역을 사용한 번역 장치 및 방법
JPH03161865A (ja) 文章の検索方法
Sorensen et al. Rethinking Full-Text Search for Multi-lingual Databases.
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH04296970A (ja) 文章検査装置
JPH09160929A (ja) 文書処理装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111220

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120102

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150127

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees