WO2006090732A1

WO2006090732A1 - 単語翻訳装置、翻訳方法および翻訳プログラム

Info

Publication number: WO2006090732A1
Application number: PCT/JP2006/303155
Authority: WO
Inventors: Shaoming Liu
Original assignee: Fuji Xerox Co., Ltd.
Priority date: 2005-02-24
Filing date: 2006-02-22
Publication date: 2006-08-31
Also published as: CN101124579A; US8041557B2; US20090106018A1; JPWO2006090732A1; JP4911028B2

Abstract

　単語翻訳装置は、第１言語の単語を検索するための第１言語の単語検索トライ構造１００、第２言語の単語を検索するための第２言語の単語検索トライ構造２００、第１言語の単語検索トライ構造１００に格納された単語についての訳語を識別するための第１の訳語情報を含む第１言語の単語情報レコード１１０、および第２の単語検索トライ構造に格納された単語についての訳語を識別するための第２の訳語情報を含む第２言語の単語情報レコード２１０を対訳辞書に記憶している。第１、第２の単語情報レコード１１０、２１０を参照することで、第１、第２言語間の双方向の単語翻訳を高精度にかつ高速に実現することができる。

Description

明細書

単語翻訳装置、翻訳方法および翻訳プログラム

技術分野

[0001] 本発明は、原言語の単語を目的言語の単語に翻訳する単語翻訳装置に関し、特に複数言語相互間の翻訳技術に関する。

背景技術

[0002] 単語翻訳技術は、入力された第 1の言語単語を対訳辞書を参照し、そこから第 2の言語の訳語を引き出し、これを出力するものである。また、文の翻訳技術は、入力された第 1言語の文を形態素解析し、文を構成する単語集合を抽出し、対訳辞書を利用して抽出された単語の訳語を引き出し、訳語の接続関係を利用して訳文を生成するものである。例えば非特許文献 1は、語の接続関係を利用した機械翻訳システムを開示している。

[0003] このような単語翻訳技術や文の翻訳技術は、電子単語翻訳装置やコンピュータ装置において実用化されている。例えば、電子単語翻訳装置は、複数の言語に関する対訳辞書をメモリ内に記憶し、ユーザが第 1の言語単語を入力すると、その単語の訳語を対訳辞書を参照して抽出し、これをディスプレイに表示する。

[0004] 特許文献 1は、電子辞書において検索を行うときに、ユーザが辞書の種類を選択する手間を省くものである。すなわち、ユーザが入力した検索語に基づいて、複数の辞書に含まれる見出し語を検索し、検索された見出し語が含まれる複数の辞書内容を一括して表示させている。

[0005] 特許文献 1 :特開 2000— 276479号

非特許文献 1 :鈴木、栃内、「語の接続関係を利用した機械翻訳システム」、情報処理学会論文誌、 Vol.29, No.4、 1988

発明の開示

発明が解決しょうとする課題

[0006] 一般に、対訳辞書の構成は、言語対毎 (例えば、日英、英日など)に構成され、単語情報を二重に記録し、日英または英日からの翻訳時に、単語情報を共用しない構造になっている。このため、辞書の構築コストは高くなつている。また、対訳辞書は双方向に検索可能な構成になって、な、ため対訳辞書に情報漏れと、う問題がある。例えば、日英に存在する対訳対が、英日に存在しない場合がある。特許文献 1の電子辞書では、英日翻訳辞書と日英翻訳辞書をそれぞれ独自の翻訳に適用して、るので、上記した課題を依然として解決するものではなヽ。

[0007] また、文の翻訳技術として、最終的な目的は正確な翻訳文を取り出すことであるが、すべてにおいて正確な翻訳を得ることが容易でないのが現状である。このため、翻訳された文書には、正解な訳文と不正解な訳文とが混在し、ユーザは、どこまでが正解な訳文なのかを判断することが難くなつている。非特許文献 1は、このような課題を解決する構成を開示し、または示唆するものではな、。

[0008] 本発明は、上記従来の課題を解決するために成されたものであり、 2言語間または複数言語間において双方向の翻訳を可能とする対訳辞書を備えた単語翻訳装置、翻訳方法および翻訳プログラムを提供することを目的とする。

さらに本発明は、高速に単語の翻訳を行うことができる単語翻訳装置、翻訳方法および翻訳プログラムを提供することを目的とする。

課題を解決するための手段

[0009] 本発明は、複数言語間において単語の翻訳を行う単語翻訳装置であって、少なくとも、第 1の言語の単語を検索するための第 1の単語検索構造、第 2の言語の単語を検索するための第 2の単語検索構造、第 1の単語検索構造に格納された単語についての単語関連情報と訳語情報を含む第 1の単語'訳語情報レコード、および第 2の単語検索構造に格納された単語についての単語関連情報と訳語情報を含む第 2の単語情報レコードを辞書に記憶する記憶手段を備える。任意の言語の単語からもう一方の言語の訳語を引き出すときに、単語を原言語の単語検索構造と照合し、照合が成功した場合は、対応した単語情報と訳語情報を単語 ·訳語情報レコードから取り出し、取り出された訳語情報からもう一方の言語の単語検索構造の訳語情報を得ることができる。原言語の単語を単語検索構造において照合が失敗した場合は、原言語の単語をそのまま出力する。

[0010] また、本発明の単語翻訳装置は、第 1、第 2の単語検索構造が、単語'訳語情報レコードを識別するための単語'訳語情報レコード識別情報を含む。

[0011] また、本発明の単語翻訳装置は、第 1、第 2の単語'訳語情報レコードが、それぞれ第 1、第 2の単語検索構造に含まれる単語を識別する単語識別情報を含む。

[0012] また、本発明の単語翻訳装置は、第 1、第 2の単語'訳語情報レコードが、それぞれ第 1、第 2の単語検索構造に含まれる単語の関連情報を含む。

[0013] また、本発明の単語翻訳装置は、第 1の単語'訳語情報レコードが、第 2の単語'訳語情報レコードに含まれる訳語情報を識別するための訳語識別情報を含み、第 2の単語'訳語情報レコードが、第 1の単語'訳語情報レコードに含まれる訳語情報を識別するための訳語識別情報を含む。

[0014] また、本発明の単語翻訳装置は、第 1、第 2の単語'訳語情報レコードが、訳語に関連する多義語を識別するための識別情報を含む。

[0015] また、本発明の単語翻訳装置は、第 1、第 2の単語'訳語情報レコードが、訳語の言語種を識別するための識別情報を含む。

[0016] また、本発明の単語翻訳装置は、第 1、第 2の単語'訳語情報レコードが、 1つの単語が複数の品詞を有する場合に、各品詞毎に、単語関連情報と訳語情報を記憶するレコードを有する。

[0017] また、本発明の単語翻訳装置は、各品詞毎のレコードが、当該 1つの単語関連情報とポインタによって関連付けされている。

[0018] 好ましくは、単語翻訳装置はさらに、単語を入力する入力手段と、入力された単語を第 1の単語検索トライ構造に格納された単語と照合する照合手段と、照合された単語についての第 1の単語情報レコードに基づき第 2の単語検索トライ構造に格納された訳語を抽出する抽出手段と、抽出された訳語を出力する出力手段とを有する。これにより、入力された単語の訳語を高速かつ高精度に得ることができる。好ましくは、前記抽出手段は、前記照合手段により照合された単語についての第 1の単語情報レコードに基づき第 2の単語情報レコードを抽出する。また、第 1の単語情報レコードの訳語情報は、第 2の単語検索構造に格納された訳語または第 2の単語情報レコードを識別するためのリンク情報を含み、前記抽出手段は、前記リンク情報に基づき前記訳語または第 2の単語情報レコードを抽出するようにしてもょ、。 [0019] 本発明に係る複数言語間において単語の翻訳を行う単語翻訳装置は、 N力国言語 (Nは、 2以上の整数）についての単語検索トライ構造と、 N力国言語の単語検索トライ構造に対応する N力国言語の単語情報レコードとを辞書に記憶する記憶手段を含み、 N力国言語の単語情報レコードのうち所定言語の単語情報レコードは、所定単語についての訳語を識別する訳語情報を複数言語について記憶する。これは、本発明に係る単語翻訳装置が、 2言語間のみならず複数言語間 (マルチリンガル)の単語翻訳に対応可能であることを規定して、る。

[0020] さらに本発明に係る機械翻訳システムは、文章を入力し、当該文章の翻訳を行う翻訳手段と、翻訳手段によって翻訳できな力つた単語を入力し、当該単語の翻訳を行う請求項 1ないし 10いずれか 1つに記載の単語翻訳装置とを有する。翻訳手段は、翻訳メモリエンジン、パターンベース翻訳エンジン、またはチャンクベース例文翻訳ェンジンのいずれか 1つを含む。好ましくは、翻訳手段によって翻訳できな力つた単語についての訳語を、他の訳語と識別して出力する識別出力手段を含む。これにより、高精度の翻訳を行うことができるとともに、ユーザは、どの訳語の信頼性が高ぐどの訳語の信頼性が低、のかを容易に判別することができる。

[0021] 本発明に係る、複数言語間において単語の翻訳を行う単語翻訳装置は、前記言語毎に設けられる単語検索辞書データと、前記言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報とを記憶する記憶手段を有する。

[0022] これにより、リンク情報によって一の言語の単語と他の言語における訳語との関連付けがなされるため、 2言語間又は複数言語間において双方向の翻訳が可能となる

[0023] 好ましくは、単語翻訳装置は、前記リンク情報が、前記一の言語の単語の識別情報と、前記他の言語の識別情報と、前記他の言語における訳語に対応するリンク情報を指し示すポインタと、前記一の言語の単語に関連する多義語に対応するリンク情報を指し示すポインタとを含む。

[0024] 好ましくは、単語翻訳装置は、前記リンク情報が、親リンク情報と子リンク情報とを有し、前記親リンク情報は、前記一の単語の識別情報と、前記一の単語に関連する多義語に対応する子リンク情報を指し示すポインタとを含み、前記子リンク情報は、前記他の言語の識別情報と、対応する親リンク情報を指し示すポインタと、前記他の言語における訳語に対応する子リンク情報を指し示すポインタと、他の多義語に対応する子リンク情報を指し示すポインタとを含む。

[0025] 好ましくは、単語翻訳装置は、前記単語が複数の品詞を有する場合、前記リンク情報は、前記品詞毎に設けられる。前記単語検索辞書データは、前記複数言語毎に、単語を検索するための単語検索構造と単語に関する情報を記憶した単語情報レコ一ドとを有する。

[0026] 好ましくは、単語情報レコードは、前記リンク情報を含む。単語検索構造は、例えば、単語トライ構造またはハッシュ関数構造を含む。

[0027] 好ましくは、単語翻訳装置は、前記単語検索辞書データが、対応する言語の単語の第 1文字のリスト情報と、前記単語のリスト情報とを有し、前記第 1文字リスト情報は、前記第 1文字の情報、前記第 1文字から始まる単語数、前記第 1文字から始まる単語のリスト情報における位置を指し示すポインタを含み、前記単語のリスト情報は、前記単語に対応するリンク情報を指し示すポインタを含む。

[0028] 好ましくは、前記リンク情報は、前記単語検索辞書データに含まれる単語に関する情報を表す単語情報レコードと対応付けられる。

[0029] 好ましくは、単語翻訳装置は、一の言語の単語を入力する入力手段と、前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合手段と、前記照合された一の言語の単語に対応するリンク情報に基づいて、他の言語に対応する単語検索辞書データ力前記他の言語における訳語を抽出する抽出手段とを有する。これにより、単語の翻訳を高精度に行うことができる。好ましくは、前記抽出手段は、前記照合手段により照合された一の言語の単語情報レコードのリンク情報に基づいて他の言語の単語情報レコードを抽出する。また、前記抽出手段は、前記照合手段により照合された一の言語の単語情報レコードのリンク情報に基づいて他の言語の単語検索構造の訳語を抽出することができる。

[0030] 本発明に係る複数言語間において単語の翻訳を行う単語翻訳方法は、第 1の言語の単語を検索するための第 1の単語検索構造を記憶し、第 2の言語の単語を検索するための第 2の単語検索構造を作成し記憶し、第 1の単語検索構造に格納された単語についての訳語を識別するための第 1の訳語情報を含む第 1の単語情報レコードを記憶し、かつ第 2の単語検索構造に格納された単語にっ、ての訳語を識別するための第 2の訳語情報を含む第 2の単語情報レコードを辞書に記憶するステップを備えたものである。

[0031] 単語翻訳方法はさらに、単語を入力する入力ステップ、入力された単語を第 1の単語検索構造に格納された単語と照合するステップ、照合された単語についての第 1 の単語情報レコードに基づき第 2の単語検索構造に格納された訳語を抽出するステップ、抽出された訳語を出力するステップを含む。好ましくは、前記単語検索辞書データは、言語毎に単語検索構造と単語に関する情報を記憶した単語情報レコードを含み、前記単語情報レコードは前記リンク情報を含み、前記抽出するステップは、一の言語の単語情報レコードの前記リンク情報に基づ!/、て他の言語の単語情報レコ一ドを抽出する。

[0032] 本発明に係る、複数言語間において単語の翻訳を行う単語翻訳方法は、前記言語毎に設けられる単語検索辞書データと、前記言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報と、を記憶手段に記憶させる記憶ステップを有する。

[0033] 好ましくは、単語翻訳方法は、一の言語の単語を入力する入力ステップと、前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合ステップと、前記照合された一の言語の単語に対応するリンク情報に基づ、て、他の言語に対応する単語検索辞書データ力前記他の言語における訳語を抽出する抽出ステップとを有する。

[0034] さらに本発明に係る複数言語間において単語の翻訳を行う単語翻訳プログラムは、第 1の言語の単語を検索するための第 1の単語検索構造を記憶し、第 2の言語の単語を検索するための第 2の単語検索構造を作成し記憶し、第 1の単語検索構造に格納された単語についての訳語を識別するための第 1の訳語情報を含む第 1の単語情報レコードを記憶し、かつ第 2の単語検索構造に格納された単語についての訳語を識別するための第 2の訳語情報を含む第 2の単語情報レコードを辞書に記憶するステップを備えている。

[0035] 本発明に係る、複数の言語間において単語の翻訳を行う単語翻訳プログラムは、前記言語毎に設けられる単語検索辞書データと、前記言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報とを記憶手段に記憶させる記憶ステップを備える。

[0036] 好ましくは、単語翻訳プログラムは、一の言語の単語を入力する入力ステップと、前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合ステップと、前記照合された一の言語の単語に対応するリンク情報に基づ、て、他の言語に対応する単語検索辞書データ力前記他の言語における訳語を抽出する抽出ステップとを備える。

発明の効果

[0037] 本発明によれば、言語毎に単語検索辞書データとリンク情報とが設けられることによって、言語間の双方向翻訳を情報漏れなぐ高精度にかつ高速に行うことができる。さらに、本発明の単語翻訳装置は、 2言語間のみならずマルチリンガルの単語翻訳にも適用することができる。

図面の簡単な説明

[0038] [図 1]本発明の実施例に係る機械翻訳システムの構成を示す図である。

[図 2]2言語相互間の単語翻訳装置の構成を示す図である。

[図 3]本発明の実施例に係る単語直訳機械エンジンのハードウェア構成を示す図である。

[図 4]本発明の実施例に係る単語検索トライ構造を示す図である。

[図 5]トライ構造を説明する図である。

[図 6]単語情報レコードの構造を示す図である。

[図 7]単語フラグを説明する図である。

[図 8]図 8(a)は子供フラグを説明する図、図 8(b)は言語 IDを説明する図である。

[図 9]単語情報レコード IDを説明する図である。

[図 10]トライ構造の文字情報の構造を説明する図である。 [図 11]ノードレコード IDの付与を説明する図である。

[図 12]ノードレコードの配列を示す図である。

[図 13]第 1の単語情報レコードの格納方法を説明する図である。

[図 14]第 2の単語情報レコードの格納方法を説明する図である。

[図 15]単語の翻訳動作を説明するフローである。

[図 16]本発明の第 2の実施例に係る N力国言語間の単語翻訳装置の対訳辞書を説明する図である。

[図 17]本発明の第 3の実施例において用いられる N力国言語単語対訳辞書の構造を示す図である。

[図 18]N力国言語単語対訳辞書の第 1の構成の概念図である。

[図 19]N力国言語単語対訳辞書の第 2の構成の概念図である。

[図 20]ノ、ッシュ関数ベースでの単語検索辞書の詳細な構成を示す図である。

[図 21]配列構造ベースが採用される場合における単語情報レコードの構造を示す図である。

[図 22]二重配列構造ベースが採用される場合における単語情報レコードの構造を示す図である。

[図 23]二重配列構造ベースが採用される場合における多義語情報レコードの構造を示す図である。

[図 24]配列構造ベースが採用される場合における、日本語と中国語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。

[図 25]二重配列構造ベースが採用される場合における、日本語と中国語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。

[図 26]配列構造ベースが採用される場合における、日本語と英語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。

[図 27]二重配列構造ベースが採用される場合における、日本語と英語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。

発明を実施するための最良の形態

以下、本発明の最良の実施形態について図面を参照して説明する。図 1は、本発明の実施例に係る機械翻訳システムの全体構成を示す図である。機械翻訳システム

1は、文書のすべての部分を正しく翻訳することはできない。翻訳できない部分に無理に翻訳すると、ユーザを混迷させ、原文の内容の把握に悪い影響を与えてしまう。そこで、翻訳結果において、正解または失敗の区別、あるいは信頼性の高低を与えるようにしている。また、翻訳システムに学習機能を設け、翻訳できない部分を自動的に回収し、正確な対訳を付与することで、翻訳の性能を向上させている。

[0040] 機械翻訳システム 1は、原言語テキスト文入力部 10から入力された文単位の文を翻訳する翻訳メモリエンジン 12、翻訳メモリエンジン 12のデータベースにおいて照合できな力つた部分、つまり正確に翻訳をできな力つた部分を入力しこれの形態素解析を行う形態素解析部 14と、形態素解析部 14で解析された文または単語を入力しパターンベースで翻訳をするパターンベース翻訳エンジン 16と、パターンベース翻訳エンジン 16で翻訳できな力つた部分をチャンクベース例文（単語の組合せまたは名詞句のようなフレーズ)で翻訳するチャンクベース翻訳エンジン 18と、チャンクベース翻訳エンジン 18で翻訳できなカゝつた単語を入力し、解析ベースまたは単語ベースで翻訳する解析ベースまたは単語直訳翻訳エンジン 20と、目的言語テキスト文を作成する目的言語テキスト作成部 22とを有している。なお、チャンクベース翻訳エンジン 1 8は、訳語引き出し関数を保持している。この訳語引き出し関数は、文に含まれる単語の列と、当該単語の列を翻訳した単語の列とを対応付けるものであり、解析ベースまたは単語直訳翻訳エンジン 20は、訳語引き出し関数を文力も切り出した単語の列に適用して、当該単語の列の翻訳結果を得る。

[0041] 翻訳メモリエンジン 12、パターンベース翻訳エンジン 16、チャンクベース例文翻訳エンジン 18により翻訳が成功した部分の翻訳データは、目的言語テキスト作成部 22 に入力される。目的言語テキスト作成部 22は、これらの翻訳データに基づき目的言語のテキストを作成する。このとき、翻訳成功した部分については、正確に翻訳されたことがわ力るような識別を与える。一方、解析ベースまたは単語直訳翻訳エンジン 2 0によって翻訳された翻訳データは、目的言語テキスト文作成部 22において、参考程度の翻訳として出力される。これにより、ユーザは、テキスト訳文において、どこが信頼できる翻訳結果であり、どこが信頼できな、翻訳結果かを一見して把握することができる。一方、チャンクベース例文翻訳エンジン 18で翻訳失敗した部分は、回収部 24によって回収される。回収された翻訳失敗部分は、翻訳者によって正確な翻訳がなされ、その結果が、学習エンジン 26に出力される。学習エンジン 26は、正確な翻訳に基づき、対訳データを対訳辞書 28へ書き込む。

[0042] 図 2は、本実施例の好ましい 2言語相互間の単語翻訳装置の構成を示す図である。 2言語相互間の単語翻訳機能は、単語直訳翻訳エンジン 20に包含されている。単語翻訳装置において、原言語テキスト入力部 10からテキスト分または単語が形態素解析部 14に入力される。単語は、そこで属性 (名詞や動詞など)を付与され、単語直訳翻訳エンジン 20に入力される。単語直訳翻訳エンジン 20は、入力された原言語の単語を対訳辞書を用いて目的言語の単語に翻訳し、その結果を目的言語テキスト作成部 22へ出力する。単語直訳翻訳エンジン 20の対訳辞書は、学習エンジン 26により学習された対訳辞書 28を用いることができる。

[0043] 図 3は、 2言語相互間の単語翻訳装置のハードウェア構成を示す図である。単語翻訳装置は、入力装置 30、表示装置 32、主記憶装置 34、外部記憶装置 36、中央処理装置 (CPU) 38、これらを接続するバス 40を含んでいる。入力装置 30、キー操作により単語を入力するキーボード、原稿に記載された単語を光学的に読み取る光学式読取装置、あるいは、チャンクベース例文翻訳エンジンの出力のように他のハードウェアまたはソフトウェアの演算結果であってもよ、。

[0044] 表示装置 32は、原言語の単語を翻訳した目的言語の単語を出力するディスプレイ等を含む。主記憶装置 34は、 ROMまたは RAMを含み、単語の翻訳を制御するためのプログラムや演算結果等のデータを記憶する。外部記憶装置 36は、例えばハードディスク等の大容量記憶装置を含み、ここには、単語の翻訳に必要な対訳辞書が記憶されている。 CPU (Central Processing Unit) 38は、主記憶装置 34に記憶されたプログラムに従、各部を制御する。

[0045] 次に、本実施例に係る単語直訳翻訳エンジンの詳細について説明する。図 4は、単語直訳翻訳エンジン 20に含まれる対訳辞書の単語検索トライ構造および単語情報レコード構造の概念を説明する図である。対訳辞書には、第 1言語の単語検索トラィ構造 100およびこれに対応する第 1言語の単語情報レコード 110と、第 2言語の単語検索トライ構造 200およびこれに対応する第 2言語の単語情報レコード 210とを有している。

[0046] トライ構造 (TRIE structure)とは、言語情報処理分野にお!、て、検索キー集合の共通部分の文字列を併合して得られる木構造のことである。例えば、「あい」、「あいさい」、「あいさつ」、「あいのこ」、「あいのり」の 5つの検索キーから生成したトライ構造は図 5に示すようになる。図中の $は、単語の末尾を表わす特殊文字として用いてもよい。トライ構造を用いて検索するには、検索文字列を左から順に走査しながら、木の根（ノード N 1)から各ノード N2〜N13に付与された文字を手がかりに木をたどり、検索文字列に照合する単語を抽出する。トライ構造を用いると、検索キーの数によらず検索文字列に比例した時間で検索ができる。

[0047] 再び図 4に戻って説明する。 2言語相互間での翻訳を行うため、本実施例に係る対訳辞書は、第 1言語の単語検索トライ構造 (以下、第 1のトライ構造という） 100と、第 1 のトライ構造 100に含まれる各単語の訳語情報を記憶する第 1の言語の単語情報レコード 110と、第 2言語の単語検索トライ (以下、第 2のトライ構造という） 200と、第 2のトライ構造 200に含まれる各単語の訳語情報を記憶する第 2言語の単語情報レコード 210を格納している。

[0048] 例えば、第 1言語が日本語であり、第 2言語が中国語であるとき、第 1のトライ構造 1 00に「アメリカ」という単語が格納されていると、第 2のトライ構造 200には、その訳語である「美国」が格納されている。「アメリカ」と「美国」との関係は、第 1、第 2の単語情報レコード 110、 210に含まれる訳語情報にいって相互にリンク付けされる。

[0049] 例えば、「アメリカ」の検索文字列が入力されると、 CPU38は、検索文字列「アメリカ」を左から順に（「ァ」力も順に）走査しながら、第 1のトライ構造のルートから各ノードをたどり、「アメリカ」に一致する単語またはパスが存在する力否かを判別する。一致するパスが存在しているとき、すなわち単語が存在しているとき、「アメリカ」に対応する単語情報レコード 110を参照することで、第 2のトライ構造 200における訳語である「美国」であるパスを識別し、訳語「美国」を得る。一方、「美国」の検索文字列が入力されると、上記とは反対に、「美国」に対応する単語情報レコード 210を参照することで、第 1のトライ構造 100における訳語である「アメリカ」のパスを識別し、訳語「アメリカ」を得る。このように、第 1、第 2の単語情報レコード 110、 210を双方向にリンク付けすることで、相互方向の対訳情報漏れを防止している。

[0050] また、第 1のトライ構造 100に格納される「アメリカ」と同義語である「米国」（ここでは漢字で示すが、ひらがなでも良い）が格納されているとき、「美国」の単語情報レコード 210の訳語情報には、多義語を識別するリンク付けが成されているため、「美国」の訳語から、「アメリカ」および「米国」を得ることができる。

[0051] 上記したように、第 1のトライ構造 100に記憶された単語から第 2のトライ構造の単語を識別するために、第 1言語の単語情報レコード 110が生成され、第 2のトライ構造 2 00に記憶された単語から第 1のトライ構造の単語を識別するために、第 2言語の単語情報レコード 210が生成される。図 6は、単語情報レコードの構造を示す図である。単語情報レコードは、文字情報 ₃00、単語フラグ +子供フラグ +言語 ID302、単語 k情報レコードの ID304、親ノード ID306、右兄弟ノード ID308を有する。

[0052] 文字情報 300は、ノードに含まれる文字が漢字、ひらがな、カタカナ、アルファべットかを示すものである。単語フラグ +子供フラグ +訳語言語 ID302は、 1バイトから構成され、そのうち単語フラグは 2ビットから構成される。単語フラグは、図 7に示すように、単語フラグ力 S「0」のとき、中間ノードを意味し、単語フラグが「1」のとき、単語ノードを意味し (根力該ノードまでのパス上の情報が単語を表す)、単語フラグが「2」のとき、発音ノードを意味し (根カも該ノードまでのパス上の情報が発音を表す)、単語フラグが「3」のとき、単語発音ノードを意味する（根カも該ノードまでのパス上の情報が単語と発音を表す)。

[0053] 子供フラグは 1ビットから構成され、図 8(a)に示すように、子供フラグが「0」のとき、当該ノードよりも下の階層にノードを含まないことを意味し、子供フラグ「1」のとき、当該ノードよりも下の階層にノードを含んで、ることを意味する。

[0054] 訳語言語 IDは、訳語の言語表記を示す識別であり、例えば、図 8 (b)に示すように

、言語 IDが「1」のとき、日本語を示し、言語 IDが「2」のとき中国語を示し、言語 IDが「

3」のとき英語を示す。

[0055] 単語情報レコード ID304は、図 9に示すように、単語、発音、品詞、優先順位、多義性情報 (語数)、概念 ID、左連結情報 ID、右連結情報 ID、訳語言語 ID、訳語 ID、次の多義語情報レコード ID、および説明を含んでいる。単語 IDは、トライ構造に格納された単語を識別するためのノード IDである。例えば、図 4に示す第 1のトライ構造の「アメリカ」の場合、単語 IDは、単語の末端「力」を格納するノード IDである。発音 IDは、単語の発音を表すもので、例えば、漢字やひらがなによって発音が異なるためである。品詞 IDは、単語の品詞、例えば、名詞、動詞、形容詞等を識別する ID である。

[0056] 多義性情報は、単語が多義語であるとき、多義語の数を示す。例えば、図 4の第 1 のトライ構造の「アメリカ」であれば、多義語の数は 1 (「米国」）となる。概念、左連結情報 ID、右連結情報 IDは、必須のものではないが、解析ベースの翻訳を行うときに有用な IDである。

[0057] 訳語言語 IDは、訳語の言語表記を識別する IDであり、「アメリカ」から「美国」への翻訳であれば、中国語を識別する IDとなる。訳語 IDは、当該単語の訳語を識別する IDである。すなわち、「アメリカ」の訳語が「美国」であれば、訳語 IDは、「美国」の末端「国」を格納するノード IDである。多義語情報レコードは、当該単語の訳語と多義語である次のレコードを識別する IDである。例えば「美国」の単語レコードにおいて、訳語が「アメリカ」であり、その多義語が「米国」であれば、多義語レコード IDは、「米国」を識別する IDとなる。説明は、注釈等を含むものであって、必ずしも必須ではない。

[0058] 親ノード ID306は、当該単語を識別するノードより階層の上のノードを識別する ID であり、右兄弟ノード ID308は、当該ノードと共通の親ノードを有する左右のノード ID である。これらのノード IDは、トライ構造に必要な情報であって、単語の翻訳に直接関係するものではない。なお、同音の単語が複数存在する場合には、その単語の数を単語情報レコードに含ませるようにしてもよい。この場合には、単語情報レコードに対応するトライ構造には、複数の単語が対応することになる。

[0059] 図 4に示すように、例えば、第 1のトライ構造 100に格納された「アメリカ」の単語情報レコードを kとすると、単語情報レコード kは、「アメリカ」のルートからのパスを示す情報と、これの訳語情報 (訳語言語 ID、訳語 IDおよび多義語情報レコード ID)を含んでいる。一方、第 2のトライ構造 200に格納された「美国」の単語情報レコードを hとすると、単語情報レコード hは、「美国」のルートからのパスを示す情報と、これの訳語情報を含んでいる。また、単語情報レコード hは、「米国」の単語情報レコード k+1を、多義語情報レコード IDとして含んでいる。こうして、第 1言語および第 2言語の双方の訳語が第 1、第 2の単語情報レコードを介して双方向にリンク付けされ、双方向からの翻訳時に訳語を漏れなく高速に検索することができる。

[0060] 次に、トライ構造の文字情報の構造を図 10を参照して説明する。図 10(a)に示す方法は、トライ構造の各ノードを、 2バイトにより 1文字を表している。図 10(b)に示す方法は、すべての言語をュ-コード（Unicode)に変換し、各ノードに高バイト（上位 8ビット）と低バイト（下位 8ビット）を格納し、高バイトおよび低バイトにより 1文字を表して!/、る。図 10 (b)の方法は、図 10 (a)の方法に比べて、トライ構造の水平方向のノードが減るため（256通り）、検索速度は速くなる力ノードが深さ方向に深くなるため、情報量は増加する。図 10(c)に示す方法は、図 10(a)の方法と図 10(b)の方法をミックスしたものである。

[0061] 次にノード IDの付与方法について説明する。図 11は、ノード IDの付与方法を示す図である。トライ構造では、深さ優先探索し、探索の順番によって番号を 1あるいは 0 力も順に増加させ、ノード IDを付与する。ノード IDを付与したならば、図 12に示すように、ノード IDに対応するレコードをノード IDの順番に従い配列し、格納する。ノード I Dの順番でレコードを配列させることで、ノード IDが指すノード情報に瞬時にアクセスすることができる。なお、本実施例では訳語だけが得られ、図 9に示すような単語の情報 (訳語の情報）、即ち、単語の発音、品詞 (属性)などは正確に得られない。図 9に示すような訳語の正確な情報が必要な場合は、後述する第 2及び第 3の実施例のような単語検索構造及び単語情報レコード構造を用いれば良ヽ。

[0062] 次に、単語レコードの格納方法について説明する。第 1の言語の単語と第 2の言語の単語が 1対 1に対応して、るときは、それぞれの単語情報レコードは単一でよ!、が

、一般には、単語には複数の品詞 (複数の意味)を持つものも多ぐ対訳は、複数対複数の関係になることが多、。

[0063] 単語 kの品詞が複数であり、ある品詞の訳語が複数の場合には、単語 kの情報レコードを複数用意し、各レコードの間を直列の指針 (ポインタ)で連結し、それぞれのレコードに対応している訳語情報を記憶するようにする。図 13に示すように、第 1の言語の単語 kのレコードには、品詞 1とその対訳語 1の情報が記憶され、さらにポインタによって関連付けされたレコードには、品詞 1とその対訳語 2が記憶される。ポインタは、図 6に示した次の多義語情報レコード IDを用いることができる。次に、単語の選択ルールについて説明する。好ましくは、名詞、代名詞、形容詞、副詞、動詞、専門用語だけ翻訳する。対訳の関係が 1対 1の場合は、一義的に対応する訳語を選択する。一方、 1対 nの場合 (η> 1)は、 n個の訳語の品詞属性を比較して、原言語の単語の品詞が同じ品詞のもの力も選択する.そのとき，同じ品詞の訳語が一つの場合は，その訳語を選択する.複数の場合は、優先順位で候補を選択したり、あるいは任意の 1個の候補を選択する。

[0064] 例えば、中国語の「美国」から、日本語の「米国」、「アメリカ」への翻訳を例にすると、中国対訳辞書には、「美国」についての 2つのレコード 320、 322力生成され、それらがポインタにて関連付けされている。日本語対訳辞書には、「米国」についてのレコード 330と「アメリカ」についてのレコード 332が生成されている。 [美国]のレコード 32 0は、「アメリカ」の訳語情報を含み、「美国」のレコード 322は、「米国」の訳語情報を含む。

[0065] 日本語の「アメリカ」、「米国」のレコード 330、 332は、破線で示すように、「美国」の訳語情報、すなわち「美国」を参照するように関連付けされている。

[0066] 次に、他の単語情報レコードの格納方法について説明する。上記した図 13に示す例では、同一のレコードを複数用いるため、メモリ容量が大きくなる。そこで、メモリ空間を節約するために、他の格納方法は、単語 kの情報レコードを一用い、その単語 k の情報レコードから、多義語情報配列内の複数の訳語情報をそれぞれ含む複数のレコードを識別するようにし、多義語情報配列に最小限の訳語情報を記録する。図 1 4に示すように、第 1言語の単語 kの情報レコードと多義語情報配列とを用意する。多義語情報配列のレコードは、例えば、品詞 1の訳語 2、品詞 1の訳語 3、品詞 2の訳語 1等の情報を含んでいる。多義語情報配列のレコードは、最小限の訳語情報として、優先順位、概念、言語、訳語、および次の多義語情報レコード指針を含んでいる。 [0067] 例えば図 14に示すように、中国語の「美国」から日本語の訳語を検索する場合、「美国」の単語情報レコード 320が作成され、さらに多義語情報配列に含まれるレコード 324が作成される。レコード 320によって、「米国」が参照され、多義語情報配列のレコード 324によって「アメリカ」が参照される。

[0068] 次に、単語の選択ルールについて説明する。好ましくは、名詞、代名詞、形容詞、副詞、動詞、専門用語だけ翻訳する。対訳の関係が、 1対 1の場合は、一義的に対応する訳語を選択する。一方、 1対 nの場合 (η> 1)は、 n個の訳語の品詞属性を比較して、原言語の単語の品詞が同じ品詞のものから順に候補を選択したり、あるいは任意の 1個の候補を選択する。

[0069] 図 15は、単語翻訳装置の動作を説明するフローチャートである。まず、原言語のテキスト文を解析した単語またはユーザにより特定された単語が入力されると (ステップ S101)、 CPU38は、原言語の種類を特定する（ステップ S 102)。次に、 CPU38は、特定された言語種に該当する訳語辞書のトライ構造を選択し (ステップ S103)、そのトライ構造に格納された単語と入力された単語との照合を行う (ステップ S104)。 CP U38は、トライ構造内に単語が存在するとき (ステップ S105)、当該単語についての単語情報レコードを参照し (ステップ S106)、単語情報レコードで参照される目的言語のトライ構造力も訳語を抽出する (ステップ S107)。抽出された訳語は、目的言語テキスト文作成部 22によってディスプレイ上に表示される (ステップ S108)。

[0070] 一方、入力された単語が存在しないとき (ステップ S 105)、翻訳失敗の表示が出力される。この場合、翻訳者によって、入力された単語に適切な訳語が付与され、これが訳語辞書に登録され、学習機能が与えられる (ステップ S 108)。

[0071] 次に本発明の第 2の実施例について説明する。第 2の実施例は、マルチリンガル、すなわち N力国言語間の単語翻訳を可能にするもので、その対訳辞書の構成を図 1 6に示す。同図に示すように、第 1言語のトライ構造 400、第 2言語のトライ構造 500、および第 N言語のトライ構造 600を作成し、各言語の単語検索トライを記憶する。同時に、各トライ構造と対となるベぐ第 1言語の単語情報レコード 410、第 2言語の単語情報レコード 510、および第 N言語の単語情報レコード 610を作成する。

[0072] 単語情報レコードには、複数の言語への対訳情報が混在されている。例えば、日本語の単語情報レコードには、英語の訳語情報を記録するレコードと、中国語の訳語情報を記録するレコードが含まれている。これにより、日本語の単語から、英語または中国語の訳語を検索することができる。英語または中国語の、ずれかを検索するかは、ユーザの指示に応じて行うことができる。また、英語から日本語および中国語から日本語への単語翻訳も可能である。単語情報レコードの格納方法は、上記した図 13に示す方法または図 14に示す方法の、ずれを用いることも可能である。

[0073] このように各言語毎に単語検索トライと単語情報レコードを作成することで、複数言語間において単語翻訳を双方向で行うことができ、より利便性を高めることができる。

[0074] 次に、第 3実施例について説明する。図 17は、第 3実施例において用いられる N力国言語単語対訳辞書 300の構造を示す図である。 N力国言語単語対訳辞書 300は、第 1言語乃至第 N言語のそれぞれに対応する第 1言語単語検索辞書 312— 1乃至第 N言語単語検索辞書 312— N (以下、これら第 1言語単語検索辞書 312— 1乃至第 N言語単語検索辞書 312— Nをまとめて、適宜「単語検索辞書 312」と称する)と、第 1言語乃至第 N言語のそれぞれに対応する第 1言語単語訳語リンク情報 314— 1 乃至第 N言語単語訳語リンク情報 314— N (以下、これら第 1言語単語訳語リンク情報 314— 1乃至第 N言語単語訳語リンク情報 314— Nをまとめて、適宜「単語訳語リンク情報 314」と称する）とによって構成される。

[0075] 単語検索辞書 312は、トライ構造ベース又はノ、ッシュ (Hash)関数ベースの構成となっている。一方、単語訳語リンク情報 314は、対応する一の言語の単語と他の言語における訳語との関連付けを表すものであり、単語情報レコードによって構成される単語情報配列表のみを有する配列構造ベースの構成、又は、単語情報レコードによつて構成される単語情報配列表と多義語情報レコードによって構成される多義語配列表とを有する二重配列構造ベースの構成となっている。

[0076] 図 18は、 N力国言語単語対訳辞書 300の第 1の構成の概念図である。図 18は、単語検索辞書がトライ構造ベースである場合を示す。 2言語相互間での翻訳が行われる場合、第 1言語の単語検索辞書は、第 1言語の単語検索トライ構造（「第 1のトライ構造)を有し、第 1言語の単語訳語リンク情報は、第 1のトライ構造に含まれる各単語の情報 (単語情報レコード）により構成され、その単語情報レコードは第 2言語における訳語との関連付けを表すポインタを含んでいる。同様に、第 2言語の単語検索辞書は、第 2言語の単語検索トライ構造 (第 2のトライ構造)を有し、第 2言語の単語訳語リンク情報は、第 2のトライ構造に含まれる各単語の情報 (単語情報レコード）により構成され、その単語情報レコードには第 1言語における訳語との関連付けを表すポインタを含んでいる。図 18では、第 1言語の単語 kと第 2言語の単語 h+ 1とが単語と訳語の関係にあり、これらの関連付けがなされている。更には、ある単語の品詞が複数存在し、更にある品詞の訳語が複数存在する場合には、その単語に対応する単語情報レコードが品詞毎且つ訳語毎に複数用意され、これら複数の単語情報レコードの間は、単語情報レコードに含まれるポインタによって関連付けがなされる。

[0077] 図 19は、 N力国言語単語対訳辞書 300の第 2の構成の概念図である。図 6は、単語検索辞書カ、ッシュ関数ベースであり、単語訳語リンク情報が配列構造ベースである。

[0078] ノ、ッシュ関数ベースでは、 2言語相互間での翻訳が行われる場合、第 1言語の単語検索辞書は、第 1言語の単語とその単語に対応する単語訳語情報辞書の単語情報レコードへの指針 (ポインタ)情報を含む単語リストを有する。同様に、第 ₂言語の単語検索辞書は、第 2言語の単語とその単語に対応する単語訳語情報辞書の単語情報レコードへの指針 (ポインタ)情報を含む単語リストを有する。第 1言語及び第 2言語の単語訳語リンク情報は、図 18と同様であるので、その説明は省略する。また、ハッシュ関数部 320の詳細については後述する。

[0079] 図 20は、ノ、ッシュ関数ベースでの単語検索辞書の詳細な構成を示す図である。ハッシュ関数部 320は、対応する言語の全ての文字コードを連続する文字コードに変換するものである。第 1文字表は、ノ、ッシュ関数部 320によって文字コードが変換された文字である単語の第 1文字の情報、その第 1文字から開始する単語の数、その第 1文字から開始する単語に対応する単語リスト内のレコードへの指針 (ポインタ)情報を含む。単語リストは、その単語の情報、単語発音情報、その単語に対応する単語訳語リンク情報内の単語情報のレコード IDを含む。

[0080] 単語翻訳の際、単語直訳翻訳エンジン 20は、入力した単語の第 1文字に対応する第 1文字表内のレコードを特定する。次に、単語直訳翻訳エンジン 20は、特定したレコード内の単語の数と、単語リストへのポインタ情報とに基づいて、入力した単語の第

1文字から開始する単語に対応する単語リスト内のレコードを特定する。更に、単語直訳翻訳エンジン 20は、入力した単語とその特定した全てのレコード内の単語情報とを照合し、入力した単語を特定する。

[0081] 次に、単語直訳翻訳エンジン 20による単語翻訳の実施例について説明する。以下において、単語言語リンク情報に配列構造ベースが採用される場合における、単語情報レコードは、図 21 (a)に示す構造を有しており、単語情報レコードの IDによって一意に特定され、対応する単語の単語 ID、発音、品詞、優先順位、多義性情報、単語 ZChunk識別フラグ、領域分類 ID、概念 ID、左連結情報 ID、右連結情報 I D、訳語言語 ID、訳語情報レコード ID、次の多義語情報レコード ID、および説明を含んでいる。なお、次の多義語に対応する単語情報レコードが存在しない場合には、次の多義語情報レコード IDは「0」となる。また、訳語言語 IDは、図 21 (b)に示す言語 IDと図 21 (c)に示す子供フラグを有する。これらは、上述した図 8における言語 ID 及び子供フラグと同様である。

[0082] 一方、単語言語リンク情報に二重配列構造ベースが採用される場合における、単語情報レコードは、図 22に示す構造を有しており、単語情報レコードの IDによって一意に特定され、対応する単語の単語 ID、発音、品詞、優先順位、多義性情報、単語 ZChunk識別フラグ、領域分類 ID、概念 ID、左連結情報 ID、右連結情報 ID、多義語情報レコード ID、および説明を含んでいる。また、単語言語リンク情報に二重配列構造ベースが採用される場合における、多義語情報レコードは、図 23に示す構造を有しており、多義語情報レコードの IDによって一意に特定され、訳語の言語 ID、親である単語情報レコードの ID、訳語の多義語情報レコードの ID、次の多義語の多義語情報レコードの IDを有する。なお、次の多義語に対応する多義語情報レコードが存在しない場合には、次の多義語の多義語情報レコードの IDは「0」となる。

[0083] 図 24は、単語訳語リンク情報に配列構造ベースが採用される場合における、日本語と中国語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。日本語の単語検索辞書内のトライ構造には、「アメリカ」とその同義語「米国」という単語が格納されている。一方、中国語の単語検索辞書内のトライ構造には、「アメリカ」の中国語訳である「美利加合衆国」とその同義語「米国」の中国語訳である「美国」という単語が格納されている。なお、「美利加¹^合衆国」は、下記中国語を意味している。

外 1

^[0084] 美利坚合众国

[0085] この場合、日本語の単語訳語リンク情報には、単語「アメリカ」に対応する単語情報レコード ID330の単語情報レコードと単語情報レコード ID333の単語情報レコードとが含まれ、単語「米国」に対応する単語情報レコード ID444の単語情報レコードと単語情報レコード ID451の単語情報レコードとが含まれる。

[0086] 一方、中国語の単語訳語リンク情報には、単語「美利加合衆国」に対応する単語情報レコード ID100の単語情報レコードと単語情報レコード ID101の単語情報レコードとが含まれ、単語「美国」に対応する単語情報レコード ID400の単語情報レコードと単語情報レコード ID541の単語情報レコードとが含まれる。なお、日本語の単語「アメリカ」の訳語である中国語の単語は「美利加合衆国」、日本語の単語「米国」の訳語である中国語の単語は「美国」であり、「アメリカ」と「米国」は同義語であり、「美利加合衆国」と「美国」は同義語である。

[0087] 日本語の単語訳語リンク情報における ID330の単語情報レコードは、対応する単語「アメリカ」の単語 ID「5」、訳語である中国語の言語 ID「2」、訳語である中国語の単語「美利加合衆国」に対応する単語情報レコードの ID「100」、及び、次の多義語に対応する単語情報レコードの ID「333」を有する。また、日本語の単語訳語リンク情報における ID333の単語情報レコードは、対応する単語「アメリカ」の単語 ID「5」、訳語である中国語の言語 ID「2」、訳語である中国語の単語「美利加¹^合衆国」の多義語「美国」、換言すれば、単語「アメリカ」の多義語「米国」の訳語である中国語の単語「美国」に対応する単語情報レコードの ID「541」、次の多義語に対応する単語情報レコードが存在しな!ヽことを示す「0」を有する。

[0088] また、日本語の単語訳語リンク情報における ID444の単語情報レコードは、対応する単語「米国」の単語 ID「7」、訳語である中国語の言語 ID「2」、訳語である中国語の単語「美国」に対応する単語情報レコードの ID「400」、及び、次の多義語に対応する単語情報レコードの ID「451」を有する。また、日本語の単語訳語リンク情報における ID451の単語情報レコードは、対応する単語「米国」の単語 ID「7」、訳語である中国語の言語 ID「2」、訳語である中国語の単語「美国」の多義語「美利加合 T衆 ▲国」、換言すれば、単語「米国」の多義語「アメリカ」の訳語である中国語の単語「美利加合衆国」に対応する単語情報レコードの ID「101」、次の多義語に対応する単語情報レコードが存在しな！ヽことを示す「0」を有する。

[0089] 一方、中国語の単語訳語リンク情報における ID100の単語情報レコードは、対応する単語卩美利加合衆国の単語訳語でぁる日本語の言語 ^」、訳語である日本語の単語「アメリカ」に対応する単語情報レコードの ID「330」、及び、次の多義語に対応する単語情報レコードの ID「101」を有する。また、中国語の単語訳語リンク情報における ID101の単語情報レコードは、対応する単語「美利▲ 加合衆国の単語訳語でぁる日本語の言語 ^ 訳語でぁる日本語の単語「米国」の多義語「アメリカ」、換言すれば、単語「美利加合衆国」の多義語「美国」の訳語である日本語の単語「米国」に対応する単語情報レコードの I D「451」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。

[0090] また、中国語の単語訳語リンク情報における ID400の単語情報レコードは、対応する単語「美国」の単語10「9」、訳語でぁる日本語の言語10「1」、訳語である日本語の単語「米国」に対応する単語情報レコードの ID「444」、及び、次の多義語に対応する単語情報レコードの ID「541」を有する。また、中国語の単語訳語リンク情報における ID541の単語情報レコードは、対応する単語「美国」の単語 ID「7」、訳語である日本語の言語 ID「1」、訳語である日本語の単語「米国」の多義語「アメリカ」、換言すれば、単語「美国」の多義語「美利加合衆国」の訳語である日本語の単語「ァメリ力」に対応する単語情報レコードの ID「333」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。

[0091] このように、日本語及び中国語の単語訳語リンク情報によって、日本語の単語と中国語の単語との関連付けがなされる。単語直訳翻訳エンジン 20は、中国語の単語「美利加合衆国」を日本語に翻訳する場合、中国語の単語訳語リンク情報における単語「美利加¹^合国」の単語 ID「7」と日本語の言語 ID「1」を含む ID

100の単語情報レコードを特定する。次に、単語直訳翻訳エンジン 20は、 ID100の単語情報レコードに含まれる、次の多義語に対応する単語情報レコードの ID「101」の単語情報レコードを特定する。更に、単語直訳翻訳エンジン 20は、 ID100の単語情報レコードに含まれる訳語である日本語の単語に対応する単語情報レコードの ID 「330」により日本語の単語訳語リンク情報における ID330の単語情報レコードを特定するとともに、 ID101の単語情報レコードに含まれる訳語である日本語の単語に対応する単語情報レコードの ID「451」により日本語の単語訳語リンク情報における ID 451の単語情報レコードを特定する。そして、単語直訳翻訳エンジン 20は、 ID330 の単語情報レコードに含まれる単語 ID「5」によって日本語の単語検索辞書における単語「アメリカ」を抽出するとともに、 ID451の単語情報レコードに含まれる単語 ID「7 」によって日本語の単語検索辞書における単語「米国」を抽出する。このような処理によって、中国語の単語「美利加合衆国」は日本語の単語「アメリカ」及び「米国」に翻訳される。

[0092] 図 25は、単語訳語リンク情報に二重配列構造ベースが採用される場合における、日本語と中国語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。日本語及び中国語の単語検索辞書内のトライ構造は、図 23と同様であるので、その説明は省略する。

[0093] 日本語の単語訳語リンク情報には、単語「アメリカ」に対応する単語情報レコード ID 330の単語情報レコードと、単語「米国」に対応する単語情報レコード ID444の単語情報レコードが含まれる。更に、日本語の単語訳語リンク情報には、 ID330の単語情報レコードを親とする ID01及び 02の多義語情報レコードと、 ID333の単語情報レコードを親とする ID14及び 15の多義語情報レコードとが含まれる。

[0094] 一方、中国語の単語訳語リンク情報には、単語「美利加合衆国」に対応する単語情報レコード ID100の単語情報レコードと、単語「美国」に対応する単語情報レコード ID211の単語情報レコードとが含まれる。更に、中国語の単語訳語リンク情報には、 ID100の単語情報レコードを親とする ID04及び 05の多義語情報レコードと、 ID211の単語情報レコードを親とする ID214及び 215の多義語情報レコードとが含まれる。

[0095] 日本語の単語訳語リンク情報における ID330の単語情報レコードは、対応する単語「アメリカ」の単語 ID「5」、子である多義語情報レコードの ID「01」を有する。 ID01 の多義語情報レコードは、訳語である中国語の言語 ID「2」、親である単語情報レコードの ID「330」、訳語である中国語の単語の多義語「美国」に対応する単語情報レコードの子である多義語情報レコードの ID「214」、次の多義語に対応する多義語情報レコードの ID「02」を有する。また、 ID02の多義語情報レコードは、訳語である中国語の言語 ID「2」、親である単語情報レコードの ID「330」、訳語である中国語の単語「美利加合衆国」に対応する単語情報レコードの子である多義語情報レコードの ID「05」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。

[0096] また、日本語の単語訳語リンク情報における ID333の単語情報レコードは、対応する単語「米国」の単語 ID「7」、子である多義語情報レコードの ID「15」を有する。 ID1 5の多義語情報レコードは、訳語である中国語の言語 ID「2」、親である単語情報レコードの ID「333」、訳語である中国語の単語の多義語「美利加¹^合衆国」に対応する単語情報レコードの子である多義語情報レコードの ID「04」、次の多義語に対応する多義語情報レコードの ID「15」を有する。また、 ID15の多義語情報レコードは、訳語である中国語の言語 ID「2」、親である単語情報レコードの ID「333」、訳語である中国語の単語「美国」に対応する単語情報レコードの子である多義語情報レコードの ID「215」、次の多義語に対応する多義語情報レコードが存在しないことを示す「 0」を有する。

[0097] 一方、中国語の単語訳語リンク情報における ID100の単語情報レコードは、対応する単語「美利加合衆国」の単語 ID「7」、子である多義語情報レコードの I D「04」を有する。 ID04の多義語情報レコードは、訳語である日本語の言語 ID「1」、親である単語情報レコードの ID「100」、訳語である日本語の単語の多義語「米国」に対応する単語情報レコードの子である多義語情報レコードの ID「14」、次の多義語に対応する多義語情報レコードの ID「05」を有する。また、 ID05の多義語情報レコードは、訳語である日本語の言語 ID「1」、親である単語情報レコードの ID「100」、訳語である日本語の単語「アメリカ」に対応する単語情報レコードの子である多義語情報レコードの ID「02」、次の多義語に対応する多義語情報レコードが存在しな、ことを示す「0」を有する。

[0098] また、中国語の単語訳語リンク情報における ID211の単語情報レコードは、対応する単語「美国」の単語 ID「9」、子である多義語情報レコードの ID「214」を有する。 ID 214の多義語情報レコードは、訳語である日本語の言語 ID「1」、親である単語情報レコードの ID「211」、訳語である日本語の単語の多義語「アメリカ」に対応する単語情報レコードの子である多義語情報レコードの ID「01」、次の多義語に対応する多義語情報レコードの ID「215」を有する。また、 ID215の多義語情報レコードは、訳語である日本語の言語 ID「1」、親である単語情報レコードの ID「211」、訳語である日本語の単語「米国」に対応する単語情報レコードの子である多義語情報レコードの ID「 15」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。

[0099] このように、日本語及び中国語の単語訳語リンク情報によって、日本語の単語と中国語の単語との関連付けがなされる。単語直訳翻訳エンジン 20は、中国語の単語「美利加合衆国」を日本語に翻訳する場合、中国語の単語訳語リンク情報における単語「美利加¹^合国」の単語 ID「7」を含む ID100の単語情報レコードを特定する。次に、単語直訳翻訳エンジン 20は、 ID100の単語情報レコードに含まれる、多義語情報レコードの ID「04」により ID04の多義語情報レコードを特定する。更に、単語直訳翻訳エンジン 20は、 ID04の多義語情報レコードに含まれる、次の多義語に対応する多義語情報レコードの ID「05」により ID05の多義語情報レコードを特定する。そして、単語直訳翻訳エンジン 20は、特定した ID04及び ID05の多義語情報レコードに含まれる、訳語である日本語の単語に対応する単語情報レコードの子である多義語情報レコードの ID「02」及び「14」により、日本語の単語に対応する単語情報レコードの子である ID02及び ID04の多義語情報レコードを特定する。次に、単語直訳翻訳エンジン 20は、特定した ID02及び ID04の多義語情報レコードに含まれる、親である単語情報レコードの ID「330」及び ID「333」により ID330及び I D333の単語情報レコードを特定する。そして、単語直訳翻訳エンジン 20は、 ID33 0の単語情報レコードに含まれる単語 ID「5」によって日本語の単語検索辞書における単語「アメリカ」を抽出するとともに、 ID451の単語情報レコードに含まれる単語 ID「 7」によって日本語の単語検索辞書における単語「米国」を抽出する。このような処理によって、中国語の単語「美利加合衆国」は日本語の単語「アメリカ」及び「米国」に翻訳される。

[0100] 図 26は、単語訳語リンク情報に配列構造ベースが採用される場合における、単語直訳翻訳エンジン 20による日本語と英語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。日本語の単語検索辞書内のトライ構造には、「アメリカ」とその同義語「米国」という単語が格納されている。一方、英語の単語検索辞書内のトライ構造には、「アメリカ」の英語訳である「Ameri_ca」とその同義語「米国」の英語訳である「USA」 t 、う単語が格納されて、る。

[0101] この場合、日本語の単語訳語リンク情報には、単語「アメリカ」に対応する単語情報レコード ID340の単語情報レコードと単語情報レコード ID343の単語情報レコードとが含まれ、単語「米国」に対応する単語情報レコード ID464の単語情報レコードと単語情報レコード ID471の単語情報レコードとが含まれる。

[0102] 一方、英語の単語訳語リンク情報には、単語「Ameri_ca」に対応する単語情報レコード ID200の単語情報レコードと単語情報レコード ID201の単語情報レコードとが含まれ、単語「USA」に対応する単語情報レコード ID500の単語情報レコードと単語情報レコード ID641の単語情報レコードとが含まれる。なお、日本語の単語「アメリカ」の訳語である英語の単語は「America」、日本語の単語「米国」の訳語である英語の単語は「USA」であり、「アメリカ」と「米国」は同義語であり、「八11161^&」と「1；3八」は同義語である。

[0103] 日本語の単語訳語リンク情報における ID330の単語情報レコードは、対応する単語「アメリカ」の単語 ID「5」、訳語である英語の言語 ID「3」、訳語である英語の単語「 Americajに対応する単語情報レコードの ID「200」、及び、次の多義語に対応する単語情報レコードの ID「343」を有する。また、日本語の単語訳語リンク情報における ID343の単語情報レコードは、対応する単語「アメリカ」の単語 ID「5」、訳語である英語の言語10「3」、訳語でぁる英語の単語「八11½ &」の多義語「1；3八」、換言すれば、単語「アメリカ」の多義語「米国」の訳語である英語の単語「USA」に対応する単語情報レコードの ID「641」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。

[0104] また、日本語の単語訳語リンク情報における ID464の単語情報レコードは、対応する単語「米国」の単語 ID「7」、訳語である英語の言語 ID「3」、訳語である英語の単語「USA」に対応する単語情報レコードの ID「500」、及び、次の多義語に対応する単語情報レコードの ID「471」を有する。また、日本語の単語訳語リンク情報における I D471の単語情報レコードは、対応する単語「米国」の単語 ID「7」、訳語である英語の言語10「3」、訳語でぁる英語の単語「113八」の多義語「八1!½1^&」、換言すれば、単語「米国」の多義語「アメリカ」の訳語である英語の単語「Ameri_ca」に対応する単語情報レコードの ID「201」、次の多義語に対応する単語情報レコードが存在しないことを示す「0」を有する。

[0105] 一方、英語の単語訳語リンク情報における ID200の単語情報レコードは、対応する単語「America」の単語 ID「8」、訳語である日本語の言語 ID「1」、訳語である日本語の単語「アメリカ」に対応する単語情報レコードの ID「340」、及び、次の多義語に対応する単語情報レコードの ID「201」を有する。また、英語の単語訳語リンク情報における ID201の単語情報レコードは、対応する単語「八11½1^&」の単語10「8」、訳語である日本語の言語 ID「1」、訳語である日本語の単語「米国」の多義語「アメリカ」、換言すれば、単語「America」の多義語「USA」の訳語である日本語の単語「米国」に対応する単語情報レコードの ID「471」、次の多義語に対応する単語情報レコードが存在しな!ヽことを示す「0」を有する。

[0106] また、英語の単語訳語リンク情報における ID500の単語情報レコードは、対応する単語「USA」の単語 ID「11」、訳語である日本語の言語 ID「1」、訳語である日本語の単語「米国」に対応する単語情報レコードの ID「464」、及び、次の多義語に対応する単語情報レコードの ID「641」を有する。また、英語の単語訳語リンク情報における ID641の単語情報レコードは、対応する単語「USA」の単語 ID「11」、訳語である日本語の言語 ID「1」、訳語である日本語の単語「米国」の多義語「アメリカ」、換言すれば、単語「USA」の多義語「America」の訳語である日本語の単語「アメリカ」に対応する単語情報レコードの ID「343」、次の多義語に対応する単語情報レコードが存在しな!/ヽことを示す「0」を有する。

[0107] このように、日本語及び英語の単語訳語リンク情報によって、日本語の単語と英語の単語との関連付けがなされる。単語直訳翻訳エンジン 20は、英語の単語「Americ a」を日本語に翻訳する場合、英語の単語訳語リンク情報における単語「Ameri_ca」の単語 ID「8」と日本語の言語 ID「1」を含む ID200の単語情報レコードを特定する。次に、単語直訳翻訳エンジン 20は、 ID200の単語情報レコードに含まれる、次の多義語に対応する単語情報レコードの ID「 201」の単語情報レコードを特定する。更に、単語直訳翻訳エンジン 20は、 ID200の単語情報レコードに含まれる訳語である日本語の単語に対応する単語情報レコードの ID「340」により日本語の単語訳語リンク情報における ID340の単語情報レコードを特定するとともに、 ID201の単語情報レコードに含まれる訳語である日本語の単語に対応する単語情報レコードの ID「471」により日本語の単語訳語リンク情報における ID471の単語情報レコードを特定する。そして、単語直訳翻訳エンジン 20は、 ID340の単語情報レコードに含まれる単語 ID 「5」によって日本語の単語検索辞書における単語「アメリカ」を抽出するとともに、 ID 471の単語情報レコードに含まれる単語 ID「7」によって日本語の単語検索辞書における単語「米国」を抽出する。このような処理によって、英語の単語「America」は日本語の単語「アメリカ」及び「米国」に翻訳される。

[0108] 図 27は、単語訳語リンク情報に二重配列構造ベースが採用される場合における、単語直訳翻訳エンジン 20による日本語と英語の間での単語翻訳に用いられる対訳辞書の構造を示す図である。日本語及び英語の単語検索辞書内のトライ構造は、図 23と同様であるので、その説明は省略する。

[0109] 日本語の単語訳語リンク情報には、単語「アメリカ」に対応する単語情報レコード ID 331の単語情報レコードと、単語「米国」に対応する単語情報レコード ID334の単語情報レコードが含まれる。更に、日本語の単語訳語リンク情報には、 ID331の単語情報レコードを親とする ID03及び 04の多義語情報レコードと、 ID334の単語情報レコードを親とする ID16及び 17の多義語情報レコードとが含まれる。 [0110] 一方、英語の単語訳語リンク情報には、単語「Ameri_ca」に対応する単語情報レコード ID101の単語情報レコードと、単語「USA」に対応する単語情報レコード ID212 の単語情報レコードとが含まれる。更に、英語の単語訳語リンク情報には、 ID101の単語情報レコードを親とする ID06及び 07の多義語情報レコードと、 ID212の単語情報レコードを親とする ID216及び 217の多義語情報レコードとが含まれる。

[0111] 日本語の単語訳語リンク情報における ID331の単語情報レコードは、対応する単語「アメリカ」の単語 ID「5」、子である多義語情報レコードの ID「03」を有する。 ID03 の多義語情報レコードは、訳語である英語の言語 ID「3」、親である単語情報レコードの10「331」、訳語でぁる英語の単語の多義語「1；3八」に対応する単語情報レコードの子である多義語情報レコードの ID「216」、次の多義語に対応する多義語情報レコードの ID「04」を有する。また、 ID04の多義語情報レコードは、訳語である英語の言語 ID「3」、親である単語情報レコードの ID「331」、訳語である英語の単語「Americ ajに対応する単語情報レコードの子である多義語情報レコードの ID「07」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。

[0112] また、日本語の単語訳語リンク情報における ID334の単語情報レコードは、対応する単語「米国」の単語 ID「7」、子である多義語情報レコードの ID「16」を有する。 ID1 6の多義語情報レコードは、訳語である英語の言語 ID「3」、親である単語情報レコードの10「334」、訳語でぁる英語の単語の多義語「八1^1： _&」に対応する単語情報レコードの子である多義語情報レコードの ID「06」、次の多義語に対応する多義語情報レコードの ID「17」を有する。また、 ID17の多義語情報レコードは、訳語である英語の言語 ID「3」、親である単語情報レコードの ID「334」、訳語である英語の単語「U SAJに対応する単語情報レコードの子である多義語情報レコードの ID「217」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。

[0113] 一方、英語の単語訳語リンク情報における ID101の単語情報レコードは、対応する単語「America」の単語 ID「8」、子である多義語情報レコードの ID「06」を有する。 I D06の多義語情報レコードは、訳語である日本語の言語 ID「1」、親である単語情報レコードの ID「101」、訳語である日本語の単語の多義語「米国」に対応する単語情報レコードの子である多義語情報レコードの ID「16」、次の多義語に対応する多義語情報レコードの ID「07」を有する。また、 ID07の多義語情報レコードは、訳語である日本語の言語 ID「1」、親である単語情報レコードの ID「101」、訳語である日本語の単語「アメリカ」に対応する単語情報レコードの子である多義語情報レコードの ID「04 」、次の多義語に対応する多義語情報レコードが存在しな、ことを示す「0」を有する

[0114] また、英語の単語訳語リンク情報における ID212の単語情報レコードは、対応する単語「USA」の単語 ID「11」、子である多義語情報レコードの ID「216」を有する。 ID 216の多義語情報レコードは、訳語である日本語の言語 ID「1」、親である単語情報レコードの ID「212」、訳語である日本語の単語の多義語「アメリカ」に対応する単語情報レコードの子である多義語情報レコードの ID「03」、次の多義語に対応する多義語情報レコードの ID「217」を有する。また、 ID217の多義語情報レコードは、訳語である日本語の言語 ID「1」、親である単語情報レコードの ID「212」、訳語である日本語の単語「米国」に対応する単語情報レコードの子である多義語情報レコードの ID「 17」、次の多義語に対応する多義語情報レコードが存在しないことを示す「0」を有する。

[0115] このように、日本語及び英語の単語訳語リンク情報によって、日本語の単語と英語の単語との関連付けがなされる。単語直訳翻訳エンジン 20は、英語の単語「Americ a」を日本語に翻訳する場合、英語の単語訳語リンク情報における単語「Ameri_ca」の単語 ID「7」を含む ID101の単語情報レコードを特定する。次に、単語直訳翻訳ェンジン 20は、 ID101の単語情報レコードに含まれる、多義語情報レコードの ID「06」により ID06の多義語情報レコードを特定する。更に、単語直訳翻訳エンジン 20は、 I D06の多義語情報レコードに含まれる、次の多義語に対応する多義語情報レコードの ID「07」により ID07の多義語情報レコードを特定する。そして、単語直訳翻訳ェンジン 20は、特定した ID06及び ID07の多義語情報レコードに含まれる、訳語である日本語の単語に対応する単語情報レコードの子である多義語情報レコードの ID「04 」及び「16」により、日本語の単語に対応する単語情報レコードの子である ID04及び ID16の多義語情報レコードを特定する。次に、単語直訳翻訳エンジン 20は、特定した ID04及び ID06の多義語情報レコードに含まれる、親である単語情報レコードの I D「331」及び ID「334」により ID331及び ID334の単語情報レコードを特定する。そして、単語直訳翻訳エンジン 20は、 ID331の単語情報レコードに含まれる単語 ID「5 」によって日本語の単語検索辞書における単語「アメリカ」を抽出するとともに、 ID33 4の単語情報レコードに含まれる単語 ID「7」によって日本語の単語検索辞書における単語「米国」を抽出する。このような処理によって、英語の単語「America」は日本語の単語「アメリカ」及び「米国」に翻訳される。

[0116] 単語直訳翻訳エンジン 20は、上述した翻訳により得られた訳語を目的言語テキスト文作成部 22へ出力する。なお、訳語が複数存在する場合には、単語直訳翻訳ェンジン 20は、翻訳対象の単語の品詞属性と訳語の品詞属性とを比較して、訳語のうち、翻訳対象の単語と品詞属性が同一のもののみを選択して出力するようにしてもよい。更に、翻訳対象の単語と品詞属性が同一の訳語が複数存在する場合には、単語直訳翻訳エンジン 20は、任意の 1つを選択して出力するようにしてもよい。また、翻訳結果の単語が存在しない場合には、単語直訳翻訳エンジン 20は、翻訳対象の単語をそのまま目的言語テキスト文作成部 22へ出力する。また、単語直訳翻訳エンジン 2 0は、入力した単語と訳語に基づいて、外部の知識データベース（図示せず)から統計情報、文法上放蕩の各種情報を取得することが可能である。

[0117] このように、単語訳語リンク情報によって一の言語の単語と他の言語における訳語との関連付けがなされるため、 2言語間又は複数言語間において双方向の翻訳が可能となる。

[0118] 以上、本発明の好ましい実施の形態について詳述したが、本発明に係る特定の実施形態に限定されるものではなぐ特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形 ·変更が可能である。

産業上の利用可能性

[0119] 本発明に係る単語翻訳装置は、翻訳メモリエンジン、パターンベース翻訳エンジン、チャンクベース翻訳エンジン、解析ベース翻訳エンジンを補完するように用いたり（図 1を参照）、あるいは、翻訳エンジン、パターンベース翻訳エンジン、チャンクベース翻訳エンジンのいずれかと組み合わせて用いたり、または単体として構成してもよい。さらに、単語翻訳装置は、その機能を実行するソフトウェアをコンピュータに搭載させたり、あるいは携帯用もしくはポータブル用の電子辞書として利用することもできる。

Claims

請求の範囲

[1] 複数言語間において単語の翻訳を行う単語翻訳装置であって、

少なくとも、第 1の言語の単語を検索するための第 1の単語検索構造、第 2の言語の単語を検索するための第 2の単語検索構造、第 1の単語検索構造に格納された単語についての単語関連情報と訳語情報を含む第 1の単語'訳語情報レコード、および第 2の単語検索構造に格納された単語についての単語関連情報と訳語情報を含む第 2の単語情報レコードを辞書に記憶する記憶手段を備えた、単語翻訳装置。

[2] 第 1、第 2の単語検索構造は、単語'訳語情報レコードを識別するための単語'訳語情報レコード識別情報を含む、請求項 1に記載の単語翻訳装置。

[3] 第 1、第 2の単語'訳語情報レコードは、それぞれ第 1、第 2の単語検索構造に含まれる単語を識別する単語識別情報を含む、請求項 1に記載の単語翻訳装置。

[4] 第 1、第 2の単語'訳語情報レコードは、それぞれ第 1、第 2の単語検索構造に含まれる単語の関連情報を含む、請求項 1に記載の単語翻訳装置。

[5] 第 1の単語'訳語情報レコードは、第 2の単語'訳語情報レコードに含まれる訳語情報を識別するための訳語識別情報を含み、第 2の単語'訳語情報レコードは、第 1の単語'訳語情報レコードに含まれる訳語情報を識別するための訳語識別情報を含む

、請求項 1に記載の単語翻訳装置。

[6] 第 1、第 2の単語'訳語情報レコードは、訳語に関連する多義語を識別するための識別情報を含む、請求項 1ないし 4いずれか 1つに記載の単語翻訳装置。

[7] 第 1、第 2の単語'訳語情報レコードは、訳語の言語種を識別するための識別情報を含む、請求項 1ないし 5いずれか 1つに記載の単語翻訳装置。

[8] 第 1、第 2の単語'訳語情報レコードは、 1つの単語が複数の品詞を有する場合に、各品詞毎に，単語関連情報と訳語情報を記憶するレコードを有する、請求項 1ないし

3 ヽずれか 1つに記載の単語翻訳装置。

[9] 各品詞毎のレコードは、当該 1つの単語関連情報とポインタによって関連付けされている、請求項 8に記載の単語翻訳装置。

[10] 単語翻訳装置はさらに、単語を入力する入力手段と、入力された単語を第 1の単語検索構造に格納された単語と照合する照合手段と、照合された単語についての第 1 の単語情報レコードに基づき第 2の単語検索構造に格納された訳語を抽出する抽出手段と、抽出された訳語を出力する出力手段と、を有する請求項 1ないし 9いずれ力ゝ 1つに記載の単語翻訳装置。

[11] 前記抽出手段は、前記照合手段により照合された単語についての第 1の単語情報レコードに基づき第 2の単語情報レコードを抽出する、請求項 10に記載の単語翻訳装置。

[12] 第 1の単語情報レコードの訳語情報は、第 2の単語検索構造に格納された訳語または第 2の単語情報レコードを識別するためのリンク情報を含み、前記抽出手段は、前記リンク情報に基づき前記訳語または第 2の単語情報レコードを抽出する、請求項 1 0または 11に記載の単語翻訳装置。

[13] 複数言語間において単語の翻訳を行う単語翻訳装置であって、

N力国言語 (Nは、 2以上の整数）についての単語検索構造と、 N力国言語の単語検索構造に対応する N力国言語の単語情報レコードとを辞書に記憶する記憶手段を含み、

N力国言語の単語情報レコードのうち所定言語の単語情報レコードは、所定単語につ、ての訳語を識別する訳語情報を複数言語にっ、て記憶する、単語翻訳装置

[14] 複数言語間において単語の翻訳を行う単語翻訳装置であって、

前記複数言語毎に設けられる単語検索辞書データと、

前記複数言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報と、を記憶する記憶手段を備えた、単語翻訳装置。

[15] 前記リンク情報は、

前記一の言語の単語の識別情報と、前記他の言語の識別情報と、前記他の言語における訳語に対応するリンク情報を指し示すポインタと、前記一の言語の単語に関連する多義語に対応するリンク情報を指し示すポインタとを含む、請求項 14に記載の単語翻訳装置。

[16] 前記リンク情報は、親リンク情報と子リンク情報とを有し、前記親リンク情報は、前記一の単語の識別情報と、前記一の単語に関連する多義語に対応する子リンク情報を指し示すポインタとを含み、

前記子リンク情報は、前記他の言語の識別情報と、対応する親リンク情報を指し示すポインタと、前記他の言語における訳語に対応する子リンク情報を指し示すポインタと、他の多義語に対応する子リンク情報を指し示すポインタとを含む、請求項 14に記載の単語翻訳装置。

[17] 前記単語が複数の品詞を有する場合、前記リンク情報は、前記品詞毎に設けられる、請求項 14ないし 16のいずれか 1つに記載の単語翻訳装置。

[18] 前記単語検索辞書データは、

前記複数言語毎に、単語を検索するための単語検索構造と単語に関する情報を記憶した単語情報レコードとを有する、請求項 14ないし 17のいずれか 1つに記載の単語翻訳装置。

[19] 前記単語情報レコードは、前記リンク情報を含むことを特徴とする請求項 18に記載の単語翻訳装置。

[20] 前記単語検索構造は、単語トライ構造またはハッシュ関数構造を含む、請求項 18〖こ記載の単語翻訳装置。

[21] 前記単語検索構造は、

対応する言語の単語の第 1文字のリスト情報と、前記単語のリスト情報とを有し、前記第 1文字リスト情報は、前記第 1文字の情報、前記第 1文字から始まる単語数、前記第 1文字力始まる単語のリスト情報における位置を指し示すポインタを含み、前記単語のリスト情報は、前記単語に対応するリンク情報を指し示すポインタを含む、請求項 14な、し 20の、ずれか 1つに記載の単語翻訳装置。

[22] 一の言語の単語を入力する入力手段と、

前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合手段と、

前記照合された一の言語の単語に対応するリンク情報に基づいて、他の言語に対応する単語検索辞書データ力前記他の言語における訳語を抽出する抽出手段とを有する、請求項 14なヽし 21のヽずれか 1つに記載の単語翻訳装置。

[23] 前記抽出手段は、前記照合手段により照合された一の言語の単語情報レコードのリンク情報に基づいて他の言語の単語情報レコードを抽出する、請求項 22に記載の単語翻訳装置。

[24] 前記抽出手段は、前記照合手段により照合された一の言語の単語情報レコードのリンク情報に基づいて他の言語の単語検索構造の訳語を抽出する、請求項 22に記載の単語翻訳装置。

[25] 文章を入力し、当該文章の翻訳を行う翻訳手段と、

翻訳手段によって翻訳できな力つた単語を入力し、当該単語の翻訳を行う請求項 1 な!、し 24の、ずれか 1つに記載の単語翻訳装置と、

を有する機械翻訳システム。

[26] 翻訳手段は、翻訳メモリエンジン、パターンベース翻訳エンジン、またはチャンクベース例文翻訳エンジンのいずれか 1つを含む、請求項 25に記載の機械翻訳システム。

[27] 機械翻訳システムはさらに、翻訳手段によって翻訳できな力つた単語についての訳語を、他の訳語と識別して出力する識別出力手段を含む、請求項 26に記載の機械翻訳システム。

[28] 複数言語間にお、て単語の翻訳を行う単語翻訳方法であって、

第 1の言語の単語を検索するための第 1の単語検索構造を記憶し、第 2の言語の単語を検索するための第 2の単語検索構造を作成し記憶し、第 1の単語検索構造に格納された単語についての訳語を識別するための第 1の訳語情報を含む第 1の単語情報レコードを記憶し、かつ第 2の単語検索構造に格納された単語についての訳語を識別するための第 2の訳語情報を含む第 2の単語情報レコードを辞書に記憶するステップを備えた、単語翻訳方法。

[29] 単語翻訳方法はさらに、単語を入力する入力ステップ、入力された単語を第 1の単語検索構造に格納された単語と照合するステップ、照合された単語についての第 1の単語情報レコードに基づき第 2の単語検索構造に格納された訳語を抽出するステツプ、抽出された訳語を出力するステップを含む、請求項 28に記載の単語翻訳方法。

[30] 複数言語間にお、て単語の翻訳を行う翻訳方法であって、

前記言語毎に設けられる単語検索辞書データと、前記言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報と、を記憶手段に記憶させる記憶ステップを有することを特徴とする翻訳方法。

[31] 一の言語の単語を入力する入力ステップと、

前記入力された一の言語の単語と、該一の言語に対応する単語検索辞書データとを照合する照合ステップと、

前記照合された一の言語の単語に対応するリンク情報に基づいて、他の言語に対応する単語検索辞書データ力前記他の言語における訳語を抽出する抽出ステップとを有することを特徴とする請求項 29に記載の翻訳方法。

[32] 前記単語検索辞書データは、言語毎に単語検索構造と単語に関する情報を記憶した単語情報レコードを含み、前記単語情報レコードは前記リンク情報を含み、前記抽出するステップは、一の言語の単語情報レコードの前記リンク情報に基づいて他の言語の単語情報レコードを抽出する、請求項 31に記載の翻訳方法。

[33] 複数言語間において単語の翻訳を行う単語翻訳プログラムであって、

第 1の言語の単語を検索するための第 1の単語検索構造を記憶し、第 2の言語の単語を検索するための第 2の単語検索構造を作成し記憶し、第 1の単語検索構造に格納された単語についての訳語を識別するための第 1の訳語情報を含む第 1の単語情報レコードを記憶し、かつ第 2の単語検索構造に格納された単語についての訳語を識別するための第 2の訳語情報を含む第 2の単語情報レコードを辞書に記憶するステップを備えた、単語翻訳プログラム。

[34] 単語翻訳方法はさらに、単語を入力する入力ステップ、入力された単語を第 1の単語検索構造に格納された単語と照合するステップ、照合された単語についての第 1の単語情報レコードに基づき第 2の単語検索構造に格納された訳語を抽出するステツプ、抽出された訳語を出力するステップを含む、請求項 31に記載の単語翻訳プログラム。

[35] 複数言語間にお、て単語の翻訳を行う翻訳プログラムであって、

前記言語毎に設けられる単語検索辞書データと、

前記言語毎に設けられる単語検索辞書データに含まれる単語毎に設けられ、対応する一の言語の単語と他の言語における訳語との関連付けを表すリンク情報と、を記憶手段に記憶させる記憶ステップを備えた、翻訳プログラム。

[36] 一の言語の単語を入力する入力ステップと、

前記照合された一の言語の単語に対応するリンク情報に基づいて、他の言語に対応する単語検索辞書データ力前記他の言語における訳語を抽出する抽出ステップとを備えた、翻訳プログラム。

[37] 前記単語検索辞書データは、言語毎に単語検索構造と単語に関する情報を記憶した単語情報レコードを含み、前記単語情報レコードは前記リンク情報を含み、前記抽出するステップは、一の言語の単語情報レコードの前記リンク情報に基づいて他の言語の単語情報レコードを抽出する、請求項 36に記載の翻訳プログラム。