JPH06290210A

JPH06290210A - 自然言語の翻訳装置

Info

Publication number: JPH06290210A
Application number: JP5075638A
Authority: JP
Inventors: Taro Morishita; 太朗森下; Kazuhiro Tsubaki; 和弘椿; Takahiro Yamaji; 孝浩山路; Yasuji Kobuchi; 保司小渕
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1993-04-01
Filing date: 1993-04-01
Publication date: 1994-10-18
Anticipated expiration: 2016-06-18
Also published as: JP3176750B2

Abstract

(57)【要約】【目的】文の構造解析や編集をすることなく質の高い
訳文を得る。【構成】記憶部２には対訳例文データベースを格納す
る。形態素解析部４は入力部１からの入力文を形態素解
析して述語を得る。表層パターン生成部５は形態素解析
結果に基づいて入力文の表層パターンを生成する。パタ
ーン比較部６は入力文の述語に基づいて対訳例文データ
ベースのインデックスを決定し、更に入力文の表層パタ
ーンを用いて当該インデックス下に在る変換パターンお
よび対訳例文を検索する。単純句翻訳部７は対訳例文を
参照して入力文の表層パターンにおけるカテゴリ・シン
ボルに対応する単語列を翻訳して変換パターン内の空欄
を埋めて目標言語の文字列パターンを得る。翻訳文生成
部８は目標言語の文字列パターンに基づいて完全な翻訳
文を生成する。こうして、入力文の構造解析や編集をす
ることなく質の高い訳文を得る。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、自然言語で書かれた
文章を自動的に翻訳する自然言語の翻訳装置に関する。

【０００２】

【従来の技術】従来より、機械翻訳装置としては、図７
に示すような解析レベルに従って、辞書情報と多数の解
析ルールを使用して目標言語との対応が取り易くなるレ
ベルまで原言語による入力文(以下、原文と言う)の解析
を行い、原文が表す意味的な内部構造を抽出するという
解析プロセスを採用した所謂トランスファー方式による
ものが主流である。

【０００３】すなわち、先ず、原文に対する形態素解析
によって各単語に対する品詞列を求める。次に、構文解
析によって上記品詞列に対する句構造を求める。そし
て、最後に単語や句の用法に関する種々のデータを使っ
て意味解析を行って依存構造等の最終的な内部構造を得
る。こうして、目標言語との対応が取り易くなるレベル
まで解析されると、目標言語への変換規則を用いて同レ
ベルの目標言語に変換し、そこから構文生成,形態素形
成と生成プロセスを進めて目標言語を生成して行くので
ある。

【０００４】このように、従来の機械翻訳装置では、解
析主導の翻訳プロセスが翻訳処理の前提となっている。
ところが、上記従来の解析主導の翻訳システムには以下
のような欠点がある。

【０００５】 (１) 翻訳の専門家のような柔軟な意訳ができない目標言語への変換規則は、通常機械的な置き換えによる
ものであり、分かりやすい表現の訳文にするための知識
は反映されてはいない。したがって、得られる訳文は堅
い表現になり、非常に分かりにくいものになっている。
そのために、現行の機械翻訳装置では、マニュアルによ
って翻訳結果を“後編集"して分かりやすい訳文に修正
したり、マニュアルによって入力文を“前編集"して機
械翻訳装置が容易に処理可能な文型に書き換えたりしな
ければ、妥当な訳文を得ることができないのである。

【０００６】その結果、当然のことながら、人手を介す
ることなく、翻訳の専門家が訳すようなレベルの“意
訳"の訳文を得ることは極めて難しい。

【０００７】 (２) 機械システムのメンテナンスや改良が困難部分的に上記目標言語への変換規則等の解析ルールや経
験則を増やして翻訳システムを改良しようとしても、全
体の処理アルゴリズムに影響を及ぼしてしまうので変更
に伴う負担が大きい。また、翻訳システムを修正できた
としてもヒューリスティックに依存する部分が多く、ヒ
ューリスティックを統一的に制御する有効な手段を備え
てはいないために、翻訳改善の対象となった文に対して
は良好な改善結果が得られる一方で、別の文章に対して
は翻訳精度が低下してしまうという事態が発生し易い。

【０００８】上述のように、解析主導の翻訳システムの
欠点を解消すべく、近年、例文主導の翻訳システムが提
唱されている。

【０００９】この例文主導の翻訳システムでは、入力文
に最も類似した対訳例文(対訳を有する例文)を対訳例文
データベースから検索し、この検索した対訳例文の対訳
を利用して上記入力文に対する翻訳を得るようにしてい
る。この翻訳システムには、上記対訳例文データベース
に対訳例文を追加するだけで性能向上を図れるという利
点や、対訳例文によってカバーできる範囲内においては
意訳レベルでの翻訳が実施できるという利点がある。

【００１０】

【発明が解決しようとする課題】しかしながら、上記従
来の例文主導の翻訳システムには以下のような問題点が
ある。現在提唱されている例文主導の翻訳システムにお
いては、上記対訳例文を検索する際に用いるキーとして
文章の依存構造を予め用意しておくものが多い。このた
めに、対訳例文の検索に際しては翻訳対象となる入力文
の依存構造を求める必要がある。そして、そのために
は、入力文章の形態素解析,構文解析,係り受け解析,意
味解析を正確に行わなければならない。

【００１１】ところで、一般に、入力文に対する形態素
解析および構文解析の際には多数の解析候補が得られ
る。そして、長く複雑な文章になるほど得られる解析候
補の数が増大する。さらに、上記解析候補を絞り込むた
めの意味解析においては、拠り所となる規則が存在しな
い。そこで、通常は多数の経験則を用意しておいて状況
に応じて使い分けることになる。

【００１２】その結果、長く複雑な文章になるほど、上
記得られた多数の解析候補から文意に沿った候補を一意
に絞り込むことが困難になるのである。したがって、上
記依存構造を有する対訳例文を上記対訳データベースに
格納する上記例文主導の翻訳システムでは、係り受け関
係の複雑な文章を正しく翻訳できる確率が低いという問
題点がある。

【００１３】そこで、この発明の目的は、入力文の構文
解析,係り受け解析および意味解析等の解析プロセスを
適用する必要がなく且つ“後編集"および“前編集"を実
施することなく、係り受けの複雑な入力文であっても質
の高い訳文を得ることができる自然言語の翻訳装置を提
供することにある。

【００１４】

【課題を解決するための手段】上記目的を達成するた
め、第１の発明の自然言語の翻訳装置は、入力部から入
力された自然言語による文章に対して形態素解析部で形
態素解析を行い、記憶部に格納されている訳例文データ
ベースから入力文に対応する例文とその対訳との対であ
る対訳例文を対訳例文検索部によって上記形態素解析結
果に基づいて検索し、この検索された対訳例文に基づい
て翻訳部で入力文章を目標言語に翻訳し、得られた翻訳
結果を表示部に表示する自然言語の翻訳装置において、
上記形態素解析部による入力文に対する形態素解析結果
に基づいて、上記入力文から、少なくとも用言及び付属
語の文字列とそれらに前後する単語列の構文カテゴリと
によって文の表層的特徴を表した表層パターンを所定の
手順で生成する表層パターン生成部を備えると共に、上
記対訳例文データベースに蓄積された各対訳例文にはこ
の対訳例文における例文の上記表層パターンを予め付加
し、上記対訳例文検索部は、上記対訳例文データベース
から該当する対訳例文を検索するに際して、上記表層パ
ターン生成部によって生成された入力文の表層パターン
と上記対訳例文に付加されている例文の表層パターンと
の類似度を求めることによって入力文に類似した例文を
有する対訳例文を検索する構成に成したことを特徴とし
ている。

【００１５】また、第２の発明は、第１の発明の自然言
語の翻訳装置において、上記記憶部に格納された対訳例
文データベースには、用言の文字列パターンをルートノ
ードとし、当該用言を用いた文から抽出された少なくと
も当該用言および付属語の文字列パターンを当該ルート
ノードから分岐した各ノードとする木構造を成すと共
に、上記各ノードの文字列パターンは親ノードの文字列
パターンを詳細化した文字列パターンになっているイン
デックス木を設けて、このインデックス木におけるリー
フノードの文字列パターンを上記対訳例文データベース
のインデックスとし、上記対訳例文検索部は、入力文か
ら形態素解析部での形態素解析結果によって抽出された
用言に基づいて当該用言を表す文字列パターンのルート
ノードを有するインデックス木を検索し、この検索され
たインデックス木を用いて上記対訳例文データベースの
インデックスを得る構成に成したことを特徴としてい
る。

【００１６】

【作用】第１の発明では、入力部から入力された自然言
語による文章に対して形態素解析部によって形態素解析
が実施され、この形態素解析結果に基づいて、表層パタ
ーン生成部によって、入力文から、少なくとも用言およ
び付属語の文字列とそれらに前後する単語列の構文カテ
ゴリとによって文の表層的特徴を表した表層パターンが
所定の手順で生成される。そうすると、対訳例文検索部
によって、記憶部の対訳例文データベースに蓄積された
各対訳例文に付加されている例文の表層パターンと上記
表層パターン生成部で生成された入力文の表層パターン
との類似度が求められる。そして、この類似度に基づい
て、入力文に類似した例文を有する対訳例文が検索され
る。

【００１７】以後、この検索された対訳例文に基づい
て、翻訳部によって入力文章が目標言語に翻訳され、得
られた翻訳結果が表示部に表示される。こうして、文全
体の表層的特徴を表す表層パターンを用いた形態素レベ
ルでの類似度算出のみによって、非常に簡単に入力文に
対応する対訳例文を検索して質の良い翻訳が得られる。

【００１８】また、第２の発明では、入力部から入力さ
れた入力文が形態素解析部によって形態素解析され、こ
の形態素解析結果に基づいて入力文の用言が抽出され
る。そうすると、対訳例文検索部によって、上記抽出さ
れた用言を表す文字列パターンのルートノードを有する
インデックス木が検索され、この検索されたインデック
ス木を用いて上記対訳例文データベースのインデックス
が得られる。

【００１９】そして、こうして得られたインデックスを
用いて、上記対訳例文検索部によって、入力文の表層パ
ターンとの類似度算出の対象となる対訳例文候補が選出
される。

【００２０】

【実施例】以下、この発明を図示の実施例により詳細に
説明する。この発明における自然言語の翻訳装置は、文
章の表層パターンを利用して対訳例文を検索する例文主
導の翻訳システムを備えた翻訳装置である。

【００２１】図１は本実施例の自然言語の翻訳装置にお
ける概略ブロック図である。以下、便宜上、日本語によ
る原文を英語に翻訳する場合を例に上記自然言語の翻訳
装置を説明する。

【００２２】入力部１はキーボードや光学文字読み取り
装置(ＯＣＲ)等の入力機器で構成されて、上記対訳例文
や翻訳対象の文章等を入力する。記憶部２はＲＡＭ(ラ
ンダム・アクセス・メモリ)やＲＯＭ(リード・オンリ・メモ
リ)等のメモリおよびこのメモリを制御するメモリ制御
手段で構成されて、単語辞書や対訳例文データベース等
を格納する。表示部３はＣＲＴ(カソード・レイ・チュー
ブ)等の表示機器で構成される。

【００２３】形態素解析部４は、記憶部２のメモリに格
納されている単語辞書を引いて入力文章から単語列を切
り出し、品詞列を生成する。さらに、テンスやアスペク
ト等の情報を得る。表層パターン生成部５は、形態素解
析部４による形態素解析結果を用いて、入力部１からの
入力文の表層パターンを生成する。パターン比較部６
は、後に詳述するようにして、入力文章の表層パターン
の候補と記憶部２の上記メモリに格納されている対訳例
文データベースに用意されている表層パターンとの比較
を行って、入力文章に最も類似した表層パターンを有す
る対訳例文を検索する。

【００２４】単純句翻訳部７は、複雑な埋め込み文のな
い名詞句(「本」,「その本」,「彼の本」,「美しい本」等)や、
空列を含む助動詞列が後続する述語等の単純な語句を対
象として、上記単語辞書のような簡単なルールのみに基
づいて翻訳処理を実行する。この単純句翻訳部７は、上
述した従来型の機械翻訳装置における一部の機能で代用
可能であるために、ここでは詳細な説明は省略する。

【００２５】翻訳文生成部８は、上記目標言語における
単語の並びやテンスおよびアスペクト等の情報から、目
標言語による完全な翻訳文を生成する。尚、この翻訳文
生成部８についても従来型の機械翻訳装置における一部
の機能で代用可能であるために詳細な説明は省略する。
制御部９は、上記入力部１,記憶部２,表示部３,形態素
解析部４,表層パターン生成部５,パターン比較部６,単
純句翻訳部７および翻訳文生成部８を制御して、入力文
章の翻訳処理を実施する。

【００２６】すなわち、上記パターン比較部６で上記対
訳例文検索部を構成し、単純句翻訳部７,翻訳文生成部
８および制御部９で上記翻訳部を成すのである。

【００２７】本実施例の翻訳装置によって実施される翻
訳処理の概略は、入力文の表層パターンを用いて入力文
に最も類似した対訳例文を上記対訳例文データベースか
ら検索し、検索された対訳例文における対訳を基にして
入力文の翻訳文を得る処理である。以下、上記翻訳処理
について順を追って詳細に説明する。尚、ここで言う表
層パターンとは、文を特徴付ける単語とその他の部分単
語列の構文カテゴリとによって表されるものである。

【００２８】先ず、上記記憶部２のメモリに格納される
対訳例文データベースについて説明する。図２および図
３は上記対訳例文データベースに関する説明図である。
図２は上記対訳例文データベースのインデックス構造を
示し、「ある」という動詞が述部となる和文を原文とする
複数の対訳例文のインデックス構造を例示している。

【００２９】上記インデックスは、述語の終止形「ある」
をルートノードとし、その述語「ある」を含む表層の文字
列パターン「＊は＊がある」,「＊には＊がある」,「＊は
＊に＊がある」,…をルートノード以外のノードとする
木構造で表現される。尚、上記表層の文字列パターンに
おけるパターン要素は、各ノードに存在する述語「ある」
に対する必須格,任意格,省略格の格助詞および特徴的な
単語である。上記表層の文字列パターンは、リーフノー
ドに行くほど詳細に記述され、子ノードの文字列パター
ン(例えば、「＊は＊と＊がある」)は親ノードの文字列
パターン(例えば、「＊は＊がある」)を詳細化した文字
列パターンになっている。

【００３０】そして、上述のようなルートノードを幹と
する木構造を有するインデックス木の各リーフノードに
係る上記表層の文字列パターンを上記対訳例文データベ
ースのインデックスとし、このインデックスに対訳例文
が対応付けられている。したがって、入力文から抽出し
た述語の終止形をルートノードとするインデックス木を
上記入力文の表層の文字列に従って辿って行くことによ
って、該当する対訳例文を検索するためのインデックス
を決定できるのである。

【００３１】図３は、「＊には＊がある」という表層の
文字列パターンを有する和文を原文とする対訳例文を蓄
積した対訳例文データベースの構造例を示す。図３に示
すように、上記対訳例文データベースは、上記インデッ
クス(上記インデックス木のリーフノードに係る表層の
文字列パターン),表層パターン,変換パターンおよび対
訳例文からなる層構造を成している。

【００３２】ここで、上記表層パターンは本実施例の中
心となるデータ構造であり、上述したように文を特徴付
ける単語(以下、特徴単語と言う)とその他の部分単語列
の構文カテゴリによって表される。ここで、上記特徴単
語とは、動詞,助詞および一部の特徴的な名詞であり、
図２に示すインデックスにおける各ノードの文字列パタ
ーンに具体的に表記された単語に対応する。また、上記
構文カテゴリとは、上記特徴単語に前後する単語列(す
なわち、上記インテックスでは“＊"に対応する部分単
語列)の簡単な句構造を表すものである。

【００３３】次に、上記表層パターンの構成法について
説明する。 (１) 対象となる文の中心用言とそれに係る任意格を含
めた格助詞,接続助詞および特徴的な名詞とを夫々抽出
して上記特徴単語とする。 (２) (１)で抽出された特徴単語に前後する部分単語列
の上記構文カテゴリを設定する。そして、その設定され
た構文カテゴリを次のようにカテゴリ・シンボルに置き
換える。構文カテゴリカテゴリ・シンボル単純名詞句 → Ｎ埋め込み文によって装飾された名詞句 → ＶＰ・Ｎ動詞句 → ＶＰ … …

【００３４】上述のようにして構成される表層パターン
を用いて、上記対訳例文データベースは次のように構成
される。以下、図３に従って対訳例文データベースの構
成について具体的に説明する。

【００３５】「＊には＊がある」というインデックス下
には、次のようなパターン１〜パターン３と命名された
３つの表層パターンが存在する。すなわち、パターン１＝“Ｎ1にはＮ2がある" ＝“単純名詞句１＋「には」＋単純名詞句２＋「が」＋「あ
る」" パターン２＝“ＶＰ・ＮIにはＮ2がある" ＝“連体修飾述句＋単純名詞句１＋「には」＋単純名詞句
２＋「が」＋「ある」" パターン３＝“ＶＰにはＮがある" ＝“述句＋「には」＋単純名詞句＋「が」＋「ある」"

【００３６】さらに、各表層パターン下には、その表層
パターンを有する和文を英訳する際に用いられる変換パ
ターンが存在する。例えば、パターン１＝“Ｎ1にはＮ2がある" ＝“単純名詞句１＋「には」＋単純名詞句２＋「が」＋「あ
る」" に対しては、変換パターン＝“There BE Ｔ(Ｎ2) in Ｔ(Ｎ1)." が対応付けられており、 “「There」＋BE動詞＋単純名詞句２の翻訳結果＋「in」＋
単純名詞句１の翻訳結果" が変換されるべき英文のパターンであることを示してい
る。

【００３７】ここで、上記変換パターンに見られる“Ｔ
(ｘ)"という表記は、句“ｘ"に対応する単語列を上記単
純句翻訳部７(図１参照)によって翻訳した結果を表す。
例えば、CASE01に示す対訳例文の場合には、“ｘ"は
「庭」を表す単純名詞句であり、“Ｔ(x)"は「garden」であ
る。また、“Ｔc_h(ｘ)という表記は、CASE番号“ｈ"を
有する対訳例文の対訳英文を表す。例えば、CASE11に示
す対訳例文の場合には、“ｘ"は「彼が学会誌に発表した
論文」を表す埋め込み文を含む名詞句であり、CASE番号
“１１"の対訳例文に記載された同じ和文に対する対訳
英文を取り出すことによって、“Ｔc₁₁(ｘ)"＝「the pap
er which he published in a scholar journal」が得ら
れる。尚、上記CASExxは、具体的な例文と対訳との対か
ら成る対訳例文を表す。例えば、CASE01の場合には、和
文「庭には池がある」と対を成す英訳文は「There is apon
d in the garden」である。

【００３８】つまり、上記変換パターンは一種のテンプ
レートとなっており、対応する表層パターンを構成する
上記特徴単語に前後する部分単語列の翻訳結果で上記テ
ンプレートの空欄を埋めることによって翻訳英文が得ら
れるのである。

【００３９】上述のような構造を有する対訳例文データ
ベースとして大量の対訳例文を蓄積しておけば、入力文
章の表層パターンと類似若しくは一致した表層パターン
を有する対訳例文を対訳例文データベースから検索する
ことによって、質の高い翻訳文を得ることが容易に可能
となるのである。

【００４０】ここで、上述のような表層パターンを用い
て翻訳を実施することによって、次のような利点が得ら
れるのである。

【００４１】(Ａ)上記対訳例文データベースから入力文
に類似若しくは一致する対訳例文を検索する際に実施さ
れる表層パターンのマッチングは、１次元的な形態素解
析レベルでのパターンマッチングである。したがって、
依存構造解析のように２次元的な解析を行う必要がな
い。具体的には、上記依存構造解析の場合には、入力文
全体に対する係り受け解析および意味処理を含めた構文
解析を必要とする。これに対して、表層パターンのマッ
チングの場合には、文字列のパターンマッチング,形態
素解析および品詞列に対する極簡単なパターン認識処理
しか必要とはしない。したがって、入力文章の解析処理
が非常に単純なものとなる。

【００４２】このように、上記対訳例文の検索に伴う解
析処理が簡単になることによって、従来型の例文主導の
翻訳システムに比較して長く複雑な入力文章に対する翻
訳処理時間が大幅に短縮される。

【００４３】(Ｂ)上記従来型の例文主導による翻訳シス
テムで実施される依存構造解析は、局所的に解析ルール
を適用してマッチングを行い、得られた結果を積み上げ
るボトムアップ方式である。そのために、部分的には正
しく構造が解析されているにも拘わらず、文章全体とし
ては係り受け関係や句のまとまりが誤っている解析候補
が生成される場合が多い。

【００４４】これに対して、上記表層パターンは文全体
を規定したものであるために、表層パターンのマッチン
グ処理に際しては巨視的に見た場合の翻訳の失敗を避け
ることができる。また、その結果、訳文候補の組み合わ
せの爆発を避けることができる。以上の理由から、本実
施例における表層パターンを用いた翻訳システムによれ
ば、長く複雑な文章に対する翻訳の精度が飛躍的に向上
するのである。

【００４５】次に、上記入力部１から入力された入力文
章から上記表層パターンを抽出し、記憶部２のメモリに
格納された対訳例文データベースから上記入力文章に類
似した対訳例文を上記抽出された入力文章の表層パター
ンに基づいて検索する対訳例文検索処理動作について説
明する。

【００４６】図４および図５は、上記制御部９によって
記憶部２,形態素解析部４,表層パターン生成部５および
パターン比較部６を制御して実施される対訳例文検索処
理動作のフローチャートである。以下、図４に従って、
上記対訳例文検索処理動作について詳細に説明する。

【００４７】ステップＳ1で、上記形態素解析部４によ
って、入力部１から入力された入力文“Ｓ"の形態素が
解析されて単語列および品詞列が切り出され、テンスお
よびアスペクト等の情報が得られる。そして、得られた
入力文Ｓの単語列および品詞列から入力文Ｓの述語
“Ｖ"が決定される。ステップＳ2で、上記パターン比較
部６によって、上記ステップＳ1において決定された述
語Ｖをキーワードとして、図２の構造を有して上記対訳
例文に関連付けられた複数のインデックス木から当該述
語Ｖと同じ文字列パターンをルートノード(以下、“ル
ートノードＶ"と言う)とするインデックス木が検索され
る。

【００４８】ステップＳ3で、さらに上記パターン比較
部６によって、上記検索されたインデックス木における
ルートノードＶから分岐している各子ノードchild(V)の
文字列パターンのパターン要素をキーワードとして、全
子ノードchild(V)の文字列パターンと入力文Ｓの文字列
とが比較される。ステップＳ4で、上記キーワードであ
るパターン要素が入力文Ｓの文字列中に在るような子ノ
ードchild(V)が存在するか否かが判別される。その結果
存在すればステップＳ5に進み、存在しなければ上記対
訳例文データベース内に入力文Ｓに類似する対訳例文は
ないとして対訳例文検索処理動作を終了する。

【００４９】ステップＳ5で、当該子ノードを親ノード
“Ｆ"とする。ステップＳ6で、上記パターン比較部６に
よって、子ノードchild(F)に係る上記パターン要素をキ
ーワードとして、全子ノードchild(F)の文字列パターン
と入力文Ｓの文字列とが比較される。ステップＳ7で、
上記パターン要素が入力文Ｓの文字列中に在るような子
ノードchild(F)が存在するか否かが判別される。その結
果、存在すればステップＳ5に戻って当該子ノードchild
(F)から分岐したノードに対する処理に移行する。一
方、存在しなければステップＳ8に進む。

【００５０】ステップＳ8で、上記ノードＦはリーフノ
ードであるから、このノードＦの文字列パターンが入力
文Ｓに類似した対訳例文を検索する際のインデックスで
あると決定される。ここで、便宜上、上記インデックス
を“＊Ｐ₁＊Ｐ₂＊…＊Ｐ_j＊…＊Ｐ_J・Ｖ"と表す。但し、
“Ｐ_j(ｊ＝１〜Ｊ)"はｊ番目のインデックス要素であ
り、“＊"は上記インデックス要素に前後する部分文字
列である。ステップＳ9で、上記ステップＳ8において決
定されたインデックスの文字列パターンにおけるインデ
ックス要素が参照されて、入力文Ｓの文字列が上記イン
デックス要素と同じ文字の箇所で分割される。その際
に、上記入力文Ｓの文字列に上記インデックス要素と同
一の部分文字列が複数あるために分割箇所が一意に決ま
らない場合には、総ての分割候補が求められて保持され
る。ここで、上記分割候補がＩ個あるとした場合には、
このＩ個の分割候補の集合{ｂ_i}は次のように表され
る。 {ｂ_i}＝{conc(Ｓ_ij・Ｐ_j)_j=1〜J}_i=1〜I 但し、Ｓ_ij：ｊ番目のインデックス要素Ｐ_jの直前に位
置する“＊"に対応する部分文字列

【００５１】ステップＳ10で、分割候補番号ｉと表層パ
ターン番号ｋとに“１"がセットされる。また、マッチ
ング評価値Ｅkと最大マッチング評価値Ｅk'と最大マッ
チング評価値を呈する表層パターン番号ｋ'と最大評価
値を呈する分割候補番号ｉ'に“０"がセットされる。ス
テップＳ11で、上記表層パターン生成部５によって、ｉ
番目の分割候補ｂ_iの各部分文字列(Ｓ_ij)_j=1〜Jに対し
て形態素解析が実施されて、以下のような分割候補ｂ_i
の表層パターンbp_iが求められる。 bp_i＝[Ｘ_ij・Ｐ_j]_j=1〜J 但し、Ｘ_ij：部分文字列Ｓ_ijを形態素解析して得られた
品詞列Ｈ₁,…,Ｈ_r,…,Ｈ_Rに対して割り当てられる上記
カテゴリ・シンボル列

【００５２】上記カテゴリ・シンボル列Ｘ_ijの割り当て
は、次のような割り当てルールを適用して実施される。 (ａ) 品詞Ｈ_Rが動詞,動詞に続く付属語,名詞に続く述
語型助動詞である場合にはカテゴリ・シンボル“ＶＰ"を
割り当てる。 (ｂ) 品詞Ｈ_Rが名詞,名詞に続く接辞であり、且つ、ｒ
＜Ｒであるｒに対して連体形の動詞である品詞Ｈ_rが存
在する場合には、カテゴリ・シンボル列“ＶＰ・Ｎ"を割
り当てる。 (ｃ) 品詞Ｈ_Rが名詞,名詞に続く接辞であり、且つ、ｒ
＜Ｒであるｒに対して動詞である品詞Ｈ_rが存在しない
場合にはカテゴリ・シンボル“Ｎ"を割り当てる。

【００５３】ステップＳ12で、上記対訳例文データベー
スから上記ステップＳ8において決定されたインデック
ス下に在るｋ番目の表層パターン(以下、任意のインデ
ックス下に在る表層パターンをインデックス内表層パタ
ーンと言う)dp_kが読み出される。ここで、当該インデッ
クス下にはＫ個のインデックス内表層パターンdp_kが在
るものとすると、このＫ個のインデックス内表層パター
ンの集合{dp_k}は次のように表される。 {dp_k}＝{[Ｃ_kj・Ｐ_j]_j=1〜J}_k=1〜K 但し、Ｃ_kj：ｊ番目の上記特徴単語Ｐ_jの直前に位置す
るカテゴリ・シンボル列つまり、上記インデックス内表層パターンは、入力文Ｓ
と同じ述語Ｖを含む入力文Ｓと同じ上記表層の文字列パ
ターンを有する表層パターンであると言える。ステップ
Ｓ13で、上記パターン比較部６によって、上記ステップ
Ｓ11において求められた入力文Ｓの表層パターンbp_iの
カテゴリ・シンボル列Ｘ_ijと上記ステップＳ12において
読み出されたインデックス内表層パターンdp_kのカテゴ
リ・シンボル列Ｃ_kjとが、総てのｊについて比較され
る。その結果、Ｘ_ij＝Ｃ_kjまたはＸ_ij≒Ｃ_kjであればス
テップＳ18に進む。一方、Ｘ_ij≠Ｃ_kjであればステップ
Ｓ14に進む。ここで、上記“Ｘ_ij≒Ｃ_kj"とは、カテゴ
リ・シンボルＸ_ijあるいはカテゴリ・シンボルＣ_kjのうち
何れか一方のヘッドフィーチャーが他方のカテゴリ・シ
ンボルと一致する場合である。

【００５４】ステップＳ14で、上記インデックス内表層
パターンdp_kの表層パターン番号ｋの内容が最大値“Ｋ"
より小さいか否かが判別される。その結果最大値“Ｋ"
より小さければステップＳ15に進み、そうでなければス
テップＳ16に進む。ステップＳ15で、表層パターン番号
ｋの内容がインクリメントされてステップＳ12に戻り、
次のインデックス内表層パターンの処理に移行する。ス
テップＳ16で、上記分割候補番号ｉの内容が最大値
“Ｉ"より小さいか否かが判別される。その結果最大値
“Ｉ"より小さければステップＳ17に進み、そうでなけ
ればステップＳ21に進む。ステップＳ17で、分割候補番
号ｉの内容がインクリメントされてステップＳ１１に戻
り、入力文Ｓの次の分割候補の表層パターンに対する処
理に移行する。

【００５５】ステップＳ１８で、上記ステップＳ13での
比較結果に基づいて、入力文Ｓ(分割候補ｂ_i)の表層パ
ターンbp_iとインデックス内表層パターンdp_kとの間のマ
ッチング評価値Ｅkが以下のようにして算出される。す
なわち、先ず、上記分割候補ｂ_iの表層パターンbp_iのカ
テゴリ・シンボル列Ｘ_ijと上記インデックス内表層パタ
ーンdp_kのカテゴリ・シンボル列Ｃ_kjとの比較結果に基づ
いて、以下のようにマッチ度ＣＥ_kjが設定される。

【００５６】上記マッチ度ＣＥ_kjは次のように設定され
る。 (イ) カテゴリ・シンボル列Ｘ_ijとカテゴリ・シンボル列
Ｃ_kjとが完全に一致する場合(Ｘ_ij＝Ｃ_kj) 例えば、Ｘ_ij及びＣ_kjが共に埋め込み文によって装飾さ
れた名詞句“ＶＰ・Ｎ"である場合には、マッチ度ＣＥ_kj
に“１.０"を与える。 (ロ) カテゴリ・シンボル列Ｘ_ijとカテゴリ・シンボル列
Ｃ_kjのヘッドフィーチャーとが一致する場合(Ｘ_ij≒Ｃ
_kj) 例えば、Ｘ_ijが単純名詞句“Ｎ"でＣ_kjが埋め込み文に
よって装飾された名詞句“ＶＰ・Ｎ"である場合には、マ
ッチ度ＣＥ_kjに“０.５"を与える。 (ハ) カテゴリ・シンボル列Ｘ_ijのヘッドフィーチャー
とカテゴリ・シンボル列Ｃ_kjとが一致する場合(Ｘ_ij≒Ｃ
_kj) 例えば、Ｘ_ijが埋め込み文によって装飾された名詞句
“ＶＰ・Ｎ"でＣ_kjが単純名詞句“Ｎ"である場合には、
マッチ度ＣＥ_kjに“０.５"を与える。

【００５７】こうして、総ての“ｊ"についてマッチ度
ＣＥ_kjが与えられると(すなわち、分割候補ｂ_iの表層パ
ターンbp_iとインデックス内表層パターンdp_kとが一致あ
るいは類似すると)、ｊ個のマッチ度ＣＥ_kjの和が算出
されて表層パターンbp_iとインデックス内表層パターンd
p_kとの間のマッチング評価値Ｅkが得られる。

【００５８】ステップＳ19で、上記記憶部２のメモリに
現在保持されている最大マッチング評価値Ｅk'と上記算
出されたマッチング評価値Ｅkとが比較される。その結
果、当該マッチング評価値Ｅkの方が最大マッチング評
価値Ｅk'よりも大きい場合にはステップＳ20に進む。一
方、最大マッチング評価値Ｅk'以下であればステップＳ
14に戻って、次のインデックス内表層パターンが在れば
次のインデックス内表層パターンに対する処理に移行す
る。ステップＳ20で、上記記憶部２によって、メモリに
格納されている上記最大マッチング評価値Ｅk'を呈する
表層パターン番号ｋ'が当該表層パターン番号“ｋ"に更
新され、最大マッチング評価値Ｅk'を呈する分割候補番
号ｉ'が当該分割候補番号“ｉ"に更新され、そして最大
マッチング評価値Ｅk'が当該マッチング評価値“Ｅk"に
更新される。その後、ステップＳ14に戻って、次のイン
デックス内表層パターン在れば次のインデックス内表層
パターンに対する処理に移行する。

【００５９】ステップＳ21で、入力文Ｓに係る総ての分
割候補ｂ_i(ｉ＝１〜Ｎ)および上記対訳例文データベー
スにおける当該インデックス下に在る総てのインデック
ス内表層パターンdp_k(ｋ＝１〜Ｋ)に関する検索処理が
終了したので、最大マッチング評価値Ｅk'を呈するイン
デックス内表層パターン下に在る対訳例文が出力され
る。また、最大マッチング評価値Ｅk'を呈する分割候補
の表層パターンが出力される。こうして、入力文Ｓの表
層パターンに類似したあるいは一致した表層パターンを
有する対訳例文が出力されて、対訳例文検索処理動作を
終了する。

【００６０】このようにして、入力文Ｓに類似あるいは
一致した対訳例文が得られると、当該対訳例文と当該対
訳例文上に在る上記変換パターンとを入力文Ｓに適用し
て目標言語の具体化された文字列パターンを得る。その
際における入力文Ｓへの適用とは、当該変換パターン内
における表記Ｔ(ｘ)に対応する当該分割候補ｂ_i内にお
ける部分文字列Ｓ_ijの上記単純句翻訳部７による翻訳
や、当該変換パターン内における表記“Ｔc_h(ｘ)"で指
定された対訳例文を用いた部分翻訳を意味する。

【００６１】こうして、上記目標言語の具体化された文
字パターンが得られると、上記翻訳文生成部８によっ
て、形態素解析部４による形態素解析で得られたテンス
およびアスペクトに関する情報や訳文生成ルールに基づ
いて、目標言語に具体化された文字パターンの時制,人
称および数等の表現の検査/修正が行われて完全な翻訳
文が生成される。そして、生成された翻訳結果は表示部
３に出力されて表示される。

【００６２】次に、本実施例における翻訳装置によって
実施される例文主導の翻訳処理について、入力例文を上
げて図１〜図５を参照して順を追って具体的に説明す
る。

【００６３】和文による入力文Ｓ「彼が買った本には落
丁があった」が入力部１から入力される。そうすると、
形態素解析部４で形態素解析が行われて述語Ｖ「ある」が
決定され、入力文Ｓの時制情報“過去"が得られる。…
ステップＳ1 上記述語Ｖ「ある」がルートノードになっている図２に示
すインデックス木が検索される。そして、この検索され
たインデックス木の子ノードの文字列パターンと入力文
Ｓ「彼が買った本には落丁があった」の文字列とが比較さ
れて、インデックス「＊には＊がある」が決定される。
…ステップＳ2〜ステップＳ8

【００６４】上記インデックス「＊には(P₁)＊が(P₂) あ
る」が参照されて、入力文Ｓ「彼が買った本には落丁があ
った」が分割される。その際に、インデックス要素Ｐ
₁(＝「には」)とこれに続くＰ₂(＝「が」)とは入力文Ｓ中に
各々一回しか出現しないので、分割候補はｂ₁唯一つだ
け存在する。ｂ₁＝「彼が買った本(S₁₁)/には(P₁)/落丁(S₁₂)/が(P₂)/
ある(V)」…ステップＳ9 次に、上記分割候補ｂ₁内の部分文字列Ｓ₁₁(＝「彼が買
った本」)及び部分文字列Ｓ₁₂(「落丁」)に対する形態素解
析が実施される。そして、上記部分文字列Ｓ₁₁(＝「彼が
買った本」)には上記割り当てルール(ｂ)が適用されてカ
テゴリ・シンボルＸ₁₁(＝ＶＰ・Ｎ)に変換される。一方、
部分文字列Ｓ₁₂(＝「落丁」)には割り当てルール(ｃ)が適
用されてカテゴリ・シンボルＸ₁₂(＝Ｎ)に変換される。
その結果、上記入力文Ｓにおける分割候補ｂ₁の表層パ
ターンbp₁が次のように求められる。 bp₁＝“ＶＰ・ＮにはＮがある"…ステップＳ10,ステッ
プＳ11

【００６５】上記対訳例文データベースにおけるインデ
ックス「＊には＊がある」下にはパターン１,パターン２
およびパターン３と命名された３つのインデックス内表
層パターンdp₁,dp₂,dp₃が存在する。そこで、上記分割
候補ｂ₁の表層パターンbp₁と各インデックス内表層パタ
ーンdp₁,dp₂,dp₃の夫々とが比較される。 bp₁とdp₁との比較 bp₁＝“ＶＰ・Ｎ(Ｘ₁₁) にはＮ(Ｘ₁₂) がある" dp₁＝“ Ｎ1(Ｃ₁₁) にはＮ2(Ｃ₁₂) がある" したがって、Ｘ₁₁≒Ｃ₁₁ → マッチ度ＣＥ₁₁＝０.５Ｘ₁₂＝Ｃ₁₂ → マッチ度ＣＥ₁₂＝１.０マッチング評価値Ｅ1＝１.５ bp₁とdp₂との比較 bp₁＝“ ＶＰ・Ｎ(Ｘ₁₁) にはＮ(Ｘ₁₂) がある" dp₂＝“ＶＰ・Ｎ1(Ｃ₂₁) にはＮ2(Ｃ₂₂) がある" したがって、Ｘ₁₁＝Ｃ₂₁ → マッチ度ＣＥ₂₁＝１.０Ｘ₁₂＝Ｃ₂₂ → マッチ度ＣＥ₂₂＝１.０マッチング評価値Ｅ2＝２.０ bp₁とdp₃との比較 bp₁＝“ＶＰ・Ｎ(Ｘ₁₁) にはＮ(Ｘ₁₂) がある" dp₃＝“ ＶＰ(Ｃ₃₁) にはＮ(Ｃ₃₂) がある" したがって、Ｘ₁₁≠Ｃ_３１分割候補ｂ_１の表層パターンbp₁と見出し内表層パター
ンdp₃とは別表層パターンである。…ステップＳ12〜ス
テップＳ18

【００６６】およびでの比較結果により、マッチング評価値Ｅ1(＝１.５)＜マッチング評価値Ｅ2
(＝２.０) であるから、インデックス内表層パターンdp₂が入力文
Ｓに最も類似したインデックス内表層パターンであると
確定される。その結果、類似対訳例文としてCASE11と命
名された例文「彼が学会誌に発表した論文には誤りがある」対訳「There are some errors in the paper which he published in a scholar journal」の対が出力される。さらに、上記入力文Ｓの表層パター
ン bp₁＝“ＶＰ・ＮにはＮがある"が出力される。
…ステップＳ19〜ステップＳ21

【００６７】こうして、入力文Ｓ「彼が買った本には落
丁があった」の類似対訳例文が得られると、この得られ
た対訳例文上に在る上記変換パターン「 There BE Ｔ(Ｎ2) in Ｔc_h(ＶＰ・Ｎ1).」に入力文Ｓが次にように適用される。Ｔc_h(ＶＰ・Ｎ1＝彼が買った本) → 「the book which
he bought」Ｔ(Ｎ2＝落丁) → 「missing page」但し、この場合には、変換パターン「There BE Ｔ(Ｎ2)
in Ｔc₁₂(ＶＰ・Ｎ1).」下には、例えば、 CASE12 ＶＰ＝彼が買ったＮ1＝本Ｎ2＝誤り There are some errors in the book which he bought. なる対訳例文が記述されているものとする。

【００６８】こうして、和文による上記入力文Ｓ「彼が
買った本には落丁があった」の目標言語(英語)に具体化
された次のような文字列パターン記述が得られる。「 There BE missing page in the book which he bough
t.」以後、この目標言語に具体化された文字列パターンと上
記時制情報とに基づいて、上記訳文生成ルールを適用し
て、目標言語による翻訳文「 There were some missing pages in the book which h
e bought.」を得るのである。

【００６９】上述の例では、説明の便宜を図るためにご
く簡単な係り受け構造しか持たないような入力文Ｓの翻
訳プロセスについて述べているが、更に複雑な係り受け
構造を有する文章に対しても適切な翻訳文を得ることが
可能である。例えば、以下のような入力文「ハードウェアの構成は、本体とKBD,FDが一体になって
いるスタンドアロン型と、本体と一部が分離しているデ
スクトップ型の２種類があります。」は、並列句が多く係り受け関係が複雑である。したがっ
て、入力文章を一から解析する従来の解析主導の翻訳シ
ステムや依存構造を用いた例文主導の翻訳システムで
は、入力文の解析段階で正しい解析結果を得ることが極
めて困難である。したがって、高い翻訳精度は得られ
ず、翻訳の専門家のような意訳ができず翻訳の質は低
い。

【００７０】ところが、本実施例によれば、以下のよう
に高精度で且つ質の高い翻訳文が得られるのである。す
なわち、図６に示すように、上記対訳例文データベース
に、・インデックス “＊は＊と＊の２＊がある" ・インデックス内表層パターン “Ｎ1はＶＰ1・Ｎ2とＶＰ2・Ｎ3の２Ｎ4がある" ・変換パターン「There are two Ｎ4 of Ｎ1：Ｎ2 and Ｎ3. In the Ｎ2，Ｔc(ＶＰ1). In the Ｎ3，Ｔc(ＶＰ2).」・対訳例文Ｎ1＝推論の方式Ｎ2＝帰納法Ｎ3＝演繹法Ｎ4＝種
類ＶＰ1＝事実から規則を導くＶＰ2＝規則から事実
を導く「There are two kinds of inference method：inducti
on and deduction. In the induction，rules are infered from facts. In the deduction，facts are infered from rules.」を格納しておく。

【００７１】上記入力部１から上記入力文Ｓ「ハードウ
ェアの構成は、本体とKBD,FDが一体になっているスタン
ドアロン型と、本体と一部が分離しているデスクトップ
型の２種類があります。」が入力されると、上述のように
形態素解析部２によって述語Ｖ「ある」が決定される。そ
して、上記パータン比較部５によってルートノードＶ
“ある"のインデックス木が検索され、入力文Ｓの文字
列に対応するインデックス“＊は＊と＊の２＊がある"
が求められる。こうして、上記対訳例文データベースの
インデックスが決定されると、上述と同様に、決定され
たインデックス下に在るインデックス内表層パターン,
変換パターンおよび対訳例文を用いて入力文Ｓの目標言
語に具体化された文字列パターン記述が得られるのであ
る。

【００７２】このように、長く複雑な係り受けを有する
入力文章であっても、その入力文章の表層パターンと同
じ表層パターンを呈する対訳例文を対訳例文データベー
スに登録しておくだけで、翻訳生成に失敗することはな
いのである。また、長い文章の場合には、文意を取り易
いように変換パターンおよび対訳例文の対訳を夫々複数
に分割して(図６の場合には３つに分割)意訳するパター
ンで記述しておくことによって、専門家による翻訳に近
い意訳が可能となる。

【００７３】上述のように、本実施例では、入力文章の
表層の文字列パターンのマッチングおよび入力文章の文
字列における上記特徴単語に前後する部分単語列の上記
構文カテゴリのマッチングのみを実施すればよく、入力
文章を解析して得られた複雑な依存構造によるマッチン
グを実施する必要がない。したがって、任意格や並列句
を含む複雑な係り受け構造を有する入力文章にも容易に
対処できる。

【００７４】尚、本実施例の翻訳装置では上記対訳例文
をどれだけ網羅するかによって翻訳性能が決まる。一
方、文の表層の文字列パターンの木を使用して対訳例文
データベースをインデキシングするようにしている。し
たがって、本実施例の翻訳装置によれば、文法の専門家
でなくとも系統的に対訳例文を増やして行くことが可能
であり、翻訳性能の向上や翻訳システムの改良やメンテ
ナンスを容易に実施できる。

【００７５】この発明における対訳例文検索処理動作の
アルゴリズムは図４および図５に示すフローチャートに
限定されるものではない。また、上記対訳例文データベ
ースの具体的構成は、図３および図６に示すような構成
に限定されるものではない。

【００７６】

【発明の効果】以上より明らかなように、第１の発明の
自然言語の翻訳装置は、形態素解析部による入力文の形
態素解析結果に基づいて、上記入力文から、少なくとも
用言および付属語の文字列とそれらに前後する単語列の
構文カテゴリとによって文の表層的特徴を表す表層パタ
ーンを表層パターン生成部によって生成し、対訳例文検
索部によって、上記表層パターン生成部で生成された入
力文の表層パターンと上記対訳例文に付加された例文の
表層パターンとの類似度を求めることによって入力文に
類似した例文を有する対訳例文を検索するようにしたの
で、形態素レベルでの類似度算出によって上記対訳例文
データベースから容易に該当する対訳例文を検索し、こ
の検索された対訳例文を用いて例文主導の翻訳処理を実
施できる。

【００７７】したがって、この発明によれば、入力文の
構文解析,係り受け解析および意味解析等の２次元的な
解析プロセスを適用することなく、“後編集"および
“前編集"の実施の必要のない例文主導の翻訳処理を非
常に簡単に且つ短時間に実施できるのである。

【００７８】さらに、その際における上記対訳例文検索
部による類似度算出は、文全体の表層的特徴を表した表
層パターンを用いて実施される。したがって、この発明
によれば、係り受けの複雑な入力文であっても質の高い
訳文を容易に得ることができる。

【００７９】また、第２の発明の自然言語の翻訳装置
は、記憶部に格納された対訳例文データベースに、用言
の文字列パターンをルートノードとし、当該用言を用い
た文から抽出された少なくとも当該用言および付属語の
文字列パターンを各ノードとする木構造を有するインデ
ックス木を設けて、このインデックス木のリーフノード
の文字列パターンを上記対訳例文データベースのインデ
ックスとし、上記対訳例文検索部は、上記形態素解析部
での形態素解析結果によって抽出された用言に基づいて
インデックス木を用いて上記対訳例文データベースのイ
ンデックスを得るような構成にしたので、得られたイン
デックスに基づいて、上記対訳例文検索部による類似度
計算の対象となる対訳例文候補を容易に選出できる。

【００８０】したがって、上記対訳例文検索部は、上記
インデックスに基づいて選出された対訳例文候補に付加
されている上記表層パターンに付いてのみ上記入力文の
表層パターンとの類似度を求めればよく、入力文に類似
した例文を有する対訳例文の検索を更に容易に且つ短時
間に実施できる。

【図面の簡単な説明】

【図１】この発明の自然言語の翻訳装置におけるブロッ
ク図である。

【図２】図１における記憶部に格納された対訳例文デー
タベースを検索する際に使用されるインデックス木の説
明図である。

【図３】対訳例文データベースの構成例を示す図であ
る。

【図４】対訳例文検索処理動作のフローチャートであ
る。

【図５】図４に続く対訳例文検索処理動作のフローチャ
ートである。

【図６】図３とは異なる対訳例文データベースの構成例
を示す図である。

【図７】解析主導の翻訳プロセスにおける解析レベルの
説明図である。

【符号の説明】

１…入力部、２…記憶部、３…
表示部、４…形態素解析部、５
…表層パターン生成部、６…パターン比較
部、７…単純句翻訳部、８…翻訳文生
成部、９…制御部。

───────────────────────────────────────────────────── フロントページの続き (72)発明者小渕保司大阪府大阪市阿倍野区長池町22番22号シャープ株式会社内

Claims

【特許請求の範囲】

【請求項１】入力部から入力された自然言語による文
章に対して形態素解析部で形態素解析を行い、記憶部に
格納されている訳例文データベースから入力文に対応す
る例文とその対訳との対である対訳例文を対訳例文検索
部によって上記形態素解析結果に基づいて検索し、この
検索された対訳例文に基づいて翻訳部で入力文章を目標
言語に翻訳し、得られた翻訳結果を表示部に表示する自
然言語の翻訳装置において、上記形態素解析部による入力文に対する形態素解析結果
に基づいて、上記入力文から、少なくとも用言および付
属語の文字列とそれらに前後する単語列の構文カテゴリ
とによって文の表層的特徴を表した表層パターンを所定
の手順で生成する表層パターン生成部を備えると共に、上記対訳例文データベースに蓄積された各対訳例文に
は、この対訳例文における例文の上記表層パターンを予
め付加し、上記対訳例文検索部は、上記対訳例文データベースから
該当する対訳例文を検索するに際して、上記表層パター
ン生成部によって生成された入力文の表層パターンと上
記対訳例文に付加されている例文の表層パターンとの類
似度を求めることによって、入力文に類似した例文を有
する対訳例文を検索する構成に成したことを特徴とする
自然言語の翻訳装置。
【請求項２】請求項１に記載の自然言語の翻訳装置に
おいて、上記記憶部に格納された対訳例文データベースには、用
言の文字列パターンをルートノードとし、当該用言を用
いた文から抽出された少なくとも当該用言および付属語
の文字列パターンを当該ルートノードから分岐した各ノ
ードとする木構造を成すと共に、上記各ノードの文字列
パターンは親ノードの文字列パターンを詳細化した文字
列パターンになっているインデックス木を設けて、この
インデックス木におけるリーフノードの文字列パターン
を上記対訳例文データベースのインデックスとし、上記対訳例文検索部は、入力文から上記形態素解析部で
の形態素解析結果によって抽出された用言に基づいて、
当該用言を表す文字列パターンのルートノードを有する
インデックス木を検索し、この検索されたインデックス
木を用いて上記対訳例文データベースのインデックスを
得る構成に成したことを特徴とする自然言語の翻訳装
置。