JPH06290210A - 自然言語の翻訳装置 - Google Patents

自然言語の翻訳装置

Info

Publication number
JPH06290210A
JPH06290210A JP5075638A JP7563893A JPH06290210A JP H06290210 A JPH06290210 A JP H06290210A JP 5075638 A JP5075638 A JP 5075638A JP 7563893 A JP7563893 A JP 7563893A JP H06290210 A JPH06290210 A JP H06290210A
Authority
JP
Japan
Prior art keywords
sentence
translation
pattern
example sentence
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5075638A
Other languages
English (en)
Other versions
JP3176750B2 (ja
Inventor
Taro Morishita
太朗 森下
Kazuhiro Tsubaki
和弘 椿
Takahiro Yamaji
孝浩 山路
Yasuji Kobuchi
保司 小渕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP07563893A priority Critical patent/JP3176750B2/ja
Publication of JPH06290210A publication Critical patent/JPH06290210A/ja
Application granted granted Critical
Publication of JP3176750B2 publication Critical patent/JP3176750B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 文の構造解析や編集をすることなく質の高い
訳文を得る。 【構成】 記憶部2には対訳例文データベースを格納す
る。形態素解析部4は入力部1からの入力文を形態素解
析して述語を得る。表層パターン生成部5は形態素解析
結果に基づいて入力文の表層パターンを生成する。パタ
ーン比較部6は入力文の述語に基づいて対訳例文データ
ベースのインデックスを決定し、更に入力文の表層パタ
ーンを用いて当該インデックス下に在る変換パターンお
よび対訳例文を検索する。単純句翻訳部7は対訳例文を
参照して入力文の表層パターンにおけるカテゴリ・シン
ボルに対応する単語列を翻訳して変換パターン内の空欄
を埋めて目標言語の文字列パターンを得る。翻訳文生成
部8は目標言語の文字列パターンに基づいて完全な翻訳
文を生成する。こうして、入力文の構造解析や編集をす
ることなく質の高い訳文を得る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、自然言語で書かれた
文章を自動的に翻訳する自然言語の翻訳装置に関する。
【0002】
【従来の技術】従来より、機械翻訳装置としては、図7
に示すような解析レベルに従って、辞書情報と多数の解
析ルールを使用して目標言語との対応が取り易くなるレ
ベルまで原言語による入力文(以下、原文と言う)の解析
を行い、原文が表す意味的な内部構造を抽出するという
解析プロセスを採用した所謂トランスファー方式による
ものが主流である。
【0003】すなわち、先ず、原文に対する形態素解析
によって各単語に対する品詞列を求める。次に、構文解
析によって上記品詞列に対する句構造を求める。そし
て、最後に単語や句の用法に関する種々のデータを使っ
て意味解析を行って依存構造等の最終的な内部構造を得
る。こうして、目標言語との対応が取り易くなるレベル
まで解析されると、目標言語への変換規則を用いて同レ
ベルの目標言語に変換し、そこから構文生成,形態素形
成と生成プロセスを進めて目標言語を生成して行くので
ある。
【0004】このように、従来の機械翻訳装置では、解
析主導の翻訳プロセスが翻訳処理の前提となっている。
ところが、上記従来の解析主導の翻訳システムには以下
のような欠点がある。
【0005】 (1) 翻訳の専門家のような柔軟な意訳ができない 目標言語への変換規則は、通常機械的な置き換えによる
ものであり、分かりやすい表現の訳文にするための知識
は反映されてはいない。したがって、得られる訳文は堅
い表現になり、非常に分かりにくいものになっている。
そのために、現行の機械翻訳装置では、マニュアルによ
って翻訳結果を“後編集"して分かりやすい訳文に修正
したり、マニュアルによって入力文を“前編集"して機
械翻訳装置が容易に処理可能な文型に書き換えたりしな
ければ、妥当な訳文を得ることができないのである。
【0006】その結果、当然のことながら、人手を介す
ることなく、翻訳の専門家が訳すようなレベルの“意
訳"の訳文を得ることは極めて難しい。
【0007】 (2) 機械システムのメンテナンスや改良が困難 部分的に上記目標言語への変換規則等の解析ルールや経
験則を増やして翻訳システムを改良しようとしても、全
体の処理アルゴリズムに影響を及ぼしてしまうので変更
に伴う負担が大きい。また、翻訳システムを修正できた
としてもヒューリスティックに依存する部分が多く、ヒ
ューリスティックを統一的に制御する有効な手段を備え
てはいないために、翻訳改善の対象となった文に対して
は良好な改善結果が得られる一方で、別の文章に対して
は翻訳精度が低下してしまうという事態が発生し易い。
【0008】上述のように、解析主導の翻訳システムの
欠点を解消すべく、近年、例文主導の翻訳システムが提
唱されている。
【0009】この例文主導の翻訳システムでは、入力文
に最も類似した対訳例文(対訳を有する例文)を対訳例文
データベースから検索し、この検索した対訳例文の対訳
を利用して上記入力文に対する翻訳を得るようにしてい
る。この翻訳システムには、上記対訳例文データベース
に対訳例文を追加するだけで性能向上を図れるという利
点や、対訳例文によってカバーできる範囲内においては
意訳レベルでの翻訳が実施できるという利点がある。
【0010】
【発明が解決しようとする課題】しかしながら、上記従
来の例文主導の翻訳システムには以下のような問題点が
ある。現在提唱されている例文主導の翻訳システムにお
いては、上記対訳例文を検索する際に用いるキーとして
文章の依存構造を予め用意しておくものが多い。このた
めに、対訳例文の検索に際しては翻訳対象となる入力文
の依存構造を求める必要がある。そして、そのために
は、入力文章の形態素解析,構文解析,係り受け解析,意
味解析を正確に行わなければならない。
【0011】ところで、一般に、入力文に対する形態素
解析および構文解析の際には多数の解析候補が得られ
る。そして、長く複雑な文章になるほど得られる解析候
補の数が増大する。さらに、上記解析候補を絞り込むた
めの意味解析においては、拠り所となる規則が存在しな
い。そこで、通常は多数の経験則を用意しておいて状況
に応じて使い分けることになる。
【0012】その結果、長く複雑な文章になるほど、上
記得られた多数の解析候補から文意に沿った候補を一意
に絞り込むことが困難になるのである。したがって、上
記依存構造を有する対訳例文を上記対訳データベースに
格納する上記例文主導の翻訳システムでは、係り受け関
係の複雑な文章を正しく翻訳できる確率が低いという問
題点がある。
【0013】そこで、この発明の目的は、入力文の構文
解析,係り受け解析および意味解析等の解析プロセスを
適用する必要がなく且つ“後編集"および“前編集"を実
施することなく、係り受けの複雑な入力文であっても質
の高い訳文を得ることができる自然言語の翻訳装置を提
供することにある。
【0014】
【課題を解決するための手段】上記目的を達成するた
め、第1の発明の自然言語の翻訳装置は、入力部から入
力された自然言語による文章に対して形態素解析部で形
態素解析を行い、記憶部に格納されている訳例文データ
ベースから入力文に対応する例文とその対訳との対であ
る対訳例文を対訳例文検索部によって上記形態素解析結
果に基づいて検索し、この検索された対訳例文に基づい
て翻訳部で入力文章を目標言語に翻訳し、得られた翻訳
結果を表示部に表示する自然言語の翻訳装置において、
上記形態素解析部による入力文に対する形態素解析結果
に基づいて、上記入力文から、少なくとも用言及び付属
語の文字列とそれらに前後する単語列の構文カテゴリと
によって文の表層的特徴を表した表層パターンを所定の
手順で生成する表層パターン生成部を備えると共に、上
記対訳例文データベースに蓄積された各対訳例文にはこ
の対訳例文における例文の上記表層パターンを予め付加
し、上記対訳例文検索部は、上記対訳例文データベース
から該当する対訳例文を検索するに際して、上記表層パ
ターン生成部によって生成された入力文の表層パターン
と上記対訳例文に付加されている例文の表層パターンと
の類似度を求めることによって入力文に類似した例文を
有する対訳例文を検索する構成に成したことを特徴とし
ている。
【0015】また、第2の発明は、第1の発明の自然言
語の翻訳装置において、上記記憶部に格納された対訳例
文データベースには、用言の文字列パターンをルートノ
ードとし、当該用言を用いた文から抽出された少なくと
も当該用言および付属語の文字列パターンを当該ルート
ノードから分岐した各ノードとする木構造を成すと共
に、上記各ノードの文字列パターンは親ノードの文字列
パターンを詳細化した文字列パターンになっているイン
デックス木を設けて、このインデックス木におけるリー
フノードの文字列パターンを上記対訳例文データベース
のインデックスとし、上記対訳例文検索部は、入力文か
ら形態素解析部での形態素解析結果によって抽出された
用言に基づいて当該用言を表す文字列パターンのルート
ノードを有するインデックス木を検索し、この検索され
たインデックス木を用いて上記対訳例文データベースの
インデックスを得る構成に成したことを特徴としてい
る。
【0016】
【作用】第1の発明では、入力部から入力された自然言
語による文章に対して形態素解析部によって形態素解析
が実施され、この形態素解析結果に基づいて、表層パタ
ーン生成部によって、入力文から、少なくとも用言およ
び付属語の文字列とそれらに前後する単語列の構文カテ
ゴリとによって文の表層的特徴を表した表層パターンが
所定の手順で生成される。そうすると、対訳例文検索部
によって、記憶部の対訳例文データベースに蓄積された
各対訳例文に付加されている例文の表層パターンと上記
表層パターン生成部で生成された入力文の表層パターン
との類似度が求められる。そして、この類似度に基づい
て、入力文に類似した例文を有する対訳例文が検索され
る。
【0017】以後、この検索された対訳例文に基づい
て、翻訳部によって入力文章が目標言語に翻訳され、得
られた翻訳結果が表示部に表示される。こうして、文全
体の表層的特徴を表す表層パターンを用いた形態素レベ
ルでの類似度算出のみによって、非常に簡単に入力文に
対応する対訳例文を検索して質の良い翻訳が得られる。
【0018】また、第2の発明では、入力部から入力さ
れた入力文が形態素解析部によって形態素解析され、こ
の形態素解析結果に基づいて入力文の用言が抽出され
る。そうすると、対訳例文検索部によって、上記抽出さ
れた用言を表す文字列パターンのルートノードを有する
インデックス木が検索され、この検索されたインデック
ス木を用いて上記対訳例文データベースのインデックス
が得られる。
【0019】そして、こうして得られたインデックスを
用いて、上記対訳例文検索部によって、入力文の表層パ
ターンとの類似度算出の対象となる対訳例文候補が選出
される。
【0020】
【実施例】以下、この発明を図示の実施例により詳細に
説明する。この発明における自然言語の翻訳装置は、文
章の表層パターンを利用して対訳例文を検索する例文主
導の翻訳システムを備えた翻訳装置である。
【0021】図1は本実施例の自然言語の翻訳装置にお
ける概略ブロック図である。以下、便宜上、日本語によ
る原文を英語に翻訳する場合を例に上記自然言語の翻訳
装置を説明する。
【0022】入力部1はキーボードや光学文字読み取り
装置(OCR)等の入力機器で構成されて、上記対訳例文
や翻訳対象の文章等を入力する。記憶部2はRAM(ラ
ンダム・アクセス・メモリ)やROM(リード・オンリ・メモ
リ)等のメモリおよびこのメモリを制御するメモリ制御
手段で構成されて、単語辞書や対訳例文データベース等
を格納する。表示部3はCRT(カソード・レイ・チュー
ブ)等の表示機器で構成される。
【0023】形態素解析部4は、記憶部2のメモリに格
納されている単語辞書を引いて入力文章から単語列を切
り出し、品詞列を生成する。さらに、テンスやアスペク
ト等の情報を得る。表層パターン生成部5は、形態素解
析部4による形態素解析結果を用いて、入力部1からの
入力文の表層パターンを生成する。パターン比較部6
は、後に詳述するようにして、入力文章の表層パターン
の候補と記憶部2の上記メモリに格納されている対訳例
文データベースに用意されている表層パターンとの比較
を行って、入力文章に最も類似した表層パターンを有す
る対訳例文を検索する。
【0024】単純句翻訳部7は、複雑な埋め込み文のな
い名詞句(「本」,「その本」,「彼の本」,「美しい本」等)や、
空列を含む助動詞列が後続する述語等の単純な語句を対
象として、上記単語辞書のような簡単なルールのみに基
づいて翻訳処理を実行する。この単純句翻訳部7は、上
述した従来型の機械翻訳装置における一部の機能で代用
可能であるために、ここでは詳細な説明は省略する。
【0025】翻訳文生成部8は、上記目標言語における
単語の並びやテンスおよびアスペクト等の情報から、目
標言語による完全な翻訳文を生成する。尚、この翻訳文
生成部8についても従来型の機械翻訳装置における一部
の機能で代用可能であるために詳細な説明は省略する。
制御部9は、上記入力部1,記憶部2,表示部3,形態素
解析部4,表層パターン生成部5,パターン比較部6,単
純句翻訳部7および翻訳文生成部8を制御して、入力文
章の翻訳処理を実施する。
【0026】すなわち、上記パターン比較部6で上記対
訳例文検索部を構成し、単純句翻訳部7,翻訳文生成部
8および制御部9で上記翻訳部を成すのである。
【0027】本実施例の翻訳装置によって実施される翻
訳処理の概略は、入力文の表層パターンを用いて入力文
に最も類似した対訳例文を上記対訳例文データベースか
ら検索し、検索された対訳例文における対訳を基にして
入力文の翻訳文を得る処理である。以下、上記翻訳処理
について順を追って詳細に説明する。尚、ここで言う表
層パターンとは、文を特徴付ける単語とその他の部分単
語列の構文カテゴリとによって表されるものである。
【0028】先ず、上記記憶部2のメモリに格納される
対訳例文データベースについて説明する。図2および図
3は上記対訳例文データベースに関する説明図である。
図2は上記対訳例文データベースのインデックス構造を
示し、「ある」という動詞が述部となる和文を原文とする
複数の対訳例文のインデックス構造を例示している。
【0029】上記インデックスは、述語の終止形「ある」
をルートノードとし、その述語「ある」を含む表層の文字
列パターン「*は*が ある」,「*には*が ある」,「*は
*に*が ある」,…をルートノード以外のノードとする
木構造で表現される。尚、上記表層の文字列パターンに
おけるパターン要素は、各ノードに存在する述語「ある」
に対する必須格,任意格,省略格の格助詞および特徴的な
単語である。上記表層の文字列パターンは、リーフノー
ドに行くほど詳細に記述され、子ノードの文字列パター
ン(例えば、「*は*と*が ある」)は親ノードの文字列
パターン(例えば、「*は*が ある」)を詳細化した文字
列パターンになっている。
【0030】そして、上述のようなルートノードを幹と
する木構造を有するインデックス木の各リーフノードに
係る上記表層の文字列パターンを上記対訳例文データベ
ースのインデックスとし、このインデックスに対訳例文
が対応付けられている。したがって、入力文から抽出し
た述語の終止形をルートノードとするインデックス木を
上記入力文の表層の文字列に従って辿って行くことによ
って、該当する対訳例文を検索するためのインデックス
を決定できるのである。
【0031】図3は、「*には*が ある」という表層の
文字列パターンを有する和文を原文とする対訳例文を蓄
積した対訳例文データベースの構造例を示す。図3に示
すように、上記対訳例文データベースは、上記インデッ
クス(上記インデックス木のリーフノードに係る表層の
文字列パターン),表層パターン,変換パターンおよび対
訳例文からなる層構造を成している。
【0032】ここで、上記表層パターンは本実施例の中
心となるデータ構造であり、上述したように文を特徴付
ける単語(以下、特徴単語と言う)とその他の部分単語列
の構文カテゴリによって表される。ここで、上記特徴単
語とは、動詞,助詞および一部の特徴的な名詞であり、
図2に示すインデックスにおける各ノードの文字列パタ
ーンに具体的に表記された単語に対応する。また、上記
構文カテゴリとは、上記特徴単語に前後する単語列(す
なわち、上記インテックスでは“*"に対応する部分単
語列)の簡単な句構造を表すものである。
【0033】次に、上記表層パターンの構成法について
説明する。 (1) 対象となる文の中心用言とそれに係る任意格を含
めた格助詞,接続助詞および特徴的な名詞とを夫々抽出
して上記特徴単語とする。 (2) (1)で抽出された特徴単語に前後する部分単語列
の上記構文カテゴリを設定する。そして、その設定され
た構文カテゴリを次のようにカテゴリ・シンボルに置き
換える。 構文カテゴリ カテゴリ・シンボル 単純名詞句 → N 埋め込み文によって装飾された名詞句 → VP・N 動詞句 → VP … …
【0034】上述のようにして構成される表層パターン
を用いて、上記対訳例文データベースは次のように構成
される。以下、図3に従って対訳例文データベースの構
成について具体的に説明する。
【0035】「*には*が ある」というインデックス下
には、次のようなパターン1〜パターン3と命名された
3つの表層パターンが存在する。すなわち、 パターン1=“N1にはN2が ある" =“単純名詞句1+「には」+単純名詞句2+「が」+「あ
る」" パターン2=“VP・NIにはN2が ある" =“連体修飾述句+単純名詞句1+「には」+単純名詞句
2+「が」+「ある」" パターン3=“VPにはNが ある" =“述句+「には」+単純名詞句+「が」+「ある」"
【0036】さらに、各表層パターン下には、その表層
パターンを有する和文を英訳する際に用いられる変換パ
ターンが存在する。 例えば、 パターン1=“N1にはN2が ある" =“単純名詞句1+「には」+単純名詞句2+「が」+「あ
る」" に対しては、 変換パターン=“There BE T(N2) in T(N1)." が対応付けられており、 “「There」+BE動詞+単純名詞句2の翻訳結果+「in」+
単純名詞句1の翻訳結果" が変換されるべき英文のパターンであることを示してい
る。
【0037】ここで、上記変換パターンに見られる“T
(x)"という表記は、句“x"に対応する単語列を上記単
純句翻訳部7(図1参照)によって翻訳した結果を表す。
例えば、CASE01に示す対訳例文の場合には、“x"は
「庭」を表す単純名詞句であり、“T(x)"は「garden」であ
る。また、“Tch(x)という表記は、CASE番号“h"を
有する対訳例文の対訳英文を表す。例えば、CASE11に示
す対訳例文の場合には、“x"は「彼が学会誌に発表した
論文」を表す埋め込み文を含む名詞句であり、CASE番号
“11"の対訳例文に記載された同じ和文に対する対訳
英文を取り出すことによって、“Tc11(x)"=「the pap
er which he published in a scholar journal」が得ら
れる。尚、上記CASExxは、具体的な例文と対訳との対か
ら成る対訳例文を表す。例えば、CASE01の場合には、和
文「庭には池がある」と対を成す英訳文は「There is apon
d in the garden」である。
【0038】つまり、上記変換パターンは一種のテンプ
レートとなっており、対応する表層パターンを構成する
上記特徴単語に前後する部分単語列の翻訳結果で上記テ
ンプレートの空欄を埋めることによって翻訳英文が得ら
れるのである。
【0039】上述のような構造を有する対訳例文データ
ベースとして大量の対訳例文を蓄積しておけば、入力文
章の表層パターンと類似若しくは一致した表層パターン
を有する対訳例文を対訳例文データベースから検索する
ことによって、質の高い翻訳文を得ることが容易に可能
となるのである。
【0040】ここで、上述のような表層パターンを用い
て翻訳を実施することによって、次のような利点が得ら
れるのである。
【0041】(A)上記対訳例文データベースから入力文
に類似若しくは一致する対訳例文を検索する際に実施さ
れる表層パターンのマッチングは、1次元的な形態素解
析レベルでのパターンマッチングである。したがって、
依存構造解析のように2次元的な解析を行う必要がな
い。具体的には、上記依存構造解析の場合には、入力文
全体に対する係り受け解析および意味処理を含めた構文
解析を必要とする。これに対して、表層パターンのマッ
チングの場合には、文字列のパターンマッチング,形態
素解析および品詞列に対する極簡単なパターン認識処理
しか必要とはしない。したがって、入力文章の解析処理
が非常に単純なものとなる。
【0042】このように、上記対訳例文の検索に伴う解
析処理が簡単になることによって、従来型の例文主導の
翻訳システムに比較して長く複雑な入力文章に対する翻
訳処理時間が大幅に短縮される。
【0043】(B)上記従来型の例文主導による翻訳シス
テムで実施される依存構造解析は、局所的に解析ルール
を適用してマッチングを行い、得られた結果を積み上げ
るボトムアップ方式である。そのために、部分的には正
しく構造が解析されているにも拘わらず、文章全体とし
ては係り受け関係や句のまとまりが誤っている解析候補
が生成される場合が多い。
【0044】これに対して、上記表層パターンは文全体
を規定したものであるために、表層パターンのマッチン
グ処理に際しては巨視的に見た場合の翻訳の失敗を避け
ることができる。また、その結果、訳文候補の組み合わ
せの爆発を避けることができる。以上の理由から、本実
施例における表層パターンを用いた翻訳システムによれ
ば、長く複雑な文章に対する翻訳の精度が飛躍的に向上
するのである。
【0045】次に、上記入力部1から入力された入力文
章から上記表層パターンを抽出し、記憶部2のメモリに
格納された対訳例文データベースから上記入力文章に類
似した対訳例文を上記抽出された入力文章の表層パター
ンに基づいて検索する対訳例文検索処理動作について説
明する。
【0046】図4および図5は、上記制御部9によって
記憶部2,形態素解析部4,表層パターン生成部5および
パターン比較部6を制御して実施される対訳例文検索処
理動作のフローチャートである。以下、図4に従って、
上記対訳例文検索処理動作について詳細に説明する。
【0047】ステップS1で、上記形態素解析部4によ
って、入力部1から入力された入力文“S"の形態素が
解析されて単語列および品詞列が切り出され、テンスお
よびアスペクト等の情報が得られる。そして、得られた
入力文Sの単語列および品詞列から入力文Sの述語
“V"が決定される。ステップS2で、上記パターン比較
部6によって、上記ステップS1において決定された述
語Vをキーワードとして、図2の構造を有して上記対訳
例文に関連付けられた複数のインデックス木から当該述
語Vと同じ文字列パターンをルートノード(以下、“ル
ートノードV"と言う)とするインデックス木が検索され
る。
【0048】ステップS3で、さらに上記パターン比較
部6によって、上記検索されたインデックス木における
ルートノードVから分岐している各子ノードchild(V)の
文字列パターンのパターン要素をキーワードとして、全
子ノードchild(V)の文字列パターンと入力文Sの文字列
とが比較される。ステップS4で、上記キーワードであ
るパターン要素が入力文Sの文字列中に在るような子ノ
ードchild(V)が存在するか否かが判別される。その結果
存在すればステップS5に進み、存在しなければ上記対
訳例文データベース内に入力文Sに類似する対訳例文は
ないとして対訳例文検索処理動作を終了する。
【0049】ステップS5で、当該子ノードを親ノード
“F"とする。ステップS6で、上記パターン比較部6に
よって、子ノードchild(F)に係る上記パターン要素をキ
ーワードとして、全子ノードchild(F)の文字列パターン
と入力文Sの文字列とが比較される。ステップS7で、
上記パターン要素が入力文Sの文字列中に在るような子
ノードchild(F)が存在するか否かが判別される。その結
果、存在すればステップS5に戻って当該子ノードchild
(F)から分岐したノードに対する処理に移行する。一
方、存在しなければステップS8に進む。
【0050】ステップS8で、上記ノードFはリーフノ
ードであるから、このノードFの文字列パターンが入力
文Sに類似した対訳例文を検索する際のインデックスで
あると決定される。ここで、便宜上、上記インデックス
を“*P1*P2*…*Pj*…*PJ・V"と表す。但し、
“Pj(j=1〜J)"はj番目のインデックス要素であ
り、“*"は上記インデックス要素に前後する部分文字
列である。ステップS9で、上記ステップS8において決
定されたインデックスの文字列パターンにおけるインデ
ックス要素が参照されて、入力文Sの文字列が上記イン
デックス要素と同じ文字の箇所で分割される。その際
に、上記入力文Sの文字列に上記インデックス要素と同
一の部分文字列が複数あるために分割箇所が一意に決ま
らない場合には、総ての分割候補が求められて保持され
る。ここで、上記分割候補がI個あるとした場合には、
このI個の分割候補の集合{bi}は次のように表され
る。 {bi}={conc(Sij・Pj)j=1〜J}i=1〜I 但し、Sij:j番目のインデックス要素Pjの直前に位
置する“*"に対応する部分文字列
【0051】ステップS10で、分割候補番号iと表層パ
ターン番号kとに“1"がセットされる。また、マッチ
ング評価値Ekと最大マッチング評価値Ek'と最大マッ
チング評価値を呈する表層パターン番号k'と最大評価
値を呈する分割候補番号i'に“0"がセットされる。ス
テップS11で、上記表層パターン生成部5によって、i
番目の分割候補biの各部分文字列(Sij)j=1〜Jに対し
て形態素解析が実施されて、以下のような分割候補bi
の表層パターンbpiが求められる。 bpi=[Xij・Pj]j=1〜J 但し、Xij:部分文字列Sijを形態素解析して得られた
品詞列H1,…,Hr,…,HRに対して割り当てられる上記
カテゴリ・シンボル列
【0052】上記カテゴリ・シンボル列Xijの割り当て
は、次のような割り当てルールを適用して実施される。 (a) 品詞HRが動詞,動詞に続く付属語,名詞に続く述
語型助動詞である場合にはカテゴリ・シンボル“VP"を
割り当てる。 (b) 品詞HRが名詞,名詞に続く接辞であり、且つ、r
<Rであるrに対して連体形の動詞である品詞Hrが存
在する場合には、カテゴリ・シンボル列“VP・N"を割
り当てる。 (c) 品詞HRが名詞,名詞に続く接辞であり、且つ、r
<Rであるrに対して動詞である品詞Hrが存在しない
場合にはカテゴリ・シンボル“N"を割り当てる。
【0053】ステップS12で、上記対訳例文データベー
スから上記ステップS8において決定されたインデック
ス下に在るk番目の表層パターン(以下、任意のインデ
ックス下に在る表層パターンをインデックス内表層パタ
ーンと言う)dpkが読み出される。ここで、当該インデッ
クス下にはK個のインデックス内表層パターンdpkが在
るものとすると、このK個のインデックス内表層パター
ンの集合{dpk}は次のように表される。 {dpk}={[Ckj・Pj]j=1〜J}k=1〜K 但し、Ckj:j番目の上記特徴単語Pjの直前に位置す
るカテゴリ・シンボル列 つまり、上記インデックス内表層パターンは、入力文S
と同じ述語Vを含む入力文Sと同じ上記表層の文字列パ
ターンを有する表層パターンであると言える。ステップ
S13で、上記パターン比較部6によって、上記ステップ
S11において求められた入力文Sの表層パターンbpi
カテゴリ・シンボル列Xijと上記ステップS12において
読み出されたインデックス内表層パターンdpkのカテゴ
リ・シンボル列Ckjとが、総てのjについて比較され
る。その結果、Xij=CkjまたはXij≒Ckjであればス
テップS18に進む。一方、Xij≠Ckjであればステップ
S14に進む。ここで、上記“Xij≒Ckj"とは、カテゴ
リ・シンボルXijあるいはカテゴリ・シンボルCkjのうち
何れか一方のヘッドフィーチャーが他方のカテゴリ・シ
ンボルと一致する場合である。
【0054】ステップS14で、上記インデックス内表層
パターンdpkの表層パターン番号kの内容が最大値“K"
より小さいか否かが判別される。その結果最大値“K"
より小さければステップS15に進み、そうでなければス
テップS16に進む。ステップS15で、表層パターン番号
kの内容がインクリメントされてステップS12に戻り、
次のインデックス内表層パターンの処理に移行する。ス
テップS16で、上記分割候補番号iの内容が最大値
“I"より小さいか否かが判別される。その結果最大値
“I"より小さければステップS17に進み、そうでなけ
ればステップS21に進む。ステップS17で、分割候補番
号iの内容がインクリメントされてステップS11に戻
り、入力文Sの次の分割候補の表層パターンに対する処
理に移行する。
【0055】ステップS18で、上記ステップS13での
比較結果に基づいて、入力文S(分割候補bi)の表層パ
ターンbpiとインデックス内表層パターンdpkとの間のマ
ッチング評価値Ekが以下のようにして算出される。す
なわち、先ず、上記分割候補biの表層パターンbpiのカ
テゴリ・シンボル列Xijと上記インデックス内表層パタ
ーンdpkのカテゴリ・シンボル列Ckjとの比較結果に基づ
いて、以下のようにマッチ度CEkjが設定される。
【0056】上記マッチ度CEkjは次のように設定され
る。 (イ) カテゴリ・シンボル列Xijとカテゴリ・シンボル列
kjとが完全に一致する場合(Xij=Ckj) 例えば、Xij及びCkjが共に埋め込み文によって装飾さ
れた名詞句“VP・N"である場合には、マッチ度CEkj
に“1.0"を与える。 (ロ) カテゴリ・シンボル列Xijとカテゴリ・シンボル列
kjのヘッドフィーチャーとが一致する場合(Xij≒C
kj) 例えば、Xijが単純名詞句“N"でCkjが埋め込み文に
よって装飾された名詞句“VP・N"である場合には、マ
ッチ度CEkjに“0.5"を与える。 (ハ) カテゴリ・シンボル列Xijのヘッドフィーチャー
とカテゴリ・シンボル列Ckjとが一致する場合(Xij≒C
kj) 例えば、Xijが埋め込み文によって装飾された名詞句
“VP・N"でCkjが単純名詞句“N"である場合には、
マッチ度CEkjに“0.5"を与える。
【0057】こうして、総ての“j"についてマッチ度
CEkjが与えられると(すなわち、分割候補biの表層パ
ターンbpiとインデックス内表層パターンdpkとが一致あ
るいは類似すると)、j個のマッチ度CEkjの和が算出
されて表層パターンbpiとインデックス内表層パターンd
pkとの間のマッチング評価値Ekが得られる。
【0058】ステップS19で、上記記憶部2のメモリに
現在保持されている最大マッチング評価値Ek'と上記算
出されたマッチング評価値Ekとが比較される。その結
果、当該マッチング評価値Ekの方が最大マッチング評
価値Ek'よりも大きい場合にはステップS20に進む。一
方、最大マッチング評価値Ek'以下であればステップS
14に戻って、次のインデックス内表層パターンが在れば
次のインデックス内表層パターンに対する処理に移行す
る。ステップS20で、上記記憶部2によって、メモリに
格納されている上記最大マッチング評価値Ek'を呈する
表層パターン番号k'が当該表層パターン番号“k"に更
新され、最大マッチング評価値Ek'を呈する分割候補番
号i'が当該分割候補番号“i"に更新され、そして最大
マッチング評価値Ek'が当該マッチング評価値“Ek"に
更新される。その後、ステップS14に戻って、次のイン
デックス内表層パターン在れば次のインデックス内表層
パターンに対する処理に移行する。
【0059】ステップS21で、入力文Sに係る総ての分
割候補bi(i=1〜N)および上記対訳例文データベー
スにおける当該インデックス下に在る総てのインデック
ス内表層パターンdpk(k=1〜K)に関する検索処理が
終了したので、最大マッチング評価値Ek'を呈するイン
デックス内表層パターン下に在る対訳例文が出力され
る。また、最大マッチング評価値Ek'を呈する分割候補
の表層パターンが出力される。こうして、入力文Sの表
層パターンに類似したあるいは一致した表層パターンを
有する対訳例文が出力されて、対訳例文検索処理動作を
終了する。
【0060】このようにして、入力文Sに類似あるいは
一致した対訳例文が得られると、当該対訳例文と当該対
訳例文上に在る上記変換パターンとを入力文Sに適用し
て目標言語の具体化された文字列パターンを得る。その
際における入力文Sへの適用とは、当該変換パターン内
における表記T(x)に対応する当該分割候補bi内にお
ける部分文字列Sijの上記単純句翻訳部7による翻訳
や、当該変換パターン内における表記“Tch(x)"で指
定された対訳例文を用いた部分翻訳を意味する。
【0061】こうして、上記目標言語の具体化された文
字パターンが得られると、上記翻訳文生成部8によっ
て、形態素解析部4による形態素解析で得られたテンス
およびアスペクトに関する情報や訳文生成ルールに基づ
いて、目標言語に具体化された文字パターンの時制,人
称および数等の表現の検査/修正が行われて完全な翻訳
文が生成される。そして、生成された翻訳結果は表示部
3に出力されて表示される。
【0062】次に、本実施例における翻訳装置によって
実施される例文主導の翻訳処理について、入力例文を上
げて図1〜図5を参照して順を追って具体的に説明す
る。
【0063】和文による入力文S「彼が買った本には落
丁があった」が入力部1から入力される。そうすると、
形態素解析部4で形態素解析が行われて述語V「ある」が
決定され、入力文Sの時制情報“過去"が得られる。…
ステップS1 上記述語V「ある」がルートノードになっている図2に示
すインデックス木が検索される。そして、この検索され
たインデックス木の子ノードの文字列パターンと入力文
S「彼が買った本には落丁あった」の文字列とが比較さ
れて、インデックス「*には*が ある」が決定される。
…ステップS2〜ステップS8
【0064】上記インデックス「*には(P1)が(P2)
る」が参照されて、入力文S「彼が買った本には落丁
った」が分割される。その際に、インデックス要素P
1(=「には」)とこれに続くP2(=「が」)とは入力文S中に
各々一回しか出現しないので、分割候補はb1唯一つだ
け存在する。 b1「彼が買った本(S11)/には(P1)/落丁(S12)/(P2)/
ある(V)」…ステップS9 次に、上記分割候補b1内の部分文字列S11(=「彼が買
った本」)及び部分文字列S12(「落丁」)に対する形態素解
析が実施される。そして、上記部分文字列S11(=「彼が
買った本」)には上記割り当てルール(b)が適用されてカ
テゴリ・シンボルX11(=VP・N)に変換される。一方、
部分文字列S12(=「落丁」)には割り当てルール(c)が適
用されてカテゴリ・シンボルX12(=N)に変換される。
その結果、上記入力文Sにおける分割候補b1の表層パ
ターンbp1が次のように求められる。 bp1=“VP・NにはNが ある"…ステップS10,ステッ
プS11
【0065】上記対訳例文データベースにおけるインデ
ックス「*には*が ある」下にはパターン1,パターン2
およびパターン3と命名された3つのインデックス内表
層パターンdp1,dp2,dp3が存在する。そこで、上記分割
候補b1の表層パターンbp1と各インデックス内表層パタ
ーンdp1,dp2,dp3の夫々とが比較される。 bp1とdp1との比較 bp1=“VP・N(X11) には N(X12) が ある" dp1=“ N1(C11) には N2(C12) が ある" したがって、X11≒C11 → マッチ度CE11=0.5 X12=C12 → マッチ度CE121.0 マッチング評価値E1=1.5 bp1とdp2との比較 bp1=“ VP・N(X11) には N(X12) が ある" dp2=“VP・N1(C21) には N2(C22) が ある" したがって、X11=C21 → マッチ度CE21=1.0 X12=C22 → マッチ度CE221.0 マッチング評価値E2=2.0 bp1とdp3との比較 bp1=“VP・N(X11) には N(X12) が ある" dp3=“ VP(C31) には N(C32) が ある" したがって、X11≠C31 分割候補bの表層パターンbp1と見出し内表層パター
ンdp3とは別表層パターンである。…ステップS12〜ス
テップS18
【0066】およびでの比較結果により、 マッチング評価値E1(=1.5)<マッチング評価値E2
(=2.0) であるから、インデックス内表層パターンdp2が入力文
Sに最も類似したインデックス内表層パターンであると
確定される。その結果、類似対訳例文としてCASE11と命
名された 例文「彼が学会誌に発表した論文には誤りがある」 対訳「There are some errors in the paper which he published in a scholar journal」 の対が出力される。さらに、上記入力文Sの表層パター
ン bp1=“VP・NにはNが ある"が出力される。
…ステップS19〜ステップS21
【0067】こうして、入力文S「彼が買った本には落
丁があった」の類似対訳例文が得られると、この得られ
た対訳例文上に在る上記変換パターン「 There BE T(N2) in Tch(VP・N1).」 に入力文Sが次にように適用される。 Tch(VP・N1=彼が買った本) → 「the book which
he bought」 T(N2=落丁) → 「missing page」 但し、この場合には、変換パターン「There BE T(N2)
in Tc12(VP・N1).」下には、例えば、 CASE12 VP=彼が買った N1=本 N2=誤り There are some errors in the book which he bought. なる対訳例文が記述されているものとする。
【0068】こうして、和文による上記入力文S「彼が
買った本には落丁があった」の目標言語(英語)に具体化
された次のような文字列パターン記述が得られる。「 There BE missing page in the book which he bough
t.」 以後、この目標言語に具体化された文字列パターンと上
記時制情報とに基づいて、上記訳文生成ルールを適用し
て、目標言語による翻訳文「 There were some missing pages in the book which h
e bought.」 を得るのである。
【0069】上述の例では、説明の便宜を図るためにご
く簡単な係り受け構造しか持たないような入力文Sの翻
訳プロセスについて述べているが、更に複雑な係り受け
構造を有する文章に対しても適切な翻訳文を得ることが
可能である。例えば、以下のような入力文「 ハードウェアの構成は、本体とKBD,FDが一体になって
いるスタンドアロン型と、本体と一部が分離しているデ
スクトップ型の2種類があります。」 は、並列句が多く係り受け関係が複雑である。したがっ
て、入力文章を一から解析する従来の解析主導の翻訳シ
ステムや依存構造を用いた例文主導の翻訳システムで
は、入力文の解析段階で正しい解析結果を得ることが極
めて困難である。したがって、高い翻訳精度は得られ
ず、翻訳の専門家のような意訳ができず翻訳の質は低
い。
【0070】ところが、本実施例によれば、以下のよう
に高精度で且つ質の高い翻訳文が得られるのである。す
なわち、図6に示すように、上記対訳例文データベース
に、 ・インデックス “*は*と*の2*が ある" ・インデックス内表層パターン “N1はVP1・N2とVP2・N3の2N4がある" ・変換パターン 「There are two N4 of N1:N2 and N3. In the N2,Tc(VP1). In the N3,Tc(VP2).」 ・対訳例文 N1=推論の方式 N2=帰納法 N3=演繹法 N4=種
類 VP1=事実から規則を導く VP2=規則から事実
を導く 「There are two kinds of inference method:inducti
on and deduction. In the induction,rules are infered from facts. In the deduction,facts are infered from rules.」 を格納しておく。
【0071】上記入力部1から上記入力文S「ハードウ
ェアの構成は、本体とKBD,FDが一体になっているスタン
ドアロン型と、本体と一部が分離しているデスクトップ
型の2種類があります。」が入力されると、上述のように
形態素解析部2によって述語V「ある」が決定される。そ
して、上記パータン比較部5によってルートノードV
“ある"のインデックス木が検索され、入力文Sの文字
列に対応するインデックス“*は*と*の2*が ある"
が求められる。こうして、上記対訳例文データベースの
インデックスが決定されると、上述と同様に、決定され
たインデックス下に在るインデックス内表層パターン,
変換パターンおよび対訳例文を用いて入力文Sの目標言
語に具体化された文字列パターン記述が得られるのであ
る。
【0072】このように、長く複雑な係り受けを有する
入力文章であっても、その入力文章の表層パターンと同
じ表層パターンを呈する対訳例文を対訳例文データベー
スに登録しておくだけで、翻訳生成に失敗することはな
いのである。また、長い文章の場合には、文意を取り易
いように変換パターンおよび対訳例文の対訳を夫々複数
に分割して(図6の場合には3つに分割)意訳するパター
ンで記述しておくことによって、専門家による翻訳に近
い意訳が可能となる。
【0073】上述のように、本実施例では、入力文章の
表層の文字列パターンのマッチングおよび入力文章の文
字列における上記特徴単語に前後する部分単語列の上記
構文カテゴリのマッチングのみを実施すればよく、入力
文章を解析して得られた複雑な依存構造によるマッチン
グを実施する必要がない。したがって、任意格や並列句
を含む複雑な係り受け構造を有する入力文章にも容易に
対処できる。
【0074】尚、本実施例の翻訳装置では上記対訳例文
をどれだけ網羅するかによって翻訳性能が決まる。一
方、文の表層の文字列パターンの木を使用して対訳例文
データベースをインデキシングするようにしている。し
たがって、本実施例の翻訳装置によれば、文法の専門家
でなくとも系統的に対訳例文を増やして行くことが可能
であり、翻訳性能の向上や翻訳システムの改良やメンテ
ナンスを容易に実施できる。
【0075】この発明における対訳例文検索処理動作の
アルゴリズムは図4および図5に示すフローチャートに
限定されるものではない。また、上記対訳例文データベ
ースの具体的構成は、図3および図6に示すような構成
に限定されるものではない。
【0076】
【発明の効果】以上より明らかなように、第1の発明の
自然言語の翻訳装置は、形態素解析部による入力文の形
態素解析結果に基づいて、上記入力文から、少なくとも
用言および付属語の文字列とそれらに前後する単語列の
構文カテゴリとによって文の表層的特徴を表す表層パタ
ーンを表層パターン生成部によって生成し、対訳例文検
索部によって、上記表層パターン生成部で生成された入
力文の表層パターンと上記対訳例文に付加された例文の
表層パターンとの類似度を求めることによって入力文に
類似した例文を有する対訳例文を検索するようにしたの
で、形態素レベルでの類似度算出によって上記対訳例文
データベースから容易に該当する対訳例文を検索し、こ
の検索された対訳例文を用いて例文主導の翻訳処理を実
施できる。
【0077】したがって、この発明によれば、入力文の
構文解析,係り受け解析および意味解析等の2次元的な
解析プロセスを適用することなく、“後編集"および
“前編集"の実施の必要のない例文主導の翻訳処理を非
常に簡単に且つ短時間に実施できるのである。
【0078】さらに、その際における上記対訳例文検索
部による類似度算出は、文全体の表層的特徴を表した表
層パターンを用いて実施される。したがって、この発明
によれば、係り受けの複雑な入力文であっても質の高い
訳文を容易に得ることができる。
【0079】また、第2の発明の自然言語の翻訳装置
は、記憶部に格納された対訳例文データベースに、用言
の文字列パターンをルートノードとし、当該用言を用い
た文から抽出された少なくとも当該用言および付属語の
文字列パターンを各ノードとする木構造を有するインデ
ックス木を設けて、このインデックス木のリーフノード
の文字列パターンを上記対訳例文データベースのインデ
ックスとし、上記対訳例文検索部は、上記形態素解析部
での形態素解析結果によって抽出された用言に基づいて
インデックス木を用いて上記対訳例文データベースのイ
ンデックスを得るような構成にしたので、得られたイン
デックスに基づいて、上記対訳例文検索部による類似度
計算の対象となる対訳例文候補を容易に選出できる。
【0080】したがって、上記対訳例文検索部は、上記
インデックスに基づいて選出された対訳例文候補に付加
されている上記表層パターンに付いてのみ上記入力文の
表層パターンとの類似度を求めればよく、入力文に類似
した例文を有する対訳例文の検索を更に容易に且つ短時
間に実施できる。
【図面の簡単な説明】
【図1】この発明の自然言語の翻訳装置におけるブロッ
ク図である。
【図2】図1における記憶部に格納された対訳例文デー
タベースを検索する際に使用されるインデックス木の説
明図である。
【図3】対訳例文データベースの構成例を示す図であ
る。
【図4】対訳例文検索処理動作のフローチャートであ
る。
【図5】図4に続く対訳例文検索処理動作のフローチャ
ートである。
【図6】図3とは異なる対訳例文データベースの構成例
を示す図である。
【図7】解析主導の翻訳プロセスにおける解析レベルの
説明図である。
【符号の説明】
1…入力部、 2…記憶部、3…
表示部、 4…形態素解析部、5
…表層パターン生成部、 6…パターン比較
部、7…単純句翻訳部、 8…翻訳文生
成部、9…制御部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小渕 保司 大阪府大阪市阿倍野区長池町22番22号 シ ャープ株式会社内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力部から入力された自然言語による文
    章に対して形態素解析部で形態素解析を行い、記憶部に
    格納されている訳例文データベースから入力文に対応す
    る例文とその対訳との対である対訳例文を対訳例文検索
    部によって上記形態素解析結果に基づいて検索し、この
    検索された対訳例文に基づいて翻訳部で入力文章を目標
    言語に翻訳し、得られた翻訳結果を表示部に表示する自
    然言語の翻訳装置において、 上記形態素解析部による入力文に対する形態素解析結果
    に基づいて、上記入力文から、少なくとも用言および付
    属語の文字列とそれらに前後する単語列の構文カテゴリ
    とによって文の表層的特徴を表した表層パターンを所定
    の手順で生成する表層パターン生成部を備えると共に、 上記対訳例文データベースに蓄積された各対訳例文に
    は、この対訳例文における例文の上記表層パターンを予
    め付加し、 上記対訳例文検索部は、上記対訳例文データベースから
    該当する対訳例文を検索するに際して、上記表層パター
    ン生成部によって生成された入力文の表層パターンと上
    記対訳例文に付加されている例文の表層パターンとの類
    似度を求めることによって、入力文に類似した例文を有
    する対訳例文を検索する構成に成したことを特徴とする
    自然言語の翻訳装置。
  2. 【請求項2】 請求項1に記載の自然言語の翻訳装置に
    おいて、 上記記憶部に格納された対訳例文データベースには、用
    言の文字列パターンをルートノードとし、当該用言を用
    いた文から抽出された少なくとも当該用言および付属語
    の文字列パターンを当該ルートノードから分岐した各ノ
    ードとする木構造を成すと共に、上記各ノードの文字列
    パターンは親ノードの文字列パターンを詳細化した文字
    列パターンになっているインデックス木を設けて、この
    インデックス木におけるリーフノードの文字列パターン
    を上記対訳例文データベースのインデックスとし、 上記対訳例文検索部は、入力文から上記形態素解析部で
    の形態素解析結果によって抽出された用言に基づいて、
    当該用言を表す文字列パターンのルートノードを有する
    インデックス木を検索し、この検索されたインデックス
    木を用いて上記対訳例文データベースのインデックスを
    得る構成に成したことを特徴とする自然言語の翻訳装
    置。
JP07563893A 1993-04-01 1993-04-01 自然言語の翻訳装置 Expired - Fee Related JP3176750B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07563893A JP3176750B2 (ja) 1993-04-01 1993-04-01 自然言語の翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07563893A JP3176750B2 (ja) 1993-04-01 1993-04-01 自然言語の翻訳装置

Publications (2)

Publication Number Publication Date
JPH06290210A true JPH06290210A (ja) 1994-10-18
JP3176750B2 JP3176750B2 (ja) 2001-06-18

Family

ID=13581999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07563893A Expired - Fee Related JP3176750B2 (ja) 1993-04-01 1993-04-01 自然言語の翻訳装置

Country Status (1)

Country Link
JP (1) JP3176750B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001016794A1 (fr) * 1999-08-31 2001-03-08 Sony Corporation Procede et dispositif informatique et support d'enregistrement
JP2012141879A (ja) * 2011-01-05 2012-07-26 Fuji Xerox Co Ltd 対訳情報検索装置、翻訳装置及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001016794A1 (fr) * 1999-08-31 2001-03-08 Sony Corporation Procede et dispositif informatique et support d'enregistrement
US7010477B1 (en) 1999-08-31 2006-03-07 Sony Corporation Information processing device information processing method, and recording medium
JP2012141879A (ja) * 2011-01-05 2012-07-26 Fuji Xerox Co Ltd 対訳情報検索装置、翻訳装置及びプログラム
US8909511B2 (en) 2011-01-05 2014-12-09 Fuji Xerox Co., Ltd. Bilingual information retrieval apparatus, translation apparatus, and computer readable medium using evaluation information for translation

Also Published As

Publication number Publication date
JP3176750B2 (ja) 2001-06-18

Similar Documents

Publication Publication Date Title
JP3189186B2 (ja) パターンに基づく翻訳装置
US5895446A (en) Pattern-based translation method and system
US20080040095A1 (en) System for Multiligual Machine Translation from English to Hindi and Other Indian Languages Using Pseudo-Interlingua and Hybridized Approach
US20020111792A1 (en) Document storage, retrieval and search systems and methods
JP2006012168A (ja) 翻訳メモリシステムにおいてカバレージおよび質を改良する方法
WO2003083708A2 (en) Machine translation
Sawalha Open-source resources and standards for Arabic word structure analysis: Fine grained morphological analysis of Arabic text corpora
Bollmann Normalization of historical texts with neural network models
JP2004513458A (ja) ユーザが変更可能な翻訳のウエイト
US5608623A (en) Special cooccurrence processing method and apparatus
CN113408307B (zh) 一种基于翻译模板的神经机器翻译方法
JP3176750B2 (ja) 自然言語の翻訳装置
JP3326646B2 (ja) 機械翻訳システム用辞書・ルール学習装置
KR100745367B1 (ko) 템플릿에 기반한 기록정보 색인 및 검색 방법과 이를이용한 질의응답 시스템
KR100327115B1 (ko) 부분 대역 패턴 데이터베이스에 기반한 번역문 생성장치및 그 방법
Sankaravelayuthan et al. A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam
JP3892227B2 (ja) 機械翻訳システム
JP3419748B2 (ja) 辞書作成装置および方法と辞書作成プログラムを記録した記録媒体
Kadhem et al. English to Arabic example-based machine translation system
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
Sugandhi et al. Addressing challenges in multilingual machine translation
Ahmad Ontological Approach for Semantic Modelling of Malay Translated Qur’an
Barker Noun modifier relationship analysis in the TANKA system
KR950002705B1 (ko) 음성합성 시스템의 운율제어용 구문 분석장치와 방법
Powell et al. Natural language and voice output for relational data base systems

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080406

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090406

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090406

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100406

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100406

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110406

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees