JPH06348751A - 言語変換装置 - Google Patents

言語変換装置

Info

Publication number
JPH06348751A
JPH06348751A JP5142729A JP14272993A JPH06348751A JP H06348751 A JPH06348751 A JP H06348751A JP 5142729 A JP5142729 A JP 5142729A JP 14272993 A JP14272993 A JP 14272993A JP H06348751 A JPH06348751 A JP H06348751A
Authority
JP
Japan
Prior art keywords
sentence
information
pattern
intermediate structure
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5142729A
Other languages
English (en)
Inventor
Masayuki Kameda
雅之 亀田
Anuiru Fuirisu
アンウイル フイリス
Yoshitoshi Yamauchi
佐敏 山内
Hirokawa Hayashi
大川 林
Takashi Katooka
隆 加登岡
Masumi Narita
真澄 成田
Hideo Ito
秀夫 伊東
Hiroko Hayashi
寛子 林
Sakiko Honma
咲子 本間
Yoshihisa Oguro
慶久 大黒
Ayako Oono
亜矢子 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP5142729A priority Critical patent/JPH06348751A/ja
Priority to US08/149,661 priority patent/US5675815A/en
Publication of JPH06348751A publication Critical patent/JPH06348751A/ja
Priority to US08/451,569 priority patent/US5646840A/en
Priority to US08/451,553 priority patent/US5845143A/en
Priority to US08/452,336 priority patent/US5652896A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 目的言語側の文化によって原言語側の文化的
背景を吸収し、原言語側で表現している事柄を的確に目
的言語側の表現に訳出する。 【構成】 原文(J)を一文毎に解析し、原言語中間構
造(S)を得る。翻訳対象の文書の分野を判別し、
(S)の内容を分析する。(S)からIC(対象となる
文の真に言いたい事柄の中心となる言語)となり得る単
語を抽出し、抽出されたICを含む文パターンを同定す
る。文パターンが要求する要求情報を(S)から抽出す
る。文パターンと要求情報から訳文の中間構造(T)を
決定し、(T)より表層の訳文を生成する。

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、言語変換装置に関し、より詳細
には、文書作成、自然言語処理技術、特に二言語間にま
たがる翻訳技術機械翻訳における言語変換装置に関す
る。例えば、機械翻訳装置,文書作成装置,CAI(Co
mputer Assisted Instruction)外国語作成支援システ
ム、ワープロ、パソコン、パーソナルワープロ等のOA
機器全般に適用されるものである。
【0002】
【従来技術】図99(a)は、従来の機械翻訳の一例を
示す図で、一般的に構文トランスファー方式といわれて
いる。まず原文を解析し、目的言語の中間構造に移しや
すい原言語側の中間構造をつくる。その内容にしたがっ
て目的言語の中間言語に変換をし、そこから目的言語の
表層の訳文を生成する。この方式は、論理的に正確な訳
文ができたとしても、日本語と英語のように文化的背景
が全く違う言語間の翻訳だと、訳文側のネイティブが意
味の取れない文となることが多い。図99(b)は、従来
の機械翻訳の他の例を示す図で、原文の解析結果は、ど
んな言語にも依存しない構造・内容を作る。その内容に
従って目的言語の表層の訳文を生成する。この方式も文
化的背景まで吸収しきれておらず、したがって、読みに
くい訳文になってしまうことが多い。
【0003】また、本発明に係る従来技術を記載した公
知文献としては、以下のものがある。 特開昭63−44276「生成文法自動生成装置」 前記図99(b)に示すように、原言語を概念構造まで
解析し、その内容に従って目的言語の表層を生成しよう
とするものである。この技術は、どんな言語にも依存せ
ずに、どんな言語をも超越した中間構造を設定している
が、現実問題として、そのような言語構造を得ることが
できていない。また、今後もできる見通しもない。その
結果、そこにできた概念構造は、原言語に依存した内容
になってしまっており、そこから生成される訳文は、目
的言語のネイティブにとって非常に読みにくい訳文とな
ってしまう。 「ユーザ協調型日本語生成システム」(熊野 明,野
上裕康,他:情報処理学会 第42回(平成3年前期)全国
大会 2C−9) このシステムは、訳文を利用する側の人がオペレーショ
ンをすることを前提に提案されているもので、原文の内
容と違った内容の訳文が出力されたら、あるいは出力さ
れそうになったら、訂正や変更をしたり、補助的な情報
を入力として質の良い訳文を得ようとするものである。
そのため、原文の知識が少なからず必要となる。
【0004】 「外国語手紙文の自動作成について」
(斎藤博昭,富田 勝:「自然言語処理技術シンポジウ
ム」,昭和59年11月) 訳文側の知識が全くない人のために、原言語側の知識だ
けで目的言語側の相手側へ手紙を書こうとするシステム
の提案で、質の良い手紙を作成できるということでは非
常に優れている。しかし、それも手紙の「書出し」と「書
き終わり」の部分だけであり、内容は一般にいう例文集
を穴埋め型にしたレベルの技術であり、柔軟性に欠け、
典型パターン以外で言いたいことが生じても全く対応で
きない。 「目的言語の知識を用いた訳語選択」(野美山 浩:
情報処理学会 第42回(平成3年前期)全国大会 2C−4) 言語の種類によって共起する動詞と名詞の関係が異なる
ことにより、訳文が読みにくくなっていることに着目し
て、より適切な訳語を得ようとするものである。しか
し、これは、文全体の言回しでの分りにくさを解決して
いない。 Satoshi Sato, Makoto Nagao:「Toward Memory-bas
ed Translation」 比較的に分りの良い訳文とその原文をより多く集めて、
例文集としてシステム内に記憶させ、新たな原文が入力
されたら、その例文の中から一番近い文を選んで原文の
内容と部分的に違う部分を検出して変更するというもの
で、比較的に質の良い訳文が得られるが、全てのパター
ンに合致する例文を事前に収集するのは不可能であり、
原文にマッチする例文を取りだすことができなかったと
きには、全く訳出ができなくなってしまう。
【0005】また、対象とする文の真に言いたい事柄
(概念:Idea)の中心となる言葉であるIC(Idea Cen
ter)とそれによって駆動される目的言語文パターンに
よって、原言語文の表現する内容を目的言語において自
然な表現で訳出するものがある。目的言語文パターン
は、目的言語の実文を分析してICに必須な(あるいは
密接な)要素から構成する。必須でない要素は、それが
存在しなくても目的言語文として成立し、かつ奇異でな
い要素である。原言語中間構造に合致する目的言語文パ
ターンが存在する場合、必須な原言語要素は目的言語文
パターンによって目的言語要素に翻訳される。しかし、
合致した目的言語文パターンにおいて任意な要素にあた
り、原言語要素は目的言語文パターンによっては翻訳さ
れず、別にまとめられたパターンの内、当該要素として
適切なものを使用者が選択する。しかし、次回出現する
類似な原言語中間構造に対しても、任意的な要素に関し
て使用者は同様な作業を繰り返さなくてはならない。
【0006】従来主流の言語変換方式では、原言語の解
析(木構造)を部分ごとに目的言語の木構造へ変換して
目的言語を生成する。この方式だと、使用者との対話に
よって知識の不足を補っても、どうしても原言語寄りの
構造になりがちである。目的言語として不自然な文型に
なって不自然な表現になる。一方、全情報を使用者への
問い合わせによって獲得する方式では、広範な文書に対
応するためには非常に大量のデータを用意しておく必要
があり、また作業が最初から機械主導となるので、使用
者に被支配者感を与える。また、目的言語に必要な情報
が原言語の文には欠落していることが非常に多いので、
本発明の方式から使用者との対話を除いた方式では不完
全な出力を生成することが非常に多くなる。
【0007】また、目的言語で必要な情報が原文には存
在しない場合もある。従来の方式では、訳文を完成する
ために、この必要な情報をデフォルト処理で補足するこ
とが多い。しかしながら、不十分なデフォルト処理で誤
った情報を入れたり、必要情報が落ちたりすることも多
くて、不自然な訳文を生成しがちである。一方、対訳例
文を用いる翻訳方式では、広範な文書に対応するために
は非常に大量の対訳例文を必要とする。
【0008】
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、目的言語側の文化(言語表現の習慣,文書記述
の考え方など)によって、原言語側の文化的背景を吸収
し、原言語側で表現している事柄を的確に目的言語側の
表現に訳出すること、また、目的言語(訳文)が分らな
いユーザ(モノリンガル)のためであり、目的言語(訳
文)しか分らない相手(モノリンガル)が読んで、少な
くとも意味を取り違えないレベルの訳文を得ること、ま
た、文パターンの内容あるいは文パターンが要求した情
報の内容をユーザに確認して、より適切な訳文を得ると
ともに、目的言語・文パターンから要求情報を原文に問
い掛けて必要情報がなかったとき、システムがユーザに
情報を要求し、表示された内容にユーザの意図と違いが
ある場合、表示された内容を変更し、より適切な訳文を
得ること、また、目的言語(訳文)が分らないユーザ
(モノリンガル)のためであり、目的言語に訳された文
(訳文)がユーザの言いたい内容になっているかを確認
すること、また、ユーザの伝えたい内容に訳されている
かどうか、即座に容易に確認できるようにすること、ま
た、ユーザの言いたい内容に訳されたか不安が残る場合
があるので、すなわち、例えば、日本語と英語のよう
に、文化的背景が大きく違う言語間の翻訳では、翻訳結
果を元の原文側に再翻訳されても理解不能になる場合が
あるので、なぜそのような翻訳文にする必要性がある
か、ユーザに納得してもらうことを可能にすること、ま
た、目的言語文パターンにおいては任意な要素であって
も、使用者が追加し確定した場合には、新たな目的言語
文パターンとして新規に登録することにより、次回、類
似な原言語文が出現した場合には、任意的な要素も含ん
だ目的言語文パターンが既に存在しているので、使用者
の介入なしに先と同様な翻訳結果が得られるようにし、
目的言語文パターンを学習することによって、ユーザの
所望する訳文を速やかにかつ正確に得るようにするこ
と、また、ユーザからの情報を受け入れるインターフェ
ースの向上あるいは多様性を図ること、またユーザから
の情報を受け入れた際のリアルタイム性の向上を図るこ
と、またユーザがより適切な目的言語文を選択する選択
手段あるいはユーザが適切な文を作成する作成手段を有
すること、さらに、従来主流の前向き構造変換方式より
適当かつ自然な訳文を生成し、全情報を使用者への問い
合わせによって獲得する方式に比べて用意するデータが
少なくて済み、使用者に被支配者感を与えず、不完全な
出力を生成することが少ない言語変換装置を提供するこ
と、また、必要とするデータ量が対訳例文を用いる翻訳
方式のものより少なくて済むような言語変換装置を提供
すること、また、効率的に表現された目的言語のパター
ンを有し、不可情報の重要度に柔軟に対応できる言語変
換装置を提供すること、また、目的言語の表現パターン
と原言語の入力との適合度評価手段と、目的言語の出力
を生成するために目的言語のパターンが要求する情報を
原言語の入力から検索・同定する手段とを改変容易にし
て、言語変換システムの性能を漸時向上させていくこと
を容易にする言語変換装置を提供すること、さらには、
同一または類似の事柄を表現する目的言語の表現パター
ンが複数個ある場合、オペレータはどれを選んでよいか
判断に困る場合があるので、目的言語の表現パターンが
複数個ある場合、最終判断はあくまでオペレータが行う
が、オペレータがその表現パターンの一つを選び易くす
る手段を提供し、オペレータの負担をなるべく少なく
し、選び易くする手段の一つは、選択に必要と思われる
判断情報を各種用意してオペレータに提示し、積極的に
それらの判断情報を使って一定の基準により各候補を評
価し、最適と思われる選択候補を決め、オペレータに推
奨し、判断指標をオペレータが指定でき、状況に合せて
柔軟な選択ができるようにした言語変換装置を提供する
ことを目的としてなされたものである。
【0009】
【構成】本発明は、上記目的を達成するために、(1)
原文を解析し、該原文の中間構造を得る原文解析手段
と、該原文解析手段により得られた原文の中間構造から
ICを抽出するIC抽出手段と、該IC抽出手段により
抽出されたICを含む文パターンを同定する同定手段
と、該同定手段により同定された文パターンが要求する
情報を原文の中間構造から抽出する情報抽出手段と、前
記文パターンと前記抽出した要求情報から訳文の中間構
造を決定する決定手段と、前記訳文の中間構造より表層
の訳文を生成する訳文生成手段とから成ること、更に
は、(2)前記IC抽出手段が、E=f(S,P){E:
ICの可能性,S:係数,P:可能性度合}なる評価式を
用いること、更には、(3)前記IC抽出手段が、少な
くともIC候補となる表記と可能性度合を記述したリス
トを用いること、更には、(4)前記IC抽出手段が、
目的言語・文パターンの記述内容との一致の程度で決定
すること、或いは、(5)原文を解析し、該原文の中間
構造を得る原文解析手段と、該原文解析手段により得ら
れた原文の中間構造からICを抽出するIC抽出手段
と、該IC抽出手段により抽出されたICを含む文パタ
ーンを同定する同定手段と、該同定手段により同定され
た文パターンが要求する情報を原文の中間構造から抽出
する情報抽出手段と、前記文パターンと前記抽出した要
求情報から訳文の中間構造を決定する決定手段と、前記
訳文の中間構造より表層の訳文を生成する訳文生成手段
とから成り、前記同定手段は、原言語の中間構造内の情
報によって満たされる目的言語表現パターン中の構成要
素の数を計数する計数手段を有すること、或いは、
(6)原文を解析し、該原文の中間構造を得る原文解析
手段と、該原文解析手段により得られた原文の中間構造
からICを抽出するIC抽出手段と、該IC抽出手段に
より抽出されたICを含む文パターンを同定する同定手
段と、該同定手段により同定された文パターンが要求す
る情報を原文の中間構造から抽出する情報抽出手段と、
前記文パターンと前記抽出した要求情報から訳文の中間
構造を決定する決定手段と、前記訳文の中間構造より表
層の訳文を生成する訳文生成手段とから成り、前記文パ
ターン中の目的言語表現パターンの構成要素には、予め
重要度が付記されており、前記同定手段は、原言語の中
間構造内の情報によって満たされる目的言語表現パター
ン中の構成要素の重要度を求める演算手段と、該演算手
段により求められた重要度によって目的言語表現パター
ンの優先順位を決定する決定手段を有すること、或い
は、(7)原文を解析し、該原文の中間構造を得る原文
解析手段と、該原文解析手段により得られた原文の中間
構造からICを抽出するIC抽出手段と、該IC抽出手
段により抽出されたICを含む文パターンを同定する同
定手段と、該同定手段により同定された文パターンが要
求する情報を原文の中間構造から抽出する情報抽出手段
と、前記文パターンと前記抽出した要求情報から訳文の
中間構造を決定する決定手段と、前記訳文の中間構造よ
り表層の訳文を生成する訳文生成手段とから成り、前記
文パターン中の目的言語表現パターンは、予めそのスコ
アと共に記憶されているとともに、構成要素に合致する
目的言語情報を、そのスコアと共に記憶されており、前
記同定手段は、目的言語表現パターン中の構成要素に合
致する目的言語情報に対応する原言語を記憶する記憶手
段と、該記憶手段のスコアに基づいて目的言語表現パタ
ーンと原言語情報との照合度を評価する評価手段とを有
すること、或いは、(8)原文を解析し、該原文の中間
構造を得る原文解析手段と、該原文解析手段により得ら
れた原文の中間構造からICを抽出するIC抽出手段
と、該IC抽出手段により抽出されたICを含む文パタ
ーンを同定する同定手段と、該同定手段により同定され
た文パターンが要求する情報を原文の中間構造から抽出
する情報抽出手段と、前記文パターンと前記抽出した要
求情報から訳文の中間構造を決定する決定手段と、前記
訳文の中間構造より表層の訳文を生成する訳文生成手段
と、目的言語側のシソーラス辞書を記憶する記憶手段
と、該記憶手段のシソーラス辞書の見出し語を原言語側
に翻訳した対訳シソーラス辞書を記憶する記憶手段とか
ら成り、前記文パターン中の目的言語表現パターンは、
その構成要素として相当する原言語の表層を記憶する記
憶手段と、構成要素として相当する意味マーカを記憶す
る記憶手段とを有し、前記同定手段は、目的言語表現パ
ターン中の構成要素が原言語文情報の表層/意味マーカ
/シソーラス語のいずれで満たされるかを検出する検出
手段と、該検出手段の結果により、目的言語表現パター
ンと原言語情報との照合度を評価する評価手段とを有す
ること、或いは、(9)原文を解析し、該原文の中間構
造を得る原文解析手段と、該原文解析手段により得られ
た原文の中間構造からICを抽出するIC抽出手段と、
該IC抽出手段により抽出されたICを含む文パターン
を同定する同定手段と、該同定手段により同定された文
パターンが要求する情報を原文の中間構造から抽出する
情報抽出手段と、前記文パターンと前記抽出した要求情
報から訳文の中間構造を決定する決定手段と、前記訳文
の中間構造より表層の訳文を生成する訳文生成手段とか
ら成り、前記文パターン中の目的言語表現パターンは、
同一情報から生成する複数の別パターンを有し、前記同
定手段は、同定結果を文毎に記憶する記憶手段と、同定
結果を前記記憶手段の内容と比較する比較手段と、その
結果一致する場合は別パターンに切り換える切換手段と
を有すること、更には、(10)前記(1)〜(9)の
いずれかにおいて、前記決定手段が、前記文パターンが
要求する情報を原文の中間構造から抽出できなかった必
須の要求情報としてデホルト値を用いて訳文の中間構造
を決定するものであること、更には、(11)前記
(1)〜(9)のいずれかにおいて、前記決定手段が、
前記文パターンが要求する情報が原文の中間構造から抽
出できなかった場合に、デホルト値を含まない訳文の中
間構造を決定するものであること、或いは、(12)原
文を解析し、該原文の中間構造を得る原文解析手段と、
該原文解析手段により得られた原文の中間構造からIC
を抽出するIC抽出手段と、該IC抽出手段により抽出
されたICを含む文パターンを同定する同定手段と、該
同定手段により同定された文パターンが要求する情報を
原文の中間構造から抽出する情報抽出手段と、前記文パ
ターンと前記抽出した要求情報から訳文の中間構造を決
定する決定手段と、前記訳文の中間構造より表層の訳文
を生成する訳文生成手段と、文パターンが要求する要求
情報を表示する表示手段と、該表示手段により表示され
た要求情報に対して不足している情報の補充を得るため
の、または誤っている情報に対して訂正を受けるための
入力手段とから成ること、或いは、(13)原文を解析
し、該原文の中間構造を得る原文解析手段と、該原文解
析手段により得られた原文の中間構造からICを抽出す
るIC抽出手段と、該IC抽出手段により抽出されたI
Cを含む文パターンを同定する同定手段と、該同定手段
により同定された文パターンが要求する情報を原文の中
間構造から抽出する情報抽出手段と、前記文パターンと
前記抽出した要求情報から訳文の中間構造を決定する決
定手段と、前記訳文の中間構造より表層の訳文を生成す
る訳文生成手段と、文パターンが必要としない情報を表
示する表示手段と、該表示手段により表示された情報を
訳文に反映させるか否かの指示を受けるための入力手段
とから成ること、或いは、(14)原文を解析し、該原
文の中間構造を得る原文解析手段と、該原文解析手段に
より得られた原文の中間構造からICを抽出するIC抽
出手段と、該IC抽出手段により抽出されたICを含む
文パターンを同定する同定手段と、該同定手段により同
定された文パターンが要求する情報を原文の中間構造か
ら抽出する情報抽出手段と、前記文パターンと前記抽出
した要求情報から訳文の中間構造を決定する決定手段
と、前記訳文の中間構造より表層の訳文を生成する訳文
生成手段と、前記訳文の中間構造より原文と同言語の中
間構造を得る文変換手段と、該文変換手段により得られ
た中間構造から原文と同言語の表層文を生成する表層文
生成手段とから成ること、或いは、(15)原文を解析
し、該原文の中間構造を得る原文解析手段と、該原文解
析手段により得られた原文の中間構造からICを抽出す
るIC抽出手段と、該IC抽出手段により抽出されたI
Cを含む文パターンを同定する同定手段と、該同定手段
により同定された文パターンが要求する情報を原文の中
間構造から抽出する情報抽出手段と、前記文パターンと
前記抽出した要求情報から訳文の中間構造を決定する決
定手段と、前記訳文の中間構造より表層の訳文を生成す
る訳文生成手段と、前記原文および訳文を表示する同一
画面上に、対応する参考文である訳文の原文と同言語へ
の直訳文を表示する表示手段を有すること、或いは、
(16)原文を解析し、該原文の中間構造を得る原文解
析手段と、該原文解析手段により得られた原文の中間構
造からICを抽出するIC抽出手段と、該IC抽出手段
により抽出されたICを含む文パターンを同定する同定
手段と、該同定手段により同定された文パターンが要求
する情報を原文の中間構造から抽出する情報抽出手段
と、前記文パターンと前記抽出した要求情報から訳文の
中間構造を決定する決定手段と、前記訳文の中間構造よ
り表層の訳文を生成する訳文生成手段と、前記原文と訳
文との情報の差異を検出する検出手段と、前記差異の内
容に応じたガイダンス文を得るガイダンス生成手段と、
ガイダンス情報を表示する表示手段とから成ること、或
いは、(17)原文を解析し、該原文の中間構造を得る
原文解析手段と、該原文解析手段により得られた原文の
中間構造からICを抽出するIC抽出手段と、該IC抽
出手段により抽出されたICを含む文パターンを同定す
る同定手段と、該同定手段により同定された文パターン
が要求する情報を原文の中間構造から抽出する情報抽出
手段と、前記文パターンと前記抽出した要求情報から訳
文の中間構造を決定する決定手段と、前記訳文の中間構
造より表層の訳文を生成する訳文生成手段と、前記原文
と訳文との情報の差異を検出する検出手段と、差異のあ
った情報によってガイダンス情報を検索する検索手段
と、ガイダンス情報を表示する表示手段とから成り、前
記検出手段により検出された原文と訳文の差異情報は、
目的言語の文パターンが要求している原文の中間構造か
ら抽出できなかった追加情報、あるいは目的言語の文パ
ターンが要求して原文の中間構造を検索した結果、抽出
を受けなかった余剰情報を用いるものであること、或い
は、(18)原文を解析し、該原文の中間構造を得る原
文解析手段と、該原文解析手段により得られた原文の中
間構造からICを抽出するIC抽出手段と、該IC抽出
手段により抽出されたICを含む文パターンを同定する
同定手段と、該同定手段により同定された文パターンが
要求する情報を原文の中間構造から抽出する情報抽出手
段と、前記文パターンと前記抽出した要求情報から訳文
の中間構造を決定する決定手段と、前記訳文の中間構造
より表層の訳文を生成する訳文生成手段と、事前に翻訳
した一文以上の原文の中間構造の内容を記憶する記憶手
段とから成り、前記ICを抽出する対象に該記憶手段を
も含めること、或いは、(19)原文を解析し、該原文
の中間構造を得る原文解析手段と、該原文解析手段によ
り得られた原文の中間構造から訳文の中間構造に変換す
る変換手段と、前記訳文の中間構造より表層の訳文を生
成する訳文生成手段と、前記訳文の中間構造より原文と
同言語の第2の中間構造に変換する変換手段と、第2の
中間構造から原文と同言語の表層文を生成する表層文生
成手段とから成ること、或いは、(20)原文を解析
し、該原文の中間構造を得る原文解析手段と、該原文解
析手段により得られた原文の中間構造からICを抽出す
るIC抽出手段と、該IC抽出手段により抽出されたI
Cを含む文パターンを同定する同定手段と、該同定手段
により同定された文パターンが要求する情報を原文の中
間構造から抽出する情報抽出手段と、前記文パターンと
前記抽出した要求情報から訳文の中間構造を決定する決
定手段と、前記訳文の中間構造より表層の訳文を生成す
る訳文生成手段と、前記原文と翻訳との情報の差異を検
出する検出手段と、差異のあった情報によってガイダン
ス情報を検索する検索手段と、ガイダンス情報を表示す
る表示手段とから成ること、或いは、(21)原文を解
析し、該原文の中間構造を得る原文解析手段と、該原文
解析手段により得られた原文の中間構造からICを抽出
するIC抽出手段と、該IC抽出手段により抽出された
ICを含む文パターンを同定する同定手段と、該同定手
段により同定された文パターンが要求する情報を原文の
中間構造から抽出する情報抽出手段と、前記文パターン
と前記抽出した要求情報から訳文の中間構造を決定する
決定手段と、前記訳文の中間構造より表層の訳文を生成
する訳文生成手段と、前記ICによって駆動された目的
言語・句パターン中の要素に対応する原言語中間構造素
が無い場合は、その要素が任意であるならば該要素に限
ってICとは関係なく目的言語・句パターンを選択し、
目的言語訳を作成する作成手段とから成ること、更に
は、(22)前記(21)において、必須部および任意
部である範囲を明示し、確認を要求する要求手段を有す
ること、更には、(23)前記(22)において、確認
の実施の有無を設定する設定手段を有すること、更に
は、(24)前記(22)において、前記ICに基づい
て選択された必須要素に対応する目的言語・句パターン
と、ICに関係なく選択された任意要素に対応する目的
言語・句パターンとを組み合わした目的言語・パターン
を作成する作成手段と、該作成手段により作成した目的
言語・句パターンを新規に記憶する記憶手段とを有する
こと、更には、(25)前記(24)において、新規に
作成した句パターンを任意の基準に分類して記憶する記
憶手段と、種類に合致する句パターンを検索する検索手
段とを有すること、或いは、(26)原文を読み取る入
力部と、該入力部の原文を目的言語に翻訳処理する翻訳
部と、該翻訳部の翻訳処理に必要な情報を記憶する情報
記憶部と、前記翻訳部による翻訳結果を出力する出力部
とから成る機械翻訳装置において、前記翻訳部が原文を
解析し、該原文の中間構造を得る原文解析手段と、該原
文解析手段により得られた原文の中間構造からICを抽
出するIC抽出手段と、該IC抽出手段により抽出され
たICを含む文パターンを同定する同定手段と、該同定
手段により同定された文パターンが要求する情報を原文
の中間構造から抽出する情報抽出手段と、前記文パター
ンと前記抽出した要求情報から訳文の中間構造を決定す
る決定手段と、前記訳文の中間構造より表層の訳文を生
成する訳文生成手段と、前記翻訳部による翻訳結果が確
認できる結果確認部とから成ること、更には、(27)
前記(26)において、前記結果確認部が、翻訳結果を
ユーザの指定する言語に再翻訳できる再翻訳手段を有す
ること、更には、(28)前記(27)において、前記
再翻訳手段が、生成翻訳文を入力原文とする再翻訳手段
であること、更には、(29)前記(27)において、
前記再翻訳手段が、前記(28)記載の再翻訳手段以外
の再翻訳手段であること、更には、(30)前記(2
7)において、前記(28)記載の再翻訳手段と、前記
(29)記載の再翻訳手段とを選択する第1の選択手段
を有すること、更には、(31)前記(26)におい
て、前記結果確認部が、訳文に指定言語で逐語訳を付与
する逐語訳付与手段を有すること、或いは、(32)原
言語文からICを抽出するIC抽出手段と、該IC抽出
手段により抽出されたICを含む目的言語の表現パター
ンを同定する同定手段と、該同定手段により同定された
表現パターンが要求する情報を原言語文から抽出する情
報抽出手段と、前記表現パターンが要求する情報を表示
する表示手段とから成ること、或いは、(33)前記表
示手段において、前記表現パターンが要求する情報を表
形式で表示し、該表示手段で表示された表形式の値を編
集できること、更には、(34)前記(33)におい
て、前記表形式での表示手段で表示された表形式の項に
ついて、その項の必要度に応じて表示形態を変更するこ
と、更には、(35)前記(33)又は(34)におい
て、前記表形式に対する編集手段において、値の変更が
あるごとに目的言語文を出力すること、更には、(3
6)前記(33)〜(35)のいずれかにおいて、複数
の表現パターンがある場合、各表現パターンごとに目的
言語文を出力すること、更には、(37)前記(33)
〜(36)のいずれかにおいて、前記目的言語の表現パ
ターンに応じて目的言語文を出力する以外に、対応する
原言語の表現パターンに応じて原言語文を出力する出力
手段を有すること、更には、(38)前記(37)にお
いて、前記原言語文出力手段によって出力された原言語
文を編集できる編集手段を有すること、更には、(3
9)前記(38)において、前記原言語文に対する編集
手段において、値の変更があるごとにその値をメモリに
設定し直し、以降の手段が動作し、目的言語文を出力す
ること、更には、(40)前記(38)又は(39)に
おいて、前記選択された表現パターンに対応する原言語
パターンによる原言語文のみを表示し、前記原言語文が
複数になった場合、原言語文の選択も許容し、選択した
原言語文に対応する表現パターンに基づき、目的言語文
を生成すること、更には、(41)前記(33)におい
て、前記抽出手段と前記編集手段により得られた情報を
もとに、前記表現パターンにより、目的言語文を出力す
る出力手段と、該出力手段で出力された目的言語文を編
集する編集手段を有し、該出力手段において、該編集手
段により変更された値が原言語の語句であれば、目的言
語の語句に変換し、目的言語文の対応する原言語の語句
と置換して再度出力すること、原文を解析し、該原文の
中間構造を得る原文解析手段と、該原文解析手段により
得られた原文の中間構造からICを抽出するIC抽出手
段と、該IC抽出手段により抽出されたICを含む文パ
ターンを同定する同定手段と、該同定手段により同定さ
れた文パターンが要求する情報を原文の中間構造から抽
出する情報抽出手段と、前記文パターンが要求する要求
情報を表示する表示手段とから成ること、前記目的言語
文に対する編集手段が終了した時点で、編集された目的
言語文において、変更された値が原言語の語句であれ
ば、前記原言語の語句を対訳辞書を用いて目的言語の語
句に変換する変換手段より変換し、目的言語文の対応す
る原言語の語句と置換すること、更には、(42)前記
(41)において、前記目的言語文に対する編集手段に
おいて、原言語の語句による値の変更があるごとに行う
こと、更には、(43)前記(33)〜(42)のいず
れかにおいて、前記原言語文からICを抽出する代わり
に、ICを指定する指定手段を有し、該指定手段により
ICを得ること、或いは、(44)原言語から目的言語
への変換を計算機を用いて行う言語変換装置において、
目的言語の表現パターンのデータベースと、目的言語の
表現パターンと原言語の入力との適合度評価手段と、目
的言語の出力を生成するために目的言語パターンが要求
する情報を原言語の入力から検索して同定する検索・同
定手段と、目的言語の出力を生成するために必要な情報
をユーザとの質間・応答によって獲得する問い合わせ手
段と、前記適合度評価手段による適合度に応じて原言語
の入力に適合する目的言語のパターンを選択する選択手
段と、前記検索・同定手段による必要な情報の原言語の
入力の検索・同定と、前記問い合せ手段によるユーザと
の質問・応答との組合わせで目的言語の出力を生成する
出力手段とから成り、同一または類似の事柄を表現する
目的言語の表現パターンが複数個ある場合、同パターン
のデータベースに同パターンを選択する判断情報を合せ
て記憶し、複数の同パターンを表示する際、同判断情報
を合せて表示すること、更には、(45)前記(44)
において、前記判断情報は同パターンの選択手段によっ
て得られた順に表示すること、更には、(46)前記
(44)において、前記同パターンを選択する判断情報
を評価する評価手段を設け、判断情報の評価を行い、判
断情報に加えて選択評価情報を合せて表示すること、更
には、(47)前記(46)において、同選択評価情報
の評価の高い順に同パターンを表示すること、更には、
(48)前記(46)において、前記同パターンを選択
する判断情報を評価する評価手段において、同パターン
の前後の文脈から最適なものを評価の指標とすること、
更には、(49)前記(46)において、前記同パター
ンを選択する判断情報を評価する評価手段において、同
パターンに対応する原言語の前後の文脈から最適なもの
を評価の指標とすること、更には、(50)前記(4
6)において、前記同パターンを選択する判断情報を評
価する評価手段において、同パターンの目的言語または
原言語の前後の文脈から最適なものを評価の指標とする
こと、更には、(51)前記(46)において、前記同
パターンを選択する判断情報を評価する評価手段におい
て、同パターンの評価指標を変更すること、更には、
(52)前記(46)において、前記同パターンを選択
する判断情報を評価する評価手段において、同パターン
の評価指標を同システムが作成中の文書の種類あるいは
その目的によって変更すること、更には、(53)前記
(48)〜(52)のいずれかにおいて、前記システム
が判断する評価指標を指定できるように構成したこと、
(54)前記(46)において、前記システムの選択評
価の最高のもののみを同パターンとして表示すること、
更には、(55)前記(46)において、前記システム
の選択評価の高いものを限定して同パターンとして表示
すること、更には、(56)前記(46),(54)又
は(55)において、前記表示方法を選択できること、
更には、(57)前記(56)において、文書作成の任
意の時点で切換える切換手段を有することを特徴とした
ものである。以下、本発明の実施例に基づいて説明す
る。
【0010】図1は、本発明による言語変換装置の一実
施例を説明するための外観図で、図2は、構成図であ
る。図中、1はディスプレイ、2はFD(Floppy Dis
k)、3はキーボード(コントローラを含む)、4はプ
リンタ、5はスキャナ(OCRを含む)である。6は文
書エディタ、7は翻訳エディタ、8は翻訳本体、9は原
文文書DB(Data Base)、10は翻訳知識DB(Data
Base)、11は辞書エディタ、12は訳文文書DB(Da
ta Base)、13は通信系である。
【0011】OCR(Optical Character Reader:光学
式文字読取装置)5は、紙に書かれたテキストを画像と
して読み込み、キャラクターコード列に変換し、本発明
で扱う入力文書の一つとして利用できるようにするため
のものである。FD2等は、既にキャラクターコード列
で記述されたテキストやドキュメント類で、記述様式の
変更程度で入力文書の一つとして利用でき、出力文書も
記録しておくことができる。メディアは、FD(フロッ
ピーディスク)の他、磁気テープや光ディスク等何でも
良い。通信系13は、電話回線または専用の通信系で送
受信するもので、一般的にはキャラクターコード列を扱
う。やはり、記述様式の変更程度で本発明の入力文書と
して利用できる。もちろん、出力文書を送信することも
可能である。プリンタ4は、本装置で扱うテキスト,ド
キュメント類(入力文書,出力文書,原文,訳文,中間
構造等)を印刷できる。
【0012】キーボード3及びディスプレイ1は、本発
明を含む本装置の全体をコントロールする機能を含む。
キーボード3は、入力文書を作成したり、原文の入力・
修正,中間構造の変更入力,システムからの要求情報の
入力翻訳知識DBの入力・修正,訳文や出力文書の修正
入力などの文書エディタの操作を指示する。更に、その
他の機能(ORCやプリンター等)の操作の指示もす
る。ディスプレイ4は、入力文書,原文,中間構造,シ
ステムからの要求情報,訳文,出力文書,翻訳知識DB
等を表示する他、OCRの画像データ等、他の機能の表
示も行える。文書エディタ6は、原文文書,訳文文書を
編集するもので、原文文書から翻訳したい部分を取りだ
し、翻訳エディタに渡したり、翻訳エディタから訳文を
受取ったりする。翻訳エディタ7は、文書エディタの下
にあり、翻訳本体を管理している。辞書エディタ11
は、文書エディタの下に翻訳エディタと並列に置かれて
いて、翻訳知識DBの内容を直接に変更・入力・編集で
きる。
【0013】原文文書DB9は、OCRやFD等で入力
された文や文書等を翻訳エディタで扱える形式に整形し
て記憶してあるデータベースである。もちろん、キーボ
ードからの入力文書も同様に扱うことができる。訳文文
書DB12は、翻訳本体で訳された文や文書,翻訳エデ
ィタで扱った文書等を記憶しておくデータベースである
(原文文書DBと、文書単位,章単位,文単位等で対応
が取れるように相互にポインタを持っている)。翻訳本
体8は、データ構造の変遷のあらましを左側に、翻訳す
るための各処理機能のあらましを順を追って右側に示し
ている。両者共に()内のデータや処理機能は、本発明
の基本では必ずしも必要とするものではない。また、翻
訳知識DB10は、解析用文法・辞書DB,分野別キーワ
ードリストDB,IC候補リストDB,目的言語パターン
DB,対訳辞書DB等の集合体の総称として示してい
る。
【0014】図3は、翻訳本体内の各機能間の関係を示
す図で、図2における翻訳本体内を詳しく示したもので
ある。キーボード/ディスプレイは、翻訳エディタを代
表して示しており、その他は翻訳本体の内部を示してい
る(原文,訳文,入力IFなど、翻訳エディタと翻訳本
体との境界に位置して、本発明の説明上必要な機能も示
している)。次に、各記号の説明をする。||で囲まれ
た名称は処理機能を表わす。〇は翻訳処理課程の情報ノ
ードであり、各処理機能間で受け渡しを行うための情報
メモリである。()で囲まれているのは、〇印と同じ役
割を持つが、更に情報の書き換えが頻繁に行われる。−
→又は←→は翻訳本体内の情報の流れを示す。=→は翻
訳本体の外部との情報の流れを示す(この図では、煩雑
さを避けるため、各処理間の制御を示す関係線は省略し
ている)。
【0015】以下に、各機能毎にその役割を説明してい
く。また、原言語は日本語(原文は日本文)、目的言語
は英語(訳文は英文)を例にして説明する。解析 原文(J)を一文毎に解析するもので、解析文法・辞書
DBを用いて解析用文法規則と解析用辞書を用いて解析
し、原言語中間構造(S)を得る。ただし、後述する翻
訳単位が「バッチ1」のモードの際は、この解析処理の
最初の段階で文分割処理をする。分野判別 翻訳対象の文書の分野を自動的に判別し、分野別キーワ
ードリストDBの内容で原言語の中間構造(S)の内容
を分析し、その結果にしたがって以後の処理をその分野
に合せる。この機能は必ずしも必要ではなく、ユーザが
分野を指定してもよく、原文の解析時に分野の識別をし
てしまってもよいが、本発明の実施例では、解析結果の
内容を分析して分野を判定する場合を前提にして説明す
る。
【0016】IC抽出 ICとは、対象とする文の真に言いたい事柄(概念(Ide
a))の中心となる言葉(Center)のことを指し、Idea C
enter と称する言葉の略語である。例えば、「今後の活
動テーマについてディスカッションしたいと思いま
す。」の文では、文体としての主動詞は「思う」である
が、文の主題は「ディスカッションする」である。ま
た、「本契約は当社が申込金を受領した時に成立するも
のとします。」の文では、やはり、文体としての主動詞
は「…とします。」の「する」であるが、文の主題は
「成立する」である。すなわち、この「ディスカッショ
ンする」,「成立する」がそれぞれの文のIC(Idea Ce
nter)である。ここでは、対象とする文のICを決定し
やすくするために、IC候補リストDBの内容を参照し
て、対象とする文の中間構造(S)からICとなりうる
単語を抽出し、抽出ICバッファに蓄積する。抽出され
たICは、IC候補リストDB内に書かれている目的言
語文パターンのポインタを持っている。但し、このIC
抽出機能は必ずしも必要とせず、次に示す目的言語パタ
ーン抽出の機能で複合的にICの決定を行うことも可能
である。
【0017】目的言語パターン抽出 抽出ICバッファ内のポインタにより目的言語パターン
DBの内容を検索し、その内容に従って中間構造(S)
の内容を分析し、一旦対象文に対するICを仮に決定す
る。それと共に、その仮に決定されたICに対応する目
的言語側(この場合:英語)の単語(または熟語)が、
要求する目的言語文パターンで指定された句パターンに
より、原言語に表現されている内容を目的言語で全部表
現できるように文構造を決定する。言い換えると、英語
のICが目的言語側の文の中でどのような役割を持ち、
他にどのような単語や句,節を要求するのかを分析し、
その要求情報を中間構造(S)から抽出し、目的言語側
の文構造を決定する。この時、文構造は目的言語側に沿
ったものだが、原言語側の情報も目的言語側の情報に対
応して作成する。これらの内容を要求情報バッファに蓄
積する。対話型でないときは、中間構造(S)から抽出
できなかった情報は、デホルト値を挿入して処理を終了
させる。オペレータとの対話型で翻訳本体を動作させて
いる場合は、文構造を決定するのに必要な情報が欠けて
いると、オペレータに情報を要求する内容を抽出してお
く。また、それがどんな質の要求情報なのかのコメント
情報(中間構造(S)から抽出できなかった要求情報
は、その内容が何であるか分る形)も用意し、更に、
「なぜ、このICが選ばれたか」または「選ばれたIC
の意味合い」などのコメントもガイダンスバッファへ送
る。
【0018】ガイダンス情報抽出 ガイダンスのバッファ内でコメントのない原文と訳文の
差異情報には、その内容に応じたコメントをガイダンス
リストDBから取りだし、そのコメントでガイダンスバ
ッファ内の不足情報を埋める。本発明の実施例では、原
文に対して、どうしてその文型を採用したか?,必須語
のコメントなどは目的言語文パターンに記述している
が、これもこのガイダンスリストDBへ登録しておい
て、このDBから取り出せるようにしてもよい。表示整形 原文(J),要求情報バッファの内容(後述の訳文(E),
参考文(J)の利用を含む)と、ガイダンスバッファの内
容を合成してディスプレイに表示した際、オペレータが
分りやすい形になるように整えて表示バッファに送る
(その内容に対して、キーボードから入力される情報
と、その情報の要求元との対応関係を保つためのポイン
タ管理機能を持つ)。また、入力IFから書き換え要求
がきたら、それに従って内容を書き換え、表示バッファ
へ送り、表示バッファの内容を入れ替える。
【0019】入力IF ディスプレイ上で表示バッファの内容を確認したオペレ
ータがその内容を修正したり、要求情報の入力を要求さ
れてその内容を入力しようとするとき、キーボードから
その情報を入力する。その時、表示整形とのインターフ
ェースをとる。翻訳状態メモリ 翻訳対象文を翻訳本体でどのような状態で処理を進めて
いくかをオペレータが指定し、その内容を記憶しておく
フラグメモリ。但し、分野を自動設定にしておくと、対
象分野の自動判別結果をも記憶しておき、その内容に沿
った翻訳処理を行わしめるようにもできる。
【0020】整形1 要求バッファの内容から訳文(E)に必要な情報のみを
取りだし、訳文を生成しやすい形の目的言語中間構造
(T)を作成する。対話モードの時には、表示整形へ送
る情報との関係を保つためのポインタ情報をも含めて整
形する。整形2 要求バッファの内容から参考文(原文と同じ言語で書か
れた文)(J′)に必要な情報のみを取りだし、参考文
を生成しやすい形の参考文中間構造(S′)を作成す
る。対話モードの時には、表示整形へ送る情報との関係
を保つためのポインタ情報をも含めて整形する。
【0021】生成1 目的言語中間構造の内容を表層の訳文(E)に生成す
る。対話モードの時には、表示整形へ送る情報との関係
を保つためのポインタ情報をも含めて生成する。生成2 参考文中間構造の内容を表層の参考文(J′)に生成す
る。対話モードの時には、表示整形へ送る情報との関係
を保つためのポインタ情報をも含めて生成する。T整形 表示整形内の情報との関係ポインタを外す。
【0022】次に、各(処理)機能で使われるデータベー
ス(DB)の内容について説明する。解析用文法・辞書DB ここで用いる内容は、本発明に直接関係しないので、詳
しくは言及しない。従来技術のいずれかを用いれば良
い。但し、一点重要なのは、解析で作成される原言語中
間構造の(S)の単語の表記は正規化されるように辞書
が構成されており、対応する解析処理もそのように動作
するよう構成されていなければならない。例えば、「行
う」は「行なう」とも書き、「おこなう」と平仮名書き
する場合もある。原文がこの何れの表記で記述されてい
ても、中間構造(S)内の表記が「行う」に統一される
ようにしてある。{「止める」「留める」「とどめ
る」}{「仄聞する」「側聞する」「ソク聞する」}
{「シンポジューム」「シンポジウム」}等の例
も、{}内の表記は、原文の中にどれが書かれていて
も、どれか一つの表記(代表表記)に統一される。
【0023】次に、分野別キーワードリスト以降のDB
内容は、図4〜図13を参照しながら説明する。分野別キーワードリスト 図4は、分野別キーワードリストDBの一例を示す図で
ある。分野を決定しやすい単語を集めたもので、主とし
て名詞系の単語である。分野を特徴付けるために短単
位,長単位の区別なしで集められている。属性は「見出
し」,「読み」,「品詞」,「意味属性」,「分野別使用頻
度」である。「見出し」は中間構造(S)に表記される
代表表記で記述されている。「読み」,「品詞」はこの
DBを辞書エディタで検索するとき、内容を追加,修正
するとき等に利用される。「意味属性」は同じ表記の言
葉でも分野によって含む意味が異なるので、その識別の
ために利用される。例えば、“受け口”という言葉は、
人間の部位“口”の一種として著された場合は‘HEL’
とし、郵便受けの“口”等のように何か器物の一部とし
て著された場合は‘IEL’として区別する。「分野別使
用頻度」は、各分野での使用頻度を統計的に調査し、そ
の値を対数正規化したものである。ここでは3分野を示
しており、分野1は新聞・雑誌を対象に調査したもので
あり、分野2は電算機のハード,ソフトの論文を対象に
調査したもので、分野3は重電機関係の業界紙を対象に
調査したものである。もちろん、この分野の数は幾つで
も良く、その単位は、もっと細かくしても、粗くしても
本発明の本質ではない。
【0024】IC候補リスト 図5は、分野別IC候補リストDBの一例を示す図であ
る。本発明でいうICとなり得る語は、用言(動詞,形
容詞,形容動詞等)(注:名詞として使われているサ変
動詞の語幹も対象にする)と、一部の助動詞(断定の
“だ”,“です”や、比況の“ようだ”等)である。但
し、動詞「する」は本発明の主旨からCとはなりえない
ので外しておく。属性は、「見出し」,「読み」,「品詞
活用型」,「可能性度合」,「ポインタ」である。「見出
し」は、中間構造(S)に表記される代表表記で記述さ
れている。「読み」,「品詞活用型」は、このDBを辞
書エディタで検索するとき、内容を追加,修正するとき
等に利用される。「品詞活用型」は、更にICの可能性
の演算子にも利用される。「可能性度合」は、日本文の
中でICとなり得る程度を示す数値で、ある纒まった量
の文(一般には翻訳対象とした分野から取りだした文)
を事前に分析して得たものである。
【0025】例えば、前述の「今後の活動テーマについ
てディスカッションしたいと思います。」の文の解析を
すると、ICになり得る語は「活動する」,「ディスカ
ッションする」,「思う」の3語であるが、この文のI
Cは「ディスカッションする」であるので3点を与え、
文体としての主動詞は「思う」であるにもかかわらず、
この文ではICとならなかったので0点を与える。「活
動する」は特にICの分析対象にならなかったので1点
を与える。もう一例挙げると、「本契約は当社が申込金
を受領した時に成立するものとします。」の文は、文体
としての主動詞は「…とします。」の「する」である
が、文の主題は「成立する」であるので、「契約す
る」,「申込む」,「受領する」,「成立する」,「する」
の5語のIC候補語にそれぞれ1点,1点,1点,3
点,0点を与える。これらの具体的な作業は、英文に翻
訳した文と比較して点数付けをするもので、英文側が複
文になったとき、英文内の主題となる単語に対応する日
本語のIC候補には2点を与える。このように、与えた
点数をIC候補毎に集計してその結果を対数正規化した
ものである。「ポインタ」は、そのICに対応する目的
言語パターンDB内の内容記述をした部分を検索するた
めのポインタである。
【0026】目的言語パターンDBは、目的言語文パタ
ーンDBと目的言語句パターンDBとに種類が別れてい
る。以下、各々について説明する。目的言語文パターン 図6〜図10は、目的言語・文パターンの一例(その1
〜その5)を示す図である。IC毎に目的言語(英語)
の基本文型を記述したもので、原言語に記述されている
内容を一番表現しやすい文型を取りだし、to不定詞句,
動名詞句,前置詞句などの句パターンの内容をも抽出す
るポインタを持つ。 1行目:“ICの表記”,“対応する英語表記”:「こ
のICがこの場面で使う場合の意味」(このIC表記に
対応する英語表記を以後英語ICと称する)。 <Required>:この英語ICが文のICとして振る舞うた
めの必須の情報である、というラベル。 <Preferred>:この英語ICを含む文の構成上あった方
が好ましい情報である、というラベル。 <Optional>:この英語ICを含む文ではよく出現する情
報であるが無くても不自然な文にならない、というレベ
ル。 <Subj-___>:文の主語である、というラベル。 <DirObj-___>:直接目的語である、というラベル。 <IndObj-___>:間接目的語である、というラベル。 <Xobj-___>:その他の目的語(to不定詞句の目的語や動
名詞句の目的語等)である、というラベル。 <X________>:その他のマッチング条件である、という
ラベル。
【0027】<Alternates>:その内容が中間構造(S)
内になかったとき、どんな情報を必要とするかをオペレ
ータに知らせる内容と、その情報をシステム側が受け取
れなかったときのデホルト情報が書かれている。デホル
ト値は<someone> や <something>等である。 <Features>:そこで要求する情報の特徴を示すものであ
り、中間構造(S)に書かれている情報と一致すると確
からしさが増すことになる。 <Japanese>:中間構造(S)内の格(相当)ラベルやそ
の位置に書かれているその他の条件情報。 <English-Pattern-Pointers>:この英語ICが文として
振る舞うための英語文型の大枠を特徴付ける記述(<Res
trictions>の値として書かれている)が、更に細かな内
容(単語または句レベルの並び)を表現するための句パ
ターンを示すためのポインタ(例:<v-|test|-001>のよ
うに表現されている)の集合である。
【0028】目的言語句パターン 図11は、目的言語・句パターンDBの一例を示す図で
ある。目的言語文パターンで指定された句パターンによ
り、原言語に表現されている内容を目的言語で全部表現
できるように文構造を決定する。 <Pattern>:文法的に成立する英単語,デホルト値,他
の句パターンの並びの一単位。 <Example>:このDBを更新するときの説明用例。 <Component>:(Xn,Xm)の形で記述しているが、意味とし
ては<Pattern>に記述されいている要素をXで示し、n
番目のXが示すm番目のXを取りだして用いる、という
ことを示している。
【0029】対訳辞書 図12は、分野別対訳辞書DBの一例を示す図である。
主として原言語の自立語あるいは Content Words に対
して目的言語の訳語を持たせたもので、分野毎に内容が
異なる(辞書の形態は分野に関係なく一つとして訳語毎
に分野別の識別フラグを付してもよい)。また、前述の
分野別キーワードリストの役割をも持たせられるが、D
Bの保守管理のしやすさから分離しておいた方が都合が
よい。属性は「見出し」,「読み」,「品詞」,「意味属
性」,「英語訳」であり、「英語訳」は、日本語に対応
する英語の訳語が記述してある。「意味属性」は、目的
言語句パターンで要求する意味属性との関係分析に使
う。それ以外は、分野別キーワードリストと同内容であ
る。
【0030】ガイダンスリスト 図13は、ガイダンスDBの一例を示す図である。原文
に対して、どうしてその文型を採用したか?,原文にあ
る語に対応する訳語がなぜ訳文中にないのか?,なぜ原
文にない語を要求するのか? などのコメントをもって
いる。 EXCHANGE:日本人が一般的に間違えやすい用語を、他の
適切な用語で表現されたときの解説文。 REQUIRED:日本文には表記されていないが、英語ではど
うしても必要な単語を要求したときの解説文。 RELATIONAL:日本文に表記されている単語、特に自立語
の直接的な英訳単語が訳文中に表現されないときの解説
文。
【0031】次に、本発明による翻訳装置の動作につい
て、図14〜図25に基づいて説明する。最初に、オペ
レータが本発明の翻訳本体をどのうよな状態で使用しよ
うとするかを決めなくてはならず、その状態を記憶して
おくメモリが必要である。図14は、翻訳状態メモリを
示す図である。本発明の翻訳本体をどのような状態で使
うか、また、翻訳本体側で条件を変更する場合の内容を
記録しておくもので、各項目毎に“1”,“0”で表現
している。状態項目は、「翻訳単位」,「対話」,「分
野」があり、「翻訳単位」は「バッチ1」,「バッチ
2」,「一文単位」とに分れていて、「バッチ1」は、
ドキュメント単位でも翻訳できるように、必ずしも文単
位に分れていない文書をも扱えるように、解析処理の途
中で自動文分割処理を施したモードである。「バッチ
2」は、文と文の切れ目が明確に分れている文の集合を
翻訳するモードである。「一文単位」は、一文単位で翻
訳するモード。「対話」モードは、更に「対話有り無
し」,「ガイド表示の有無」,「単語学習有無」,「文型
学習有無」に分れている。「分野」は、この実施例では
0〜3の4分野に分けているが、これは幾つでもかまわ
ない。本発明の実施例では、“0”は自動モード,
“1”は一般,“2”は電子・情報,“3”は重電機関
係としておく。手動フラグ欄は、オペレータが指定した
場合のフラグ欄である。自動フラグ欄は、分野項目のみ
である。手動フラグ欄は自動フラグ欄に優先し、自動フ
ラグ欄が有効に働くのは手動フラグ欄の「分野0」項が
“1”の時のみである。ここでは、「一文単位」,「対
話有り」,「ガイド表示有り」,「単語学習無し」,「文
型学習無し」,「分野指定なし:自動モード」の設定を前
提で説明していく。
【0032】以後、原文は図15に示す2文を用い、図
17以降の内容を追いながら本発明の動作例を示す。文
頭に付してある,はそれぞれの文番号であり、以後
の説明のための例示する場面でも対応はこの番号で示
す。説明の都合上2文を示し、並行して説明していく
が、翻訳単位は「一文単位」なので、原文文書DBから
は一文ずつ取り出して翻訳していく。取り出された文
は、SourceTex(J)のタグが付けられる。
【0033】図17は、原言語中間構造(S)の一例
で、原文(J)を解析した結果である。“sem”項目に
は、解析結果の主として、自立語(接辞や造語成分等も
対象になる)を原形で記述してある。その“sem”項の
すぐ下に書いてあるのは、その自立語のその文の中で用
いられている状態を示すものである。必要なら何行書い
てもよく、不用なら何も書かなくてもよい。[]の前に
書かれている項目名は、[]内の内容のその文の中での
役割を示すシンボル(以後、役割ラベルと称する)であ
る。ここで、「行う」はの文の主動詞であることを示
しており、“tense”,“PAST”(た) でもって、文中で
は助動詞「た」を伴った過去形文であることを示してい
る。「テストする」は、サ変動詞ではあるけれども、名
詞として使われていることを示しており、その[]の前
に書かれている“をobj”でこの語が目的語として振る
舞うように使われていることを示している。「する」,
「対象」,「変電所」の全体は、前提条件としての“pre
-supp”役割ラベルを付けている。の文では、主動詞
「する」の“tense”は現在形文なので、デホルトとし
て省略されている。“aspect”,“STATE"(いる)で補
助動詞「いる」を伴った状態表示文であることを示して
いる。<連用>modは、「同様だ」,「場合」,「処理す
る」,「続語」全体の[]が形容動詞だ型の連用形
(に)で修飾していることを示している。“はtopic”
「実現する」,「上」,「コンピュータ」全体の[]内が
主題であることを示している役割ラベルである。
【0034】解析処理が終わると、翻訳状態メモリ内の
分野指定が自動モードかどうか判断し、自動モードなら
ば分野判別処理をする(分野がすでに指定されていれば
この処理をスキップする)。文の場合 :中間構造(S)内の全“sem”項の値「行
う」,「テストする」,「する」,「対象」,「変電所」を
抽出し、その値で分野別キーワードリスト(図4)の見
出し部を検索する。この場合、「変電所」のみが一致
し、分野別使用頻度の076(分野1),014(分野2),232(分野
3)が取りだされる。大小比較をすると、分野3が最大で
あるので、その情報を翻訳状態メモリに送り、分野の自
動フラグを3の位置にセットし、以後は分野3の「重電
機」関連を最優先として処理していく。文の場合 :中間構造(S)内の“sem”項の値を全部
抽出し、その値で分野別キーワードリストを検索する
と、「言語」045 224 006 「論理型」021 088 014 「ベ
ース」156 045 092 「場合」273 210 084 「続語」000
043 000 「コンピュータ」033 321 174 を取り出すこと
ができる。そこで、各分野毎の数値を集計すると、分野
1は528、分野2は931、分野3は370 が得られる。大小
比較すると、分野2が最大であるので、翻訳情報メモリ
内の分野自動フラグ欄を分野2にセットし、以後は分野
3の「電子・情報」関連を優先して処理していく。
【0035】分野の判別処理が終わると、翻訳対象文の
IC抽出をする。文の場合 :中間構造(S)内の全“sem”項の値「行
う」,「テストする」,「する」,「対象」,「変電所」を
抽出し(この時、その“sem”が属する先頭の役割ラベ
ル名も抽出しておく)、その値でIC候補リスト(図
5)の見出し部を検索する。この場合、「テストする」
(をobj),「行う」(Hed)の各内容が抽出される。その内容
の品詞活用型と先に抽出した役割ラベル名で決定される
係数S(詳述しないが、表形式で保持している)と、可
能性度合Pとで文中のICとなる可能性“E=f(S,
P)”を演算し、それぞれその結果をスコアとして抽出
ICバッファにポインタと共に記憶させる。文の場合 :中間構造(S)内の“sem”項の値とその
先頭の役割ラベルを全部抽出し、その“sem”値でIC
候補リスト(図5)の見出し部を検索する。この場合、
「実現する」(はtopic),「処理する」(<連用>mod),の2語
であり、それぞれのICの可能性“E”を計算し、スコ
アとしてポインタと共に抽出ICバッファに登録する
(図16参照)。
【0036】次に、対象文の目的言語パターンを抽出す
る。文の場合 :抽出ICバッファ内のスコアが一番高い
「テストする」のポインタ“0378”でもって目的言語文
パターンDBを検索し、図6〜図10の内容を得る。ま
ず、最初に<English-Pattern-Pointers>内の<Restri
ctions>の記述内容で、中間構造(S)の内容をチェッ
クしていく。この場合、最初にDirObj-PATIENTの役割ラ
ベルが中間構造(S)内のどこかにあるかどうかチェッ
クするが無いので次に移る。AND内に(@名詞性 sem
(する)−上位構造 機能名(をobj))が記述されて
いるが、その意味は、自分自身「テストする」が”名詞
性”の属性を持っており、その機能名は”をobj”であ
り、上位構造の”sem”項に「する」があることを示し
ている。チェックの結果、@名詞性と、機能名(をobj)
の条件は満たされているが、その上位構造の"sem"項に
「する」が無いので、これもだめ。次には"sem"項に「受け
る」があるかチェックするが、これもだめ。その次は、A
ND内に(@名詞性 sem(する)−上位構造 機能名(をo
bj))が記述されている。前述と同様の操作をして中間
構造(S)内を確認すると上位構造の”sem”項に「行
う」が有り、「テストする」が名詞性であること、その
役割ラベルが(をobj)となっていることから、全てが一
致しこのパターンを採る。このポインタは、<v-|test|-
003>であるから、目的言語句パターンDBを検索して c
onduct<n-|test|-002>を得る。この意味は、“test”を
直接目的語として持つ“conduct”が主動詞の文体であ
ることを示している。この<>内は更にポインタとなって
おり、それで検索すると|test|(<p-|of|-001>),(<P-|fo
r|-001>)を得る。この記述には Component欄があり、(X
1,X1)<DirObj-PATIENT>と(X2,X1)<Xobj-CONDITION>と指
示されている。そこで、<p-|of|-001>を検索すると、ま
ず|of|<SOMETHING>をデホルトとして得る。
【0037】次に、<DirObj-PATIENT>の役割ラベルで中
間構造(S)から対象となる語を探すのだが、このラベ
ルは英語側のラベルなので、日本語側のラベルに対応表
(詳述しないが、英語ラベルに対して日本語ラベルを優
先順に1ラベル以上並べた表)で変換すると、“をob
j”が最優先で得る。この役割ラベルで中間構造(S)
を探すと「変電所」を得る。ここで、(分野別)対訳辞
書DBを検索すると、英語訳が transformer station
で、意味属性がINS(施設)であることを得る。意味関係
表(詳述しないが一種の意味ネットワーク)から、INS
は PATIENT の一部として属すことから、|of|の次に挿
入されてもよい単語であることが検証できた。
【0038】さて、<p-|for|-001>側をチェックしてみ
ると、|for|<SOME PURPOSE>をデホルトとして得る。次
に、<Xobj-CONDITION>の役割ラベルから日本語側のラベ
ルの対応をみると“にobj”があり、このラベルで中間
構造(S)を探すと「対象」を得る。ここで、対訳辞書
DBを検索すると、英語訳,意味属性それぞれに“subj
ect”,“APP(並位)" を得る。更に、意味関係をチェッ
クすると、CONDITION とAPP との関係が直接には得られ
ないので、この「対象」という語は |for| の次には入
れることのできない単語だとされて、<SOME PURPOSE>の
候補として挙げられない。目的言語パターンから要求さ
れて中間構造(S)から抽出した情報の処理は、一通り
終わった。最後に残った“sem”項「する」は「するの
特別処理」で行う。
【0039】具体的には、「〜を対象にして〜」,「〜
を対象とした〜」,「〜の場合にして〜」,「〜を場合と
して〜」のように、「〜助詞・“APP”:意味属性・す
る〜」のパターンで“sem”項が“APP”で浮いてしまっ
た場合は、「する」という語は目的言語側には変換しな
い処理とする。このように、日本語側にある表記で英語
側に直接表記されない場合、そのように処理したことを
ガイダンス情報抽出へ情報として送る。最後に、再度目
的言語文パターン側に戻って<Required>の内容チェック
をすると、<Subj-AGT>の項が埋っていないことが分か
り、<Alternates>の内容(デホルト値である<someone
>)を要求情報バッファへ送る。コント部分はガイダン
スバッファへ送る。<DirObj-PATIENT>の項は“test”そ
のものが埋っており、また“test”の“PrepD0”も埋っ
ているので問題ない。これで、文の中間構造(S)の
内容の全部を処理したことになる。しかし、中間構造
(S)の内容が全部処理できなくて行き詰ったとして
も、英語側のパターンを使い果たしてしまったら、目的
言語パターン抽出処理を止めて次の処理に移ってしまっ
てよい(図18,19参照)。
【0040】次に、ガイダンス情報抽出では、目的言語
パターン抽出から、“sem"「対象」と「する」が不用である
ことの情報を受けているので、その構造から「対象にし
て」を生成し、その内容に即したガイダンスメッセージ
「この文型内に意味として表現されている。」をガイダ
ンスDBからとりだし、先に生成した「対象にして」と
共にガイダンスバッファに送る。表示整形では、文の
場合、要求情報バッファから必須情報として<Subj-AGT>
項の<someone>と<誰が>を取り出し、それが必須情報で
あることのラベルとその内容を表示バッファへ送る。具
体的には、IM(e)側の情報として<<someone: >>をIM
(j′)側の情報として<<誰が: >>を送る。また、ガ
イダンスバッファからは、コメント情報として目的言語
パターン抽出から送られてきている--“テストする”:
“test”:「機械や装置のテストを行う場合」--を取り
出し、読みやすい形に整形して表示バッファの Comment
欄へ送る。更に、ガイダンス情報抽出から送られてきて
いる「対象にして」のコメント情報を取り出し、表示バ
ッファの Comment欄へ送る。また、ガイダンスバッファ
からは、目的言語パターン抽出で必須情報部分の<Alter
nates>に書かれている内容を取り出し、表示バッファの
Example欄へ送る。
【0041】表示バッファ 項目値で[]に囲まれている記述は、その名称の示す内
容を表示することを意味する。[]のない記述はその記
述そのものを表示する。IntMed(e):の項目は[]で囲ま
れていて、記述内容は GenResult(E′)となっているの
で、その時点の情報付き訳文(E′)を表示する。これ
は、要求情報バッファの英語側から取り出した内容を整
形し生成した文で、要求情報バッファ内の情報と表層訳
文との対応関係を保つためのポインタを保持している。
IntMed(j′):の項目は[]で囲まれていて、記述内容
は GenResult(J′)となっているので、その時点の参考
文(J′)を表示する。これは、要求情報バッファの日
本語側から取り出した内容を整形し生成した文で、要求
情報バッファ内の情報と表層参考文との対応関係を保つ
ためのポインタを保持している。Text(j)は原文メモリ
から SourceTex(J)を取り出して翻訳エディタヘ渡す。T
ext(e)は訳文メモリから TranTex(E)を取り出して翻訳
エディタへ渡す。
【0042】整形1 要求情報バッファでは、英文パターンで記述された中間
構造が記述されているが、それには対応した日本文の情
報も記述してある。この中から英文の生成に必要な情報
(要求情報を含めて)のみを取り出して生成しやすい形
に整える。要求情報バッファ内のヘッドは日本文対英文
で記述してあり、その中から英文の conduct a test を
取り出し、主動詞の conduct を Headラベルの値とし、
直接目的語の a test を DirObjラベルの値とする。こ
の時、要求バッファ内の PrepD0ラベルの内容と組にな
るようにする。Xobjラベルの値はそのままの形で生成側
へ移せばよい。これらの操作は、全て日本語の情報を外
して取り出す。その結果は、図22の内容になる。
【0043】生成1内の生成ルールによって表層文をつ
くる。“tense”ラベルが“PAST"なので、主動詞を過去
形に換えるというような基本的なルールは公知なので説
明しない。主語で必須な値(単語)は<<>>で囲んで表記
する。その値がないときは DEFラベルの値(単語)を入
れる。その値があるときには DEFラベルの値(単語)を
まず入れて、次に semラベルの値(単語)を()で囲っ
て表記する。Xobjラベルのように任意の句は、その値
(単語)を<>で囲って表現する。この時点では、<<some
one>> conducted a test of <<something(the transfor
mer station)>> <for some purpose>.を得る。この文ラ
ベルは GenResult(E′)である。T整形では、曖昧性の
なくなった部分の付随情報は全部外してしまい、オペレ
ータが読んで直感的に分るように、より普通の文の表記
に近い形にする(曖昧な部分が全くなければ、通常の文
表記になる)。この時点では、<<someone>> conducted
of a test of transfer station.を得る。この文ラベル
は TranTex(E)である(図24参照)。
【0044】整形2 要求情報バッファでは、英文パターンで記述された中間
構造が記述されているが、それには対応した日本文の情
報も記述してある。この中から、日本文の生成に必要な
情報(要求情報を含めて)のみを取り出して生成しやす
い形に整える。整形1では単純な整形で済むが、この整
形2では、ある程度生成処理の技術も入れざるを得な
い。要求情報バッファ内のヘッドは日本文対英文で記述
してあり、その中から日本文の「テストを行う」を取り
出し、主動詞の「行う」を Head のsemラベルの値と
し、直接目的語の「テスト」を objラベルの値とする。
この時、英文の時と同様に要求バッファ内の PrepD0ラ
ベルの内容と組になるようにする。この際、候補ラベル
の値(単語)が変電所であり、 Prepラベルの値が ofな
ので、のmodラベルを当てる。Xobjラベルの値はそのま
まの形でよいが、日本語側の形態に換える。任意ラベル
の値(単語)が「何のために」であることと Prepラベ
ルの値が for なので modラベルを付加する。これで処
理は終わり、任意ラベルを含めて生成側へ移せばよい。
これらの操作は、全て英語の情報を外して取り出す。そ
の結果は、図23の内容になる。
【0045】生成2内の生成ルールによって表層文をつ
くる。“tense”ラベルが“PAST”なので、助動詞を過
去助動詞(た)に換えるというような基本的なルールは
公知なので説明しない。主語で必須な値(単語)は<<>>
で囲んで表記する。その値がないときは必須ラベルの値
(単語)を入れる。その値があるときにはラベル名が候
補ラベルに換えてあり、その値(単語)を入れて表記す
る。modラベルのように任意の文節は、任意ラベルの値
(単語)を<>で囲んで表現する。この時点では、「<<誰
が>><何のために><<変電所>>のテストを行った。」を得
る。この文ラベルは GenResult(J′)である(図25
参照)。
【0046】次に、図26〜図29に基づいて、ここま
での動きをディスプレイ上の動きとして説明する。図2
6の画面は初期設定(図14参照)を終えて、原文を一
文取り出したところであり、この状態で翻訳開始をキー
ボードから指示すると、|解析|から|生成2|,|T整形|
までの処理を終えて、表示バッファの内容が表示され
る。その状態が図27の画面である。[編集]参考文の
欄には、訳文(英):欄にその時点のGenResult(E′)
内の文が表示され、訳語(日):欄には、やはりその時
点の GenResult(J′)内の文が表示されている。コメン
ト:欄には、“conduct a test”のパターンを用いた理
由と、原文中にある「対象にして」の表記に対応する英
語表記がされていない理由を表示している。 *次の必須項目を埋めて下さい。のコマンドがあり、必
須(英):必須(日):の欄のどちらを埋めてもよい。
そこに埋めることのできる英単語の例が、英語例:欄に
示されている。必須(英):欄側に単語を埋めてリター
ンキーを押すと、その値がそのまま反映されて訳文
(E),参考文(J′)が生成される。このことから、
[英語]訳文の欄と訳文(英):欄は変化するが、訳語
(日):欄は何も変化しない。必須(日):欄に求めら
れた単語を埋めると、対訳辞書を検索し英語表記を取り
出し、その語を用いて以後の処理をする。この場合、必
須(日):欄に単語を埋めたとして説明する。結果は図
28のようになり、訳文が完成する。
【0047】次に、要求情報が得られた後の動作につい
て説明する。要求情報バッファ内の必須ラベル Subj の
日本語側の「誰」の位置に「政府」が埋められたのを受
けて|目的言語パターン抽出|は|訳語変換|に働きか
け対訳辞書を検索し、government を得る。それを英語
側のスロットに挿入する。その結果を図18の′に示
す。その後の|整形1|,|生成1|,|T整形|,|整形2|,|
生成2|の処理方法は、前述した各処理方法と同じなの
で説明は省略する。結果は、それぞれ図24,図25の
文′となる。ところが、オペレータはこの訳に満足せ
ず、必須(英):欄の government の後に agency を追
加して再度リターンキーを押すと、要求情報バッフ
ァ()内の内容は図19″の内容に変り、|整形1|,|
生成1|,|T整形|を経てそれぞれの結果を得る。結果
は、それぞれ図24の文″となる。この場合、要求情
報バッファ内の日本語側は変化がないので、参考文
(J′)の生成結果は変化しない。図25の文″の内
容は文′と同内容である。
【0048】図30及び図31は、本発明による翻訳装
置の他の実施例2,3を示すもので、前述した実施例と
同様の処理を行うことにより、訳文を得ることができ
る。また、図32は、TD方式の実施例(原言語・目的
言語パターンDB)、図33は、TD方式の実施例(文
脈レベル)、図34はTD方式の実施例(学習付き)、
図35は、TD方式の実施例(学習付き,オリジナル文
書作成)を各々示している。
【0049】次に、請求項2〜5の目的言語パターンの
マッチング処理の改良について説明する。図6〜図10
の目的言語・文パターンにおいて、当該パターンが原言
語にどれほどの確度でマッチしているかを判定するに
は、以下の方法がある。 (1)マッチする構成要素を計数して決める。図6〜図
10の目的言語・文パターンにおいて、パターン中の各
構成要素が原言語情報によって幾つ満足させられるかに
よって確度を求める。例えば、"変電所を対象にして、
テストを行った。"(図15の例文)(例a)は、IC
「テストする」(図6〜図10)の<English-Pattern-P
ointers>内のパターンの<Restrictions>と原言語中間構
造(図17)とを順に照合し、どの<Restrictions>とマ
ッチするかを調べる。本発明の実施例では、 (@名詞性 sem(行う)−上位構造 機能名(をobj)) と原言語中間構造(図17)とが、以下の照合処理を経
ることによってマッチすることがわかる。
【0050】照合処理については、以下の〜に説明
する。 <English-Pattern-Pointers>内のパターンの<Restri
ctions>の内、そのsem()項と原言語中間構造のsem項と
がマッチするものを選択する。本発明の実施例では、
(@名詞性 sem(行う)−上位構造 機能名(をobj))が
マッチする。さらに、(をobj)もマッチするので、目
的言語パターン<v-|test|-003>が原言語中間構造に対応
する目的言語パターンである。 前記で求めた目的言語パターン<v-|test|-003>を
元として、 <v-|test|-003>→<n-|test|-002>→<p-|of|-001><p-|fo
r|-001> の順に目的言語・句パターンと原言語中間構造とを照合
する。まず、<v-|test|-003>は、 であるから、目的言語パターンは、動詞が "conduct"
で目的語が<n-|test|-002>あるいは<n-|test|-003>の文
型であることがわかる。
【0051】 <n-|test|-002>は、 (<Pattern> (|test| (<p-|of|-001>) (<vinf-|to determine|-002>)) (<Example> "A TEST OF (test-subj) TO DETERMINE(A or B)") (<Component> ((X1 X1) <DirObj-PATIENT>) ((X2 X1) <Xnnn-BINARY_CONTRAST>)) であり、<Component>欄の第1行、 <Component> ((X1 X1) <DirObj-PATIENT>) すなわち、 <p-|of|-001>の<SOMETHING> ((X1 X1):<Pattern>行の1番目の項の構成要素の1番目
の項) は、 IC「テストする」(図6〜図10)の<DirObj-PATIEN
T> に対応することがわかる。
【0052】IC「テストする」(図6〜図10)によ
ると、<DirObj-PATIENT>は<Required>であるから必須な
構成要素である。原言語中間構造から<DirObj-PATIENT>
に対応する要素を抽出する。<DirObj-PATIENT>は目的言
語側のラベルであるから、原言語中間構造から直接抽出
することはできない。したがって、予め目的言語側のラ
ベルに対応する原言語側のラベルを複数、優先順位をつ
けて記述した対応表を用意しておき、目的言語側のラベ
ルを原言語側のラベルに変換してから、原言語中間構造
から対応する要素を抽出する。本発明の実施例では、<D
irObj-PATIENT>には "をobj" が最優先で対応するもの
とし、したがって、原言語中間構造の "をobj" の要素
"変電所" が<DirObj-PATIENT>に対応すると求められ
る。
【0053】 前記で求められた "変電所" の目的
言語訳は、対訳辞書DBによると、"transformer stati
on" であり、その意味属性は INS であることがわか
る。つまり、<p-|of|-001>の<SOMETHING>が "transform
er station" で、その意味属性はINS であると求められ
た。 <p-|of|-001>の<SOMETHING>は、<DirObj-PATIENT>で
あるという条件があるから、これを確かめる。意味関係
表(一種の意味ネットワークであり、意味属性間の関係
が記述されている)によると、意味属性 INS は意味属
性 PATIENT に属すので、先の条件は満足され、<DirObj
-PATIENT>に対応する原言語中間構造内の要素が存在す
ることが確認できた。
【0054】 <Component>欄の第2行、 ((X2 X1) <Xnnn-BINARY_CONTRAST>)) も第1行と同様な処理を行うが、 (<vinf-|to determine|-002>) ((X2 X1) : <Pattern>行の2番目の項の構成要素の1番
目の項) に対応する構成要素は、原言語中間構造には存在しな
い。しかし、 (<vinf-|to determine|-002>)の構成要素の1番目の項 は、 IC「テストする」(図6〜図10)の<Xnnn-BINARY_C
ONTRAST> に対応し、これが<Preferred>であるから、原言語中間
構造には存在しなくてもよい。
【0055】 以上の結果より、<n-|test|-002>は、
原言語中間構造にマッチすることがわかる。同様な処理
を経て、<n-|test|-003>も、原言語中間構造にマッチす
ることがわかる。 したがって、<v-|test|-003>は、 の二種のパターンがともに原言語中間構造にマッチす
る。
【0056】一方、原言語文 "安全か、安全でないか、を決めるために変電所を対象
にして、テストを行った。" …(例b) の場合、同様な照合処理の結果、 の内、<n-|test|-002>は、 (<Pattern> (|test|(<p-|of|-001>)(vinf-|to determine|-002>)) (<Example> "A TEST OF (test-subj) TO DETERMINE (A or B)") (<Component> ((X1 X1) <DirObj-PATIENT>) ((X2 X1) <Xnnn-BINARY_CONTRAST>)) において、 DirObj-PATIENT → "変電所" : <Required> Xnnn-BINARY_CONTRAST→マッチせず: <Preferred> と対応し、<n-|test|-003>は、 (<Pattern> (|test|(<p-|of|-001>)(vinf-|to determine|-001>)) (<Example> "A TEST OF (test-subj) TO DETERMINE (WHETHER A or not A)") (<Component> ((X1 X1) <DirObj-PATIENT>) ((X2 X1) <Xnnn-BOOLEAN>)) ) において、 DirObj-PATIENT → "変電所" :<Required> Xnnn-BOOLEAN → "安全か、安全でないか" :<Preferred> と対応する。
【0057】したがって、 (conduct <n-|test|-002>) (conduct <n-|test|-003>) のいずれもマッチする。このような場合、どちらの目的
言語・句パターンを取捨選択するかが問題になる。しか
し、<n-|test|-002>のXnnn-BINARY_CONTRASTには、対応
する原言語情報がないのに対し、<n-|test|-003>のXnnn
-BOOLEANには、対応する原言語情報が存在する。Xnnn-B
INARY_CONTRAST,Xnnn_BOOLEANは、両者とも<Preferred
>であるから、対応する原言語情報が存在しなくても、
目的言語・句パターンを満足するが、<Preferred>に対
応する原言語情報の存在が確認されている方が、より確
からしい目的言語・句パターンであると判断することは
妥当である。つまり、この例では、(conduct <n-|test|
-003>) (conduct <n-|test|-002>) の順に優先順位を付ける。
【0058】目的言語・句パターン中の構成要素の内、
対応する原言語情報が存在しているものの数を計数する
ことによって、上記の判断を行うことができる。先の例
(例b)の場合、以下の形式で句パターン毎に対応する
原言語情報がある構成要素数を管理しておけば(図36
に管理表を示す)、 <v-|test|-003>→<n-|test|-002>→<p-|of|-001><vinf-
|to determine|-002> という照合処理の結果、満たされる構成要素数は、各々
の句パターンにおいて対応する原言語情報がある構成要
素数の和 0+0+(1+0)=1 と求められる。同様に、 <v-|test|-003>→<n-|test|-003>→<p-|of|-001><vinf-
|to determine|-001> は、 0+0+1+1=2 と求められる。
【0059】(2)マッチする構成要素に重要度を付記
する。前記(1)で述べたように、原言語中間構造と目
的言語・句パターンとが照合され、目的言語・句パター
ン中のどの構成要素が原言語情報のどれに対応するかが
求められる。目的言語・句パターン中の構成要素には、
先の例では<Required>と<Preferred>との2種類が存在
し、<Required>である構成要素は、それを満たす原言語
情報がなくてはならない。<Preferred>である構成要素
は、それを満たす原言語情報がなくてもよい。との制約
があった。しかし、これだけでは目的言語・句パターン
が複数マッチした場合、どれを優先すればよいのかを決
められなかった。そこで、この制約を拡張し、目的言語
・句パターン中の構成要素毎にその重要度を数値で記憶
しておき、目的言語・句パターン毎に照合スコアを求め
れば、スコアに基づいて優先順位を判断するようにし、
最適な目的言語・句パターンを選択することができるよ
うにする。
【0060】例えば、図6〜図10の目的言語・文パタ
ーンの一例の場合、 のように、各構成要素毎に数値による重要度(数値が大
きい程、重要)が付記されており、<Required>の要素<S
ubj-AGT><DirObj-PATIENT>だけ対応する原言語情報が存
在すれば、このときの照合スコアは、 照合スコア=20+30=50 と求める(本発明の実施例では、照合スコアは各重要度
の和として定義したが、任意の評価式が定義可能であ
る)。<Required>の要素<Subj-AGT><DirObj-PATIENT>に
加え、<Preferred>の要素<Xnnn-BOOLEAN>に対応する原
言語情報が存在すれば、このときの照合スコアは、 照合スコア=20+30+3=53 となる。このようにして、マッチ可能な目的言語・句パ
ターンの照合スコアを全て求めた後、照合スコアの高い
順に目的言語・句パターンを優先すると判断する。
【0061】(3)目的言語・文パターンおよび目的言
語・句パターンに重要度を付記する。"変電所を対象に
してテストする" は、図6〜図10の目的言語・文パタ
ーンの一例の、 "test"「機械や装置等のテストを行う」と、 "examine"「学科や知識などをテストする場合」との
両方にマッチする。 このように、原言語中間構造が複数の目的言語・文パタ
ーンにマッチする場合に、どれを優先するかを決めるた
めに、目的言語表現の出現頻度などを調査し、それに基
づく重要度を目的言語・文パターン毎に付記しておけ
ば、重要度を比較することによって、複数のパターンマ
ッチした場合にも優先順位を付けることができる。
【0062】図6〜図10では、例えば、図37に示す
ように、重要度を数値で付記する。番号の横の数値が重
要度である。同様に、原言語中間構造が複数の目的言語
・句パターンにマッチすることもある。例えば、照合処
理の説明に用いた先の例では、 (conduct <n-|test|-003>) (conduct <n-|test|-002>) の2種類の目的言語・句パターンにマッチする。このよ
うな場合に優先順位をつけるために、目的言語・句パタ
ーン毎に重要度を付記する。パターンの横の数値が重要
度である。 (conduct <n-|test|-003>) 50 (conduct <n-|test|-002>) 40 重要度を比較することによって、複数のパターンマッチ
した場合にも、優先順位を付けることができる。
【0063】(4)複数種類のマッチ条件を備える。前
記(1)で述べたように、目的言語・句パターンの各構
成要素と原言語情報とを照合する際、構成要素と原言語
情報とは意味的に整合がとれていなければならず、それ
を保証するために、原言語情報の対訳語の意味マーカを
求め、目的言語・句パターンの構成要素が要求する意味
マーカに属するか否かを判定している。上記に加え、目
的言語・句パターンの構成要素に直接、原言語の表層を
記述しておき、照合処理において原言語情報の表層と照
合する。原言語の表層と一致するときに限りマッチする
ので、非常に稀な表現は、この形式で記述しておけば、
誤ってマッチする恐れが少ない。また、原言語の表層的
に決まり切った表現も、この形式で記述しておけば、対
訳処理や意味マーカ間を照合する必要がないので、照合
処理の負担を軽減できる。更に、目的言語のシソーラス
辞書とその原言語訳とを用意しておれば、目的言語・句
パターンの構成要素に目的言語を記述することによっ
て、照合条件を作成することができる。本方式によれ
ば、目的言語・句パターンを作成する場合、その構成要
素を満足する条件を目的言語単語を記述することによっ
て表現できるために、目的言語・句パターンに該当する
例文を調査し、その構成要素にあたる目的言語単語を収
集すればよいので、目的言語・句パターンの作成が容易
になる。
【0064】以下、実施例について説明する。図6〜図
10の目的言語・文パターンの一例において、図38の
ように各構成要素欄にその構成要素となりうる目的言語
単語を記述する。先述した照合処理において、原言語単
語の目的言語訳の意味マーカと目的言語・文パターンの
意味マーカとの整合を調査する代わりに、図39の対訳
シソーラス辞書を用いて原言語単語の目的言語訳を求
め、更に、図40の目的言語シソーラス辞書を用いて目
的言語単語のシソーラス単語を求める。つまり、原言語
単語の目的言語シソーラス単語を求める。求めた目的言
語シソーラス単語が、図38の目的言語・文パターンに
記載されていれば、目的言語シソーラス単語の元となっ
た原言語単語情報によって構成要素が満たされると判断
する。
【0065】次に、請求項6について説明する。今まで
の構成では、マッチした文パターンに対して常に1つの
文表現しか得られない。そのため、同一のパターンにマ
ッチした場合は常に同一の構文で訳出することになる。
しかし、これでは表現が単調になる上に、談話上不自然
な文章構成になる恐れがある。例えば、談話構造の基本
的な原則として、新しい情報(新情報)は文尾に近い位
置に現れやすく、古い情報(旧情報)は文頭に近い位置
に現れやすいという原則がある。したがって、例えば、
同一の名詞がキーとなる文が連続した場合、最初の文で
はキーとなる名詞が文尾に近い目的語の位置に現れやす
いが、後続の文では文頭に近い主語の位置に生じるのが
普通ということになる。同一パターンに1つの文表現し
かない場合、このような差異は表わしようがない。これ
を解消するため、1つの文パターンに対して、同一要求
項目から生成可能な別表現パターンを有し、同一パター
ンにマッチする文が連続する場合、別パターンを用いて
訳出を行う。
【0066】次に、各機能の役割について説明する。 目的言語パターン抽出:抽出ICバッファ内のポインタ
により、目的言語パターンDBの内容を検索し、その内
容に従って中間構造(S)の内容を分析し、一旦対象文
に対するICを仮に決定する。それと共に、その仮に決
定されたICに対応する目的言語側(この場合:英語)
の単語(または熟語)が、要求する目的言語文パターン
で指定された句パターンにより、原言語に表現されてい
る内容を目的言語で全部表現できるように文構造を決定
する。言い換えると、英語のICが目的言語側の文の中
でどのような役割を持ち、他にどのような単語や句,節
を要求するのかを分析し、その要求情報を中間構造
(S)から抽出し、目的言語側の文構造を決定する。ま
た、1つの句パターンは、デホルトの表現に加えて1つ
以上の別表現パターンを持つことができる。これによ
り、原文の表現が同一の句パターンにマッチする場合で
も、訳文側で同一表現が続くことを避けることができ
る。
【0067】次に、使用データベースの内容について説
明する。 目的言語句パターン:一例を図11に示す。 目的言語文パターンで指定された句パターンにより、原
言語に表現されている内容を目的言語で全部表現できる
ように文構造を決定する。 <Pattern> :文法的に成立する英単語,デホルト値,
他の句パターンの並びの一単位。 <Example> :このDBを更新するときの説明用例。 <Component>:(Xn Xm)の形で記述しているが、意味とし
ては、n番目のXが示すm番目のXを取りだして用いるとい
うことを示している。 別パターン付き目的言語句パターン:一例を図41,図
42に示す。 次の項目以外は、図11と同一の構成である(微細は多
少異なる)。 <AltPat>:<Pattern>で記述されているものと同一項目
の別の並びを示す。
【0068】次に、動作について説明する。次に、目的
言語・句パターンDBが別パターンを持つ場合の一実施
例を示す。ここでは、図41,図42に "test" 句パタ
ーンDBの例を挙げる。DBの構成および動作は、別パ
ターン<AltPat>を除き、図11と同一である。図43に
挙げた原文の翻訳を例(図44)に、別パターン選択の
一実施例を示す。ここでは、直前の文と同一句パターン
を用いる場合に、強制的に別パターンを生成する処理の
例を示す。例としてあげた原文は、3文から成る。ま
ず、1文目(文ナンバーJ01)が読み込まれ、原言語解
析,IC抽出,目的言語パターンマッチなどを経て、訳
文E01を得る(この文の処理に必要なDB等の具体例は
省略する。原言語側では「研究」「目的」等がキーとな
り、目的言語側では "study" "purpose" 等がキーとな
る)。処理した文のナンバーは、訳出に用いた句パター
ンのポインタとペアで、「使用パターン記憶バッファ」
に記憶される。この場合、例えば J01:<n-|purpose|-0
01>が記憶される。
【0069】次に、2文目(文ナンバーJ02)が読み込
まれる。原文解析を経て、原言語中間構造が得られる。
文パターンDBを示す図6〜図10の<English-Pattern
s-Pointer>でマッチする "sem" 項は「行う」だけなの
で、<v-|test|-003>が選ばれる。句パターンDBを示す
図41,図42の中から、文パターンのポインタと一致
する<v-|test|-003>が選ばれる。この時点で、選択した
ポインタを「使用パターン記憶バッファ」に記憶されて
いるポインタと比較する。処理している文の1つ前の文
ナンバーを呼び出し、そのポインタと選択されたポイン
タを比較する。ここでは、呼び出したポインタは<n-|pu
rpose|-001>であるのに対し、選択されたポインタが<v-
|test|-003>で一致しないため、図41,図42で<Patt
ern>の項に記述された句パターンがそのまま使用され
る。なお、この文のナンバーと使用ポインタのペアJ02:
<v-|test|-003>は「使用パターン記憶バッファ」の記憶
内容に追加される。句パターン<v-|test|-003>は更に下
位パターンを持つので、その中から(|conduct| <n-|tes
t|-002>が選ばれる。各項目のマッチング処理は、既に
説明した例(基本の例)と同様に行われ、訳文 E02 が
得られる。この例では原文にない "conducted" の主語
として代名詞 "we" を挿入するものとする。
【0070】次に、3文目(文ナンバーJ03)が読み込
まれる。原言語中間構造と図6〜図10の<English-Pat
terns-Pointer>でマッチする "sem" 項は「行う」だけ
なので、<v-|test|-003>が選ばれ、句パターンDBでも
同一ポインタが選択される。「使用パターン記憶バッフ
ァ」に記憶されている前文(J02)のポインタと比較する
と、どちらも<v-|test|-003>であるため、<AltPat>に記
述された別パターンを使用する。下位パターンの中から
(<n-|test|-003> |be conducted|)が選ばれ、訳文 E0
3 が得られる。<n-|test|-003>の句パターンに記述され
ている任意要素は、"beconducted" の後ろに訳出される
ものとする。なお、図45に別パターンなしで処理を行
った場合の訳出例を示す。
【0071】次に、要求情報が欠如している場合の訳文
生成(構成11)について説明する。文の場合 ;目的言語パターン抽出によって、目的言語
側で要求される情報である<Subj-AGT>の項が埋まってい
ないことがわかった。つまり、動作主の情報が欠如して
いる。この場合に、システムで用意してあるデホルト値
を含む訳文の中間構造を作成するかわりに、動作主を明
示しなくてもすむ中間構造を決定する。このためには、
目的言語中間構造の構造変換規則(図46)にアクセス
して、動作主がなくてもよい受動文の構造を中間構造と
して作成する。これにより、図47〜図50に示すよう
な画面ではなく、図51に示すような画面が表示され
る。図中のコメント欄には、原文に主語(動作主)がな
いので、訳文を受動文にしているという情報が表示され
る。なお、図52には、ガイダンスリストが示されてい
る。
【0072】次に、請求項8について説明する。動作概
要は次のとおりである。 (1)入力された原文を解析し、原言語中間構造を構成
する。図53に原文の例を示し、図54に原言語中間構
造を示した。 (2)IC候補リストDBを参照し、上記中間構造から
ICとなりうる単語を抽出し、抽出ICバッファに蓄積
する。 (3)抽出されたICは、IC候補リストDB内に書か
れている目的言語パターンへのポインタを持っている。 (4)上記ポインタにより目的言語パターンDBの内容
を検索し、その内容に沿って上記中間構造を分析し、目
的言語側の文構造を決定する。
【0073】(5)上記において、原言語側の情報も目
的言語側の情報に対応して作成する。これらの情報を要
求情報バッファに蓄積する。この際、目的言語側に反映
されなかった原文中の情報を、要求情報バッファに蓄積
する。この情報を余分情報と呼ぶ。図55に要求情報バ
ッファの例を示した。余分情報が REL-STAY_WITH とい
う項目で付加されている。ここでは、「新しい」が訳文
に反映されず、余分情報として認識されている。 (6)オペレータとの対話型で翻訳本体を動作させてい
る場合に、文構造を決定する際、余分情報、及びその余
分情報の内容に関するコメント情報をガイダンスバッフ
ァへ送る。 (7)上記コメント情報は、ガイダンスリストDBから
取り出す。すなわち、RELATIONAL として分類されたも
のより選択し取り出す。このコメントには余分情報を反
映させるか否かに関する質問も含まれている。図56に
ガイダンスリストDBの例を示した。
【0074】(8)原文,要求情報バッファの内容,ガ
イダンスバッファの内容を合成して表示バッファに送
り、ディスプレーに表示する。図57に対話画面の例を
示した。 (9)余分情報を反映させるか否かに関する指示を、入
力IFよりオペレータから受け取る。 (10)オペレータの指示が「反映させない」ならば、処
理を続行する。 (11)オペレータの指示が「反映させる」ならば、目的
言語パターンの選択に戻り、上記余分情報を反映する目
的言語の構造を構成し、以降の処理を続行する。図58
に余分情報を反映した場合の要求情報バッファの例を示
した。図59に新たな対話画面の例を示した。
【0075】以下、請求項16(構成21)について説
明する。目的言語駆動翻訳(以後TDC)において、以
下の文の照合処理を説明する。 「私は、あなたがするか否かを決断するために装置をテ
ストする。」 (1).<English-Pattern-Pointers>内のパターンの<R
estrictions>の内、そのsem()項と原言語中間構造の
sem 項とがマッチするものを選択する。本例では、(@
名詞性 sem(行う)−上位構造−機能名(を obj))が
マッチする。さらに、(を obj)もマッチするので、目
的言語パターン<v-|test|-003>が原言語中間構造に対応
する目的言語パターンである。 (2).前記(1)で求めた目的言語パターン<v-|test
|-003>を元として <v-|test|-003>→<n-|test|-002>→<p-|of|-001><p-|fo
r|-001> の順に目的言語・句パターンと原言語中間構造とを照合
する。まず、<v-|test|-003>は であるから、目的言語パターンは動詞が“conduct”で
目的語が<n-|test|-002>あるいは<n-|test|-003>の文型
であることがわかる。
【0076】(3).<n-|test|-002>は (<Pattern> (|test|<p-|of|-001>)(vinf-|to determine|-002>)) (<Example> “A TEST OF(test-subj)TO DETERMINE(AorB)”) (<Component> ((X1 X1) <DirObj-PATIENT>) ((X2 X1) <Xnnn-BINARY_CONTRAST>)) ) であり、<Component>欄の第1行、 <Component> ((X1 X1) <DirObj-PATIENT>) すなわち、 <p-|of|-001>の<SOMETHING> ((X1 X1):<Pattern>行の1番目の項の構成要素の1番
目の項) は、 IC「テストする」(図6〜図10)の<DirObj-PATIENT> に対応することがわかる。
【0077】IC「テストする」(図6〜図10)による
と、<DirObj-PATIENT>は<Required>であるから必須な構
成要素である。原言語中間構造から<DirObj-PATIENT>に
対応する要素を抽出する。<DirObj-PATIENT>は目的言語
側のラベルであるから、原言語中間構造から直接抽出す
ることはできない。したがって、予め目的言語側のラベ
ルに対応する原言語側のラベルを複数、優先順位をつけ
て記述した対応表を用意しておき、目的言語側のラベル
を原言語側のラベルに変換してから、原言語中間構造か
ら対応する要素を抽出する。本例では、<DirObj-PATIEN
T>には、“をobj”が最優先で対応するものとし、した
がって原言語中間構造の“をobj”の要素“装置”が<Di
rObj-PATIENT>に対応すると求められる。
【0078】(4).前記(3)で求められた“装置”
の目的言語訳は対訳辞書DBによると、“the device”
であり、その意味属性は INS であることがわかる。つ
まり、<p-|of|-001>の<SOMETHING>が“the device”
で、その意味属性は INS であると求められた。 (5).<p-|of|-001>の<SOMETHING>は、<DirObj-PATIE
NT>であるという条件があるから、これを確かめる。意
味関係表(一種の意味ネットワークであり、意味属性間
の関係が記述されている)によると、意味属性 INS は
意味属性 PATIENTに属すので、先の条件は満足され、<D
irObj-PATIENT>に対応する原言語中間構造内の要素が存
在することが確認できた。
【0079】(6).<Component>欄の第2行 ((X2 X1) <Xnnn-BINARY_CONTRAST>)) も第1行と同様な処理を行うが、 (vinf-|to determine|-002>) ((X2 X1):<Pattern>行の2番目の項の構成要素の1番
目の項) に対応する構成要素は原言語中間構造には存在しない。
しかし、 (vinf-|to determine|-002>)の構成要素の1番目の項 は IC「テストする」(図6〜図10)の<Xnnn-BINARY_CON
TRAST> に対応し、これが<Preferred>であるから、原言語中間
構造には存在しなくてもよい。 (7).以上の結果より、<n-|test|002>は原言語中間
構造にマッチすることがわかる。同様な処理を経て、<n
-|test|003>も原言語中間構造にマッチすることがわか
る。 (8).したがって<v-|test|003>は の二種のパターンがともに原言語中間構造にマッチす
る。
【0080】(9).原言語中間構造中の 「あなたがするか否かを決断するために」 に対応する目的言語・句パターンが見つかっていないの
で、この部分にマッチする目的言語・句パターンを探
す。今、図6〜図10の目的言語・文パターンで満足さ
れてにいない要素は、 <Xobj-CONDITION>,<X-BINARY-CONTRAST>,<Xnnn-BOOLE
AN> の3つである。 「あなたがするか否かを決断するために」 が3つのうちのいずれに該当するかを調べる。「〜する
ために」という日本語は、目的、理由、の二通りが
考えられ、各々の英訳は異なるが、このどちらかを選択
することは日本語解析系の問題であり、本発明の範囲を
越える。それ故、ここでは目的、であったとして説明
を続ける。「〜するために」の目的の意味の英訳は不定
詞句“to〜”であり、「決断する」の英訳は“decide”
であることは、英日対訳辞書から容易にわかる。したが
って、目的言語・句パターンDBにおいて不定詞句 <vinf-|to decide|-XXX> を探索する。
【0081】(10).探索の結果、目的言語・句パタ
ーンDB中の<vinf-|to- decide|-XXX>が図60であっ
たとする。<vinf-|to- decide|-000>に対しては Xnnn-BOOLEAN →“あなたがするか否か”;
<Preferred> と対応し、図11に示す目的言語・句パターンにおいて
Xnnn-BOOLEAN が満たされる。<vinf-|to decide|-001>
に対しては Xnnn-BINARY_CONDITION →対応する要素なし であるから、句パターン<vinf-|to decide|-001>はマッ
チしない。 (11).(10)の照合結果により、 「あなたがするか否かを決断するために」 は、<vinf-|to decide|-000>によって目的言語に翻訳す
る。生成処理の詳細については省略するが、原言語中間
構造と目的言語・句パターン要素との対応関係が求めら
れているので、目的言語生成ルールによって 「あなたがするか否か」 → “you will do it or no
t” と翻訳される。
【0082】(12).原言語中間構造の内、対応関係
のない要素が無くなったので、前記(1)〜(8)で既
に対応済みの要素も目的言語生成ルールによって、目的
言語へ翻訳する。 I conduct a test of it to decide whether you will do it or not. 必須部 任意部 このように、ICによって駆動された目的言語・句パタ
ーン中の要素に対応する原言語中間構造要素が無い場合
は、その要素が<Prefered>(任意)であるならばその要
素に限ってICとは関係なく目的言語・句パターンを選
択し、目的言語訳を作成する。これによって、目的言語
・句パターンが不完全な場合でも翻訳作業を進めること
ができる。
【0083】次に、構成22について説明する。しかし
ながら、任意部は必須部とは関係なく選択した部分なの
で必須部との整合がとれている保証がない。したがっ
て、必須部および任意である範囲を明示し、使用者に確
認を要求する。例えば、図60に表示の一例を示す。グ
ラフィカル・ユーザ・インターフェースに基づく表示例
において、使用者はマウス等のポインティング・デバイ
スによって、受理あるいは棄却を入力する。これによっ
て、目的言語での妥当性が保証されている必須部と保証
されていない任意部とを区別できるので、使用者の確認
作業が著しく軽減され、かつ誤った目的言語文が作成さ
れることが避けられる。
【0084】次に、構成23について説明する。また、
使用者あるいは使用目的によっては構成22記載の確認
作業を実施することが煩わしい場合もあるので、確認の
有無を予め設定できるようにしておく。これによって、
使用目的に応じた柔軟な運用が実現できる。
【0085】以下、構成24について説明する。構成2
2記載の目的言語文の確認作業において、使用者が妥当
であると確認した場合、当該目的言語文を作成する過程
に用いた目的言語・句パターンの内、ICに無関係に選
択した目的言語・句パターンがあるなら、それをICに
関係した目的言語・句パターンとして新規に登録する。
先の例では、予め登録されている目的言語・句パターン
の内、原言語中間構造に合致したのは以下の2パターン
である。 これらの内、原言語中間構造中の要素を満たしたもの
は、必須要素(<Required>)の<DirObj-PATIENT>だけで
あり、それは両パターンに共通である。この要素に、任
意要素(<Preferred>)で新たに追加した目的言語・句
パターン<vinf-|to decide|-000>を組み合わせて、新し
い目的言語・句パターン<n-|test|-004>を作成する。図
61に句パターン<vinf-|to decide|-XXX>の例を示す。
【0086】図62は、確認作業後に新規に登録する句
パターンの例を示す図である。このように、ICに基づ
いて選択された必須要素に対応する目的言語・句パター
ンと、ICに関係なく選択された任意要素に対応する目
的言語・句パターンとを組み合わせた目的言語・句パタ
ーンを新規に登録する。この作業を繰り返せば、使用者
の翻訳したい文に応じて目的言語・句パターンがICの
周辺部に関して精密化されていくので、使用者が所望す
る目的言語文が正確にかつ速やかに得られる。したがっ
て、以後、同様な原言語文を翻訳する際には、妥当であ
ることを確認済みの目的言語・句パターンを用いて目的
言語文を作成するので、以前の確認作業を繰り返す必要
がない。
【0087】さらに、新規に作成した句パターンを任意
の基準に分類して記憶、また利用できれば、使用目的に
応じて柔軟な運用が実施できる。例えば、分類の基準と
して使用者別を設定すれば、使用者の翻訳したい文に対
応して目的言語・句パターンが使用されるので、使用者
の所望する目的言語文が正確にかつ速やかに得られる。
また、分類の基準として分野別を設定すれば、翻訳した
い文の属する分野を選択した後、翻訳処理を実施すれ
ば、翻訳対象分野に適した目的言語・句パターンが使用
されるので、高精度な翻訳が行える。種類別に記憶する
には、目的言語パターンDBにおいて、分類フィールド
欄を新設し、新規にパターンを登録する場合、分類フィ
ールドに所望の種類を記入して記憶すればよい(図63
の“USER1”“USER2”)。利用する際には、分類フィー
ルドの種類と使用者の所望する種類とが一致する目的言
語・句パターンを抽出すればよい。
【0088】本発明は以上の実施例に限定されるもので
はなく、 ICによって駆動された目的言語・句パターン中の要
素に対応する原言語中間構造要素が無い場合は、その要
素が<Prefered>(任意)であるならばその要素に限って
ICとは関係なく目的言語・句パターンを選択し、目的
言語訳を作成する手段 必須部および任意部である範囲を明示し、使用者に確
認を要求する手段 確認の実施の有無を設定する手段 ICに基づいて選択された必須要素に対応する目的言
語・句パターンと、ICに関係なく選択された任意要素
に対応する目的言語・句パターンとを組み合わした目的
言語 作成した目的言語・句パターンを新規に記憶する手段 新規に作成した句パターンを任意の基準に分類して記
憶する手段 種類に合致する句パターンを検索する手段 を持ち、目的言語・句パターン学習機能を有する機能翻
訳装置を提供することに本質がある。
【0089】図64は、本発明による言語変換装置の他
の実施例を説明するための構成図で、図中、21は入力
部、22は翻訳部、23はユーザ選択部(第3の選択手
段)、24は結果確認部、25は出力部、26は情報記
録部である。入力部21は原文を読み取る機能を有し、
入力手段としてはキーボード、OCR(Optical Charac
ter Reader:光学式文字読取装置)、音声入力などがあ
る。翻訳部22は、入力部21の原文を目的言語に翻訳
処理する。結果確認部24は、翻訳部22の翻訳結果が
確認できるようにしたものである。ユーザ選択部23
は、翻訳部22の翻訳結果に基づいて、必要な目的言語
を選択するものである。情報記録部26における情報記
録手段としては、FD(フレキシブル・ディスク)、内
蔵メモリ、RAM(Random Access Memory)、ROM
(Read Only Memory)ディスクなどがある。処理時のバ
ッファ並びに翻訳に必要な各種辞書、データベース類等
の情報を保持する。出力部25は、翻訳部22の翻訳結
果及び結果確認部の出力情報を表示する。出力手段とし
ては、ディスプレイ、プリンタ、音声合成などがある。
【0090】図65は、図64における翻訳部の構成図
で、本発明方式による翻訳処理部と、従来方式による翻
訳処理部とが含まれている。本発明方式の翻訳処理部
は、中間構造獲得部と、IC抽出部と、文パターン同定
部と、文パターン要求情報獲得部と、中間構造決定部
と、訳文生成部とから構成されている。
【0091】図66は、図64における結果確認部の構
成図で、図中、31はユーザ選択部(第2の選択手
段)、32は逐語訳付与部、33は再翻訳部、34はユ
ーザ選択部(第1の選択手段)、35は従来方式再翻訳
部、36は本発明方式再翻訳部である。ユーザ選択部3
1は逐語訳を付与するか、再翻訳をするかを選択するも
ので、ユーザ選択部34は、従来方式の再翻訳を行う
か、本発明方式の再翻訳を行うかを選択するものであ
る。なお、結果確認部における確認手段には逐語訳付与
手段、あるいは再翻訳手段以外の手段があってもよく、
同様に再翻訳部における手段には、本発明方式再翻訳
部、あるいは従来方式再翻訳部以外の手段の存在を妨げ
るものではない。
【0092】図67は、情報の受け渡しに関する一実施
例を示す図である。図中で“TD翻訳”といった場合、
前述した本発明方式の翻訳処理部の構成により翻訳され
るものであり、従来方式による翻訳を“SD翻訳”と呼
ぶことにする(TD=Target language Driven,SD=So
urce language Driven)。入力原文が入力文として翻訳
部にわたされる。翻訳には、従来方式によるものと本方
式によるものとがある。逐語訳はどの方式においても辞
書引きの段階で得られる情報である。一回目の訳文が生
成されて結果確認に入る。結果確認によって再度確認用
の入力文が指定され、翻訳、逐語訳などによって、意図
する内容の確認を行う。確認用入力文の訳出が行われて
再度結果確認部に入り、入力原文に対する訳文の指定を
行って最終的な解を出力する。
【0093】図68は、本発明による言語変換装置の動
作を説明するためのフローチャートである。以下、各ス
テップに従って順に説明する。なお、ユーザ指定が無い
場合は適宜ディフォルト処理を行う。まず、入力文原文
が与えられ(step1)、入力部で入力文としてこれを受
け(step2)、ユーザに問い合わせて翻訳方法を選択し
てもらう(step3)。ユーザの指定する翻訳方法で翻訳
処理(ディフォルトはTD翻訳である)を実施し(step
4)、翻訳を終了すると訳文を表示する(step5)。翻
訳結果の確認を行うかどうかを問い合わせ(step6)、
結果確認に入ったらユーザに確認モードへの入力文を指
定してもらう(step7)。結果確認を行わなければ、ユ
ーザによる最終訳文選択を行い(step8)、表示して終
了する(step9)。
【0094】図69及び図70は、本発明による翻訳方
法の説明である。原言語は日本語(原文は日本文)目的
言語は英語(訳文は英文)を例にして説明する。 例文:“私はその月間セールス報告書を読んで驚いてい
る。” 中間構造抽出 中間構造の形式については、後述するIC抽出並びに文
パターン同定、要求情報獲得に効率よく情報がわたせれ
ばよく、特に指定しない。
【0095】IC抽出 ICとは対象とする文の真に言いたい事柄(概念(Ide
a))の中心となる言葉(Center)のことを指し、Idea
Center と称する言葉の略語である。ICの抽出方法に
は、意味解析を使用したり、係の深さを利用するなど様
々な方法があるが、図7のように、対象とする文のIC
を決定しやすくするためにIC候補リストDBを有し、
これを参照して判別するという方法もある。IC度は頻
度、分野偏り度、また運用上の重要度などから判断して
付与するなどする。図70では辞書を兼ねているので、
特にIC候補でないものは“0”にしておく。図に搭載
されている情報は例であり、情報種類、形式等が異なっ
てもよい。出現順も図のものは便宜上のであり、これら
に拘束される必要はない。 文パターン同定 IC抽出のあと、日本語のIC語に対応した英語を見つ
けなくてはならない。図70及び図71では上位意味を
設定し、ここで対応づけを行っているが direct に単語
単位で行っても構わないし pibot 的な方法も考えられ
る。図71では各上位意味に対し、その文パターンを示
すポインタが付与され、図72のようなDBにアクセス
する。
【0096】文パターン要求情報獲得 文構造は目的言語側に沿ったものだが、原言語側の情報
も目的言語側の情報に対応して作成する(図73参
照)。これらの内容を要求情報バッファに蓄積する。対
話型でないときは、中間構造から抽出できなかった情報
はデフォルト値を挿入して処理を終了させる。 中間構造決定部 ICに対応する目的言語側(この場合:英語)の単語
(または熟語)が、要求する目的言語文パターンで指定
された句パターンにより原言語に表現されている内容を
目的言語で全部表現できるような構造に決定する。 訳文生成 目的言語中間構造の内容を表層の訳文に生成する。
【0097】図74〜図78は、画面表示を示す図であ
る。図中アンダーライン部分はユーザが入力する。デフ
ォルトの翻訳は前述した本発明方式の翻訳処理部の構成
により翻訳されるものであり、“TD翻訳”といった場
合はこれをさすものとする(TD=Target language Dri
ven)。これに対し、従来方式による翻訳を“SD翻
訳”と呼ぶことにする(SD=Source languageDrive
n)。画面レイアウトや質問形式は一例であり、縦二分
割して入力文と結果で分ける等々勿論もっとみやすく工
夫してもよく、これを拘束するものではない。
【0098】図74は、原文入力モードを示す。step1 :入力を促すので画面のように文を入力する。こ
れは、処理の便宜上“a”という略称で指定できるとす
る(これは再入力の手間省きであり、必須ではない)。
以下この略称で指定することを前提とする。step2 :次に、請求項17の手法による翻訳結果が示さ
れる。これは、“b”で以下指定できる。“b=a”と
は“aの翻訳結果がb”の意味である。step3 :翻訳結果が意図通りであるかの確認を行うかを
きいてくるので、ここでは“Y”を入れることにする。
【0099】図75は、結果確認モード(再翻訳−SD
翻訳による−)を示す。step4 :結果確認モードに入り、確認方法を選択する。
この例では“1”の再翻訳を選んだときを示す。再翻訳
モードに入る。step5 :従来方式であるSD翻訳を選択する。step6 :何語に翻訳するか選択する。マシンでフォロー
していない言語の場合、次のステップで辞書等を指定し
て情報を与える必要がある。この例では入力原文と何言
語である日本語を選んだとする。step7 :辞書等の言語データの指定を行う。前記step6
でフォローしていない言語を指定されたら、使用する言
語データの入ったファイルの指示等を要求する。この実
施例の場合では、すでに用意されたものがあり、それを
使用することにする。step8 :再翻訳の入力を指定する。この実施例では
“b”“This monthly…”を指定する。“=b”で
“b”を入力とすることの意である。step9 :“b”をSD翻訳した結果例を示してある。こ
の結果は“c”で指定できる。step10 :続行するか問い合わせる。step11 :前記step8と同機能を有し、“a”の“私は
その月間…”を指定する。step12 :“私はその月間…”をSD翻訳した結果例を
示す。
【0100】図76は、結果確認モード(再翻訳−TD
翻訳による−)を示す。step13 :“N”でSD翻訳を終了する。step14 :翻訳方法の選択に戻る。今度はTD翻訳を選
択する。step15 :前記step8と同機能を有し、“c”の“その
月間…”を指定する。step16 :“その月間…”をTD翻訳した結果例を示
す。図77は、結果確認モード(逐語訳による)を示
す。step17 :“N”でTD翻訳を終了する。step18 :“N”で再翻訳を終了する。step19 :“Y”で結果確認は続行する。step20 :確認方法を選択する。“2”で逐語訳による
確認を選択する。step22〜24 :逐語訳モードに入る。図78は、結果確認
モード終了・解選択を示す。step25 :再翻訳続行の有無を判断する。step26 :結果確認続行の有無を判断する。確認モード
に入る。step27 :翻訳結果を選択する。
【0101】請求項18(構成32)は原言語ICを抽
出するIC抽出手段と、該IC抽出手段により抽出され
たICを含む目的言語の表現パターンを同定する同定手
段と、該同定手段により同定された表現パターンが要求
する情報を原言語文から抽出する情報抽出手段と、前記
表現パターンが要求する情報を表示する表示手段と、該
表示手段により表示された情報を変更できる編集手段と
を有する。図79は、構成32から表現パターンが要求
する情報を表示する表示手段とを除いた実施例として、
原言語文あるいは該原言語文を解析した結果の解析構造
を入力する原言語文入力手段と、目的言語における表現
の中心となる語句であるICごとに、該ICの原言語で
の対応語句と、ICが必要とする情報及びそのデフォル
ト値と、ICのとる表現パターン名の候補群と、それら
の制約条件とを有するIC辞書と、前記ICのとる表現
パターン名ごとに、該表現パターンと表現パターンに必
要な語句の情報とを有するIC表現パターン辞書と、前
記原言語の語句と該語句に対応する目的言語の語句を対
にもつ対訳辞書と、前記原言語の入力からIC辞書の原
言語での対応語句によりICを抽出するIC抽出手段
と、該IC抽出手段で抽出されたICに関する情報テー
ブルをメモリ上に複写し、ICが必要とする情報を原言
語の入力から検索する検索手段と、該検索手段で検索さ
れた原言語の語句から対訳辞書を用いて対応する目的言
語の語句を得、両言語の語句の対をIC情報テーブルの
メモリ上の対応する位置に設定する設定手段と、該設定
手段で設定された内容を前記ICのとる表現パターン名
の候補に与えられた制約条件と適合度を評価し、該適合
度に応じて表現パターンあるいは表現パターン名を選択
する選択手段と、該選択手段により選択された表現パタ
ーンあるいは表現パターン名に関し、該表現パターンあ
るいは表現パターン名に必要な語句をIC情報テーブル
のメモリ上から同定し、同定できなかった場合は、必要
な語句のデフォルト値を同定する同定手段と、前記表現
パターン名に関し、該表現パターンに応じて前記同定手
段で同定された語句を並べて目的言語文を出力する出力
手段と、該出力手段によって出力された目的言語の文を
編集できる編集手段とから成る言語変換装置を説明する
構成図で、図中、41は原言語文入力手段、42はIC
辞書、43はIC表現パターン辞書、44は対訳辞書、
45はIC抽出手段、46は検索手段、47は設定手
段、48は選択手段、49は同定手段、50は出力手
段、51は編集手段である。ICとは、対象とする文の
真に言いたい事柄(概念(Idea))の中心となる言葉(Ce
nter)のことを指し、Idea Center と称する言葉の略語
である。原言語文入力手段41は、原言語文,あるいは
原言語文を解析した結果の解析構造を入力する。IC辞
書42は、目的言語における表現の中心となる語句であ
るICごとに、ICの原言語での対応語句と、ICが必
要とする情報及びそのデフォルト値と、ICのとる表現
パターン名の候補群とそれらの制約条件とを有する。I
C表現パターン辞書43は、ICのとる表現パターンご
とに、表現パターンと、該表現パターンに必要な語句の
情報とを有する。対話辞書44は、原言語の語句と、そ
れに対応する目的言語の語句とを対にして有している。
【0102】IC抽出手段45は、原言語の入力からI
C辞書42の原言語での対応語句によりICを抽出す
る。検索手段46は、前記IC抽出手段45で抽出され
たICに関する情報テーブルをメモリ上に複写し、IC
が必要とする情報を原言語の入力から検索する。設定手
段47は、前記検索手段46で検索された原言語の語句
から対訳辞書44を用いて対応する目的言語の語句を
得、両言語の語句の対をIC情報テーブルのメモリ上の
対応する位置に設定する。選択手段48は、前記設定手
段47で設定された内容を前記ICのとる表現パターン
名の候補に与えられた制約条件と適合度を評価し、その
適合度に応じて表現パターン(名)を選択する。同定手
段49は、前記選択手段48により選択された表現パタ
ーン(名)に関し、表現パターンに必要な語句をIC情
報テーブルのメモリ上から同定し、同定できなかった場
合は、必要な語句のデフォルト値を同定する。出力手段
50は、前記表現パターン名に関し、表現パターンに応
じて前記同定手段49で同定された語句を並べて目的言
語文を出力する。編集手段51は、前記出力手段50に
よって出力された目的言語文をユーザが編集できる。
【0103】原言語の入力 図80の最初に示す日本語の例文「変電所をテストし
た」に関して説明する。最初の例文については、次のよ
うな形態素列と解析構造が示されている。 原言語文:変電所をテストした 形態素列:<変電所><を><テストする><た>
【0104】ICの抽出 IC辞書には、英語のICがエントリとして登録されて
いるが、各ICのデータは、図81のようなデータが保
持されている。この中で、"TO_SEARCH" というラベルが
付けられたデータが、日本語文における対応語句がある
か否かの条件になっている。ここでは、次の "TO_SEARC
H1","TO_SEARCH2" の2種類があるが、各々、形態素列
あるいは解析構造に関する記述となっている。 TO_SEARCH1 (<テストする> <試験する> <テスト<を>.*<行う> <試験>.*<を><行う>) TO_SEARCH2 (テストする 試験する)
【0105】原言語の対象としては、形態素列や原文そ
のものでも本発明の実現は可能であるが、以降、解析構
造を想定して説明する。従って、"TO_SEARCH2" によれ
ば、"テストする" あるいは "試験する" という項が解
析構造中にあるか否かという条件であり、最初の例文の
解析構造は、"(sem テストする)" という項をもつこと
から条件に合致する。IC辞書中の各ICについて同様
な検査を行い、合致したICが選択される。当然、複数
のICが選択される可能性があるが、ここでは、その選
択については特に問わず、簡単のために、ここでは図8
1のIC"test"が検出されたとする(なお、この他、検
出方法としては、目的言語のICと原言語での対応語句
の対を、原言語の語句をエントリにテーブル化した辞書
を作成しておいて、解析構造中の各項の値をキーに検索
する方法も考えられる)。
【0106】ICの必要情報の検索・設定 次に、選択されたICのもとにあるテーブル形式のデー
タ全体をメモリ上に複写する。データのうち、"Require
d" と "Preferred" の配下にある次のデータ群は、その
ICが必須的あるいは選好的に求める項の情報に関す
る。 Required AGENT:主語 DEFAULT_VALUE ((<SOMEONE> <行為者>) (<PERSON> <テストする人>) (<AGENCY> <テストを行う人>) (<TEST CONDUCTOR> <テストを行う人>)) TO_FILL ((@が [*])) OBJECT:直接目的語 DEFAULT_VALUE ((<SOMETHING> <対象>) (<TEST SUBJECT> <テスト対象>)) TO_FILL ((@を [*])(@の [*]) ([する(@と [対象])(@を [*])]) ([する(@に [対象])(@を [*])])) Preferred CONDITION:状態 DEFAULT_VALUE ((<CONDITION/STATE> <状態>) (<CIRCUMSTANCES> <状況>)) TO_FILL ((@ために [*])(@のため [*])) OR_COND:OR_状態 DEFAULT_VALUE ((<A or B> <AかB>) (<CONDITION/STATE A or B> <状態AかB>) (<CIRCUMSTANCES A or B> <状況AかB>)) TO_FILL ((@ために (@OR [*1] [*2])) (@のための (@OR [*1] [*2])))
【0107】すなわち、必須的項としては、"AGENT:主
語" と "OBJECT:直接目的語" があり、選好的項として
は、"CONDITION:状態" と "OR_COND:OR_状態" がある
(":"の前後が各々英語,日本語の項の名にあたる)。
各々が "DEFAULT" と "TO_FILL" という下位の項をも
つ。"DEFAULT" は、いわゆるデフォルト値で、英語と日
本語の語句の対が複数並んでいる。"TO_FILL" は、その
項の "VALUE" 項を埋めるための検索方法が記されてい
る(ここでは、原言語の解析構造内での検索方法)。例
えば、"AGENT"項は、ラベル名が "@が" である項の値で
あり、"OBJECT"項は、ラベル名が "@を" あるいは "@
が" あるいは "[する(@と[対象])(@を[*])]"が "[する
(@に[対象])(@を[*])]" という部分構造内のラベルが "
@を" の値であることを示す。これにより、最初の例文
の解析構造からは、4つの項のうち、"OBJECT" の項だ
けが "変電所" を得、さらに対訳辞書を用いて英語の語
句を得るが、他の項は検索に失敗する。結果として、各
項の "VALUE" 項と "VALUE" 項の値が nil の場合に有
効となる "DEFAULT_VALUE"項は、次のようになる。
【0108】 Required AGENT:主語 VALUE nil DEFAULT_VALUE ((<SOMEONE> <行為者>) (<PERSON> <テストする人>) (<AGENCY> <テストを行う人>) (<TEST CONDUCTOR> <テストを行う人>)) OBJECT:直接目的語 VALUE (|transformer station| 変電所) DEFAULT_VALUE ((<SOMETHING> <対象>) (<TEST SUBJECT> <テスト対象>)) Preferred CONDITION:状態 VALUE nil DEFAULT_VALUE ((<CONDITION/STATE> <状態>) (<CIRCUMSTANCES> <状況>)) OR_COND:OR_状態 VALUE nil DEFAULT_VALUE ((<A or B> <A か B>) (<CONDITION/STATE A or B> <状態AかB>) (<CIRCUMSTANCES A or B> <状況A か B>)
【0109】同定された原言語(日本語)の語句は、
(日英)対訳辞書により目的言語(英語)の語句が求め
られるが、単純な単語レベルでなく、句相当の表現がで
る場合もある。その場合には、簡易日英翻訳機能を用い
て変換することとする。なお、日英対訳辞書による変換
あるいは句レベルの簡易日英翻訳機能は、従来技術によ
り十分可能なので、ここでは、特に詳しく述べない。な
お、上記の "|transformer station|" の "|" の枠は、
原型を示す標識である。
【0110】IC表現パターンの選択 次には、以下に示すようなICのデータの "PATTERNS"
の項の配下にある "<v-|test|-000>" などという表現パ
ターン名とその制約条件の対により表現パターンが選択
される。 PATTERNS <v-|test|-000> (#OBJECT#) <v-|test|-001> (#OBJECT# #CONDITION#) <v-|test|-002> (#OBJECT# #CONDITION#) <v-|test|-003> (#OBJECT# #OR_COND#) <n-|test|-001> ((others <名詞性>) #OBJECT# #CONDITION#) <n-|test|-002> ((others <名詞性>) #OBJECT# #OR_COND#)
【0111】すなわち、各表現パターンの対に与えられ
たリストは、メモリ上のICデータに格納された "Requ
ired" あるいは "Preferred" の下位項のVALUE項の値、
あるいは、解析構造中の内容の制約条件を示す。例え
ば、"<v-|test|-000>" は、"OBJECT"項が埋まっている
ことを求め、"<v-|test|-001>" と "<v-|test|-002>"
は、"OBJECT"項と"OR_COND"項が埋まっていることを求
めている。また、"<n-|test|-000>" は、さらに解析構
造中に "(others<名詞性>)" の構造を求めている。こう
した制約によれば、"<v-|test|-000>" は、1制約中の
1つを満たし、"<v-|test|-001>" , "<v-|test|-002>"
, "<v-|test|-003>" は、2制約中の1つ、また、"<n-
|test|-001>" と "<n-|test|-002>" は、3制約中の1
つしか満たしていないことになる。この制約条件は、適
切な表現パターンを選択するためのものだが、制約満足
数と制約の満足度が高い程、適切とすることにより、こ
こでは、"<v-|test|-000>" が選択されるものとする。
【0112】表現パターンの語句の同定 ここで選択された表現パターンに基づき、目的言語文が
生成される。すなわち、図82のIC表現パターン辞書
に、選択された "<v-|test|-000>" をエントリとして、
次の表現パターンの情報が記されている。 <v-|test|-000> PATTERN ((X0 |test| X1)) COMPONENT ((X0 #AGENT#) (X1 #OBJECT#)) EXAMPLE ((<SOMEONE> tests <SOMETHING>))
【0113】"PATTERN"項の値には、表現パターンの語
句の並びの候補が1つ以上指定されている。この場合
は、"X1" と "|test|" と "X2" の並びのパターンが一
つ指定されている(なお、表現パターン中では、目的言
語の語句の原型が "|" にはさまれて表示され、また、
ICに対応する語句の前の語句が "X0" 、以降の語句
が"X1" , "X2" …という変数で表される)。さらに、"C
OMPONENT"項では、各変数の充填元がICの情報の項名
の形式で指定されている。すなわち、"X0" は "AGENT"
項であり、"X1" は "OBJECT"項である。後者は、"VALU
E"項の値が "(|transformer station| 変電所)" である
が、前者は nil であるので、 "DEFAULT VALUE"項の値
が同定される。この場合、"DEFAULT VALUE"項の値は、
複数の英語と日本語の語句の対があるが、通常はその先
頭 "<SOMEONE> <行為者>" をとる(ただし、必要に応じ
て2番目以降のデータも随時参照できる)。ここで検索
された値は、目的言語と原言語の語句の対であるが、そ
のうちの目的言語の語句を同定する。すなわち、X0は "
<SOMEONE>" ,X1は "|transformer station|" をとる。
【0114】目的言語文の生成 同定,変換された語句を表現パターンの並びで表示する
と、次のようになる。 <SOMEONE> |test| |transformer station| 実際の英語文を出力するには、"|" で囲まれた原型の語
句の形態素生成や冠詞などを付加しなければならない。
ここでも、こうした生成は、従来の機械翻訳技術による
ものとして詳細は示さないが、結果として次のような文
が生成される。 <SOMEONE> tested a transformer station. ここで得られた英語の文は、日本語で省略されている主
語の項がデフォルト値ではあるが補足されており、英語
として自然な表現に近くなっている。請求項19(構成
33)記載の言語変換装置では、さらに、上記の目的言
語文をユーザが編集する手段を有する。
【0115】なお、上記の説明で現れなかったデータの
いくつかについて補足する。 "OBJECT"項の "TO_FILL"項にある次の検索条件 ([する(@と [対象])(@を [*])])([する(@に [対象])(@
を[*])]) は、次の解析構造 [行う(tense<PAST>)(@を[テストする(others<名詞性
>)]) (pre-supp[する(@に [対象])(@を [変電所])])] の "変電所" を検索する。
【0116】次の "PATTERNS" の表現パターン候補は、 PATTERNS <v-|test|-000> (#OBJECT#) <v-|test|-001> (#OBJECT# #CONDITION#) <v-|test|-002> (#OBJECT# #CONDITION#) <v-|test|-003> (#OBJECT# #OR_COND#) <n-|test|-001> ((others <名詞性>) #OBJECT# #CONDITION#) <n-|test|-002> ((others <名詞性>) #OBJECT# #OR_COND#) 上記では、"<v-|test|-000>" が制約満足数,制約満足
度が最も高かったが、ICの情報として "CONDITION"
が設定されていれば、"<v-|test|-001>" と "<v-|test|
-002>" が最も高くなるし、さらに、"<名詞性>" があれ
ば、"<n-|test|-001>" と "<n-|test|-002>" が最も高
くなる。
【0117】次の表現パターン <v-|test|-001> PATTERN ((X0 |test| X1 <p-|for|-001>)) COMPONENT ((X0 #AGENT#) (X1 #OBJECT#) ((X2 X1) #CONDITION#)) EXAMPLE ((<SOMEONE> tests <SOMETHING> for <CONDITION/STATE>)) では、"COMPONENT"項の変数の指定部分に "(X2 X1)" と
いう表現が使われている。これは "X2"、すなわちIC
から2番目の位置の表現パターン "<p-|for|-001>" における "X1" 、すなわち "|for|" の次の語句に関す
る指定で、"|for|" の次の語句は、"CONDITION"項から
同定せよという意味である。以上が、請求項18(構成
32)記載の言語変換装置から、表現パターンが要求す
る情報を表示する表示手段を除いた言語変換装置であ
る。構成32は、これに表現パターンが要求する情報を
表示する表示手段を加えた言語変換装置である。表示手
段の実施例は、次の請求項19(構成33)の実施例で
代えるものとする。
【0118】構成33:[表形式の表示・編集] 請求項18の言語変換装置において、表示手段におい
て、前記表現パターンが要求する情報を表形式で表示
し、該表示手段で表示された表形式の値を編集できる編
集手段を有する。たとえば、前記表現パターン(名)選
択手段が〜その値をメモリの設定し直す手段とを有す
る。
【0119】本発明では、抽出されたICに関するメモ
リ上の情報のうち、"Required" あるいは "Preferred"
の下位の項の "VALUE"項,"VALUE"項の値が nil であれ
ば、"DEFAULT-VALUE"項の値を表形式で表示し、かつ、
ユーザがその値部分を編集可能とするものである。表形
式の表示としては、例えば、次の表1のように行う。
【0120】
【表1】
【0121】さらに、本発明では、ユーザはこの表1に
おける "VALUE" の欄を編集できる。例えば、 "AGENT"
項の "VALUE"欄を、次のように "we" と書き換えるとす
る。以下の表2のようになる。
【0122】
【表2】
【0123】この後、ユーザの編集が終了した時点で、
この変更は、次のようにメモリ上のIC情報に反映され
る(この時、原型を示す "|" が "we" の前後に付加さ
れる)。 Required AGENT:主語 VALUE (|we|) DEFAULT_VALUE ((<SOMEONE> <行為者>) (<PERSON> <テストする人>) (<AGENCY> <テストを行う人>) (<TEST CONDUCTOR> <テストを行う人>)) OBJECT:直接目的語 VALUE (|transformer station| 変電所) DEFAULT_VALUE ((<SOMETHING> <対象>) (<TEST SUBJECT> <テスト対象>))
【0124】以降、請求項19に記載された言語変換装
置と同じく、この情報に基づいて表現パターン(名)が
選択され、その表現パターンに基づいて目的言語文が生
成される。この場合は、表現パターンとしては同じ "<v
-|test|-000>" が選択されるが、表現パターン中の "X
0" が同定でき、次のような並び |We| |tested| |transformer station| に基づき、次の文が生成される。 We tested a transformer station.
【0125】構成34:[表形式の表示・編集の改良] 請求項19の言語変換装置において、表形式での表示手
段で表示された表形式の項について、その項の必要度に
応じて表示形態を変更する。本発明は、IC情報の表形
式での表示の際において、必要的項とされる "Require
d"項の下位項を、選好的項とされる "Preferred"項の下
位項より強調的に表示することにより、必要項の情報設
定を促すものである。必要性を強調する表示方法はさま
ざま考えられるが、例えば、前例に対しては、表3のよ
うに"Required" で "VALUE"値のない "AGENT"項の "VAL
UE"欄を網掛け表示する(表3では"//…//"として表
示)などして必要性を強調する。
【0126】
【表3】
【0127】構成35:[表形式の表示・編集のリアル
タイムな反映] 請求項19あるいは構成34の言語変換装置において、
表形式に対する編集手段が終了した時点で、その値をメ
モリに設定し直し、以降の手段が動作し、最終的に目的
言語文を出力する代わりに、表形式に対する編集手段に
おいて、値の変更があるごとにその値をメモリに設定し
直し、以降の手段が動作し、目的言語文を出力する。前
記発明では、表形式の編集が終了時点でメモリ上のIC
情報が更新され、それにともない、目的言語文が生成さ
れたが、本発明では、値の変更ごとに目的言語文の生成
を行う。本発明での表形式の表示には、表4のように、
常にその時点のメモリ上のIC情報に基づく目的言語文
を生成して表示する。
【0128】
【表4】
【0129】ここで、"AGENT"項の "VALUE"欄に、次の
ように "We" が入力されると、以下の表5のようにな
る。
【0130】
【表5】
【0131】その変更に基づき、表6のように、直ちに
メモリ上のIC情報が更新され、表現パターン選択など
を経て目的言語文も更新される(なお、この時、"We"
にも原型を示す "|" が前後に付加される)。
【0132】
【表6】
【0133】以降も、"VALUE"欄の変更があるごとにメ
モリ上のIC情報が更新され、表現パターン選択などを
経て目的言語文も更新される。次の表7に示す例は、"O
BJECT"項の "VALUE"欄が更新された時の例である。
【0134】
【表7】
【0135】構成36:[複数の表現パターンの表示] 請求項19及び構成34の言語変換装置において、表現
パターンに選択手段が、その適合度に応じて複数の表現
パターンを選択し、各表現パターンごとに目的言語文を
出力する。前記までの発明では、表現パターンは1つし
か選択していなかった。本発明では、適合度に応じて複
数の表現パターンを選択する。"OBJECT"項だけが充填さ
れている例では、制約満足数と制約満足の程度は各々次
の表8のようであった。
【0136】
【表8】
【0137】ここで、適合度の定義を、例えば制約満足
数と制約満足率の積とし、選択する表現パターンを上位
2位までとすると、上記の場合には、第2位が同点で3
表現パターンあるので、上の4つの表現パターンが選択
される。各表現パターンにより、次の目的言語文が生成
される。 <v-|test|-000>: <SOMEONE> tested a transformer station. <v-|test|-001>: <SOMEONE> tested a transformer station for <CONDITION/ STATE>. <v-|test|-002>: <SOMEONE> made a test of a transformer station for <CONDITION/STATE>. <v-|test|-003>: <SOMEONE> conducted a test of a transformer station to determine <A or B>. 構成35の表形式の表示では、次の表9のような表示が
得られる。
【0138】
【表9】
【0139】請求項20(構成37):[原言語表現パ
ターンによる原言語文の表示] 請求項19及び構成34,35の言語変換装置におい
て、IC表現パターン辞書中の目的言語の表現パターン
に対応する原言語の表現パターンを併せもつとともに、
目的言語の表現パターンに応じて目的言語文を出力する
以外に、対応する原言語の表現パターンに応じて原言語
文を出力する手段を有する。本発明では、図83のよう
に、IC表現パターン辞書において、目的言語の表現パ
ターンごとに対応する原言語の表現パターンをもつ。例
えば、表現パターン"<v-|test|-000>" では、次のよう
に、日本語の表現パターン "J-PATTERN" が付加されて
いる。 <v-|test|-000> PATTERN ((X0 |test| X1)) CONPONENT ((X0 #AGENT#) (X1 #OBJECT#)) EXAMPLE ((<SOMEONE> TESTS <SOMETHING>)) J-PATTERN ((X0 が X1をテストする))
【0140】この原言語のパターンを用いて、目的言語
文とともに原言語文も表示する。この際、IC情報中で
同定する値は、両言語の語句の対のうちの原言語の語句
を選ぶ。すなわち、X0に対しては、"<SOMEONE>" の対で
ある "<行為者>" ,X1に対しては、 "|transformer sta
tion" の対で、原文中にあった "変電所" が得られる。
これらの語句を日本語の表現パターンに基づいて並べる
と、次のような日本語が同時に得られる。 <SOMEONE> tested a transformer station. <行為者>が変電所をテストした。 これにより、ユーザは日本語文においても必要な項が認
識できる。
【0141】構成38:[原言語文での編集] 構成37の言語変換装置において、原言語文出力手段に
よって出力された原言語文をユーザが編集できる手段
と、編集された原言語文において、変更された位置の原
言語の語句を検出し、それを元の目的言語の表現パター
ンのメモリ上に設定し直す手段とを有し、前記設定手段
により設定し直されたメモリの内容に基づき、表現パタ
ーンの選択以降の手段が動作する。本発明では、前記発
明において表示された原言語文に対する編集機構を含め
る。さらに、その際、編集において変更された語句を検
出し、その語句を目的言語の対応語句を求めた上で、対
にしてメモリ上のIC情報に反映し、以降、目的言語文
の生成を行う。
【0142】例えば、 <行為者>が変電所をテストした。 の原言語文の "<行為者>" 部分を "彼ら" に書き換えた
とする。 彼らが変電所をテストした。 原言語文のもととなった原言語の表現パターンとの対応
から、X0が "彼ら" に変わったことを認識し、その目的
言語の対応語句とともにメモリ上のIC情報を更新す
る。この場合、 "AGENT"項が "(|they| 彼ら)" とな
る。この更新に基づき、目的言語文を生成すると、 They tested a transformer station. が得られる。
【0143】構成39:[原言語文での編集のリアルタ
イム化] 構成38の言語変換装置において、原言語文に対する編
集手段が終了した時点で、その値をメモリに設定し直
し、以降の手段が動作し、最終的に目的言語文を出力す
る代わりに、原言語文に対する編集手段において、値の
変更があるごとにその値をメモリに設定し直し、以降の
手段が動作し・目的言語文を出力する。本発明は、請求
項19に対する構成35の変更ごとの目的言語生成の関
係と同じく、構成38に対する変更ごとの目的言語生成
である。すなわち、原言語文に対する変更があるごと
に、その結果をメモリ上のIC情報に反映し、それに基
づく目的言語文を生成する。
【0144】構成40:[複数の目的言語パターンの選
択を対応する原言語パターンで選択する] 構成38,39の言語変換装置において、選択された表
現パターンに対応する原言語パターンによる原言語文の
みを表示し、該原言語文が複数になった場合、ユーザに
原言語文の選択も許容し、前記ユーザが選択した原言語
文に対応する表現パターンに基づき目的言語文を生成す
る。構成36の説明では、次の4つの表現パターンが選
択された例を示した。
【0145】 <v-|test|-000> <v-|test|-001> <v-|test|-002> <v-|test|-003> そこで、これらの表現パターンにより、次の目的言語文
が生成された。 <SOMEONE> tested a transformer station. <SOMEONE> tested a transformer station for <CONDITION/STATE>. <SOMEONE> made a test of a transformer station for <CONDITION /STATE>. <SOMEONE> conducted a test of a transformer station to determine <A or B>.
【0146】本発明は、目的言語文を生成する代わり
に、請求項20(構成37)で追加された原言語のパタ
ーンにより、次のように、原言語文だけを生成する。 <行為者>が変電所をテストした。 <行為者>が<状態>のために変電所をテストした。 <行為者>が<状態>のために変電所のテストを行った。 <行為者>が<状態A か B>を決めるために変電所のテスト
を実施した。 その後にユーザはいずれかの文を編集する、あるいは選
択すると、それに対応する表現パターンが決定し、その
表現パターンにより目的言語文を生成する。すなわち、
例えば、ユーザが第1の原文の "<行為者>" を "彼ら"
に書き換えたとすると、それにより第1の文が選択さ
れ、従って、表現パターンとして "<v-|test|-000>" が
決まり、以降、構成38で示したように、次のように目
的言語文が生成される。 彼らが変電所をテストした。 They tested a transformer station.
【0147】請求項21(構成41):[目的言語文で
の編集での原言語語句の許容] 請求項19において、目的言語文に対する編集手段が終
了した時点で、編集された目的言語文において変更され
た値が原言語の語句であれば、前記原言語の語句を対訳
辞書を用いて目的言語の語句に変換する手段より変換
し、目的言語文の対応する原言語の語句と置換する。請
求項19では、生成された目的言語文を編集することが
できるが、本発明では、目的言語文においても構成39
と同じく、目的言語の表現パターンとの対応により、変
更語句と表現の位置、すなわち対応するIC情報の項を
検出する。さらに、その変更語句が原言語の語句であれ
ば、対訳辞書あるいは簡易翻訳機能により、対応する目
的言語の語句を得た上でメモリ上のIC情報に反映し、
以降、同様に目的言語文を生成し直す。
【0148】例えば、 <SOMEONE> tested a transformer station. の目的言語文の "<SOMEONE>"部分を "彼ら" に書き換え
たとする。 彼ら tested a transformer station. 目的言語文のもととなった目的言語の表現パターンとの
対応から、X0が "彼ら"に変わったことを認識し、かつ
"彼ら" が原言語の語句であることから、対訳辞書によ
り得た目的言語の対応語句とともにメモリ上のIC情報
を更新する。この場合、 "AGENT"項が "(|they| 彼ら)"
となる。この更新に基づき、目的言語文を生成する
と、 They tested a transformer station. が得られる。
【0149】構成42:[目的言語文での編集での原言
語語句の許容のリアルタイム化] 請求項21(構成41)の言語変換装置において、原言
語の語句を目的言語の語句と置換するのを、目的言語文
に対する編集手段が終了した時点で行う代わりに、目的
言語文に対する編集手段において、原言語の語句による
値の変更があるごとに行う。本発明は、構成38に対す
る構成39の変更ごとの目的言語生成の関係と同じく、
構成38に対する変更ごとの目的言語生成である。すな
わち、目的言語文に対する変更があるごとに、その結果
をメモリ上のIC情報に反映し、それに基づく目的言語
文を生成する。
【0150】請求項22(構成43):[ICをユーザ
が指定する] 前記までの各請求項の言語変換装置において、原言語の
入力からIC辞書の原言語での対応語句によりICを抽
出する代わりに、ユーザがICを指定する手段を有し、
前記手段によりICを得る。前記までの各請求項は、請
求項19のIC抽出手段によりICを原言語の入力から
抽出するものであった。本発明では、ICをユーザが指
定する。すなわち、ユーザのIC入力を受け付け、入力
がIC辞書に一致すれば、それをICとして以降の処理
を進める。あるいは、IC辞書にあるICの全てあるい
は一部のリストを表示し、その中から選択させることを
してもよい。一部のリストを出す指定としては、先頭が
"te" で始まるICであれば、"te*" のように正規表現
で指定することを許せば、ユーザは柔軟にICを選択す
ることができる。請求項34にこの手段を付加し、ユー
ザがICに "test" を指定したとすれば、次の表10の
ような表形式の表示がなされる。
【0151】
【表10】
【0152】図84は、本発明による言語変換装置の更
に他の実施例を説明するための構成図で、図中、61は
表示部、62は入力部、63は外部記憶部、64は印刷
部、65は制御部、66は入力/編集制御部、67は目
的言語作成支援部、68は出力制御部、69は目的言語
作成支援制御部、70は原言語解析制御部、71はデー
タベース検索制御部、72は出力表示生成制御部、73
は設定情報管理表、74は原言語解析用辞書、75は目
的言語表現パターンデータベース、76はパターン選択
判断情報、77は適合度評価部、78は検索同定部、7
9は目的言語パターン選択部、80はユーザ問い合せ
部、81はパターン選択評価部である。一般のOA機器
であるパソコン、ワードプロセッサなどと同様な構成と
なっている。中心に全体を制御する制御部65があり、
汎用マイクロコンピュータ、あるいは、専用LSIなど
で実現されている。それに入出力、記憶を受持つ周辺装
置のディスプレイ、キーボード、フロッピ、プリンタな
どがある。また、制御部65の下にデータの入力、編
集、保管、印刷を制御する部分があり、これらはファー
ムウェア、専用LSIなどで実用されている。
【0153】目的言語表現パターンデータベース75
は、データベース検索制御部71により制御される。適
合度評価部77は、目的言語の表現パターンと原言語の
入力との適合度を評価する。検索同定部78は、目的言
語の出力を生成するために、目的言語パターンが要求す
る情報を原言語の入力から検索して同定する。ユーザ問
い合せ部80は、目的言語の出力を生成するために必要
な情報をユーザとその質問・応答によって獲得する。目
的言語パターン選択部79は、適合度評価部77により
適合度に応じて原言語の入力に適合する目的言語のパタ
ーンを選択する。前記検索同定部78による必要な情報
の原言語の入力の検索・同定と、前記問い合せ部80に
よるユーザとの質問・応答との組み合わせで目的言語の
出力を生成する。
【0154】このほか上記のキーボードからくる入力情
報や日本語入力の際の仮名漢字変換は入力/編集制御含
66のもとで、また、データの編集、保管、印刷などは
入力/編集制御部66、出力制御部68のもとで行われ
る。目的言語パターンデータベース75には目的言語の
表現パターンを蓄えており、適合度評価部77によって
その目的言語パターンデータベース75の中の目的言語
パターンと原言語入力との適合度を評価し、その評価に
よって最も適合度の高いいくつかの目的言語パターンを
選択する。つぎに、選択された目的言語パターンが目的
言語の出力生成のために必要とする情報を検索・同定部
78によって原言語入力から検索・同定するか、問い合
わせ部20によってユーザに問い合わせる。原言語解析
機構を内部に有して原言語文文字列を原言語入力とする
ことも、原言語解析処理を外部で行なってその解析結果
を原言語入力とすることも考えられる。同様に、目的言
語文生成機構を内部に有して目的言語文文字列を目的言
語出力とすることも、目的言語構造を目的言語出力とし
て外部で目的言語文生成処理を行なうことも考えられ
る。
【0155】図85は、本発明による言語変換装置の動
作を説明するためのフローチャートである。以下、各ス
テップに従って順に説明する。step1 ;まず、原言語表現を入力する。step2 ;次に、原言語表現を解析する。step3 ;中心語句を決定する。step4 ;中心語句に適合する目的言語パターンを検索す
る。step5 ;目的言語パターンを用い、目的言語表現生成に
必要な情報を原言語表現入力から検索、同定変換する。step6 ;使用者との対話によって不足情報を獲得する。step7 ;生成に必要な情報が未獲得のものについてはパ
ターン中の一般代用記号で代用する。step8 ;目的言語表現を画面に表示する。
【0156】ここでは、原言語解析機構と目的言語文生
成機構を外部に持つ場合を示している。原文の解析結果
構造を入力として原文における意味的に中心となる単語
又は句を決定する。この中心語句に基づき、目的言語パ
ターンデータベースから適合する目的言語パターンを検
索する。それから、検索して得た目的言語パターンを用
い、原文の構造から目的言語パターンが必要する情報を
検索・同定、もしくは使用者への問い合わせによって獲
得し、目的言語の構造に変換する。それでも必要な情報
を獲得できなかった場合には目的言語パターン中の一般
代用記号で代用する。
【0157】原言語入力からの検索・同定と、ユーザへ
の問い合わせの組み合わせ方はいろいろ考えられるが、
ユーザへの問い合わせを優先的に行なえば、獲得する情
報の確実度は増すが、ユーザに煩雑な作業を強いること
になるので、原言語入力からの検索・同定を優先して無
用の問い合わせを減らすべきである。原言語入力からの
検索・同定によって必要な情報が得られなかった場合に
その都度利用者に問い合わせても、問い合わせする内容
を記憶しておいて次の検索・同定作業を行なって最後に
まとめて問い合わせを行なっても、先に問い合わせを行
なうよりは無用の問い合わせが少なくて済む。請求項5
の方式では、問い合わせする内容を記憶しておいて次の
検索・同定作業を行なう必要がないので効率的であり、
処理も簡単である。一方、問い合わせ時点で、原言語入
力からの検索・同定で得られた全ての情報(とそれ以前
の問い合わせで得られた全ての情報)を利用することが
できるので、無用の問い合わせを更に減らしたり、ユー
ザが答え易い質問文で問い合わせることができる。
【0158】図86(a)〜(e)は目的言語パターン
の処理例を示す図で、図(a)は入力文と従来方式の
例、図(b)は本方式の目標パターン(ユーザの目でわ
かるパターン)の例、図(c)は本方式の途中出力の
例、図(d)は原言語文の解析構造の例、図(e)は目
的言語パターンデータベースの例を各々示す図である。
この例では原言語を日本語、目的言語を英語としてい
る。以下、この例を基にして、本方式の動作を説明す
る。原言語文「変電所を対象にしてテストを行なっ
た。」を構文解析すると図(d)のような構造を得る。
この構造で示しているように、構文的には、「行なう」
という単語が原文の中心であるが、意味的には「テスト
を行なう」という句が中心と思われる。本方式ではこの
ような意味的な中心を中心語句と呼ぶ。入力している構
造から中心語句を決定する。
【0159】それから、決定している中心語句と適合度
が最も高い目的言語パターンを、図(e)に示す目的言
語パターンデータベースから検索する。この例の場合、
図(b)で示している目標パターン[(Someone) conduc
ts a test of (something){for (some purpose)}.]で
ある。小括弧()で記述されている語句、例えば(Someon
e)とか(something)を、本方式では一般代用記号と呼ん
でいる。一般代用記号はこのパターンを基に目的言語出
力を生成する時に必要な情報である。中括弧{}で記述さ
れている語句を省略しても、構文的に正しい目的文を作
成できるが、省略しない方がより自然な完成した目的言
語文を作成できる。
【0160】必要な各情報を原言語入力である原言語文
の解析構造から検索・同定するための検索キーが、図
(e)のように目的言語パターンデータベースに記述さ
れており、必要な情報はそのキーを用いて検索する。
「テストを行なう」に対応する目的言語パターンは con
ducts a test である。また、必要な情報の1つが直接
目的語で検索キー
【表層語句(対象)-上位構造-機能名(をobj)】を用いて
[sem変電所]を発見し、目的言語の構造に変換する。
一方、主語(Subj)も必要な情報であるが、対応する情
報が原言語の構造中に存在しないので、ユーザに問い合
わせを行なうことによって、それが“the government a
gency”であることを得る。
【0161】このときの質問文は、例えば、「訳文候補
“(Someone) conducts a test of (something){for (so
me purpose)}.”の主語の部分の(Someone)が分かりま
せん。『テストを行なう』のは誰ですか?」となり、ま
た、例えば、「訳文候補“(Someone) conducted a test
of (a) transformer station {for (some purpose)}.”
の主語の部分の(Someone)が分かりません。『変電所
のテストを行なう』のは誰ですか?」となる。次に“tra
nsformer station”の冠詞について問い合わせて最終出
力結果を得る。問い合わせしても得られなかった、ある
いは問い合わせしなかった不足情報については、一般代
用記号をそのまま採用する。出力結果は図86(c)で
示しているように、パターン[The government agency
conducted a test of the transformer station {for
(some purpose)}.]に対応する目的言語文となる。図8
7は、ユーザ問い合わせを行っている例である。
【0162】図88は、本発明による言語変換装置の他
の動作を説明するためのフローチャートである。以下、
各ステップに従って順に説明する(請求項23)。step1 ;まず、原言語表現を入力する。step2 ;次に、原言語表現を解析する。step3 ;中心語句を決定する。step4 ;中心語句に適合する目的言語パターンを検索す
る。step5 ;目的言語パターンを用い、目的言語表現生成に
必要な情報を原言語表現入力から検索、同定変換する。step6 ;使用者との対話によって不足情報を獲得する。step7 ;目的言語パターンの候補が複数ある場合、選択
する判断情報を提示する。step8 ;生成に必要な情報が未獲得のものについてはパ
ターン中の一般代用記号で代用する。step9 ;目的言語表現を画面に表示する。
【0163】図89は、目的言語パターンが複数ある場
合の表現パターンのデータベース内にある判断情報の一
例を示す図である。ここでは原言語が「義務を果たす」
という表現の判断情報を原言語側からみて分り易い形式
で示している。図に示すように、対応する目的言語の表
現は「do one's duty」、「perform one's duty」、
…、「do one's duties」、…など、非常に多くの類似
表現がある。この例では、それぞれの表現に対応して、
「表現のタイプ」と「説明文番号」を情報として保持し
ている。「説明文番号」は、それぞれの目的言語の表現
に対し、どのような状況、場面でその表現が使われてい
るかの解説を、原言語を使って記述したデータの収納位
置を示す。また、「表現タイプ」はそれぞれの目的言語
表現がどんな状況や場面で使われるかを粗い分類で示し
た属性値を記載してある(構成46)。
【0164】図90は、目的言語パターンが複数ある場
合の表現パターンのデータベース内にある判断情報の別
の例を示す図である。この例では、それぞれの表現に対
応して、「表現のタイプ」と「説明文番号」の他に「分
野別選択順位」を情報として保持している。「分野別選
択順位」はそれぞれの目的言語の表現に対し、どの分野
でその表現がよく使われるかを分野毎に順位で示した属
性値を保持している。例えば、「do one's duty」に記
載の数字列「11125」は初めの「1」が第1分野、
次の「1」が第2分野、…のように5分野のデータを示
している。ここで、「分野」の意味はいわゆる政治、外
交、法律、…、工業、機械、電気、電子、通信、…、社
会、生活、文化、…、といった分野に相当する。それぞ
れの数字はその分野で使われる順位を表わす(構成4
6,52)。
【0165】図91は、目的言語パターンが複数ある場
合の表現パターンのデータベース内にある判断情報のさ
らに別の例を示す図である。この例では、それぞれの表
現に対応して、「表現のタイプ」「説明文番号」「分野
別選択順位」の他に「共起表現1」「共起開現2」を情
報として保持している。「共起表現1」は原言語表現中
で、例えば、「義務を果たす」という表現とともに記述
されやすい表現や分野や状況、場面に対応して生起しや
すい表現を収納したデータの位置を示す。「共起表現
2」は目的言語表現中で、例えば、「doone's duty」と
いう表現とともに記述されやすい表現や分野や状況、場
面に対応して生起しやすい表現を収納したデータの位書
を示す(構成48〜50)。
【0166】「表現タイプ」や「分野別選択順位」ある
いは「共起表現1」「共起表現2」の情報を使って、シ
ステムは目的言語の表現パターンが複数個登録されてい
て、必要な場合はどれを選択すべきかの評価を行なう。
評価は、例えば、「表現タイプ」の場合、ごく普通の文
書の作成では属性値が『一般』の目的表現を選ぶ(高い
評価をする)。また、「分野別選択順位」の場合、順位
情報の値が小さいものを優先して評価する(図の例では
「1」が優先順位が高い、ここでは「0」は情報がない
こと(不定)を表わす)(請求項23及び構成45〜4
7)。
【0167】「共起表現1」や「共起表現2」の記述さ
れやすいor生起しやすい表現としては、文書の種類や
文書内容の分野による用語(キーワード)、表現(言い
回し)の違い(例えば、特許公報の請求項記載の言い回
し「することを特徴とする…」、法律関係の特殊用語
「瑕疵」など)、表現パターンの対象とする主語や目的
語(名詞類)の違いがある(構成48〜49,52)。
【0168】図92は、本発明の別の実施例の処理を示
すフローチャートである。以下、各ステップに従って順
に説明する。step1 ;まず、原言語表現を入力する。step2 ;次に、原言語表現を解析する。step3 ;中心語句を決定する。step4 ;中心語句に適合する目的言語パターンを検索す
る。step5 ;目的言語パターンを用い、目的言語表現生成に
必要な情報を原言語表現入力から検索、同定変換する。step6 ;使用者との対話によって不足情報を獲得する。step7 ;目的言語パターンの候補が複数ある場合、判断
情報をもとに評価し、複数パターンの選択評価情報とし
て、判断情報とともに画面を表示する。step8 ;生成に必要な情報が未獲得のものについてはパ
ターン中の一般代用記号で代用する。step9 ;目的言語表現を画面に表示する。 使用者との対話の際、目的言語パターンの候補が複数あ
る場合、選択する判断情報(材料)を使ってどの候補を
選んだらよいか、システムが評価し、判断情報とともに
評価結果を提示する(構成46)。
【0169】図93は、図92で候補を表示する際、評
価の高い順にする処理のフローチャートである。以下、
各ステップに従って順に説明する。step1 ;まず、原言語表現を入力する。step2 ;次に、原言語表現を解析する。step3 ;中心語句を決定する。step4 ;中心語句に適合する目的言語パターンを検索す
る。step5 ;目的言語パターンを用い、目的言語表現生成に
必要な情報を原言語表現入力から検索、同定変換する。step6 ;使用者との対話によって不足情報を獲得する。step7 ;目的言語パターンの候補が複数ある場合、判断
情報をもとに評価し、複数パターンの選択評価情報とし
て、判断情報とともに評価の高い順に画面に表示する。step8 ;生成に必要な情報が未獲得のものについてはパ
ターン中の一般代用記号で代用する。step9 ;目的言語表現を画面に表示する。 また、図示しないが、図93のフローチャートで評価順
位の一番高いものを1個表示するようにしてもよい。ま
た、評価順位の高いものを限定して表示するようにして
もよい(構成47,54,55)。
【0170】図94は、図92のフローチャートに対応
する本発明のユーザ問い合せの例である。目的言語パタ
ーンを複数個抽出順に表示している(図95との比較の
ため「表現タイプ」「説明文」etc は表示していない)
(構成46)。図95は、図93のフローチャートに対
応する本発明のユーザ問い合せの例である。図90の
「分野別選択順位」の第5分野の情報を使って、目的言
語パターンを複数個選択順位順に表示している(図94
と比較のため「表現タイプ」「説明文」etc は表示して
いない)。図96は「表現タイプ」属性を使って、判断
情報付きで目的言語パターンを複数個表示した例で、オ
ペレータに表現パターンの選択を促しているところであ
る(請求項23、構成45,46)。図97は、図89
〜図91で述べた判断情報の利用をオペレータが指定す
る(変更する)場面を示した図である。ユーザ問い合わ
せの対話画面で、図示しないキーまたはメニューからシ
ステム設定の変更を呼び出し、複数パターンの評価指標
(判断情報)のどの情報を使用するか指示する。この例
では、指定はON,OFFのトグル形式となっている。
評価に使う情報は番号部分が反転表示となっている。こ
こでは、指標は複数同時に指定できる方式となってい
る。の分野の項で「自動」「手動」とあるのは、自動
では原言語表現等からシステムが自動的に分野を判断す
る設定となっている。原言語文章の入力がないなど、分
野を自動的に判断するには情報が不足しているときは、
システムはディフォルトの設定に従う。「手動」では、
オペレータが作成する文書の分野をあらかじめ指定す
る。この設定は図示しないキーまたはメニューで設定が
できる(構成53)。
【0171】図98は、図93〜図95で述べた複数候
補の表示の仕方を変更する場面を示した図で、図97の
説明と同様にして、システム設定の変更を呼び出し、複
数候補をどのように表示するか指示する。図の例では、
は第1候補のみ(候補を複数表示せず評価の一番高か
ったパターンのみを表示する)、は第1〜第3候補ま
でを表示する。候補の表示順序は評価の高い順(評価高
順)である。は全候補を表示する。但し、上限を図の
ように数値で指定できる。の評価の高いものの限定の
上限の場合も、図示しないキーまたはメニューで設定が
できる。指定は図97と同様である(構成56,5
7)。
【図面の簡単な説明】
【図1】 本発明による言語変換装置の一実施例を説明
するための外観図である。
【図2】 本発明による言語変換装置の一実施例を説明
するための構成図である。
【図3】 図2における翻訳本体の一実施例を示す図で
ある。
【図4】 本発明の分野別キーワードリストDBの一例
を示す図である。
【図5】 本発明の分野別IC候補リストDBの一例を
示す図である。
【図6】 本発明の目的言語・文パターンの一例(その
1)を示す図である。
【図7】 本発明の目的言語・文パターンの一例(その
2)を示す図である。
【図8】 本発明の目的言語・文パターンの一例(その
3)を示す図である。
【図9】 本発明の目的言語・文パターンの一例(その
4)を示す図である。
【図10】 本発明の目的言語・文パターンの一例(そ
の5)を示す図である。
【図11】 本発明の目的言語・句パターンDBの一例
を示す図である。
【図12】 本発明の分野別対訳辞書DBの一例を示す
図である。
【図13】 本発明のガイダンスDBの一例を示す図で
ある。
【図14】 本発明の翻訳状態メモリを示す図である。
【図15】 本発明の原文(J)の一例を示す図であ
る。
【図16】 本発明の抽出ICバッファの一例を示す図
である。
【図17】 本発明の原言語中間構造(S)の一例を示
す図である。
【図18】 本発明の要求情報バッファ内の一例(その
1)を示す図である。
【図19】 本発明の要求情報バッファ内の一例(その
2)を示す図である。
【図20】 本発明のガイダンスバッファの一例を示す
図である。
【図21】 本発明の表示バッファの一例を示す図であ
る。
【図22】 本発明の目的言語中間構造(T)の一例を
示す図である。
【図23】 本発明の参考文中間構造(S′)の一例を
示す図である。
【図24】 本発明の訳文(E)の一例を示す図であ
る。
【図25】 本発明の参考文(J′)の一例を示す図で
ある。
【図26】 本発明の対話(画面表示を入力)の一例
(a)を示す図である。
【図27】 本発明の対話(画面表示を入力)の一例
(b)を示す図である。
【図28】 本発明の対話(画面表示を入力)の一例
(c)を示す図である。
【図29】 本発明の対話(画面表示を入力)の一例
(d)を示す図である。
【図30】 本発明による翻訳装置の他の実施例を示す
図である。
【図31】 本発明による翻訳装置の更に他の実施例を
示す図である。
【図32】 本発明のTD方式の一実施例を示す図であ
る。
【図33】 本発明のTD方式の他の実施例を示す図で
ある。
【図34】 本発明のTD方式の更に他の実施例を示す
図である。
【図35】 本発明のTD方式の更に他の実施例を示す
図である。
【図36】 本発明の満たされる構成要素数の管理素を
示す図である。
【図37】 本発明の重要度を付記した目的言語・文パ
ターンを示す図である。
【図38】 本発明の目的言語を構成要素とする目的言
語・文パターンの一例を示す図である。
【図39】 本発明の対訳シソーラス辞書を示す図であ
る。
【図40】 本発明の目的言語のシソーラス辞書を示す
図である。
【図41】 本発明の別パターン付き目的言語・句パタ
ーンDBの一例(その1)を示す図である。
【図42】 本発明の別パターン付き目的言語・句パタ
ーンDBの一例(その2)を示す図である。
【図43】 本発明の原文(J)の一例を示す図であ
る。
【図44】 本発明の別パターン訳文(E)の一例を示
す図である。
【図45】 本発明の訳文(E)の一例を示す図であ
る。
【図46】 本発明の目的言語中間構造の構造変換規則
例を示す図である。
【図47】 本発明の対語(画面表示と入力)の一例
(その1)を示す図である。
【図48】 本発明の対語(画面表示と入力)の一例
(その2)を示す図である。
【図49】 本発明の対語(画面表示と入力)の一例
(その3)を示す図である。
【図50】 本発明の対語(画面表示と入力)の一例
(その4)を示す図である。
【図51】 本発明の対語(画面表示と入力)の一例
(その5)を示す図である。
【図52】 本発明のガイダンスリストを示す図であ
る。
【図53】 本発明の他の原文の例を示す図である。
【図54】 本発明の原言語中間構造の例を示す図であ
る。
【図55】 本発明の要求情報バッファの例を示す図で
ある。
【図56】 本発明のガイダンスリストDBの例を示す
図である。
【図57】 本発明の対話画面の例を示す図である。
【図58】 本発明の要求情報のバッファの他の例を示
す図である。
【図59】 本発明の対話画面の他の例を示す図であ
る。
【図60】 本発明の必須部と任意部とを明示する機能
を持つ表示装置の一実施例を示す図である。
【図61】 本発明の任意・句パターンの一例を示す図
である。
【図62】 本発明の確認作業後に新規に登録する句パ
ターンの例を示す図である。
【図63】 本発明の分類フィールドを設けた目的言語
・句パターンの例を示す図である。
【図64】 本発明による言語変換装置の他の実施例を
説明するための構成図である。
【図65】 図64における翻訳部の構成図である。
【図66】 図64における結果確認部の構成図であ
る。
【図67】 本発明による言語変換装置による情報の受
け渡しに関する一実施例を示す図である。
【図68】 本発明による言語変換装置の動作を説明す
るためのフローチャートである。
【図69】 本発明の中間構造抽出例を示す図である。
【図70】 本発明のIC候補リストDBの一例を示す
図である。
【図71】 本発明のIC候補対応DBの他の例を示す
図である。
【図72】 本発明の文パターンDBの一例を示す図で
ある。
【図73】 本発明の要求情報獲得の一例を示す図であ
る。
【図74】 本発明の原文入力モード画面を示す図であ
る。
【図75】 本発明の結果確認モード(SD翻訳)画面
を示す図である。
【図76】 本発明の結果確認モード(TD翻訳)画面
を示す図である。
【図77】 本発明の結果確認モード(逐語訳)画面を
示す図である。
【図78】 本発明の結果確認モード終了・解選択画面
を示す図である。
【図79】 本発明による言語変換装置の更に他の実施
例を説明するための構成図である。
【図80】 本発明の原言語文とその形態素解析列と構
文解析構造を示す図である。
【図81】 本発明のIC辞書におけるIC "test" の
内容例を示す図である。
【図82】 本発明のIC表現パターン辞書におけるI
C表現パターンの例を示す図である。
【図83】 本発明の原言語パターン付きのIC表現パ
ターン辞書におけるIC表現パターンの例を示す図であ
る。
【図84】 本発明による言語変換装置の更に他の実施
例を説明するための構成図である。
【図85】 本発明による言語変換装置の動作を説明す
るためのフローチャートである。
【図86】 本発明による目的言語パターンの処理例を
示す図である。
【図87】 本発明によるユーザ問い合せの例を示す図
である。
【図88】 本発明による言語変換装置の他の動作を説
明するためのフローチャートである。
【図89】 本発明による判断情報の例1を示す図であ
る。
【図90】 本発明による判断情報の例2を示す図であ
る。
【図91】 本発明による判断情報の例3を示す図であ
る。
【図92】 本発明による言語変換装置の他の動作を説
明するためのフローチャートである。
【図93】 本発明による言語変換装置の他の動作を説
明するためのフローチャートである。
【図94】 本発明によるユーザ問い合せの例1を示す
図である。
【図95】 本発明によるユーザ問い合せの例2を示す
図である。
【図96】 本発明によるユーザ問い合せの例3を示す
図である。
【図97】 本発明による評価指標変更の例を示す図で
ある。
【図98】 本発明による複数候補表示変更の例を示す
図である。
【図99】 従来の言語変換装置を示す図である。
【符号の説明】
1…ディスプレイ、2…FD(Floppy Disk)、3…キ
ーボード(コントローラを含む)、4…プリンタ、5…
スキャナ(OCRを含む)、6…文書エディタ、7…翻
訳エディタ、8…翻訳本体、9…原文文書DB(Data B
ase)、10…翻訳知識DB(Data Base)、11…辞書
エディタ、12…訳文文書DB(Data Base)、13…
通信系、21…入力部、22…翻訳部、23…ユーザ選
択部(第3の選択手段)、24…結果確認部、25…出
力部、26…情報記録部、31…ユーザ選択部(第2の
選択手段)、32…逐語訳付与部、33…再翻訳部、3
4…ユーザ選択部(第1の選択手段)、35…従来方式
再翻訳部、36…本発明方式再翻訳部、41…原言語文
入力手段、42…IC辞書、43…IC表現パターン辞
書、44…対話辞書、45…IC抽出手段、46…検索
手段、47…設定手段、48…選択手段、49…同定手
段、50…出力手段、51…編集手段、61…表示部、
62…入力部、63…外部記憶部、64…印刷部、65
…制御部、66…入力/編集制御部、67…目的言語作
成支援部、68…出力制御部、69…目的言語作成支援
制御部、70…原言語解析制御部、71…データベース
検索制御部、72…出力表示生成制御部、73…設定情
報管理表、74…原言語解析用辞書、75…目的言語表
現パターンデータベース、76…パターン選択判断情
報、77…適合度評価部、78…検索同定部、79…目
的言語パターン選択部、80…ユーザ問い合せ部、81
…パターン選択評価部。
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 特願平4−356646 (32)優先日 平4(1992)12月22日 (33)優先権主張国 日本(JP) (31)優先権主張番号 特願平5−45919 (32)優先日 平5(1993)2月10日 (33)優先権主張国 日本(JP) (31)優先権主張番号 特願平5−112124 (32)優先日 平5(1993)4月14日 (33)優先権主張国 日本(JP) (72)発明者 林 大川 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 加登岡 隆 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 成田 真澄 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 伊東 秀夫 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 林 寛子 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 本間 咲子 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 大黒 慶久 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 大野 亜矢子 東京都大田区中馬込1丁目3番6号 株式 会社リコー内

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 原文を解析し、該原文の中間構造を得る
    原文解析手段と、該原文解析手段により得られた原文の
    中間構造からICを抽出するIC抽出手段と、該IC抽
    出手段により抽出されたICを含む文パターンを同定す
    る同定手段と、該同定手段により同定された文パターン
    が要求する情報を原文の中間構造から抽出する情報抽出
    手段と、前記文パターンと前記抽出した要求情報から訳
    文の中間構造を決定する決定手段と、前記訳文の中間構
    造より表層の訳文を生成する訳文生成手段とから成るこ
    とを特徴とする言語変換装置。
  2. 【請求項2】 原文を解析し、該原文の中間構造を得る
    原文解析手段と、該原文解析手段により得られた原文の
    中間構造からICを抽出するIC抽出手段と、該IC抽
    出手段により抽出されたICを含む文パターンを同定す
    る同定手段と、該同定手段により同定された文パターン
    が要求する情報を原文の中間構造から抽出する情報抽出
    手段と、前記文パターンと前記抽出した要求情報から訳
    文の中間構造を決定する決定手段と、前記訳文の中間構
    造より表層の訳文を生成する訳文生成手段とから成り、
    前記同定手段は、原言語の中間構造内の情報によって満
    たされる目的言語表現パターン中の構成要素の数を計数
    する計数手段を有することを特徴とする言語変換装置。
  3. 【請求項3】 原文を解析し、該原文の中間構造を得る
    原文解析手段と、該原文解析手段により得られた原文の
    中間構造からICを抽出するIC抽出手段と、該IC抽
    出手段により抽出されたICを含む文パターンを同定す
    る同定手段と、該同定手段により同定された文パターン
    が要求する情報を原文の中間構造から抽出する情報抽出
    手段と、前記文パターンと前記抽出した要求情報から訳
    文の中間構造を決定する決定手段と、前記訳文の中間構
    造より表層の訳文を生成する訳文生成手段とから成り、
    前記文パターン中の目的言語表現パターンの構成要素に
    は、予め重要度が付記されており、前記同定手段は、原
    言語の中間構造内の情報によって満たされる目的言語表
    現パターン中の構成要素の重要度を求める演算手段と、
    該演算手段により求められた重要度によって目的言語表
    現パターンの優先順位を決定する決定手段を有すること
    を特徴とする言語変換装置。
  4. 【請求項4】 原文を解析し、該原文の中間構造を得る
    原文解析手段と、該原文解析手段により得られた原文の
    中間構造からICを抽出するIC抽出手段と、該IC抽
    出手段により抽出されたICを含む文パターンを同定す
    る同定手段と、該同定手段により同定された文パターン
    が要求する情報を原文の中間構造から抽出する情報抽出
    手段と、前記文パターンと前記抽出した要求情報から訳
    文の中間構造を決定する決定手段と、前記訳文の中間構
    造より表層の訳文を生成する訳文生成手段とから成り、
    前記文パターン中の目的言語表現パターンは、予めその
    スコアと共に記憶されているとともに、構成要素に合致
    する目的言語情報を、そのスコアと共に記憶されてお
    り、前記同定手段は、目的言語表現パターン中の構成要
    素に合致する目的言語情報に対応する原言語を記憶する
    記憶手段と、該記憶手段のスコアに基づいて目的言語表
    現パターンと原言語情報との照合度を評価する評価手段
    とを有することを特徴とする言語変換装置。
  5. 【請求項5】 原文を解析し、該原文の中間構造を得る
    原文解析手段と、該原文解析手段により得られた原文の
    中間構造からICを抽出するIC抽出手段と、該IC抽
    出手段により抽出されたICを含む文パターンを同定す
    る同定手段と、該同定手段により同定された文パターン
    が要求する情報を原文の中間構造から抽出する情報抽出
    手段と、前記文パターンと前記抽出した要求情報から訳
    文の中間構造を決定する決定手段と、前記訳文の中間構
    造より表層の訳文を生成する訳文生成手段と、目的言語
    側のシソーラス辞書を記憶する記憶手段と、該記憶手段
    のシソーラス辞書の見出し語を原言語側に翻訳した対訳
    シソーラス辞書を記憶する記憶手段とから成り、前記文
    パターン中の目的言語表現パターンは、その構成要素と
    して相当する原言語の表層を記憶する記憶手段と、構成
    要素として相当する意味マーカを記憶する記憶手段とを
    有し、前記同定手段は、目的言語表現パターン中の構成
    要素が原言語文情報の表層/意味マーカ/シソーラス語
    のいずれで満たされるかを検出する検出手段と、該検出
    手段の結果により、目的言語表現パターンと原言語情報
    との照合度を評価する評価手段とを有することを特徴と
    する言語変換装置。
  6. 【請求項6】 原文を解析し、該原文の中間構造を得る
    原文解析手段と、該原文解析手段により得られた原文の
    中間構造からICを抽出するIC抽出手段と、該IC抽
    出手段により抽出されたICを含む文パターンを同定す
    る同定手段と、該同定手段により同定された文パターン
    が要求する情報を原文の中間構造から抽出する情報抽出
    手段と、前記文パターンと前記抽出した要求情報から訳
    文の中間構造を決定する決定手段と、前記訳文の中間構
    造より表層の訳文を生成する訳文生成手段とから成り、
    前記文パターン中の目的言語表現パターンは、同一情報
    から生成する複数の別パターンを有し、前記同定手段
    は、同定結果を文毎に記憶する記憶手段と、同定結果を
    前記記憶手段の内容と比較する比較手段と、その結果一
    致する場合は別パターンに切り換える切換手段とを有す
    ることを特徴とする言語変換装置。
  7. 【請求項7】 原文を解析し、該原文の中間構造を得る
    原文解析手段と、該原文解析手段により得られた原文の
    中間構造からICを抽出するIC抽出手段と、該IC抽
    出手段により抽出されたICを含む文パターンを同定す
    る同定手段と、該同定手段により同定された文パターン
    が要求する情報を原文の中間構造から抽出する情報抽出
    手段と、前記文パターンと前記抽出した要求情報から訳
    文の中間構造を決定する決定手段と、前記訳文の中間構
    造より表層の訳文を生成する訳文生成手段と、文パター
    ンが要求する要求情報を表示する表示手段と、該表示手
    段により表示された要求情報に対して不足している情報
    の補充を得るための、または誤っている情報に対して訂
    正を受けるための入力手段とから成ることを特徴とする
    言語変換装置。
  8. 【請求項8】 原文を解析し、該原文の中間構造を得る
    原文解析手段と、該原文解析手段により得られた原文の
    中間構造からICを抽出するIC抽出手段と、該IC抽
    出手段により抽出されたICを含む文パターンを同定す
    る同定手段と、該同定手段により同定された文パターン
    が要求する情報を原文の中間構造から抽出する情報抽出
    手段と、前記文パターンと前記抽出した要求情報から訳
    文の中間構造を決定する決定手段と、前記訳文の中間構
    造より表層の訳文を生成する訳文生成手段と、文パター
    ンが必要としない情報を表示する表示手段と、該表示手
    段により表示された情報を訳文に反映させるか否かの指
    示を受けるための入力手段とから成ることを特徴とする
    言語変換装置。
  9. 【請求項9】 原文を解析し、該原文の中間構造を得る
    原文解析手段と、該原文解析手段により得られた原文の
    中間構造からICを抽出するIC抽出手段と、該IC抽
    出手段により抽出されたICを含む文パターンを同定す
    る同定手段と、該同定手段により同定された文パターン
    が要求する情報を原文の中間構造から抽出する情報抽出
    手段と、前記文パターンと前記抽出した要求情報から訳
    文の中間構造を決定する決定手段と、前記訳文の中間構
    造より表層の訳文を生成する訳文生成手段と、前記訳文
    の中間構造より原文と同言語の中間構造を得る文変換手
    段と、該文変換手段により得られた中間構造から原文と
    同言語の表層文を生成する表層文生成手段とから成るこ
    とを特徴とする言語変換装置。
  10. 【請求項10】 原文を解析し、該原文の中間構造を得
    る原文解析手段と、該原文解析手段により得られた原文
    の中間構造からICを抽出するIC抽出手段と、該IC
    抽出手段により抽出されたICを含む文パターンを同定
    する同定手段と、該同定手段により同定された文パター
    ンが要求する情報を原文の中間構造から抽出する情報抽
    出手段と、前記文パターンと前記抽出した要求情報から
    訳文の中間構造を決定する決定手段と、前記訳文の中間
    構造より表層の訳文を生成する訳文生成手段と、前記原
    文および訳文を表示する同一画面上に、対応する参考文
    である訳文の原文と同言語への直訳文を表示する表示手
    段を有することを特徴とする言語変換装置。
  11. 【請求項11】 原文を解析し、該原文の中間構造を得
    る原文解析手段と、該原文解析手段により得られた原文
    の中間構造からICを抽出するIC抽出手段と、該IC
    抽出手段により抽出されたICを含む文パターンを同定
    する同定手段と、該同定手段により同定された文パター
    ンが要求する情報を原文の中間構造から抽出する情報抽
    出手段と、前記文パターンと前記抽出した要求情報から
    訳文の中間構造を決定する決定手段と、前記訳文の中間
    構造より表層の訳文を生成する訳文生成手段と、前記原
    文と訳文との情報の差異を検出する検出手段と、前記差
    異の内容に応じたガイダンス文を得るガイダンス生成手
    段と、ガイダンス情報を表示する表示手段とから成るこ
    とを特徴とする言語変換装置。
  12. 【請求項12】 原文を解析し、該原文の中間構造を得
    る原文解析手段と、該原文解析手段により得られた原文
    の中間構造からICを抽出するIC抽出手段と、該IC
    抽出手段により抽出されたICを含む文パターンを同定
    する同定手段と、該同定手段により同定された文パター
    ンが要求する情報を原文の中間構造から抽出する情報抽
    出手段と、前記文パターンと前記抽出した要求情報から
    訳文の中間構造を決定する決定手段と、前記訳文の中間
    構造より表層の訳文を生成する訳文生成手段と、前記原
    文と訳文との情報の差異を検出する検出手段と、差異の
    あった情報によってガイダンス情報を検索する検索手段
    と、ガイダンス情報を表示する表示手段とから成り、前
    記検出手段により検出された原文と訳文の差異情報は、
    目的言語の文パターンが要求している原文の中間構造か
    ら抽出できなかった追加情報、あるいは目的言語の文パ
    ターンが要求して原文の中間構造を検索した結果、抽出
    を受けなかった余剰情報を用いるものであることを特徴
    とする言語変換装置。
  13. 【請求項13】 原文を解析し、該原文の中間構造を得
    る原文解析手段と、該原文解析手段により得られた原文
    の中間構造からICを抽出するIC抽出手段と、該IC
    抽出手段により抽出されたICを含む文パターンを同定
    する同定手段と、該同定手段により同定された文パター
    ンが要求する情報を原文の中間構造から抽出する情報抽
    出手段と、前記文パターンと前記抽出した要求情報から
    訳文の中間構造を決定する決定手段と、前記訳文の中間
    構造より表層の訳文を生成する訳文生成手段と、事前に
    翻訳した一文以上の原文の中間構造の内容を記憶する記
    憶手段とから成り、前記ICを抽出する対象に該記憶手
    段をも含めることを特徴とする言語変換装置。
  14. 【請求項14】 原文を解析し、該原文の中間構造を得
    る原文解析手段と、該原文解析手段により得られた原文
    の中間構造から訳文の中間構造に変換する変換手段と、
    前記訳文の中間構造より表層の訳文を生成する訳文生成
    手段と、前記訳文の中間構造より原文と同言語の第2の
    中間構造に変換する変換手段と、第2の中間構造から原
    文と同言語の表層文を生成する表層文生成手段とから成
    ることを特徴とする言語変換装置。
  15. 【請求項15】 原文を解析し、該原文の中間構造を得
    る原文解析手段と、該原文解析手段により得られた原文
    の中間構造からICを抽出するIC抽出手段と、該IC
    抽出手段により抽出されたICを含む文パターンを同定
    する同定手段と、該同定手段により同定された文パター
    ンが要求する情報を原文の中間構造から抽出する情報抽
    出手段と、前記文パターンと前記抽出した要求情報から
    訳文の中間構造を決定する決定手段と、前記訳文の中間
    構造より表層の訳文を生成する訳文生成手段と、前記原
    文と翻訳との情報の差異を検出する検出手段と、差異の
    あった情報によってガイダンス情報を検索する検索手段
    と、ガイダンス情報を表示する表示手段とから成ること
    を特徴とする言語変換装置。
  16. 【請求項16】 原文を解析し、該原文の中間構造を得
    る原文解析手段と、該原文解析手段により得られた原文
    の中間構造からICを抽出するIC抽出手段と、該IC
    抽出手段により抽出されたICを含む文パターンを同定
    する同定手段と、該同定手段により同定された文パター
    ンが要求する情報を原文の中間構造から抽出する情報抽
    出手段と、前記文パターンと前記抽出した要求情報から
    訳文の中間構造を決定する決定手段と、前記訳文の中間
    構造より表層の訳文を生成する訳文生成手段と、前記I
    Cによって駆動された目的言語・句パターン中の要素に
    対応する原言語中間構造素が無い場合は、その要素が任
    意であるならば該要素に限ってICとは関係なく目的言
    語・句パターンを選択し、目的言語訳を作成する作成手
    段とから成ることを特徴とする言語変換装置。
  17. 【請求項17】 原文を入力する入力部と、該入力部の
    原文を目的言語に翻訳処理する翻訳部と、該翻訳部の翻
    訳処理に必要な情報を記憶する情報記憶部と、前記翻訳
    部による翻訳結果を出力する出力部とから成る機械翻訳
    装置において、前記翻訳部が原文を解析し、該原文の中
    間構造を得る原文解析手段と、該原文解析手段により得
    られた原文の中間構造からICを抽出するIC抽出手段
    と、該IC抽出手段により抽出されたICを含む文パタ
    ーンを同定する同定手段と、該同定手段により同定され
    た文パターンが要求する情報を原文の中間構造から抽出
    する情報抽出手段と、前記文パターンと前記抽出した要
    求情報から訳文の中間構造を決定する決定手段と、前記
    訳文の中間構造より表層の訳文を生成する訳文生成手段
    と、前記翻訳部による翻訳結果が確認できる結果確認部
    とから成ることを特徴とする言語変換装置。
  18. 【請求項18】 原言語文からICを抽出するIC抽出
    手段と、該IC抽出手段により抽出されたICを含む目
    的言語の表現パターンを同定する同定手段と、該同定手
    段により同定された表現パターンが要求する情報を原言
    語文から抽出する情報抽出手段と、前記パターン表現が
    要求する情報を表示する表示手段とから成ることを特徴
    とする言語変換装置。
  19. 【請求項19】 前記表示手段において、前記表現パタ
    ーンが要求する情報を表形式で表示し、該表示手段で表
    示された表形式の値を編集できることを特徴とする請求
    項18記載の言語変換装置。
  20. 【請求項20】 前記目的言語の表現パターンに応じて
    目的言語文を出力する以外に、対応する原言語の表現パ
    ターンに応じて原言語文を出力する出力手段を有するこ
    とを特徴とする請求項19記載の言語変換装置。
  21. 【請求項21】 前記抽出手段と前記編集手段により得
    られた情報をもとに、前記表現パターンにより、目的言
    語文を出力する出力手段と、該出力手段で出力された目
    的言語文を編集する編集手段を有し、該出力手段におい
    て、該編集手段により変更された値が原言語の語句であ
    れば、目的言語の語句に変換し、目的言語文の対応する
    原言語の語句と置換して再度出力することを特徴とする
    請求項19記載の言語変換装置。
  22. 【請求項22】 前記原言語文からICを抽出する代わ
    りに、ICを指定する指定手段を有し、該指定手段によ
    りICを得ることを特徴とする請求項19又は21記載
    の言語変換装置。
  23. 【請求項23】 原言語から目的言語への変換を計算機
    を用いて行う言語変換装置において、目的言語の表現パ
    ターンのデータベースと、目的言語の表現パターンと原
    言語の入力との適合度評価手段と、目的言語の出力を生
    成するために目的言語パターンが要求する情報を原言語
    の入力から検索して同定する検索・同定手段と、目的言
    語の出力を生成するために必要な情報をユーザとの質間
    ・応答によって獲得する問い合わせ手段と、前記適合度
    評価手段による適合度に応じて原言語の入力に適合する
    目的言語のパターンを選択する選択手段と、前記検索・
    同定手段による必要な情報の原言語の入力の検索・同定
    と、前記問い合せ手段によるユーザとの質問・応答との
    組合わせで目的言語の出力を生成する出力手段とから成
    り、同一または類似の事柄を表現する目的言語の表現パ
    ターンが複数個ある場合、同パターンのデータベースに
    同パターンを選択する判断情報を合せて記憶し、複数の
    同パターンを表示する際、同判断情報を合せて表示する
    ことを特徴とする言語変換装置。 【0172】 【効果】以上の説明から明らかなように、本発明による
    と、以下のような効果がある。 (1)請求項1に対応する効果:目的言語側の文化(言
    語表現の習慣,文書記述の考え方など)によって、原言
    語側の文化的背景を吸収し、原言語側で表現している事
    柄を的確に目的言語側の表現に訳出することができるの
    で、目的言語(訳文)が分らないユーザ(モノリンガ
    ル)が自信を持って使える。また、目的言語(訳文)
    しか分らない相手(モノリンガル)が読んで、少なくと
    も意味を取り違えないレベルの訳文が得られるため、効
    率的に国際交流ができる。 (2)構成2〜4に対応する効果:請求項1と同様の作
    用効果であるが、更に的確な表現文型が得られる。 (3)請求項2〜5に対応する効果:目的言語・文パタ
    ーンの構成要素と原言語情報との照合の判定条件につい
    て、意味マーカ,原言語表層,目的言語の3種について
    述べた。これらの判定条件のうち、どの条件によって構
    成要素が満たされたのかによって、目的言語・文パター
    ンの構成要素と原言語情報との照合度に優先順位をつけ
    ることができる。例えば、原言語表層,意味マーカ,目
    的言語の順に優先すれば、原言語において決まり切った
    表現で、その目的言語訳も固定されているものはその訳
    が優先されるので、望ましい訳が容易に得られる。 (4)請求項6に対応する効果:ある句パターンに対し
    て別表現パターンを有し、同一パターンにマッチする文
    が連続する場合は別パターンを用いることで、同一パタ
    ーンにマッチした原文が常に同じ構文表現で現れるのを
    避けることができ、文章が単調になったり、談話上不自
    然な文章構成を避けることができる。 (5)構成10,11に対応する効果:請求項1と同様
    の作用効果であるが、更に使いよさが加味される。 (6)請求項7に対応する効果:文パターンの内容ある
    いは文パターンが原文に問い掛けて必要情報がなかった
    とき、システムが要求した情報の内容をユーザに確認し
    て、より適切な訳文を得るので、誤りのほとんど少ない
    訳文が得られる。また、表示された内容にユーザの意図
    と違いがある場合、表示された内容を変更し、より適切
    な訳文を得るので、効率よく相手言語の文章を作成でき
    る。 (7)請求項9に対応する効果:目的言語(訳文)が分
    らないユーザ(モノリンガル)のため、また、目的言語
    に訳された文(訳文)がユーザの言いたい内容になって
    いるかを確認することができるので、安心してその訳文
    を相手に渡すことができる。 (8)請求項10に対応する効果:ユーザの伝達したい
    事柄が的確に訳文に反映されているか、容易に確認でき
    る。 (9)請求項11に対応する効果:例えば、日本語と英
    語のように、文化的背景が大きく違う言語間の翻訳で
    は、翻訳結果を元の原文側に再翻訳されても理解不能に
    なる。そこで、ユーザの言いたい内容に訳されたかどう
    か、不安が残る場合がある。そこで、なぜそのような翻
    訳文にする必要性があるかを適切に説明を与えることに
    より、ユーザが安心してその翻訳文を相手に渡すことが
    できる。 (10)請求項12に対応する効果:請求項11と同じ
    効果があるが、更に豊富な情報をユーザに提供できる。 (11)請求項13に対応する効果:請求項7と同じ効
    果があるが、更にユーザに要求する情報の量を極力少な
    くして、ユーザの負担が軽減できる。 (12)請求項14,15に対応する効果:請求項9と
    同じ効果があるが、更に簡単な方法でその効果を得るこ
    とができる。 (13)請求項16においては、目的言語・句パターン
    が不完全な場合でも翻訳作業を進めることができる。 (14)構成22においては、目的言語での妥当性が保
    証されている必須部と保証されていない任意部とを区別
    できるので、使用者の確認作業が著しく軽減され、かつ
    誤った目的言語文が作成されることが避けられる。 (15)構成23においては、使用目的に応じた柔軟な
    運用が実現できる。 (16)構成24においては、過去に出現した原言語文
    と同様な原言語文を翻訳する際には、妥当であることを
    確認済みの目的言語・句パターンを用いて目的言語文を
    作成するので、以前の確認作業を繰り返す必要がない。 (17)構成25においては、使用目的に応じた柔軟な
    運用が実施できる。例えば、分類の基準として使用者別
    を設定すれば、使用者の所望する目的言語文が正確にか
    つ速やかに得られる。また、分類の基準として分野別を
    設定すれば、翻訳対象分野に適した目的言語・句パター
    ンが使用されるので、高精度な翻訳が行える。 (18)請求項17に対応する効果:目的言語側の文化
    (言語表現の習慣、文書記述の考え方など)によって、
    原言語側の文化的背景を吸収し、原言語側で表現してい
    る事柄を的確に、目的言語側の表現に訳出することが出
    来るので、目的言語(訳文)が分らないユーザ(モノリ
    ンガル)でも自信を持って使える。また、目的言語(訳
    文)しか分らない相手(モノリンガル)が読んで少なく
    とも意味を取り違えないレベルの訳文が得られるため効
    率的に国際交流が出来る。 (19)請求項17に対応する効果:文パターンの内容
    あるいは文パターンが原文に問い掛けて必要情報が無か
    ったときシステムが要求した情報の内容をユーザに確認
    して、より適切な訳文を得るので誤りのほとんど少ない
    訳文が得られ、表示された内容にユーザの意図と違いが
    ある場合、表示された内容を変更し、より適切な訳文を
    得るので効率よく相手言語の文章を作成できる。 (20)構成27〜31に対応する効果:目的言語に訳
    された文(訳文)がユーザの言いたい内容になっている
    かを確認することが出来るので安心してその訳文を相手
    に渡すことが出来る。また、ユーザの伝達したい事項が
    的確に訳文に反映されているか、容易に確認できる。さ
    らに、ユーザの意思にそった選択が出来るので使いやす
    さを提供することができる。 (21)請求項18,19,構成34,37,38,41に
    対する効果:ユーザからの情報を受け入れるインターフ
    ェースを向上し、多様化する。 (22)構成35,39,42に対する効果:ユーザか
    らの情報を受け入れた際のリアルタイム性を向上する。 (23)構成36,40に対する効果:ユーザがより適
    切な目的言語文を選択する手段を提供する。 (24)請求項22に対する効果:ユーザが適切な文を
    作成する手段を提供する。 (25)請求項23に対応する効果;同一または類似の
    事柄を表現する目的言語の表現パターンが複数個ある場
    合、複数の候補に合せて候補を選択する判断情報を合せ
    て表示するようにしたのでオペレータはより的確な選択
    ができ、より良い表現の目的言語の文章を作成できる。 (26)構成45に対応する効果;上記請求項23の判
    断情報は同表現パターンの検索・同定手段によって得ら
    れた順に表示するため、オベレータの負担はやや大きい
    が、オペレータが目的言語にある程度精通している場合
    は、判断情報を公平に見ることができ、より正確な候補
    の選択ができる。 (27)構成46に対応する効果;上記請求項23に加
    え、同表現パターンを選択する評価手段を設け、判断情
    報の一定の評価を行い、判断情報に合せて、オペレータ
    に選択を奨める評価情報を表示するようにしたので、オ
    ペレータがあまり目的言語に精通していない場合には、
    より良い候補の選択ができる。 (28)構成47に対応する効果;上記構成46に加
    え、オペレータに選択を奨める同評価情報の評価の高い
    順に目的言語の表現パターンを表示するようにしたの
    で、オペレータがあまり目的言語に精通していない場
    合、装置(システム)の奨める最良の候補がより分り易
    い位置に表示されているため、オペレータの判断でシス
    テムの推奨候補をそのまま採用する場合に、候補の選択
    がより容易にできる。 (29)構成48に対応する効果;上記構成46におい
    て、同表現パターンの判断情報を評価する際に、同表現
    パターンの持つ情報だけではなく目的言語の同表現パタ
    ーンを含む前後の文脈の各種情報から総合的に判断して
    評価するようにしたので、より的確な評価情報を提供で
    きる。 (30)構成49に対応する効果;上記構成46におい
    て、同表現パターンの判断情報を評価する際に、対応す
    る原言語がある場合、同表現パターンを含む原言語の前
    後の文脈の各種情報から総合的に判断して評価するよう
    にしたので、より的確な評価情報を提供できる。 (31)構成50に対応する効果;上記構成46におい
    て、同表現パターンの判断情報を評価する際に、対応す
    る原言語がある場合、目的言語の同表現パターンを含む
    前後の文脈の各種情報と同表現パターンを含む対応する
    原言語の前後の文脈の各種情報とを合せ、総合的に判断
    して評価するようにしたので、より的確な評価情報を提
    供できる。 (32)構成51に対応する効果;上記構成46におい
    て、同表現パターンの判断情報を評価する際の評価指標
    をオペレータが変更できるようにしたので、オペレータ
    が目的言語にある程度精通しかつシステムの操作に慣れ
    た場合に、場面や状況によりオペレータが評価指標を変
    更することで、より柔軟で適切な判断情報を得ることが
    できる。 (33)構成52に対応する効果;上記構成46におい
    て、同表現パターンの判断情報を評価する際に、作成中
    の文書の種類やその作成目的によって、評価指標や評価
    基準を変更して判断するようにしたので、より的確な評
    価情報を提供できる。 (34)構成53に対応する効果;上記構成48,5
    1,52において、同表現パターンの判断情報を評価す
    る際に、評価指標や評価基準をオペレータが指定できる
    ようにしたので、より柔軟でオペレータの好みに合せた
    評価情報を提供できる。 (35)構成54に対応する効果;上記構成46におい
    て、システムが判断する選択評価の最高のもののみを同
    表現パターンとして表示するようにしたので、オペレー
    タがあまり目的言語に精通していなくかつシステムに任
    せたい場合には、より容易に文章の作成ができる。 (36)構成55に対応する効果;上記構成46におい
    て、システムが判断する選択評価の高いものを限定して
    同表現パターンとして表示するようにしたので、オペレ
    ータはより分り易く文章の作成ができる。 (37)構成56に対応する効果;上記構成46,5
    4,55にあるような、同表現パターンのシステムが判
    断する選択評価の候補の提示方法を、オペレータが選択
    できるようにしたので、例えば、精通した分野やより木
    目細かい作成場面では表現パターンの候補を複数個残す
    形の表示を選択し、不慣れな分野や迅速な作成、決まり
    切った文面などでは表現パターンの候補少なくしたり候
    補を一つにして表示させ作成するなどのように、その場
    の状況や場面に応じて最適なものを選択して実行でき
    る。 (38)構成57に対応する効果;上記構成56の選択
    をオペレータが文章作成の任意の場面で切り換えること
    ができるようにしたので、より一層柔軟な文章の作成が
    できる。
JP5142729A 1992-11-09 1993-05-21 言語変換装置 Pending JPH06348751A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP5142729A JPH06348751A (ja) 1992-11-09 1993-05-21 言語変換装置
US08/149,661 US5675815A (en) 1992-11-09 1993-11-09 Language conversion system and text creating system using such
US08/451,569 US5646840A (en) 1992-11-09 1995-05-26 Language conversion system and text creating system using such
US08/451,553 US5845143A (en) 1992-11-09 1995-05-26 Language conversion system and text creating system using such
US08/452,336 US5652896A (en) 1992-11-09 1995-05-26 Language conversion system and text creating system using such

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
JP32363492 1992-11-09
JP4-323634 1992-11-09
JP4-339844 1992-11-25
JP33984492 1992-11-25
JP4-350763 1992-12-04
JP35076392 1992-12-04
JP35664692 1992-12-22
JP4-356646 1992-12-22
JP4591993 1993-02-10
JP5-45919 1993-02-10
JP11212493 1993-04-14
JP5-112124 1993-04-14
JP5142729A JPH06348751A (ja) 1992-11-09 1993-05-21 言語変換装置

Publications (1)

Publication Number Publication Date
JPH06348751A true JPH06348751A (ja) 1994-12-22

Family

ID=27564631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5142729A Pending JPH06348751A (ja) 1992-11-09 1993-05-21 言語変換装置

Country Status (1)

Country Link
JP (1) JPH06348751A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006001204A1 (ja) * 2004-06-23 2006-01-05 Matsushita Electric Industrial Co., Ltd. 自動翻訳装置及び自動翻訳方法
KR20150116675A (ko) * 2014-04-08 2015-10-16 네이버 주식회사 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
KR20160052506A (ko) * 2016-04-26 2016-05-12 네이버 주식회사 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
CN112836525A (zh) * 2021-01-13 2021-05-25 江苏金陵科技集团有限公司 一种基于人机交互机器翻译系统及其自动优化方法
CN112989008A (zh) * 2021-04-21 2021-06-18 上海汽车集团股份有限公司 一种多轮对话改写方法、装置和电子设备
CN114139560A (zh) * 2021-12-03 2022-03-04 山东诗语翻译有限公司 基于人工智能翻译系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62208168A (ja) * 1986-03-10 1987-09-12 Ricoh Co Ltd 翻訳装置
JPS63238671A (ja) * 1987-03-26 1988-10-04 Canon Inc 機械翻訳装置
JPH03228178A (ja) * 1990-02-02 1991-10-09 Nec Software Ltd 自動翻訳システム
JPH03282776A (ja) * 1990-03-30 1991-12-12 Nec Corp 文書処理方式
JPH0439770A (ja) * 1990-06-05 1992-02-10 Ricoh Co Ltd 言語翻訳装置における訳語候補表示方式
JPH04263364A (ja) * 1991-02-18 1992-09-18 Nippon Telegr & Teleph Corp <Ntt> 自然言語自動翻訳方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62208168A (ja) * 1986-03-10 1987-09-12 Ricoh Co Ltd 翻訳装置
JPS63238671A (ja) * 1987-03-26 1988-10-04 Canon Inc 機械翻訳装置
JPH03228178A (ja) * 1990-02-02 1991-10-09 Nec Software Ltd 自動翻訳システム
JPH03282776A (ja) * 1990-03-30 1991-12-12 Nec Corp 文書処理方式
JPH0439770A (ja) * 1990-06-05 1992-02-10 Ricoh Co Ltd 言語翻訳装置における訳語候補表示方式
JPH04263364A (ja) * 1991-02-18 1992-09-18 Nippon Telegr & Teleph Corp <Ntt> 自然言語自動翻訳方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006001204A1 (ja) * 2004-06-23 2006-01-05 Matsushita Electric Industrial Co., Ltd. 自動翻訳装置及び自動翻訳方法
KR20150116675A (ko) * 2014-04-08 2015-10-16 네이버 주식회사 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
KR20160052506A (ko) * 2016-04-26 2016-05-12 네이버 주식회사 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
CN112836525A (zh) * 2021-01-13 2021-05-25 江苏金陵科技集团有限公司 一种基于人机交互机器翻译系统及其自动优化方法
CN112836525B (zh) * 2021-01-13 2023-08-18 江苏金陵科技集团有限公司 一种基于人机交互机器翻译系统及其自动优化方法
CN112989008A (zh) * 2021-04-21 2021-06-18 上海汽车集团股份有限公司 一种多轮对话改写方法、装置和电子设备
CN114139560A (zh) * 2021-12-03 2022-03-04 山东诗语翻译有限公司 基于人工智能翻译系统
CN114139560B (zh) * 2021-12-03 2022-12-09 山东诗语信息科技有限公司 基于人工智能翻译系统

Similar Documents

Publication Publication Date Title
US5675815A (en) Language conversion system and text creating system using such
EP0423683B1 (en) Apparatus for automatically generating index
US5850561A (en) Glossary construction tool
Dagan et al. Termight: Identifying and translating technical terminology
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
US7020601B1 (en) Method and apparatus for processing source information based on source placeable elements
US5010486A (en) System and method for language translation including replacement of a selected word for future translation
JP2003030186A (ja) 機械翻訳装置
JP2006012168A (ja) 翻訳メモリシステムにおいてカバレージおよび質を改良する方法
JP2002215617A (ja) 品詞タグ付けをする方法
JP2004265423A (ja) 文書翻訳方法
US8041556B2 (en) Chinese to english translation tool
Ogrodniczuk et al. Connecting data for digital libraries: the library, the dictionary and the corpus
JPH06348751A (ja) 言語変換装置
JP3657338B2 (ja) 翻訳装置
JP3766406B2 (ja) 機械翻訳装置
JP2838984B2 (ja) 汎用参照装置
Weisser Manual for the dialogue annotation & research tool (DART)
JPS61248160A (ja) 文書情報登録方式
JPH0561902A (ja) 機械翻訳システム
JPH052605A (ja) 機械翻訳方式
JP4007630B2 (ja) 対訳例文登録装置
Bernth et al. Terminology extraction for global content management
Picchi et al. A translator’s workstation
JPH04174069A (ja) 言語理解支援装置