JP2963463B2 - 対話型言語解析装置 - Google Patents

対話型言語解析装置

Info

Publication number
JP2963463B2
JP2963463B2 JP1124891A JP12489189A JP2963463B2 JP 2963463 B2 JP2963463 B2 JP 2963463B2 JP 1124891 A JP1124891 A JP 1124891A JP 12489189 A JP12489189 A JP 12489189A JP 2963463 B2 JP2963463 B2 JP 2963463B2
Authority
JP
Japan
Prior art keywords
relation
relationship
unit
score
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1124891A
Other languages
English (en)
Other versions
JPH02302876A (ja
Inventor
秀夫 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1124891A priority Critical patent/JP2963463B2/ja
Priority to US07/521,559 priority patent/US5029085A/en
Priority to DE4015905A priority patent/DE4015905C2/de
Publication of JPH02302876A publication Critical patent/JPH02302876A/ja
Application granted granted Critical
Publication of JP2963463B2 publication Critical patent/JP2963463B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 技術分野 本発明は、対話型言語解析装置に関し、例えば、機械
翻訳装置または自然言語対話システムに適用されるもの
である。
従来技術 前編集型の代表例として、特開昭59−140582号公報に
記載された発明である「自然言語翻訳援助方式」は、機
械翻訳システムにおいて、前編集(構文解析を行なう
前)において、ユーザーが翻訳の各種援助情報を追加す
るもので、このシステムはその情報を使用して翻訳する
ことが開示されている。しかしながら、この前編集型の
欠点は、ユーザーに追加してもらいたい情報は入力文に
よって異なる。よって、ユーザーは、入力文に応じて、
どの情報を追加すべきかを吟味・選択する必要がある
が、これはユーザーによって大きな負担となる。
また、後編集型の代表例として、特開昭58−101365号
公報に記載された発明である「記械翻訳システムにおけ
るテキスト表示校正装置」には、機械翻訳システムにお
いて、後編集(訳文生成後)で原文と訳文を所定の単位
で対応をとり、その単位毎に修正をする点が開示されて
いる。
また、特開昭62−271060号公報に記載された発明であ
る「機械翻訳システム」には、機械翻訳システムにおい
て、訳文を提示し、ユーザーからの別解要求があれば、
保持していた可能な構文的接続関係候補の中から未使用
でかつ最も評点が高い接続関係を採用して再翻訳するこ
とが開示されている。
また、特開昭62−271060号公報に記載された発明であ
る「機械翻訳システム」は、機械翻訳システムにおい
て、訳文を提示し、誤訳である場合、ユーザーが原文の
係り文節を指定すると受け文節の候補を提示し、それら
を参考に受け文節を選択指定するもので、そのシステム
はその指定に沿って再翻訳することが開示されている。
しかしながら、これらの後編集型の欠点は、現在の技
術では、完全な自動解析/翻訳は難しい。よってユーザ
ーは、正訳か誤訳かの判断または、誤訳である場合その
修正を行なう必要があるが、これらユーザーにとって大
きな負担となる。
中編集型として、特開昭61−18073号公報に記載され
た発明である「校正方式」には、機械翻訳において、原
文の解析結果としての解析木を表示し、基本コマンドを
用いて解析木を校正する点が開示されている。
また、特開昭61−278970号公報に記載された発明であ
る「構文解析結果を表示及び校正のための制御方法」に
は、機械翻訳において、原文の解析結果としての解析木
を少スペースで表示できるように別表現し、それへの校
正を受け付ける点が開示されている。
しかしながら、これらの中編集型の欠点は、一般に解
析木などの解析結果の意味はシステムのしくみを知らな
い一般のユーザーにとっては分かりにくい。また、ユー
ザーは誤解析の修正だけでなく、正しい解析結果に対し
ても正誤の判断を行なう必要があるため、結果的にみれ
ば無駄な判断を行なわなければならない。これらはユー
ザーの大きな負担となる。
対話型解析として、特開昭57−132270号公報に記載さ
れた発明である「機械翻訳における意味決定不能要因に
対する人的介入法」には、機械翻訳システムにおいて、
意味が決定不能とする文構造を表示し、ユーザーが意味
決定の情報を与え、それを利用して翻訳することが開示
されている。
しかしながら、多数の文を翻訳する場合、このような
意味が決定不能である文構造はかなりの数に上る。それ
ら全てに対してユーザーが意味決定の情報を与えるのは
ユーザーにとって非現実的な負担となる。よって、決定
不能の度合について考慮し、本当にユーザーからの介入
が必要なものを選択することが望ましい。
また、特開昭61−80362号公報及び特開昭61−90269号
公報に記載された発明である「翻訳方式」は、機械翻訳
システムにおいて、構文解析し、解析結果の構成要素間
関係をユーザーに表示し、ユーザーはそれを見て判断
し、誤っている場合はユーザーが正しい関係を指示する
もので、そのシステムはその指定に沿って再解析する点
が開示されている。
しかしながら、多数の文を翻訳する場合、このような
構成要素間関係はかなりの数に上る。それら全てについ
てユーザーが正誤の判断をするのは非現実的な負担とな
る。よって、少なくとも曖昧な関係や不明な部分などに
限定することが望まれる。
また、特開昭62−290976号公報に記載された発明であ
る「翻訳支援装置」は、機械翻訳システムにおいて、原
文の解析過程で曖昧性や不明部分が発生したとき、ユー
ザーに対して質物応答し、得られた情報を用いて解析を
進めるもので、その際、その曖昧性や不明部分の種類・
内容に応じて、ユーザーに分かりやすく容易に返答でき
る方法で質問をすることでユーザーの負担をなるべく少
なくする点が開示されている。
しかしながら、多数の文を翻訳する場合、このような
曖昧性や不明部分はかなりの数に上る。それら全てにつ
いてユーザーが判断をするのは大きな負担となる。よっ
て、曖昧性や不明の度合を考慮し、それらが高いものを
選んで質問することが望ましい。
また、特開昭63−98072号公報に記載された発明であ
る「曖昧修飾関係検出方式」は、自然語対話システムに
おいて、問い合わせ文を解析し、曖昧な修飾関係を検出
し、可能な修飾関係を全て表示しユーザーに選択を促
し、その情報を使用して正しい解析を行なうもので、そ
の曖昧修飾関係の検出方法として、予め曖昧修飾となる
パターンをシステム内に格納し利用する点が開示されて
いる。
しかしながら、多数の文を翻訳する場合、このような
曖昧性はかなりの数に上る。それら全てについてユーザ
ーが判断をするのは大きな負担となる。また文の曖昧性
は多種多様であり、それを予めパターン化するのは難し
い。
言語を解析する技術は未熟であり、完全な自動解析は
難しい。この問題に対処する方法として大きく分けて2
つある。すなわち、解析対象を限定すること、または
解析の自動化を制限することである。本発明は後者に
関するものである。この自動化の制限の方法として4つ
ある。
−1(前編集型)ユーザーが前もって原文をシステム
が解析できる形に編集する。
−2(後編集型)機械翻訳等、言語解析結果を利用す
る処理において、ユーザーがシステムの最終的な処理結
果を校正する。
−3(中編集型)ユーザーがシステムの言語解析結果
そのものを校正する。
−4(対話型解析)ユーザーとシステムが協調して解
析を行なう。
本発明は−4に関するものである。
上記の欠点は、解析しようとする原稿がその限定を
満たしているかどうかを確認することが難しいことであ
る。上記−1、−2、−3の欠点は前述したとお
りである。そしてこの欠点は−4においてはあてはま
らない。一方、−4に関する従来技術の欠点も前述し
たが、共通して指摘できることは、「多数の文を翻訳す
る場合、システムが解析困難な部分の総計は莫大な数に
なり、それら全てに関してユーザーが援助するのは現実
的ではない。」 ということである。
目的 本発明は、上述のごとき実情に鑑みてなされた対話型
言語解析装置を提供するもので、システムによる解析が
困難である度合を見積り、その困難度に応じてユーザー
に援助を求める対象を限定することによって援助回数を
減らし、上記問題を解決することを第一の目的とする。
また、ユーザーからの援助は解析率を向上させるもの
でなければ意味がない。すなわち、仮にその援助がなく
てもシステム自身の判断で同様の解析結果を得られるな
らば、その援助は無駄である。本発明は、1回の援助に
よる解析率の向上を常に最大することで上記無駄を省く
ことを第二の目的とする。
また、システムの解析能力は一定とは限らない。辞書
や文法を整備することで向上するものである。本発明
は、システムの解析能力が向上するに従ってユーザーの
負担を自動的に軽減させることでユーザーの負担を常に
適正に保つことを第三の目的とする。
さらに、解析率は100%が望ましいが、そうである必
要はない。例えば翻訳システムに対して本装置を利用す
る場合、粗訳でよければ80%ほどの解析率でもかまわな
い場合がある。本発明は、ユーザーが必要とする解析率
に応じて、ユーザーに求める援助の回数を制御すること
で、ユーザーが、ユーザーの負担を適正な量に調節する
ことを可能にすることを第四の目的とする。
構成 本発明は、上記目的を達成するために、(1)解析の
対象となる文を入力する為の入力部と、上記入力部から
入力された原文を構文的単位に分割し、そのノード間で
成立する可能性がある各種関係を全て検出する全関係検
出部と、上記全関係検出部で検出された全ての関係を保
持するための関係記憶部と、前記全関係検出部で、各ノ
ードに対して付与される辞書情報を保持する辞書と、関
係の検出時に利用される文法規則を保持する文法と、前
記関係記憶部中で保持されている関係の集合の中から、
既に成立することが確定している関係を検出する確定関
係検出部と、前記関係記憶部中の確定された関係に対し
て、それと排他的な関係を前記関係記憶部より全て消去
する制約適用部と、前記関係記憶部内の各関係に対し
て、それが成立する確からしさを示す値すなわちスコア
を付与するスコアリング部と、前記関係記憶部内の関係
の中から、上記スコアを利用して、互いに排他的な関係
にある関係を要素とする関係群である排他類を選び、ユ
ーザーに対して、その排他類中のどの関係が原文中で成
立するかどうかを問い合わせ、前記入力部を通して解答
を得て、その解答で成立するとされた関係を確定させる
対話部と、前記関係記憶部内の関係の中から、上記スコ
アを利用して、成立すると思われる関係を選択し確定さ
せる優先解釈部と、前記対話部によるユーザーとの質問
応答において、情報の表示を行なう表示部とを有し、こ
れらによって、原文を構成するノード間において実際に
成立している関係を、全ての可能性の中から選択するこ
とで原文の解析を行なう対話型言語解析装置であって、
該対話型言語解析装置は、該対話型言語解析装置による
選択の困難度を求め、困難度が高いものは前記対話部を
通してユーザーに選択を求めること、更には、(2)前
記スコアは、文法規則が成立する確率であること、更に
は、(3)前記スコアは、、文法規則が成立する確率及
び、関係が成立する為の前提となる各種属性をその関係
を構成しているノードが有している確率を各々の重要度
に応じて加算したものであること、更には、(4)前記
対話部において排他類を選択する際、排他類中の関係に
付与されているスコアの内、1番高いスコアと次に高い
スコアの差を、装置による選択の困難度とすること、及
び差が小さい排他類から順に選択すること、更には、
(5)前記対話部において排他類を選択する際、ある定
数を定め、その定数よりスコア差が小さい排他類のみを
選択の対象とすること、更には、(6)前記対話部にお
いてユーザーの援助に関して、その援助回数の上限が予
め定められていること、更には、(7)前記対話部また
は前記優先解釈部において、関係を1つ確定する度に前
記制約適用部によって制約適用を行なうこと、更には、
(8)前記対話部において行なわれるユーザーの援助に
よる関係の選択・確定が、全て終了した後で、初めて装
置による関係の選択・確定を行なうこと、更には、
(9)前記制約適用部において、関係が消去される度
に、前記スコアリング部でスコアの再付与を行なうこと
を、更には、(10)前記優先解釈部において、それを構
成する関係に付与された1番高いスコアと次に高いスコ
アの差が大きいものから順に、スコアが高い関係を確定
させていくこと、更には、(11)前記優先解釈部におい
て、確定された各関係のスコアの総和が最大になるよう
に、関係を選択すること、更には、(12)前記スコアの
確率は、1つの原文を解析する度に各種関係毎に計算し
更新された確率であること、更には、(13)前記全関係
検出部は、複数の文を解析する場合、全文に対して関係
の可能性を求めて文毎に関係記憶部に保持し、その後、
それ以外の解析処理を前記関係記憶部に保持された文毎
に行うこと、更には、(14)複数の文を解析する場合、
ユーザーは、全文に対して関係の可能性を求めて文毎に
関係記憶部に保持し、その後、それ以外の解析処理を前
記関係記憶部に保持された文毎に行うか、或いは、全て
の解析処理を文毎に行うかを選択できること、更には、
(15)請求項1乃至14のいずれかの言語解析装置を用い
た機械翻訳装置であることを特徴としたものである。以
下、本発明の実施例に基づいて説明する。
まず、日本語の解析についてその前提を説明する。な
お、本発明は、言語の種類はもちろんのこと、文法の種
類(係受け文法、句構造文法等)も限定するものではな
い。
日本文を係受け文法を用いて文節間の係受け関係を解
析する際の実施例について述べる。例えば、 指定された/時刻に/指定された/メッセージを/送
る/こと という日本文(/は文節の区切り)において、各文節間
の係受け関係の可能性を全て検出すると以下のようにな
る。
上記は、例えば最初の「指定された」と係受け関係を
形成する可能性があるのは「時刻に」「メッセージを」
「こと」の3文節であること等を示している。最後の
「こと」には係り先は無い。上記(1)を2項関係の集
合で表わすと以下のようになる。
一般的な言語解析において必要とされる情報は、上記
の情報だけでは不十分である。即ち、上記(2)が表わ
す「ある文節がどの文節に係るか(係り先情報)」だけ
でなく、「どのような種類の関係として係るか(係受け
関係名情報)」も必要となる。例えば、最初の「指定さ
れた」と「時刻に」の係受け関係名情報としては「動作
の対象」父が考えられる。この実施例では、記述の煩雑
さを避けるために、解析で得られる情報を係り先情報に
限定し、係受け関係名情報に関しては省略する。しか
し、上記(2)の2項関係の代わりに、例えば、(指定
される,時刻,動作の対象)のような関係を考えること
によって、以下で述べる方法によって係受け関係名情報
を含めた解析に関しても実施することができる。
さて、一般に日本語では、次のような規則(制約と呼
ぶ)がある。
この規則から、日本文を解析するとは、文末の文節を
除いた各文節に対して、1つの係受け関係を、各々が交
差しないように、前記2項関係の集合から選択すること
とする。
第1図は、本発明による対話型言語解析装置の一実施
例を説明するための構成図で、図中、1は入力部、2は
全関係検出部、3は関係記憶部、4は辞書、5は文法、
6は確定関係検出部、7は制約適用部、8はスコアリン
グ部、9は対話部、10は優先解釈部、11は表示部であ
る。
第2図は、本発明による対話型言語解析装置の動作の
フローチャートである。
Step1;全関係検出 入力部から入力された原文を適当な手段を用いて文節
に分割し、各文節に対して辞書に格納されている適当な
語彙情報を付与する。この語彙情報及び、文法に格納さ
れている係り受け文法(後述)を用いて、前記係受け関
係を生成し、関係記憶部に保持する。
Step2;確定関係検出 この時点で、上記関係記憶部において既に一意に確定
している係受け関係を検出して、その関係に対して適当
なマーク(確定マークと呼ぶ)を付与する。この確定マ
ークは次の制約適用部で利用される。
前記(2)の例では、 (メッセージを,送る) (送る,こと) が既に一意に確定している。つまり、「メッセージを」
と「送る」は初めから各々「送る」と「こと」に係る可
能性しかもっていない。
Step3;制約適用 前記(3)で例示したような、(ほぼ)必ず成立する
規則を制約という。このような制約は係り受け関係の間
に排他関係を生み出す。例えば、文節組ab、文節組ac
(b≠c)の間に共に係受け関係がある場合、係り先の
一意性の制約によってこれらは排他関係(一方が成立す
れば他方は成立しない)を形成する。
さて、ある係受け関係が、なんらかの手段によって確
定したとする。このような、係受けに対して、上記制約
のもとに排他関係にある全ての関係記憶部内の係受け関
係を削除することを制約適用と呼ぶ。
実際には、確定した係受け関係には確定マークが付与
され、制約適用部は、このようなマークを探し、発見す
れば制約適用する。
本発明の実施例では、全関係検出の後、係り受け関係
を絞り込む機会は、この制約適用をおいては存在しな
い。一方、係受けを確定する機会は、本方式では以下の
3である。すなわち、 確定関係検出。前で述べた、初めから確定している場
合。
ユーザーによる指定。後述のように対話を通して行な
われる。
システムによる優先解釈。後述。
実施例では、これらの確定の後には必ず制約適用をす
るようになっている。このことで、その確定情報を最大
限に活用する。
ここで重要なことは、制約適用によって係受け関係を
絞り込んでも、制約は(ほぼ)必ず成り立つ規則である
ため、誤って正しい係受け関係まで削除するということ
がないことである。よって、本発明の実施例において正
確を漏らす可能性は、前記3つの機会の内、システム
による優先解釈によってのみ生まれる。
このことから、確定関係検出と制約適用のみを対話の
前に行い、システムによる優先解釈を、対話終了後まで
いっさい行なわないことで、常に正解を含んだ形で対話
を行えること(対話の健全性)が保証できる。
Step4;スコアリング ここまでで、残っている係受け関係全てに対して、ス
コアを付与する。このスコアは、その差が有意であるも
のでなければならない。つまり、排他関係にある2つの
係受け関係に関して、どちらが正解であるかを判断する
ことが難しいものほど、それらのスコア差の絶対値が小
さくなければならない。本発明の実施例では、このよう
な性質を満たすスコアとして係受けの確率を用いる。
<係り受けの確率計算> 一般に係受け文法は、係り文節の属性(係り属性)、
受け文節の属性(受け属性)、そして係り受けが成立す
るときの関係名の記述である。ここで、以下のような係
り受け規則があったとしよう。
係り受け規則:k 係り属性 A1 受け属性 A2 関係名 LABEL そして、この文法kによって、次の文節組abが係受け
関係を形成しているとする。このとき、 係り受け文法kが成立する確率をP1 文節aが属性値A1を持つ確率をP2 文節bが属性値A2を持つ確率をP3 であるとき、文節組abが文法kによって係受け関係にあ
るスコアをs(a,b,k)とすると ただし、複数の係り受け文法が同じ係受け関係を成立さ
せる場合は、その最大値を採用することとする。また、
上記において、W1は各々の確率の重要度を表わす。よっ
て、文法毎に適当な値に定める必要がある。
さて、このようにして文節aの係り先候補の全てに関
して、上記スコアを求める。そして、文節組abが係受け
関係にあるスコアをs(a,b)と表わすと、上記スコア
より次のように計算する。
前記の計算においてW1=1,W2=W3=0とすると、係受
け文法の確率のみをスコアとすることになる。
また、係受け文法の確率は、今までに何回適用し、そ
の内何回が正解であったかを調べることで簡単に計算で
きるが、本装置を使用する度に、これらのデータを記録
し、確率の再計算を行なうことで、使用する度に確率の
精度が向上する。このような一種の学習を行なうことが
できる。
また、前記におけるWは一種の正規化定数であるが、
関係が制約適用によって消去される度にWを更新してス
コアの再計算を行なうことで、常により適正なスコアを
得ることができる。
一方、さらに前記の計算において、W1,W2,W3及びP2,P
3を正しく求め利用することによって、係り文節と受け
文節の種類(どのような語から構成されているか等)を
スコアに反映させることができ、スコアの精度をさらに
向上させることができる。
Step5;対話 ユーザーとの対話(質問応答)を通して係受け関係を
確定させてゆく。このことは、次の手順によって行なわ
れる。
係り先が確定していない各文節について、係り先候補
の最高スコアと次点のスコアの組を求める。
上記各スコア組について、そのスコア差を求め、スコ
ア差が小さい順にソートする。
先頭の組が、予め定めておいた、定数xと比べてスコ
ア差がxよりも小さければシステムによる係り先決定が
困難である多義とみなして、その組に対応する文節を対
話の候補とする。
対話の候補となった文節の係り先をユーザーに質問す
る。そして、ユーザーの解答を受取り、それと合致する
係り受け関係に確定マークを付与する。
制約適用部に処理を移行する。
こうして、対話−制約適用−スコアリング−対話のル
ープを繰り返す。このループは次の2つの終了条件のい
ずれかが成立するまで続けられる。その後優先解釈部に
移行する。
・終了条件1:上記スコア組のソート列で、先頭のスコア
差が値xより大きい。
・終了条件2:今までのその文に関する対話量(質問回
数)が予め定められた値yに等しい。
以上の処理は次のことを意味する。
ユーザーとの対話によって全ての係受け関係を確定さ
せることを考えると、文節数nの文では、最高でもn−
1回の質問応答で終了する。しかし、多数の文を解析す
る場合を考えると、このようなユーザーの負担は莫大な
ものとなる。そこで、装置自身による関係の選択の困難
度を求め、困難度が高いもののみに質問の対象を限定す
ることで、上記ユーザーの負担を適正な量にできる。
一方、前記、装置自身による関係の選択の困難度は、
なるべく簡単に求められるものが好ましい。本発明の実
施例では、 ある文節に関する係受け関係の最高スコアと次点のス
コア差 を用いている。上記は簡単に求められ、かつ後述の優先
解釈で用いられるスコアを利用している意味で一石二鳥
である。さらに、このスコア差が小さいものから順に質
問の対象とすることで、一回の援助による解析率の向上
を常に最大にすることができる。
また、質問の対象を限定する方法として、予め定めて
おいた定数xと比べてスコア差がxよりも小さいものの
みを対象とすることで、装置の解析能力が向上するに従
って、質問の対象がより限定され、ユーザーの負担が自
動的に軽減する。このことで、ユーザーの負担を常に適
正に保つことができる。なぜなら、装置の解析能力の向
上は、データ類(辞書、文法)の整備、システムの学習
などによって、スコアリングの精度として反映される。
その結果、ほどんどの曖昧性は、スコアによってはっき
り正解を装置が判断できるものになっていくはずだから
である。また、スコアの精度が高くなればスコア差も信
頼でき、値xもシビアに定めることができ、その意味で
も質問量を減少させることができる。
また、質問の回数の上限を定数yと定め、この定数y
をユーザーが調節できるようにすることで、ユーザー
が、ユーザーの負担を適正な量に調節することができ
る。即ち、高品質の解析結果を望むほどに定数yの値を
大きくする必要がある。
Step6;優先解釈 ここまでで、係受けが決定されていない文節に関し
て、各係受け関係に付与されているスコアをもとにして
係り受けを確定していく。次の手順で行なう。
「確定すべき解候補をなんらかの方法によって解候補
の中から1つだけ選択し、その解候補に対して確定マー
クを付与した後、制約適用部へ移行する。こうした、優
先解釈−制約適用−スコアリング−優先解釈のループを
解析が終了するまで繰り返す。」 上記の「なんらかの方法」として、対話の場合と同様
のスコア組を求めスコア差最大のものから決定すること
が考えられる。このとき、係り先を確定していく段階
で、係先きの解候補が存在しない文節が発生する可能性
があり、このような場合、バックトラックを行う必要が
ある。この方法によって、差が有意である(差が大きい
ほど一方が他方に比べ相対的に成立しやすい)スコアの
特質を利用することで、装置の判断の正解率を高めるこ
とができる。
また、別の優先解釈の手順として以下のものも考えら
れる。この場合のブロックは第3図のようになる。
決定していない全ての文節に対して係受けの候補を作
成する。このとき、各々の係受けの候補間で、制約によ
る排他関係を形成するものがないようにする。こうして
できた、係受け候補の集合に対して、それを構成する要
素のスコアの総和を候補集合スコアと呼ぶ。可能な係受
け候補の集合の中で、その候補集合スコアが最大となる
ものをみつけ、その集合の要素を全て確定させる。
前記の手順によれば、最初の手順のように局所的な観
点(1つの文節の係り先決定を単位として順に行なう)
ではなく、全体的な観点から選択を行なう点で、より精
度の高い装置の判断を期待できる。
以上のとおり、本発明の実施例の大筋を説明した。以
下に、付加的な機能について述べる。
文節数の多い文では、係受け関係の可能性がかなり大
きくなり、Step1〜Step4に多大な時間がかかる。そこ
で、複数の文を解析する場合、Step1〜4と、それ以外
の処理を分離し、前者の処理結果を適当な記憶装置に文
毎に保持し、すべての文について前者の処理が終了した
後に、文毎に残りの処理を前記記憶装置から前者処理結
果を呼び出しながら行なうことで、前者処理を行なう処
理時間の分だけ、ユーザーの拘束時間を短縮することが
できる。この処理については第4図に示されている。
上記のような処理形態にするか、文毎にStep1〜Step6
の全てを行なうかは、ユーザーの都合によって選択でき
た方が望ましい。このことは、第2図Step3の処理形態
か、第4図の処理形態かを、処理の初めにユーザーに問
い合わせることで簡単に実施できる。
本発明の言語解析装置は、様々なアプリケーションの
中で、その言語解析部として利用することができる。本
発明は、そのようなアプリケーションの種類を限定する
ものではないが、特に機械翻訳システムに対して相乗的
な効果がある。即ち、一般に機械翻訳においては、誤解
析率の方が誤生成率より高い。よって、ユーザーが解析
部を重点的に援助することは効率的である。それに加え
て、ユーザーは相手言語を知らなくても、原言語の知識
だけで解析率を向上させることで翻訳結果の品質を高め
ることができる。
効果 以上の説明から明らかなように、本発明によると以下
のような効果がある。
(1)システムによる解析が困難である度合を見積り、
その困難度に応じてユーザーに援助を求める対象を限定
することによって援助回数を減らし、ユーザーの負担を
適正な量にとどめることができる(請求項1に対応)。
(2)確率は簡単な計算で求めることができ、他の恣意
的なスコアに比べて人間にとって直観的に把握しやす
い。よってスコアの適正度を判断しやすい(請求項2に
対応)。
(3)個々のノードの種類に応じたキメの細かいスコア
を計算することができる(構成3に対応)。
(4)優先解釈で用いられるスコアを利用している意味
で一石二鳥である。そして、一回の援助による解析率の
向上を常に最大にすることができる(請求項4に対
応)。
(5)装置の解析能力が向上するに従ってユーザーの負
担を自動的に軽減させることでユーザーの負担を適当に
保つことができる(構成5に対応)。
(6)ユーザーが、ユーザーの負担を適正な量に調節す
ることができる(請求項6に対応)。
(7)ユーザーによる1回の援助を最大に活用すること
ができる(請求項7に対応)。
(8)ユーザーに対する質問の対象に、常に正解が含ま
れていることを保証することができる(請求項8に対
応)。
(9)それまでの解析結果をスコアに反映することによ
って、つねに最適なスコアを付与することができる(請
求項9に対応)。
(10)差が有意である(差が大きいほど一方が他方に比
べ相対的に成立しやすい)スコアの特質を利用すること
で、システムの判断の正解率を高めることができる(請
求項10に対応)。
(11)差が有意である(差が大きいほど一方が他方に比
べ相対的に成立しやすい)スコアの特質を利用すること
で、システムの判断を最適にすることができる(請求項
11に対応)。
(12)スコアをより適正な値にしていくことで、解析率
を高め、ユーザーの負担を軽減することができる(請求
項12に対応)。
(13)ユーザーの拘束時間を短縮することができる(請
求項13に対応)。
(14)解析する文の量によって、利用形態を選択でき、
ユーザーの拘束時間を適正に調節することができる(請
求項14に対応)。
(15)一般に機械翻訳においては、誤解析率の方が誤生
成率より高い。よって、ユーザーが解析部を重点的に援
助することは効率的である。それに加えて、ユーザーは
相手言語を知らなくても、原言語の知識だけで解析率を
向上させることで翻訳結果の品質を高めることができる
(請求項15に対応)。
【図面の簡単な説明】
第1図は、本発明による対話型言語処理装置の一実施例
を説明するための構成図、第2図は、本発明による対話
型言語処理装置の動作のフローチャート、第3図は、動
作のフローチャートの他の実施例を示す図、第4図は、
動作のフローチャートのさらに他の実施例を示す図であ
る。 1……入力部、2……全関係検出部、3……関係記憶
部、4……辞書、5……文法、6……確定関係検出部、
7……制約適用部、8……スコアリング部、9……対話
部、10……優先解釈部、11……表示部。

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】解析の対象となる文を入力する為の入力部
    と、上記入力部から入力された原文を構文的単位に分割
    し、そのノード間で成立する可能性がある各種関係を全
    て検出する全関係検出部と、上記全関係検出部で検出さ
    れた全ての関係を保持するための関係記憶部と、前記全
    関係検出部で、各ノードに対して付与される辞書情報を
    保持する辞書と、関係の検出時に利用される文法規則を
    保持する文法と、前記関係記憶部中で保持されている関
    係の集合の中から、既に成立することが確定している関
    係を検出する確定関係検出部と、前記関係記憶部中の確
    定された関係に対して、それと排他的な関係を前記関係
    記憶部より全て消去する制約適用部と、前記関係記憶部
    内の各関係に対して、それが成立する確からしさを示す
    値すなわちスコアを付与するスコアリング部と、前記関
    係記憶部内の関係の中から、上記スコアを利用して、互
    いに排他的な関係にある関係を要素とする関係群である
    排他類を選び、ユーザーに対して、その排他類中のどの
    関係が原文中で成立するかどうかを問い合わせ、前記入
    力部を通して解答を得て、その解答で成立するとされた
    関係を確定させる対話部と、前記関係記憶部内の関係の
    中から、上記スコアを利用して、成立すると思われる関
    係を選択し確定させる優先解釈部と、前記対話部による
    ユーザーとの質問応答において、情報の表示を行なう表
    示部とを有し、これらによって、原文を構成するノード
    間において実際に成立している関係を、全ての可能性の
    中から選択することで原文の解析を行なう対話型言語解
    析装置であって、該対話型言語解析装置は、該対話型言
    語解析装置による選択の困難度を求め、困難度が高いも
    のは前記対話部を通してユーザーに選択を求めることを
    特徴とする対話型言語解析装置。
  2. 【請求項2】前記スコアは、文法規則が成立する確率で
    あることを特徴とする請求項1に記載の対話型言語解析
    装置。
  3. 【請求項3】前記スコアは、、文法規則が成立する確率
    及び、関係が成立する為の前提となる各種属性をその関
    係を構成しているノードが有している確率を各々の重要
    度に応じて加算したものであることを特徴とする請求項
    1に記載の対話型言語解析装置。
  4. 【請求項4】前記対話部において排他類を選択する際、
    排他類中の関係に付与されているスコアの内、1番高い
    スコアと次に高いスコアの差を、装置による選択の困難
    度とすること、及び差が小さい排他類から順に選択する
    ことを特徴とする請求項1乃至3のいずれかに記載の対
    話型言語解析装置。
  5. 【請求項5】前記対話部において排他類を選択する際、
    ある定数を定め、その定数よりスコア差が小さい排他類
    のみを選択の対象とすることを特徴とする請求項4に記
    載の対話型言語解析装置。
  6. 【請求項6】前記対話部においてユーザーの援助に関し
    て、その援助回数の上限が予め定められていることを特
    徴とする請求項1乃至5のいずれかに記載の対話型言語
    解析装置。
  7. 【請求項7】前記対話部または前記優先解釈部におい
    て、関係を1つ確定する度に前記制約適用部によって制
    約適用を行なうことを特徴とする請求項1乃至6のいず
    れかに記載の対話型言語解析装置。
  8. 【請求項8】前記対話部において行なわれるユーザーの
    援助による関係の選択・確定が、全て終了した後で、初
    めて装置による関係の選択・確定を行なうことを特徴と
    する請求項1乃至7のいずれかに記載の対話型言語解析
    装置。
  9. 【請求項9】前記制約適用部において、関係が消去され
    る度に、前記スコアリング部でスコアの再付与を行なう
    ことを特徴とする請求項1乃至8のいずれかに記載の対
    話型言語解析装置。
  10. 【請求項10】前記優先解釈部において、それを構成す
    る関係に付与された1番高いスコアと次に高いスコアの
    差が大きいものから順に、スコアが高い関係を確定させ
    ていくことを特徴とする請求項7に記載の対話型言語解
    析装置。
  11. 【請求項11】前記優先解釈部において、確定された各
    関係のスコアの総和が最大になるように、関係を選択す
    ることを特徴とする請求項1乃至9のいずれかに記載の
    対話型言語解析装置。
  12. 【請求項12】前記スコアの確率は、1つの原文を解析
    する度に各種関係毎に計算し更新された確率であること
    を特徴とする請求項2に記載の対話型言語解析装置。
  13. 【請求項13】前記全関係検出部は、複数の文を解析す
    る場合、全文に対して関係の可能性を求めて文毎に関係
    記憶部に保持し、その後、それ以外の解析処理を前記関
    係記憶部に保持された文毎に行うことを特徴とする請求
    項1乃至12のいずれかに記載の対話型言語解析装置。
  14. 【請求項14】複数の文を解析する場合、ユーザーは、
    全文に対して関係の可能性を求めて文毎に関係記憶部に
    保持し、その後、それ以外の解析処理を前記関係記憶部
    に保持された文毎に行うか、或いは、全ての解析処理を
    文毎に行うかを選択できることを特徴とする請求項13に
    記載の対話型言語解析装置。
  15. 【請求項15】請求項1乃至14のいずれかの言語解析装
    置を用いた機械翻訳装置。
JP1124891A 1989-05-18 1989-05-18 対話型言語解析装置 Expired - Fee Related JP2963463B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP1124891A JP2963463B2 (ja) 1989-05-18 1989-05-18 対話型言語解析装置
US07/521,559 US5029085A (en) 1989-05-18 1990-05-10 Conversational-type natural language analysis apparatus
DE4015905A DE4015905C2 (de) 1989-05-18 1990-05-17 Sprachanalyseeinrichtung, -verfahren und -programm

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1124891A JP2963463B2 (ja) 1989-05-18 1989-05-18 対話型言語解析装置

Publications (2)

Publication Number Publication Date
JPH02302876A JPH02302876A (ja) 1990-12-14
JP2963463B2 true JP2963463B2 (ja) 1999-10-18

Family

ID=14896663

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1124891A Expired - Fee Related JP2963463B2 (ja) 1989-05-18 1989-05-18 対話型言語解析装置

Country Status (3)

Country Link
US (1) US5029085A (ja)
JP (1) JP2963463B2 (ja)
DE (1) DE4015905C2 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04287278A (ja) * 1991-03-18 1992-10-12 Nec Corp 機械翻訳装置
US5528491A (en) * 1992-08-31 1996-06-18 Language Engineering Corporation Apparatus and method for automated natural language translation
US6760695B1 (en) 1992-08-31 2004-07-06 Logovista Corporation Automated natural language processing
US6278967B1 (en) 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
US6041141A (en) * 1992-09-28 2000-03-21 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing
US5987170A (en) * 1992-09-28 1999-11-16 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
US5454106A (en) * 1993-05-17 1995-09-26 International Business Machines Corporation Database retrieval system using natural language for presenting understood components of an ambiguous query on a user interface
JP3339741B2 (ja) * 1994-01-13 2002-10-28 株式会社リコー 言語解析装置
JPH0816596A (ja) * 1994-06-29 1996-01-19 Nec Corp 機械翻訳装置
US5715466A (en) * 1995-02-14 1998-02-03 Compuserve Incorporated System for parallel foreign language communication over a computer network
US6339754B1 (en) 1995-02-14 2002-01-15 America Online, Inc. System for automated translation of speech
US6292769B1 (en) 1995-02-14 2001-09-18 America Online, Inc. System for automated translation of speech
US5721938A (en) * 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
US5987404A (en) * 1996-01-29 1999-11-16 International Business Machines Corporation Statistical natural language understanding using hidden clumpings
US5870700A (en) * 1996-04-01 1999-02-09 Dts Software, Inc. Brazilian Portuguese grammar checker
US6470306B1 (en) 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
WO1998013771A1 (fr) * 1996-09-26 1998-04-02 Mitsubishi Denki Kabushiki Kaisha Processeur interactif
US6161082A (en) * 1997-11-18 2000-12-12 At&T Corp Network based language translation system
DE19937490B4 (de) * 1999-08-07 2018-11-29 Volkswagen Ag Verfahren und Vorrichtung zur Eingabe von Steuerungsbefehlen für Komfortgeräte, insbesondere in Kraftfahrzeugen
JP4465564B2 (ja) * 2000-02-28 2010-05-19 ソニー株式会社 音声認識装置および音声認識方法、並びに記録媒体
US6996518B2 (en) * 2001-01-03 2006-02-07 International Business Machines Corporation Method and apparatus for automated measurement of quality for machine translation
US7516076B2 (en) * 2001-03-14 2009-04-07 At&T Intellectual Property Ii, L.P. Automated sentence planning in a task classification system
US7729918B2 (en) * 2001-03-14 2010-06-01 At&T Intellectual Property Ii, Lp Trainable sentence planning system
US7574362B2 (en) * 2001-03-14 2009-08-11 At&T Intellectual Property Ii, L.P. Method for automated sentence planning in a task classification system
US7920682B2 (en) * 2001-08-21 2011-04-05 Byrne William J Dynamic interactive voice interface
JP4947861B2 (ja) * 2001-09-25 2012-06-06 キヤノン株式会社 自然言語処理装置およびその制御方法ならびにプログラム
US20030172067A1 (en) * 2002-03-07 2003-09-11 Eytan Adar System and method for harvesting community knowledge
US20030217106A1 (en) 2002-03-25 2003-11-20 Eytan Adar System and method for profiling clients within a system for harvesting community knowledge
US20030115062A1 (en) * 2002-10-29 2003-06-19 Walker Marilyn A. Method for automated sentence planning
US20060247912A1 (en) * 2005-04-27 2006-11-02 Microsoft Corporation Metric for evaluating systems that produce text
US20080167876A1 (en) * 2007-01-04 2008-07-10 International Business Machines Corporation Methods and computer program products for providing paraphrasing in a text-to-speech system
US20090326913A1 (en) * 2007-01-10 2009-12-31 Michel Simard Means and method for automatic post-editing of translations
US20110035210A1 (en) * 2009-08-10 2011-02-10 Benjamin Rosenfeld Conditional random fields (crf)-based relation extraction system
DE202016000135U1 (de) 2016-01-08 2016-02-02 Markus Robens System zum kooperativen Verbessern von Sprachkenntnissen unter Zuhilfenahme von Terminologie-Datenbanken
US11354501B2 (en) * 2019-08-02 2022-06-07 Spectacles LLC Definition retrieval and display

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57132270A (en) * 1981-02-09 1982-08-16 Yoshio Hida Human intervening method for factor of failure in decision on meaning by machine translation
JPS58101365A (ja) * 1981-12-14 1983-06-16 Hitachi Ltd 機械翻訳システム
JPS59176823A (ja) * 1983-01-28 1984-10-06 テキサス インスツルメンツ インコ−ポレイテツド 自然言語を用いてコンピュータに入力する方法
JPS59140582A (ja) * 1983-01-31 1984-08-11 Hitachi Ltd 自然言語翻訳援助方式
JPS6084667A (ja) * 1983-10-17 1985-05-14 Mitsubishi Electric Corp 文章組立装置
JPS6118073A (ja) * 1984-07-04 1986-01-25 Hitachi Ltd 校正方式
JPS6190269A (ja) * 1984-10-08 1986-05-08 Sharp Corp 翻訳方式
JPS6180362A (ja) * 1984-09-26 1986-04-23 Sharp Corp 翻訳装置
JP2593065B2 (ja) * 1985-06-03 1997-03-19 株式会社日立製作所 自然言語処理装置における構文解析結果の表示及び校正のための制御方法
JPS62203273A (ja) * 1986-03-04 1987-09-07 Toshiba Corp 機械翻訳システム
JPS62271060A (ja) * 1986-05-20 1987-11-25 Toshiba Corp 機械翻訳システム
JPS62271061A (ja) * 1986-05-20 1987-11-25 Toshiba Corp 機械翻訳システム
JPS62290976A (ja) * 1986-06-11 1987-12-17 Hitachi Ltd 翻訳支援装置
NL8702359A (nl) * 1986-10-03 1988-05-02 Ricoh Kk Taal analyse inrichting.
JPS6398072A (ja) * 1986-10-15 1988-04-28 Hitachi Ltd 曖昧修飾関係検出方式
DE3723078A1 (de) * 1987-07-11 1989-01-19 Philips Patentverwaltung Verfahren zur erkennung von zusammenhaengend gesprochenen woertern
US4864502A (en) * 1987-10-07 1989-09-05 Houghton Mifflin Company Sentence analyzer
US4914590A (en) * 1988-05-18 1990-04-03 Emhart Industries, Inc. Natural language understanding system

Also Published As

Publication number Publication date
DE4015905C2 (de) 2003-04-30
US5029085A (en) 1991-07-02
DE4015905A1 (de) 1990-11-22
JPH02302876A (ja) 1990-12-14

Similar Documents

Publication Publication Date Title
JP2963463B2 (ja) 対話型言語解析装置
US8364470B2 (en) Text analysis method for finding acronyms
EP1475778B1 (en) Rules-based grammar for slots and statistical model for preterminals in natural language understanding system
US8086453B2 (en) Automatic detection and application of editing patterns in draft documents
US5675815A (en) Language conversion system and text creating system using such
JPS62163173A (ja) 機械翻訳方法
JP2004265423A (ja) 文書翻訳方法
JP2001100781A (ja) 音声処理装置および音声処理方法、並びに記録媒体
JP3921523B2 (ja) テキスト生成方法及びテキスト生成装置
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP2006030326A (ja) 音声合成装置
US7620541B2 (en) Critiquing clitic pronoun ordering in french
Gao et al. MARS: A statistical semantic parsing and generation-based multilingual automatic translation system
JP2003030187A (ja) 自動通訳システム、会話学習装置、自動通訳装置及びその方法並びにそのプログラム
JP2003162524A (ja) 言語処理装置
KR100420474B1 (ko) 부분문틀을 이용한 장문 번역 장치 및 그 방법
JPH06348751A (ja) 言語変換装置
JP7483085B1 (ja) 情報処理システム、情報処理装置、情報処理方法、およびプログラム
JP4043176B2 (ja) 自然言語処理装置
JP3999771B2 (ja) 翻訳支援プログラム、翻訳支援装置、翻訳支援方法
JPH0561906A (ja) 言語変換方式
JP2006330628A (ja) 自然言語学習支援装置、方法及びプログラム
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JP3181465B2 (ja) 言語処理装置
JP3353873B2 (ja) 機械翻訳装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees