JP3140894B2 - 言語処理装置 - Google Patents

言語処理装置

Info

Publication number
JP3140894B2
JP3140894B2 JP05246887A JP24688793A JP3140894B2 JP 3140894 B2 JP3140894 B2 JP 3140894B2 JP 05246887 A JP05246887 A JP 05246887A JP 24688793 A JP24688793 A JP 24688793A JP 3140894 B2 JP3140894 B2 JP 3140894B2
Authority
JP
Japan
Prior art keywords
sentence
concept
semantic
phrase
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05246887A
Other languages
English (en)
Other versions
JPH07105213A (ja
Inventor
明人 永井
泰 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP05246887A priority Critical patent/JP3140894B2/ja
Publication of JPH07105213A publication Critical patent/JPH07105213A/ja
Application granted granted Critical
Publication of JP3140894B2 publication Critical patent/JP3140894B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、自然言語で入力され
た文に形態素解析、および意味解析を行なって入力文の
意味内容を解析する言語処理装置に関するものである。
【0002】
【従来の技術】一般の利用者にとって自然で使いやすい
インタフェースを目指して、音声などの自然言語によっ
て計算機を操作する対話システムの実現が非常に望まれ
ている。従来から、入力された文の意味解釈を計算機上
で行なうために用いられる代表的な言語処理技術とし
て、形態素解析、構文解析、および意味解析などの技術
がある。これらのうち特に、利用者と計算機が対話的に
作業を進めるシステムにおいては、利用者が計算機に何
をやらせたいかを把握するための意味解析技術が中心的
な役割を果たす。
【0003】意味解析技術については、電子情報通信学
会「日本語情報処理」3版 (昭和62年5月30日)p.141-16
6に記載されているもののうち、動詞と名詞句、前置詞
句などとの共起関係を表現した格フレーム形式を用いた
意味解析が、一般に広く用いられている。
【0004】図7は、この格フレームを用いた意味解析
の代表的な処理を示すブロック構成図である。入力手段
1は、利用者が計算機に入力したい情報を文字で表現さ
れた文に変換し、形態素解析手段2へその結果を出力す
る。形態素解析手段2は、語▲い▼知識記憶手段3に記
憶してある単語の見出し語や品詞などの語▲い▼情報
と、単語や文節などの抽出すべき単位を定義する文法規
則などに基づいて、入力文に対し形態素解析を行ない、
抽出された単語や文節などの形態素の列を意味抽出手段
9へ出力する。意味抽出手段9は、形態素と、意味素性
と呼ばれる形態素の意味概念との対応関係が記憶されて
いる意味素性知識記憶手段5を参照して、形態素解析手
段2により入力された形態素に意味素性を対応させ、格
フレーム知識記憶手段10に記憶されている、文全体の
意味表現である格フレームを用いて、意味素性付きの形
態素から文の意味表現を抽出する。
【0005】次に、意味解析の中心的な処理である意味
抽出手段における基本的な動作を説明する。この方式で
は、格フレームを文全体の意味を表現するパターンとし
て用いる。格フレームは動詞の用法別に複数記憶され、
格要素を表現する複数のスロットから構成される。スロ
ットとは、文を構成する名詞句などを埋め込む部分であ
り、動作主格、対象格、場所格などの動詞の格要素毎に
準備される。スロットに埋め込まれる名詞句などは、フ
ィラーと呼ばれる。フィラーとしては、通常、単語や文
節程度までの短い単位が用いられ、単語と意味素性との
対応関係を記憶した意味辞書を用いて、それぞれのフィ
ラーに意味素性が与えられる。また、それぞれのスロッ
トには、そこに埋め込まれるフィラーに許される意味概
念、および前置詞などが記憶されており、フィラーの持
つ意味素性、および前置詞との意味的な適合性が検証さ
れる。
【0006】上記の意味表現に基づいて、入力された文
から抽出された単語や文節などの形態素(フィラー)は、
格フレームにおけるスロットの意味的制約条件に検証さ
れながら、意味的に許されるスロットに埋め込まれてい
く。このようにして、文を構成し得るフィラーが、全て
意味的に適合した格フレームをもって、文全体の意味の
抽出結果とする。
【0007】
【発明が解決しようとする課題】しかしながら、上記の
意味解析方式では、以下のような課題があった。 (1) 一般の利用者が入力する文は様々な言い回しを含
み、文のパターンの種類は膨大に存在すると考えられ
る。従って、文全体の意味を表現する格フレームを文の
パターン毎に多数用意しようとしても、多種多様な文の
パターンを十分にカバーしきれず、解析できない場合が
あった。言い換えれば、言語的な頑健さを得るのが困難
であった。
【0008】(2) 単語や文節を直接、意味理解の単位
であるフィラーとして扱うと、意味的な曖昧さのために
非常に多くの意味解釈の仮説が生成され、意味検証が効
率的でなかった。
【0009】この発明は、上記の課題を解決するもの
で、様々な言い回しを含む一般の利用者の入力文に対し
て、言語的に頑健に意味解析し、かつ、文の意味の検証
を効率的に行なうことが可能な言語処理装置を提供する
ものである。
【0010】
【課題を解決するための手段】この発明は、前記課題を
解決するために、自然言語で入力された文に対して形態
素解析を行なって文節候補列を抽出し、それらの文節候
補列に対して、基本的な概念(概念素)を中間的な理解単
位とした概念素フレームを概念素抽出手段によって適用
して、文の部分的な意味的まとまりを概念素として抽出
し、抽出された複数の概念素の組合せが、文全体の意味
を表現するものとして適切であるかどうかを、対象領域
に関する知識や文脈知識などを用いて、文意判定手段に
よって判定し、入力文の意味表現を得る、二段階の意味
抽出方式を行なうようにしたものである。
【0011】
【作用】この発明によれば、一般の利用者が入力する多
種多様なパターンを有する文全体の意味が、単語や文節
の組合せとしてではなく、文節よりも長い区間の意味的
まとまりである概念素の組合せとして表現されるので、
文パターンの表現効率を高めるように働く。
【0012】また、文意成立判定知識記憶手段によって
記憶された対象領域に関する知識や文脈知識などをトッ
プダウンに直接働かせる対象としては、文パターンより
も概念素の方が、その予測が比較的容易であるために、
頑健な言語処理の設計がしやすくなる。
【0013】さらに、文の意味の成立を判定する処理は
文節ではなく概念素を直接対象にすることから、単語や
文節を直接フィラーとして扱った場合と異なり、効率の
良い意味検証の処理ができるようになる。
【0014】
【実施例】以下、この発明の一実施例を、図面とともに
説明する。図1は、この発明の実施例を示す機能ブロッ
ク図である。図1において、入力手段1は、利用者が計
算機に入力したい情報を文字で表現された文に変換し、
形態素解析手段2へその結果を出力する。利用者がキー
ボードを用いて計算機に文を入力した場合は、入力手段
1はキーボードであり、音声によって文を入力した場合
は、入力手段1は音声認識器である。
【0015】形態素解析手段2は、語▲い▼知識記憶手
段3に記憶してある単語の見出し語や品詞などの語▲い
▼情報と、単語と単語の接続を規定して文節を定義する
文法規則に基づいて、入力文に対し形態素解析を行な
い、出現可能な文節候補を入力文から全て抽出し、それ
らの文節候補の集合を意味抽出手段9における概念素抽
出手段4へ出力する。ここで、形態素解析手段2で抽出
するものは文節である必要はなく、文の部分的な単位で
あれば良い。
【0016】概念素抽出手段4では、まず、自立語と意
味素性との対応関係が記憶されている意味素性知識記憶
手段5を参照して、形態素解析手段2から入力されたそ
れぞれの文節候補に対し、図2に示すように意味素性を
与える。次に、概念素抽出手段4は、形態素解析手段2
から文節候補を受け取る。文節候補には、文節の表記、
品詞情報、意味素性、及び時間的位置の情報が付与され
ている。概念素抽出手段4は、形態素解析手段2から入
力された文節候補の時間的位置の情報を基に、文として
成立する候補(文候補)を構成する文節候補の接続可能
な組合せを選択する。選択されたそれぞれの文節候補に
ついて概念素知識記憶手段6を参照して意味的な適合性
を検証しながら、概念素フレームのスロットに埋め込ん
でいく。最後に、概念素抽出手段4は、文節候補が埋め
込まれたスロットを有する概念素フレームを全て抽出
し、文候補を構成する文節候補の組合せから抽出された
概念素の組合せを、文意成立判定手段7へ出力する。
【0017】文意成立判定手段7は、文意成立判定知識
記憶手段8を参照して、概念素抽出手段4から入力され
た概念素の組合せが、文全体の意味を表現するのに適当
であるか否かを判定する。文意成立判定知識記憶手段8
に記憶される知識としては、対象領域に関する知識や文
脈知識などであり、その他にも文意の判定に有効である
知識源は、ここに含まれる。
【0018】以上のような構成において、以下にその動
作を、「湘南海岸の近くできれいなプールのあるホテル
を教えて下さい」という入力文を例にして説明する。形
態素解析手段2は、入力文中に出現可能な文節候補とし
て、「湘南海岸の」、「近くで」、「きれいな」、「プ
ールの」、「ある」、「ホテルを」、「教えて下さい」
などを抽出する。これら以外にも、同音義語や、音声
入力の場合の認識誤りによる文節候補(例えば、「海
岸」に対する「階段」)なども抽出される。これらの文
節候補には、「湘南海岸(名詞)、の(格助詞)」といった
品詞情報、および入力文中での文節候補の時間的位置の
情報もあわせて抽出される。
【0019】これらの文節候補の集合は概念素抽出手段
4に入力され、各文節候補内の自立語の情報と、意味素
性知識記憶手段5に記憶されている自立語と意味素性と
の対応関係情報によって、図2のようにそれぞれ意味素
性が与えられる。この意味素性は、概念素フレームのそ
れぞれのスロットに記憶してある意味的制約条件を検証
するためのものであり、ある文節候補が概念素フレーム
のあるスロットを意味的に満たすことができるかどうか
を判定するために用いられる。
【0020】続いて、図2に示したような、文候補とし
て時間的な順序で接続可能な文節候補の組合せに対して
概念素フレームを適用して、文節候補を概念素の単位に
まとめる。概念素の具体的な定義は、図3に示すような
概念素フレームとして記憶されている。図3(1)の例
は、文に出現し得る基本的な概念として、「駅に近
い」、「繁華街から離れている」などの、場所の遠近を
表現する概念を記憶した概念素フレームを示し、また図
3(2)の例は「プールがある」、「駐車場が付いてい
る」などの、設備を表現する概念素フレームを示してい
る。それぞれのスロットには、フィラーが満たすべき制
約条件として意味素性と助詞が記憶されている。各概念
素には、その概念素のみを表現するための言い回しを十
分カバーできるだけのスロットを記憶する。
【0021】文の意味理解の単位を、文全体を表現する
格フレームではなく、文の部分的な概念素としたこと
で、文としての全ての言い回しを記憶する必要がなく、
言い回しは各概念素の単位のみで記憶すれば良い。従っ
て、文全体を処理対象にする格フレームよりも、言い回
しの表現効率が高いことは明らかである。これらの概念
素フレームの記述は、概念素知識記憶手段6に記憶され
ている。
【0022】このようにして、図2の文節候補を概念素
の単位にまとめた例を図4に示す。この例では、概念素
(場所の遠近)を表す表現として、「湘南海岸の」、「近
くで」がまとめられおり、以下同様に、概念素(設備)を
表す表現として「きれいな」、「プールの」、「あ
る」、概念素(宿泊施設)を表す表現として「ホテル
を」、概念素(意図)を表す表現として「教えて下さい」
が、それぞれまとめられている。これらの概念素の組合
せにより、文全体の意味を表現する。
【0023】従って、文の意味的なパターンを考えた場
合、概念素の時間的な出現順序は任意であり、また、別
の概念素が付加することも任意であることから、多種多
様な言い回しを含む一般利用者の入力文を頑健に意味解
析できることは言うまでもない。
【0024】次に、概念素抽出手段4から入力された概
念素の組合せに対して、文意成立判定手段7は、概念素
の組合せが文全体の意味を成立させるのに適当であるか
どうかを、文意成立判定知識記憶手段8を参照して判定
する。以下に、本実施例で行なった文意成立判定の方法
を三種類説明する。
【0025】まず第一の文意成立判定方法は、概念素抽
出手段4から抽出された概念素に対するトップダウンの
知識として、入力文に込められている利用者の意図を利
用する方法である。意図とは、質問応答システムにおい
て利用者がシステムに何をさせたいのかを表現するもの
であり、具体的には、質問文を分類した種類を指す。質
問文は、ホテルを予約する場合を例にとれば、予約、変
更、取消、WH質問、YN質問、検索などに分類できる。こ
れらの質問文の種類を、概念素抽出手段4から抽出され
た概念素フレーム中の文節候補の情報によって決定し、
各意図における概念素の存在条件を設定することができ
るようになる。
【0026】図5に、ホテルを予約する場合における意
味構造を示す。図中の「ホテル予約」は意図を示し、
「ホテル名」、「日時」、「部屋」、「人数」などは、
ホテル予約必須情報としての概念素を示す。その他の概
念素は、ホテルの属性を示す。このような階層的な意味
構造を参照して、概念素内の文節候補の情報から意図を
推論する。
【0027】具体的には、図6に示すように、発話意図
抽出のキーワードとして、各意図に関連の深い述語(予
約する、変える、やめる、探す、など)を用い、述語が
省略されている場合には、(1) ホテル予約を達成する
ための予約必須情報(ホテル名、日時、部屋の種類・
数、人数)の有無、(2) 概念素で階層的に表現された
ホテルの属性情報の有無、により意図を推論する。
【0028】次に第二の文意成立判定の方法は、概念素
抽出手段4から抽出された概念素に対して、各概念素の
中心的な意味的役割を持つスロットを必須スロットとし
て定義し、これ以外のスロットのみから成る概念素フレ
ームが単独で成立しないようにする方法である。必須ス
ロットは、そのスロットなしでは意味が成立しないスロ
ットであり、例えば、図3の(1)の概念素フレーム
「場所(遠近)」においては、距離の程度の概念を表わ
すスロット名(属性)を必須スロットとする。文意成立
判定知識記憶手段8では、文全体の意味表現を概念素の
組合せとし、文全体の意味表現として認定するための概
念素の組合せに対する条件(知識)を文意成立判定知識
として記憶する。知識としては、対象領域に関する知識
や文脈知識、その他にも文意の判定に有効である知識源
などがある。文意成立判定手段7における文意成立判定
の処理では、上記文意成立判定知識記憶手段8の文意成
立判定知識を参照して、抽出したそれぞれの概念素フレ
ームのスロット中に少なくとも一つの必須スロットが含
まれているか否かを判定し、必須スロットが一つも含ま
れていない概念素フレームを棄却する。この方法によ
り、単独のスロットで成立した場合に意味的におかしい
概念素を、その概念素の組合せが文全体の意味を成立さ
せるのに不適当であるとして排除する。
【0029】第三の文意成立判定の方法は、図4に示す
ように各概念素内では全ての文節候補が時間的に接続し
ていることを仮定する方法である。これは、入力文に対
して意味的に適合させつつ、各概念素を時間的に伸ばし
ていくことに相当する。 例えば図4で文節候補「湘南海
岸の」の概念素「場所」と文節候補「近くで」の概念素
「場所」は同じであるから「湘南海岸の」の概念素「場
所」を、文節候補「近くで」まで時間的に伸ばし、概念
素「場所」でまとめている。同様に文節候補「きれい
な」、「プールの」、「ある」は、文節候補「きれい
な」の概念素「設備」を時間的に伸ばし、概念素「設
備」でまとめている。 このように、入力文中に同じ概念
素内では全ての文節候補が時間的に接続している。従っ
入力文中に同じ概念素が別の位置に分かれて出現する
ような概念素の組合せは文全体の意味を成立させるのに
不適当であるとして排除する。即ち、同じ概念素が別の
位置に離れて複数存在する文節候補組合わせからなる文
候補は文全体の意味を成立させるのに不適当であるとし
て棄却する。
【0030】文意成立判定手段7、および文意成立判定
知識記憶手段8においては、以上述べた三種類の文意判
定の方法に限らず、文脈知識や常識といった他の知識も
広く適用することができる。
【0031】
【発明の効果】以上のように、この発明によれば、従来
の、動詞の用法に基づいた格フレームを用いる意味解析
方式に比べ、文の意味理解の単位を文全体を表現する格
フレームではなく、文の部分的な概念素としたことで、
文としての全ての言い回しを記憶する必要がなく、言い
回しは各概念素の単位のみで記憶すれば良い。従って、
文全体を処理対象にする格フレームよりも、言い回しの
表現効率が高くなるという効果がある。この効果は、対
象とする文の言い回しの種類が多いほど特に顕著にな
る。
【0032】また、言い回しの表現効率が高いという効
果に伴って、文の意味の成立を判定する処理は文節では
なく概念素を直接対象にすることから、単語や文節を直
接フィラーとして扱った場合と異なり、効率の良い意味
検証の処理ができるという効果もある。
【0033】一方、文の意味的なパターンを考えた場
合、概念素の時間的な出現順序は任意であり、また、別
の概念素が付加することも任意であることから、多種多
様な言い回しを含む一般利用者の入力文を、言語的に頑
健に意味解析できる効果がある。
【0034】さらに、概念素の定義は文パターンの定義
よりも、対象領域の変更に対してより汎用的であり、処
理の対象領域を変更する場合に、基本的な概念素の再構
成によって容易に新たな対象領域を表現できるという効
果がある。
【図面の簡単な説明】
【図1】この発明の一実施例を示す言語処理装置の機能
ブロック構成図である。
【図2】この発明の一実施例における意味素性情報付与
の例を示す説明図である。
【図3】この発明の一実施例における概念素フレームの
例を示す説明図である。
【図4】この発明の一実施例における概念素フレームに
よる概念素抽出の例を示す説明図である。
【図5】この発明の一実施例における対象領域の意味構
造を示す説明図である。
【図6】この発明の一実施例における文意判定知識とし
ての意図抽出知識の例を示す説明図である。
【図7】従来の格フレームを用いた意味解析方式の機能
ブロック構成図である。
【符号の説明】
1 入力手段 2 形態素解析手段 3 語▲い▼知識記憶手段 4 概念素抽出手段 5 意味素性知識記憶手段 6 概念素知識記憶手段 7 文意成立判定手段 8 文意成立判定知識記憶手段 9 意味抽出手段 10 格フレーム知識記憶手段
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/27 - 17/28

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 自然言語を表現する文を入力する入力手
    段と、入力手段が入力する文に対して形態素解析を行な
    って、単語や文節等の候補を出力する形態素解析手段
    と、単語や文節に対する意味素性情報を記憶する意味素
    性知識記憶手段と、単語や文節間の意味関係が記憶さ
    れ、それらが文の部分的な意味的まとまりをなすものと
    してフレーム構造で表現し、概念素として格納した概念
    素知識記憶手段と、前記意味素性知識記憶手段を参照し
    て、前記形態素解析手段が出力する各候補に意味素性を
    与え、文の部分を構成する候補群に対して、前記概念素
    知識記憶手段を参照して概念素を抽出する概念素抽出手
    段と、文全体の意味表現を概念素の組合せとし、文全体
    の意味表現として認定するための概念素の組合せに対す
    る条件を記憶した文意成立判定知識記憶手段と、前記概
    念素抽出手段が抽出した概念素の組合せに対して、前記
    文意成立判定知識記憶手段に格納された概念素の組合せ
    に対する条件に適合する概念素の組合せを出力する文意
    成立判定手段とを備えたことを特徴とする言語処理装
    置。
JP05246887A 1993-10-01 1993-10-01 言語処理装置 Expired - Fee Related JP3140894B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05246887A JP3140894B2 (ja) 1993-10-01 1993-10-01 言語処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05246887A JP3140894B2 (ja) 1993-10-01 1993-10-01 言語処理装置

Publications (2)

Publication Number Publication Date
JPH07105213A JPH07105213A (ja) 1995-04-21
JP3140894B2 true JP3140894B2 (ja) 2001-03-05

Family

ID=17155231

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05246887A Expired - Fee Related JP3140894B2 (ja) 1993-10-01 1993-10-01 言語処理装置

Country Status (1)

Country Link
JP (1) JP3140894B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101957277B1 (ko) * 2017-02-14 2019-03-12 윤종식 음성 인식을 이용한 코딩시스템 및 코딩방법
US20210192139A1 (en) * 2017-11-29 2021-06-24 Mitsubishi Electric Corporation Language processing device, language processing system and language processing method

Also Published As

Publication number Publication date
JPH07105213A (ja) 1995-04-21

Similar Documents

Publication Publication Date Title
US7584092B2 (en) Unsupervised learning of paraphrase/translation alternations and selective application thereof
US7552046B2 (en) Unsupervised learning of paraphrase/translation alternations and selective application thereof
US7546235B2 (en) Unsupervised learning of paraphrase/translation alternations and selective application thereof
Cussens Part-of-speech tagging using Progol
JP2003505778A (ja) 音声制御ユーザインタフェース用の認識文法作成の特定用途を有する句ベースの対話モデル化
WO2003056450A1 (fr) Procede et appareil d'analyse syntaxique
JP2000353161A (ja) 自然言語生成における文体制御方法及び装置
Alkhatib et al. Deep learning for Arabic error detection and correction
CN111488733B (zh) 基于Mask机制与孪生网络的汉语零指代消解方法及系统
Kita et al. collocations in language learning: Corpus‐based automatic compilation of collocations and bilingual collocation concordancer
JP3140894B2 (ja) 言語処理装置
Lee et al. A dialogue analysis model with statistical speech act processing for dialogue machine translation
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
Zhou et al. Annotating the contemporary Chinese corpus
Cussens et al. Using inductive logic programming for natural language processing
Munk et al. Shallow statistical parsing for machine translation
Boitet Automated translation
JP3181465B2 (ja) 言語処理装置
Samir et al. Training and evaluation of TreeTagger on Amazigh corpus
Chung et al. Word Sense Disambiguation Using Neural Networks with Concept Co-occurrence Information.
Lhioui et al. Realization of Minimum Discursive Units Segmentation of Arab Oral Utterances.
Yamakoshi et al. Hierarchical Coordinate Structure Analysis for Japanese Statutory Sentences Using Neural Language Models
Mima et al. A situation-based approach to spoken dialog translation between different social roles
JP2765618B2 (ja) 言語解析装置
Russi Robust and efficient parsing for applications such as text-to-speech conversion

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071215

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081215

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091215

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees