JPS61221874A - 自然言語のデ−タベ−ス化方式 - Google Patents

自然言語のデ−タベ−ス化方式

Info

Publication number
JPS61221874A
JPS61221874A JP60046776A JP4677685A JPS61221874A JP S61221874 A JPS61221874 A JP S61221874A JP 60046776 A JP60046776 A JP 60046776A JP 4677685 A JP4677685 A JP 4677685A JP S61221874 A JPS61221874 A JP S61221874A
Authority
JP
Japan
Prior art keywords
sentence
kana
sentences
analysis
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60046776A
Other languages
English (en)
Inventor
Shigeki Kuga
空閑 茂起
Taro Morishita
森下 太朗
Nobuo Nakamura
信夫 中村
Mikio Osaki
大崎 幹雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP60046776A priority Critical patent/JPS61221874A/ja
Publication of JPS61221874A publication Critical patent/JPS61221874A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 く技術分野〉 本発明は、たとえば自然言語(日本語等)を用いて装置
(コンピータ)と対話できる所謂自然言語による質問応
答システムに好適な自然言語のデータベース化方式に関
するものである。
〈従来技術〉 従来提案されている対話形式のコンピュータシステムで
は、そのシステムのデータペース特有の操作用言語とか
コンピュータの操作用言語を理解できなければ全く使用
することができない。しかも、その操作用言語を習得す
るには多大の時間が必要である。
そこで、近年はコンピュータとの対話に自然言語すなわ
ち人間が使用している言葉を直接使用することができる
ようなシステムが考えられている。
〈目 的〉 本発明は上記した点に鑑みて成されたもので、自然言語
による対話形式(質問応答形式)のコンピュータシステ
ムに好適な自然言語のデー9 /< −ス化方式を提供
することを目的とする。
〈実施例〉 以下図にもとづいて本発明の詳細な説明する。
第1図は本発明に係る自然言語のデータベース化方式を
採用した質問応答装置のブロック構成図である。
図において、1はカナ文字列等を入力するためのキーボ
ード、2はCRT表示装置、3は中央演算処理装置、4
は内部メモリ、5は外部メモリである。また、6はコマ
ンド対応表メモリ、7はカナ漢字システム辞書メモリ、
8はパーザ用辞書メモリ、9はパーザ用文法メモリであ
る。
本装置はベタ入力カナ漢字変換部、パーザ部(文章解析
部)、質問応答部から構成されており、キーボード1で
タイプしたベタ入力のカナ列はカナ漢字変換部において
辞書及びテープ/L/7の使用によシ、カナ漢字混シ文
に変換され、さらにこの変換過程で同時に各単語の区切
り情報(こ−で単語とは、名詞、助詞、活用語尾といっ
た形態素を指す)や品詞情報の形態素情報が得られる。
そしてパーザ部ではこの形態素情報を利用するとともに
パーザ用文法規則メモリ9とパーザ用辞書メモリ8を使
用して各単語の構文解析を行ない入力文の構文解析木を
生成する。さらにパーザ部は得られた解析木から後の質
問応答部が利用可能な形式である単文化及び単文間の関
係を生成する。第2図は「もし彼が赤いYを買うならば
私もYを買う」を例とした場合の単文化及び単文間の関
係スタックの様子を示すもので、この単文化スタック及
び単文間の関係スタックは後述する質問応答部で使用さ
れる。
第3図は質問応答部の処理フローであり、機能的に分け
ると次の5つに分かれる。
1)単文間の関係スタックからand文or文に展開す
る。
2)入力文を質問文、命令文、平叙文、仮定文に応じて
データベース化する。
8)事実、ルー〜のデータベースから解を求める(ユニ
フィケーション)。
4) コマンドの解釈と実行。
5)自然言語による応答。
次に上記の各機能を順に説明する。
1)単文間の関係スタックからand文or文への展開
について、ただし、と\で言う単文とは用言(動詞、形
容詞、形容動詞)が一つしか含まれていない文をいう。
一般に文章というのは複数個の単文かand *or、
ifや連体関係で構成されており、そのま\の形で処理
することは非常に難しい。
但し、A−Dはそれぞれ単文である。
第1表 例えば、第1表(a)では単文A、B、Cがand*o
rで連結され、さらにA、B、Cで構成された文は単文
りとifで連結されている。一方、第1表(b)は第1
表(a)の文をand、orに展開したもので、数学で
いう二項展開に相当する。すなわち、論理的にandで
連結するものをまとめておシ、このようにすることによ
って後の処理が楽になる。
第4図は実際のスタック構成を示す図であシ、図中10
は関係スタック、11はand・Orスタックを示して
いる。こ\で関係スタック10は単文間の関係を示して
いる(第1表(a))。この例では単文BとCはOrの
関係、単文AとOrで構成される文はandの関係、a
ndで構成される文は単文りとifの関係になっている
またand・Orスタック11は前記関係スタックの中
からand、Or+  if量関係単文を抽出するもの
である。例えば、ifが親ノードの場合、左子ノードは
条件部と判断され、右子ノードは結論部と判断される。
図から明らかなように、まずifの左子ノードのand
、 or量関係調べてA and(B or C)を見
つける。これは二項展開によって(A andB)or
(AandC)になり、and−Orスタック11の条
件部BKA、BとA、Cがスタックされる。次に右子ノ
ードは単文りなので、そのま−and・Orスタック1
1の結論部12に積まれ前記第1表(b)の関係を導き
出している。
11)データベース化について、 パーザ部(文章解析部)で解析された文は深層構造を持
った単文に変換されておシ、更に賀間応答部の前処理部
で各単文に対してand、or等の関係を抽出している
。これらの処理結果を用いて、たとえば平叙文(仮定文
も含む)ならば事実、ルールとしてデータベース化され
、疑問文ならば一旦データベース化されて機械特有のコ
マンド群に変換されるか、事実、ルールのデータベース
に対してパターンマツチ、バックトラックを行なって解
を求めている。
データベースの構造は l)情報の追加、削除、拡張性 2)パターンマツチのやりやすさ を考慮して次の形式にしている。
述部(ID、状況1.深層格、格体言、状況2) 述部は、通常は用言の終止形で表現しているが、連体詞
“その“等が文中にあれば後続の格体言をキーにして前
文と関連付けを行なっている。
但し、r O= r 3は定数、RO〜R1及びXo−
XIは変数第2表 例えば、第2表のa)では、“その”に続く格体言は“
ポール“であシ、rOO文番号に同じ格体言があるので
、その文と関連付けを行なっている。この時「述部」は
referになシ深層格としてはrentaiを入れて
いる。又、述部は変数で表記することも可能である。r
I DJは第2表a)に示すよう仮定文等を除く平叙文
に対してはfactを割り当てて事実としてデータベー
ス化している。仮定文は第2表C)に示すように条件部
の文に対してはgoal、結論部の文に対してはhea
dをそれぞれ与えている。
さらに、疑問文は第2表b)に示すようにgoalが与
えられる。これらのIDは後のユニフィケーーション処
理のときに三段論法の推論で必要となる。
「状況1」は単文化された文番号で、IDがhead及
びfactに対してはrOからrnを割シ当て、IDが
goa 1のものに対してはRO〜Rn与えている。ま
たrO〜rnは定数、RO〜Rnは変数と定義されてい
て、後のユニフィケーシ冒ン処理でも使用される。
「深層格」はagent +  5ubj 、  ob
j、 rentaiなど10数格用意している。格体言
は深層格に入る体言であシ、通常は“彼゛、“学校゛が
格納されるが、疑問代名詞“誰”、“何1やX′″。
′Y″が文中にあると第2表b)、c)のように変数と
してXO,Xi、X2が格納される。
「状況2」はref er等の関係子で関連付けされた
文番号が入る。refer以外の通常の述部を持ってい
る場合はnilである。
データベースは後でユニフィケーション処理においてパ
ーターンマツチの対象となるので、パターンマツチの処
理が高速になるようにデータベースの構造を工夫してい
る。
なお、1)述部や格体言の漢字データは単語領域に登録
しておき、登録しているアドレスを述部、格体言に格納
しているため、パターンマツチの際アドレスポインター
の比較で済む。また2)各単文において述部、ID、状
況1は同一なので一つにまとめている。
11i )  ユニフィケーションについて、ユニフィ
ケーション処理は第5図の概略フローに示す通シであり
、その基本動作はゴール側(疑問文データベース)とソ
ース側(平叙文データベース)とのパターンマツチとバ
ックトラックのくシ返しである。
例えば、第2表a)、  c)、 d)が既にソース側
にスタックされていた時に質問として第2表b)を入力
するとユニフィケーションの結果として「ポール」、「
りんご」が得られる。この動作は第3表に示している様
に、ゴール側の5)。
6)がソース側の1)、 2)とユニファイし変数XO
にボールがバインド(結合)されて解が一つ求まる。さ
らに次の解を求めるために変数RO,XOの値をアンバ
インドして置き、ソー7側の8)、9)とユニファイす
る。この時、RO=r2 XO=X1 がバインドされる。8)、  9)はheadであるの
で副目標としてIDがgoa 1である。7)をセット
して、さらにソース側の10)とユニファイを試みる。
この時、 R1= r3 X1=りんご がバインドされ X0=X1=りんご のリンクよシ別の解として「りんご」が求まる。
尚、I)、 2)等は第2表と対応する。
第3表 ■)コマンドの解釈と実行について、 命令文や疑問文は−Hデータベース化されるが、述部が
システムコマンドになければ平叙文のデータベースとの
ユニフィケーションカ行なわれる。またシステムコマン
ドにあれば平叙文のデータベースとのユニフィケーショ
ンは行なわれない。
第6図はコマンド用の引数テープ/l/14であり、構
成要素としてプリントとかコピーのようなコマンド名、
コマンドに対する引数の種類、コマンド本体のプログラ
ムが格納されているメモリへのアドレスからなる。
第4表はコマンドの解釈と実行の例を示すものであり、
たとえば日本語で入力した文はデータベース化され、そ
の述部とコマンドテーブルのコマンド名とを比較する。
一致すれば次に深層格とコマンドテープpに記述されて
いる引数の格との比較をとる。この例では引数1と一致
しており、“ファイ/L/1″が引数1に渡される。
コマンドテーブルに満たすべき引数がなければプログラ
ムの本体に引数を渡して実行される。
もし最低限必要な引数がそろっていないとき或いは引数
の格に一致しなければ、その旨をユーザにCRT2を通
じて知らせる。
第4表 ■)自然言語による応答について、 第3表は、 「彼は何を買うか」 の質問に対するユニフィケーションの例で、6)か何を
買うかを表現している。更に、 objが“を1 XOが“何” に対応しており、ユニフィケーションの結果XO=ポー
lv、りんご が解として求まるので、“何”に対して6ポール”、“
りんご”で置き換えて疑問の“が゛を取り除けば日本語
で応答が生成されろうすなわち・ 「彼はボールを買う」 「彼はりんごを買う」 の文が生成されCRT2上に表示されろうこのように本
発明方式によれば、キーボード等によυ入力した日本語
を容易にデータベース化することができ、したがって日
本語による対話形式のコンピュータシステム化に効果的
に寄与することが出来る。
〈効 果〉 以上詳細に説明したように本発明に係る自然言語のデー
タベース化方式は、自然言語の文章を入力する手段と、
単語の区切り情報と品詞情報を得る形態素解析手段と、
品詞間の係り受けを決める構文解析手段と、意味的に正
しい係シ受けを決める意味解析手段と、埋込み文を単文
に分解する単文化処理手段とを備え、カナ漢字変換処理
を利用して形態素解析を行うとともに、前記構文解析、
意味解析及び単文化処理後に得られた単文化された文章
に含まれる事実を入力文章の種類に応じて抽出蓄積する
ようにしたから、入力した自然言語を容易にデータベー
ス化することが出来る。
【図面の簡単な説明】
第1図は本発明方式を採用した質問応答装置の10ツク
構成図、第2図は単文化及び単文間の関係スタックを示
す図、第3図は質問応答部での処理フローを示す図、第
4図はand文、or文〜の展開を説明する図、第5図
はユニフィケーション処理フローを示す図、第6図はコ
マンド用の引数テーブルを示す図である。 1はキーボード、2はCRT、3はCPU、4は内部メ
モリ、5は外部メモリ、6はコマンド対応表、7はカナ
漢字システム辞書メモリ、8はパーザ用軸メモリ、9は
パーザ用文法規則メモリ享1図 第2 図 1IIa5  図 第6図

Claims (1)

    【特許請求の範囲】
  1. 1、自然言語の文章を入力する入力手段と、単語の区切
    り情報と品詞情報を得る形態素解析手段と、品詞間の係
    り受けを決める構文解析手段と、意味的に正しい係り受
    けを決める意味解析手段と、埋込み文を単文に分解する
    単文化処理手段とを有し、カナ漢字変換処理を利用して
    形態素解析を行うと共に前記、構文解析、意味解析及び
    単文化処理後に得られた単文化された文章に含まれる事
    実を、入力文章の種類に応じて抽出蓄積するようにした
    ことを特徴とする自然言語のデータベース化方式。
JP60046776A 1985-03-08 1985-03-08 自然言語のデ−タベ−ス化方式 Pending JPS61221874A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60046776A JPS61221874A (ja) 1985-03-08 1985-03-08 自然言語のデ−タベ−ス化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60046776A JPS61221874A (ja) 1985-03-08 1985-03-08 自然言語のデ−タベ−ス化方式

Publications (1)

Publication Number Publication Date
JPS61221874A true JPS61221874A (ja) 1986-10-02

Family

ID=12756727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60046776A Pending JPS61221874A (ja) 1985-03-08 1985-03-08 自然言語のデ−タベ−ス化方式

Country Status (1)

Country Link
JP (1) JPS61221874A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0228725A (ja) * 1988-07-18 1990-01-30 Fujitsu Ltd エキスパートシステムにおける問題認識方式
JPH02166557A (ja) * 1988-12-21 1990-06-27 Agency Of Ind Science & Technol 自然言語理解のための専門知識収集装置
JPH06318202A (ja) * 1993-05-06 1994-11-15 Sharp Corp 文書記憶方式及び文書管理方式並びに文書表示方式
JP2010108279A (ja) * 2008-10-30 2010-05-13 Kddi Corp コンテンツ配信方法およびシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0228725A (ja) * 1988-07-18 1990-01-30 Fujitsu Ltd エキスパートシステムにおける問題認識方式
JPH02166557A (ja) * 1988-12-21 1990-06-27 Agency Of Ind Science & Technol 自然言語理解のための専門知識収集装置
JPH06318202A (ja) * 1993-05-06 1994-11-15 Sharp Corp 文書記憶方式及び文書管理方式並びに文書表示方式
JP2010108279A (ja) * 2008-10-30 2010-05-13 Kddi Corp コンテンツ配信方法およびシステム

Similar Documents

Publication Publication Date Title
Briscoe Lexical issues in natural language processing
US20030004706A1 (en) Natural language processing system and method for knowledge management
JP2005535007A (ja) 文書検索システム用の知識抽出のための自己学習システムの合成方法
JPS61221873A (ja) 自然言語による質問応答方式
Witbrock et al. An interactive dialogue system for knowledge acquisition in cyc
Grishman et al. New York University Description of the PROTEUS System as Used for MUC-5
Agrawal et al. Materialization and incremental update of path information
Lehmann Interpretation of natural language in an information system
Schäfer Integrating deep and shallow natural language processing components: representations and hybrid architectures
Chang et al. A methodology and interactive environment for iconic language design
Bais et al. A model of a generic natural language interface for querying database
Jia CSIEC (Computer Simulator in Educational Communication): A virtual context-adaptive chatting partner for foreign language learners
JPS61221874A (ja) 自然言語のデ−タベ−ス化方式
Enea et al. Idiolectic Language-Analysis for Understanding Doctor-Patient Dialogues.
Spyns et al. A Dutch medical language processor
Yen et al. Natural language processing
Mote Natural Language Processing-A Survey
Hunt Natural language processing
Dale et al. Two investigations into intelligent text processing
Chen Understanding mental states in natural language
Gevarter An Overview of Computer-Based Natural Language Processing.
Alkim Morphological analysis in natural language processing for Turkish language and a new approach for lexicon design
Kontos et al. Greek verb semantic processing for stock market text mining
Ong An architecture and prototype system for automatically processing natural-language statements of policy
Wilkens A study of the use of Natural Language Processing for Conversational Agents