JP2606541B2 - 知識獲得方式 - Google Patents
知識獲得方式Info
- Publication number
- JP2606541B2 JP2606541B2 JP5009573A JP957393A JP2606541B2 JP 2606541 B2 JP2606541 B2 JP 2606541B2 JP 5009573 A JP5009573 A JP 5009573A JP 957393 A JP957393 A JP 957393A JP 2606541 B2 JP2606541 B2 JP 2606541B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- dictionary
- target
- database
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
【0001】
【産業上の利用分野】本発明は、データベースなどの情
報検索手段に対する自然言語インタフェースに係わり、
漸進的に対象領域辞書と対象領域知識とを増加させてい
く知識獲得方式に関する。
報検索手段に対する自然言語インタフェースに係わり、
漸進的に対象領域辞書と対象領域知識とを増加させてい
く知識獲得方式に関する。
【0002】
【従来の技術】データベース技術やAI(人工知能)技術
の発展により、専門のオペレータだけでなく、計算機に
馴染みの薄いユーザでも簡単に使えるインタフェースの
要望が高まってきている。この要望に答えるインタフェ
ースの一つに計算機に対して自然言語で問い合わせを行
なうものが開発されている。このような自然言語インタ
フェースは、自然言語処理を行なう意味解析部を備え、
入力される自然言語の入力文の意味を理解して、それぞ
れのアプリケーションに対して、アプリケーション固有
の操作手段に従った入力列を作成し、アプリケーション
を実行する。
の発展により、専門のオペレータだけでなく、計算機に
馴染みの薄いユーザでも簡単に使えるインタフェースの
要望が高まってきている。この要望に答えるインタフェ
ースの一つに計算機に対して自然言語で問い合わせを行
なうものが開発されている。このような自然言語インタ
フェースは、自然言語処理を行なう意味解析部を備え、
入力される自然言語の入力文の意味を理解して、それぞ
れのアプリケーションに対して、アプリケーション固有
の操作手段に従った入力列を作成し、アプリケーション
を実行する。
【0003】システムの意味解析部が入力文中に含まれ
ている単語の意味を理解するためには、辞書との照合を
行ない意味解析を行なう必要がある。しかし、各種入力
文中に含まれる全ての単語を網羅して予め辞書に登録し
ておくことは不可能であるから、一部に照合できない未
登録語が生じ、結果としては、システムが入力文を理解
できない結果となる場合が多くあった。
ている単語の意味を理解するためには、辞書との照合を
行ない意味解析を行なう必要がある。しかし、各種入力
文中に含まれる全ての単語を網羅して予め辞書に登録し
ておくことは不可能であるから、一部に照合できない未
登録語が生じ、結果としては、システムが入力文を理解
できない結果となる場合が多くあった。
【0004】そこで、自然言語の語彙とその対象となる
アプリケーション上の内部表現の関係を記述した対象領
域知識を獲得するために、表形式の入力方式やノードと
リンクの接続によって自然言語上の概念素と対象アプリ
ケーション上の概念素とのマッピングを獲得する方式な
どが提案されてきた。しかし、従来の知識獲得方式は、
いづれも知識表現に関する知識を必要としていた。
アプリケーション上の内部表現の関係を記述した対象領
域知識を獲得するために、表形式の入力方式やノードと
リンクの接続によって自然言語上の概念素と対象アプリ
ケーション上の概念素とのマッピングを獲得する方式な
どが提案されてきた。しかし、従来の知識獲得方式は、
いづれも知識表現に関する知識を必要としていた。
【0005】
【発明が解決しようとする課題】従来、このような日本
語インタフェースを構築する際には、日本語の入力文を
解析するための辞書項目を辞書表現に基づいて記述し、
解析された構造からアプリケーション言語へ変換するた
めの対象領域知識をシステムに依存した知識表現の形で
記述する必要があった。このため、辞書表現に対する知
識、対象領域知識の知識表現に対する知識が不可欠であ
り、対象領域に詳しい専門家が直接に入力することが困
難であった。
語インタフェースを構築する際には、日本語の入力文を
解析するための辞書項目を辞書表現に基づいて記述し、
解析された構造からアプリケーション言語へ変換するた
めの対象領域知識をシステムに依存した知識表現の形で
記述する必要があった。このため、辞書表現に対する知
識、対象領域知識の知識表現に対する知識が不可欠であ
り、対象領域に詳しい専門家が直接に入力することが困
難であった。
【0006】本発明は上記の問題点を解決するためにな
されたものである。本発明の目的は、データベースの日
本語表記を解析する段階で対象領域辞書と対象領域知識
に登録するというサイクルを繰り返すことで、漸進的に
対象領域辞書と対象領域知識を獲得し、また、スキーマ
情報と日本語の文法知識を最大限用いることで、登録に
必要な知識のかなりの部分を自動的に獲得することがで
き、推定が不可能な文法・意味分類情報に関しても、例
文選択のような簡単な問い合わせで獲得でき、辞書表
記、対象領域知識表現に対する知識を持たない専門家で
も対象領域辞書および対象領域知識の構築を可能にする
ことにある。
されたものである。本発明の目的は、データベースの日
本語表記を解析する段階で対象領域辞書と対象領域知識
に登録するというサイクルを繰り返すことで、漸進的に
対象領域辞書と対象領域知識を獲得し、また、スキーマ
情報と日本語の文法知識を最大限用いることで、登録に
必要な知識のかなりの部分を自動的に獲得することがで
き、推定が不可能な文法・意味分類情報に関しても、例
文選択のような簡単な問い合わせで獲得でき、辞書表
記、対象領域知識表現に対する知識を持たない専門家で
も対象領域辞書および対象領域知識の構築を可能にする
ことにある。
【0007】
【課題を解決するための手段】前述の課題を解決するた
めに本発明の知識獲得方式は、データベースからデータ
ベースのスキーマを抽出するデータベーススキーマ抽出
部と、前記データベーススキーマ抽出部で抽出したデー
タベーススキーマを保持するデータベーススキーマ保持
部と、前記データベーススキーマ抽出部が出力したデー
タベーススキーマに日本語表記を付与する日本語表記付
与部と、前記日本語表記付与部で日本語を付与したデー
タベーススキーマを保持するスキーマ日本語表記保持部
と、前記データベーススキーマを構成する要素であっ
て、対象領域、テーブル及びカラムから構成されるもの
をデータベース構造体と定義するとき、前記スキーマ日
本語表記保持部から対象とするデータベース構造体を選
択する対象データベース構造体選択部と、前記対象デー
タベース構造体選択部が選択したデータベース構造体に
対応する日本語表記および日本語類義語表記の中から対
象文字列言語解析登録部を実行する対象文字列を選択す
る対象文字列選択部と、前記対象文字列選択部によって
選択した対象文字列を解析登録するための対象文字列言
語解析登録部とからなり、前記対象文字列言語解析登録
部が前記対象文字列を形態素解析する形態素解析部と、
前記形態素解析部が参照する基本辞書および対象領域辞
書と、前記形態素解析部が出力した形態素解析列を構文
解析する構文解析部と、前記構文解析部が参照する構文
解析ルールと、前記構文解析部が途中結果を格納参照す
る途中結果格納部と、前記構文解析部が辞書登録を行な
う際に不足している辞書記述を推定する辞書記述推定ル
ールと、前記構文解析部で前記形態素解析列の構文解析
により得た構文解析結果からデータベース操作系列への
変換を行なう対象領域知識保持部と、前記対象領域辞書
に語彙を登録する辞書登録部と、前記構文解析結果を前
記対象領域辞書に登録する辞書形式に変更する辞書構造
変形部と、前記構文解析結果を前記対象領域知識保持部
に登録する形式に変更する知識構造変形部と、前記構文
解析結果を前記対象領域辞書に登録する際に必要とされ
る意味分類情報を推定するのに利用するためのデータベ
ース構造体意味分類保持部と、前記対象領域保持部に新
たな領域知識を登録する対象領域知識登録部とを持ち、
前記対象データベース構造選択部がデータベース構造体
の大きなものから選択をすることと、前記形態素解析に
よって形態素解析を行なう際、前記対象領域辞書および
前記基本辞書に存在しない日本語文字列を未登録語とし
て、前記未登録語に対する辞書記述を前記構文解析ルー
ルと前記データベース構造体意味分類保持部とを利用し
て推定し、前記対象領域辞書に、前記辞書登録部を用い
て登録を行ない、前記対象領域知識保持部に前記対象領
域知識登録部を用いて登録を行ない、語彙の増加した前
記対象領域辞書を用いて次の形態素解析を行なうことに
よって前記対象領域辞書および前記対象領域知識を漸進
的に増加させていくことを特徴とする。
めに本発明の知識獲得方式は、データベースからデータ
ベースのスキーマを抽出するデータベーススキーマ抽出
部と、前記データベーススキーマ抽出部で抽出したデー
タベーススキーマを保持するデータベーススキーマ保持
部と、前記データベーススキーマ抽出部が出力したデー
タベーススキーマに日本語表記を付与する日本語表記付
与部と、前記日本語表記付与部で日本語を付与したデー
タベーススキーマを保持するスキーマ日本語表記保持部
と、前記データベーススキーマを構成する要素であっ
て、対象領域、テーブル及びカラムから構成されるもの
をデータベース構造体と定義するとき、前記スキーマ日
本語表記保持部から対象とするデータベース構造体を選
択する対象データベース構造体選択部と、前記対象デー
タベース構造体選択部が選択したデータベース構造体に
対応する日本語表記および日本語類義語表記の中から対
象文字列言語解析登録部を実行する対象文字列を選択す
る対象文字列選択部と、前記対象文字列選択部によって
選択した対象文字列を解析登録するための対象文字列言
語解析登録部とからなり、前記対象文字列言語解析登録
部が前記対象文字列を形態素解析する形態素解析部と、
前記形態素解析部が参照する基本辞書および対象領域辞
書と、前記形態素解析部が出力した形態素解析列を構文
解析する構文解析部と、前記構文解析部が参照する構文
解析ルールと、前記構文解析部が途中結果を格納参照す
る途中結果格納部と、前記構文解析部が辞書登録を行な
う際に不足している辞書記述を推定する辞書記述推定ル
ールと、前記構文解析部で前記形態素解析列の構文解析
により得た構文解析結果からデータベース操作系列への
変換を行なう対象領域知識保持部と、前記対象領域辞書
に語彙を登録する辞書登録部と、前記構文解析結果を前
記対象領域辞書に登録する辞書形式に変更する辞書構造
変形部と、前記構文解析結果を前記対象領域知識保持部
に登録する形式に変更する知識構造変形部と、前記構文
解析結果を前記対象領域辞書に登録する際に必要とされ
る意味分類情報を推定するのに利用するためのデータベ
ース構造体意味分類保持部と、前記対象領域保持部に新
たな領域知識を登録する対象領域知識登録部とを持ち、
前記対象データベース構造選択部がデータベース構造体
の大きなものから選択をすることと、前記形態素解析に
よって形態素解析を行なう際、前記対象領域辞書および
前記基本辞書に存在しない日本語文字列を未登録語とし
て、前記未登録語に対する辞書記述を前記構文解析ルー
ルと前記データベース構造体意味分類保持部とを利用し
て推定し、前記対象領域辞書に、前記辞書登録部を用い
て登録を行ない、前記対象領域知識保持部に前記対象領
域知識登録部を用いて登録を行ない、語彙の増加した前
記対象領域辞書を用いて次の形態素解析を行なうことに
よって前記対象領域辞書および前記対象領域知識を漸進
的に増加させていくことを特徴とする。
【0008】
【実施例】次に本発明について図面を参照して説明す
る。漸進的増加部とは、対象データベース構造体意味分
類保持部114と対象領域知識保持部110と対象領域
辞書107のことである。
る。漸進的増加部とは、対象データベース構造体意味分
類保持部114と対象領域知識保持部110と対象領域
辞書107のことである。
【0009】図1は本発明の実施例の知識獲得方式の基
本構成図、図2は図1中のデータベースのスキーマ例を
示す図、図3は図1中のデータベースのスキーマの日本
語表記例を示す図、図4は図1中の入力された対象領域
名を対象文字列言語解析登録処理する直前の漸進的増加
部を示す図、図5は図4の状態で図1中の入力された対
象領域名を対象文字列言語解析登録処理した結果を示す
図、図6は図5で実行された対象文字列言語解析登録処
理の結果変化した漸進的増加部を示す図、図7は図1中
のデータベーススキーマの日本語表記の内、KAISHAのテ
ーブルを対象データベース構造体した時の対象データベ
ース構造体言語解析登録処理をする直前の漸進的増加部
を示す図、図8は前記KAISHAテーブルの日本語表記を対
象文字列とした時の対象文字列言語解析登録処理を行な
った結果を示す図、図9は前記KAISHAテーブルの日本語
表記を対象文字列とした時の対象文字列言語解析登録処
理を行なった直後の漸進的増加部を示す図、図10は前
記KAISHAテーブルの日本語類義語表記である「企業」を
対象文字列言語解析登録処理を行なった結果を示す図
で、ここで「企業」は基本辞書に存在しないことを仮定
している。
本構成図、図2は図1中のデータベースのスキーマ例を
示す図、図3は図1中のデータベースのスキーマの日本
語表記例を示す図、図4は図1中の入力された対象領域
名を対象文字列言語解析登録処理する直前の漸進的増加
部を示す図、図5は図4の状態で図1中の入力された対
象領域名を対象文字列言語解析登録処理した結果を示す
図、図6は図5で実行された対象文字列言語解析登録処
理の結果変化した漸進的増加部を示す図、図7は図1中
のデータベーススキーマの日本語表記の内、KAISHAのテ
ーブルを対象データベース構造体した時の対象データベ
ース構造体言語解析登録処理をする直前の漸進的増加部
を示す図、図8は前記KAISHAテーブルの日本語表記を対
象文字列とした時の対象文字列言語解析登録処理を行な
った結果を示す図、図9は前記KAISHAテーブルの日本語
表記を対象文字列とした時の対象文字列言語解析登録処
理を行なった直後の漸進的増加部を示す図、図10は前
記KAISHAテーブルの日本語類義語表記である「企業」を
対象文字列言語解析登録処理を行なった結果を示す図
で、ここで「企業」は基本辞書に存在しないことを仮定
している。
【0010】図11は前記KAISHAテーブルの日本語類義
語表記である「企業」を対象文字列言語解析登録処理を
行なった直後の漸進的増加部を示す図、図12は前記KA
ISHAテーブルの日本語類義語表記である「カンパニー」
を対象文字列言語解析登録処理を行なった結果を示す図
で、ここで「カンパニー」は基本辞書に存在しないこと
を仮定している。
語表記である「企業」を対象文字列言語解析登録処理を
行なった直後の漸進的増加部を示す図、図12は前記KA
ISHAテーブルの日本語類義語表記である「カンパニー」
を対象文字列言語解析登録処理を行なった結果を示す図
で、ここで「カンパニー」は基本辞書に存在しないこと
を仮定している。
【0011】図13は前記KAISHAテーブルの日本語類義
語表記である「カンパニー」を対象文字列言語解析登録
処理を行なった直後の漸進的増加部を示す図、図14は
図1中のデータベーススキーマの日本語表記の内、KAIS
HAテーブルのTELNOカラムを対象データベース構造体し
た時の対象データベース構造体言語解析登録処理をする
直前の漸進的増加部を示す図、図15は前記TELNOカラ
ムの日本語表記を対象文字列とした時の対象文字列言語
解析登録処理を行なった結果を示す図、図16は前記TE
LNOカラムの日本語表記を対象文字列とした時の対象文
字列言語解析登録処理を行なった直後の漸進的増加部を
示す図、図17は前記TELNOカラムの日本語類義語表記
である「本社の電話番号」を対象文字列言語解析登録処
理を行なった結果を示す図、図18は前記TELNOカラム
の日本語類義語表記である「本社の電話番号」を対象文
字列言語解析登録処理を行なった直後の漸進的増加部を
示す図、図19は形態素解析で用いる辞書の形式を表す
図、図20は形態素解析で用いる辞書の形式の例を表す
図、図21は大まかな処理の流れを表す図、図22は、
対象データベース構造体言語解析登録処理および対象文
字列言語解析登録処理の流れを表す図である。
語表記である「カンパニー」を対象文字列言語解析登録
処理を行なった直後の漸進的増加部を示す図、図14は
図1中のデータベーススキーマの日本語表記の内、KAIS
HAテーブルのTELNOカラムを対象データベース構造体し
た時の対象データベース構造体言語解析登録処理をする
直前の漸進的増加部を示す図、図15は前記TELNOカラ
ムの日本語表記を対象文字列とした時の対象文字列言語
解析登録処理を行なった結果を示す図、図16は前記TE
LNOカラムの日本語表記を対象文字列とした時の対象文
字列言語解析登録処理を行なった直後の漸進的増加部を
示す図、図17は前記TELNOカラムの日本語類義語表記
である「本社の電話番号」を対象文字列言語解析登録処
理を行なった結果を示す図、図18は前記TELNOカラム
の日本語類義語表記である「本社の電話番号」を対象文
字列言語解析登録処理を行なった直後の漸進的増加部を
示す図、図19は形態素解析で用いる辞書の形式を表す
図、図20は形態素解析で用いる辞書の形式の例を表す
図、図21は大まかな処理の流れを表す図、図22は、
対象データベース構造体言語解析登録処理および対象文
字列言語解析登録処理の流れを表す図である。
【0012】図1において、本実施例は、データベース
からデータベース構造を抽出するデータベーススキーマ
抽出部101と、前記データベーススキーマ抽出部10
1で抽出したデータベーススキーマを保持するデータベ
ーススキーマ保持部102と、前記データベーススキー
マ抽出部101が出力したデータベーススキーマに日本
語表記を付与する日本語表記付与部103と、前記日本
語表記付与部103で日本語を付与したデータベースス
キーマを保持するスキーマ日本語表記保持部104と、
前記日本語表記付与部103が出力したスキーマ日本語
表記を形態素解析するための形態素解析部105と、前
記形態素解析部105が参照する基本辞書106及び対
象領域辞書107と、前記形態素解析部105が出力し
た形態素解析列の構文を解析する構文解析部108と、
前記構文解析部108が参照する構文解析ルール109
と、前記構文解析部108が途中結果を格納し参照する
途中結果格納部116と、前記構文解析部108が辞書
登録を行なう際に不足している辞書記述を推定する辞書
記述推定ルール117と、前記構文解析結果からデータ
ベース操作系列への変換を行なうための対象領域知識保
持部110と、前記対象領域辞書107に語彙を登録す
るための辞書登録部111と、前記構文解析結果を前記
対象領域辞書107に登録する辞書形式に変更する辞書
構造変形部112と、前記構文解析結果を前記対象領域
知識保持部110に登録する形式に変更する知識構造変
形部113と、前記構文解析結果を前記対象領域辞書に
登録する際に必要とされる意味分類情報を推定するのに
利用するためのデータベース構造体意味分類保持部11
4と、前記対象領域知識保持部110に新たな領域知識
を登録する対象領域知識登録部115とを有している。
からデータベース構造を抽出するデータベーススキーマ
抽出部101と、前記データベーススキーマ抽出部10
1で抽出したデータベーススキーマを保持するデータベ
ーススキーマ保持部102と、前記データベーススキー
マ抽出部101が出力したデータベーススキーマに日本
語表記を付与する日本語表記付与部103と、前記日本
語表記付与部103で日本語を付与したデータベースス
キーマを保持するスキーマ日本語表記保持部104と、
前記日本語表記付与部103が出力したスキーマ日本語
表記を形態素解析するための形態素解析部105と、前
記形態素解析部105が参照する基本辞書106及び対
象領域辞書107と、前記形態素解析部105が出力し
た形態素解析列の構文を解析する構文解析部108と、
前記構文解析部108が参照する構文解析ルール109
と、前記構文解析部108が途中結果を格納し参照する
途中結果格納部116と、前記構文解析部108が辞書
登録を行なう際に不足している辞書記述を推定する辞書
記述推定ルール117と、前記構文解析結果からデータ
ベース操作系列への変換を行なうための対象領域知識保
持部110と、前記対象領域辞書107に語彙を登録す
るための辞書登録部111と、前記構文解析結果を前記
対象領域辞書107に登録する辞書形式に変更する辞書
構造変形部112と、前記構文解析結果を前記対象領域
知識保持部110に登録する形式に変更する知識構造変
形部113と、前記構文解析結果を前記対象領域辞書に
登録する際に必要とされる意味分類情報を推定するのに
利用するためのデータベース構造体意味分類保持部11
4と、前記対象領域知識保持部110に新たな領域知識
を登録する対象領域知識登録部115とを有している。
【0013】次に、本実施例の動作について、図21及
び図22の流れを追いながら、途中結果である図2〜2
0を用いて説明する。
び図22の流れを追いながら、途中結果である図2〜2
0を用いて説明する。
【0014】データベーススキーマ抽出部101は対象
とするデータベース91を持つデータベース管理システ
ム90に、スキーマ情報を出力するデータベース検索コ
マンドを入力し、スキーマ情報を獲得し、データベース
スキーマ保持部102に図2のようにテーブル名201
とカラム名202が対応するように格納する。
とするデータベース91を持つデータベース管理システ
ム90に、スキーマ情報を出力するデータベース検索コ
マンドを入力し、スキーマ情報を獲得し、データベース
スキーマ保持部102に図2のようにテーブル名201
とカラム名202が対応するように格納する。
【0015】スキーマ情報を出力するデータベース検索
コマンドは、例えばデータベース管理システム90がS
QLのインタフェースを持つとするなら、日刊工業新聞
社発行・河村 一樹著・「SQL言語活用入門」に記載
されている方法を用いれば良い。
コマンドは、例えばデータベース管理システム90がS
QLのインタフェースを持つとするなら、日刊工業新聞
社発行・河村 一樹著・「SQL言語活用入門」に記載
されている方法を用いれば良い。
【0016】日本語表記付与部103は図2で示される
スキーマの各データベース構造体に対して図3の日本語
表記304と日本語類義語表記305を付与し、スキー
マ日本語表記保持部104に格納する。この日本語表記
付与部103には、例えば情報処理学会第45回全国大
会予稿集2F-10「自然言語によるデータベース検索のた
めの対象分野知識入力支援ツール」に記載されている方
法を用いれば良い。対象領域名入力部123によって入
力された対象領域名は対象文字列言語解析登録部122
によって解析が行なわれる。
スキーマの各データベース構造体に対して図3の日本語
表記304と日本語類義語表記305を付与し、スキー
マ日本語表記保持部104に格納する。この日本語表記
付与部103には、例えば情報処理学会第45回全国大
会予稿集2F-10「自然言語によるデータベース検索のた
めの対象分野知識入力支援ツール」に記載されている方
法を用いれば良い。対象領域名入力部123によって入
力された対象領域名は対象文字列言語解析登録部122
によって解析が行なわれる。
【0017】この直前の漸進的増加部の状態は図4に示
すとおり、データベース構造体意味分類保持部114が
保持しているデータベース構造意味分類401も、対象
領域保持部110で保持されている対象領域知識402
も、対象領域辞書107で保持されている対象領域辞書
内容403も空である。
すとおり、データベース構造体意味分類保持部114が
保持しているデータベース構造意味分類401も、対象
領域保持部110で保持されている対象領域知識402
も、対象領域辞書107で保持されている対象領域辞書
内容403も空である。
【0018】図5に示すように対象文字列501「会社
情報」を対象領域辞書107、基本辞書106を使って
形態素解析をして、形態素列502を得る。
情報」を対象領域辞書107、基本辞書106を使って
形態素解析をして、形態素列502を得る。
【0019】形態素解析部105には例えば、昭和63
年電子情報通子学会秋季全国大会予稿集「PIVOT J-E:日
本語形態素分解」に記載されている方法を用いれば良
い。
年電子情報通子学会秋季全国大会予稿集「PIVOT J-E:日
本語形態素分解」に記載されている方法を用いれば良
い。
【0020】前記形態素列502について構文解析ルー
ル109と途中結果格納部116を利用して構文解析を
し、構文解析結果格納部124に、構文解析結果503
のように格納する。構文解析部108には、例えば特願
昭61-175034によって周知のような構文解析手段を用い
れば良い。また、構文解析結果503を表す概念構造に
は、例えば電子情報通信学会技術報告書NLC91-62「自然
言語インタフェース構築キット:IF-Kit」に記載されい
る方法を用いれば良い。
ル109と途中結果格納部116を利用して構文解析を
し、構文解析結果格納部124に、構文解析結果503
のように格納する。構文解析部108には、例えば特願
昭61-175034によって周知のような構文解析手段を用い
れば良い。また、構文解析結果503を表す概念構造に
は、例えば電子情報通信学会技術報告書NLC91-62「自然
言語インタフェース構築キット:IF-Kit」に記載されい
る方法を用いれば良い。
【0021】辞書構造変形部112はデータベース構造
体意味分類保持部114に図6の601のように対象領
域名に対する意味分類を登録し、前記構文解析結果から
対象領域辞書登録項目504を作成し、辞書登録部11
1によって対象領域辞書107に対象領域辞書内容60
3のように格納する。
体意味分類保持部114に図6の601のように対象領
域名に対する意味分類を登録し、前記構文解析結果から
対象領域辞書登録項目504を作成し、辞書登録部11
1によって対象領域辞書107に対象領域辞書内容60
3のように格納する。
【0022】知識構造変形部113は構文解析結果50
3から、対象領域知識登録項目として505を作成し、
対象領域知識登録部115によって対象領域知識保持部
110に対象領域知識602のように格納する。対象領
域知識602は604のように丸で囲まれたノードと6
05のようにラベルのついたリンクからできている。6
06で示すようなラベル0が付随しているリンクは同義
語リンクであり、同じ意味のノードの間を結ぶ。
3から、対象領域知識登録項目として505を作成し、
対象領域知識登録部115によって対象領域知識保持部
110に対象領域知識602のように格納する。対象領
域知識602は604のように丸で囲まれたノードと6
05のようにラベルのついたリンクからできている。6
06で示すようなラベル0が付随しているリンクは同義
語リンクであり、同じ意味のノードの間を結ぶ。
【0023】図6は前記対象領域名を対象文字列として
対象文字列言語解析登録処理を終了した直後の漸進的増
加部である。
対象文字列言語解析登録処理を終了した直後の漸進的増
加部である。
【0024】次に、入力された対象領域名に属する各々
のテーブルを対象データベース構造体として、その日本
語表記と日本語類義語表記を対象文字列として前記対象
文字列言語解析登録処理を行なう。対象データベース構
造体をKAISHAテーブルとした時の流れを図7、8、9、
10、11、12、13を参照して説明する。
のテーブルを対象データベース構造体として、その日本
語表記と日本語類義語表記を対象文字列として前記対象
文字列言語解析登録処理を行なう。対象データベース構
造体をKAISHAテーブルとした時の流れを図7、8、9、
10、11、12、13を参照して説明する。
【0025】対象データベース構造体をKAISHAテーブル
としたので、KAISHAテーブルの日本語表記である「会
社」、日本語類義語表記である「企業」、「カンパニ
ー」、「社」を順に対象文字列として対象文字列言語解
析登録処理を行なう。この直前の漸進的増加部は図7の
ようになり、これは対象領域名の前記対象文字列言語解
析登録処理を終った段階の図6と同じである。
としたので、KAISHAテーブルの日本語表記である「会
社」、日本語類義語表記である「企業」、「カンパニ
ー」、「社」を順に対象文字列として対象文字列言語解
析登録処理を行なう。この直前の漸進的増加部は図7の
ようになり、これは対象領域名の前記対象文字列言語解
析登録処理を終った段階の図6と同じである。
【0026】まず、対象データベース構造体KAISHAテー
ブルの日本語表記「会社」に関して対象文字列言語解析
登録処理を行なった結果が図8であり、この結果漸進的
増加部は図9のようになる。
ブルの日本語表記「会社」に関して対象文字列言語解析
登録処理を行なった結果が図8であり、この結果漸進的
増加部は図9のようになる。
【0027】次に、対象データベース構造体KAISHテー
ブルの日本語類義語表記「企業」に関して対象文字列言
語解析登録処理を行なう。この結果が図10であり、基
本辞書に「企業」がなかった場合についてここでは示し
ている。「企業」は未登録語であるため、辞書記述推定
ルール117とデータベース構造体意味分類901から
構文解析結果1002及び辞書登録項目1003を得
て、漸進的増加部は図11のようになる。
ブルの日本語類義語表記「企業」に関して対象文字列言
語解析登録処理を行なう。この結果が図10であり、基
本辞書に「企業」がなかった場合についてここでは示し
ている。「企業」は未登録語であるため、辞書記述推定
ルール117とデータベース構造体意味分類901から
構文解析結果1002及び辞書登録項目1003を得
て、漸進的増加部は図11のようになる。
【0028】同様に、日本語類義語表記「カンパニー」
に関して、行なった結果が図12で、その結果、漸進的
増加部は図13のようになる。
に関して、行なった結果が図12で、その結果、漸進的
増加部は図13のようになる。
【0029】同様に、未処理のテーブルに関して対象デ
ータベース構造体言語解析登録処理を行なう。
ータベース構造体言語解析登録処理を行なう。
【0030】次に、前記対象領域名に属するカラムに関
して、同様の処理を行なう。ここでは、KAISHAテーブル
のTELNOカラムに関して、その日本語表記である「電話
番号」と日本語類義語表記である「本社の電話番号」を
対象文字列解析した時の漸進的増加部の変化を図14、
16、18に、また言語登録解析結果を図15、17に
示した。
して、同様の処理を行なう。ここでは、KAISHAテーブル
のTELNOカラムに関して、その日本語表記である「電話
番号」と日本語類義語表記である「本社の電話番号」を
対象文字列解析した時の漸進的増加部の変化を図14、
16、18に、また言語登録解析結果を図15、17に
示した。
【0031】このように、スキーマ日本語表記保持部1
04に保持されている全てのデータベース構造体に対し
て日本語表記及び日本語類義語表記の対象文字列言語解
析登録処理を行なうことで対象領域辞書106と対象領
域知識保持部110を漸進的に増加させることができ
る。
04に保持されている全てのデータベース構造体に対し
て日本語表記及び日本語類義語表記の対象文字列言語解
析登録処理を行なうことで対象領域辞書106と対象領
域知識保持部110を漸進的に増加させることができ
る。
【0032】以上、本発明を実施例にもとづき具体的に
説明したが、本発明は、前記実施例限定されるものでは
なく、その要旨を逸脱しない範囲において種々の態様に
変更可能であることは言うまでもない。
説明したが、本発明は、前記実施例限定されるものでは
なく、その要旨を逸脱しない範囲において種々の態様に
変更可能であることは言うまでもない。
【0033】
【発明の効果】以上、説明したように、本発明によれ
ば、データベース上では登録されているデータベースの
日本語表記を解析する段階で対象領域辞書と対象領域意
味ネットワーク知識に登録するというサイクルを繰り返
すことで、漸進的に対象領域辞書と対象領域知識を獲得
することができる。また、スキーマ情報と日本語の文法
知識を最大限に用いることで、登録に必要な知識のかな
りの部分を自動的に獲得することができ、推定が不可能
な文法・意味分類情報に関しても、例文選択のような簡
単な問い合わせで獲得できるため、辞書表記、意味ネッ
トワーク知識表現に対する知識を持たない専門家でも対
象領域辞書および対象領域知識の構築が可能である。
ば、データベース上では登録されているデータベースの
日本語表記を解析する段階で対象領域辞書と対象領域意
味ネットワーク知識に登録するというサイクルを繰り返
すことで、漸進的に対象領域辞書と対象領域知識を獲得
することができる。また、スキーマ情報と日本語の文法
知識を最大限に用いることで、登録に必要な知識のかな
りの部分を自動的に獲得することができ、推定が不可能
な文法・意味分類情報に関しても、例文選択のような簡
単な問い合わせで獲得できるため、辞書表記、意味ネッ
トワーク知識表現に対する知識を持たない専門家でも対
象領域辞書および対象領域知識の構築が可能である。
【図1】本発明の一実施例を示す基本構成図である。
【図2】図1中のデータベースのスキーマ例を示す図で
ある。
ある。
【図3】図1中のデータベースのスキーマの日本語表記
例を示す図である。
例を示す図である。
【図4】図1中の入力された対象領域名「会社情報」を
対象文字列言語解析登録処理する直前の漸進的増加部を
示す図である。
対象文字列言語解析登録処理する直前の漸進的増加部を
示す図である。
【図5】図4の状態で図1中の入力された対象領域名
「会社情報」を対象文字列言語解析登録処理した結果を
示す図である。
「会社情報」を対象文字列言語解析登録処理した結果を
示す図である。
【図6】図5で実行された対象文字列言語解析登録処理
の結果変化した漸進的増加部を示す図である。
の結果変化した漸進的増加部を示す図である。
【図7】図1中のデータベーススキーマの日本語表記の
内、KAISHAのテーブルの日本語表記「会社」を対象文字
列として、対象文字列言語解析登録処理をする直前の漸
進的増加部を示す図である。
内、KAISHAのテーブルの日本語表記「会社」を対象文字
列として、対象文字列言語解析登録処理をする直前の漸
進的増加部を示す図である。
【図8】前記KAISHAテーブルの日本語表記「会社」を対
象文字列とした時の対象文字列言語解析登録処理を行な
った結果を示す図である。
象文字列とした時の対象文字列言語解析登録処理を行な
った結果を示す図である。
【図9】前記KAISHAテーブルの日本語表記を対象文字列
とした時の対象文字列言語解析登録処理を行なった直後
の漸進的増加部を示す図である。
とした時の対象文字列言語解析登録処理を行なった直後
の漸進的増加部を示す図である。
【図10】前記KAISHAテーブルの日本語類義語表記であ
る「企業」を対象文字列言語解析登録処理を行なった結
果を示す図で、ここで「企業」は基本辞書に存在しない
ことを仮定している。
る「企業」を対象文字列言語解析登録処理を行なった結
果を示す図で、ここで「企業」は基本辞書に存在しない
ことを仮定している。
【図11】前記KAISHAテーブルの日本語類義語表記であ
る「企業」を対象文字列言語解析登録処理を行なった直
後の漸進的増加部を示す図である。
る「企業」を対象文字列言語解析登録処理を行なった直
後の漸進的増加部を示す図である。
【図12】前記KAISHAテーブルの日本語類義語表記であ
る「カンパニー」を対象文字列言語解析登録処理を行な
った結果を示す図で、ここで「カンパニー」は基本辞書
に存在しないことを仮定している。
る「カンパニー」を対象文字列言語解析登録処理を行な
った結果を示す図で、ここで「カンパニー」は基本辞書
に存在しないことを仮定している。
【図13】前記KAISHAテーブルの日本語類義語表記であ
る「カンパニー」を対象文字列言語解析登録処理を行な
った直後の漸進的増加部を示す図である。
る「カンパニー」を対象文字列言語解析登録処理を行な
った直後の漸進的増加部を示す図である。
【図14】図1中のデータベーススキーマの日本語表記
の内、KAISHAテーブルのTELNOカラムの日本語表記「電
話番号」を対象文字列としたときの対象文字列言語解析
登録処理をする直前の漸進的増加部を示す図である。
の内、KAISHAテーブルのTELNOカラムの日本語表記「電
話番号」を対象文字列としたときの対象文字列言語解析
登録処理をする直前の漸進的増加部を示す図である。
【図15】前記TELNOカラムの日本語表記「電話番号」
を対象文字列とした時の対象文字列言語解析登録処理を
行なった結果を示す図である。
を対象文字列とした時の対象文字列言語解析登録処理を
行なった結果を示す図である。
【図16】前記TELNOカラムの日本語表記「電話番号」
を対象文字列とした時の対象文字列言語解析登録処理を
行なった直後の漸進的増加部を示す図である。
を対象文字列とした時の対象文字列言語解析登録処理を
行なった直後の漸進的増加部を示す図である。
【図17】前記TELNOカラムの日本語類義語表記である
「本社の電話番号」を対象文字列言語解析登録処理を行
なった結果を示す図である。
「本社の電話番号」を対象文字列言語解析登録処理を行
なった結果を示す図である。
【図18】前記TELNOカラムの日本語類義語表記である
「本社の電話番号」を対象文字列言語解析登録処理を行
なった直後の漸進的増加部を示す図である。
「本社の電話番号」を対象文字列言語解析登録処理を行
なった直後の漸進的増加部を示す図である。
【図19】形態素解析で用いる辞書の形式を表す図であ
る。
る。
【図20】形態素解析で用いる辞書の形式の例を表す図
である。
である。
【図21】図1の実施例における大まかな処理の流れを
表す図である。
表す図である。
【図22】図1の実施例における対象データベース構造
体言語解析登録処理および対象文字列言語解析登録処理
の流れを表す図である。
体言語解析登録処理および対象文字列言語解析登録処理
の流れを表す図である。
90 データベース管理システム 91 データベース 101 データベーススキーマ抽出部 102 データベーススキーマ保持部 103 日本語表記付与部 104 スキーマ日本語表記保持部 105 形態素解析部 106 基本辞書 107 対象領域辞書 108 構文解析部 109 構文解析ルール 110 対象領域知識保持部 111 辞書登録部 112 辞書構造変形部 113 知識構造変形部 114 データベース構造体意味分類保持部 115 対象領域知識登録部 116 途中結果格納部 117 辞書記述推定ルール 120 対象データベース構造体選択部 121 対象文字列選択部 122 対象文字列言語解析登録部 123 対象領域名入力部 201 テーブル名格納領域 202 カラム名格納領域 301 対象領域名格納領域 302 テーブル名格納領域 303 カラム名格納領域 304 日本語表記格納領域 305 日本語類語表記格納領域 401 データベース構造体意味分類 402 対象領域知識 403 対象領域辞書内容 501 対象文字列 502 形態素列 503 構文解析結果 504 辞書登録項目 505 対象領域知識登録項目 601 対象領域名に対する意味分類 602 対象領域知識 603 対象領域辞書内容 604 会社情報を表すノード 605 情報ノードに会社が入力された際に遷移するリ
ンク 606 ラベルが0の同義語リンク 901 KAISHAテーブルに対する意味分類 1001 「企業」に対する形態素列 1002 「企業」に対する構文解析結果 1003 「企業」に対する辞書登録項目
ンク 606 ラベルが0の同義語リンク 901 KAISHAテーブルに対する意味分類 1001 「企業」に対する形態素列 1002 「企業」に対する構文解析結果 1003 「企業」に対する辞書登録項目
フロントページの続き (56)参考文献 特開 平1−180631(JP,A) 特開 昭60−225979(JP,A) 情報処理学会第43回(平成3年後期) 全国大会P.3−171〜P.3−172 情報処理学会第43回(平成3年後期) 全国大会P.3−175〜P.3−176 情報処理学会第45回(平成4年後期) 全国大会P.3−127〜P.3−128 情報処理学会第45回(平成4年後期) 全国大会P.3−125〜P.3−126 電子情報通信学会技術研究報告NLC 91−62(1991)P.25−32 情報処理学会論文誌VOL.32NO. 9(1991)P.1180〜P.1189
Claims (1)
- 【請求項1】 データベースからデータベースのスキー
マを抽出するデータベーススキーマ抽出部と、 前記データベーススキーマ抽出部で抽出したデータベー
ススキーマを保持するデータベーススキーマ保持部と、 前記データベーススキーマ抽出部が出力したデータベー
ススキーマに日本語表記を付与する日本語表記付与部
と、 前記日本語表記付与部で日本語を付与したデータベース
スキーマを保持するスキーマ日本語表記保持部と、 前記データベーススキーマを構成する要素であって、対
象領域、テーブル及びカラムから構成されるものをデー
タベース構造体と定義するとき、 前記スキーマ日本語表記保持部から対象とするデータベ
ース構造体を選択する対象データベース構造体選択部
と、 前記対象データベース構造体選択部が選択したデータベ
ース構造体に対応する日本語表記および日本語類義語表
記の中から対象文字列言語解析登録部を実行する対象文
字列を選択する対象文字列選択部と、 前記対象文字列選択部によって選択した対象文字列を解
析登録するための対象文字列言語解析登録部とからな
り、前記対象文字列言語解析登録部が前記対象文字列を
形態素解析する形態素解析部と、 前記形態素解析部が参照する基本辞書および対象領域辞
書と、 前記形態素解析部が出力した形態素解析列を構文解析す
る構文解析部と、 前記構文解析部が参照する構文解析ルールと、 前記構文解析部が途中結果を格納参照する途中結果格納
部と、 前記構文解析部が辞書登録を行なう際に不足している辞
書記述を推定する辞書記述推定ルールと、 前記構文解析部で前記形態素解析列の構文解析により得
た構文解析結果からデータベース操作系列への変換を行
なう対象領域知識保持部と、 前記対象領域辞書に語彙を登録する辞書登録部と、 前記構文解析結果を前記対象領域辞書に登録する辞書形
式に変更する辞書構造変形部と、 前記構文解析結果を前記対象領域知識保持部に登録する
形式に変更する知識構造変形部と、 前記構文解析結果を前記対象領域辞書に登録する際に必
要とされる意味分類情報を推定するのに利用するための
データベース構造体意味分類保持部と、 前記対象領域保持部に新たな領域知識を登録する対象領
域知識登録部とを持ち、 前記対象データベース構造選択部がデータベース構造体
の大きなものから選択をすることと、前記形態素解析に
よって形態素解析を行なう際、前記対象領域辞書および
前記基本辞書に存在しない日本語文字列を未登録語とし
て、前記未登録語に対する辞書記述を前記構文解析ルー
ルと前記データベース構造体意味分類保持部とを利用し
て推定し、前記対象領域辞書に、前記辞書登録部を用い
て登録を行ない、前記対象領域知識保持部に前記対象領
域知識登録部を用いて登録を行ない、語彙の増加した前
記対象領域辞書を用いて次の形態素解析を行なうことに
よって前記対象領域辞書および前記対象領域知識を漸進
的に増加させていくことを特徴とする知識獲得方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5009573A JP2606541B2 (ja) | 1993-01-22 | 1993-01-22 | 知識獲得方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5009573A JP2606541B2 (ja) | 1993-01-22 | 1993-01-22 | 知識獲得方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06223109A JPH06223109A (ja) | 1994-08-12 |
JP2606541B2 true JP2606541B2 (ja) | 1997-05-07 |
Family
ID=11724056
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5009573A Expired - Lifetime JP2606541B2 (ja) | 1993-01-22 | 1993-01-22 | 知識獲得方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2606541B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4992715B2 (ja) | 2005-08-04 | 2012-08-08 | 日本電気株式会社 | データ処理装置、データ処理方法、データ処理プログラム |
-
1993
- 1993-01-22 JP JP5009573A patent/JP2606541B2/ja not_active Expired - Lifetime
Non-Patent Citations (6)
Title |
---|
情報処理学会第43回(平成3年後期)全国大会P.3−171〜P.3−172 |
情報処理学会第43回(平成3年後期)全国大会P.3−175〜P.3−176 |
情報処理学会第45回(平成4年後期)全国大会P.3−125〜P.3−126 |
情報処理学会第45回(平成4年後期)全国大会P.3−127〜P.3−128 |
情報処理学会論文誌VOL.32NO.9(1991)P.1180〜P.1189 |
電子情報通信学会技術研究報告NLC91−62(1991)P.25−32 |
Also Published As
Publication number | Publication date |
---|---|
JPH06223109A (ja) | 1994-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA1265871A (en) | Domain-independent natural language database interface | |
US6853992B2 (en) | Structured-document search apparatus and method, recording medium storing structured-document searching program, and method of creating indexes for searching structured documents | |
JP3266586B2 (ja) | データ分析システム | |
US20040167875A1 (en) | Information processing method and system | |
JPH03278174A (ja) | 異言語交信用翻訳方法およびシステム | |
JPH0447364A (ja) | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 | |
JP2000315216A (ja) | 自然言語検索方法および装置 | |
CN116737759B (zh) | 一种基于关系感知注意力的中文查询生成sql语句方法 | |
CN108228701A (zh) | 一种实现汉语近自然语言查询接口的系统 | |
CN113779062A (zh) | Sql语句生成方法、装置、存储介质及电子设备 | |
CN113297251A (zh) | 多源数据检索方法、装置、设备及存储介质 | |
CN112183110A (zh) | 一种基于数据中心的人工智能数据应用系统及应用方法 | |
JP2606541B2 (ja) | 知識獲得方式 | |
JP2008077512A (ja) | 文書解析装置、および文書解析方法、並びにコンピュータ・プログラム | |
KR100376931B1 (ko) | 정보 검색 기술을 이용한 한영번역 데이터베이스 시스템 구축 방법 | |
Meng et al. | Overview of a chinese natural language interface to databases: Nchiql | |
JP2606056B2 (ja) | 知識ベース構築方式 | |
JP4033093B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Bruder et al. | GETESS: Constructing a linguistic search index for an Internet search engine | |
ter Hofstede et al. | Grammar based information modelling | |
Kang et al. | Database semantics representation for natural language access | |
JP4635585B2 (ja) | 質問応答システム、質問応答方法及び質問応答プログラム | |
JPH0944508A (ja) | データベース自然言語インタフェース装置および方法 | |
JP3892227B2 (ja) | 機械翻訳システム | |
JP2654533B2 (ja) | データベース日本語表記候補生成方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19961217 |