JP2606541B2

JP2606541B2 - 知識獲得方式

Info

Publication number: JP2606541B2
Application number: JP5009573A
Authority: JP
Inventors: 幹也谷
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1993-01-22
Filing date: 1993-01-22
Publication date: 1997-05-07
Anticipated expiration: 2012-05-07
Also published as: JPH06223109A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、データベースなどの情
報検索手段に対する自然言語インタフェースに係わり、
漸進的に対象領域辞書と対象領域知識とを増加させてい
く知識獲得方式に関する。

【０００２】

【従来の技術】データベース技術やＡＩ(人工知能)技術
の発展により、専門のオペレータだけでなく、計算機に
馴染みの薄いユーザでも簡単に使えるインタフェースの
要望が高まってきている。この要望に答えるインタフェ
ースの一つに計算機に対して自然言語で問い合わせを行
なうものが開発されている。このような自然言語インタ
フェースは、自然言語処理を行なう意味解析部を備え、
入力される自然言語の入力文の意味を理解して、それぞ
れのアプリケーションに対して、アプリケーション固有
の操作手段に従った入力列を作成し、アプリケーション
を実行する。

【０００３】システムの意味解析部が入力文中に含まれ
ている単語の意味を理解するためには、辞書との照合を
行ない意味解析を行なう必要がある。しかし、各種入力
文中に含まれる全ての単語を網羅して予め辞書に登録し
ておくことは不可能であるから、一部に照合できない未
登録語が生じ、結果としては、システムが入力文を理解
できない結果となる場合が多くあった。

【０００４】そこで、自然言語の語彙とその対象となる
アプリケーション上の内部表現の関係を記述した対象領
域知識を獲得するために、表形式の入力方式やノードと
リンクの接続によって自然言語上の概念素と対象アプリ
ケーション上の概念素とのマッピングを獲得する方式な
どが提案されてきた。しかし、従来の知識獲得方式は、
いづれも知識表現に関する知識を必要としていた。

【０００５】

【発明が解決しようとする課題】従来、このような日本
語インタフェースを構築する際には、日本語の入力文を
解析するための辞書項目を辞書表現に基づいて記述し、
解析された構造からアプリケーション言語へ変換するた
めの対象領域知識をシステムに依存した知識表現の形で
記述する必要があった。このため、辞書表現に対する知
識、対象領域知識の知識表現に対する知識が不可欠であ
り、対象領域に詳しい専門家が直接に入力することが困
難であった。

【０００６】本発明は上記の問題点を解決するためにな
されたものである。本発明の目的は、データベースの日
本語表記を解析する段階で対象領域辞書と対象領域知識
に登録するというサイクルを繰り返すことで、漸進的に
対象領域辞書と対象領域知識を獲得し、また、スキーマ
情報と日本語の文法知識を最大限用いることで、登録に
必要な知識のかなりの部分を自動的に獲得することがで
き、推定が不可能な文法・意味分類情報に関しても、例
文選択のような簡単な問い合わせで獲得でき、辞書表
記、対象領域知識表現に対する知識を持たない専門家で
も対象領域辞書および対象領域知識の構築を可能にする
ことにある。

【０００７】

【課題を解決するための手段】前述の課題を解決するた
めに本発明の知識獲得方式は、データベースからデータ
ベースのスキーマを抽出するデータベーススキーマ抽出
部と、前記データベーススキーマ抽出部で抽出したデー
タベーススキーマを保持するデータベーススキーマ保持
部と、前記データベーススキーマ抽出部が出力したデー
タベーススキーマに日本語表記を付与する日本語表記付
与部と、前記日本語表記付与部で日本語を付与したデー
タベーススキーマを保持するスキーマ日本語表記保持部
と、前記データベーススキーマを構成する要素であっ
て、対象領域、テーブル及びカラムから構成されるもの
をデータベース構造体と定義するとき、前記スキーマ日
本語表記保持部から対象とするデータベース構造体を選
択する対象データベース構造体選択部と、前記対象デー
タベース構造体選択部が選択したデータベース構造体に
対応する日本語表記および日本語類義語表記の中から対
象文字列言語解析登録部を実行する対象文字列を選択す
る対象文字列選択部と、前記対象文字列選択部によって
選択した対象文字列を解析登録するための対象文字列言
語解析登録部とからなり、前記対象文字列言語解析登録
部が前記対象文字列を形態素解析する形態素解析部と、
前記形態素解析部が参照する基本辞書および対象領域辞
書と、前記形態素解析部が出力した形態素解析列を構文
解析する構文解析部と、前記構文解析部が参照する構文
解析ルールと、前記構文解析部が途中結果を格納参照す
る途中結果格納部と、前記構文解析部が辞書登録を行な
う際に不足している辞書記述を推定する辞書記述推定ル
ールと、前記構文解析部で前記形態素解析列の構文解析
により得た構文解析結果からデータベース操作系列への
変換を行なう対象領域知識保持部と、前記対象領域辞書
に語彙を登録する辞書登録部と、前記構文解析結果を前
記対象領域辞書に登録する辞書形式に変更する辞書構造
変形部と、前記構文解析結果を前記対象領域知識保持部
に登録する形式に変更する知識構造変形部と、前記構文
解析結果を前記対象領域辞書に登録する際に必要とされ
る意味分類情報を推定するのに利用するためのデータベ
ース構造体意味分類保持部と、前記対象領域保持部に新
たな領域知識を登録する対象領域知識登録部とを持ち、
前記対象データベース構造選択部がデータベース構造体
の大きなものから選択をすることと、前記形態素解析に
よって形態素解析を行なう際、前記対象領域辞書および
前記基本辞書に存在しない日本語文字列を未登録語とし
て、前記未登録語に対する辞書記述を前記構文解析ルー
ルと前記データベース構造体意味分類保持部とを利用し
て推定し、前記対象領域辞書に、前記辞書登録部を用い
て登録を行ない、前記対象領域知識保持部に前記対象領
域知識登録部を用いて登録を行ない、語彙の増加した前
記対象領域辞書を用いて次の形態素解析を行なうことに
よって前記対象領域辞書および前記対象領域知識を漸進
的に増加させていくことを特徴とする。

【０００８】

【実施例】次に本発明について図面を参照して説明す
る。漸進的増加部とは、対象データベース構造体意味分
類保持部１１４と対象領域知識保持部１１０と対象領域
辞書１０７のことである。

【０００９】図１は本発明の実施例の知識獲得方式の基
本構成図、図２は図１中のデータベースのスキーマ例を
示す図、図３は図１中のデータベースのスキーマの日本
語表記例を示す図、図４は図１中の入力された対象領域
名を対象文字列言語解析登録処理する直前の漸進的増加
部を示す図、図５は図４の状態で図１中の入力された対
象領域名を対象文字列言語解析登録処理した結果を示す
図、図６は図５で実行された対象文字列言語解析登録処
理の結果変化した漸進的増加部を示す図、図７は図１中
のデータベーススキーマの日本語表記の内、KAISHAのテ
ーブルを対象データベース構造体した時の対象データベ
ース構造体言語解析登録処理をする直前の漸進的増加部
を示す図、図８は前記KAISHAテーブルの日本語表記を対
象文字列とした時の対象文字列言語解析登録処理を行な
った結果を示す図、図９は前記KAISHAテーブルの日本語
表記を対象文字列とした時の対象文字列言語解析登録処
理を行なった直後の漸進的増加部を示す図、図１０は前
記KAISHAテーブルの日本語類義語表記である「企業」を
対象文字列言語解析登録処理を行なった結果を示す図
で、ここで「企業」は基本辞書に存在しないことを仮定
している。

【００１０】図１１は前記KAISHAテーブルの日本語類義
語表記である「企業」を対象文字列言語解析登録処理を
行なった直後の漸進的増加部を示す図、図１２は前記KA
ISHAテーブルの日本語類義語表記である「カンパニー」
を対象文字列言語解析登録処理を行なった結果を示す図
で、ここで「カンパニー」は基本辞書に存在しないこと
を仮定している。

【００１１】図１３は前記KAISHAテーブルの日本語類義
語表記である「カンパニー」を対象文字列言語解析登録
処理を行なった直後の漸進的増加部を示す図、図１４は
図１中のデータベーススキーマの日本語表記の内、KAIS
HAテーブルのTELNOカラムを対象データベース構造体し
た時の対象データベース構造体言語解析登録処理をする
直前の漸進的増加部を示す図、図１５は前記TELNOカラ
ムの日本語表記を対象文字列とした時の対象文字列言語
解析登録処理を行なった結果を示す図、図１６は前記TE
LNOカラムの日本語表記を対象文字列とした時の対象文
字列言語解析登録処理を行なった直後の漸進的増加部を
示す図、図１７は前記TELNOカラムの日本語類義語表記
である「本社の電話番号」を対象文字列言語解析登録処
理を行なった結果を示す図、図１８は前記TELNOカラム
の日本語類義語表記である「本社の電話番号」を対象文
字列言語解析登録処理を行なった直後の漸進的増加部を
示す図、図１９は形態素解析で用いる辞書の形式を表す
図、図２０は形態素解析で用いる辞書の形式の例を表す
図、図２１は大まかな処理の流れを表す図、図２２は、
対象データベース構造体言語解析登録処理および対象文
字列言語解析登録処理の流れを表す図である。

【００１２】図１において、本実施例は、データベース
からデータベース構造を抽出するデータベーススキーマ
抽出部１０１と、前記データベーススキーマ抽出部１０
１で抽出したデータベーススキーマを保持するデータベ
ーススキーマ保持部１０２と、前記データベーススキー
マ抽出部１０１が出力したデータベーススキーマに日本
語表記を付与する日本語表記付与部１０３と、前記日本
語表記付与部１０３で日本語を付与したデータベースス
キーマを保持するスキーマ日本語表記保持部１０４と、
前記日本語表記付与部１０３が出力したスキーマ日本語
表記を形態素解析するための形態素解析部１０５と、前
記形態素解析部１０５が参照する基本辞書１０６及び対
象領域辞書１０７と、前記形態素解析部１０５が出力し
た形態素解析列の構文を解析する構文解析部１０８と、
前記構文解析部１０８が参照する構文解析ルール１０９
と、前記構文解析部１０８が途中結果を格納し参照する
途中結果格納部１１６と、前記構文解析部１０８が辞書
登録を行なう際に不足している辞書記述を推定する辞書
記述推定ルール１１７と、前記構文解析結果からデータ
ベース操作系列への変換を行なうための対象領域知識保
持部１１０と、前記対象領域辞書１０７に語彙を登録す
るための辞書登録部１１１と、前記構文解析結果を前記
対象領域辞書１０７に登録する辞書形式に変更する辞書
構造変形部１１２と、前記構文解析結果を前記対象領域
知識保持部１１０に登録する形式に変更する知識構造変
形部１１３と、前記構文解析結果を前記対象領域辞書に
登録する際に必要とされる意味分類情報を推定するのに
利用するためのデータベース構造体意味分類保持部１１
４と、前記対象領域知識保持部１１０に新たな領域知識
を登録する対象領域知識登録部１１５とを有している。

【００１３】次に、本実施例の動作について、図２１及
び図２２の流れを追いながら、途中結果である図２〜２
０を用いて説明する。

【００１４】データベーススキーマ抽出部１０１は対象
とするデータベース９１を持つデータベース管理システ
ム９０に、スキーマ情報を出力するデータベース検索コ
マンドを入力し、スキーマ情報を獲得し、データベース
スキーマ保持部１０２に図２のようにテーブル名２０１
とカラム名２０２が対応するように格納する。

【００１５】スキーマ情報を出力するデータベース検索
コマンドは、例えばデータベース管理システム９０がＳ
ＱＬのインタフェースを持つとするなら、日刊工業新聞
社発行・河村一樹著・「ＳＱＬ言語活用入門」に記載
されている方法を用いれば良い。

【００１６】日本語表記付与部１０３は図２で示される
スキーマの各データベース構造体に対して図３の日本語
表記３０４と日本語類義語表記３０５を付与し、スキー
マ日本語表記保持部１０４に格納する。この日本語表記
付与部１０３には、例えば情報処理学会第４５回全国大
会予稿集2F-10「自然言語によるデータベース検索のた
めの対象分野知識入力支援ツール」に記載されている方
法を用いれば良い。対象領域名入力部１２３によって入
力された対象領域名は対象文字列言語解析登録部１２２
によって解析が行なわれる。

【００１７】この直前の漸進的増加部の状態は図４に示
すとおり、データベース構造体意味分類保持部１１４が
保持しているデータベース構造意味分類４０１も、対象
領域保持部１１０で保持されている対象領域知識４０２
も、対象領域辞書１０７で保持されている対象領域辞書
内容４０３も空である。

【００１８】図５に示すように対象文字列５０１「会社
情報」を対象領域辞書１０７、基本辞書１０６を使って
形態素解析をして、形態素列５０２を得る。

【００１９】形態素解析部１０５には例えば、昭和６３
年電子情報通子学会秋季全国大会予稿集「PIVOT J-E:日
本語形態素分解」に記載されている方法を用いれば良
い。

【００２０】前記形態素列５０２について構文解析ルー
ル１０９と途中結果格納部１１６を利用して構文解析を
し、構文解析結果格納部１２４に、構文解析結果５０３
のように格納する。構文解析部１０８には、例えば特願
昭61-175034によって周知のような構文解析手段を用い
れば良い。また、構文解析結果５０３を表す概念構造に
は、例えば電子情報通信学会技術報告書NLC91-62「自然
言語インタフェース構築キット：IF-Kit」に記載されい
る方法を用いれば良い。

【００２１】辞書構造変形部１１２はデータベース構造
体意味分類保持部１１４に図６の６０１のように対象領
域名に対する意味分類を登録し、前記構文解析結果から
対象領域辞書登録項目５０４を作成し、辞書登録部１１
１によって対象領域辞書１０７に対象領域辞書内容６０
３のように格納する。

【００２２】知識構造変形部１１３は構文解析結果５０
３から、対象領域知識登録項目として５０５を作成し、
対象領域知識登録部１１５によって対象領域知識保持部
１１０に対象領域知識６０２のように格納する。対象領
域知識６０２は６０４のように丸で囲まれたノードと６
０５のようにラベルのついたリンクからできている。６
０６で示すようなラベル０が付随しているリンクは同義
語リンクであり、同じ意味のノードの間を結ぶ。

【００２３】図６は前記対象領域名を対象文字列として
対象文字列言語解析登録処理を終了した直後の漸進的増
加部である。

【００２４】次に、入力された対象領域名に属する各々
のテーブルを対象データベース構造体として、その日本
語表記と日本語類義語表記を対象文字列として前記対象
文字列言語解析登録処理を行なう。対象データベース構
造体をKAISHAテーブルとした時の流れを図７、８、９、
１０、１１、１２、１３を参照して説明する。

【００２５】対象データベース構造体をKAISHAテーブル
としたので、KAISHAテーブルの日本語表記である「会
社」、日本語類義語表記である「企業」、「カンパニ
ー」、「社」を順に対象文字列として対象文字列言語解
析登録処理を行なう。この直前の漸進的増加部は図７の
ようになり、これは対象領域名の前記対象文字列言語解
析登録処理を終った段階の図６と同じである。

【００２６】まず、対象データベース構造体KAISHAテー
ブルの日本語表記「会社」に関して対象文字列言語解析
登録処理を行なった結果が図８であり、この結果漸進的
増加部は図９のようになる。

【００２７】次に、対象データベース構造体KAISHテー
ブルの日本語類義語表記「企業」に関して対象文字列言
語解析登録処理を行なう。この結果が図１０であり、基
本辞書に「企業」がなかった場合についてここでは示し
ている。「企業」は未登録語であるため、辞書記述推定
ルール１１７とデータベース構造体意味分類９０１から
構文解析結果１００２及び辞書登録項目１００３を得
て、漸進的増加部は図１１のようになる。

【００２８】同様に、日本語類義語表記「カンパニー」
に関して、行なった結果が図１２で、その結果、漸進的
増加部は図１３のようになる。

【００２９】同様に、未処理のテーブルに関して対象デ
ータベース構造体言語解析登録処理を行なう。

【００３０】次に、前記対象領域名に属するカラムに関
して、同様の処理を行なう。ここでは、KAISHAテーブル
のTELNOカラムに関して、その日本語表記である「電話
番号」と日本語類義語表記である「本社の電話番号」を
対象文字列解析した時の漸進的増加部の変化を図１４、
１６、１８に、また言語登録解析結果を図１５、１７に
示した。

【００３１】このように、スキーマ日本語表記保持部１
０４に保持されている全てのデータベース構造体に対し
て日本語表記及び日本語類義語表記の対象文字列言語解
析登録処理を行なうことで対象領域辞書１０６と対象領
域知識保持部１１０を漸進的に増加させることができ
る。

【００３２】以上、本発明を実施例にもとづき具体的に
説明したが、本発明は、前記実施例限定されるものでは
なく、その要旨を逸脱しない範囲において種々の態様に
変更可能であることは言うまでもない。

【００３３】

【発明の効果】以上、説明したように、本発明によれ
ば、データベース上では登録されているデータベースの
日本語表記を解析する段階で対象領域辞書と対象領域意
味ネットワーク知識に登録するというサイクルを繰り返
すことで、漸進的に対象領域辞書と対象領域知識を獲得
することができる。また、スキーマ情報と日本語の文法
知識を最大限に用いることで、登録に必要な知識のかな
りの部分を自動的に獲得することができ、推定が不可能
な文法・意味分類情報に関しても、例文選択のような簡
単な問い合わせで獲得できるため、辞書表記、意味ネッ
トワーク知識表現に対する知識を持たない専門家でも対
象領域辞書および対象領域知識の構築が可能である。

【図面の簡単な説明】

【図１】本発明の一実施例を示す基本構成図である。

【図２】図１中のデータベースのスキーマ例を示す図で
ある。

【図３】図１中のデータベースのスキーマの日本語表記
例を示す図である。

【図４】図１中の入力された対象領域名「会社情報」を
対象文字列言語解析登録処理する直前の漸進的増加部を
示す図である。

【図５】図４の状態で図１中の入力された対象領域名
「会社情報」を対象文字列言語解析登録処理した結果を
示す図である。

【図６】図５で実行された対象文字列言語解析登録処理
の結果変化した漸進的増加部を示す図である。

【図７】図１中のデータベーススキーマの日本語表記の
内、KAISHAのテーブルの日本語表記「会社」を対象文字
列として、対象文字列言語解析登録処理をする直前の漸
進的増加部を示す図である。

【図８】前記KAISHAテーブルの日本語表記「会社」を対
象文字列とした時の対象文字列言語解析登録処理を行な
った結果を示す図である。

【図９】前記KAISHAテーブルの日本語表記を対象文字列
とした時の対象文字列言語解析登録処理を行なった直後
の漸進的増加部を示す図である。

【図１０】前記KAISHAテーブルの日本語類義語表記であ
る「企業」を対象文字列言語解析登録処理を行なった結
果を示す図で、ここで「企業」は基本辞書に存在しない
ことを仮定している。

【図１１】前記KAISHAテーブルの日本語類義語表記であ
る「企業」を対象文字列言語解析登録処理を行なった直
後の漸進的増加部を示す図である。

【図１２】前記KAISHAテーブルの日本語類義語表記であ
る「カンパニー」を対象文字列言語解析登録処理を行な
った結果を示す図で、ここで「カンパニー」は基本辞書
に存在しないことを仮定している。

【図１３】前記KAISHAテーブルの日本語類義語表記であ
る「カンパニー」を対象文字列言語解析登録処理を行な
った直後の漸進的増加部を示す図である。

【図１４】図１中のデータベーススキーマの日本語表記
の内、KAISHAテーブルのTELNOカラムの日本語表記「電
話番号」を対象文字列としたときの対象文字列言語解析
登録処理をする直前の漸進的増加部を示す図である。

【図１５】前記TELNOカラムの日本語表記「電話番号」
を対象文字列とした時の対象文字列言語解析登録処理を
行なった結果を示す図である。

【図１６】前記TELNOカラムの日本語表記「電話番号」
を対象文字列とした時の対象文字列言語解析登録処理を
行なった直後の漸進的増加部を示す図である。

【図１７】前記TELNOカラムの日本語類義語表記である
「本社の電話番号」を対象文字列言語解析登録処理を行
なった結果を示す図である。

【図１８】前記TELNOカラムの日本語類義語表記である
「本社の電話番号」を対象文字列言語解析登録処理を行
なった直後の漸進的増加部を示す図である。

【図１９】形態素解析で用いる辞書の形式を表す図であ
る。

【図２０】形態素解析で用いる辞書の形式の例を表す図
である。

【図２１】図１の実施例における大まかな処理の流れを
表す図である。

【図２２】図１の実施例における対象データベース構造
体言語解析登録処理および対象文字列言語解析登録処理
の流れを表す図である。

【符号の説明】

９０データベース管理システム９１データベース１０１データベーススキーマ抽出部１０２データベーススキーマ保持部１０３日本語表記付与部１０４スキーマ日本語表記保持部１０５形態素解析部１０６基本辞書１０７対象領域辞書１０８構文解析部１０９構文解析ルール１１０対象領域知識保持部１１１辞書登録部１１２辞書構造変形部１１３知識構造変形部１１４データベース構造体意味分類保持部１１５対象領域知識登録部１１６途中結果格納部１１７辞書記述推定ルール１２０対象データベース構造体選択部１２１対象文字列選択部１２２対象文字列言語解析登録部１２３対象領域名入力部２０１テーブル名格納領域２０２カラム名格納領域３０１対象領域名格納領域３０２テーブル名格納領域３０３カラム名格納領域３０４日本語表記格納領域３０５日本語類語表記格納領域４０１データベース構造体意味分類４０２対象領域知識４０３対象領域辞書内容５０１対象文字列５０２形態素列５０３構文解析結果５０４辞書登録項目５０５対象領域知識登録項目６０１対象領域名に対する意味分類６０２対象領域知識６０３対象領域辞書内容６０４会社情報を表すノード６０５情報ノードに会社が入力された際に遷移するリ
ンク６０６ラベルが０の同義語リンク９０１ KAISHAテーブルに対する意味分類１００１「企業」に対する形態素列１００２「企業」に対する構文解析結果１００３「企業」に対する辞書登録項目

フロントページの続き (56)参考文献特開平１−180631（ＪＰ，Ａ) 特開昭60−225979（ＪＰ，Ａ) 情報処理学会第43回（平成３年後期) 全国大会Ｐ．３−171〜Ｐ．３−172 情報処理学会第43回（平成３年後期) 全国大会Ｐ．３−175〜Ｐ．３−176 情報処理学会第45回（平成４年後期) 全国大会Ｐ．３−127〜Ｐ．３−128 情報処理学会第45回（平成４年後期) 全国大会Ｐ．３−125〜Ｐ．３−126 電子情報通信学会技術研究報告ＮＬＣ 91−62（1991）Ｐ．25−32 情報処理学会論文誌ＶＯＬ．32ＮＯ. ９（1991）Ｐ．1180〜Ｐ．1189

Claims

(57)【特許請求の範囲】

【請求項１】データベースからデータベースのスキー
マを抽出するデータベーススキーマ抽出部と、前記データベーススキーマ抽出部で抽出したデータベー
ススキーマを保持するデータベーススキーマ保持部と、前記データベーススキーマ抽出部が出力したデータベー
ススキーマに日本語表記を付与する日本語表記付与部
と、前記日本語表記付与部で日本語を付与したデータベース
スキーマを保持するスキーマ日本語表記保持部と、前記データベーススキーマを構成する要素であって、対
象領域、テーブル及びカラムから構成されるものをデー
タベース構造体と定義するとき、前記スキーマ日本語表記保持部から対象とするデータベ
ース構造体を選択する対象データベース構造体選択部
と、前記対象データベース構造体選択部が選択したデータベ
ース構造体に対応する日本語表記および日本語類義語表
記の中から対象文字列言語解析登録部を実行する対象文
字列を選択する対象文字列選択部と、前記対象文字列選択部によって選択した対象文字列を解
析登録するための対象文字列言語解析登録部とからな
り、前記対象文字列言語解析登録部が前記対象文字列を
形態素解析する形態素解析部と、前記形態素解析部が参照する基本辞書および対象領域辞
書と、前記形態素解析部が出力した形態素解析列を構文解析す
る構文解析部と、前記構文解析部が参照する構文解析ルールと、前記構文解析部が途中結果を格納参照する途中結果格納
部と、前記構文解析部が辞書登録を行なう際に不足している辞
書記述を推定する辞書記述推定ルールと、前記構文解析部で前記形態素解析列の構文解析により得
た構文解析結果からデータベース操作系列への変換を行
なう対象領域知識保持部と、前記対象領域辞書に語彙を登録する辞書登録部と、前記構文解析結果を前記対象領域辞書に登録する辞書形
式に変更する辞書構造変形部と、前記構文解析結果を前記対象領域知識保持部に登録する
形式に変更する知識構造変形部と、前記構文解析結果を前記対象領域辞書に登録する際に必
要とされる意味分類情報を推定するのに利用するための
データベース構造体意味分類保持部と、前記対象領域保持部に新たな領域知識を登録する対象領
域知識登録部とを持ち、前記対象データベース構造選択部がデータベース構造体
の大きなものから選択をすることと、前記形態素解析に
よって形態素解析を行なう際、前記対象領域辞書および
前記基本辞書に存在しない日本語文字列を未登録語とし
て、前記未登録語に対する辞書記述を前記構文解析ルー
ルと前記データベース構造体意味分類保持部とを利用し
て推定し、前記対象領域辞書に、前記辞書登録部を用い
て登録を行ない、前記対象領域知識保持部に前記対象領
域知識登録部を用いて登録を行ない、語彙の増加した前
記対象領域辞書を用いて次の形態素解析を行なうことに
よって前記対象領域辞書および前記対象領域知識を漸進
的に増加させていくことを特徴とする知識獲得方式。