JPH09245051A - 自然言語事例検索装置及び自然言語事例検索方法 - Google Patents

自然言語事例検索装置及び自然言語事例検索方法

Info

Publication number
JPH09245051A
JPH09245051A JP8047573A JP4757396A JPH09245051A JP H09245051 A JPH09245051 A JP H09245051A JP 8047573 A JP8047573 A JP 8047573A JP 4757396 A JP4757396 A JP 4757396A JP H09245051 A JPH09245051 A JP H09245051A
Authority
JP
Japan
Prior art keywords
case
input
expression
term
language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8047573A
Other languages
English (en)
Other versions
JP3780556B2 (ja
Inventor
泰博 ▲高▼山
Yasuhiro Takayama
Katsushi Suzuki
克志 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP04757396A priority Critical patent/JP3780556B2/ja
Publication of JPH09245051A publication Critical patent/JPH09245051A/ja
Application granted granted Critical
Publication of JP3780556B2 publication Critical patent/JP3780556B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 自然言語事例検索で、入力の言語表現中に記
号表現や数量表現等の記号列を含む場合に、記号列を有
効に活用する。 【解決手段】 入力された言語表現中に含まれる記号表
現や数量表現等を抽出する記号列抽出手段2と、受け取
った言語表現から用語辞書管理手段3を用いて事例検索
のキーとなる用語と抽出する用語抽出手段4と、用語抽
出手段により抽出された用語をキーとして事例ベース管
理手段5によって管理された事例ベースから処理対象と
なる事例の候補を取り出す事例候補検索手段6と、事例
候補の中から入力された言語表現に類似した事例を絞り
こむための事例絞り込み手段7と、絞り込まれた事例の
なかから入力された言語表現の内容に応じて関連する情
報を推論する関連情報推論手段8と、その結果等を表示
する解析内容表示手段9とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、過去の課題と対策
を自然言語形式の事例として登録・蓄積しておき、それ
を検索・参照および推論処理して、新規課題の処理や、
設計支援等に用いられる自然言語事例検索装置及び自然
言語事例検索方法に関するものである。
【0002】ここで、「自然言語」の「事例」(以下、
自然言語事例)とは、処理の対象として蓄積されるデー
タの検索のキーとなる部分に日本語や英語等の人間が日
常使用する言葉の表現(文章)である自然言語を含むも
のをいう。もちろん、検索のキーに関連づけられた情報
も自然言語から構成されていても良い。自然言語事例
は、通常の言語表現という人間にとって極めて自然な記
述形式を用いるので、入力が容易であり、また文字コー
ドの並びという蓄積効率の高いデータであり、データの
再利用も簡単に行なうことができる。
【0003】
【従来の技術】図28は、例えば文献(黒川高光:”C
BR機能を組み込んだ「ART−IM」とドメイン・シ
ェル「CBR Express」,日経AI別冊199
1春号, pp.130−139,日経BP(1991
年))や文献(中條将典:「ヘルプデスク専用ソフト増
える/過去の事例を文章で素早く検索」,日経コンピュ
ータ,pp.103−105,1995年9月5日号)
に示された従来の自然言語事例検索装置の構成である。
ただし、比較しやすくするために,名称等をここでの表
現に統一している。
【0004】図において、1は問合せの入力手段であ
り、検索したい内容を言語表現として入力する。4は用
語抽出手段であり、用語の抽出や同義語展開を行なう。
3は用語抽出を行なうための用語データを管理する用語
辞書管理手段、5は自然言語の事例データとその検索の
ための索引等を管理する事例ベース管理手段、6は入力
と類似する事例を取り出すための事例候補検索手段であ
り、入力に対して類似した事例を検索して取り出す。8
は選択した事例に関連付けられた事例を取り出す関連情
報推論手段、9は一連の解析内容を表示するための解析
内容表示手段である。
【0005】次に従来の技術の例における動作について
説明する。図28において、例えば、入力手段1での入
力「印刷できない」に対して、用語抽出手段4は、用語
辞書管理手段3の用語データを参照して、「印刷で」、
「刷でき」、「できな」、... といった3文字単位の文
字列を取り出す。次に事例候補検索手段6でこれら3文
字単位の文字列を索引として、事例ベース管理手段5に
よる事例の索引中にこれらの文字列をもっとも多く含む
ものを事例の候補として取り出す。
【0006】次に、得られた候補の中から利用者が選択
した事例に対して、関連情報推論手段8においてその事
例に関係付けられているYes/Noの質問に答えるこ
とによって、関連情報を取り出す。これらの過程におい
て必要な情報は解析内容表示手段9において随時表示さ
れる。
【0007】図29は、前記文献(黒川高光:”CBR
機能を組み込んだ「ART−IM」とドメイン・シェル
「CBR Express」,日経AI別冊1991春
号,pp.130−139,日経BP(1991年))
に示された、各事例に付随するべき質問を登録し、質問
に対して期待する回答のタイプを指定するウィンドウ画
面の例である。図において、2901は、質問の言語表
現を示す欄、2902は付随する関連情報を示す欄、2
903はテキストによる検索を指定する欄、2904は
数値による検索を指定する欄である。
【0008】この従来の装置では、テキストによる検索
の指定2903と数値による検索の指定2904を別個
に指定して扱わなければならないため、テキスト中に含
まれている数値そのものを取り出して、その情報を別の
箇所で利用するという機能は備えていない。また、数値
以外の記号列に対して特別な処理を行なうことはできな
いため、入力文の照合には必要ない記号列部分に対して
も前記3文字単位の索引が無駄に生成されてしまう。
【0009】また、図30は特開平7−200583に
おける従来の数量/時間表現処理方式の例である。この
従来技術は、自然言語文を解析して意味構造を出力する
構文/意味解析手段3001と、この構文/意味解析手
段3001からの意味構造に基づいて文脈を利用した入
力文の意味処理を行なう文脈処理手段3002と、文脈
処理手段3002の結果を意味履歴として保持する文脈
情報保持手段3003と、入力文中の数量/時間表現を
対象として基準や範囲に関する情報を抽出する数量/時
間表現解析手段3004と、上記文脈情報保持手段30
03による解析結果と文脈情報とを利用して入力文の数
量/時間に関する情報を補完する数量/時間情報文脈補
完手段3005と、意味補完内容を一定の基準で評価し
て誤りの可能性ありと判断した内容について利用者への
確認問い合わせを行なう補完内容確認手段3006とを
有している。
【0010】次に、この従来技術の動作を説明する。ま
ず、自然言語で記述した文を構文・意味解析手段300
1で解析して意味構造を出力し、更に文脈処理手段30
02で意味構造に基づいて文脈を利用した入力文の意味
処理を行ない、文脈情報保持手段3003に文脈処理の
結果を意味履歴として保持しておく。
【0011】一方、数量/時間表現解析手段3004で
は、入力文中の数量/時間表現を対象として基準や範囲
に関する、例えば、「1993年」や「翌年」といった
情報を抽出する。このとき、数量/時間情報文脈内容補
完手段3005によって、文脈情報保持手段3003に
保持された文脈情報を利用して、数量/時間表現解析手
段3004によって抽出された入力文中の数量/時間表
現を対象として、例えば「翌年」を「1994年」であ
るとするような補完を行なう。この補完処理は、高度な
解析技術を要する文脈情報を使用するために誤る可能性
があるので、補完内容確認手段3006において意味補
完内容を一定の基準で評価して誤りの可能性ありと判断
した内容については、利用者への確認問い合わせを行な
う。
【0012】また、図31は特開平6−195371に
おける従来の未登録語獲得方式の例である。この従来技
術は、登録されている単語を入力文字列から検索する辞
書記憶手段3103と、未登録語を含む入力文から未登
録語を抽出する未登録語抽出手段3101と、共起事例
データを格納する共起事例データ記憶手段3102と、
単語と単語の間の関係を抽出する解析手段3104と、
解析手段3104により抽出された単語と単語の関係を
キーにして共起事例データ記憶手段3102を検索して
得られた共起単語の中から辞書記憶手段3103に含ま
れる単語だけを残して同義語候補にする同義語候補抽出
手段3105と、同義語候補を利用者に提示し選択する
同義語選択手段3106と、選択された同義語を辞書記
憶手段3103に登録する辞書登録手段3107と、一
般的な語彙に対して十分な同義語を保持している同義語
データ記憶手段3108とを有しており、辞書内の未登
録語に対して共起事例データあるいは同義語データを用
いて、未登録語を登録するものである。
【0013】次に、この従来技術の動作を説明する。ま
ず、入力した自然言語の文から、辞書記憶手段3103
によって記憶している辞書情報を用いて未登録語抽出手
段3101によって未登録語を抽出する。解析手段31
04は、未登録語の有無にかかわらず、入力文を解析し
て概念構造を作成する。同義語候補抽出手段3105
は、概念構造から意味要素間の関係である格関係(動詞
と名詞の間の関係など)の組みに分割する。
【0014】格関係の組みが未登録語を含んでいる場
合、意味要素と格関係をキーとして、共起事例データ記
憶手段3102を検索して、マッチングするもの、ある
いは未登録語の表層の一部がマッチングする共起事例デ
ータが存在すれば第一次同義語候補にする。同時に、同
義語候補抽出手段3105は、入力文に含まれていた未
登録語をキーとして、同義語データ記憶手段3108を
検索し、未登録語の全体や一部が同義語データのエント
リとして存在すれば、第二次同義語候補にする。
【0015】このとき、同義語データ記憶手段3108
は、辞書記憶手段3103に関係なく、一般的な語彙に
対して十分な同義語を保持しているものとする。同義語
選択手段3106は、第一次同義語候補と第二次同義語
候補をユーザに提示し、ユーザによって選択された結果
を、入力文中の未登録語の辞書情報として、辞書登録手
段3107により辞書記憶手段3103に登録する。
【0016】
【発明が解決しようとする課題】上記従来の自然言語事
例検索装置は以上のように構成されており、自然言語デ
ータである事例文および入力文の照合を検索目的のみに
用いるので、文の中に含まれる記号表現や数量表現の記
号列を有効に利用できないばかりか、文中にこれらの表
現が含まれると、同様な事例も別個の事例として扱われ
るため、これらの記号列に対して事例や索引などが無駄
に生成されるという問題もあった。特に、技術文章等に
対して事例検索を行なう場合には、記号・数量表現や論
理構造を持つ言語データが重要な役割を持つためこれら
は大きな問題であった。
【0017】また、文単位に入力と事例との照合を行な
うのみであったので、箇条書き等の論理構造を持つ言語
データを扱うことができなかった。
【0018】さらに、構文/意味解析手段の処理の後で
数量/時間表現の抽出を行ない、文脈処理の結果で情報
を補完するような処理を行なっていたが、文脈処理が必
ずしも正確に行われるとは限らないため、利用者への確
認問い合わせが必要であり、自動的な処理では利用しに
くいという問題があった。
【0019】さらにまた、共起事例データや同義語デー
タを用いて未登録語の辞書への登録の効率を向上させて
いたが、同義語データが一般的な語彙に対して十分な同
義語を保持していることを前提にしていたため、予めこ
のような同義語データを備えておくことが困難であり、
さらに、単語ではなく文以上の単位をもつ言語データの
登録にはこの方法を用いることができないという問題が
あった。
【0020】本発明は上記のような問題を解消するため
になされたもので、記号列表現を抽出する手段を設ける
ことにより、入力文や事例中に含まれる記号や数量など
に関して無駄な索引を生成することがなく、それらの表
現を抽出して事例検索の結果に関連する情報を推論する
際、有効に活用する事を目的とする。
【0021】また、本発明は、論理構造を持つ言語デー
タを容易に入力する手段と、構造データを段階的に類似
照合して適切な事例を絞り込むことができるようにする
ことにより、複雑な自然言語事例をも取り扱うことがで
きる検索方式を得ることを目的とする。
【0022】さらに、本発明は、事例候補検索手段や事
例絞り込み手段で入力に対する所望の事例が得られない
とき、単語より大きな単位である文や文章であっても、
新たな言語表現の事例として登録したり、その表現を次
に検索する際に必要な用語の登録を容易にすることを目
的とする。
【0023】またさらに、本発明は、入力の言語表現中
に図面参照等の参照表現が含まれていた場合に、外部の
データベースの参照を容易にすることを目的とする。
【0024】
【課題を解決するための手段】この発明に関わる請求項
1に記載の自然言語事例検索装置は、言語表現を入力す
る入力手段と、この入力手段により入力された言語表現
中に含まれる記号表現や数量表現等の記号列を抽出する
記号列抽出手段と、上記入力手段により入力された言語
表現からの用語抽出に必要な辞書データを検索・管理す
る用語辞書管理手段と、上記記号列抽出手段から記号列
と言語表現を受け取り、受け取った言語表現からこの用
語辞書管理手段を用いて事例検索のキーとなる用語を抽
出する用語抽出手段と、予め蓄積された言語表現とその
関連情報との対からなる事例データを検索・管理する事
例ベース管理手段と、上記用語抽出手段により抽出され
た用語をキーとしてこの事例ベース管理手段によって管
理された事例ベースから処理対象となる事例の候補を取
り出す事例候補検索手段と、この事例候補検索手段によ
り取り出された事例候補の中から入力された言語表現に
類似した事例を絞りこむための事例絞り込み手段と、こ
の事例絞り込み手段により絞り込まれた事例のなかから
入力された言語表現の内容に応じて関連する情報を推論
する関連情報推論手段と、少なくとも事例候補検索手段
または上記事例絞り込み手段によって取り出された事例
とこの関連情報推論手段の推論結果を表示する解析内容
表示手段とを備えたものである。
【0025】請求項2に記載の自然言語事例検索装置
は、箇条書き等の論理構造を持つ言語表現の入力を補助
する構造入力補助手段と、論理構造を持つ事例に対して
事例候補の絞り込みが可能である構造化事例絞り込み補
助手段を備えたものである。
【0026】請求項3に記載の自然言語事例検索装置
は、事例候補検索手段や事例絞り込み手段で入力に対す
る所望の事例が得られないとき、新たな事例や用語の登
録を容易にするために新規事例登録手段を備えたもので
ある。
【0027】請求項4に記載の自然言語事例検索装置
は、入力の言語表現中に含まれる図面参照等の参照表現
から、外部のデータベースの参照を容易にする付加情報
参照手段を備えたものである。
【0028】この発明に係わる請求項5に記載の自然言
語事例検索方法は、言語表現を入力手段から入力する入
力ステップと、このステップで入力された言語表現中に
含まれる記号表現や数量表現等の記号列を抽出する記号
列抽出ステップと、この記号列抽出ステップで処理後の
言語表現を受け取り、入力された言語表現からの用語抽
出に必要な事例検索のキーとなる用語を収録した用語辞
書を用いて受け取った言語表現から事例検索のキーとな
る用語を抽出する用語抽出ステップと、この用語抽出ス
テップにより抽出された用語をキーとして予め蓄積され
た言語表現とその関連情報との対からなる事例データか
ら処理対象となる事例の候補を取り出す事例候補検索ス
テップと、この事例候補検索ステップにより取り出され
た事例候補の中から入力された言語表現に類似した事例
を絞りこむための事例絞り込みステップと、この事例絞
り込みステップにより絞り込まれた事例のなかから入力
された言語表現の内容に応じて関連する情報を推論する
関連情報推論ステップと、少なくとも事例候補検索ステ
ップまたは上記事例絞り込みステップによって取り出さ
れた事例とこの関連情報推論ステップの推論結果を表示
する解析内容表示ステップとを備えたものである。
【0029】請求項6に記載の自然言語事例検索方法
は、上記入力ステップは、箇条書き等の論理構造を持つ
言語表現の入力を補助する構造入力補助ステップを備
え、上記事例絞り込みステップは、上記論理構造を持つ
事例に対して事例候補の絞り込みをする構造化事例絞り
込み補助ステップを備えたものである。
【0030】請求項7に記載の自然言語事例検索方法
は、上記事例候補検索ステップまたは上記事例絞り込み
ステップで入力の言語表現に対する所望の事例が得られ
ないとき、入力された言語表現と関連情報の対を新たな
事例として新規に登録する登録ステップを備えたもので
ある。
【0031】請求項8に記載の自然言語事例検索方法
は、入力文中に含まれる参照表現によって外部のデータ
ベースに含まれる情報を参照する機能を有する付加情報
参照ステップを上記解析内容表示ステップの前または後
に備えたものである。
【0032】
【発明の実施の形態】
実施の形態1.以下、この発明の実施の形態1を図につ
いて説明する。図1は本発明の自然言語事例検索装置の
実施の形態1の構成図であり、図において、1はキーボ
ード等の入力装置または他のプログラムからデータを受
け取ることによる入力手段、2は入力手段1で入力した
データの入力言語表現から記号表現や数量表現等の記号
列を抽出するための記号列抽出手段、3はこの装置によ
る検索方式で用いる用語辞書データを索引等によって検
索したり、新たな用語辞書データを格納したりするため
の用語辞書管理手段であり、公知の方法で実現するもの
とする。4はこの用語辞書管理手段3を利用して言語表
現から用語を抽出するための用語抽出手段であり、公知
の方法で実現するものとする。5は言語表現とそれに関
連付けた情報を管理するための事例ベース管理手段であ
り、公知の方法で実現するものとする。6は多くの事例
の中から現在の入力に対して処理を適用できそうな事例
の候補を、入力から抽出した索引と同じ索引を含むかど
うかによって事例ベースから取り出す事例候補検索手段
である。
【0033】7はこの事例候補検索手段6で得た事例候
補のなかから入力に類似したものを選びだすための事例
絞り込み手段、8は検索して得た事例とその事例に関係
付けられた情報から、入力に関連する情報を取り出すた
めの関連情報推論手段、9は一連の処理内容を随時表示
するための解析内容表示手段である。
【0034】上記のように構成された自然言語事例検索
装置の動作を説明する。図1の構成において、入力手段
1で、検索する条件となる言語表現を受け取ると、記号
列抽出手段2に入力を受け渡す。本発明の特徴の一つで
ある記号列抽出手段2の構成は例えば図2のように構成
することができる。
【0035】図2において、入力文字列201は入力手
段1から受け取った文字列、パタン定義202はこれか
ら抽出しようとする文字列に対してあらかじめ定義した
パタン、表現抽出プログラム203は、入力文字列20
1にパタン定義202に従うパタンが含まれているか否
かを解析するプログラムであり、その結果として抽出し
た表現パタン204と残りの文字列205が、記号列抽
出手段2の出力として、次の用語抽出手段4に渡され
る。この種のプログラムは、例えば文献(Wirth,
N著、片山卓也訳「アルゴリズム+データ構造=プログ
ラム」,日本コンピュータ協会発行,1979年)に示
されたような方法で作成することができ、以下、図3〜
図9を用いて説明する。
【0036】図3は、図2のパタン定義202の一実現
例の一般形を示すものである。図3(a)は、パタン定
義の方法を示すものであり、記号「::=」の左辺の記
号を右辺のパタンで定義するとみなす。左辺には非終端
記号と呼ばれる、唯一つの記号を記述することができる
ものとする。右辺には非終端記号(各パタン定義に付け
る記号の名札)または終端記号(具体的な文字に対応す
るパタン)とを記述するものとする。このとき、右辺の
記述方法には、図3(b)、図3(c)、図3(d)に
示す3通りの形式があるものとする。
【0037】図3(b)は、記号「S」が記号「{」と
記号「}」とに囲まれている場合であり、この形式は記
号「S」が0回以上繰り返し出現すると解釈する。図3
(c)は、 記号「S1」、「S2」、... 、「Sn」が
記号「|」に よって区切られている場合であり、この
形式は記号「S1」、「S2」、... 、「Sn」 の何れ
かが出現する(OR)と解釈する。図3(d)は、 記
号「S1」、「S2」、... 、「Sn」が連続して記述さ
れてい る場合であり、この形式は記号「S1」、「S
2」、... 、 「Sn」が順番に出現する(連接)と解釈
する。
【0038】図3のように形式的に定義されたパタン
は、あらかじめ図4に示す構文グラフの形に置き換えて
おくものとする。構文グラフの一つのノードは図4
(a)に示す形で実現することができる。なお図4にお
いて斜線が引いてある欄は、その欄が空(NULL)で
あることを意味する。
【0039】図4(a)においてsym欄401は、ノ
ードが非終端記号に対応する場合にはその文字を格納
し、非終端記号に対応する場合にはその非終端記号を定
義する構文グラフの部分へのポインタを格納する。al
t欄402は図4(c)に示すように図3(c)に対応
するORとなるパタンの構文グラフの部分へのポインタ
を格納する。suc欄403は図4(d)に示すように
連接するパタンの構文グラフの部分へのポインタを格納
するものとする。
【0040】図4(b)は図3(b)の繰り返しを表現
するパタン定義に対応する構文グラフである。繰り返す
パタンの先頭の記号を含むノードのalt欄から、sy
m欄に記号emptyを含むノードを指すように構成す
る。記号emptyを含むノードのalt欄は空(NU
LL)であり、suc欄は繰り返すパタンの2つ目以降
の記号に対応する構文グラフの部分を指すものとする。
【0041】図5は、「(1)」、「(2)」や「3
個」、「1.5V」といったパタンを定義したパタン定
義の記述の例である。ここで、非終端記号は記号「<」
と記号「>」とで挟んで示している。また、<数字>や
<小数点>の定義は省略している。
【0042】図6は、図5に対応する構文グラフであ
り、図3と図4によって説明した、パタン定義と構文グ
ラフの対応の方法によってグラフ表現したものである。
図2の表現抽出プログラム203は、図5で定義された
パタンの抽出を行なうために、図6の構文グラフに添っ
て動作することになる。
【0043】上記のように構成された記号列抽出手段2
の動作を図6の構文グラフと図7と図8のフローチャー
トに沿って詳しく説明する。図7のフローチャートは記
号列抽出手段2の主プログラムの流れを示すものであ
り、この主プログラムは局所変数pHと大域変数iSy
mとを使用する。局所変数pHは図6の構文グラフのノ
ードを指すポインタを格納するための変数であり、大域
変数iSymは現在注目している入力文字列中の文字を
格納するための変数である。
【0044】記号列抽出手段2の主プログラムは、最初
に図7の(step1)で構文グラフのゴール(最終的
に到達すべき非終端記号)となる非終端記号のノード
(図6では601)を主プログラムの局所変数pHに設
定し、(step2)で処理対象の入力文字列の先頭の
文字を大域変数iSymに設定して、(step3)で
図8に示す関数Parseを呼び出す。この時、(st
ep3)において関数Parseの引数として局所変数
pHの値を渡す。
【0045】図8は関数Parseの処理の流れを示す
フローチャートである。関数Parseはパラメータp
Gを持ち、大域変数iSymと局所変数pS、bMat
chを用いる。関数Parseが呼び出されると、呼び
出し時に与えられた引数の値を(step4)でパラメ
ータpGに受け取る。
【0046】ついで、(step5)で局所変数pSに
パラメータpGが指す構文グラフ中の位置を設定し、
(step6)で局所変数pSの指すノードの持つ記号
欄が終端記号であるかどうかを判定する。(step
6)において局所変数が終端記号を指す場合には、(s
tep7)で局所変数pSの指す値が大域変数iSym
の値と一致するかを判定する。(step7)において
局所変数pSの指すノードのsym欄が大域変数iSy
mと同じ文字を持っている場合には、(step8)に
進み、局所変数bMatchに値TRUEを設定し、
(step9)で大域変数iSymに入力文字列中の次
の文字を読み込む。
【0047】(step7)において局所変数pSの指
すノードの文字が大域変数iSymの文字と異なる場合
には、(step10)で局所変数pSの指すノードの
sym欄がemptyであるかを判定し、もしempt
yであれば(step11)で局所変数bMatchに
値TRUEを設定し、さもなければ(step12)で
局所変数bMatchに値FALSEを設定する。
【0048】(step6)において局所変数pSの指
すノードが終端記号でない場合には、(step13)
に進み、局所変数pSの指す非終端記号を引数として関
数Parseを再帰的に呼び出す。呼び出した結果の関
数Parseのリターン値は局所変数bMatchに設
定する。
【0049】(step9)、(step11)、(s
tep12)、(step13)のそれぞれの処理が終
了したら、(step14)で局所変数bMatchの
値がTRUEであるかを判定する。bMatchがTR
UEの時には、(step15)で局所変数pSの指す
ノードのsuc欄をたどり、suc欄の指すノードを局
所変数pSが指すように設定する。(step14)で
局所変数bMatchの値がFALSEの時は、これま
でのパタンの照合が失敗しているので、局所変数pSの
alt欄の指すノードを改めて局所変数pSに設定し直
す。
【0050】(step15)または(step16)
で構文グラフの次のノードをたどる準備ができたら、
(step17)で局所変数pSが指す処理対象のノー
ドが空(NULL)かどうかを判定し、空でなければ
(step6)に戻って構文グラフに添ったパタン抽出
処理を続ける。もし、(step17)で局所変数pS
が空を指していれば、(step18)で局所変数bM
atchの値をリターン値として関数Parseから復
帰する。
【0051】上記のような構成によれば、記号列抽出手
段2は図5に示す形式で定義された仕様に従って作成さ
れた図6に示す形の構文グラフに基づいてパタン照合・
抽出処理を行なうので、図5で与えた仕様を変更するこ
とで所望のパタンを抽出することができる。図5のよう
なパタンの仕様定義を複数個与えて、パタン抽出処理を
複数回実行してもよく、ここで述べた方法は、ある特定
のパタンを持った表現を扱う場合に有効である。
【0052】図9は、前述の方法による記号列抽出手段
2の処理の具体例を示した図であり、入力文字列901
「(1)箱の中の3個の1.5Vの電池を確認する。」
に対して図6に対応する構文グラフをパタン定義902
として表現抽出プログラム903が動作した場合、抽出
パタン904として「(1)」、「3個」、「1.5
V」を取り出し、残りの文字列905として「箱の中の
電池を確認する。」を取り出したことを示している。
【0053】このとき、図6に示す付加プログラム60
2、603、604は、抽出したパタン904の
「(1)」、「3個」、「1.5V」の取り出しや、取
り出した情報のバッファへの格納、あるいは、抽出した
表現に後続する助詞「の」の削除などの動作を行なう。
【0054】記号列抽出手段2の処理が終了すると、次
に用語抽出手段4において記号列抽出手段2から受け取
った、残りの文字列205である言語表現中に用語辞書
管理手段3が保持している用語を抽出する。このとき用
語の抽出方法は公知のキーワード抽出などの方法によ
る。
【0055】事例候補検索手段6では、用語抽出手段4
によって求めた用語の組みと同じものを含む事例データ
を事例ベース管理手段5で管理されている事例データ中
から事例の候補として取り出す。このとき、用語を含む
事例データの検索は公知のテキストデータ管理の方法に
よる。
【0056】次に、事例絞り込み手段7では、事例候補
検索手段6によって求めた事例候補の言語データと入力
の言語表現との類似度を求める。このとき、類似度を求
める方法としては、図10に示すように入力の文字列と
事例候補の文字列とのもっとも長く一致している共通の
部分文字列(最長共通部分列)を求め、文字列全体の長
さにおける最長共通部分列の割合を類似度として求める
ものとする。
【0057】ここで、最長共通部分列(LCS; Longes
t Common Subsequence)とは、与えられた2つの文字列
の両方の文字列に対する部分文字列となっているものの
うち、最長の部分文字列のことであり、その長さは、以
下のようにして求めることができる。いま、文字列 A
= a1a2...am と文字列 B = b1b2...bn の最長共
通部分列を求めることとする。まず文字列 a1a2...a
i と文字列 b1b2...bj の「LCS長さ」を p(i,j)
とおく。このとき、以下の漸化式が成立する。
【0058】
【数1】
【0059】図11の流れ図に従って、最長共通部分列
の長さを求める方法を具体的に説明する。いま、文字列
Aの長さmを変数iMに、文字列Bの長さを変数iNに
設定してあるものとする。ここで、配列p(i,j),
i=0,..,iM,j=0,..,iNを「LCS長
さ表」と呼ぶ。まず、(step1101)でLCS長
さ表の第1行を0クリアし、(step1102)でL
CS長さ表の第1列を0クリアしておく。
【0060】次に、(step1103)で文字バッフ
ァcAに文字列Aの先頭の文字を設定する。(step
1104)でループ・カウンタ変数iに1を設定し、
(step1105)でループ・カウンタ変数iが文字
列Aの長さiMと等しいか小さい時には(step11
06)へ処理を移す。
【0061】(step1106)では、文字バッファ
cBに文字列Bの先頭の文字を設定し、(step11
07)でループ・カウンタ変数jに1を設定する。(s
tep1108)でループ・カウンタ変数jが文字列B
の長さiNと等しいか小さい時には(step110
9)へ処理を移す。
【0062】続いて、(step1109)で文字cA
と文字cBとが等しいかどうかを判定し、等しい場合に
は(step1110)でp(i,j) に p(i-1,j-1)+1
を設定する。(step1109)で文字cAと文字c
Bとが等しくない場合は、(step1111)でp
(i,j) にはp(i,j-1)とp(i-1,j)との大きい方の値を設
定する。
【0063】(step1110)あるいは(step
1111)でLCS長さ表の現在位置の値p(i,j)の設
定が終わると、(step1112)で文字バッファc
Bに文字列Bの次の文字を設定する。(step111
3)では、ループ・カウンタ変数jを1増やし、(st
ep1108)に戻る。
【0064】(step1108)でループ・カウンタ
変数jが文字列Bの長さiNより大きくなった時には
(step1114)へ処理を移す。(step111
4)で文字バッファcAに文字列Aの次の文字を設定
し、(step1115)でループ・カウンタ変数iを
1増やして、(step1108)に戻る。
【0065】(step1105)でループ・カウンタ
変数iが文字列Aの長さiMより大きくなった時には
(step1116)へ処理を移す。(step111
6)では、LCS長さ表のp(iN,iM)の位置に求
まった値を文字列Aと文字列Bとの最長共通部分列の長
さとして変数iLCSに設定する。こうして求めた最長
共通部分列の長さをもとの文字列Aまたは文字列Bの長
さで割り算して類似度として用いることとする。
【0066】関連情報推論手段8では、事例絞り込み手
段7で最も入力に類似していると判定された事例を選択
事例として、その事例について関連情報を求める。図1
2に事例データの一構成例を示す。この事例データは設
計情報を事例として事例ベース管理手段5に蓄積した場
合の事例の構成例であり、各項目は事例番号1201と
事例文1202と関連部品情報1203と機械処理コー
ド1204と参照図面情報1205の欄から構成されて
いるものとする。
【0067】今、例えば、入力手段1に「ケース寸法
(特殊寸法50mm)」という入力があったとき、前述
の事例候補絞り込み手段7までの処理で、図12の事例
番号0100を持つ事例が選択されると、関連情報推論
手段8では、事例文中に含まれる記号「@1」に入力文
中にある表現「50」が対応するものと判断し、機械処
理コードとして「CODE=000050」を生成す
る。
【0068】なお、上記の実施の形態では、パタン定義
202に図3に示す方法を用い、これを図4に示す構文
グラフに置き換えたものに対して、パタン抽出プログラ
ム203が動作する方法を例示しているが、パタン定義
方法は別の表現手段によっても良い。
【0069】解析内容表示手段9は、上述の一連の処理
において、事例の候補や推論された結果等を利用者に表
示し、利用者が必要と判断した時には、処理に介入でき
る役割を果たす。
【0070】図13は、この発明の実施の形態1にかか
るデータの流れを請求項1を構成する各手段に関連付け
て示したものである。図13において、1301は入力
文の例、1302は記号列抽出手段2によって記号列が
抽出された後の残りの文字列、1311は用語辞書管理
手段3が管理する用語辞書、1303は記号列抽出手段
2によって抽出された記号列、1304は用語抽出手段
4によって抽出された用語索引である。
【0071】1312は事例ベース管理手段6によって
管理されている事例ベースであり、図12に例示したよ
うな内容を含む。1305は事例候補検出手段5によっ
て事例ベース1312から取り出された、用語索引13
04を含む事例候補、1306は事例絞り込み手段7に
よって入力にもっとも類似しているとして選択された事
例である。
【0072】1307は関連情報推論手段8によって解
析内容表示手段9に表示すべきとされた文、1008は
記号列抽出手段2によって抽出された記号列と事例に付
加された情報とから関連情報推論手段8で推定された内
容の例、1309は関連情報推論手段8で生成されたコ
ード情報の例である。また、1310は解析内容表示手
段9の表示の例である。
【0073】図13では、まず、入力として文1301
「本体(寸法50mm)の中に3個の1.5Vの電池を
取り付けよ。」が入力手段1で入力されると、入力手段
1はその文字列を記号列抽出手段2に送る。記号列抽出
手段2は、図5に例示したパタンが定義してあるとき、
入力文1301から記号列1303を抽出し、その抽出
した記号列1303と残りの文字列1302とを用語抽
出手段4に受け渡す。用語抽出手段4では、用語辞書管
理手段3を通じて用語辞書1311を検索し、文字列1
302「本体(寸法50mm)の中に電池を取り付け
よ。」から、事例の用語索引1304となる「本体」、
「電池」という文字列を取り出し、この用語索引130
4と文字列1302および記号列1303を事例候補検
索手段6へ受け渡す。
【0074】次に、事例候補検索手段6では、事例ベー
ス管理手段5を通じて事例ベース1312から、用語索
引1304「本体」、「電池」を含む事例を事例候補1
305として取り出し、事例絞り込み手段7へ文字列1
302および記号列1303と事例候補1305を受け
渡す。
【0075】事例絞り込み手段7では、図10および図
11の流れ図を用いて説明した方法によって、文字列1
302に最も類似した事例1306を事例候補1305
の中から選択する。図13の例では、事例番号0009
を持つ事例が選択されたことを示している。事例絞り込
み手段7からは、文字列1302および記号列1303
と選択事例1306が関連情報推論手段8へ受け渡され
る。
【0076】関連情報推論手段8では、文字列1302
および記号列1303と選択事例1306に付加された
情報とで、例えば記号列1303の「3個」、「1.5
V」と選択事例1306の関連情報「個数[個],電圧
[V]」とから、解析情報1308「個数:3個」、「電
圧:1.5V」という情報を導き、事例文「本体(寸法
@mm)に電池を取付けよ」とその関連情報「CODE
=A0@」、関連情報「部品1」と文字列1302「本
体(寸法@mm)に電池を取り付けよ」から解析情報1
309「部品1 CODE=A050」や、括弧内の文
字列を取り除いた文字列1307「本体に電池を取り付
けよ。」を生成する。関連情報推論手段8は、ここで求
めた文字列1307や解析情報1308、1309を解
析内容表示手段9に受け渡す。解析内容表示手段9で
は、例えば1310に示すように解析情報を表示する。
【0077】実施の形態2 図14は実施の形態2を示す構成図であり、図に実施の
形態1と同様又は相当する部分については同一符合を付
しその説明を省略する。
【0078】図14において、10は箇条書き等の論理
構造を持つ言語表現の入力を補助する構造入力補助手段
であり、11は箇条書き等の論理構造を持つ事例に対し
て事例候補の絞り込みを可能にする構造化事例絞り込み
補助手段である。
【0079】上記のように構成された自然言語事例検索
装置の動作を図15と図16、図17の流れ図によって
説明する。実施の形態2は、図15において、入力手段
1で箇条書きを入力する必要があった場合に、図14の
構造入力補助手段10に対応するものとして、図15の
キーボード1500にある機能キー1501や機能キー
1502を使用する。
【0080】機能キー1501や機能キー1502の押
し下げによってインデント1522が入力画面上でガイ
ド表示され、そのガイド表示に従って箇条書きのリード
部分や箇条書き項目を入力していくことができる。
【0081】図16の流れ図でキー入力があり、まず
(step1601)で機能キー1501の押し下げと
判断されると、(step1602)でインデントが深
くなっていくものとし、さもなければ(step160
3)で機能キー1502の押し下げであると判断される
と、(step1604)でインデントが浅くなっていく
ものとする。その他のキー入力の場合には(step1
605)で通常の文字の入力であるとみなして処理を行
なう。
【0082】図16の手順で入力された文字列の入力画
面上に表示1521されている文字列は、対応する内部
データの形式1530に変換される。ここで記号「<」
と記号「>」とで囲まれたものを「タグ」と呼ぶ。図1
5において、タグ1531とタグ1534とは、箇条書
きであることを表わし、タグ1532は箇条書きのリー
ド部分であることを表わし、また、タグ1533は箇条
書きの箇条項目であることを表わしており、残りの部分
が入力内容の文字列に対応する。
【0083】図14の事例ベース管理手段5において
も、図15の内部構造1530と同様な形式で事例デー
タが格納されているものとする。このとき、図14の構
造化事例絞り込み手段11では、まず、図17の(st
ep1701)でタグ1531「<UL>」とタグ15
34「</UL>」とによって箇条書きの範囲を識別す
る。
【0084】次に、(step1702)において、タ
グ1532「<LH>」を調べることにより、箇条書き
のリード部が存在するかどうかを判定する。(step
1702)で、箇条書きのリード部1511があるとき
には、(step1703)で、実施の形態1において
図10および流れ図11に示したと同様な方法で入力と
事例の箇条書きのリード部同士の類似度を求め、(st
ep1704)の処理を行なう。
【0085】一方、(step1702)で箇条書きの
リード部が無いときには、すぐに(step1704)
の処理を行なう。(step1704)では、最初の箇
条項目を注目項目として設定する。
【0086】次に(step1706)で注目箇条項目
1512によって同様に実施の形態1で図10および流
れ図11に示した方法で類似度を求め、(step17
07)で類似度を累積(例えば加算)していく。さらに
(step1708)で次の箇条項目を注目項目に設定
し、(step1705)からの処理を繰り返し、後続
の箇条項目の類似度を求める。(step1705)で
後続の箇条項目がなくなったら、箇条書き項目を持つ一
つの事例に関する類似度を求める計算が終了する。
【0087】なお、上記の実施の形態では、タグの表現
方法があたかも固定的であるかのように図15に例示し
たが、例えば文献(JIS規格 文書記述言語SGML
JIS X 4151、1992年、日本規格協会)
に示されるように文書構造として定義し直しが可能なタ
グであっても良い。
【0088】上記のような構成によれば、構造入力補助
手段10によって箇条書き等の構造を持つ複雑な言語表
現の入力が容易になり、構造化事例絞り込み手段11に
よって構造を持った事例データの絞り込みが可能になる
ため、技術文章のように複雑な内容を持つ事例の検索を
行なう場合に有効である。
【0089】図18は、この発明の実施の形態2にかか
るデータの流れを、構成する手段に関連付けて示したも
のである。図18において、1530は入力である構造
を持つ文の例、1311は用語辞書管理手段が管理する
用語辞書である。1801は用語抽出手段3によって抽
出された用語索引である。
【0090】1312は事例ベース管理手段6によって
管理されている事例ベースであり、図12に例示したよ
うな内容を含む。1802は事例候補検出手段5によっ
て事例ベース1312から取り出された、用語索引18
01を含む事例候補、1803は事例絞り込み手段7に
よって入力にもっとも類似しているとして選択された事
例である。また、1804は関連情報推論手段8によっ
て解析内容表示手段9に表示すべきとした内容の例であ
る。
【0091】図18では、まず、入力として構造を持つ
文1530が構造入力補助手段10で入力されると、構
造入力補助手段10は入力手段1にその文字列を渡し、
入力手段1はその文字列を記号列抽出手段2に送る。記
号列抽出手段2は、予め設定されたパタンが定義に従っ
て、入力の文字列1530から記号列を抽出するが、こ
の例では特に抽出された記号列はなかったとして以下説
明を行なう。このとき、文字列1530はそのまま用語
抽出手段3に受け渡される。
【0092】用語抽出手段3では、用語辞書管理手段4
を通じて用語辞書1311を使用し、文字列1530か
ら、事例の用語索引1801となる文字列を取り出す。
ここで、用語辞書1311に用語の表記の置き換えが定
義してあれば、例えば「パソコン」を「PC」と置き換
える処理も行われる。この用語索引1801と文字列1
530を事例候補検索手段5へ受け渡す。
【0093】次に、事例候補検索手段6では、事例ベー
ス管理手段5を通じて事例ベース1312から、用語索
引1801を含む事例を事例候補1802として取り出
し、事例絞り込み手段7へ文字列1530および事例候
補1802を受け渡す。
【0094】事例絞り込み手段7では、上記図15およ
び図17の流れ図を用いて説明した方法によって、文字
列1530に最も類似した事例1803を事例候補18
02の中から選択する。ここでは、事例候補1802の
詳細な例示は省略したが、事例候補1802の各事例は
選択事例1803と同様な事例から構成されている。事
例絞り込み手段7からは、文字列1530と選択事例1
803が関連情報推論手段8へ受け渡される。
【0095】関連情報推論手段8では、選択事例180
3に関連情報1804「マニュアルp.38」、「関連
図面F48」を付加して、解析内容表示手段9に受け渡
し、解析内容表示手段9では、この関連情報を表示す
る。
【0096】実施の形態3 図19は実施の形態3を示す構成図であり、図に実施の
形態1と同様又は相当する部分については同一符合を付
しその説明を省略する。図19において、12は新規事
例登録手段である。また、図20は事例候補検索手段6
の処理の流れ図の例、図21は事例候補絞り込み手段7
の処理の流れ図の例、図22は新規事例登録手段12の
処理の流れ図の例である。更に、図23と図24は実施
の形態3におけるデータの流れを示す図である。
【0097】上記のように構成された自然言語事例ベー
ス検索装置の動作を図19の構成図および図20、図2
1、図22の流れ図に沿って説明する。実施の形態3
は、図19の構成図において、実施の形態1と同様に、
入力手段1で検索する条件となる言語表現を受け取る
と、記号列抽出手段2に入力を受け渡す。次に、記号列
抽出手段2は、入力手段1から受け取った文字列からあ
らかじめ定義したパタンに沿って表現抽出プログラムを
動作させて、抽出した記号表現パタンと残りの文字列を
用語抽出手段4に渡す。
【0098】次に、用語抽出手段4において記号列抽出
手段2から受け取った言語表現中に用語辞書管理手段3
が保持している用語を抽出し、その用語を前記抽出記号
表現パタンと前記残り文字列とともに事例候補検索手段
6へ渡す。
【0099】事例候補検索手段6では、図20の(st
ep2001)において、用語抽出手段4によって求め
た用語の組みと同じ用語を含む事例データを、事例ベー
ス管理手段5で管理されている事例データ中から事例の
候補として取り出す。このとき、(step2002)
で用語抽出手段4によって入力から抽出した用語を含む
事例データが事例候補として存在しなかった場合には、
(step2004)で用語抽出新規事例登録手段12
に処理を移す。また、(step2002)で事例候補
が得られている場合には、(step2003)に進
み、事例絞り込み手段7へと処理を移す。
【0100】図21によって、事例絞り込み手段7の動
作を説明する。まず、事例候補検索手段6で幾つかの事
例候補が見つかった場合には、事例絞り込み手段7の
(step2101)で、その事例候補の言語データと
入力の言語表現との類似度を求める。このとき、(st
ep2102)で、すべての事例候補の類似度が予め設
定しておいた境界値より低く、適用する事例としてはふ
さわしくない場合には、(step2104)で新規事
例登録手段12に処理を移す。
【0101】図21の(step2102)で境界値を
越える事例を得た場合には、(step2103)にお
いて最も類似度の高い事例を選択し、関連情報推論手段
8へ処理を進める。
【0102】図22によって、新規事例登録手段12の
動作を説明する。新規事例登録手段12では、まず、
(step2201)で、どの手段から呼ばれたかを判
断し、事例候補検索手段6から呼ばれた場合には、(s
tep2202)で、用語抽出手段4が入力文から抽出
した用語が索引として十分であるかユーザに確認させ
る。用語が十分でないとユーザが判断した場合には、
(step2204)で用語辞書管理手段3にユーザが
現在の入力の言語表現のために必要な用語を追加する。
【0103】(step2203)で、用語抽出手段4
が抽出した用語が十分である場合や(step220
4)の用語登録が終了すると(step2205)へ処
理を進める。
【0104】一方、(step2201)で、新規事例
登録手段12が事例絞り込み手段7から呼ばれたと判断
された場合には、すぐに(step2205)へ進む。
(step2205)では、ユーザが入力の言語表現に
対して関連する情報を設定し、事例ベース管理手段5に
図12に示したような形式で入力と関連情報の組みを登
録する。事例ベースへの登録は通常の公知の技術を用い
て行なうものとする。なお、関連情報推論手段8と解析
内容表示手段9の動作は実施の形態1と同様とする。
【0105】上記のような構成によれば、事例候補検索
手段6と事例候補絞り込み手段7の両方で、事例の候補
が得られなかったり、検索した事例の候補が不適切と判
断された場合に、入力の言語表現を新規の事例として容
易に登録することができる。
【0106】図23は、この発明の実施の形態3におい
て事例候補検索手段6から新規事例登録手段12の処理
を行なう場合のデータの流れを、請求項3を構成する各
手段に関連付けて示したものである。図23において2
301は入力文の例、2303は記号列抽出手段2によ
って抽出された記号列、2302は記号列抽出手段2に
よって記号列が抽出された後の残りの文字列、2304
は用語抽出手段3によって抽出された用語索引、131
1は用語辞書管理手段3が管理する用語辞書である。
【0107】1312は事例ベース管理手段5によって
管理されている事例ベースであり、図12に例示したよ
うな内容を含む。また、2305は利用者が新規事例登
録に際して事例データに付加した関連情報の例、230
6は利用者が新たに追加した用語の例である。
【0108】図23では、まず、入力として文2301
「制御盤に群管理装置VZ−1を取付ける。」が入力さ
れると、入力手段1はその文2301の文字列を記号列
抽出手段2に送る。記号列抽出手段2は、予め設定され
たパタン定義に従って、入力の文字列2301から記号
列2303を抽出し、その抽出した記号列2303と残
りの文字列2302とを用語抽出手段4に受け渡す。
【0109】用語抽出手段4では、用語辞書管理手段3
を通じて用語辞書1311を検索し、文字列2302
「制御盤に群管理装置を取り付ける。」から、事例の用
語索引2304となる「制御盤」という文字列を取り出
し、この用語索引2304と文字列2302および記号
列2303を事例候補検索手段6へ受け渡す。
【0110】次に、事例候補検索手段6では、図20の
(step2001)に示したように、事例ベース管理
手段6を通じて事例ベース1312から、用語索引23
04「制御盤」を含む事例を事例候補として取り出そう
と試みる。しかし、用語索引2304「制御盤」を含む
事例が得られなかったと図20の(step2002)
で判断された時には、(step2003)に示すよう
に、(step2004)の新規事例登録手段12へ処
理を移し、図23に示すように文字列2302と用語索
引2304とおよび記号列2303を新規事例登録手段
12へ受け渡す。
【0111】新規事例登録手段12では、前記図22の
流れ図を用いて説明したように、まず図22の(ste
p2201)で事例候補検索手段6から処理が移ってき
た場合には、(step2202)で用語抽出手段4で
抽出した用語が十分であるか、否かをユーザに確認を促
し、(step2203)でユーザが十分ではないとし
た場合には、(step2204)で、この例の場合に
は、新たな用語2306として「群管理装置」という文
字列を用語辞書管理手段3に追加する。続いて、(st
ep2205)で、文字列2302を新たな事例文とし
て、その文字列に関連した情報を事例ベース1312に
追加するが、このとき、ユーザは記号列抽出手段2で抽
出した記号列2303である「VZ−1」を参照して、
関連情報として「VZ−@」という一般的な情報を追加
することができる。これは、本発明の請求項3の構成に
おいて、記号列抽出手段2と新規事例登録手段12とを
同時に備えていることの利点の一つである。
【0112】図24は、この発明の実施の形態3におい
て事例絞り込み手段7から新規事例登録手段12の処理
を行なう場合のデータの流れを、請求項3を構成する各
手段に関連付けて示したものである。図24において、
2401は入力文の例、1311は用語辞書管理手段3
が管理する用語辞書、2402は記号列抽出手段2によ
って記号列が抽出された後の残りの文字列、2403は
記号列抽出手段2によって抽出された記号列、2404
は用語抽出手段3によって抽出された用語索引である。
【0113】1312は事例ベース管理手段5によって
管理されている事例ベースであり、図12に例示したよ
うな内容を含む。また、2405は事例ベース1312
から事例候補として検索された事例の例、2406は利
用者が新規事例登録12に際して事例データに付加する
関連情報の例である。
【0114】図24では、まず、入力として文2401
「制御盤に群管理装置VZ−1を取付ける。」が入力さ
れると、入力手段1は上記入力文2401の文字列を記
号列抽出手段2に送る。記号列抽出手段2は、予め設定
されたパタン定義に従って、入力の文字列2401から
記号列2403を抽出し、その抽出した記号列2403
「VZ−1」と残りの文字列2402「制御盤に群管理
装置を取付ける。」とを用語抽出手段4に受け渡す。用
語抽出手段4では、用語辞書管理手段3を通じて用語辞
書1311を検索し、文字列2402「制御盤に群管理
装置を取り付ける。」から、事例の用語索引2404と
なる「制御盤」、「群制御装置」という文字列を取り出
し、この用語索引2404と文字列2402および記号
列2403を事例候補検索手段6へ受け渡す。
【0115】次に、事例候補検索手段6では、事例ベー
ス管理手段5を通じて事例ベース1312から、用語索
引2403「制御盤」、「群制御装置」を含む事例を事
例候補2405として取り出す。
【0116】続いて、事例絞り込み手段7では、図21
の流れ図で説明したように、(step2101)で入
力の言語表現、ここでは文字列2402と事例候補24
05の各事例との類似度を求める。このとき、事例候補
2405の各事例と文字列2402とが大きく異なる場
合には、(step2102)で類似度が予め設定して
おいた境界値を越えず、(step2104)で新規事
例登録手段12へ処理を移すことになる。
【0117】新規事例登録手段12では、上記図22の
流れ図を用いて説明したように、まず図22(step
2201)で事例絞り込み手段7から処理が移ってきた
場合には、(step2205)で、文字列2402を
新たな事例文として、その文字列に関連した情報を事例
ベース1312に追加するが、このとき、ユーザは記号
列抽出手段2で抽出した記号列2403である「VZ−
1」を参照して、関連情報として「VZ−@」という一
般的な情報を追加することができる。これは、本発明の
請求項3の構成において、記号列抽出手段2と新規事例
登録手段12とを同時に備えていることの利点の一つで
ある。
【0118】実施の形態4.図25は実施の形態4を示
す構成図であり、図に実施の形態1と同様又は相当する
部分については同一符合を付しその説明を省略する。図
25において、2は記号列抽出手段、9は解析内容表示
手段、13は付加情報参照手段である。また、図26は
付加情報参照手段の動作を示す流れ図であり、図27は
実施の形態4におけるデータの流れを示す例図である。
【0119】以下、図25と図26の流れ図によってこ
の実施の形態の動作を説明する。まず、図25の記号列
抽出手段2では、あらかじめ入力文中に含まれる参照表
現(「図XXX参照」等)をパタンとして定義してお
き、これらの参照表現が入力の言語表現中に含まれる場
合に抽出する。その他の動作は実施の形態1で述べたも
のと同様とし、ここで抽出した情報を付加情報参照手段
13まで受け渡す。
【0120】付加情報参照手段13では、図26の(s
tep2601)で入力文から抽出した記号列があるか
どうかを判定し、何もなければ処理を終了する。(st
ep2601)で入力文から抽出した記号列がある場合
には、(step2602)で入力文中に図面等の参照
表現、例えば「図A−128参照」という表現が含まれ
ているかを判定する。(step2602)で、もし入
力文中から抽出した記号列に参照表現が含まれていなけ
れば処理を終了する。(step2602)で入力文中
から抽出した記号列に参照表現が含まれていれば、(s
tep2603)で、図面のデータベースを参照して、
このデータベースから前記「図A−128」に対応する
図面を取り出す。図面のデータベースから「図A−12
8」に対応する図面を取り出したら、解析内容表示手段
9にその図面を表示する。
【0121】例えば、図12に示した事例ベースの例の
場合には、「筐体設計図面(図A−128)を送付せ
よ」という入力に対して、参照図面1205として「図
A−128」という番号が取り出され、「筐体設計図
面」を格納したデータベースから「図A−128」に対
応する図面が自動的に取り出され、解析内容表示手段9
にその図面が表示されることになる。
【0122】上記のような構成によれば、記号列抽出手
段2と付加情報参照手段13を同時に備えているため
に、特別に外部的な情報の関連付け手段を持たなくて
も、「図XXX参照」等の入力文中に含まれる参照表現
によって他のデータベース等に含まれる情報を参照する
機能が提供されるので、入力の言語表現中に含まれる情
報を有効に活用することができる。
【0123】図27は、本発明の実施の形態4にかかる
データの流れを請求項4を構成する各手段に関連付けて
示したものである。図27において、2701は入力文
の例、2703は記号列抽出手段2によって抽出された
記号列、2702は記号列抽出手段2によって記号列が
抽出された後の残りの文字列、1311は用語辞書管理
手段3が管理する用語辞書、2704は用語抽出手段3
によって抽出された用語索引である。
【0124】1312は事例ベース管理手段5によって
管理されている事例ベースであり、図12に例示したよ
うな内容を含む。2705は事例候補検出手段5によっ
て事例ベース1312から取り出された、用語索引27
04を含む事例候補であり、2706は事例絞り込み手
段7によって入力にもっとも類似しているとして事例候
補2705から選択された事例である。
【0125】2707は図面情報を格納した外部データ
ベース、2708は記号列抽出手段2によって抽出され
た記号列2703と事例に付加された情報とから関連情
報推論手段8で推定された内容の例、2709は付加情
報参照手段9で外部の図面データベース2707から取
り出された図面の実体を示している。
【0126】図27では、まず、入力として文2701
「筐体設計図面(図A−128)を送付せよ。」が入力
手段1で入力されると、入力手段1はその文字列270
1を記号列抽出手段2に送る。記号列抽出手段2は、予
め設定したパタン定義に従って入力文2701から記号
列2703「図面A−128」を抽出し、その抽出した
記号列2703と残りの文字列2702「筐体設計図面
□を送付せよ。」とを用語抽出手段4に受け渡す。ここ
で、記号「□」は、抽出した記号列2703があった位
置を示す記号である。用語抽出手段4では、用語辞書管
理手段3を通じて用語辞書1311を検索し、文字列2
702「筐体設計図面□を送付せよ。」から、事例の用
語索引2704となる「筐体」、「設計」という文字列
を取り出し、この用語索引2704と文字列2702お
よび記号列2703を事例候補検索手段6へ受け渡す。
【0127】次に、事例候補検索手段6では、事例ベー
ス管理手段5を通じて事例ベース1312から、用語索
引2704「筐体」、「設計」を含む事例を事例候補2
705として取り出し、事例絞り込み手段7へ文字列2
702および記号列2703と事例候補2705を受け
渡す。
【0128】事例絞り込み手段7では、図10および図
11の流れ図を用いて説明した方法によって、文字列2
702に最も類似した事例2706を事例候補2705
の中から選択する。図27の例では、事例番号0006
を持つ事例が選択されたことを示している。事例絞り込
み手段7からは、文字列2702および記号列2703
と選択事例2706が関連情報推論手段8へ受け渡され
る。
【0129】関連情報推論手段8では、文字列2702
および記号列2703と選択事例2706に付加された
情報とで、関連情報2708「部品1,部品2」を得
る。この関連情報2708や記号列2703は解析内容
表示手段9に表示されるが、同時に記号列2703が図
面参照情報として、付加情報参照手段13に受け渡さ
れ、付加情報参照手段13は外部データベース2707
から記号列2703の図面番号「図A−128」を持つ
図面の実体2709を取り出して、情報解析内容表示手
段9に自動的に表示する。これは、記号列抽出手段2で
抽出した記号列2703が、選択事例2706の関連情
報と関係付けられて付加情報参照手段13で利用された
ことを例示している。
【0130】
【発明の効果】本発明は、以上に説明したように構成さ
れているので、以下に記載されるような効果が得られ
る。
【0131】請求項1及び請求項5に記載の発明によれ
ば、入力の言語表現中に記号表現や数量表現等を含む場
合にも適切な事例を検索できるため、その結果として、
自然言語を対象とする情報検索装置や方法において、技
術文章のように複雑な表現を含む過去の言語事例の再利
用性が増したり、これらを設計支援用途に活用したりす
ることで自動処理の可能性が向上するという効果が得ら
れる。
【0132】請求項2及び請求項6に記載の発明によれ
ば、箇条書き等の論理構造を持つ言語表現の入力補助を
可能とし、かつ、箇条書き等の論理構造を持つ事例に対
して事例候補の絞り込みが可能であるから複雑な構造を
持つ言語表現の事例や入力に対しても事例検索を可能と
するという効果がある。
【0133】請求項3及び請求項7に記載の発明によれ
ば、新規事例の登録を可能とすることにより、事例候補
検索手段や事例絞り込み手段で入力に対する所望の事例
が得られないとき、効率良く新たな事例や用語の登録が
できるという効果がある。
【0134】請求項4及び請求項8に記載の発明によれ
ば、付加情報を参照可能とすることにより、入力の言語
表現中に含まれる図面参照等の参照表現によって他のデ
ータベース等の参照が容易になるという効果がある。
【図面の簡単な説明】
【図1】 本発明の実施の形態1の自然言語事例検索装
置の構成を示す図である。
【図2】 本発明の実施の形態1の記号列抽出手段の構
成を示す図である。
【図3】 本発明の実施の形態1の記号列抽出手段のパ
タン定義の方法を示す図である。
【図4】 本発明の実施の形態1の記号列抽出手段のパ
タン定義の内部構造を示す図である。
【図5】 本発明の実施の形態1の記号列抽出手段のパ
タン定義の具体的な一例を示す図である。
【図6】 本発明の実施の形態1の記号列抽出手段のパ
タン定義の例である図5に対応する内部構造の例を示す
図である。
【図7】 本発明の実施の形態1における記号列抽出手
段の主プログラムの動作を示す流れ図である。
【図8】 本発明の実施の形態1における記号列抽出手
段で用いる関数Parseの動作を示す流れ図である。
【図9】 本発明の実施の形態1における記号列抽出手
段の処理の一例を示す図である。
【図10】 本発明の実施の形態1における絞り込み手
段において類似度を求める方法の例を示す図である。
【図11】 本発明の実施の形態1における2つの文字
列の間の最長共通部分列を求めるための動作を示す流れ
図である。
【図12】 本発明の実施の形態1における事例ベース
管理手段において管理される事例ベースの構成の例を示
す図である。
【図13】 本発明の実施の形態1におけるデータの流
れの例を示す図である。
【図14】 本発明の実施の形態2の自然言語事例検索
装置の構成を示す図である。
【図15】 本発明の実施の形態2の構造を持つ言語デ
ータの入力方法およびその内部構造の例を示す図であ
る。
【図16】 本発明の実施の形態2の構造入力補助手段
の動作を示す流れ図である。
【図17】 本発明の実施の形態2の構造化事例絞り込
み補助手段の動作を示す流れ図である。
【図18】 本発明の実施の形態2のデータの流れを示
す例図である。
【図19】 本発明の実施の形態3の構成例を示す図で
ある。
【図20】 本発明の実施の形態3の事例絞り込み手段
を示す図である。
【図21】 本発明の実施の形態3の事例絞り込み手段
の動作流れを示す図である。
【図22】 本発明の実施の形態3の新規事例登録手段
の動作流れを示す図である。
【図23】 本発明の実施の形態3のデータの流れを示
す例図である。
【図24】 本発明の実施の形態3のデータの流れを示
す例図である。
【図25】 本発明の実施の形態4の付加情報参照手段
の構成を示す図である。
【図26】 本発明の実施の形態4の付加情報参照手段
の動作を示す流れ図である。
【図27】 本発明の実施の形態4のデータの流れを示
す例図である。
【図28】 従来の自然言語事例検索方式の構成例を示
す図である。
【図29】 従来の自然言語事例検索方式のウィンドウ
画面の例を示す図である。
【図30】 従来の数量/時間表現解析方式の構成例を
示す図である。
【図31】 従来の未登録語獲得方式の構成例を示す図
である。
【符号の説明】
1:入力手段 2:記号
列抽出手段 3:用語辞書管理手段 4:用語
抽出手段 5:事例ベース管理手段 6:事例
候補検索手段 7:事例絞り込み手段 8:関連
情報推論手段 9:解析内容表示手段 10:構造
入力補助手段 11:構造化事例絞り込み補助手段 12:新規
事例登録手段 13:付加情報参照手段 902 数量・記号パタン定義 903 表現抽
出プログラム 1202 事例文 1430 構造
化事例の内部形式

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 言語表現を入力する入力手段と、この入
    力手段により入力された言語表現中に含まれる記号表現
    や数量表現等の記号列を抽出する記号列抽出手段と、上
    記入力手段により入力された言語表現からの用語抽出に
    必要な辞書データを検索・管理する用語辞書管理手段
    と、上記記号列抽出手段から記号列と言語表現を受け取
    り、受け取った言語表現からこの用語辞書管理手段を用
    いて事例検索のキーとなる用語を抽出する用語抽出手段
    と、予め蓄積された言語表現とその関連情報との対から
    なる事例データを検索・管理する事例ベース管理手段
    と、上記用語抽出手段により抽出された用語をキーとし
    てこの事例ベース管理手段によって管理された事例ベー
    スから処理対象となる事例の候補を取り出す事例候補検
    索手段と、この事例候補検索手段により取り出された事
    例候補の中から入力された言語表現に類似した事例を絞
    りこむための事例絞り込み手段と、この事例絞り込み手
    段により絞り込まれた事例のなかから入力された言語表
    現の内容に応じて関連する情報を推論する関連情報推論
    手段と、少なくとも事例候補検索手段または上記事例絞
    り込み手段によって取り出された事例とこの関連情報推
    論手段の推論結果を表示する解析内容表示手段とを備え
    たことを特徴とする自然言語事例検索装置。
  2. 【請求項2】 箇条書き等の論理構造を持つ言語表現の
    入力を補助する構造入力補助手段と、上記論理構造を持
    つ事例に対して事例候補の絞り込みが可能である構造化
    事例絞り込み補助手段を備えたことを特徴とする請求項
    1記載の自然言語事例検索装置。
  3. 【請求項3】 事例候補検索手段または事例絞り込み手
    段で入力の言語表現に対する所望の事例が得られないと
    き、事例を新規に登録する登録手段を備えたことを特徴
    とする請求項1記載の自然言語事例検索装置。
  4. 【請求項4】 入力文中に含まれる参照表現によって外
    部のデータベースに含まれる情報を参照する機能を有す
    る付加情報参照手段を備えたことを特徴とする請求項1
    記載の自然言語事例検索装置。
  5. 【請求項5】 言語表現を入力手段から入力する入力ス
    テップと、このステップで入力された言語表現中に含ま
    れる記号表現や数量表現等の記号列を抽出する記号列抽
    出ステップと、この記号列抽出ステップで処理後の言語
    表現を受け取り、入力された言語表現からの用語抽出に
    必要な事例検索のキーとなる用語を収録した用語辞書を
    用いて受け取った言語表現から事例検索のキーとなる用
    語を抽出する用語抽出ステップと、この用語抽出ステッ
    プにより抽出された用語をキーとして予め蓄積された言
    語表現とその関連情報との対からなる事例データから処
    理対象となる事例の候補を取り出す事例候補検索ステッ
    プと、この事例候補検索ステップにより取り出された事
    例候補の中から入力された言語表現に類似した事例を絞
    りこむための事例絞り込みステップと、この事例絞り込
    みステップにより絞り込まれた事例のなかから入力され
    た言語表現の内容に応じて関連する情報を推論する関連
    情報推論ステップと、少なくとも事例候補検索ステップ
    または上記事例絞り込みステップによって取り出された
    事例とこの関連情報推論ステップの推論結果を表示する
    解析内容表示ステップとを備えたことを特徴とする自然
    言語事例検索方法。
  6. 【請求項6】 上記入力ステップは、箇条書き等の論理
    構造を持つ言語表現の入力を補助する構造入力補助ステ
    ップを備え、上記事例絞り込みステップは、上記論理構
    造を持つ事例に対して事例候補の絞り込みをする構造化
    事例絞り込み補助ステップを備えたことを特徴とする請
    求項5記載の自然言語事例検索方法。
  7. 【請求項7】 上記事例候補検索ステップまたは上記事
    例絞り込みステップで入力の言語表現に対する所望の事
    例が得られないとき、入力された言語表現と関連情報の
    対を新たな事例として新規に登録する登録ステップを備
    えたことを特徴とする請求項5記載の自然言語事例検索
    方法。
  8. 【請求項8】 入力文中に含まれる参照表現によって外
    部のデータベースに含まれる情報を参照する機能を有す
    る付加情報参照ステップを上記解析内容表示ステップの
    前または後に備えたことを特徴とする請求項5記載の自
    然言語事例検索方法。
JP04757396A 1996-03-05 1996-03-05 自然言語事例検索装置及び自然言語事例検索方法 Expired - Fee Related JP3780556B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04757396A JP3780556B2 (ja) 1996-03-05 1996-03-05 自然言語事例検索装置及び自然言語事例検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04757396A JP3780556B2 (ja) 1996-03-05 1996-03-05 自然言語事例検索装置及び自然言語事例検索方法

Publications (2)

Publication Number Publication Date
JPH09245051A true JPH09245051A (ja) 1997-09-19
JP3780556B2 JP3780556B2 (ja) 2006-05-31

Family

ID=12778993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04757396A Expired - Fee Related JP3780556B2 (ja) 1996-03-05 1996-03-05 自然言語事例検索装置及び自然言語事例検索方法

Country Status (1)

Country Link
JP (1) JP3780556B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001084381A (ja) * 1999-08-30 2001-03-30 Mitsubishi Electric Inf Technol Center America Inc マルチメディア・コンテンツの表現を生成する方法
JP2002063185A (ja) * 2000-08-22 2002-02-28 Hitachi Software Eng Co Ltd 類似知識抽出システム
JP2013506894A (ja) * 2009-10-01 2013-02-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 非構造化情報のインテリジェント・イベント・ベース・データ・マイニング
WO2017138057A1 (ja) * 2016-02-08 2017-08-17 株式会社日立製作所 文章生成システム及び文章生成方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528192A (ja) * 1991-07-24 1993-02-05 Dainippon Printing Co Ltd 学術論文データベースシステム
JPH07325834A (ja) * 1994-05-31 1995-12-12 Fujitsu Ltd 検索装置
JPH0830627A (ja) * 1994-05-12 1996-02-02 Mitsubishi Electric Corp キーワード抽出方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528192A (ja) * 1991-07-24 1993-02-05 Dainippon Printing Co Ltd 学術論文データベースシステム
JPH0830627A (ja) * 1994-05-12 1996-02-02 Mitsubishi Electric Corp キーワード抽出方式
JPH07325834A (ja) * 1994-05-31 1995-12-12 Fujitsu Ltd 検索装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
石橋文健: "表やフレームなど最新のタグにも対応しているHTML作成支援ツール:Hyper Edit[ハイパーエディット]", INTERNET MAGAZINE, vol. 第14号, CSND200000034015, 1 March 1996 (1996-03-01), JP, pages 252, ISSN: 0000714636 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001084381A (ja) * 1999-08-30 2001-03-30 Mitsubishi Electric Inf Technol Center America Inc マルチメディア・コンテンツの表現を生成する方法
JP2002063185A (ja) * 2000-08-22 2002-02-28 Hitachi Software Eng Co Ltd 類似知識抽出システム
JP2013506894A (ja) * 2009-10-01 2013-02-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 非構造化情報のインテリジェント・イベント・ベース・データ・マイニング
WO2017138057A1 (ja) * 2016-02-08 2017-08-17 株式会社日立製作所 文章生成システム及び文章生成方法

Also Published As

Publication number Publication date
JP3780556B2 (ja) 2006-05-31

Similar Documents

Publication Publication Date Title
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
JP3300866B2 (ja) テキスト処理システムにより使用されるテキストを準備する方法及び装置
US5724593A (en) Machine assisted translation tools
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
US20040117352A1 (en) System for answering natural language questions
EP0562818A2 (en) System for pattern based text translation
US20060031207A1 (en) Content search in complex language, such as Japanese
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
US20070179932A1 (en) Method for finding data, research engine and microprocessor therefor
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JP3612769B2 (ja) 情報検索装置および情報検索方法
CN112818645A (zh) 一种化学信息抽取方法、装置、设备及存储介质
JP3780556B2 (ja) 自然言語事例検索装置及び自然言語事例検索方法
KR101359039B1 (ko) 복합명사 분석장치 및 복합명사 분석 방법
JP4588657B2 (ja) 翻訳装置
JP2000148754A (ja) マルチリンガル・システム,マルチリンガル処理方法およびマルチリンガル処理のプログラムを記憶した媒体
EP1605371A1 (en) Content search in complex language, such as japanese
Al-Taani et al. Searching concepts and keywords in the Holy Quran
JPH06195371A (ja) 未登録語獲得方式
JPH1074207A (ja) 情報検索装置及び情報検索方法
JP4588417B2 (ja) 翻訳装置
JPH08115330A (ja) 類似文書検索方法および装置
CN116991969B (zh) 可配置语法关系的检索方法、系统、电子设备及存储介质
JP4007630B2 (ja) 対訳例文登録装置
JPS63228326A (ja) キ−ワ−ド自動抽出方式

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20040715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050901

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051227

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060227

LAPS Cancellation because of no payment of annual fees