JP2664915B2 - 情報検索システム - Google Patents
情報検索システムInfo
- Publication number
- JP2664915B2 JP2664915B2 JP63005073A JP507388A JP2664915B2 JP 2664915 B2 JP2664915 B2 JP 2664915B2 JP 63005073 A JP63005073 A JP 63005073A JP 507388 A JP507388 A JP 507388A JP 2664915 B2 JP2664915 B2 JP 2664915B2
- Authority
- JP
- Japan
- Prior art keywords
- undefined
- processing
- word
- semantic analysis
- words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、情報検索システムに関し、特に、自然言語
の問合せ文を入力し、意味解析部により自然言語の意味
解析を行い、意味解析結果から検索条件を作成し、情報
検索を行う情報検索システムに関するものである。
の問合せ文を入力し、意味解析部により自然言語の意味
解析を行い、意味解析結果から検索条件を作成し、情報
検索を行う情報検索システムに関するものである。
従来、データベース技術やAI(人工知能)技術の発展
により、専門のオペレータだけでなく、計算機に馴染み
の薄いユーザでも簡単に使える情報検索システムの要望
が高まっている。この要望に応える情報検索システムの
1つに、計算機に対して自然語で問合せを行うものが開
発されている。このような情報検索システムは、自然言
語処理を行う意味解析部を備え、入力される自然語の問
合せ文の意味を理解して、検索条件を作成し、情報検索
を行う。システムの意味解析部が問合せ文中に含まれて
いる単語の意味を理解するためには、辞書との照合を行
い意味解析を行う必要がある。しかし、各種の問合せ文
中に含まれる全ての単語を網羅して辞書に登録しておく
ことは不可能であるため、一部に照合できない未定義語
が生じ、結果としては、システムが問合せ文を理解でき
ない結果となる場合が多くあった。
により、専門のオペレータだけでなく、計算機に馴染み
の薄いユーザでも簡単に使える情報検索システムの要望
が高まっている。この要望に応える情報検索システムの
1つに、計算機に対して自然語で問合せを行うものが開
発されている。このような情報検索システムは、自然言
語処理を行う意味解析部を備え、入力される自然語の問
合せ文の意味を理解して、検索条件を作成し、情報検索
を行う。システムの意味解析部が問合せ文中に含まれて
いる単語の意味を理解するためには、辞書との照合を行
い意味解析を行う必要がある。しかし、各種の問合せ文
中に含まれる全ての単語を網羅して辞書に登録しておく
ことは不可能であるため、一部に照合できない未定義語
が生じ、結果としては、システムが問合せ文を理解でき
ない結果となる場合が多くあった。
ところで、意味解析を含む自然語処理に関する技術と
して機械翻訳システムに係る技術がある。機械翻訳シス
テムにおいても、同様に未定義語が生じた場合には意味
解析が行えないため、色々な未定義語処理方式が提案さ
れている。この例を示すと、例えば、特開昭60−181973
号公報に記載の「未定義単語認定方式」がある。この未
定義単語認定方式では、未定義語とその前後に位置する
単語との文法的関係を調べ、未定義語の文法的属性を認
定するようになっている。
して機械翻訳システムに係る技術がある。機械翻訳シス
テムにおいても、同様に未定義語が生じた場合には意味
解析が行えないため、色々な未定義語処理方式が提案さ
れている。この例を示すと、例えば、特開昭60−181973
号公報に記載の「未定義単語認定方式」がある。この未
定義単語認定方式では、未定義語とその前後に位置する
単語との文法的関係を調べ、未定義語の文法的属性を認
定するようになっている。
しかし、従来における未定義語処理方式の技術は、機
械翻訳システムに係るものが殆どであり、例えば、未定
義語の前後の単語,接尾辞,接頭辞等から文法的属性を
認定するものである。このように、未定義語とその前後
に位置する単語との文法的関係から未定義語の文法的属
性を認定するようになっているが、文法的関係を調べて
も属性を認定できない未定義語があると、処理が続行で
きず、文の意味が解析できないことになる。
械翻訳システムに係るものが殆どであり、例えば、未定
義語の前後の単語,接尾辞,接頭辞等から文法的属性を
認定するものである。このように、未定義語とその前後
に位置する単語との文法的関係から未定義語の文法的属
性を認定するようになっているが、文法的関係を調べて
も属性を認定できない未定義語があると、処理が続行で
きず、文の意味が解析できないことになる。
ところで、機械翻訳システムにおける意味解析では、
文法的関係を調べても属性を認定できない未定義語があ
ると、意味解析が不能となって処理の続行が困難となる
が、情報検索システムにおける意味解析では、自然言語
の問合せ文に対する意味解析を行う場合に、文法的関係
を調べても属性を認定できない未定義語があっても、当
該未定義語が検索条件を生成する処理において、当該未
定義語が特に意味を有しない場合には、処理を続行して
も差支えがないことが多い。しかし、このような場合に
も、従来の情報検索システムは、機械翻訳システムにお
ける意味解析の場合と同様に、意味解析を不能として、
処理の続行を停止しているという問題点があった。
文法的関係を調べても属性を認定できない未定義語があ
ると、意味解析が不能となって処理の続行が困難となる
が、情報検索システムにおける意味解析では、自然言語
の問合せ文に対する意味解析を行う場合に、文法的関係
を調べても属性を認定できない未定義語があっても、当
該未定義語が検索条件を生成する処理において、当該未
定義語が特に意味を有しない場合には、処理を続行して
も差支えがないことが多い。しかし、このような場合に
も、従来の情報検索システムは、機械翻訳システムにお
ける意味解析の場合と同様に、意味解析を不能として、
処理の続行を停止しているという問題点があった。
本発明は、上記問題点を解決するためになされたもの
である。
である。
本発明の目的は、自然言語の問合せ文を入力し、情報
検索を行う情報検索システムにおいて、自然言語の問合
せ文中に、意味解析による未定義語が発生しても、適切
な処理で処理の続行が行えるようにすることにある。
検索を行う情報検索システムにおいて、自然言語の問合
せ文中に、意味解析による未定義語が発生しても、適切
な処理で処理の続行が行えるようにすることにある。
本発明の前記ならびにその他の目的と新規な特徴は、
本明細書の記述及び添付図面によって明らかになるであ
ろう。
本明細書の記述及び添付図面によって明らかになるであ
ろう。
上記目的を達成するため、本発明においては、自然言
語の問合せ文を入力し、意味解析部により自然言語の意
味解析を行い、意味解析結果から検索条件を作成し、情
報検索を行う情報検索システムにおいて、前記意味解析
部に、自然言語の問合せ文に含まれる単語のうち意味辞
書に未登録で意味解析が不能な未定義語を、前記問合せ
文の他の単語の意味解析から検索条件を作成する処理に
対応して分類し、分類した未定義語に対する処理の結果
を表示出力する未定義語処理手段を設けたことを特徴と
する。
語の問合せ文を入力し、意味解析部により自然言語の意
味解析を行い、意味解析結果から検索条件を作成し、情
報検索を行う情報検索システムにおいて、前記意味解析
部に、自然言語の問合せ文に含まれる単語のうち意味辞
書に未登録で意味解析が不能な未定義語を、前記問合せ
文の他の単語の意味解析から検索条件を作成する処理に
対応して分類し、分類した未定義語に対する処理の結果
を表示出力する未定義語処理手段を設けたことを特徴と
する。
前記手段によれば、情報検索システムにおける意味解
析部に、未定義語処理段が設けられる。未定義語処理手
段は、自然言語の問合せ文に含まれる単語のうち意味辞
書に未登録で意味解析が不能な未定義語が生じた場合、
当該未定義語を、問合せ文の他の単語の意味解析から検
索条件を作成する処理に対応して分類し、分類した結果
は、当該未定義語に対する処理の結果として表示出力す
る。
析部に、未定義語処理段が設けられる。未定義語処理手
段は、自然言語の問合せ文に含まれる単語のうち意味辞
書に未登録で意味解析が不能な未定義語が生じた場合、
当該未定義語を、問合せ文の他の単語の意味解析から検
索条件を作成する処理に対応して分類し、分類した結果
は、当該未定義語に対する処理の結果として表示出力す
る。
したがって、問合せ文に未定義語が含まれていた場合
にも、情報検索システムは、問合せ文の他の単語の意味
解析から検索条件を作成する処理に対応して未定義語を
分類して処理を続行し、分類して処理を続行した処理の
結果は表示出力するので、ユーザの要求どおりに情報検
索システムを効率よく動作させることができ、ユーザ
は、所望の要求の入力が動作を容易に行うことができ
る。
にも、情報検索システムは、問合せ文の他の単語の意味
解析から検索条件を作成する処理に対応して未定義語を
分類して処理を続行し、分類して処理を続行した処理の
結果は表示出力するので、ユーザの要求どおりに情報検
索システムを効率よく動作させることができ、ユーザ
は、所望の要求の入力が動作を容易に行うことができ
る。
これにより、未定義語処理では、未定義語を固有名詞
として一律に扱うのではなく、適切な処理を施すことが
できるようになる。また、システムが施した処理の結果
は表示出力して、ユーザに提示することにより、ユーザ
要求と異なる動作を行わないように確認を取ることがで
き、情報検索の信頼性を向上させることができる。
として一律に扱うのではなく、適切な処理を施すことが
できるようになる。また、システムが施した処理の結果
は表示出力して、ユーザに提示することにより、ユーザ
要求と異なる動作を行わないように確認を取ることがで
き、情報検索の信頼性を向上させることができる。
以下、本発明の一実施例を図面を用いて具体的に説明
する。
する。
第1図は、本発明の一実施例にかかる情報検索システ
ムの構成を示すブロック図である。第1図において、1
はキーボード、2は問合せ文入力部、3は検索条件生成
処理部、4はデータベース検索部、5はデータベース
部、6は表示部である。また、30は意味解析部、33は辞
書ファイル、34はデータベース検索用言語生成部であ
る。検索条件生成処理部3には、辞書ファイル33を備え
た意味解析部30,データベース検索用言語生成部34が設
けられている。意味解析部30は辞書ファイル33を参照し
て、辞書の照合,未定義語の処理等を行い、自然言語の
問合せ文の意味解析を行う。
ムの構成を示すブロック図である。第1図において、1
はキーボード、2は問合せ文入力部、3は検索条件生成
処理部、4はデータベース検索部、5はデータベース
部、6は表示部である。また、30は意味解析部、33は辞
書ファイル、34はデータベース検索用言語生成部であ
る。検索条件生成処理部3には、辞書ファイル33を備え
た意味解析部30,データベース検索用言語生成部34が設
けられている。意味解析部30は辞書ファイル33を参照し
て、辞書の照合,未定義語の処理等を行い、自然言語の
問合せ文の意味解析を行う。
このような情報検索システムにおいて、情報検索を行
う場合、ユーザが知りたい情報に対する問合せ文を、自
然言語でキーボード1から入力すると、入力された問合
せ文は問合せ文入力部2を介して検索条件生成処理部3
に加えられる。検索条件生成処理部3では、意味解析部
30が辞書ファイル33を参照して、入力された自然言語の
問合せ文に対して、構文解析,辞書照合,単語意味解析
等の総合的な意味解析に必要な処理を行い、意味を解析
して、情報検索に必要な検索条件の単語を出力し、デー
タベース検索用言語生成部34に与える。データベース検
索用言語生成部34は、与えられた検索条件の単語からデ
ータベース検索用言語を生成して、データベース検索部
4に入力する。データベース検索部4は、与えられた検
索条件に対するデータベース検索用言語からデータベー
ス部5をアクセスして、検索条件に合った情報を取り出
し、検索条件生成処理部3を介して、表示部6において
検索された所要の情報を表示する。
う場合、ユーザが知りたい情報に対する問合せ文を、自
然言語でキーボード1から入力すると、入力された問合
せ文は問合せ文入力部2を介して検索条件生成処理部3
に加えられる。検索条件生成処理部3では、意味解析部
30が辞書ファイル33を参照して、入力された自然言語の
問合せ文に対して、構文解析,辞書照合,単語意味解析
等の総合的な意味解析に必要な処理を行い、意味を解析
して、情報検索に必要な検索条件の単語を出力し、デー
タベース検索用言語生成部34に与える。データベース検
索用言語生成部34は、与えられた検索条件の単語からデ
ータベース検索用言語を生成して、データベース検索部
4に入力する。データベース検索部4は、与えられた検
索条件に対するデータベース検索用言語からデータベー
ス部5をアクセスして、検索条件に合った情報を取り出
し、検索条件生成処理部3を介して、表示部6において
検索された所要の情報を表示する。
第2図は、第1図の意味解析部30の要部の構成を示す
ブロック図である。第2図において、31は辞書照合部、
32は未定義語処理部、33は辞書ファイルである。辞書照
合部31では、入力された自然言語の問合せ文の各単語を
辞書ファイル33に登録されている辞書単語と照合する。
未定義語処理部32は、辞書照合部31の処理で照合できな
かった単語の未定義語(未定義語辞書ファイル33に登録
されておらず意味解析が不能な単語)の処理を行う。
ブロック図である。第2図において、31は辞書照合部、
32は未定義語処理部、33は辞書ファイルである。辞書照
合部31では、入力された自然言語の問合せ文の各単語を
辞書ファイル33に登録されている辞書単語と照合する。
未定義語処理部32は、辞書照合部31の処理で照合できな
かった単語の未定義語(未定義語辞書ファイル33に登録
されておらず意味解析が不能な単語)の処理を行う。
次に、この意味解析部30の動作を説明する。自然言語
の問い合せ文が入力され、辞書照合部31に与えられる
と、辞書照合部31は、入力された文中の単語と辞書ファ
イル33に登録されている単語とを照合して、単語の属性
等を調べて、単語の認定を行う。この場合、辞書ファイ
ル33に登録されておらず、照合できなかった単語(未定
義語)が出現すると、この未定義語の単語に対する処理
を未定義語処理部32が行うように指示する。
の問い合せ文が入力され、辞書照合部31に与えられる
と、辞書照合部31は、入力された文中の単語と辞書ファ
イル33に登録されている単語とを照合して、単語の属性
等を調べて、単語の認定を行う。この場合、辞書ファイ
ル33に登録されておらず、照合できなかった単語(未定
義語)が出現すると、この未定義語の単語に対する処理
を未定義語処理部32が行うように指示する。
未定義語処理部32では、未定義語の種類を判別して、
当該未定義語に対して、入力された問合せ文の他の単語
の意味解析の結果を参照し、問合せ文の検索条件作成処
理に対応して分類して、当該未定義語に対する所定の処
理を行い、この処理の結果を出力メッセージとして出力
する。未定義語処理部32から出力された出力メッセージ
は、表示部6で表示され、ユーザに提示される。
当該未定義語に対して、入力された問合せ文の他の単語
の意味解析の結果を参照し、問合せ文の検索条件作成処
理に対応して分類して、当該未定義語に対する所定の処
理を行い、この処理の結果を出力メッセージとして出力
する。未定義語処理部32から出力された出力メッセージ
は、表示部6で表示され、ユーザに提示される。
第3図、未定義語処理で用いる付接語と未定義語の属
性を定めるための文法規則を格納した付接語テーブルの
一例を示す図である。また、第4図は、未定義語処理部
32の処理動作を示したPAD図である。第4図を参照して
未定義語処理を説明する。この未定義語処理では、ま
ず、処理ボックス51で、与えられた未定義語を変数Xに
セットする。次に判断ボックス52で、未定義語に付接語
が付いているか否かを判断する。未定義語に付接語が付
いている場合には、処理ボックス53で、未定義語に付い
ている付接語から文法規則により未定義語の属性を認定
する。この処理は、例えば、第3図に示すような各付接
語に対して文法規則が定められている付接語テーブルに
より、適用する文法規則を見つけ出して、当該文法規則
により未定義語の属性を認定する。未定義語の属性を認
定すると、次の処理ボックス54で認定した未定義語の属
性を変数Yにセットする。次に処理ボックス55で、FLAG
レジスタに1をセットする。
性を定めるための文法規則を格納した付接語テーブルの
一例を示す図である。また、第4図は、未定義語処理部
32の処理動作を示したPAD図である。第4図を参照して
未定義語処理を説明する。この未定義語処理では、ま
ず、処理ボックス51で、与えられた未定義語を変数Xに
セットする。次に判断ボックス52で、未定義語に付接語
が付いているか否かを判断する。未定義語に付接語が付
いている場合には、処理ボックス53で、未定義語に付い
ている付接語から文法規則により未定義語の属性を認定
する。この処理は、例えば、第3図に示すような各付接
語に対して文法規則が定められている付接語テーブルに
より、適用する文法規則を見つけ出して、当該文法規則
により未定義語の属性を認定する。未定義語の属性を認
定すると、次の処理ボックス54で認定した未定義語の属
性を変数Yにセットする。次に処理ボックス55で、FLAG
レジスタに1をセットする。
一方、判断ボックス52で、未定義語に付接語が付いて
いないと判断された場合には、未定義語を取り除き、当
該未定義語の前後にある単語を助詞「の」で結び付ける
ため、処理ボックス56において、当該未定義語を「の」
に置き換える。これより未定義語はなくなったので、辞
書照合により既に意味解析が行われている他の単語を組
合せた問合せ文から、処理ボックス57において、検索条
件式を作成する。次の判断ボックス58においては、この
一連の未定義語を取り除いて検索条件を作成する処理
で、検索条件式が作成できたか否かを判断する。検索条
件式が作成できた場合には、処理ボックス59でFLAGレジ
スタに2をセットし、検索条件式が作成できない場合に
は、処理ボックス60でFLAGレジスタに3をセットする。
このようにして、未定義語に対して、未定義語が含まれ
る問合せ文の他の単語の意味解析から検索条件作成処理
に対応して分類して、FLAGレジスタに1,2または3をセ
ットする。
いないと判断された場合には、未定義語を取り除き、当
該未定義語の前後にある単語を助詞「の」で結び付ける
ため、処理ボックス56において、当該未定義語を「の」
に置き換える。これより未定義語はなくなったので、辞
書照合により既に意味解析が行われている他の単語を組
合せた問合せ文から、処理ボックス57において、検索条
件式を作成する。次の判断ボックス58においては、この
一連の未定義語を取り除いて検索条件を作成する処理
で、検索条件式が作成できたか否かを判断する。検索条
件式が作成できた場合には、処理ボックス59でFLAGレジ
スタに2をセットし、検索条件式が作成できない場合に
は、処理ボックス60でFLAGレジスタに3をセットする。
このようにして、未定義語に対して、未定義語が含まれ
る問合せ文の他の単語の意味解析から検索条件作成処理
に対応して分類して、FLAGレジスタに1,2または3をセ
ットする。
次に、判断ボックス61において、FLAGレジスタにセッ
トされている値を判断し、FLAGレジスタにセットされて
いる値の1,2,および3に応じて、それぞれ処理ボックス
62,処理ボックス63,および処理ボックス64の処理を行
い、各々の出力メッセージを作成する。次に処理ボック
ス65で、作成した出力メッセージを出力する。すなわ
ち、FLAGレジスタにセットされている値が1の場合は、
処理ボックス62において、『「X」を「Y」と判断しま
した。』との出力メッセージを作成し、FLAGレジスタに
セットされている値が2の場合は、処理ボックス63にお
いて、『「X」を取り除いて検索条件を作成しまし
た。』との出力メッセージを作成し、また、FLAGレジス
タにセットされている値が3の場合は、処理ボックス64
において、『「X」の意味が解らず検索条件を作成でき
ません。辞書に登録するか又は他の表現に言い換えて下
さい。』との出力メッセージを作成する。このように作
成した各々の出力メッセージは、処理ボックス65におい
て出力し、未定義語に対する処理を終了する。
トされている値を判断し、FLAGレジスタにセットされて
いる値の1,2,および3に応じて、それぞれ処理ボックス
62,処理ボックス63,および処理ボックス64の処理を行
い、各々の出力メッセージを作成する。次に処理ボック
ス65で、作成した出力メッセージを出力する。すなわ
ち、FLAGレジスタにセットされている値が1の場合は、
処理ボックス62において、『「X」を「Y」と判断しま
した。』との出力メッセージを作成し、FLAGレジスタに
セットされている値が2の場合は、処理ボックス63にお
いて、『「X」を取り除いて検索条件を作成しまし
た。』との出力メッセージを作成し、また、FLAGレジス
タにセットされている値が3の場合は、処理ボックス64
において、『「X」の意味が解らず検索条件を作成でき
ません。辞書に登録するか又は他の表現に言い換えて下
さい。』との出力メッセージを作成する。このように作
成した各々の出力メッセージは、処理ボックス65におい
て出力し、未定義語に対する処理を終了する。
次に、上述のような情報検索システムにおける未定義
語処理の具体例を説明する。
語処理の具体例を説明する。
第5図は、本実施例にかかる情報検索システムに入力
する自然言語の問合せ文の一例を示す図である。また、
第6図は、入力した問合せ文に対してシステムから出力
された出力メッセージの一例を示す図である。第6図に
示されている出力メッセージM1〜M3は、第5図に示され
ている問合せ文Q1〜Q3に対してシステムが出力したメッ
セージの一例である。
する自然言語の問合せ文の一例を示す図である。また、
第6図は、入力した問合せ文に対してシステムから出力
された出力メッセージの一例を示す図である。第6図に
示されている出力メッセージM1〜M3は、第5図に示され
ている問合せ文Q1〜Q3に対してシステムが出力したメッ
セージの一例である。
問合せ文Q1「日立という会社に務めている人は?」で
は「日立」が未定義語であるとする。この場合、未定義
語「日立」の後に付接している単語「という」があるの
で、未定義語処理では、第3図に示したような付接語テ
ーブルが調べられ、未定義語「日立」に付接する単語
「という」の文法規則から、同じ属性を有する後続する
単語「会社」の属性を調べて、当該未定義語の属性は
「会社名」であると文法的に類推される処理が行われる
(処理ボックス53:以下カッコ内では処理ボックスとい
う語を省略する)。このような処理の結果を出力メッセ
ージとして出力するため、ここで類推した未定義語の属
性「会社名」は変数Yにセットし(54)、FLAGレジスタ
に1をセットし(55)、このFLAGレジスタの値1によっ
て作成する出力メッセージは『「日立(未定義語:X)」
を会社名(Y)と判断しました。』とする(62)。
は「日立」が未定義語であるとする。この場合、未定義
語「日立」の後に付接している単語「という」があるの
で、未定義語処理では、第3図に示したような付接語テ
ーブルが調べられ、未定義語「日立」に付接する単語
「という」の文法規則から、同じ属性を有する後続する
単語「会社」の属性を調べて、当該未定義語の属性は
「会社名」であると文法的に類推される処理が行われる
(処理ボックス53:以下カッコ内では処理ボックスとい
う語を省略する)。このような処理の結果を出力メッセ
ージとして出力するため、ここで類推した未定義語の属
性「会社名」は変数Yにセットし(54)、FLAGレジスタ
に1をセットし(55)、このFLAGレジスタの値1によっ
て作成する出力メッセージは『「日立(未定義語:X)」
を会社名(Y)と判断しました。』とする(62)。
この結果、未定義処理では、問合せ文Q1「日立という
会社に勤めている人は?」に対して、出力メッセージM1
『「日立」を会社名と判断しました。』が出力されるこ
とになる。
会社に勤めている人は?」に対して、出力メッセージM1
『「日立」を会社名と判断しました。』が出力されるこ
とになる。
問合せ文Q2「9月12日に行うコンサートを教えて下さ
い。」では「行う」が未定義語であるとする。この場
合、未定義語「行う」には付接語がないので、上述の問
合せ文Q1における未定義処理のように、付接語とその文
法規則から属性を類推することはできない。このため、
当該未定義語「行う」を取り除き、当該未定義語の前後
にある単語を助詞「の」で結び付けるため、未定義語を
「の」に置き換える(56)。これにより問合せ文Q2を
「9月12日のコンサートを教えて下さい」として意味解
析を行い、検索条件式を生成する(57)と、検索条件式
を生成することができる。このような処置の結果は出力
メッセージとして出力するため、FLAGレジスタには2を
セットし(59)、このFLAGレジスタの値2によって作成
する出力メッセージは『「行う(未定義語:X)」を取り
除いて検索条件を作成しました。』とする(63)。
い。」では「行う」が未定義語であるとする。この場
合、未定義語「行う」には付接語がないので、上述の問
合せ文Q1における未定義処理のように、付接語とその文
法規則から属性を類推することはできない。このため、
当該未定義語「行う」を取り除き、当該未定義語の前後
にある単語を助詞「の」で結び付けるため、未定義語を
「の」に置き換える(56)。これにより問合せ文Q2を
「9月12日のコンサートを教えて下さい」として意味解
析を行い、検索条件式を生成する(57)と、検索条件式
を生成することができる。このような処置の結果は出力
メッセージとして出力するため、FLAGレジスタには2を
セットし(59)、このFLAGレジスタの値2によって作成
する出力メッセージは『「行う(未定義語:X)」を取り
除いて検索条件を作成しました。』とする(63)。
この結果、未定義処理では、問合せ文Q2「9月12日に
行うコンサートを教えて下さい。」に対して、出力メッ
セージM2『「行う」を取り除いて検索条件を作成しまし
た。』が出力されることになる。
行うコンサートを教えて下さい。」に対して、出力メッ
セージM2『「行う」を取り除いて検索条件を作成しまし
た。』が出力されることになる。
問合せ文Q3「横浜市の人口は?」では「人口」が未定
義語であるとする。この場合は、上述の問合せ文Q1にお
ける未定義処理のように、付接語とその文法規則から属
性を類推することはできず、また、問合せ文Q2における
未定義処理のように、未定義語を取り除き検索条件を生
成することもできない。この場合には、ユーザに未定義
語の変更を要求するため、FLAGレジスタには3をセット
し(60)、このFLAGレジスタの値3によって作成する出
力メッセージは『「人口(未定義語:X)」の意味が解ら
ず検索索条件を作成できません。辞書に登録するか又は
他の表現に言い換えて下さい。』とする(64)。
義語であるとする。この場合は、上述の問合せ文Q1にお
ける未定義処理のように、付接語とその文法規則から属
性を類推することはできず、また、問合せ文Q2における
未定義処理のように、未定義語を取り除き検索条件を生
成することもできない。この場合には、ユーザに未定義
語の変更を要求するため、FLAGレジスタには3をセット
し(60)、このFLAGレジスタの値3によって作成する出
力メッセージは『「人口(未定義語:X)」の意味が解ら
ず検索索条件を作成できません。辞書に登録するか又は
他の表現に言い換えて下さい。』とする(64)。
結果として、この場合の未定義処理では、問合せ文Q3
「横浜市の人口は?」に対して、出力メッセージM3
『「人口」の意味が解らず検索索条件を作成できませ
ん。辞書に登録するか又は他の表現に言い換えて下さ
い。』が出力されることになる。
「横浜市の人口は?」に対して、出力メッセージM3
『「人口」の意味が解らず検索索条件を作成できませ
ん。辞書に登録するか又は他の表現に言い換えて下さ
い。』が出力されることになる。
このように、本実施例による情報検索システムの未定
義語処理においては、未定義語を問合せ文の他の単語の
意味解析から検索条件を作成する処理に対応して、シス
テムが文法的に属性を定められる未定義語,取り除いて
も検索条件として成り立つ未定義語,辞書に登録するか
又は他の表現で言い変えないと検索条件を生成できない
未定義語の3種類に分類して処理する。そして、分類し
て処理するた各未定義語の処理の結果は、出力メッセー
ジとして表示出力し、ユーザに確認させるようにする。
義語処理においては、未定義語を問合せ文の他の単語の
意味解析から検索条件を作成する処理に対応して、シス
テムが文法的に属性を定められる未定義語,取り除いて
も検索条件として成り立つ未定義語,辞書に登録するか
又は他の表現で言い変えないと検索条件を生成できない
未定義語の3種類に分類して処理する。そして、分類し
て処理するた各未定義語の処理の結果は、出力メッセー
ジとして表示出力し、ユーザに確認させるようにする。
したがって、自然言語による問合せ文を入力して情報
検索を行う情報検索システムにおいて、自然言語の問合
せ文に未定義語が含まれていた場合にも、システムは、
問合せ文の他の単語の意味解析から検索条件作成の処理
に対応して分類して処理を続行し、分類して処理を続行
した処置結果は表示出力するので、情報検索システムを
効率よく動作させることができ、ユーザの要求どおりの
動作を行わせることができる。
検索を行う情報検索システムにおいて、自然言語の問合
せ文に未定義語が含まれていた場合にも、システムは、
問合せ文の他の単語の意味解析から検索条件作成の処理
に対応して分類して処理を続行し、分類して処理を続行
した処置結果は表示出力するので、情報検索システムを
効率よく動作させることができ、ユーザの要求どおりの
動作を行わせることができる。
以上、本発明を実施例にもとづき具体的に説明した
が、本発明は、前記実施例に限定されるものではなく、
その要旨を逸脱しない範囲において種々変更可能である
ことは言うまでもない。
が、本発明は、前記実施例に限定されるものではなく、
その要旨を逸脱しない範囲において種々変更可能である
ことは言うまでもない。
以上、説明したように、本発明によれば、自然言語に
よる問合せ文を入力して情報検索を行う情報検索システ
ムにおいて、意味解析で、辞書内に登録されておらず、
照合できなかった未定義語に対しては、検索条件の作成
処理に対応して分類して、未定義語に対するシステムの
処理の結果を表示出力するため、未定義語処理により情
報検索の操作が中断することがなく続行することができ
る。システムの処理動作は、ユーザに提示されて、認識
できるようになっているので、情報検索システムにおい
て、ユーザ要求通りの問合せ入力を容易に行うことがで
きるという効果がある。
よる問合せ文を入力して情報検索を行う情報検索システ
ムにおいて、意味解析で、辞書内に登録されておらず、
照合できなかった未定義語に対しては、検索条件の作成
処理に対応して分類して、未定義語に対するシステムの
処理の結果を表示出力するため、未定義語処理により情
報検索の操作が中断することがなく続行することができ
る。システムの処理動作は、ユーザに提示されて、認識
できるようになっているので、情報検索システムにおい
て、ユーザ要求通りの問合せ入力を容易に行うことがで
きるという効果がある。
第1図は、本発明の一実施例にかかる情報検索システム
の構成を示すブロック図、 第2図は、意味解析部の要部の構成を示すブロック図、 第3図は、付接語と未定義語の属性を定めるための文法
規則を格納した付接語テーブルの一例を示す図、 第4図は、未定義語処理部の処理動作を示したPAD図、 第5図は、本実施例にかかる情報検索システムに入力す
る自然言語の問合せ文の一例を示す図、 第6図は、入力した問合せ文に対してシステムから出力
された出力メッセージの一例を示す図である。 図中、1……キーボード、2……問合せ文入力部、3…
…検索条件生成処理部、4……データベース検索部、5
……データベース部、6……表示部、30……意味解析
部、31……辞書照合部、32……未定義語処理部、33……
辞書ファイル、34……データベース検索用言語生成部。
の構成を示すブロック図、 第2図は、意味解析部の要部の構成を示すブロック図、 第3図は、付接語と未定義語の属性を定めるための文法
規則を格納した付接語テーブルの一例を示す図、 第4図は、未定義語処理部の処理動作を示したPAD図、 第5図は、本実施例にかかる情報検索システムに入力す
る自然言語の問合せ文の一例を示す図、 第6図は、入力した問合せ文に対してシステムから出力
された出力メッセージの一例を示す図である。 図中、1……キーボード、2……問合せ文入力部、3…
…検索条件生成処理部、4……データベース検索部、5
……データベース部、6……表示部、30……意味解析
部、31……辞書照合部、32……未定義語処理部、33……
辞書ファイル、34……データベース検索用言語生成部。
Claims (1)
- 【請求項1】自然言語の問合せ文を入力し、意味解析部
により自然言語の意味解析を行い、意味解析結果から検
索条件を作成し、情報検索を行う情報検索システムにお
いて、前記意味解析部に、自然言語の問合せ文に含まれ
る単語のうち意味辞書に未登録で意味解析が不能な未定
義語を、前記問合せ文の他の単語の意味解析から検索条
件を作成する処理に対応して分類し、分類した各未定義
語に対する処理の結果を表示出力する未定義語処理手段
を設けたことを特徴とする情報検索システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63005073A JP2664915B2 (ja) | 1988-01-12 | 1988-01-12 | 情報検索システム |
US07/295,758 US4994967A (en) | 1988-01-12 | 1989-01-11 | Information retrieval system with means for analyzing undefined words in a natural language inquiry |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63005073A JP2664915B2 (ja) | 1988-01-12 | 1988-01-12 | 情報検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01180631A JPH01180631A (ja) | 1989-07-18 |
JP2664915B2 true JP2664915B2 (ja) | 1997-10-22 |
Family
ID=11601211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63005073A Expired - Lifetime JP2664915B2 (ja) | 1988-01-12 | 1988-01-12 | 情報検索システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US4994967A (ja) |
JP (1) | JP2664915B2 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5197005A (en) * | 1989-05-01 | 1993-03-23 | Intelligent Business Systems | Database retrieval system having a natural language interface |
JPH03188566A (ja) * | 1989-12-18 | 1991-08-16 | Fujitsu Ltd | 辞書連動テキストベース装置 |
JP2814634B2 (ja) * | 1989-12-29 | 1998-10-27 | 松下電器産業株式会社 | 機械翻訳装置 |
JP3266246B2 (ja) * | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
GB9103080D0 (en) * | 1991-02-14 | 1991-04-03 | British And Foreign Bible The | Analysing textual documents |
US5442780A (en) * | 1991-07-11 | 1995-08-15 | Mitsubishi Denki Kabushiki Kaisha | Natural language database retrieval system using virtual tables to convert parsed input phrases into retrieval keys |
US5287278A (en) * | 1992-01-27 | 1994-02-15 | General Electric Company | Method for extracting company names from text |
US5369575A (en) * | 1992-05-15 | 1994-11-29 | International Business Machines Corporation | Constrained natural language interface for a computer system |
JPH05324713A (ja) * | 1992-05-20 | 1993-12-07 | Hitachi Ltd | 自然語処理方法および自然語処理システム |
US5440481A (en) * | 1992-10-28 | 1995-08-08 | The United States Of America As Represented By The Secretary Of The Navy | System and method for database tomography |
US5721845A (en) * | 1993-02-18 | 1998-02-24 | Apple Computer, Inc. | Topically organized interface with realistic dialogue |
US5864844A (en) * | 1993-02-18 | 1999-01-26 | Apple Computer, Inc. | System and method for enhancing a user interface with a computer based training tool |
US5454106A (en) * | 1993-05-17 | 1995-09-26 | International Business Machines Corporation | Database retrieval system using natural language for presenting understood components of an ambiguous query on a user interface |
US5652897A (en) * | 1993-05-24 | 1997-07-29 | Unisys Corporation | Robust language processor for segmenting and parsing-language containing multiple instructions |
JPH0756933A (ja) * | 1993-06-24 | 1995-03-03 | Xerox Corp | 文書検索方法 |
US5519608A (en) * | 1993-06-24 | 1996-05-21 | Xerox Corporation | Method for extracting from a text corpus answers to questions stated in natural language by using linguistic analysis and hypothesis generation |
JPH0744638A (ja) * | 1993-07-29 | 1995-02-14 | Nec Corp | 表データ検索装置 |
EP0645757B1 (en) * | 1993-09-23 | 2000-04-05 | Xerox Corporation | Semantic co-occurrence filtering for speech recognition and signal transcription applications |
US5873056A (en) * | 1993-10-12 | 1999-02-16 | The Syracuse University | Natural language processing system for semantic vector representation which accounts for lexical ambiguity |
US5584024A (en) * | 1994-03-24 | 1996-12-10 | Software Ag | Interactive database query system and method for prohibiting the selection of semantically incorrect query parameters |
US5870740A (en) * | 1996-09-30 | 1999-02-09 | Apple Computer, Inc. | System and method for improving the ranking of information retrieval results for short queries |
US6701294B1 (en) * | 2000-01-19 | 2004-03-02 | Lucent Technologies, Inc. | User interface for translating natural language inquiries into database queries and data presentations |
US20030149566A1 (en) * | 2002-01-02 | 2003-08-07 | Esther Levin | System and method for a spoken language interface to a large database of changing records |
US6980949B2 (en) * | 2003-03-14 | 2005-12-27 | Sonum Technologies, Inc. | Natural language processor |
US20070067155A1 (en) * | 2005-09-20 | 2007-03-22 | Sonum Technologies, Inc. | Surface structure generation |
US7840451B2 (en) * | 2005-11-07 | 2010-11-23 | Sap Ag | Identifying the most relevant computer system state information |
US8805675B2 (en) * | 2005-11-07 | 2014-08-12 | Sap Ag | Representing a computer system state to a user |
US7979295B2 (en) * | 2005-12-02 | 2011-07-12 | Sap Ag | Supporting user interaction with a computer system |
US7676489B2 (en) * | 2005-12-06 | 2010-03-09 | Sap Ag | Providing natural-language interface to repository |
US9218568B2 (en) | 2013-03-15 | 2015-12-22 | Business Objects Software Ltd. | Disambiguating data using contextual and historical information |
US9299041B2 (en) | 2013-03-15 | 2016-03-29 | Business Objects Software Ltd. | Obtaining data from unstructured data for a structured data collection |
US9262550B2 (en) | 2013-03-15 | 2016-02-16 | Business Objects Software Ltd. | Processing semi-structured data |
CN106649278B (zh) * | 2016-12-30 | 2019-11-15 | 三星电子(中国)研发中心 | 扩展口语对话系统语料库的方法和系统 |
CN107885801B (zh) * | 2017-10-31 | 2024-02-02 | 上海博泰悦臻网络技术服务有限公司 | 多层次信息检索的方法、导航终端及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4674066A (en) * | 1983-02-18 | 1987-06-16 | Houghton Mifflin Company | Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words |
JPS6126176A (ja) * | 1984-07-17 | 1986-02-05 | Nec Corp | 言語処理用辞書 |
JPS6140672A (ja) * | 1984-07-31 | 1986-02-26 | Hitachi Ltd | 多品詞解消処理方式 |
EP0218218A3 (en) * | 1985-10-07 | 1989-11-08 | Sharp Kabushiki Kaisha | An inputting system and an editing system in an inquiry-and-answer system |
JPH083815B2 (ja) * | 1985-10-25 | 1996-01-17 | 株式会社日立製作所 | 自然言語の共起関係辞書保守方法 |
JPH0743719B2 (ja) * | 1986-05-20 | 1995-05-15 | シャープ株式会社 | 機械翻訳装置 |
US4777617A (en) * | 1987-03-12 | 1988-10-11 | International Business Machines Corporation | Method for verifying spelling of compound words |
US4849898A (en) * | 1988-05-18 | 1989-07-18 | Management Information Technologies, Inc. | Method and apparatus to identify the relation of meaning between words in text expressions |
-
1988
- 1988-01-12 JP JP63005073A patent/JP2664915B2/ja not_active Expired - Lifetime
-
1989
- 1989-01-11 US US07/295,758 patent/US4994967A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH01180631A (ja) | 1989-07-18 |
US4994967A (en) | 1991-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2664915B2 (ja) | 情報検索システム | |
JP4306894B2 (ja) | 自然言語処理装置及びその方法、及び自然言語認識装置 | |
JP3009215B2 (ja) | 自然語処理方法および自然語処理システム | |
US8756207B2 (en) | Systems and methods for identifying potential duplicate entries in a database | |
KR20120009446A (ko) | 자연 언어 텍스트의 자동화 의미적 라벨링 시스템 및 방법 | |
JP2018045537A (ja) | 検索プログラム、検索装置および検索方法 | |
US20220245361A1 (en) | System and method for managing and optimizing lookup source templates in a natural language understanding (nlu) framework | |
CN115203719A (zh) | Sql语句脱敏方法、装置、设备及计算机可读存储介质 | |
JPH1145274A (ja) | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US20220229998A1 (en) | Lookup source framework for a natural language understanding (nlu) framework | |
US20220229990A1 (en) | System and method for lookup source segmentation scoring in a natural language understanding (nlu) framework | |
JP3123836B2 (ja) | テキスト型データベース装置 | |
US20220229987A1 (en) | System and method for repository-aware natural language understanding (nlu) using a lookup source framework | |
JPH04156663A (ja) | 文章圧縮装置 | |
CN113919352A (zh) | 数据库敏感数据识别方法及装置 | |
JP2809136B2 (ja) | 自然言語対話装置 | |
JP2003108571A (ja) | 文書要約装置、文書要約装置の制御方法、文書要約装置の制御プログラムおよび記録媒体 | |
JP3553984B2 (ja) | 文字列置換規則の生成装置及び方法 | |
JPH09146972A (ja) | 自然言語対話型情報処理装置 | |
JP2008140204A (ja) | データ検索システム及びプログラム | |
JPH08194611A (ja) | プログラム修正による影響範囲を解析する装置 | |
KR20200101735A (ko) | 임베딩 기반의 인과 관계 탐지 시스템과 방법 및 이를 실행하기 위한 프로그램이 기록된 기록매체 | |
JP2020123134A (ja) | 抽出方法,情報処理装置および抽出プログラム | |
WO2021229773A1 (ja) | 用件集約装置、用件集約方法、及びプログラム | |
JPH0773200A (ja) | キーワード抽出方法 |