JPH07105233A - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JPH07105233A
JPH07105233A JP5250481A JP25048193A JPH07105233A JP H07105233 A JPH07105233 A JP H07105233A JP 5250481 A JP5250481 A JP 5250481A JP 25048193 A JP25048193 A JP 25048193A JP H07105233 A JPH07105233 A JP H07105233A
Authority
JP
Japan
Prior art keywords
data
utterance
user
output
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5250481A
Other languages
English (en)
Inventor
Kenji Mizutani
研治 水谷
Makoto Hirai
誠 平井
Koji Matsushima
宏司 松島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5250481A priority Critical patent/JPH07105233A/ja
Publication of JPH07105233A publication Critical patent/JPH07105233A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 ユーザの自由な発話による検索が可能な情報
検索装置を提供すること。 【構成】 ユーザの発話は発話認識装置101に入力さ
れ、形態素解析、構文解析、意味解析がなされて発話の
解釈が対話管理装置103に出力される。対話管理装置
103は対話の文脈を参照して省略表現、照応表現の同
定を行い、推論装置104に結果を出力する。データベ
ース検索装置105は推論装置104から出力された対
話の文脈に基づきデータベース106からデータを検索
して推論装置104に出力する。推論装置104はユー
ザの意図を満足するデータが得られているかどうかを判
断し、対話管理装置103にユーザに対する発話の命題
表現を出力する。対話管理装置は103はそれを入力と
して対話の文脈に応じて修正し、発話生成装置102に
出力する。発話生成装置102は入力された命題表現か
ら自然言語による文を生成し、ユーザへの発話として出
力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はユーザの要求に対して情
報を提供する装置に関するものであり、特にデータベー
ス検索装置とコンサルテーション・システムに関するも
のである。
【0002】
【従来の技術】近年、CPUの性能の向上や光磁気ディ
スクなどの2次記憶装置の大容量低価格化により、デー
タベースが提供するデータは質量ともに充実し、また、
データの識別子を入力すれば高速に引き出すことが可能
になった。しかし、データベースの使い勝手は旧態依然
であり、システムの多くは複雑なキーワード論理式やメ
ニュー、SQLをインターフェースとしている。ユーザ
がシステムに慣れるまでの負担が大きく、また慣れたと
しても今度は自分が欲するデータを容易に検索すること
ができない。
【0003】このような背景からデータベース・システ
ムに対する自然言語によるユーザ・インターフェース技
術の開発が行われてきた(例えば、特開平2−2015
75号公報)。この技術では自然言語で入力されるユー
ザの要求を解析し、データベース検索に失敗したときは
その失敗原因の説明をしたり、自動的に制約の緩和を行
って代替データを提示するものである。
【0004】
【発明が解決しようとする課題】前述の技術は検索対象
となるデータベースを関係データベースに限定してい
る。関係データベースにおいては属性の値が数値もしく
は定義域が設定された値であるので、ユーザとの対話に
おいて特定の属性に注目すればデータ間の差異を計算す
ることが容易である。ユーザの意図と検索結果が一致し
なかったときはその差異を用いてユーザに検索失敗の原
因を説明をしたり、差異の小さいデータを検索して代替
データとして提案することができる。
【0005】しかし、関係データベースよりも一般的な
データベース、例えばテキスト・データベースなどで
は、文書のデータ間の差異が計算できない。各データに
付随するキーワード列を比較する方法ではその差異の解
釈が困難であり、前述の技術を応用することができな
い。
【0006】本発明は一般的なデータベースについて、
ユーザがシステムとの自由な自然言語対話を行いながら
ユーザの意図するデータを提供することを目的とする。
【0007】
【課題を解決するための手段】データベース内の各デー
タについて、その内容をよく表現する文章の依存構造を
解析し、その構造を索引ファイルとして保持する。対話
の内容からユーザの検索意図を抽出し、同様に依存構造
で表現する。そして依存構造間の距離を定義する。
【0008】
【作用】インデックス・ファイルとして依存構造表現を
利用することにより、キーワードよりも正確にテキスト
・データの内容を表現することができる。また、ユーザ
の検索意図も依存構造で表現することにより、キーワー
ド論理式よりも正確に表現される。データの検索は依存
構造表現間に定義した距離の測定によって行われ、適当
な数のデータがユーザの検索意図から抽出した制約表現
に近いものから順に選択される。また距離の測定が不可
能、もしくは多くのデータ間の距離が大きく、測定結果
にあまり意味がないと判断される場合は、測定を可能に
するために必要な不足情報をユーザに問い合わせること
で解決することができる。また、ユーザが検索意図の言
語化に困っている場合は、データの距離の分布に最も大
きな変化を与えるデータの特徴を同定してユーザに知ら
せることにより、ユーザへの発想支援を行うことができ
る。
【0009】
【実施例】本発明の構成を示すブロック図を図1に示
す。ユーザの発話は発話認識装置101に入力され、形
態素解析、構文解析、意味解析がなされて発話の解釈が
対話管理装置103に出力される。対話管理装置103
は対話の文脈を参照して省略表現、照応表現の同定を行
い、十分な解析結果を得た場合は推論装置104に結果
を出力する。データベース検索装置105は推論装置1
04から出力された対話の文脈に基づきデータベース1
06からデータを検索して推論装置104に出力する。
推論装置104はユーザの意図を満足するデータが得ら
れているかどうかを判断し、対話管理装置103にユー
ザに対する発話の命題表現を出力する。対話管理装置は
103はそれを受け取って対話の文脈に応じて修正し、
発話生成装置102に出力する。発話生成装置102は
入力された命題表現から自然言語による文を生成しユー
ザへの発話として出力する。
【0010】次に本発明の動作を説明する。実施例の1
つとして特許の抄録データベースの検索を行うシステム
を取り上げる。対話管理装置103はユーザの発話を解
析して推論装置104に出力する。例えば、以下の対話
について、 システム: どのような特許をお探しですか。 ユーザ : パイプラインの高速化について書かれたも
のをお願いします。 対話管理装置103はユーザの発話中の「もの」がシス
テムの発話の「特許」を指すことを同定し、また、「お
願いします」のような曖昧な慣用表現を「要求する」と
いう具体的な単語に変換して、図2のような依存構造を
出力する。推論装置104は図2の依存構造がユーザの
意図を十分に表現するものであると判断し、データベー
ス検索装置105に出力する。
【0011】図3にデータベース検索装置105の内部
構成を示す。制約変換装置301は対話の内容からデー
タベースのデータに対する制約を抽出し、依存構造で記
述する。図2の対話の内容からは「パイプラインの高速
化」という制約を抽出して図4に示す依存構造を生成す
る。索引生成装置302はデータベース106の各デー
タについて、その内容を端的に表現する文を解析してそ
の依存構造をあらかじめ生成しておく。例えば、ある特
許の抄録の目的項の文、「単精度の固定小数点の演算回
路にプライオリティエンコーダー回路、マルチプレクサ
等の回路を付加することにより、効率よく浮動小数点演
算を高速にデータ駆動方式パイプライン上で行えるよう
にする。」については図5に示す依存構造を生成する。
照合装置303は制約変換装置301と索引生成装置3
02から入力される依存構造を比較し、意味的に類似し
たデータの選択を行う。
【0012】図6に照合装置203の内部構成を示す。
データの依存構造と制約の依存構造はデータ検索装置6
01でその距離が測られ、距離の小さいものから順位付
けされて出力される。検索結果評価装置602はデータ
の距離の分布から検索結果の妥当性を計算する。
【0013】図7にデータ検索装置601の内部構成を
示す。表層検索装置702は依存構造の表層的な特徴に
着目して高速な粗いデータ検索を行う。深層検索装置7
01は表層検索装置が検索したデータの中から、概念辞
書やユーザの知識を利用して意味的に距離が近いデータ
の検索を行う。例えば、表層検索装置702は図4の制
約の依存構造から「パイプライン」という単語が表層的
な制約として有効であると判断し、依存構造の中にその
単語を含むデータを選択する。抄録文として、「結合演
算処理に係わるサイト及び分散データベースを利用する
為の計算機とを通じてパイプライン処理的に結合演算を
実行することにより、結合演算を高速に行う。」およ
び、「パイプラインとは別に部分書込みの為のデータの
みを保持するレジスタ群を設けることにより、パイプラ
インの規模を小さくする。」を持つ特許は、その依存構
造がそれぞれ図8と図9のようになるので、表層検索装
置702によって選択される。深層検索装置701は概
念辞書を用いて図4の構造に対して図5、図8、図9の
距離を測定する。距離の近いものは図5、図8、図9の
順になるが、どの距離の値も大きい。検索結果評価装置
602はデータに対して図4の制約に対する距離の分布
を出力し、最も距離が近いのは図5であることを出力す
る。
【0014】推論装置104は対話管理装置103が出
力する対話の内容と、データベース検索装置105が出
力する検索データと検索結果評価に基づき、ユーザに対
する発話の内容を図10に示す状態遷移図を用いて決定
する。例では各データとの距離が大きいので、最も距離
が近いデータの図5において図4の制約と類似する構造
を抽出し、命題、 (ask user (演算する (様式 高速に) (で パイプライ
ン) (を) (方法))) を対話管理装置103に出力し、次の発話の内容をユー
ザに対する質問とする。対話管理装置103は対話の文
脈を参照して、入力された命題を、 (ask user (演算する (様式 高速に) (で パイプライ
ン))) という命題に変換して発話管理装置102に出力する。
発話管理装置102はユーザに対して、 システム: パイプラインで高速に演算するということ
ですか。 という発話を行う。
【0015】以上のようにユーザが満足したと推論装置
104で判断されるまで自然言語対話によるデータの検
索が続けられる。
【0016】なお、本発明の応用範囲は特許抄録のデー
タベースに限定されず、絵画や音楽のデータベースでも
自然言語による文章が各データに付随しているものであ
れば応用することができる。
【0017】
【発明の効果】ユーザは検索論理式やキーワードによる
検索戦略を考える必要がなく、自然言語による自由な対
話を通じて自分が意図するデータを検索することができ
る。
【図面の簡単な説明】
【図1】本発明の全体の構成を表すブロック図
【図2】ユーザの要求の依存構造表現の一例を示す図
【図3】データベース検索装置105の内部構成を表す
ブロック図
【図4】データに対する制約の依存構造表現の一例を示
す図
【図5】特許の抄録の依存構造表現の一例を示す図
【図6】照合装置303の内部構成を表すブロック図
【図7】データ検索装置601の内部構成を表すブロッ
ク図
【図8】特許の抄録の依存構造表現の一例を示す図
【図9】特許の抄録の依存構造表現の一例を示す図
【図10】推論装置104の動作を表す状態遷移図
【符号の説明】
101 発話認識装置 102 発話生成装置 103 対話管理装置 104 推論装置 105 データベース検索装置 106 データベース 301 制約生成装置 302 索引生成装置 303 照合装置 601 データ検索装置 602 検索結果評価装置 701 深層検索装置 702 表層検索装置

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】ユーザの発話を入力として依存構造を出力
    する発話認識装置と、命題を入力として自然言語表現を
    ユーザに出力する発話生成装置と、対話の内容を入力と
    してデータベースからデータを検索して出力するデータ
    ベース検索装置と、前記対話の内容と前記データベース
    検索装置の出力を解析して次にユーザに発話すべき内容
    を決定して出力する推論装置と、前記発話認識装置の出
    力を入力として文脈解析を行って前記推論装置に出力
    し、かつ前記推論装置の出力を入力として対話の文脈に
    基づく命題を生成して前記発話生成装置に出力する対話
    管理装置によって構成されることを特徴とする情報検索
    装置。
  2. 【請求項2】データベース検索装置は推論装置が出力す
    る対話の内容をデータベースのデータに対する制約の記
    号表現に変換する制約変換装置と、前記データベースの
    各データについてその特徴を抽象化した記号表現に変換
    する索引変換装置と、前記制約変換装置の出力と前記索
    引変換装置の出力を比較して前記制約の記号表現に対し
    て類似度の高い前記記号表現を持つ前記データを選択す
    る照合装置を有することを特徴とする請求項1記載の情
    報検索装置。
  3. 【請求項3】制約変換装置は対話の内容を入力としてデ
    ータベースのデータに対して制約となる部分を抽出し、
    前記制約となる部分を依存構造表現で記述することを特
    徴とする請求項1記載の情報検索装置。
  4. 【請求項4】索引変換装置はデータベースの各データに
    付随する自然言語の文章を入力として依存構造表現で記
    述することを特徴とする請求項1記載の情報検索装置。
  5. 【請求項5】照合装置は制約変換装置が出力する依存構
    造表現と索引変換装置が出力する依存構造表現を比較し
    て構造的かつ意味的に類似度の高いデータを選択するデ
    ータ選択装置と、前記データの選択の妥当性を評価する
    検索結果評価装置を有することを特徴とする請求項1記
    載の情報検索装置。
  6. 【請求項6】データ選択装置は制約の依存構造表現と索
    引の依存構造表現の表層的な特徴から高速にデータの絞
    り込みを行う表層検索装置と、ユーザの知識と概念辞書
    を用いて意味的な絞り込みをする深層検索装置を有する
    ことを特徴とする請求項1記載の情報検索装置。
  7. 【請求項7】検索結果評価装置は制約に対する各データ
    の距離の分布によってデータ選択装置の出力の妥当性を
    評価することを特徴とする請求項1記載の情報検索装置
  8. 【請求項8】推論装置は対話管理装置が出力する対話の
    内容と、データベース検索装置が出力する検索データに
    対する評価から検索結果に対するユーザの満足度を推定
    し、ユーザに対する発話の内容を決定するルールを有す
    ることを特徴とする請求項1記載の情報検索装置。
JP5250481A 1993-10-06 1993-10-06 情報検索装置 Pending JPH07105233A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5250481A JPH07105233A (ja) 1993-10-06 1993-10-06 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5250481A JPH07105233A (ja) 1993-10-06 1993-10-06 情報検索装置

Publications (1)

Publication Number Publication Date
JPH07105233A true JPH07105233A (ja) 1995-04-21

Family

ID=17208503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5250481A Pending JPH07105233A (ja) 1993-10-06 1993-10-06 情報検索装置

Country Status (1)

Country Link
JP (1) JPH07105233A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7124126B1 (en) 1999-07-13 2006-10-17 Nec Corporation Information retrieval apparatus and recording medium having an information retrieval program recorded

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7124126B1 (en) 1999-07-13 2006-10-17 Nec Corporation Information retrieval apparatus and recording medium having an information retrieval program recorded

Similar Documents

Publication Publication Date Title
Affolter et al. A comparative survey of recent natural language interfaces for databases
US7567902B2 (en) Generating speech recognition grammars from a large corpus of data
JP4571404B2 (ja) データ処理方法、データ処理システムおよびプログラム
JP4306894B2 (ja) 自然言語処理装置及びその方法、及び自然言語認識装置
US9448995B2 (en) Method and device for performing natural language searches
US7174507B2 (en) System method and computer program product for obtaining structured data from text
JP5167546B2 (ja) 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置
KR20020045343A (ko) 표준화된 문장 구문구조 및 의미구조에 기반한 정보생성/검색 장치 및 그 방법
JP5321583B2 (ja) 共起辞書生成システム、スコアリングシステム、共起辞書生成方法、スコアリング方法及びプログラム
JPH0447364A (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
CA2250694A1 (en) A system, software and method for locating information in a collection of text-based information sources
Andreasen et al. Grammatical specification of domain ontologies
Kadir et al. Semantic ambiguous query formulation using statistical Linguistics technique
Song et al. Semantic query graph based SPARQL generation from natural language questions
JPH07105233A (ja) 情報検索装置
JP2000242650A (ja) 類似文書検索方法、類似文書検索装置、および類似文書検索プログラムを記録したコンピュータ読み取り可能な記憶媒体
JPH103480A (ja) 文書検索方法および装置
Dodal et al. Multi-lingual information retrieval using deep learning
Nishy Reshmi et al. Textual entailment classification using syntactic structures and semantic relations
Vickers Ontology-based free-form query processing for the semantic web
Boumechaa et al. Natural Language Interface For Querying Linked Data Using Case-Based Reasoning
JPH1074207A (ja) 情報検索装置及び情報検索方法
JP2600081B2 (ja) 自然言語対話装置
JPH0320866A (ja) テキストベース検索方式
Curteanu et al. Discourse theories vs. Topic-Focus articulation applied to prosodic focus assignment in Romanian