JP2003036271A - 対話型情報検索装置 - Google Patents

対話型情報検索装置

Info

Publication number
JP2003036271A
JP2003036271A JP2001221558A JP2001221558A JP2003036271A JP 2003036271 A JP2003036271 A JP 2003036271A JP 2001221558 A JP2001221558 A JP 2001221558A JP 2001221558 A JP2001221558 A JP 2001221558A JP 2003036271 A JP2003036271 A JP 2003036271A
Authority
JP
Japan
Prior art keywords
attribute
key
value
degree
key attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001221558A
Other languages
English (en)
Inventor
Akihiko Obata
明彦 小幡
Tomoko Segawa
智子 瀬川
Iwao Otsuka
巌 大塚
Kazuhiro Watanabe
一宏 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001221558A priority Critical patent/JP2003036271A/ja
Publication of JP2003036271A publication Critical patent/JP2003036271A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザの意図に応じて、情報検索結果を絞り
込むことができ、かつ、そこへ到達するまでの対話回数
を最小にすることができる対話型情報検索装置又は方法
を提供する。 【解決手段】 複数の属性とその属性値によって構成さ
れるデータ構造を有するデータを蓄積し、ユーザが取得
を希望する目標属性と、データの絞り込みを行うための
キー属性と、キー属性の属性値を入力し、キー属性と、
キー属性の属性値を用いて目標属性の属性値を検索し、
検査結果を出力する対話型情報検索方法であって、目標
属性の属性値を検索する前に、入力されたキー属性とキ
ー属性の属性値に基づいて、目標属性の属性値の分布度
合を算出し、分布度合が所定の範囲内に収束している場
合にのみ検索結果として出力するよう制御する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ユーザの音声等に
よる指示に基づいてデータベース等の検索を行い、得ら
れた検索結果を出力する対話型情報検索システムに関す
る。特に、携帯電話等に代表される表示面積の小さいデ
ィスプレイを有する入出力媒体を用いて情報検索を行う
対話型情報検索システムに関する。
【0002】
【従来の技術】従来のキーボード、表示装置を具備する
情報検索システムでは、検索結果を一覧表示することが
できることから、検索された結果をある程度にまで絞り
込んでおけば、対象情報を一覧表示した後に順次内容を
確認することで、比較的短時間に目的とする情報を取得
することができた。
【0003】しかし、音声のみによって検索条件を入力
し、あるいは検索結果を出力する音声対話システムにお
いては、従来と同程度の絞り込み件数では出力再生に相
当の時間を要し、目的とする情報を早期に取得すること
が困難である。また、携帯電話などの小さい表示画面し
か有さない入出力媒体を用いるシステムにおいては、検
索された結果の全てを一覧表示することができず、やは
り目的とする情報を早期に取得することが困難である。
【0004】かかる問題点を解消するために様々な方法
が考えられている。例えば特開平2000−25916
5号公報においては、応答メッセージについて必要ない
部分を削除し、必要な部分のみを選択して出力する方法
について開示されている。こうすることで、余計な情報
を出力する部分については音声再生されないことから、
目的とする情報を比較的短時間で取得することができる
ようになる。
【0005】また、特開平2000−293194号公
報においては、誤認識しやすい語彙の対話を避けて認識
率を向上させるために、対話回数を最適化する方法が開
示されている。こうすることで、誤認識されやすい対話
自体が抑制されるようになることから、目的とする情報
を比較的短時間で取得することができるようになる。
【0006】
【発明が解決しようとする課題】しかしながら、特開平
2000−259165号公報に開示されている方法で
は、提供する情報の内容を損なわない程度に冗長なメッ
セージを簡略化するだけであり、検索結果の内容に応じ
て概要を説明することはできない。また、検索結果が膨
大な量となる場合は、概要を説明するだけでは不十分で
あり、対話による絞り込みが必要である。
【0007】また、メッセージを簡潔化する方法のみが
開示されているものであって、メッセージの簡潔化が困
難な場合については想定されておらず、かかる場合につ
いては何ら記載も示唆もされてはいない。
【0008】一方、特開平2000−293194号公
報に開示されている方法では、誤認識しやすい語彙の対
話をさけた認識率の観点から対話回数を最適化するだけ
であり、ユーザにとって意味のある情報を伝えるための
対話回数の最適化を目的とするものではない。
【0009】本発明では、上記課題に鑑み、ユーザの意
図に応じて、情報検索結果を絞り込むことができ、か
つ、そこへ到達するまでの対話回数を最小にすることが
できる対話型情報検索装置又は方法を提供することを目
的とする。
【0010】
【課題を解決するための手段】上記目的を達成するため
に本発明にかかる対話型情報検索装置は、複数の属性と
その属性値によって構成されるデータ構造を有するデー
タを蓄積する情報蓄積手段と、ユーザが取得を希望する
目標属性と、データの絞り込みを行うためのキー属性
と、キー属性の属性値を入力するユーザコマンド入力手
段と、キー属性と、キー属性の属性値を用いて目標属性
の属性値を検索する情報検索手段と、情報検索手段にお
ける検査結果を出力する検索結果出力手段を具備する対
話型情報検索装置であって、入力されたキー属性とキー
属性の属性値に基づいて、目標属性の属性値の分布度合
を算出し、分布度合が所定の範囲内に収束している場合
にのみ検索結果として出力するよう制御する検索処理手
順制御手段を含むことを特徴とする。
【0011】かかる構成により、ユーザが指定したキー
属性の属性値を有する目標属性の属性値の分布度合に応
じて、実際に情報検索を行う前に、さらなる絞り込み検
索を行う必要が有るか否かを判定することができること
から、キー属性情報追加のためのユーザとの対話を最小
限に抑えることができる。また、絞り込みの度合をユー
ザが設定することで、ユーザの意図に応じて、情報検索
結果を絞り込むことができ、かつ、そこへ到達するまで
の対話回数を減らすことが可能となる。
【0012】また、本発明にかかる対話型情報検索装置
は、検索処理手順制御手段において、分布度合が所定の
範囲内に収束していない場合には、キー属性と、キー属
性の属性値の追加入力を促すメッセージを出力すること
が好ましい。ユーザの意図をより反映させる機会を付与
するためである。
【0013】また、本発明にかかる対話型情報検索装置
は、検索処理手順制御手段が、キー属性ごとに目標属性
の属性値の第1の分布度合を算出するキー属性別分布度
合算出部と、入力されたキー属性とキー属性の属性値、
及び第1の分布度合に基づいて、入力された全キー属性
に対する目標属性の属性値の第2の分布度合を算出する
総合分布度合算出部と、算出された第2の分布度合に基
づいて、第2の分布度合が所定のしきい値よりも小さい
か否かを判定する総合分布度合判定部とを含み、第2の
分布度合が所定のしきい値以下である場合に、分布度合
が所定の範囲内に収束していると判定することが好まし
い。目標属性の属性値の分布度合(第2の分布度合)が
小さいほど入力されたキー属性に対して十分な絞り込み
ができていると考えられるからである。
【0014】また、本発明にかかる対話型情報検索装置
は、検索処理手順制御手段において、第2の分布度合が
所定のしきい値よりも大きい場合に、入力されたキー属
性を除く他のキー属性であって、第1の分布度合が最も
小さい他のキー属性についての属性値の入力を促すメッ
セージを出力することが好ましい。キー属性の属性値を
追加入力させる場合に、目標属性の属性値の分布度合を
最も小さくするのに効果的なキー属性から順に入力させ
ることができ、ユーザとの対話回数を最小にすることが
できるからである。
【0015】また、本発明にかかる対話型情報検索装置
は、第2の分布度合が所定のしきい値よりも大きい場合
に、入力されたキー属性を除く他のキー属性であって、
第1の分布度合が所定のしきい値よりも小さい他のキー
属性及び他のキー属性についての属性値に関するメッセ
ージを検索結果として出力することが好ましい。全体と
しては収束していなくても、キー属性ごとであれば一定
の収束がみられる場合には、追加入力を促すよりもその
検索結果を表示する方がユーザの利便性が高いからであ
る。
【0016】また、本発明にかかる対話型情報検索装置
は、他のキー属性が、第1の分布度合が所定のしきい値
よりも最も小さい他のキー属性であることが好ましい。
キー属性ごとの分布度合が最も収束している属性値を検
索結果として出力できるからである。
【0017】また、本発明にかかる対話型情報検索装置
は、他のキー属性が、出力される他のキー属性及び他の
キー属性についての属性値に関するメッセージが最も短
くなる他のキー属性であることが好ましい。出力メッセ
ージが簡潔である方がユーザの利便性が高いからであ
る。
【0018】また、本発明にかかる対話型情報検索装置
は、他のキー属性を、第1の分布度合及びメッセージの
長さに基づいて算出される加重平均値を指標値として、
指標値が最小である他のキー属性を選択することが好ま
しい。ユーザにとっての利便性をより高めるためであ
る。
【0019】また、本発明は、上記のような対話型情報
検索装置の機能をコンピュータの処理ステップとして実
行するソフトウェアを特徴とするものであり、具体的に
は、複数の属性とその属性値によって構成されるデータ
構造を有するデータを蓄積する工程と、ユーザが取得を
希望する目標属性と、データの絞り込みを行うためのキ
ー属性と、キー属性の属性値を入力する工程と、キー属
性と、キー属性の属性値を用いて目標属性の属性値を検
索する工程と、検査結果を出力する工程を具備する対話
型情報検索方法であって、目標属性の属性値を検索する
工程の前に、入力されたキー属性とキー属性の属性値に
基づいて、目標属性の属性値の分布度合を算出し、分布
度合が所定の範囲内に収束している場合にのみ検索結果
として出力するよう制御する工程を含む対話型情報検索
方法並びにそのような工程を具現化したプログラムであ
ることを特徴とする。
【0020】かかる構成により、コンピュータ上へ当該
プログラムをロードさせ実行することで、ユーザが指定
したキー属性の属性値を有する目標属性の属性値の分布
度合に応じて、実際に情報検索を行う前に、さらなる絞
り込み検索を行う必要が有るか否かを判定することがで
きることから、キー属性情報追加のためのユーザとの対
話を最小限に抑えることができるとともに、絞り込みの
度合をユーザが設定することで、ユーザの意図に応じ
て、情報検索結果を絞り込むことができ、かつ、そこへ
到達するまでの対話回数を減らすことができる対話型情
報検索装置を実現することが可能となる。
【0021】
【発明の実施の形態】以下、本発明の実施の形態にかか
る対話型情報検索装置について、図面を参照しながら説
明する。図1は本発明の実施の形態にかかる対話型情報
検索装置の原理図である。
【0022】図1において、1はユーザコマンド入力手
段を、2は情報検索手段を、3は情報蓄積手段を、4は
検索処理手順制御手段を、5は検索結果出力手段を、そ
れぞれ示している。
【0023】まず、ユーザコマンド入力手段1におい
て、ユーザが検索条件を入力する。入力するのはキーボ
ード等によるキーインでも良いし、音声を用いるのであ
ればマイクロフォン等の音声入力媒体を用いることにな
る。なお、本実施の形態では、音声入力の場合には、ユ
ーザコマンド入力手段1内に音声認識手段も含まれてい
るものとする。
【0024】一般に検索条件としては、一又は複数個の
キー属性とその属性値、及び最終的に抽出したい属性値
にかかる目標属性を入力することになる。したがって、
目標属性値のバラツキ程度を所定の範囲内に抑制するこ
とで、情報検索精度の向上を図ることができる。
【0025】次に、情報検索手段2では、情報蓄積手段
3に保存されている情報の中から、ユーザコマンド入力
手段1において入力された検索条件に合致するものを抽
出することになる。ここで情報蓄積手段3は一般にデー
タベースであり、入力された検索条件がデータベース検
索キーとなる。すなわち、入力された検索条件の属性ご
とに合致するレコードをデータベースから抽出すること
になる。
【0026】そして、検索処理手順制御手段4では、ユ
ーザコマンド入力手段1において入力された検索条件に
基づいた情報検索手段2における検索処理結果によっ
て、ユーザが期待している程度にまで目標属性値を絞り
込むことができているか否かを判断し、絞り込みの度合
がユーザの期待している程度にまで到達しない場合に
は、所定のキー属性に関する情報について追加入力を促
すことになる。
【0027】具体的には、検索処理手順制御手段4は図
2に示すような構成となっている。図2は、本発明の実
施の形態にかかる対話型情報検索装置における検索処理
手順制御手段4の構成図である。図2において、41は
総合分布度合算出部を、42はキー属性別分布度合算出
部を、43は総合分布度合判定部を、44は上位キー属
性情報入力依頼部を、45は判定基準入力・更新部を、
それぞれ示している。
【0028】まず、キー属性別分布度合算出部42にお
いて、情報検索手段2における検索対象である情報蓄積
手段3に保存されている目標属性値について、キー属性
別分布度合算出部42において各キー属性ごとに分布度
合を算出する。算出した結果については保存しておいて
も良いし、保存しなくても良い。すなわち、登録されて
いる目標属性値の内容によっては、キー属性ごとにバラ
ツキ度合が相違していることから、その度合を事前に算
出しておくものである。バラツキの小さいキー属性につ
いてキー属性値を追加入力した場合には、全体として目
標属性値の分布度合についてもバラツキが小さくなるこ
とが期待できる。
【0029】次に、総合分布度合算出部41において、
ユーザコマンド入力手段1において入力された検索条件
に含まれているキー属性について、キー属性別分布度合
算出部42で算出された結果に基づいて、各キー属性ご
との目標属性値の分布度合を抽出し、これらの分布度合
を組み合わせることで、入力された検索条件に対する目
標属性値の総合的な分布度合を算出する。
【0030】例えば図3に示すように、キー属性xに対
する目標属性値の確率密度関数をf(x)とし、キー属
性Aに対する目標属性値の確率分布が図3(a)で、キ
ー属性Bに対する目標属性値の確率分布が図3(b)で
表されるものとすると、キー属性Aの方が目標属性値の
分布度合が小さいものと判断でき、ユーザによってキー
属性Aに関する属性値が入力された場合の方が、より目
標属性値の検索結果が収束しやすくなることを示してい
る。そして、入力された複数のキー属性に基づいて総合
的な目標属性値の確率密度関数をf(x)を算出するこ
とで、検索条件に対する目標属性値の検索結果の分布度
合を判断することが可能となる。
【0031】なお、上述したような確率分布に基づいて
分布度合を算出する方法に特に限定されるものではな
く、最大値と最小値の近接度合や、平均値あるいは度数
分布等により分布度合が求まる方法であれば、どのよう
な方法でも良いことは言うまでもない。
【0032】そして、総合分布度合算出部41において
算出された総合的な分布度合に基づいて、総合分布度合
判定部43において、抽出された目標属性値についてユ
ーザが希望しているバラツキ範囲内に収束しているか否
かを判定する。すなわち、アプリケーションによってユ
ーザがどの程度にまで検索結果を絞り込む必要があるか
変動することから、判定基準入力・更新部45を設ける
ことで、ユーザが希望している絞り込み度合を入力する
ことになる。
【0033】ここで、ユーザが希望している絞り込み度
合については、様々な指標が考えられる。例えば、最大
値と最小値の近接度合を指標とする場合を考えると、目
標属性値の(最大値−最小値)を、データベース全体に
おける属性値の(最大値−最小値)で除算した値が小さ
ければ小さいほど、目標属性値の分布度合が十分に絞り
込まれていると判断することができる。かかる方法は、
特に母集団がそれほど大きくない場合に有効な手法であ
る。
【0034】母集団が十分に大きく、統計的数値の信頼
性が高い場合には、確率分布や度数分布等の統計的指標
を用いることも考えられる。例えば度数分布を用いるの
であれば、目標属性値の範囲と集中度を指定すること
で、指定された目標属性値の範囲内における度数和が指
定された集中度をクリアしているか否かによって判断す
ることが可能となる。
【0035】総合分布度合判定部43において、目標属
性値の分布度合がまだ十分に絞り込まれていないと判定
された場合には、上位キー属性情報入力促進部45にお
いてキー属性別分布度合算出部42における算出結果に
基づいて、ユーザが未入力であり、かつ目標属性値の分
布度合が小さいキー属性から順に、ユーザに対して入力
を促すメッセージを出力表示して、入力待ち状態とす
る。ユーザは、当該メッセージに沿って、当該キー属性
に関する属性値をユーザコマンド入力手段1から入力す
ることになる。
【0036】また、目標属性値の分布度合がまだ十分に
絞り込まれていないと判定された場合であっても、キー
属性ごとに算出した目標属性値の分布度合については、
一定範囲内に収束している場合も考えられる。この場
合、ユーザに新たなキー属性に関する属性値の入力を要
求するよりも、当該キー属性に関する属性値を表示出力
する方が、ユーザの判断に役立つ場合も多い。もちろ
ん、キー属性ごとに算出した目標属性値の分布度合が小
さいものから順に出力する方がよりユーザにとって検索
結果の判断に役立つことは言うまでもない。
【0037】さらに、検索結果を合成音声で出力する音
声対話システムや、携帯電話などの小さい表示画面しか
有さない入出力媒体を用いるシステムにおいては、検索
された結果を出力するのに、その出力が短ければ短いほ
ど適しているものと考えられる。すなわち出力メッセー
ジが長いと、音声対話システムでは検索結果の本質を把
握しにくく、小さい表示画面しか有さない入出力媒体を
用いるシステムでは、メッセージの全てを表示すること
ができない場合も考えられる。したがって、キー属性に
関する属性値を出力する場合にも、出力されるメッセー
ジが短いキー属性から順に出力する方が好ましい。
【0038】もちろん、メッセージ出力の優先順位は、
上述したような条件に限定されるものではなく、キー属
性ごとの目標属性値の分布度合と出力メッセージの短さ
とを組み合わせて総合判断するものであっても良いし、
他の条件で判断するものであっても良い。
【0039】以上の処理を繰り返し実行し、総合分布度
合判定部43において、目標属性値の分布度合が十分に
絞り込まれたものと判定された場合には、検索結果出力
手段5において、最終的に絞り込まれた検索結果のみを
出力することになる。
【0040】検索結果出力手段5における出力結果は、
ユーザの意思に基づいて相当絞り込まれた結果になって
いることから、携帯電話等に代表される表示画面が小さ
い出力媒体であっても、確実に表示出力することがで
き、結果閲覧において冗長さを感じることなく確認する
ことができる。また、音声出力の場合であっても、ユー
ザの意思に沿った結果を中心として出力することができ
るとともに、目的の情報に到達するまでの対話回数を最
小限に抑制することができ、短時間で目的の情報に到達
することが可能となる。
【0041】次に図4を参照しながら、本実施の形態に
かかる対話型情報検索装置における処理の流れについて
説明する。図4は、本発明の実施の形態にかかる対話型
情報検索装置における処理の流れ図である。
【0042】図4において、まず検索条件及び情報検索
によってどの程度にまで絞り込むかを示す目標属性値の
絞り込み度合を入力してから(ステップS401)、入
力された検索条件に基づいて情報検索を行う(ステップ
S402)。
【0043】次に、入力した検索条件に含まれるキー属
性ごとの目標属性値の分布度合に基づいて、入力された
キー属性に対する目標属性値の総合分布度合を算出する
(ステップS403)。
【0044】そして、算出された総合分布度合を入力し
た絞り込み度合と比較して(ステップS404)、総合
分布度合が絞り込み度合の範囲内に収まっていない場合
には(ステップS404:No)、まだ入力されていな
いキー属性の中から任意のキー属性を選択してそのキー
属性値を入力する(ステップS405)。本実施の形態
では、目標属性値の分布度合が最も小さいキー属性及び
キー属性値を追加検索条件として入力することになる。
【0045】目標属性値の総合分布度合が絞り込み度合
の範囲内に収まっている場合には(ステップS404:
Yes)、検索結果として出力することになる(ステッ
プS405)。
【0046】以上のように本実施の形態によれば、実際
に情報検索を行う前に、ある程度の絞り込みが可能な条
件をすべて入力することになることから、検索結果とし
て過大な結果が出力されることが無く、またユーザの意
思が反映された検索結果を取得するまでの対話回数を最
小限にすることができ、ユーザにとって必要な情報を取
得するまでの時間を最小限に抑制することが可能とな
る。
【0047】以下、典型的な実施例として、音声対話を
用いた賃貸住宅検索システムを例にとって具体的な処理
について説明する。本実施例にかかる賃貸住宅検索シス
テムにおいては、ユーザコマンド入力手段1として音声
を入力するためのマイクロフォンを使用し、入力した音
声を音声コマンドとして認識するための音声認識装置、
あるいは音声認識ソフトウェアについてももユーザコマ
ンド入力手段1に含まれるものとする。
【0048】また、検索結果出力手段5は、音声を出力
するためのスピーカが具備されており、検索結果に基づ
いてプロンプトを生成するソフトウェア、あるいは生成
されたメッセージを音声化する音声合成ソフトウェアに
ついても検索結果出力手段5に含まれているものとす
る。
【0049】なお、音声入力は、電話回線等の通信回線
を介して入力する形態であっても良いし、電話回線を介
して通信相手の電話等に音声を出力するシステムであっ
ても良い。もちろん、本実施例において音声を用いるこ
となく、表示装置を具備したシステムにおいて、文字入
力あるいは出力を行うシステムとして実施することも可
能である。
【0050】最初に、本実施例における全体の処理の流
れについて図面を参照しながら説明する。図5に本実施
例にかかる賃貸住宅検索システムにおける処理の流れ図
を示す。
【0051】図5において、まずユーザは、データベー
スに対する検索コマンドを入力する(ステップS50
1)。例えば、ユーザが音声で、「物件の場所は、東
京、広さが、70平米から90平米の賃貸物件の家賃相
場を知りたい。」と入力する。ここでワードスポッティ
ング等の技術を用いることにより、キー属性として、
「場所」、「広さ」を抽出し、それぞれのキー属性値
が、「東京」、「70平米から90平米」であることを
認識する。同様に、目標属性として、「家賃相場」を抽
出し、データベースに登録されている物件のうち、入力
されたキー属性値によって抽出される目標属性である物
件の「家賃相場」を出力として求めることになる。な
お、入力については、簡易な音声コマンドや、携帯電話
のボタン、キーボード等を用いて入力するものであって
も良い。
【0052】また、検索コマンドとして目標属性値の絞
り込み度合についても入力する。例えば目標属性「家賃
相場」に対して、目標属性値の(最大値−最小値)の幅
が、全体の5%以内に収まる範囲を示す指標値η(目
標)等を指標として入力することになる。なお、かかる
指標は検索コマンドとして入力することに限定されるも
のではなく、目標属性値ごとに事前に設定しておくもの
であっても良い。
【0053】次に、情報検索を実行することで、各キー
属性ごとの目標属性値のバラツキ度合を示すキー属性別
分布度合を算出する(ステップS502)。すなわち、
キー属性の選択の仕方によっては、目標属性値の分布度
合も変動することから、どのキー属性を検索条件とすれ
ば目標属性値が収束しやすいのかを知るために必要な情
報となる。
【0054】例えば、賃貸住宅検索システムにおけるデ
ータベースが図6に示すような構造で構成されている場
合においては、入力されたキー属性である「場所」、及
び「広さ」について、各々の属性値の分布度合を求める
ことになる。分布度合の表し方については様々なものが
考えられるが、キー属性「場所」については目標属性値
の出現頻度η(場所)により、キー属性「広さ」につい
ては目標属性値の(最大値−最小値)の範囲が全体に占
める割合η(広さ)により、それぞれ表すものとする。
【0055】次に、入力されたキー属性ごとの目標属性
値の分布度合を組み合わせることによって、入力された
キー属性による目標属性値の総合分布度合を算出する
(ステップS503)。具体的には、キー属性「場所」
と「広さ」を合わせた総合的な判断指標η(総合)を求
めることになる。なお、算出方法については特に限定さ
れるものではない。
【0056】そして、目標属性値の絞り込み度合と、目
標属性値の総合分布度合とを比較して(ステップS50
4)、算出した総合分布度合が絞り込み度合の範囲内に
収まっていないと判定された場合には(ステップS50
4:No)、検索結果の概要を出力するのに十分な絞り
込みが行われていないものと判断して、ユーザに対し
て、さらに絞りこみを行うよう、まだユーザに指定され
ていないキー属性の属性値の入力を促す(ステップS5
05)。ここで指定されるキー属性は、キー属性別分布
度合の最も小さい、すなわち最も検索結果が収束するこ
とが期待できるキー属性を選択するものとする。
【0057】具体的には、指標η(総合)と指標η(目
標)とを比較して、指標η(目標)の方が小さい場合
に、キー属性として選択されていないキー属性であっ
て、かつキー属性別分布度合の最も小さい、すなわち指
標η(築年)が最も小さいキー属性である「築年」につ
いて入力を促すメッセージを出力することになる。
【0058】また、算出した総合分布度合が絞り込み度
合の範囲内に収まっていると判定された場合には(ステ
ップS504:Yes)、検索結果を表示するプロンプ
トを生成することになる(ステップS506)。例え
ば、「該当する物件の家賃は、10万円から15万円の
間です。」というようにメッセージ・プロンプトを生成
し、表示出力、あるいは音声出力する(ステップS50
7)。
【0059】目標属性値の最大値及び最小値から分布度
合を判定する方法について、さらに具体的に説明する。
すなわち、入力されたキー属性に基づく検索結果の最小
値及び最大値を検出し、当該最大値と最小値で挟まれた
範囲が、データベース全体における目標属性値の最大値
と最小値で挟まれた範囲内において占める割合を算出す
る。当該割合が一定の値以下、(例えば5%以下)なら
ば、分布度合の小さい十分に絞り込まれた検索結果であ
るものと判定し、ユーザに対して、該当する目標属性値
の最小値及び最大値を説明するプロンプトを生成する。
【0060】例えば、図6に示すデータベースの例にお
いて、検索結果の最大値が12万円、最小値が10万円
だったとする。この時、データベース全体で、10万円
から12万円の物件のデータが、全体の5%以下であっ
た場合には、「該当する物件の家賃は、10万円から1
2万円の間です。」というプロンプトを作成することに
なる。
【0061】さらに、データベースを検索した結果、目
標属性値「家賃相場」のほとんどが、10万円から12
万円の間にあるが、一部例外的に、5万円や50万円の
物件が含まれている場合も考えられる。例えば、検索結
果の最大値及び最小値を検出し、データベース全体で、
最小値と最大値の範囲内に収まるデータの全体のデータ
数における割合を算出した結果、当該割合が一定の値を
超えてしまった(例えば5%より大きい)ものとする。
この場合、図5に示す流れ図においては、十分に絞り込
みがなされていないものと判定される(ステップS50
4)。
【0062】しかし、この場合は、「該当する物件のほ
とんどは、10万円から12万円の間にあります。」と
出力することの方がユーザにとって役立つ情報を提供す
ることになる。したがって、検索結果の上位及び下位の
何%かを切り捨てて、例外的な異常値を除去してから最
大値及び最小値を検出し、全体に占める割合を算出する
ことが考えられる。例えば、上位5%及び下位5%の検
索結果を切り捨てた結果、全体の占める割合が所定の値
以下(例えば5%以下)になった場合、「検索結果の9
0%は、10万円から12万円の間にあります。」とい
うプロンプトを生成することで、ユーザにとって役立つ
情報を提供することが可能となる。
【0063】また、異常値を除去した場合であっても、
データベース全体に占める割合が所定の割合を下回らな
い場合においては、除去するデータの割合を少しずつ増
加させる方法も考えられる。例えば、上位5%及び下位
5%では所定の割合を下回らないが、上位10%及び下
位10%ならば、下回るという場合を想定すると、この
場合には「検索結果の80%は、10万円から12万円
の間にあります。」というプロンプトを生成することが
妥当である。
【0064】なお、プロンプトの生成は、上限値及び下
限値に限定されるものではなく、平均値や中央値、分散
等、その他の記述統計量を用いるものであれば何でも良
い。
【0065】また、目標属性値が数値ではなく、東向
き、南向き等の名義尺度である場合も考えられる。この
場合、まず検索された結果としての目標属性値の頻度
(度数)分布を求める。そして、目標属性値のうち、最
大の度数を有する目標属性値が、検索結果全体の中で占
めている割合を算出する。その割合が一定以上ならば
(例えば80%以上)、ユーザに、当該目標属性値をお
およその値として説明することが可能となる。例えば、
検索結果の中で「東向き」の物件が85%を占めている
場合、「85%の物件は、東向きです。」と出力するこ
とができる。
【0066】さらに、上述したような上位一件の目標属
性値の頻度で説明するのではなく、エントロピーを利用
することも考えられる。ここでエントロピーは、データ
の乱雑さの指標であり、乱雑さが低い場合には分布度合
が低いものと判定することができる。
【0067】この場合、エントロピーとして、各名義尺
度の出現確率の対数を取り、対数値の加重平均を非負に
することによって求めることができる。こうすること
で、最大の度数を有する目標属性値が検索結果全体の中
で占めている割合が高くない場合であり、かつエントロ
ピーが低い場合についても対応することができる。
【0068】すなわち、検索結果として「東向き」の物
件が40%であり、「南向き」の物件が45%である場
合、「東向き」と「南向き」の物件を合わせると全体で
85%になり、分布度合の小さい検索結果となっている
ものと考えられる。この場合、「85%の物件は、東向
き、あるいは南向きです。」のように出力することが可
能となる。
【0069】また、一つの名義尺度については、ほとん
ど検索されることが無く、その他の名義尺度について
は、均等に検索されているような場合には、たとえば、
「北向きの物件は、ほとんどありません。」のようなプ
ロンプトを生成することができる。前述した「家賃相
場」のような数値についても、価格帯に写像すること
で、名義尺度に変換することも可能である。
【0070】次に、上述したような方法を用いたので
は、概要プロンプトを出力できない場合について説明す
る。例えば、検索結果が5万円から20万円の範囲にあ
り、データベース全体の中で当該範囲内にある物件が5
0%であることから、分布度合が大きいとと判定された
場合等である。
【0071】図7に、かかる場合に対応した対話型情報
検索装置における処理の流れ図を示す。まずユーザによ
ってキー属性として指定されていない属性を一つずつ選
択し(ステップS701)、選択された当該キー属性に
対する属性値が数値である場合には、名義尺度へと変換
する(ステップS702)。
【0072】次に、選択された当該キー属性が有する名
義尺度に基づいて目標属性値を分類し(ステップS70
3)、各分類された目標属性値ごとに分布度合の加重平
均を算出する(ステップS704)。一方、分類された
目標属性値に基づいて生成される概要プロンプトの出力
長さについても算出する(ステップS705)。
【0073】そして、目標属性値ごとの分布度合の加重
平均が最小、あるいは出力長さの逆数が最小であるキー
属性を選択することになる(ステップS706)。すな
わち、前者では目標属性値のバラツキ具合が最も小さく
なることが期待でき、後者では出力プロンプトが最も端
的に分布特性を表現したものであることが期待できるか
らである。
【0074】最後に、概要プロンプトの出力長さが所定
の制限値を超えているか否かを判断し(ステップS70
7)、所定の制限値以内である場合にのみ(ステップS
707:Yes)概要プロンプトを出力することになる
(ステップS708)。
【0075】このように、ユーザによって指定されてい
ないキー属性によって分類することで分布度合がより小
さくなる場合には、ユーザに次のキー属性について属性
値の入力を促すよりも、より効率的なプロンプトを出力
できる可能性がある。例えば、駐車場の有無で分類した
結果、「駐車場有り」の場合には目標属性値「家賃相
場」が19万円から20万円の間であるのに対し、「駐
車場無し」の場合には、目標属性値「家賃相場」が5万
円から8万円の範囲にあり、それぞれデータベース全体
の中で当該範囲内にある目標属性値が10%以下である
場合、「駐車場有りの場合は、19万円から20万円で
す。ない場合は、5万から8万円です。」のようにプロ
ンプトを出力することができる。なお、分類しようとす
るキー属性が、価格のように名義尺度でない場合は、そ
れをいくつかの価格帯に分類することで、名義尺度に変
換することで対応可能である。
【0076】なお、ユーザによって指定されていないキ
ー属性によって分類する方法は、特に上記方法に限定さ
れるものではない。また、どのキー属性を選択するかに
ついては、最も分布度合が小さいと考えられるキー属性
を選択することが望ましい。
【0077】具体的には、最も分布度合が小さいキー属
性を選択する指標として、各分類における目標属性値の
分布度合の加重平均を用いることができる。例えば、
「駐車場の有無」を選択されたキー属性とした場合、
「駐車場有り」の物件は、19万円から20万円に分布
しており、データベース全体におけるその価格帯の物件
の8%を占めており、「駐車場無し」の物件は、5万円
から8万円に分布しており、その価格帯の物件の5%を
占めているものとする。
【0078】「駐車場有り」の物件が、「駐車場無し」
の物件の2倍検出されているものとすると、分布度合を
表す指標としては、(2×8+1×5)/(2+1)=
7%と求めることができる。
【0079】一方、キー属性「部屋の向き」で分類した
場合、「南向き」の物件は、19万円から20万円に分
布しており、データベース全体におけるその価格帯の物
件の5%を占めており、「東向き」の物件は、15万円
から16万円に分布しており、データベース全体におけ
るその価格帯の物件の10%を占めており、「西向き」
の物件は、12万から13万円に分布しており、データ
ベース全体におけるその価格帯の物件の5%、「北向
き」の物件は、5万円から8万円に分布しており、デー
タベース全体におけるその価格帯の物件の3%を、それ
ぞれ占めているものとする。
【0080】それぞれの物件数の比率が、3:3:2:
1だったとすると、分布度合を表す指標としては、(3
×5+3×10+2×5+3×1)/(3+3+2+
1)=6.4%と求めることができる。
【0081】したがって、キー属性「部屋の向き」で分
類した方が、キー属性「駐車場の有無」で分類するより
も分布度合が小さくなることから、この場合キー属性
「部屋の向き」を選択する方が効果的であることがわか
る。なお、キー属性値が名義尺度である場合は、各々の
属性値の度数分布から求まる最大頻度の加重平均や、エ
ントロピーの加重平均を用いることで、同様の処理を行
うことが可能となる。
【0082】また、出力される概要プロンプトの長さが
最も短いものを選択するという観点から考えると、キー
属性「駐車場の有無」によって分類した場合は、「駐車
場有りの物件は、19万円から20万円です。「駐車場
無し」の物件は、5万から8万円です。」となる。一
方、キー属性「部屋の向き」で分類した場合は、「南向
きの物件は、19万円から20万円です。東向きは、1
5万円から16万円、西向きは、12万から13万円、
北向きは、5万円から8万円です。」のようになり、キ
ー属性「駐車場の有無」で分類した方が概要プロンプト
の長さが短くなる。
【0083】なお、概要プロンプトが最も短い場合であ
っても、出力表示機器によるハードウェア的制限や、音
声出力による冗長性の限界から、一定の長さ制限が存在
する。したがって、ある一定の長さを超えている場合に
は、ユーザとの対話によって、さらなる絞り込みを行う
必要がある。
【0084】なお、本発明の実施の形態にかかる対話型
情報検索装置を実現するプログラムは、図8に示すよう
に、CD−ROM82−1やフレキシブルディスク82
−2等の可搬型記録媒体82だけでなく、通信回線の先
に備えられた他の記憶装置81や、コンピュータ83の
ハードディスクやRAM等の記録媒体84のいずれに記
録されるものであっても良く、プログラム実行時には、
プログラムはローディングされ、主メモリ上で実行され
る。
【0085】また、本発明の実施の形態にかかる対話型
情報検索装置により生成された総合分布度合等について
も、図8に示すように、CD−ROM82−1やフレキ
シブルディスク82−2等の可搬型記録媒体82だけで
なく、通信回線の先に備えられた他の記憶装置81や、
コンピュータ83のハードディスクやRAM等の記録媒
体84のいずれに記録されるものであっても良く、例え
ば本発明にかかる対話型情報検索装置を利用する際にコ
ンピュータ83により読み取られる。
【0086】
【発明の効果】以上のように本発明にかかる対話型情報
検索装置によれば、音声のみによって対話するシステム
や、携帯電話などの小画面でしか検索結果を表示できな
いシステムでの情報検索において、ユーザが指定したキ
ー属性の属性値を有する目標属性の属性値の分布度合に
応じて、実際に情報検索を行う前に、さらなる絞り込み
検索を行う必要が有るか否かを判定することができるこ
とから、キー属性情報追加のためのユーザとの対話を最
小限に抑えることができる。また、絞り込みの度合をユ
ーザが設定することで、ユーザの意図に応じて、情報検
索結果を絞り込むことができ、かつ、そこへ到達するま
での対話回数を減らすことが可能となる。
【0087】また、キー属性の属性値を追加入力させる
場合に、最も分布度合を小さくするのに効果的なキー属
性から順に入力させることができ、ユーザとの対話回数
を最小にすることができる。
【図面の簡単な説明】
【図1】 本発明の実施の形態にかかる対話型情報検索
装置の構成図
【図2】 本発明の実施の形態にかかる対話型情報検索
装置におけるキー属性制御手段の構成図
【図3】 分布度合の説明図
【図4】 本発明の実施の形態にかかる対話型情報検索
装置における処理の流れ図
【図5】 本発明の実施例にかかる対話型情報検索装置
における処理の流れ図
【図6】 本発明の実施例にかかる対話型情報検索装置
における情報蓄積手段(データベース)のデータ構造図
【図7】 本発明の実施例にかかる対話型情報検索装置
における絞り込み処理の流れ図
【図8】 コンピュータ環境の例示図
【符号の説明】
1 ユーザコマンド入力手段 2 情報検索手段 3 情報蓄積手段 4 検索処理手順制御手段 5 検索結果出力手段 41 総合分布度合算出部 42 キー属性別分布度合算出部 43 総合分布度合判定部 44 上位キー属性情報入力依頼部 45 判定基準入力・更新部 81 回線先の記憶装置 82 CD−ROMやフレキシブルディスク等の可搬型
記録媒体 82−1 CD−ROM 82−2 フレキシブルディスク 83 コンピュータ 84 コンピュータ上のRAM/ハードディスク等の記
録媒体
───────────────────────────────────────────────────── フロントページの続き (72)発明者 瀬川 智子 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 大塚 巌 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 渡辺 一宏 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B075 QM05 QS20

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 複数の属性とその属性値によって構成さ
    れるデータ構造を有するデータを蓄積する情報蓄積手段
    と、 ユーザが取得を希望する目標属性と、データの絞り込み
    を行うためのキー属性と、前記キー属性の属性値を入力
    するユーザコマンド入力手段と、 前記キー属性と、前記キー属性の属性値を用いて前記目
    標属性の属性値を検索する情報検索手段と、 前記情報検索手段における検査結果を出力する検索結果
    出力手段を具備する対話型情報検索装置であって、 入力された前記キー属性と前記キー属性の属性値に基づ
    いて、前記目標属性の属性値の分布度合を算出し、前記
    分布度合が所定の範囲内に収束している場合にのみ検索
    結果として出力するよう制御する検索処理手順制御手段
    を含むことを特徴とする対話型情報検索装置。
  2. 【請求項2】 前記検索処理手順制御手段において、前
    記分布度合が所定の範囲内に収束していない場合には、
    前記キー属性と、前記キー属性の属性値の追加入力を促
    すメッセージを出力する請求項1記載の対話型情報検索
    装置。
  3. 【請求項3】 前記検索処理手順制御手段が、 前記キー属性ごとに前記目標属性の属性値の第1の分布
    度合を算出するキー属性別分布度合算出部と、 入力された前記キー属性と前記キー属性の属性値、及び
    前記第1の分布度合に基づいて、入力された全キー属性
    に対する目標属性の属性値の第2の分布度合を算出する
    総合分布度合算出部と、 算出された前記第2の分布度合に基づいて、前記第2の
    分布度合が所定のしきい値よりも小さいか否かを判定す
    る総合分布度合判定部とを含み、 前記第2の分布度合が所定のしきい値以下である場合
    に、前記分布度合が所定の範囲内に収束していると判定
    する請求項1又は2記載の対話型情報検索装置。
  4. 【請求項4】 前記検索処理手順制御手段において、前
    記第2の分布度合が所定のしきい値よりも大きい場合
    に、入力された前記キー属性を除く他のキー属性であっ
    て、前記第1の分布度合が最も小さい前記他のキー属性
    についての属性値の入力を促すメッセージを出力する請
    求項3記載の対話型情報検索装置。
  5. 【請求項5】 前記第2の分布度合が所定のしきい値よ
    りも大きい場合に、入力された前記キー属性を除く他の
    キー属性であって、前記第1の分布度合が所定のしきい
    値よりも小さい前記他のキー属性及び前記他のキー属性
    についての属性値に関するメッセージを検索結果として
    出力する請求項3記載の対話型情報検索装置。
  6. 【請求項6】 前記他のキー属性が、前記第1の分布度
    合が所定のしきい値よりも最も小さい前記他のキー属性
    である請求項5記載の対話型情報検索装置。
  7. 【請求項7】 前記他のキー属性が、出力される前記他
    のキー属性及び前記他のキー属性についての属性値に関
    するメッセージが最も短くなる前記他のキー属性である
    請求項5記載の対話型情報検索装置。
  8. 【請求項8】 前記他のキー属性を、前記第1の分布度
    合及び前記メッセージの長さに基づいて算出される加重
    平均値を指標値として、前記指標値が最小である前記他
    のキー属性を選択する請求項5記載の対話型情報検索装
    置。
  9. 【請求項9】 複数の属性とその属性値によって構成さ
    れるデータ構造を有するデータを蓄積する工程と、 ユーザが取得を希望する目標属性と、データの絞り込み
    を行うためのキー属性と、前記キー属性の属性値を入力
    する工程と、 前記キー属性と、前記キー属性の属性値を用いて前記目
    標属性の属性値を検索する工程と、 検査結果を出力する工程を具備する対話型情報検索方法
    であって、 前記目標属性の属性値を検索する工程の前に、入力され
    た前記キー属性と前記キー属性の属性値に基づいて、前
    記目標属性の属性値の分布度合を算出し、前記分布度合
    が所定の範囲内に収束している場合にのみ検索結果とし
    て出力するよう制御する工程を含むことを特徴とする対
    話型情報検索方法。
  10. 【請求項10】 複数の属性とその属性値によって構成
    されるデータ構造を有するデータを蓄積するステップ
    と、 ユーザが取得を希望する目標属性と、データの絞り込み
    を行うためのキー属性と、前記キー属性の属性値を入力
    するステップと、 前記キー属性と、前記キー属性の属性値を用いて前記目
    標属性の属性値を検索するステップと、 検査結果を出力するステップを具備する対話型情報検索
    方法を実現するコンピュータに実行させるプログラムで
    あって、 前記目標属性の属性値を検索するステップの前に、入力
    された前記キー属性と前記キー属性の属性値に基づい
    て、前記目標属性の属性値の分布度合を算出し、前記分
    布度合が所定の範囲内に収束している場合にのみ検索結
    果として出力するよう制御するステップを含むことを特
    徴とするコンピュータに実行させるプログラム。
JP2001221558A 2001-07-23 2001-07-23 対話型情報検索装置 Withdrawn JP2003036271A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001221558A JP2003036271A (ja) 2001-07-23 2001-07-23 対話型情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001221558A JP2003036271A (ja) 2001-07-23 2001-07-23 対話型情報検索装置

Publications (1)

Publication Number Publication Date
JP2003036271A true JP2003036271A (ja) 2003-02-07

Family

ID=19055206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001221558A Withdrawn JP2003036271A (ja) 2001-07-23 2001-07-23 対話型情報検索装置

Country Status (1)

Country Link
JP (1) JP2003036271A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006113683A (ja) * 2004-10-12 2006-04-27 Patolis Corp 文献検索支援装置、その方法、文献検索装置、それらのプログラム、および、そのプログラムを記録した記録媒体
JP2009193457A (ja) * 2008-02-15 2009-08-27 Oki Electric Ind Co Ltd 情報検索装置、方法及びプログラム
JP2010541092A (ja) * 2007-10-08 2010-12-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンテンツ品目のコレクションと関連のメタデータ生成
JP2016062333A (ja) * 2014-09-18 2016-04-25 株式会社日立製作所 検索サーバ、及び検索方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006113683A (ja) * 2004-10-12 2006-04-27 Patolis Corp 文献検索支援装置、その方法、文献検索装置、それらのプログラム、および、そのプログラムを記録した記録媒体
JP2010541092A (ja) * 2007-10-08 2010-12-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンテンツ品目のコレクションと関連のメタデータ生成
JP2009193457A (ja) * 2008-02-15 2009-08-27 Oki Electric Ind Co Ltd 情報検索装置、方法及びプログラム
JP2016062333A (ja) * 2014-09-18 2016-04-25 株式会社日立製作所 検索サーバ、及び検索方法

Similar Documents

Publication Publication Date Title
CN107609101B (zh) 智能交互方法、设备及存储介质
JP5526396B2 (ja) 情報検索装置、情報検索システム及び情報検索方法
JP6820058B2 (ja) 音声認識方法、装置、デバイス、及び記憶媒体
CN107832286B (zh) 智能交互方法、设备及存储介质
US11423888B2 (en) Predicting and learning carrier phrases for speech input
US20230315266A1 (en) Method for creating short message and portable terminal using the same
CN107797984B (zh) 智能交互方法、设备及存储介质
US10521189B1 (en) Voice assistant with user data context
US7945864B2 (en) Operation assisting apparatus and operation assisting method
US20150019221A1 (en) Speech recognition system and method
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
US20090158175A1 (en) Communication support method, system, and server device
TW200842613A (en) Spell-check for a keyboard system with automatic correction
WO2012095696A2 (en) Text segmentation with multiple granularity levels
WO2013007210A1 (zh) 文字输入方法、装置及系统
CN110325987B (zh) 语境语音驱动深度书签
US20200210505A1 (en) Electronic apparatus and controlling method thereof
US11043215B2 (en) Method and system for generating textual representation of user spoken utterance
WO2020151690A1 (zh) 语句生成方法、装置、设备及存储介质
CN111460117B (zh) 对话机器人意图语料生成方法、装置、介质及电子设备
KR100725520B1 (ko) 문자입력횟수 적응 다중 입력창을 이용한 검색방법 및 그장치
US20120053937A1 (en) Generalizing text content summary from speech content
WO2015106646A1 (en) Method and computer system for performing audio search on social networking platform
JP2022117941A (ja) イメージ検索方法、装置、電子機器、及びコンピュータ読み取り可能な記憶媒体
US20210233520A1 (en) Contextual multi-channel speech to text

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081007