JPH09231237A - 情報検索方法及び装置 - Google Patents

情報検索方法及び装置

Info

Publication number
JPH09231237A
JPH09231237A JP8041908A JP4190896A JPH09231237A JP H09231237 A JPH09231237 A JP H09231237A JP 8041908 A JP8041908 A JP 8041908A JP 4190896 A JP4190896 A JP 4190896A JP H09231237 A JPH09231237 A JP H09231237A
Authority
JP
Japan
Prior art keywords
search
word
degree
solution set
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8041908A
Other languages
English (en)
Other versions
JP3435470B2 (ja
Inventor
Katsuto Bessho
克人 別所
Yoshiharu Tobe
美春 戸部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04190896A priority Critical patent/JP3435470B2/ja
Publication of JPH09231237A publication Critical patent/JPH09231237A/ja
Application granted granted Critical
Publication of JP3435470B2 publication Critical patent/JP3435470B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 単純検索よりも優れた精度を持ち、案内情報
を即座に反映できるような検索知識を自動的に作成可能
な情報検索方法及び装置を提供することを目的とする。 【解決手段】 本発明は、検索語を入力し、案内対象の
営業内容等の説明テキストを検索する情報検索方法にお
いて、説明テキストを単語に分解し、案内対象を単語の
集合で表し、該単語の出現頻度情報に基づいて、検索語
と単語間の想起度、検索語と案内対象間の関連度を算出
して、検索解集合を求める。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索方法及び
装置に係り、特に、業種別の情報案内サービス等に用い
るための案内対象の検索を行う情報検索方法及び装置に
関する。
【0002】
【従来の技術】検索語を入力し、案内対象を検索する方
法として、入力された検索語が説明テキストに出現する
ような案内対象を検索する単純検索がある。また、業種
別の情報案内の情報検索おいては、業種分類体系、案内
対象と業種との対応関係、検索語と業種との対応関係等
の検索知識を人手によって構築し、この検索知識を用い
て、入力された検索語から案内対象を検索している。
【0003】図5は、従来の方法による検索知識の構成
例を示す。同図に示す検索知識は、検索語、業種分類体
系から構成され、例えば、利用者から「テレビを販売し
ている店」という要求から、オペレータが検索語『テレ
ビ』を入力すると、当該検索語で業種分類体系の『家庭
電器』を検索する。さらに、業種分類体系において、当
該『家庭電器』の業種に従属する案内対象の集合{X
店、Z店}が示される。オペレータは、当該案内対象の
集合を利用者に案内する。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の方法における単純検索では、入力された検索語で検
索したい案内対象が検索されなかったり、逆に検索した
くない案内対象でたまたま説明テキストに検索語を含む
ものが検索されてしまうことがある。例えば、利用者か
ら、「テレビで宣伝しているレストラン」という問い合
わせがあった場合に、上記の内容から形態素解析して
“テレビ”、“で”、“宣伝”、“している”、“レス
トラン”が得られ、これから、検索語として『テレビ』
を入力して単純検索を行うと、本来“レストラン”より
当該レストラン名の候補を案内しなければならいにも関
わらず、「テレビ販売店」が案内対象として検索されて
しまうことがある。このように、検索語「テレビ」に大
して単純検索すると、案内対象Eは該当するにも係わら
ず、単語「テレビ」が説明テキストにないため検索され
ないことになり、再現性の問題がある。また、案内対象
Fは該当にしないにもかかわらず、たまたま説明テキス
トに単語「テレビ」があるため、検索されてしまい、適
合性の問題があある。
【0005】これを改善するために、前述の人手作業に
よって構築された検索知識を利用して検索が行われてい
る訳であるが、検索知識の構築に多大なコストを要する
と共に、膨大な時間を要することにより、新しい業種ヘ
の対応が遅れ、適切な案内対象が検索されないという問
題がある。
【0006】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、単純検索よりも優れた
精度を持ち、案内情報を即座に反映できるような検索知
識を自動的に作成可能な情報検索方法及び装置を提供す
ることを目的とする。
【0007】
【課題を解決するための手段】本発明は、検索語を入力
し、案内対象の営業内容等の説明テキストを検索する情
報検索方法において、説明テキストを単語に分解し、案
内対象を単語の集合で表し、該単語の出現頻度情報に基
づいて、検索語と単語間の想起度、検索語と案内対象間
の関連度を算出して、検索解集合を求める。
【0008】図1は、本発明の原理を説明するための図
である。本発明の情報検索方法は、各案内対象の説明テ
キストを形態素解析により単語に分解する単語分解過程
(ステップ1)と、入力された検索語が説明テキストに
出現するような案内対象の集合を仮検索解集合として導
出する単純検索過程(ステップ2)と、説明テキストの
単語の出現頻度情報に基づいて、検索語と単語分解過程
で求められた各単語との関連の度合いを想起度として算
出する想起度算出過程(ステップ3)と、想起度算出過
程(ステップ3)により求められた単語の想起度に基づ
いて、検索語と仮検索解集合の各々の関連度を算出する
関連度算出過程(ステップ4)と、関連度算出過程(ス
テップ4)により求められた関連度が所定の閾値以上の
案内対象の集合を、新たな仮検索解集合として導出する
仮検索解集合更新過程(ステップ5)と、想起度算出過
程(ステップ3)、関連度算出過程(ステップ4)、仮
検索解集合更新過程(ステップ5)を繰り返し行うか否
かを決定する繰り返し操作判定過程(ステップ6)と、
繰り返し操作判定過程(ステップ6)において、否と判
定された場合に、最終的な仮検索解集合を検索解集合と
して出力する検索解集合出力過程(ステップ7)からな
る。
【0009】また、本発明の情報検索方法は、単語分解
過程(ステップ1)で取得される各単語を検索語とし
て、単純検索過程(ステップ2)から検索解集合出力過
程(ステップ7)までの処理を実施しておくことによ
り、全ての検索語と検索解集合の対を予め作成し、検索
語が入力された場合に、検索語と検索解の対を利用す
る。
【0010】また、本発明の繰り返し操作判定過程(ス
テップ6)において、仮検索解集合更新過程で取得した
仮検索解集合と、1巡前に得られた仮検索解集合とが一
致した時点で、繰り返し操作を終了する。また、本発明
の繰り返し操作判定過程(ステップ6)において、繰り
返し操作を任意に固定した回数で終了する。
【0011】また、本発明の想起度算出過程(ステップ
3)において、仮検索集合の中に多く出現し、該仮検索
集合の補集合の中に出現する頻度が少ない単語と検索語
との間に高い想起度を与える。また、本発明の関連度算
出過程(ステップ4)において、想起度算出過程で求め
られた検索語と各案内対象が有する単語との間の想起度
の平均を関連度とする。
【0012】また、本発明の仮検索解更新過程(ステッ
プ5)において、所定の閾値を全案内対象の関連度の平
均の定数倍とする。図2は、本発明の原理構成図であ
る。本発明は、入力された検索語に基づいて案内対象を
検索する情報検索装置であって、各案内対象の説明テキ
ストを形態素解析により単語に分解する単語分解手段1
と、入力された検索語が説明テキストに出現するような
案内対象の集合を仮検索解集合として導出する単純検索
手段2と、説明テキストの単語の出現頻度情報に基づい
て、検索語と各単語との関連の度合いを想起度として算
出する想起度算出手段3と、想起度算出手段3により求
められた単語の想起度に基づいて、検索語と仮検索解集
合の各々の関連度を算出する関連度算出手段4と、関連
度算出手段4により求められた関連度が所定の閾値以上
の案内対象の集合を、新たな仮検索解集合として仮検索
解集合記憶手段6の仮検索解集合を更新する仮検索解集
合更新手段5と、想起度算出手段3、関連度算出手段
4、仮検索解集合更新手段5を繰り返し行うか否かを決
定する繰り返し操作判定手段6と、繰り返し操作判定手
段6において、否と判定された場合に、最終的な仮検索
解集合を検索解集合として出力する検索解集合出力手段
8とからなる。
【0013】また、本発明の情報検索装置は、単語分解
手段で取得される各単語を検索語として、単純検索手段
2から検索解集合出力手段8までの処理を実施しておく
ことにより、全ての検索語と検索解集合の対を予め作成
する検索対応情報生成手段と、検索語が入力された場合
に、検索対応情報生成手段において生成された検索語と
検索解の対を利用する検索手段を更に有する。
【0014】また、上記の想起度算出手段3は、仮検索
集合の中に多く出現し、該仮検索集合の補集合の中に出
現する頻度が少ない単語と検索語との間に高い想起度を
与える手段を含む。また、上記の関連度算出手段4は、
想起度算出手段3で求められた検索語と各案内対象が有
する単語との間の想起度の平均を関連度とする。
【0015】また、上記の仮検索解集合更新手段5は、
所定の閾値を全案内対象の関連度の平均の定数倍とす
る。また、上記の繰り返し操作判定手段7は、仮検索解
更新手段5で取得した仮検索解集合と、1巡前に得られ
た仮検索解集合記憶手段6に格納されている仮検索解集
合とが一致した時点で、繰り返し操作を終了する第1の
終了判定手段を含む。
【0016】また、上記の繰り返し操作判定手段7は、
繰り返し操作を任意に固定した回数で終了する第2の終
了判定手段を含む。また、本発明の情報検索装置は、検
索解集合出力手段8により出力された検索解集合のうち
正解となる集合の数を正解集合の数で除した値を再現率
とし、該検索解集合のうち正解の数を検索された検索解
集合の数で除した値を適合率として、仮検索解集合の精
度を評価する評価手段を更に有する。
【0017】また、仮検索解集合更新手段5は、所定の
閾値以上の関連度を有する仮検索解集合のみを仮検索解
集合記憶手段6に格納する閾値比較手段を含む。これに
より、本発明は、検索語と関連付けられた単語の重みを
考慮して、検索語と案内対象間の関連度を算出するの
で、単純検索よりも一般に高い精度が得られる。
【0018】また、案内対象に関する説明テキストデー
タさえあれば、自動的に検索知識(検索語・単語間の想
起度、検索語、案内対象間の関連度、検索語と仮検索解
集合との対等)を構築するので、検索知識構築における
コストを大幅に削減できる。また、案内対象のデータが
検索知識に即座に反映することができる。
【0019】
【発明の実施の形態】図3は、本発明の情報検索システ
ム構成を示す。同図に示す情報検索システムは、形態素
解析部10、テキストファイル20、検索部30、想起
度算出部40、関連度算出部50、仮検索解集合更新部
60、仮検索解集合格納部70、繰り返し制御部80及
び検索解集合出力部90より構成される。
【0020】形態素解析部10は、案内対象の説明テキ
ストを形態素解析して単語に分解し、各案内対象の説明
テキストと共に、形態素解析済の名詞のみを抽出単語と
してテキストファイル20に格納する。検索部30は、
オペレータから入力された検索語に基づいてテキストフ
ァイル20を検索し、説明テキストに出現するような案
内対象の説明テキストの集合(以下、仮検索解集合と記
す)を検索し、当該仮検索解集合及び、形態素解析済の
抽出単語を想起度算出部40に転送する。なお、オペレ
ータから入力される検索語は、抽出単語と一致をとるた
めに、名詞で入力されるものとする。
【0021】想起度算出部40は、入力された検索語と
抽出単語との関連の度合である想起度を算出する。想起
度は、検索部30により取得した仮検索解集合に含まれ
る抽出単語を有する案内対象の数と、出現頻度情報ファ
イル45から取得した抽出単語に対する案内対象の数に
おける比率である。
【0022】関連度算出部50は、想起度算出部40か
ら取得した検索語と案内対象に含まれる抽出語の間の想
起度の平均を求める。これにより、検索語を持たない案
内対象であっても検索語と関係の深い単語が多ければ関
連度は高くなく、検索語を持つ案内対象であっても、検
索語との関係がない単語が多ければ関連度は低くなる。
【0023】仮検索解更新部60は、所定の閾値以上の
案内対象を抽出し、新たな仮検索解集合として抽出し、
仮検索解集合格納部70に格納する。繰り返し制御部8
0は、想起度算出部40、関連度算出部50及び仮検索
解更新部60の繰り返し処理を所定の回数繰り返す。ま
たは、仮検索解集合格納部70に格納されている仮検索
解集合を参照して、1巡前に抽出された仮検索解集合と
現在求められた仮検索解集合とを比較して一致した場合
に繰り返し処理を終了する。
【0024】検索解集合出力部90は、繰り返し制御部
80により繰り返し処理が終了すると、当該繰り返し制
御部80を介して最終的な検索解集合を取得し、検索解
集合としてディスプレイ等に出力する。以下に、本発明
の検索方法を説明する。以下の各ステップは、図1に示
すフローチャートのステップ番号と一致するものとす
る。
【0025】ステップ1) 形態素解析部10は、案内
対象の営業内容等の説明テキストを形態素解析により単
語に分解し、ある程度の数以上の案内対象に出現する単
語のうち、主として名詞を抽出して、各案内対象を名詞
と案内対象の説明テキストによる集合としてテキストフ
ァイル20に格納する。
【0026】ステップ2) 次に、検索部30は、入力
された検索語Kを有する案内対象の集合を、仮検索解集
合として導出する。但し、検索語は、上記のステップ1
により単語分析過程によって抽出された単語に限定さ
れ、それ以外の単語が検索語として入力されても検索は
行わない。
【0027】ステップ3) 想起度算出部40は、検索
語Kとテキストファイル20に格納されている仮検索解
集合の各単語W間の想起率を以下の式(1)に基づいて
計算する。
【0028】
【数1】
【0029】ステップ4) 次に、関連度算出部50
は、検索語Kと各案内対象A間の関連度を以下の式
(2)に基づいて計算する。
【0030】
【数2】
【0031】A内の単語集合{W1 ,…,WN }(同一
単語は一つとする) ステップ5) 仮検索解更新部60は、関連度の閾値
を、全案内対象の関連度の平均の定数倍とし、関連度が
その閾値以上の案内対象の集合を新たな仮検索解集合と
して導出して仮検索解集合格納部70に格納する。
【0032】ステップ6) 上記の処理のステップ3、
ステップ4、ステップ5を繰り返すか否かの判定を行
う。判定方法としては、最新の仮検索解集合と仮検索解
集合格納部70に格納されているその一つ前の仮検索解
集合を比較して、一致した時点で繰り返し操作を終了す
る。また、繰り返し操作を所定の回数に達した場合に終
了する。繰り返し操作を継続する場合、最新の仮検索解
集合を用いて、再びステップ3以降の処理を行う。
【0033】ステップ7) 上記のステップ6において
繰り返し操作終了の判定がされると、最終的に得られた
仮検索解集合を、検索解集合としてディスプレイ等に出
力する。なお、上記のステップ6における繰り返し操作
の各段階での仮検索解集合の精度は再現率(式3)と適
合率(式4)によって評価される。
【0034】
【数3】
【0035】上記のステップ3における想起度算出過程
において、想起度算出部40は、式1が示す通り、仮検
索解集合の中に多く出現し、その補集合の中に少なく出
現する単語と検索語との間に高い想起度を与えるように
なっているため、これによって決まる単語と検索語間の
想起度は、仮検索解集合が正解集合と極端にずれていな
い限り、検索語から連想される単語ほど高い想起度を示
すようになる。
【0036】上記のステップ4における関連度算出過程
において、関連度算出部50は、式2が示す通り、検索
語と各案内対象がもつ単語との間の想起度が平均の関連
度としているため、例えば、検索語をもたない案内対象
であっても、想起度の高い単語を多く含む案内対象は関
連度が高くなり、一方、検索語をもっている案内対象で
あっても、想起度の高い単語が少なければ関連度は低く
なる。
【0037】以上のように、想起度、関連度が計算され
るため、ステップ5における仮検索解集合更新過程で新
たに得られる仮検索解集合の精度は、一般的に前回の仮
検索解集合の精度より向上することが期待される。その
結果、新たに得られた仮検索解集合は、前回の仮検索解
集合よりも正解集合に近づくことが期待され、この新た
に得られた仮検索解集合を基に、同様の処理を行うこと
により、更に、仮検索解集合の精度の向上が期待でき
る。
【0038】
【実施例】以下、本発明の実施例を図面と共に説明す
る。以下の説明において、表1の内容により、検索語を
『テレビ』として説明する。
【0039】
【表1】
【0040】(1) 単語分解過程 それぞれの説明テキストを形態素解析し、主として名詞
を抽出し、各案内対象をそのような単語の集合とする。
このとき、例えば、BやIではそれぞれ「電気」、「料
理」といった単語が同一案内対象に2回以上出現する
が、本発明では、その点については考慮しないものとす
る。さらに、単語をある程度の数以上の案内対象に出現
するものだけに限定する。この例では、一つ以上の案内
対象に出現する単語とする。
【0041】(2) 単純検索過程 単語分解過程の結果得られた全単語の集合をSとする。
ここでSは、 S={電気、製品、テレビ、エアコン、器具、家電、照
明、割烹、解析、料理、山菜、肉、魚} となる。
【0042】Sの中から一つの単語が検索語Kとして入
力されたものとする。例えば、『テレビ』が入力され
る。これにより、検索語Kをもつ案内対象の集合X0
は、 X0={A,B,C,D,F} となり、これを仮検索解集合とする。
【0043】(3) 想起度算出過程(i) 検索語KとSの各単語Wとの間の想起度を前述の式1で
計算する。例えば、Wが「電気」ならば、Wをもつ案内
対象の集合は、{A,B,E}となり、Wを持つ案内対
象で仮検索解集合に含まれるものの集合は{A,B}と
なり、上記の式1の値は2/3となる。
【0044】上記の各単語の想起度は以下のようにな
る。 電気=2/3,製品=1/1,テレビ=5/5,エアコ
ン=3/4 器具=2/3,家電=2/3,照明=1/1,割烹=1
/3,懐石=1/2,料理=1/3,山菜=0/2,肉
=0/1,魚=0/1 (4) 関連度算出過程(i) 次に、検索語Kと任意の案内対象Qとの関連度をKとQ
が持つ単語との間の想起度の平均を算出する。例えば、
案内対象Bの関連度は、 (2/3+2/3+2/3+5/5)/4=3/4 となる。
【0045】各案内対象の関連度は以下のようになる。 A=41/48 B=3/4 C=29/36 D=4
1/48 E=11/16 F=13/24 G=2/9 H=5
/18 I=1/9 (5) 仮検索解集合更新過程 (i) 関連度の閾値を、全案内対象の関連度の平均値(245
/432)の定数(1とする)倍とすると、新たな仮検
索解集合X1は、 X1={A,B,C,D,E} となる。
【0046】(6) 繰り返し操作判定過程 (i) X0とX1は、一致しないので継続とする。 (7) 想起度算出過程 (ii) 新たな仮検索解集合X1を用いて、再び検索語KとSの
各単語W間の想起度を前述の式1で計算する。
【0047】例えば、Wが「テレビ」ならば、Wをもつ
案内対象の集合は、 {A,B,C,D,F} となり、Wをもつ案内対象で仮検索集合に含まれるもの
の集合は、 {A,B,C,D} となり、想起度は、4/5となる。
【0048】各単語の想起度は以下のようになる。 電気=3/3,製品=1/1,テレビ=4/5,エアコ
ン=4/4 器具=3/3,家電=3/3,照明=1/1,割烹=0
/3,懐石=0/2,料理=0/3,山菜=0/2,肉
=0/1,魚=0/1 (8) 関連度算出過程(ii) 想起度算出過程(ii)で得られた各単語の想起度を用
いて、再び、各案内対象の関連度を同様に、それがもつ
単語の想起度平均として求める。
【0049】例えば、案内対象Bの関連度は、 (3/3+3/3+3/3+4/5)/4=19/20 となる。各案内対象の関連度は以下のようになる。
【0050】A=19/20 B=19/20 C=1
4/15 D=19/20 E=1 F=1/5 G=0 H=0 I=0 (9) 仮検索解集合更新過程(ii) 関連度の閾値は全案内対象の関連度の平均値(299/
540)の1倍となり、新たな仮検索解集合X2は、 X2={A,B,C,D,E} となる。
【0051】(10) 繰り返し操作判断過程 (i
i) X1とX2は一致するので、繰り返し操作を終了する。 (11) 検索解出力過程 検索語「テレビ」に対し、最終的な仮検索解集合X2を
検索解集合として出力する。
【0052】このように、繰り返し操作を続けることに
より、仮検索解の集合の精度の向上効果が期待でき、そ
の結果、最終的に得られる検索解集合の精度は単純検索
よりも大幅に改善可能となる。また、発明によれば、例
えば、検索解集合『A電気家電全般』が検索解集合とし
て取得されると、当該検索解集合と入力された検索語
『テレビ』とを対にして格納しておき、最初の検索部3
0による単純検索時において、当該検索語『テレビ』が
入力された場合には、当該検索解集合『A電気家電全
般』を直接検索するようなシステムを構築することも可
能である。
【0053】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で、種々変更・応用が可
能である。
【0054】
【発明の効果】上述のように、本発明の情報検索方法及
び装置によれば、検索知識を構築すると、その精度にお
いて多くの検索語に対して単純検索よりも大幅な改善効
果が期待できる。
【0055】また、本発明は、案内対象の説明テキスト
のみから検索知識を自動的に構築するので、人手作業の
コストが削減できると共に、案内対象のデータを検索知
識に即座に反映できる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の情報検索装置の構成図である。
【図4】本発明の一実施例の詳細な動作を示すフローチ
ャートである。
【図5】従来の検索知識の例を示す図である。
【符号の説明】
1 単語分割手段 2 単純検索手段 3 想起度算出手段 4 関連度算出手段 5 仮検索解集合更新手段 6 仮検索解集合記憶手段 7 繰り返し操作判定手段 8 検索解集合出力手段 10 形態素解析部 20 テキストファイル 30 検索部 40 想起度算出部 50 関連度算出部 60 仮検索解集合更新部 70 仮検索解集合格納部 80 繰り返し制御部 90 検索解出力部

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 検索語を入力し、案内対象の営業内容等
    の説明テキストを検索する情報検索方法において、 前記説明テキストを単語に分解し、 前記案内対象を単語の集合で表し、該単語の出現頻度情
    報に基づいて、検索語と単語間の想起度、検索語と案内
    対象間の関連度を算出して、検索解集合を求めることを
    特徴とする情報検索方法。
  2. 【請求項2】 各案内対象の前記説明テキストを形態素
    解析により単語に分解する単語分解過程と、 入力された検索語が前記説明テキストに出現するような
    案内対象の集合を仮検索解集合として導出する単純検索
    過程と、 前記説明テキストの単語の出現頻度情報に基づいて、前
    記検索語と前記単語分解過程で求められた各単語との関
    連の度合いを想起度として算出する想起度算出過程と、 前記想起度算出過程により求められた単語の前記想起度
    に基づいて、前記検索語と前記仮検索解集合の各々の関
    連度を算出する関連度算出過程と、 前記関連度算出過程により求められた関連度が所定の閾
    値以上の案内対象の集合を、新たな仮検索解集合として
    導出する仮検索解集合更新過程と、 前記想起度算出過程、前記関連度算出過程、前記仮検索
    解集合更新過程を繰り返し行うか否かを決定する繰り返
    し操作判定過程と、 前記繰り返し操作判定過程において、否と判定された場
    合に、最終的な仮検索解集合を検索解集合として出力す
    る検索解集合出力過程とからなる請求項1記載の情報検
    索方法。
  3. 【請求項3】 前記単語分解過程で取得される各単語を
    検索語として、前記単純検索過程から前記検索解集合出
    力過程までの処理を実施しておくことにより、全ての検
    索語と前記検索解集合の対を予め作成し、 前記検索語が入力された場合に、前記検索語と前記検索
    解の対を利用する請求項2記載の情報検索方法。
  4. 【請求項4】 前記繰り返し操作判定過程において、 前記仮検索解集合更新過程で取得した仮検索解集合と、
    1巡前に得られた仮検索解集合とが一致した時点で、繰
    り返し操作を終了する請求項2記載の情報検索方法。
  5. 【請求項5】 前記繰り返し操作判定過程において、 繰り返し操作を任意に固定した回数で終了する請求項2
    記載の情報検索方法。
  6. 【請求項6】 前記想起度算出過程において、 前記仮検索集合の中に多く出現し、該仮検索集合の補集
    合の中に出現する頻度が少ない単語と検索語との間に高
    い想起度を与える請求項2記載の情報検索方法。
  7. 【請求項7】 前記関連度算出過程において、 前記想起度算出過程で求められた前記検索語と各案内対
    象が有する単語との間の想起度の平均を関連度とする請
    求項2記載の情報検索方法。
  8. 【請求項8】 前記仮検索解集合更新過程は、 前記所定の閾値を全案内対象の関連度の平均の定数倍と
    する請求項2記載情報検索方法。
  9. 【請求項9】 入力された検索語に基づいて案内対象を
    検索する情報検索装置であって、 各案内対象の説明テキストを形態素解析により単語に分
    解する単語分解手段と、 入力された前記検索語が前記説明テキストに出現するよ
    うな案内対象の集合を仮検索解集合として導出する単純
    検索手段と、 前記説明テキストの単語の出現頻度情報に基づいて、前
    記検索語と各単語との関連の度合いを想起度として算出
    する想起度算出手段と、 前記想起度算出手段により求められた単語の前記想起度
    に基づいて、前記検索語と前記仮検索解集合の各々の関
    連度を算出する関連度算出手段と、 前記関連度算出手段により求められた関連度が所定の閾
    値以上の案内対象の集合を、新たな仮検索解集合として
    仮検索解集合記憶手段の仮検索集合を更新する仮検索解
    集合更新手段と、 前記想起度算出手段、前記関連度算出手段、前記仮検索
    解集合更新手段を繰り返し行うか否かを決定する繰り返
    し操作判定手段と、 前記繰り返し操作判定手段において、否と判定された場
    合に、最終的な仮検索解集合を検索解集合として出力す
    る検索解集合出力手段とからなることを特徴とする情報
    検索装置。
  10. 【請求項10】 前記単語分解手段で取得される各単語
    を検索語として、前記単純検索手段から前記検索解集合
    出力手段までの処理を実施しておくことにより、全ての
    検索語と前記検索解集合の対を予め作成する検索対応情
    報生成手段と、 前記検索語が入力された場合に、前記検索対応情報生成
    手段において生成された前記検索語と前記検索解の対を
    利用する検索手段を更に有する請求項9記載の情報検索
    装置。
  11. 【請求項11】 前記想起度算出手段は、 前記仮検索集合の中に多く出現し、該仮検索集合の補集
    合の中に出現する頻度が少ない単語と検索語との間に高
    い想起度を与える手段を含む請求項9記載の情報検索装
    置。
  12. 【請求項12】 前記関連度算出手段は、 前記想起度算出手段で求められた前記検索語と各案内対
    象が有する単語との間の想起度の平均を関連度とする請
    求項9記載の情報検索装置。
  13. 【請求項13】 前記仮検索解集合更新手段は、 前記所定の閾値を全案内対象の関連度の平均の定数倍と
    する請求項9記載の情報検索装置。
  14. 【請求項14】 前記繰り返し操作判定手段は、 前記仮検索解集合更新手段で取得した仮検索解集合と、
    1巡前に得られた仮検索解集合とが一致した時点で、繰
    り返し操作を終了する第1の終了判定手段を含む請求項
    9記載の情報検索装置。
  15. 【請求項15】 前記繰り返し操作判定手段は、 繰り返し操作を任意に固定した回数で終了する第2の終
    了判定手段を含む請求項9記載の情報検索装置。
  16. 【請求項16】 前記検索解集合出力手段により出力さ
    れた検索解集合のうち正解となる集合の数を正解集合の
    数で除した値を再現率とし、該検索解集合のうち正解の
    数を検索された検索解集合の数で除した値を適合率とし
    て、前記仮検索解集合の精度を評価する評価手段を更に
    有する請求項6記載の情報検索装置。
  17. 【請求項17】 前記仮検索解集合更新手段は、 所定の閾値以上の関連度を有する仮検索解集合のみを前
    記仮検索解集合記憶手段に格納する閾値比較手段を含む
    請求項6記載の情報検索装置。
JP04190896A 1996-02-28 1996-02-28 情報検索方法及び装置 Expired - Fee Related JP3435470B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04190896A JP3435470B2 (ja) 1996-02-28 1996-02-28 情報検索方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04190896A JP3435470B2 (ja) 1996-02-28 1996-02-28 情報検索方法及び装置

Publications (2)

Publication Number Publication Date
JPH09231237A true JPH09231237A (ja) 1997-09-05
JP3435470B2 JP3435470B2 (ja) 2003-08-11

Family

ID=12621391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04190896A Expired - Fee Related JP3435470B2 (ja) 1996-02-28 1996-02-28 情報検索方法及び装置

Country Status (1)

Country Link
JP (1) JP3435470B2 (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH021059A (ja) * 1988-06-07 1990-01-05 Hitachi Ltd 連想検索システム
JPH0365763A (ja) * 1989-08-03 1991-03-20 Ricoh Co Ltd 文書検索装置
JPH03122769A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd キーワード連想検索装置
JPH0756948A (ja) * 1993-08-09 1995-03-03 Fuji Xerox Co Ltd 情報検索装置
JPH07110818A (ja) * 1993-10-12 1995-04-25 Mitsubishi Electric Corp データベースシステム
JPH07262217A (ja) * 1994-03-24 1995-10-13 Fuji Xerox Co Ltd テキスト検索装置
JPH07334512A (ja) * 1994-06-08 1995-12-22 Sharp Corp 文書データ検索装置
JPH086965A (ja) * 1994-06-16 1996-01-12 Atr Tsushin Syst Kenkyusho:Kk 情報検索装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH021059A (ja) * 1988-06-07 1990-01-05 Hitachi Ltd 連想検索システム
JPH0365763A (ja) * 1989-08-03 1991-03-20 Ricoh Co Ltd 文書検索装置
JPH03122769A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd キーワード連想検索装置
JPH0756948A (ja) * 1993-08-09 1995-03-03 Fuji Xerox Co Ltd 情報検索装置
JPH07110818A (ja) * 1993-10-12 1995-04-25 Mitsubishi Electric Corp データベースシステム
JPH07262217A (ja) * 1994-03-24 1995-10-13 Fuji Xerox Co Ltd テキスト検索装置
JPH07334512A (ja) * 1994-06-08 1995-12-22 Sharp Corp 文書データ検索装置
JPH086965A (ja) * 1994-06-16 1996-01-12 Atr Tsushin Syst Kenkyusho:Kk 情報検索装置

Also Published As

Publication number Publication date
JP3435470B2 (ja) 2003-08-11

Similar Documents

Publication Publication Date Title
JP4098539B2 (ja) プロファイル情報の推薦方法、プログラム及び装置
KR20040068319A (ko) 콘텐트 변환 방법 및 장치
US20190058609A1 (en) Method and apparatus for pushing information based on artificial intelligence
US20170034111A1 (en) Method and Apparatus for Determining Key Social Information
JP2017204018A (ja) 検索処理方法、検索処理プログラムおよび情報処理装置
US20200089758A1 (en) Systems and methods for automated document graphing
US20180341646A1 (en) Translated-clause generating method, translated-clause generating apparatus, and recording medium
CN109977397B (zh) 基于词性组合的新闻热点提取方法、系统及存储介质
US7689543B2 (en) Search engine providing match and alternative answers using cumulative probability values
CN116340352A (zh) 数据查询方法、装置、存储介质及电子设备
JPH09231237A (ja) 情報検索方法及び装置
JP6495206B2 (ja) 文書概念ベース生成装置、文書概念検索装置、方法、及びプログラム
JPH07141383A (ja) 会話文翻訳装置
US20040049496A1 (en) Interactive searching system and method
JP2000090110A (ja) 全文検索方法、装置、および全文検索プログラムを記録した記録媒体
JP2009123138A (ja) 処理手順生成装置及び処理手順生成方法
JPH0589172A (ja) 検索装置
CN117112748A (zh) 智能客服机器人的工作方法、装置、设备及存储介质
CN110674273A (zh) 一种分词的智能问答机器人训练方法
JPH10171821A (ja) 検索語候補提示方法およびその装置
CN117891927A (zh) 基于大语言模型的问答方法、装置、电子设备及存储介质
JP2002082984A (ja) データベース検索装置およびその方法
JP2022092849A (ja) 検索装置、検索方法、およびプログラム
CN115827955A (zh) 多品类模糊性检索排序方法、装置和存储介质
CN114201525A (zh) 查询数据的方法及装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees