JP3435470B2 - 情報検索方法及び装置 - Google Patents

情報検索方法及び装置

Info

Publication number
JP3435470B2
JP3435470B2 JP04190896A JP4190896A JP3435470B2 JP 3435470 B2 JP3435470 B2 JP 3435470B2 JP 04190896 A JP04190896 A JP 04190896A JP 4190896 A JP4190896 A JP 4190896A JP 3435470 B2 JP3435470 B2 JP 3435470B2
Authority
JP
Japan
Prior art keywords
search
solution set
word
degree
search solution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04190896A
Other languages
English (en)
Other versions
JPH09231237A (ja
Inventor
克人 別所
美春 戸部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP04190896A priority Critical patent/JP3435470B2/ja
Publication of JPH09231237A publication Critical patent/JPH09231237A/ja
Application granted granted Critical
Publication of JP3435470B2 publication Critical patent/JP3435470B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索方法及び
装置に係り、特に、業種別の情報案内サービスの検索を
行う情報検索方法及び装置に関する。
【0002】
【従来の技術】検索語を入力し、案内対象を検索する方
法として、入力された検索語が説明テキストに出現する
ような案内対象を検索する単純検索がある。
【0003】また、業種別の情報案内の情報検索おい
ては、業種分類体系、案内対象と業種との対応関係、検
索語と業種との対応関係等の検索知識を人手によって構
築し、この検索知識を用いて、入力された検索語から案
内対象を検索している。
【0004】図5は、従来の方法による検索知識の構成
例を示す。
【0005】同図に示す検索知識は、検索語、業種分類
体系から構成され、例えば、利用者から「テレビを販売
している店」という要求から、オペレータが検索語『テ
レビ』を入力すると、当該検索語で業種分類体系の『家
庭電器』を検索する。さらに、業種分類体系において、
当該『家庭電器』の業種に従属する案内対象の集合{X
店、Z店}が示される。オペレータは、当該案内対象の
集合を利用者に案内する。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の方法における単純検索では、入力された検索語で検
索したい案内対象が検索されなかったり、逆に検索した
くない案内対象でたまたま説明テキストに検索語を含む
ものが検索されてしまうことがある。例えば、案内対象
の集合が表1だった場合に、検索語として「テレビ」を
入力して単純検索を行おうとする。そうすると、案内対
象Eは該当するにも係わらず、単語「テレビ」が説明テ
キストにないため検索されないことになり、再現性の問
題がある。また、案内対象Fは該当にしないにもかかわ
らず、たまたま説明テキストに単語「テレビ」があるた
め、検索されてしまい適合性の問題がある。
【0007】これを改善するために、前述の人手作業に
よって構築された検索知識を利用して検索が行われてい
る訳であるが、検索知識の構築に多大なコストを要する
と共に、膨大な時間を要することにより、新しい業種ヘ
の対応が遅れ、適切な案内対象が検索されないという問
題がある。
【0008】本発明は、上記の点に鑑みなされたもの
で、上記従来の問題点を解決し、単純検索よりも優れた
精度を持ち、案内情報を即座に反映できるような検索知
識を自動的に作成可能な情報検索方法及び装置を提供す
ることを目的とする。
【0009】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。検索語を入力し、案内対象の
営業内容等の説明テキストを検索する情報検索方法にお
いて、各案内対象の前記説明テキストを形態素解析によ
り単語に分割する単語分解過程(ステップ1)と、入力
された検索語が前記説明テキストに出現するような案内
対象の集合を仮検索解集合として導出する単純検索過程
(ステップ2)と、説明テキストの単語の出現頻度情報
に基づいて、検索語と単語分解過程で求められた各単語
との関連の度合いを想起度として算出する想起度算出過
程(ステップ3)と、想起度算出過程(ステップ3)に
より求められた単語の想起度に基づいて、検索語と案内
対象の各々の関連度を算出する関連度算出過程(ステッ
プ4)と、関連度算出過程(ステップ4)により求めら
れた関連度が所定の閾値以上の案内対象の集合を、新た
な仮検索解集合として導出する仮検索解集合更新過程
(ステップ5)と、想起度算出過程(ステップ3)、関
連度算出過程(ステップ4)、仮検索解集合更新過程
(ステップ5)を繰り返し行うか否かを決定する繰り返
し操作判定過程(ステップ6)と、繰り返し操作判定過
程(ステップ6)において、否と判定された場合に、最
終的な仮検索解集合を検索解集合として出力する検索解
集合出力過程(ステップ7)とからなる。
【0010】
【0011】
【0012】また、本発明の情報検索方法は、単語分解
過程(ステップ1)で取得される各単語を検索語とし
て、単純検索過程(ステップ2)から検索解集合出力過
程(ステップ7)までの処理を実施しておくことによ
り、全ての検索語と検索解集合の対を予め作成し、検索
語が入力された場合に、検索語と検索解集合の対を利用
する。
【0013】また、本発明の繰り返し操作判定過程(ス
テップ6)において、仮検索解集合更新過程で取得した
仮検索解集合と、1巡前に得られた仮検索解集合とが一
致した時点で、繰り返し操作を終了する。
【0014】また、本発明の繰り返し操作判定過程(ス
テップ6)において、繰り返し操作を任意に固定した回
数で終了する。
【0015】また、本発明の想起度算出過程(ステップ
3)において、仮検索集合の中に多く出現し、該仮検
集合の補集合の中に出現する頻度が少ない単語と検
索語との間に高い想起度を与える。
【0016】また、本発明の関連度算出過程(ステップ
4)において、想起度算出過程で求められた検索語と各
案内対象が有する単語との間の想起度の平均を関連度と
する。
【0017】また、本発明の仮検索解集合更新過程(ス
テップ5)において、所定の閾値を全案内対象の関連度
の平均の定数倍とする。
【0018】図2は、本発明の原理構成図である。
【0019】本発明は、入力された検索語に基づいて案
内対象を検索する情報検索装置であって、各案内対象の
説明テキストを形態素解析により単語に分解する単語分
解手段1と、入力された検索語が説明テキストに出現す
るような案内対象の集合を仮検索解集合として仮検索解
集合記憶手段6に格納する単純検索手段2と、説明テキ
ストの単語の出現頻度情報に基づいて、検索語と単語分
解手段1により求められた各単語との関連の度合いを想
起度として算出する想起度算出手段3と、想起度算出手
段3により求められた単語の想起度に基づいて、検索語
案内対象の各々の関連度を算出する関連度算出手段4
と、関連度算出手段4により求められた関連度が所定の
閾値以上の案内対象の集合を、新たな仮検索解集合とし
前記仮検索解集合記憶手段6の仮検索解集合を更新す
る仮検索解集合更新手段5と、想起度算出手段3、関連
度算出手段4、仮検索解集合更新手段5を繰り返し行う
か否かを決定する繰り返し操作判定手段と、繰り返し
操作判定手段において、否と判定された場合に、最終
的な仮検索解集合を検索解集合として出力する検索解集
合出力手段8とからなる。
【0020】また、本発明の情報検索装置は、単語分解
手段で取得される各単語を検索語として、単純検索手
段2から検索解集合出力手段8までの処理を実施してお
くことにより、全ての検索語と検索解集合の対を予め作
成する検索対応情報生成手段と、検索語が入力された場
合に、検索対応情報生成手段において生成された検索語
と検索解集合の対を利用する検索手段を更に有する。
【0021】また、上記の想起度算出手段3は、仮検索
集合の中に多く出現し、該仮検索集合の補集合の中
に出現する頻度が少ない単語と検索語との間に高い想起
度を与える手段を含む。
【0022】また、上記の関連度算出手段4は、想起度
算出手段3で求められた検索語と各案内対象が有する単
語との間の想起度の平均を関連度とする。
【0023】また、上記の仮検索解集合更新手段5は、
所定の閾値を全案内対象の関連度の平均の定数倍とす
る。
【0024】また、上記の繰り返し操作判定手段7は、
仮検索解集合更新手段5で取得した仮検索解集合と、1
巡前に得られた仮検索解集合記憶手段6に格納されてい
る仮検索解集合とが一致した時点で、繰り返し操作を終
了する第1の終了判定手段を含む。
【0025】また、上記の繰り返し操作判定手段7は、
繰り返し操作を任意に固定した回数で終了する第2の終
了判定手段を含む。
【0026】また、本発明の情報検索装置は、単純検索
手段2や仮検索解集合更新手段5で取得した仮検索解集
の正解となる要素数を正解集合の要素数で除した値を
再現率とし、該検索解集合の正となる要素数を該仮
検索解集合の要素数で除した値を適合率として、仮検
索解集合の精度を評価する評価手段を更に有する。
【0027】これにより、本発明は、検索語と関連付け
られた単語の重みを考慮して、検索語と案内対象間の関
連度を算出するので、単純検索よりも一般に高い精度が
得られる。
【0028】また、案内対象に関する説明テキストデー
タさえあれば、自動的に検索知識(検索語・単語間の想
起度、検索語案内対象間の関連度、検索語検索解集
合との対等)を構築するので、検索知識構築におけるコ
ストを大幅に削減できる。また、案内対象のデータ
索知識に即座に反映することができる。
【0029】
【発明の実施の形態】図3は、本発明の情報検索システ
ム構成を示す。同図に示す情報検索システムは、形態素
解析部10、テキストファイル20、検索部30、想起
度算出部40、関連度算出部50、仮検索解集合更新部
60、仮検索解集合格納部70、繰り返し制御部80及
び検索解集合出力部90より構成される。
【0030】形態素解析部10は、案内対象の説明テキ
ストを形態素解析して単語に分解し、各案内対象の説明
テキストと共に、形態素解析済の名詞のみを抽出単語と
してテキストファイル20に格納する。
【0031】検索部30は、オペレータから入力された
検索語に基づいてテキストファイル20を検索し、該検
索語が説明テキストに出現するような案内対象の集
(以下、仮検索解集合と記す)を検索し、当該仮検索解
合を想起度算出部40に転送する。また、当該仮検索
解集合を仮検索解集合格納部70へ格納する。なお、オ
ペレータから入力される検索語は、抽出単語と一致をと
るために、名詞で入力されるものとする。
【0032】想起度算出部40は、入力された検索語と
抽出単語との関連の度合である想起度を算出する。想起
度は、検索部30、または繰り返し制御部80から取得
した最新の仮検索解集合に含まれる抽出単語を有する
案内対象の数と、テキストファイル20から取得した抽
出単語を有する案内対象の数との比率である。
【0033】関連度算出部50は、想起度算出部40か
ら取得した検索語と案内対象に含まれる抽出単語の間の
想起度の平均を求める。これにより、検索語を持たない
案内対象であっても検索語と関係の深い単語が多ければ
関連度は高くなり、検索語を持つ案内対象であっても、
検索語との関係がない単語が多ければ関連度は低くな
る。
【0034】仮検索解集合更新部60は、所定の閾値以
上の案内対象を抽出し、新たな仮検索解集合として抽出
し、仮検索解集合格納部70に格納する。
【0035】繰り返し制御部80は、想起度算出部4
0、関連度算出部50及び仮検索解集合更新部60の繰
り返し処理所定の回数に達した場合に、繰り返し処理
を終了する。または、仮検索解集合格納部70に格納さ
れている仮検索解集合を参照して、1巡前に抽出された
仮検索解集合と現在求められた仮検索解集合とを比較し
て一致した場合に繰り返し処理を終了する。繰り返し処
理を継続する場合、最新の仮検索解集合を用いて、再び
想起度算出部40以降の処理を行う。
【0036】検索解集合出力部90は、繰り返し制御部
80により繰り返し処理が終了すると、当該繰り返し制
御部80を介して最終的な検索解集合を取得し、検索解
集合としてディスプレイ等に出力する。
【0037】以下に、本発明の検索方法を説明する。以
下の各ステップは、図1に示すフローチャートのステッ
プ番号と一致するものとする。
【0038】ステップ1) 形態素解析部10は、案内
対象の営業内容等の説明テキストを形態素解析により単
語に分解し、ある程度の数以上の案内対象に出現する単
語のうち、主として名詞を抽出して、各案内対象を名詞
と案内対象の説明テキストによる集合としてテキストフ
ァイル20に格納する。
【0039】ステップ2) 次に、検索部30は、入力
された検索語Kを有する案内対象の集合を、仮検索解集
合として導出して仮検索解集合格納部70に格納する。
但し、検索語は、上記のステップ1によ単語分過程
によって抽出された単語に限定され、それ以外の単語が
検索語として入力されても検索は行わない。
【0040】ステップ3) 想起度算出部40は、テキ
ストファイル20を参照して検索語Kとステップ1によ
る単語分解過程によって抽出された各単語W間の想起
を以下の式(1)に基づいて計算する。
【0041】
【数1】 ステップ4) 次に、関連度算出部50は、検索語Kと
各案内対象A間の関連度を以下の式(2)に基づいて計
算する。
【0042】
【数2】 ステップ5) 仮検索解集合更新部60は、関連度の閾
値を、全案内対象の関連度の平均の定数倍とし、関連度
がその閾値以上の案内対象の集合を新たな仮検索解集合
として導出して仮検索解集合格納部70に格納する。
【0043】ステップ6) 上記の処理のステップ3、
ステップ4、ステップ5を繰り返すか否かの判定を行
う。判定方法としては、最新の仮検索解集合と仮検索解
集合格納部70に格納されているその一つ前の仮検索解
集合を比較して、一致した時点で繰り返し操作を終了す
る。また、繰り返し操作を所定の回数に達した場合に終
了する。繰り返し操作を継続する場合、最新の仮検索解
集合を用いて、再びステップ3以降の処理を行う。
【0044】ステップ7) 上記のステップ6において
繰り返し操作終了の判定がされると、最終的に得られた
仮検索解集合を、検索解集合としてディスプレイ等に出
力する。
【0045】なお、上記のステップにおける仮検索解
集合更新過程で取得した仮検索解集合の精度は再現率
(式3)と適合率(式4)によって評価される。
【0046】
【数3】 上記のステップ3における想起度算出過程において、想
起度算出部40は、式1が示す通り、仮検索解集合の中
に多く出現し、その補集合の中に少なく出現する単語と
検索語との間に高い想起度を与えるようになっているた
め、これによって決まる単語と検索語間の想起度は、仮
検索解集合が正解集合と極端にずれていない限り、検索
語から連想される単語ほど高い想起度を示すようにな
る。
【0047】上記のステップ4における関連度算出過程
において、関連度算出部50は、式2が示す通り、検索
語と各案内対象がもつ単語との間の想起度の平均を関連
度としているため、例えば、検索語をもたない案内対象
であっても、想起度の高い単語を多く含む案内対象は関
連度が高くなり、一方、検索語をもっている案内対象で
あっても、想起度の高い単語が少なければ関連度は低く
なる。
【0048】以上のように、想起度、関連度が計算され
るため、ステップ5における仮検索解集合更新過程で新
たに得られる仮検索解集合の精度は、一般的に前回の仮
検索解集合の精度より向上することが期待される。
【0049】その結果、新たに得られた仮検索解集合
は、前回の仮検索解集合よりも正解集合に近づくことが
期待され、この新たに得られた仮検索解集合を基に、同
様の処理を行うことにより、更に、仮検索解集合の精度
の向上が期待できる。
【0050】
【実施例】以下、本発明の実施例を図面と共に説明す
る。
【0051】以下の説明において、表1の内容により、
検索語を『テレビ』として説明する。
【0052】
【表1】 (1) 単語分解過程 それぞれの説明テキストを形態素解析し、主として名詞
を抽出し、各案内対象をそのような単語の集合とする。
このとき、例えば、BやIではそれぞれ「電気」、「料
理」といった単語が同一案内対象に2回以上出現する
が、本発明では、その点については考慮しないものとす
る。さらに、単語をある程度の数以上の案内対象に出現
するものだけに限定する。この例では、一つ以上の案内
対象に出現する単語とする。
【0053】(2) 単純検索過程 単語分解過程の結果得られた全単語の集合をSとする。
ここでSは、S={電気、製品、テレビ、エアコン、器
具、家電、照明、割烹、懐石、料理、山菜、肉、魚}と
なる。
【0054】Sの中から一つの単語が検索語Kとして入
力されたものとする。例えば、『テレビ』が入力され
る。これにより、検索語Kをもつ案内対象の集合X0
は、 X0={A,B,C,D,F} となり、これを仮検索解集合とする。
【0055】(3) 想起度算出過程(i) 検索語KとSの各単語Wとの間の想起度を前述の式1で
計算する。
【0056】例えば、Wが「電気」ならば、Wをもつ案
内対象の集合は、{A,B,E}となり、Wを持つ案内
対象で仮検索解集合に含まれるものの集合は{A,B}
となり、上記の式1の値は2/3となる。
【0057】上記の各単語の想起度は以下のようにな
る。 電気=2/3,製品=1/1,テレビ=5/5,エアコ
ン=3/4 器具=2/3,家電=2/3,照明=1/1,割烹=1
/3, 懐石=1/2,料理=1/3,山菜=0/2,肉=0/
1,魚=0/1 (4) 関連度算出過程(i) 次に、検索語Kと任意の案内対象Qとの関連度をKとQ
が持つ単語との間の想起度の平均として算出する。例え
ば、案内対象Bの関連度は、 (2/3+2/3+2/3+5/5)/4=3/4 となる。
【0058】各案内対象の関連度は以下のようになる。
【0059】A=41/48 B=3/4 C=29/
36 D=41/48 E=11/16 F=13/24 G=2/9 H=5
/18 I=1/9 (5) 仮検索解集合更新過程 (i) 関連度の閾値を、全案内対象の関連度の平均値(245
/432)の定数(1とする)倍とすると、新たな仮検
索解集合X1は、 X1={A,B,C,D,E} となる。
【0060】(6) 繰り返し操作判定過程 (i) X0とX1は、一致しないので継続とする。
【0061】(7) 想起度算出過程 (ii) 新たな仮検索解集合X1を用いて、再び検索語KとSの
各単語W間の想起度を前述の式1で計算する。
【0062】例えば、Wが「テレビ」ならば、Wをもつ
案内対象の集合は、 {A,B,C,D,F} となり、Wをもつ案内対象で仮検索集合に含まれるも
のの集合は、 {A,B,C,D} となり、想起度は、4/5となる。
【0063】各単語の想起度は以下のようになる。 電気=3/3,製品=1/1,テレビ=4/5,エアコ
ン=4/4 器具=3/3,家電=3/3,照明=1/1,割烹=0
/3, 懐石=0/2,料理=0/3,山菜=0/2,肉=0/
1,魚=0/1 (8) 関連度算出過程(ii) 想起度算出過程(ii)で得られた各単語の想起度を用
いて、再び、各案内対象の関連度を同様に、それがもつ
単語の想起度平均として求める。
【0064】例えば、案内対象Bの関連度は、 (3/3+3/3+3/3+4/5)/4=19/20 となる。
【0065】各案内対象の関連度は以下のようになる。
【0066】A=19/20 B=19/20 C=1
4/15 D=19/20 E=1 F=1/5 G=0 H=0 I=0 (9) 仮検索解集合更新過程(ii) 関連度の閾値は全案内対象の関連度の平均値(299/
540)の1倍となり、新たな仮検索解集合X2は、 X2={A,B,C,D,E} となる。
【0067】(10) 繰り返し操作判定過程 (i
i) X1とX2は一致するので、繰り返し操作を終了する。
【0068】(11) 検索解集合出力過程 検索語「テレビ」に対し、最終的な仮検索解集合X2を
検索解集合として出力する。
【0069】このように、繰り返し操作を続けることに
より、仮検索解集合の精度の向上効果が期待でき、その
結果、最終的に得られる検索解集合の精度は単純検索よ
りも大幅に改善可能となる。
【0070】また、発明によれば、例えば、検索解集
『電気家電全般』が検索解集合として取得されると、
当該検索解集合と入力された検索語『テレビ』とを対に
して格納しておき、最初の検索部30による単純検索時
において、当該検索語『テレビ』が入力された場合に
は、当該検索解集合『電気家電全般』を直接検索するよ
うなシステムを構築することも可能である。
【0071】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で、種々変更・応用が可
能である。
【0072】
【発明の効果】上述のように、本発明の情報検索方法及
び装置によれば、検索知識を構築すると、その精度にお
いて多くの検索語に対して単純検索よりも大幅な改善効
果が期待できる。
【0073】また、本発明は、案内対象の説明テキスト
のみから検索知識を自動的に構築するので、人手作業の
コストが削減できると共に、案内対象のデータを検索知
識に即座に反映できる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の情報検索装置の構成図である。
【図4】本発明の一実施例の詳細な動作を示すフローチ
ャートである。
【図5】従来の検索知識の例を示す図である。
【符号の説明】
1 単語分解手段 2 単純検索手段 3 想起度算出手段 4 関連度算出手段 5 仮検索解集合更新手段 6 仮検索解集合記憶手段 7 繰り返し操作判定手段 8 検索解集合出力手段 10 形態素解析部 20 テキストファイル 30 検索部 40 想起度算出部 50 関連度算出部 60 仮検索解集合更新部 70 仮検索解集合格納部 80 繰り返し制御部 90 検索解集合出力部
フロントページの続き (56)参考文献 特開 平3−65763(JP,A) 特開 平3−122769(JP,A) 特開 平7−56948(JP,A) 特開 平7−334512(JP,A) 特開 平7−262217(JP,A) 特開 平8−6965(JP,A) 特開 平2−1059(JP,A) 特開 平7−110818(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS) INSPEC(DIALOG)

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】 検索語を入力し、案内対象の営業内容等
    の説明テキストを検索する情報検索方法において、各案内対象の前記説明テキストを形態素解析により単語
    に分割する単語分解過程と、 入力された検索語が前記説明テキストに出現するような
    案内対象の集合を仮検索解集合として導出する単純検索
    過程と、 前記説明テキストの単語の出現頻度情報に基づいて、前
    記検索語と前記単語分解過程で求められた各単語との関
    連の度合いを想起度として算出する想起度算出過程と、 前記想起度算出過程により求められた単語の前記想起度
    に基づいて、前記検索語と前記案内対象の各々の関連度
    を算出する関連度算出過程と、 前記関連度算出過程により求められた関連度が所定の閾
    値以上の案内対象の集合を、新たな仮検索解集合として
    導出する仮検索解集合更新過程と、 前記想起度算出過程、前記関連度算出過程、前記仮検索
    解集合更新過程を繰り返し行うか否かを決定する繰り返
    し操作判定過程と、 前記繰り返し操作判定過程において、否と判定された場
    合に、最終的な仮検索解集合を検索解集合として出力す
    る検索解集合出力過程とからなる ことを特徴とする情報
    検索方法。
  2. 【請求項2】 前記単語分解過程で取得される各単語を
    検索語として、前記単純検索過程から前記検索解集合出
    力過程までの処理を実施しておくことにより、 全ての検索語と前記検索解集合の対を予め作成し、 前記検索語が入力された場合に、前記検索語と前記検索
    解集合の対を利用する請求項記載の情報検索方法。
  3. 【請求項3】 前記繰り返し操作判定過程において、 前記仮検索解集合更新過程で取得した仮検索解集合と、
    1巡前に得られた仮検索解集合とが一致した時点で、繰
    り返し操作を終了する請求項記載の情報検索方法。
  4. 【請求項4】 前記繰り返し操作判定過程において、 繰り返し操作を任意に固定した回数で終了する請求項
    記載の情報検索方法。
  5. 【請求項5】 前記想起度算出過程において、 前記仮検索解集合の中に多く出現し、該仮検索解集合の
    補集合の中に出現する頻度が少ない単語と検索語との間
    に高い想起度を与える請求項記載の情報検索方法。
  6. 【請求項6】 前記関連度算出過程において、 前記想起度算出過程で求められた前記検索語と各案内対
    象が有する単語との間の想起度の平均を関連度とする請
    求項記載の情報検索方法。
  7. 【請求項7】 前記仮検索解集合更新過程は、 前記所定の閾値を全案内対象の関連度の平均の定数倍と
    する請求項記載の情報検索方法。
  8. 【請求項8】 入力された検索語に基づいて案内対象を
    検索する情報検索装置であって、 各案内対象の説明テキストを形態素解析により単語に分
    解する単語分解手段と、 入力された前記検索語が前記説明テキストに出現するよ
    うな案内対象の集合を仮検索解集合として仮検索解集合
    記憶手段に格納する単純検索手段と、 前記説明テキストの単語の出現頻度情報に基づいて、前
    記検索語と前期単語分解手段により求められた各単語と
    の関連の度合いを想起度として算出する想起度算出手段
    と、 前記想起度算出手段により求められた単語の前記想起度
    に基づいて、前記検索語と前記案内対象の各々の関連度
    を算出する関連度算出手段と、 前記関連度算出手段により求められた関連度が所定の閾
    値以上の案内対象の集合を、新たな仮検索解集合として
    前記仮検索解集合記憶手段の仮検索解集合を更新する仮
    検索解集合更新手段と、 前記想起度算出手段、前記関連度算出手段、前記仮検索
    解集合更新手段を繰り返し行うか否かを決定する繰り返
    し操作判定手段と、 前記繰り返し操作判定手段において、否と判定された場
    合に、最終的な仮検索解集合を検索解集合として出力す
    る検索解集合出力手段とからなることを特徴とする情報
    検索装置。
  9. 【請求項9】 前記単語分解手段で取得される各単語を
    検索語として、前記単純検索手段から前記検索解集合出
    力手段までの処理を実施しておくことにより、全ての検
    索語と前記検索解集合の対を予め作成する検索対応情報
    生成手段と、 前記検索語が入力された場合に、前記検索対応情報生成
    手段において生成された前記検索語と前記検索解集合の
    対を利用する検索手段を更に有する請求項記載の情報
    検索装置。
  10. 【請求項10】 前記想起度算出手段は、 前記仮検索解集合の中に多く出現し、該仮検索解集合の
    補集合の中に出現する頻度が少ない単語と検索語との間
    に高い想起度を与える手段を含む請求項記載の情報検
    索装置。
  11. 【請求項11】 前記関連度算出手段は、 前記想起度算出手段で求められた前記検索語と各案内対
    象が有する単語との間の想起度の平均を関連度とする請
    求項記載の情報検索装置。
  12. 【請求項12】 前記仮検索解集合更新手段は、 前記所定の閾値を全案内対象の関連度の平均の定数倍と
    する請求項記載の情報検索装置。
  13. 【請求項13】 前記繰り返し操作判定手段は、 前記仮検索解集合更新手段で取得した仮検索解集合と、
    1巡前に得られた仮検索解集合とが一致した時点で、繰
    り返し操作を終了する第1の終了判定手段を含む請求項
    記載の情報検索装置。
  14. 【請求項14】 前記繰り返し操作判定手段は、 繰り返し操作を任意に固定した回数で終了する第2の終
    了判定手段を含む請求項記載の情報検索装置。
  15. 【請求項15】 前記単純検索手段や前記仮検索解集合
    更新手段で取得した仮検索解集合の正解となる要素数を
    正解集合の要素数で除した値を再現率とし、該仮検索解
    集合の正解となる要素数を該仮検索解集合の要素数で除
    した値を適合率として、該仮検索解集合の精度を評価す
    る評価手段を更に有する請求項記載の情報検索装置。
JP04190896A 1996-02-28 1996-02-28 情報検索方法及び装置 Expired - Fee Related JP3435470B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04190896A JP3435470B2 (ja) 1996-02-28 1996-02-28 情報検索方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04190896A JP3435470B2 (ja) 1996-02-28 1996-02-28 情報検索方法及び装置

Publications (2)

Publication Number Publication Date
JPH09231237A JPH09231237A (ja) 1997-09-05
JP3435470B2 true JP3435470B2 (ja) 2003-08-11

Family

ID=12621391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04190896A Expired - Fee Related JP3435470B2 (ja) 1996-02-28 1996-02-28 情報検索方法及び装置

Country Status (1)

Country Link
JP (1) JP3435470B2 (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH021059A (ja) * 1988-06-07 1990-01-05 Hitachi Ltd 連想検索システム
JPH0365763A (ja) * 1989-08-03 1991-03-20 Ricoh Co Ltd 文書検索装置
JPH03122769A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd キーワード連想検索装置
JPH0756948A (ja) * 1993-08-09 1995-03-03 Fuji Xerox Co Ltd 情報検索装置
JPH07110818A (ja) * 1993-10-12 1995-04-25 Mitsubishi Electric Corp データベースシステム
JPH07262217A (ja) * 1994-03-24 1995-10-13 Fuji Xerox Co Ltd テキスト検索装置
JP3162907B2 (ja) * 1994-06-08 2001-05-08 シャープ株式会社 文書データ検索装置
JP2832678B2 (ja) * 1994-06-16 1998-12-09 株式会社エイ・ティ・アール通信システム研究所 情報検索装置

Also Published As

Publication number Publication date
JPH09231237A (ja) 1997-09-05

Similar Documents

Publication Publication Date Title
JP3170400B2 (ja) 意味パターン認識による文字列検索方法及びその装置
CN111159363A (zh) 一种基于知识库的问题答案确定方法及装置
CN110472043B (zh) 一种针对评论文本的聚类方法及装置
CN111274267A (zh) 一种数据库查询方法、装置及计算机可读取存储介质
US20170034111A1 (en) Method and Apparatus for Determining Key Social Information
CN105653673A (zh) 信息搜索方法及装置
CN111813923A (zh) 文本摘要方法、电子设备及存储介质
US20040181758A1 (en) Text and question generating apparatus and method
CN112115313A (zh) 正则表达式的生成、数据提取方法、装置、设备及介质
JPH11161658A (ja) 追加検索語の優先度計算方法及び装置及び追加検索語の優先度計算プログラムを格納した記憶媒体
CN113761124B (zh) 文本编码模型的训练方法、信息检索方法及设备
CN111309926B (zh) 一种实体链接方法、装置及电子设备
CN109977397B (zh) 基于词性组合的新闻热点提取方法、系统及存储介质
JP3435470B2 (ja) 情報検索方法及び装置
CN111339287B (zh) 摘要生成方法及装置
CN114676155A (zh) 代码提示信息的确定方法、数据集的确定方法及电子设备
CN113761104A (zh) 知识图谱中实体关系的检测方法、装置和电子设备
CN111368055A (zh) 一种专利数据库联合企业信息平台的检索方法和装置
JP4568320B2 (ja) 処理手順生成装置及び処理手順生成方法
CN110941963A (zh) 一种基于句子情感属性的文本属性生成观点摘要方法与系统
JPH07141383A (ja) 会話文翻訳装置
CN111414459A (zh) 人物关系获取方法、装置、电子设备及存储介质
CN114003714B (zh) 一种文档上下文感知的智能知识推送方法
CN116501841B (zh) 数据模型模糊查询方法、系统及存储介质
JP2000090110A (ja) 全文検索方法、装置、および全文検索プログラムを記録した記録媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees