JP3820878B2 - Information search device, score determination device, information search method, score determination method, and program recording medium - Google Patents
Information search device, score determination device, information search method, score determination method, and program recording medium Download PDFInfo
- Publication number
- JP3820878B2 JP3820878B2 JP2000371506A JP2000371506A JP3820878B2 JP 3820878 B2 JP3820878 B2 JP 3820878B2 JP 2000371506 A JP2000371506 A JP 2000371506A JP 2000371506 A JP2000371506 A JP 2000371506A JP 3820878 B2 JP3820878 B2 JP 3820878B2
- Authority
- JP
- Japan
- Prior art keywords
- score
- reputation information
- rule
- evaluation expression
- search word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 46
- 230000014509 gene expression Effects 0.000 claims description 246
- 238000011156 evaluation Methods 0.000 claims description 235
- 238000000605 extraction Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、情報検索技術に関し、特に評判情報を検索できる情報検索技術に関する。
【0002】
【従来の技術】
現在、検索語を手掛かりにその属性情報を自動的に収集し利用者に提示する情報検索システムは多く存在する。例えば、MySimon(http://www.mysimon.com) が提供するシステムは、次のようにして検索語(商品名)に関する属性情報(価格)を利用者に提示するようにしている。利用者が検索語として商品名を入力すると、その商品を販売している或るオンラインショップαに対して商品名を送る。これに応答して、オンラインショップαでは、上記商品名に関する価格,大きさ,色,重さ等の属性情報を検索し、検索結果を定型的な形式(フォーマット)で返却する。属性情報が返却されると、予め認識しているオンラインショップαのフォーマットに基づいて価格情報を抽出し、利用者に提示する。
【0003】
また、検索語を手掛かりにその属性情報を検索できるシステムとして、あらかじめ人手で収集した属性情報から利用者が欲しい情報を見ることができるシステムが存在する。例えば、Deja.com(http://www.deja.com) では、あらかじめ消費者から商品に関する属性情報として評判情報を収集し、利用者は商品の名前を選択するとその評判情報を得ることができる。
【0004】
【発明が解決しようとする課題】
しかしながら、上述の属性情報を自動的に収集できる情報検索システムにおいては、商品名や価格属性のように定型的な検索結果情報を利用して出現位置を特定できる属性情報を扱うことはできても、評判情報のような検索結果情報として現れないため出現位置が特定できない属性情報は自動収集することはできなかった。
【0005】
一方で、属性情報を予め人手で収集する情報検索システムにおいては、評判情報のような不特定の属性を扱うことが可能であるが、人間の作業に依存する方法は量の面で限界があり、上記の商品の評判情報においても極端に著名な商品以外は商品購入の判断材料として利用するには十分ではないのが現状である。
【0006】
本発明はこのような問題点に鑑みてなされたもので、その目的は不特定の属性情報である評判情報を自動的に検索できるようにすると共に、自動検索した各評判情報を最も評判情報らしいものから順番に利用者に提示できるようにすることにある。
【0007】
【課題を解決するための手段】
本発明の情報検索装置は、上記目的を達成するため、
入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出する評判情報判別手段(図1の13)と、
該評判情報判別手段(図1の13)で抽出された各評判情報それぞれについて、その評判情報が、評判情報中の検索語と評価表現との位置関係に関するルール群、評判情報中の検索語の位置に関するルール群、或いは評判情報中の評価表現の位置に関するルール群の内の少なくとも1つを含むルール群中のどのルールを満たしているかを調べ、満たしているルールの組み合わせに基づいて、前記各評判情報に対して検索語に関する評判情報である確率が高い順に優先順位を付ける評判情報優先度判定手段(図1の16)とを有する。
【0008】
このような構成を採用し、評判情報の自動抽出に加え、評判情報の優先順位の自動判定を行うことにより、より評判情報らしいものを利用者は優先的に知ることが可能となる。
【0009】
また、本発明の情報検索装置は、評判情報の抽出精度,抽出速度を向上させるため、
前記評判情報判別手段(図12の13a)が、
前記検索語が使用される分野を特定する検索語分野特定手段(図12の136)と、
前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定手段(図12の132)と、
複数の評価表現と該各評価表現の使用分野を示す分野情報とが格納された評価表現記憶部(図12の131a)と、
前記文書において前記評価表現記憶部(図12の131a)に格納されている評価表現の内の、前記検索語分野特定手段(図12の136)で特定された分野で使用される評価表現が出現する評価表現出現位置を特定する評価表現位置特定手段(図12の133a)と、
前記検索語位置特定手段(図12の132)が特定した検索語出現位置と前記評価表現位置特定手段(図12の133a)が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定手段(図12の134)と、
該表現間距離判定手段(図12の134)で求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出手段(図12の135)とを有している。
【0010】
このような構成を採用することにより、検索語が使用される分野が例えば「書籍」の場合、「おいしい」のような「書籍」に関する評判情報には使用されない評価表現を除外して評判情報の抽出処理を行うことが可能になるので、評判情報の抽出精度,抽出処理速度が向上する。
【0011】
また、本発明のスコア決定装置は、評判情報に優先順位を付す際に、より正確に優先順位を付せるようにするため、
入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出するスコア決定用評判情報判別手段(図14の143)と、
該スコア決定用評判情報判別手段(図14の143)で抽出した各評判情報を表示装置に表示して利用者に提示し、前記利用者が入力装置を用いて入力した前記各評判情報に対するスコアに基づいて、スコア記憶部(図4の163)に格納するスコアを決定するスコア決定手段(図14の146)とを備えている。
【0012】
このような構成を採用し、抽出された評判情報に対して利用者から入力されたスコアを利用して、スコア記憶部に格納しておくスコア(優先順位を決める際に使用するスコア)を決定するようにしているので、評判情報に優先順位を付す際に、より正確に優先順位を付すことが可能になる。
【0013】
【発明の実施の形態】
次に本発明の実施の形態について図面を参照して詳細に説明する。
【0014】
〔第1の実施の形態〕
図1を参照すると、本発明に係る情報検索装置1の第1の実施の形態は、文書入力手段11と、検索語入力手段12と、評判情報判別手段13と、判別結果記憶部14と、評判情報記憶部15と、評判情報優先度判定手段16と、優先順位記憶部17と、キーボード等の入力装置2と、LCD等の表示装置3と、記録媒体K1とを含む。尚、情報検索装置1は、コンピュータによって構成されるものである。
【0015】
文書入力手段11は、評判情報検索の対象となる文書の集合である文書集合を入力し、評判情報判別手段13に渡す機能を有する。文書の入力先は、インターネット上のWebページであっても良いし、複数の文書が記録されたファイルであっても構わない。
【0016】
検索語入力手段12は、利用者が入力装置2を用いて入力した検索語を受け付け、評判情報判別手段13に渡す機能を有する。
【0017】
評判情報判別手段13は、文書入力手段11から文書集合を受け取り、検索語入力手段12から検索語を受け取り、文書集合に含まれている検索語に関連する評判情報を抽出する機能を有する。
【0018】
図2に示すように、評判情報判別手段13は、評価表現記憶部131と、検索語位置特定手段132と、評価表現位置特定手段133と、表現間距離判定手段134と、評判情報抽出手段135とを有する。
【0019】
評価表現記憶部131には、複数の評価表現が格納されている。ここで評価表現とは、事物に対する価値を定めることのできる表現である。従って、「遊ぶ」「動く」「研究する」といった事物に対する価値を示さない表現は評価表現でない。評価表現は、「良い」「好き」「最高だ」「面白い」といった用言の他に、「人気」「絶品」「駄作」といった名詞も存在する。また、評価表現記憶部131における評価表現の記憶形式は、各評価表現の活用による表記の違いを吸収する単位で記憶する方式が記憶容量節約の面で効果的であるが、この方式に限定されるものではない。
【0020】
検索語位置特定手段132は、文書入力手段11から文書集合を受け取り、検索語入力手段12から検索語を受け取り、文書集合における検索語の出現位置(検索語出現位置)を特定する機能や、特定した検索語出現位置を表現間距離判定手段134に出力する機能を有する。検索語出現位置は、文書の先頭や最後尾等といった基準位置からの距離を算出する方法を用いて特定することができる。また、基準位置からの距離を算出する方法は、基準位置からの距離を算出することができれば、いかなる方法でも良い。具体的には、文書の先頭からの文字数により距離を算出する方法、文書の先頭からのByte数により距離を算出する方法、文書の先頭からの行数により距離を算出する方法が含まれる。また、出力する検索語の位置情報は、少なくとも検索語が出現する文書を特定する情報と、その文書内で検索語が出現する位置を特定する情報を含む。
【0021】
評価表現位置特定手段133は、文書入力手段11から文書集合を受け取り、評価表現記憶部131から評価表現を取り出し、文書集合における評価表現記憶部131に記憶された何れかの評価表現が出現する位置(評価表現出現位置)を特定する機能や、特定した評価表現出現位置を表現間距離判定手段134に出力する機能を有する。具体的には、評価表現位置特定手段133は、評価表現記憶部131に格納されている各評価表現毎に、その評価表現が文書集合に含まれているかを調べ、文書集合に含まれている場合は、その評価表現の出現位置を特定する。評価表現位置特定手段133における評価表現出現位置の特定は、検索語位置特定手段132と同一の方法で行う。また、出力する評価表現出現位置は、少なくとも評価表現が出現する文書を特定する情報と、その文書内で評価表現が出現する位置を特定する情報とを含んでいる。
【0022】
表現間距離判定手段134は、検索語位置特定手段132が特定した検索語出現位置と評価表現位置特定手段133が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対(検索語・評価表現対)を求める機能や、検索語・評価表現対を構成する検索語,評価表現及びその出現位置を判別結果記憶部14に格納する機能を有する。ここで、距離が一定の範囲内とは、例えば検索語と評価表現との間の数値的差分の大きさが閾値以下である場合や、検索語と評価表現との間に構文解析的依存関係がある場合が該当する。また、判別結果記憶部14に格納する出現位置には、文書を特定する情報と、その文書内での出現位置を特定する情報とが含まれる。尚、本実施の形態では、互いの距離が一定の範囲内の検索語と評価表現との対を検索語・評価表現対としているので、或る1つの検索語に対して、距離が一定の範囲内に複数の評価表現が存在する場合、上記或る検索語と上記複数の評価表現との対それぞれが検索語・評価表現対とされるが、上記或る検索語と上記複数の評価表現の内の1つとの対のみを検索語・評価表現対とするようにしても良い。その際、複数の評価表現の中から1つの評価表現を選択することが必要になるが、例えば、検索語から最も遠いものを選択する方法や、検索語に最も近いものを選択する方法や、最も後ろに存在するものを選択する方法等を採用することができる。
【0023】
評判情報抽出手段135は、判別結果記憶部14に格納されている検索語・評価表現対の出現位置と、文書入力手段11から入力される文書集合とに基づいて、少なくとも検索語・評価表現対によって挟まれる部分の文字列を含んだ評判情報を抽出し、評判情報記憶部15に格納する機能を有する。尚、抽出する評判情報は、例えば、検索語・評価表現対によって挟まれる部分の文字列のみであっても良いし、検索語・評価表現対によって挟まれる部分の文字列とその前後に存在する所定文字数分の文字列とを合わせたものでも良い。
【0024】
評判情報優先度判定手段16は、評判情報記憶部15に格納されている各評判情報に対して、評判情報らしさの順に優先順位を付ける機能や、評判情報記憶部15に格納されている各評判情報を優先順位の順で表示装置3に表示する機能や、各評判情報に対する優先順位を優先順位記憶部17に格納する機能等を有する。
【0025】
図4を参照すると、評判情報優先度判定手段16は、ルール記憶部161と、ルール照合手段162と、スコア記憶部163と、スコア検索手段164と、整列手段165と、提示手段166とを有する。
【0026】
ルール記憶部161には、評判情報の優先順位決定の基準となるルールが格納されている。図6にルール記憶部161の内容例を示す。図6の例においては、検索語と評価表現との位置関係に関する複数のルールと、評価表現の文章内での位置に関する複数のルールとが格納されている。検索語と評価表現との位置関係に関するルールとしては、ルールID1の「検索語と評価表現が別の文にある」や、ルールID2の「検索語と評価表現が接近している」等があり、評価表現の文章内での位置に関するルールとしては、ルールID11の「推量(かも,だろう等)を示す表現の近傍に評価表現が出現する」や、ルールID12の「疑問符の前方近傍に評価表現が出現する」等がある。また、図6の例では示していないが、検索語の文章内での位置に関するルールを使用するようにしても良い。このルールの具体例としては、「逆接(のに,けど等)の表現の前方に検索語が出現する」や、「原因(るから,だから等)の表現の前方に検索語が出現する」等があるルールの記述方法は、文字列の出現パターンを表現できる正規表現が有効であるが、形態素解析による単語の品詞及び原形、構文解析による単語間の依存関係を条件に指定することも可能である。
【0027】
ルール照合手段162は、評判情報記憶部15に格納されている各評判情報毎に、ルール記憶部161に格納されている各ルールと照合し、上記各ルールそれぞれについて評判情報がそのルールを満足するか否かを示す値(本実施の形態では、満足する場合は“1”,満足させていない場合は“0”とする)を出力する機能を有する。ここで、ルールに形態素解析による単語の品詞及び原形、構文解析による単語間の依存関係が条件として指定されている場合には、当該文字列に形態素解析、構文解析を用いる。
【0028】
スコア記憶部163には、ルール照合手段162から出力される可能性がある、各ルールに対する値(“1”或いは“0”)の組み合わせ毎に、評判情報の優先順位を決定する際に使用するスコアが格納されている。より具体的には、各ルールに対する値が配列の形式で格納され、且つ各配列に対応付けてスコアが格納されている。ここで、スコアの格納方法としては、配列をKey とし、スコアをValue として登録する。その例を図7に示す。尚、図7の例は、評判情報の優先順位決定の基準となるルールとして図6のような12個のルールを採用した場合についてのものである。また、スコアは、最高を5、最低を1とし、値が大きい程、優先順位が高いとしている。
【0029】
スコア検索手段164は、ルール照合手段162から出力された各ルールに対する値(12個のルールに対する12個の値)を構成要素とする配列をKey にしてスコア記憶部163を検索することにより、評判情報に対するスコアを検索する機能を有する。
【0030】
整列手段165は、スコア検索手段164で検索された、評判情報記憶部15に格納されている各評判情報に対するスコアに基づいて、上記各評判情報を特定するための情報(評判ID)にスコアが大きい順に優先順位を付す機能や、優先順位を付した後の評判IDを提示手段166に渡す機能や、優先順位を付した後の評判IDを優先順位記憶部17に格納する機能を有する。
【0031】
提示手段166は、整列手段165から渡された優先順位の付された評判IDに従って、評判情報記憶部15に格納されている各評判情報を、優先順位が高い順(評判情報である確率が高い順)に表示装置3に表示する機能を有する。
【0032】
情報検索装置1が備えている記録媒体K1は、ディスク,半導体メモリ,その他の記録媒体であり、コンピュータを情報検索装置1として機能させるためのプログラムが記録されている。このプログラムは、コンピュータによって読み取られ、その動作を制御することで、コンピュータ上に文書入力手段11,検索語入力手段12,評判情報判別手段13,評判情報優先度判定手段16を実現する。
【0033】
〔動作の説明〕
次に本発明の第1の実施の形態の動作について、図面を用いて説明する。尚、動作の説明は、評判情報を抽出する部分と、抽出された評判情報に優先順位を付ける部分の2つに分けて行う。
【0034】
〔1.評判情報抽出時の動作〕
先ず、文書入力手段11が文書集合を評判情報判別手段13に入力すると共に、検索語入力手段12が評判情報の検索語となる文字列を入力する(図3のS31)。尚、文書入力手段11は、文書集合を評判情報判別手段13へ入力する際、文書集合に含まれる各文書に対してユニークな文書番号を付与し、文書集合中の各文書を文書番号によって識別できるようにしている。
【0035】
次に、評判情報判別手段13内の検索語位置特定手段132が、文書集合における検索語の出現位置を特定し、特定した出現位置及び検索語を含む検索語出現位置情報を表現間距離判定手段134に出力する(S32)。
【0036】
今、例えば、文書入力手段11から入力された文書集合に、文書番号1の文書として「商品Aは非常に面白い。また、商品Bは価格が安いのでお勧め。」が含まれ、検索語入力手段12から検索語として「商品A」が入力されていたとすると、検索語位置特定手段132は、文書番号1の文書に対しては、次のような処理を行うことになる(尚、検索語位置特定手段132は、検索語出現位置の特定方法として文書の先頭からのByte数を算出する方法を採用しているとする)。先ず、検索語「商品A」の出現位置を、文書番号1の文書の先頭から0Byte目と特定する。次に、検索語出現位置「文書番号1,0Byte」と検索語「商品A」とを含む検索語出現位置情報「文書番号1,商品A,0Byte」を作成し、表現間距離判定手段134に出力する。
【0037】
S32の処理が終了すると、評価表現位置特定手段133が、評価表現記憶部131に格納されている各評価表現の、文書集合中における出現位置を特定し、特定した出現位置及び評価表現を含む評価表現出現位置情報を表現間距離判定手段134に出力する(S33)。今、例えば、評価表現記憶部131に、評価表現の集合として「面白い、お勧め、好き、いい」が格納されており、評価表現位置特定手段133が、評価表現出現位置の特定方法として文書の先頭からのByte数を算出する方法を採用しているとすると、評価表現位置特定手段133は、文書番号1の文書に対しては、次のような処理を行うことになる。先ず、評価表現位置特定手段133は、評価表現記憶部131に格納されている評価表現の内、「面白い」と「お勧め」が文書番号1の文書に含まれていることを認識し、それぞれの出現位置を「文書番号1,14Byte」「文書番号1,48Byte」と特定する。その後、評価表現出現位置「文書番号1,14Byte」と評価表現「面白い」を含む評価表現出現位置情報「文書番号1,面白い,14Byte」と、評価表現出現位置「文書番号1,48Byte」と評価表現「お勧め」を含む評価表現出現位置情報「文書番号1,お勧め,48Byte」とを作成し、表現間距離判定手段134に出力する。
【0038】
なお、S32とS33とは、その処理順序を反対にすることもできる。
【0039】
次に、表現間距離判定手段134が、検索語位置特定手段132から出力された検索語出現位置情報と評価表現位置特定手段133から出力された評価表現出現位置情報とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対(検索語・評価表現対)を求め、その対を構成する検索語,評価表現及びそれらの出現位置を含む対出現位置情報を判別結果記憶部14に格納する(S34,S35)。
【0040】
今、例えば、検索語位置特定手段132から検索語出現位置「文書番号1,商品A, 0Byte) が出力され、評価表現位置特定手段133から評価表現出現位置情報「文書番号1, 面白い, 14Byte」「文書番号1,お勧め, 48Byte」が出力されたとすると、S34,S35では、次のような処理が行われる。先ず、検索語「商品A」と評価表現「面白い」「お勧め」との間の距離を求める。この例の場合、検索語「商品A」と評価表現「面白い」のと間の距離は14−0=14Byteとなり、検索語「商品A」と評価表現「お勧め」との間の距離は48−0=48Byteとなる。その後、検索語と評価表現との間の距離が予め定められた閾値(この例では、30Byteとする)以下であるか否かを調べ、閾値以下であった場合は、検索語,評価表現及びその出現位置を含む対出現位置情報を判別結果記憶部14に格納する。この例の場合、検索語「商品A」と評価表現「面白い」との間の距離は閾値以下であり、検索語「商品A」と評価表現「お勧め」との間の距離は閾値を超えているので、表現間距離判定手段134は、判別結果記憶部14に対し、検索語「商品A」と評判情報「面白い」とを構成要素とする対に関する対出現位置情報(文書番号1, 商品A, 0Byte, 面白い, 14Byte) を出力することになる。
【0041】
また、上記の動作では、表現間距離判定手段134は、検索位置特定手段132と評価表現位置特定手段133の両方から情報が出力された後に動作を開始する方法を説明したが、それ以外にも検索語位置特定手段132で特定された検索語の位置と評価表現位置特定手段133で特定された評価表現の位置のいずれかを基準として動作を行うことも可能である。今、検索語位置特定手段132により特定された検索語の位置情報を基準とする場合について説明すると、まず基準とした手段である検索語位置特定手段132が、検索語出現位置情報を表現間距離判定手段134に出力し、次に表現間距離判定手段134が、基準としなかった手段である評価表現位置特定手段133に対し、基準とした手段である検索語位置特定手段132の出力した検索語出現位置情報を出力する。そして、基準としなかった手段である評価表現位置特定手段133は、受け取った検索語出現位置と距離の範囲(閾値)とから、検索語の位置から設定された距離の範囲だけ前方又は後方の範囲内に評価表現があるか否かを調べ、評価表現が存在する場合、その評価表現の位置を特定し、その評価表現の評価表現出現位置情報を表現間距離判定手段134に出力する。そして、最後に表現間距離判定手段134は、基準としなかった手段である評価表現位置特定手段133から出力された評価表現出現位置情報を受け取り、検索語出現位置情報と評価表現出現位置情報から、検索語と評価表現の距離が一定の範囲内である場合、対出現位置情報を判別結果記憶部14に格納するという方法でも良い。
【0042】
その後、評判情報抽出手段135が、判別結果記憶部14に格納されている対出現位置情報と、文書入力手段11から入力されている文書集合とに基づいて、少なくとも検索語・評価表現対によって挟まれる文字列を評判情報として抽出し、評判情報記憶部15に格納する(S36,S37)。今、例えば、判別結果記憶部14の記憶内容が図8に示すものであるとすると、図9に示すような評判情報が評判情報記憶部15に格納される。
【0043】
〔2.優先順位付与時の動作〕
今、ルール記憶部161に格納された評判情報の優先順位決定の基準となるルールが、図6に示した12個のルールで、スコア記憶部163の内容を図7に示したものであるとして、動作を説明する。また、図8、図9、図10、図11の対応関係は評判IDで結びついている。
【0044】
評判情報優先度判定手段16内のルール照合手段162は、評判情報記憶部15に格納されている各評判情報毎に、次のような処理を行う。現在処理対象にしている或る1個の評判情報と、ルール記憶部161に格納されている12個のルールそれぞれとを照合し、上記各ルールそれぞれについて処理対象としている評判情報がそのルールを満足するか否かを示す値と、処理対象にしている評判情報の評判IDとを出力する(図5のS51)。
【0045】
次に、スコア検索手段164が、ルール照合手段162から出力された12個の値を構成要素とする配列をKey にしてスコア記憶部163を検索することにより、評判情報に対するスコアを検索し、検索したスコアと評判IDとを出力する(S52)。図10に、各評判IDに対する配列と、それをKey として図7のスコア記憶部163からスコアを検索した結果を示す。
【0046】
次に、整列手段165が、スコア検索手段164から出力された複数の評判IDを、それに付加されているスコアの大きさの順に整列し、その順番を評判情報の優先順位として出力する(S53)。本実施の形態では、スコアが大きい順に優先順位を付け各評判IDに対して図11のような優先順位を付け出力する。
【0047】
その後、提示手段166が、整列手段165から渡された優先順位の付された評判IDに従って、評判情報記憶部15に格納されている各評判情報を、優先順位が高い順(評判情報である確率が高い順)に表示装置3に表示する(S54)。
【0048】
以上のように、本発明の第1の実施の形態においては、評判情報を自動的に抽出し、かつ、評判情報の優先順位の自動判定を行うことから、より評判情報らしいものを利用者は優先的に手に入れることが可能となる。
【0049】
〔第2の実施の形態〕
次に、本発明の第2の実施の形態について説明する。本発明の第2の実施の形態は、図1に示した情報検索装置において、評判情報判別手段13の代わりに、図12に示す構成を有する評判情報判別手段13aを備えている点が第1の実施の形態と相違している。
【0050】
図12に示した評判情報判別手段13aが、図2に示した評判情報判別手段13と異なっている点は、評価表現記憶部131の代わりに評価表現記憶部131aを備えている点と、評価表現位置特定手段133の代わりに評価表現位置特定手段133aを備えている点と、検索語分野特定手段136が追加されている点である。
【0051】
評価表現記憶部131aには、評価表現に加え、その評価表現が使用される分野、またはその評価表現が使用されない分野を示す分野情報が、評価表現と組になって格納されている。
【0052】
検索語分野特定手段136は、検索語入力手段12から入力された検索語の分野を特定し、その結果を評価表現位置特定手段133aに出力する機能を有する。ここで、検索語の分野を特定する方法は、検索語入力手段12の入力が検索語とその検索語の分野とを含んでいる場合は、その入力された分野を検索語の分野として特定し、それ以外の場合については、図示を省略した、検索語と検索語の分野の対応関係を記憶したデータベースを参照することにより検索語の分野を特定する。
【0053】
また、評価表現位置特定手段133aは、評価表現記憶部131aに格納されている複数の評価表現の中から検索語分野特定手段136で特定された分野で使用される評価表現のみを選択する機能や、選択した評価表現の、文書入力手段11から入力された文書における出現位置を特定し、出現した評価表現とその出現位置とを含む評価表現出現位置情報を出力する機能を有する。
【0054】
〔動作の説明〕
第2の実施の形態の動作を図面を参照して説明する。なお、評判情報判別手段13a以外の動作は、第1の実施の形態と同じであるので、ここでは、評判情報判別手段13aの動作のみ説明する。
【0055】
図13を参照すると、S31において、文書入力手段11,検索語入力手段12から文書集合,検索語を入力し、次のS32において、検索語位置特定手段132が検索語の出現位置を特定し、検索語出現位置情報を出力する。このS31,S32の動作は、図3のS31,S32と同様の動作である。
【0056】
その後、検索語分野特定手段136が検索語の分野を特定する(S131)。ここで、検索語入力手段12から検索語の分野も入力されている場合は、その入力された分野を検索語の分野として特定し、それ以外の場合については、検索語と検索語の分野の対応関係を記憶したデータベース(図示せず)を参照することにより検索語の分野を特定する。
【0057】
評価表現位置特定手段133aは、検索語分野特定手段136により出力された検索語の分野を用いて、評価表現記憶部131aからその検索語の分野で使用される評価表現を選択する(S132)。そして、評価表現位置特定手段133aは、各文書における選択した評価表現が出現する位置を特定し、その評価表現に関する評価表現出現位置情報を表現間距離判定手段134に出力する(S133)。その後、表現間距離判定手段134,評判情報抽出手段135が、第1の実施の形態で説明した動作と同様の動作を行う(S34〜S37)。
【0058】
なお、本実施の形態の動作において、上記で説明した以外でも、S31→S131→S32→S132→S133→S34→S35→S36→S37、S31→S131→S132→S32→S133→S34→S35→S36→S37、S31→S131→S132→S133→S32→S34→S35→S36→S37の順序でも同様の処理が可能である。
【0059】
本実施の形態では、例えば、検索語の分野が「書籍」の場合、評価表現位置特定手段133aが評価表現の位置を特定する際に、評価表現記憶部131aに格納されている評価表現の中から、評価表現「おいしい」のような「書籍」に関する評判では使用されない評価表現を除外して、評価表現の位置を特定することができる。このため、評判情報の判別精度の向上および判別速度の高速化が可能となる。
【0060】
〔スコアの決定方法〕
次に、図4に示したスコア記憶部163に格納するスコアの決定方法およびその装置の一例について説明する。
【0061】
図14を参照すると、スコア決定装置は、スコア決定用文書入力手段141と、スコア決定用検索語入力手段142と、スコア決定用評判情報判別手段143と、スコア決定用判別結果記憶部144と、スコア決定用評判情報記憶部145と、スコア決定手段146と、キーボード等の入力装置147と、LCD等の表示装置148とを含んでいる。
【0062】
スコア決定用文書入力手段141,スコア決定用検索語入力手段142は、文書入力手段11,検索語入力手段12と同様の構成,機能を有している。
【0063】
スコア決定用評判情報判別手段143は、第1の実施の形態で説明した評判情報判別手段13、または第2の実施の形態で説明した評判情報判別手段13aと同様の構成,機能を有している。
【0064】
スコア決定手段146は、スコア決定用評判情報記憶部145に格納されている評判情報を表示装置147に表示して利用者に提示する機能や、この表示を見た利用者が入力装置148を用いて入力した評判情報に対するスコアに基づいて、図7に示したスコア記憶部163に格納するスコアを決定する機能を有する。
【0065】
図15を参照するとスコア決定手段146は、スコア決定用ルール記憶部201と、スコア決定用ルール照合手段202と、頻度付きスコア記憶部203と、頻度付きスコア検索手段204と、スコア算出手段205と、表示制御手段206と、スコア入力手段207とを備えている。
【0066】
スコア決定用ルール記憶部201には、第1の実施の形態で説明したルール記憶部161と同様の内容が格納されている。
【0067】
スコア決定用ルール照合手段202は、第1の実施の形態で説明したルール照合手段162と同様の構成,機能を有している。
【0068】
表示制御手段206は、スコア決定用評判情報記憶部145に格納されている評判情報を表示装置147に表示する機能等を有する。
【0069】
スコア入力手段207は、表示装置147に表示された評判情報を見た利用者が入力装置148を見て入力したスコア(評判情報らしさを示すスコア)を受け付ける機能を有している。
【0070】
頻度付きスコア記憶部203には、第1の実施の形態のスコア記憶部163に格納されている情報に加え、スコア入力手段207で入力された利用者からのスコアの総和及びスコアの総入力回数が格納される。尚、ここで格納されるスコアとは、スコアの総和をスコアの総入力回数で割ったスコアの平均値である。
【0071】
頻度付きスコア検索手段204は、スコア決定用ルール照合手段202から出力された、評判情報がスコア決定用ルール記憶部201に格納されている各ルールを満足するか否かを示す値を構成要素とする配列をKey にして頻度付きスコア記憶部203を検索し、上記評判情報に対するスコアの総和とスコアの総入力回数を検索する機能を有する。
【0072】
スコア算出手段205は、頻度付きスコア検索手段204で検索されたスコアの総和にスコア入力手段207から入力された当該評判情報に対する利用者のスコアを加算すると共に、スコアの総入力回数に1を加算した後、頻度付きスコア記憶部203の該当部分(頻度付きスコア検索手段204によって検索された部分)に更新後のスコアの総和,スコアの総入力回数を格納すると共に、スコアの総和をスコアの総入力回数で割った平均値を格納する機能を有する。
【0073】
〔動作の説明〕
次に、図14に示したスコア決定装置の動作について詳細に説明する。
【0074】
先ず、スコア決定用評判情報判別手段143が、検索語・評価表現対の対出現位置情報をスコア決定用判別結果記憶部144に格納すると共に、評判情報をスコア決定用評判情報記憶部145に格納する。この処理により、スコア決定用判別結果記憶部144に図17に示す対出現位置情報が格納され、スコア決定用評判情報記憶部145に図18に示す評判情報が格納されたとする。尚、図17,図18の対応関係は、評判IDによって示されている。
【0075】
スコア決定用評判情報記憶部145に評判情報が格納されると、表示制御手段206は、図19に示すように、スコア決定用評判情報記憶部145に格納されている各評判情報を表示装置147に表示すると共に、スコア入力欄を表示する(図16のS161)。
【0076】
この表示を見た利用者は、各評判情報に対する評判情報らしさのスコアを、スコア入力欄を用いて入力する(S162)。今、例えば、利用者が各評判情報に対して図20に示したスコアを入力したとする。尚、図20と図17,図18との対応関係は、評判IDによって示されている。
【0077】
次に、スコア決定用ルール照合手段202が、スコア入力手段207からスコアが入力された評判情報の内の一つを選択し(S163)、この評判情報に対してスコア決定用ルール記憶部201に格納された評判情報の優先順位決定の基準となるルールの各々を照合し、各ルールを満足させるか否かの値を出力する(S164)。尚、スコア決定用ルール記憶部201には、図6に示す12個のルールと同じルールが格納されているとする。
【0078】
次に、頻度付きスコア検索手段204が、スコア決定用ルール照合手段202から出力された各ルールに対する値を構成要素にする配列をKey として、頻度付きスコア記憶部203からスコアの総和とスコアの総入力回数を検索する(S165)。
【0079】
次に、スコア算出手段205が、頻度付きスコア検索手段204から出力されたスコアの総和にスコア入力手段207から入力された当該評判情報に対する利用者のスコアを加算すると共にスコアの総入力回数に1を加算し、その後、スコアの総和をスコアの総入力回数で割った平均値を算出する(S166)。更に、それらを頻度付きスコア記憶部203の該当する部分(S165において頻度付きスコア検索手段204がスコアの総数,総入力回数を検索した部分)に格納する(S167)。
【0080】
最後に、未だ未処理の入力がある場合はS163に戻る(S168)。以上の処理により、頻度付きスコア記憶部203の内容は、図21に示すものとなる。以上の処理を多数の評判情報に対して行うことにより、図4に示したスコア記憶部163に格納する、各配列毎のスコアを決定することができる。
【0081】
なお、図16に示した各S161〜S168の実行順序は、これに限られるものではなく、図22のように最初にS164の処理を行うようにしても良い。更に、S164が、S161とS162との間にあっても、S162とS163との間にあっても良い。
【0082】
以上のように、本実施の形態によれば、スコア決定用評判情報判別手段143で抽出された各評判情報に対して利用者から入力されたスコアを利用して、優先順位を決定する際に使用するスコアを決定するようにしているので、評判情報に優先順位を付す際に、より正確に優先順位を付すことが可能になる。
【0083】
【発明の効果】
本発明の第1の効果は、評判情報の出現位置の自動判定に加え評判情報の優先順位の自動判定を行うことにより、より評判情報らしいものから順番に利用者に提示できることである。その理由は、入力された文書に含まれる検索語に関する評判情報を抽出する評判情報判別手段と、判別情報判別手段で抽出した各評判情報を評判情報らしさの順に優先順位を付ける評判情報優先度判定手段を有するためである。
【0084】
本発明の第2の効果は、評判情報の抽出精度,抽出処理速度が向上することである。その理由は、検索語が使用される分野を特定し、上記分野で使用されない評価表現は除外して評判情報の抽出処理を行うからである。
【0085】
本発明の第3の効果は、評判情報に優先順位を付す際に、より正確に優先順位を付すことが可能になるということである。その理由は、各評判情報に対して利用者から入力されたスコアを利用して、優先順位を決定する際に使用するスコアを決定するようにしているからである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の構成例を示すブロック図である。
【図2】評判情報判別手段13の構成例を示すブロック図である。
【図3】評判情報判別手段13の処理例を示す流れ図である。
【図4】評判情報優先度判定手段16の構成例を示すブロック図である。
【図5】評判情報優先度判定手段16の処理例を示す流れ図である。
【図6】ルール記憶部161の内容例を示す図である。
【図7】スコア記憶部163の内容例を示す図である。
【図8】判別結果記憶部14の内容例を示す図である。
【図9】評判情報記憶部15の内容例を示す図である。
【図10】各評判情報の配列とスコアの一例を示す図である。
【図11】各評判情報の優先順位の一例を示す図である。
【図12】本発明の第2の実施の形態で使用する評判情報判別手段13aの構成例を示すブロック図である。
【図13】評判情報判別手段13aの処理例を示す流れ図である。
【図14】スコア決定装置の構成例を示すブロック図である。
【図15】スコア決定手段146の構成例を示すブロック図である。
【図16】スコア決定装置の処理例を示す流れ図である。
【図17】スコア決定用判別結果記憶部144の内容例を示す図である。
【図18】スコア決定用評判情報記憶部145の内容例を示す図である。
【図19】表示制御手段206による評判情報,入力欄の表示例を示す図である。
【図20】利用者によって入力されたスコアの一例を示す図である。
【図21】頻度付きスコア記憶部203の最終的な内容を示した図である。
【図22】スコア決定装置の他の処理例を示す流れ図である。
【符号の説明】
1…情報検索装置
11…文書入力手段
12…検索語入力手段
13…評判情報判別手段
131…評価表現記憶部
132…検索語位置特定手段
133…評価表現位置特定手段
134…表現間距離判定手段
135…評判情報抽出手段
14…判別結果記憶部
15…評判情報記憶部
16…評判情報優先度判定手段
161…ルール記憶部
162…ルール照合手段
163…スコア記憶部
164…スコア検索手段
165…整列手段
166…提示手段
17…優先順位記憶部
2…入力装置
3…表示装置
K1…記録媒体
13a…評判情報判別手段
131a…評価表現記憶部
133a…評価表現位置特定手段
136…検索語分野特定手段
141…スコア決定用文書入力手段
142…スコア決定用検索語入力手段
143…スコア決定用評判情報判別手段
144…スコア決定用判別結果記憶部
145…スコア決定用評判情報記憶部
146…スコア決定手段
147…表示装置
148…入力装置
201…スコア決定用ルール記憶部
202…スコア決定用ルール照合手段
203…頻度付きスコア記憶部
204…頻度付きスコア検索手段
205…スコア算出手段
206…表示制御手段
207…スコア入力手段[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information search technique, and more particularly to an information search technique capable of searching for reputation information.
[0002]
[Prior art]
Currently, there are many information retrieval systems that automatically collect attribute information from search terms and present them to users. For example, a system provided by MySimon (http://www.mysimon.com) presents attribute information (price) related to a search term (product name) to the user as follows. When a user inputs a product name as a search term, the product name is sent to a certain online shop α that sells the product. In response to this, the online shop α searches for attribute information such as price, size, color, weight, etc. relating to the product name, and returns the search result in a standard form (format). When the attribute information is returned, price information is extracted based on the format of the online shop α recognized in advance and presented to the user.
[0003]
In addition, as a system that can retrieve attribute information by using a search word as a clue, there is a system that allows a user to see information that the user wants from attribute information collected in advance by hand. For example, at Deja.com (http://www.deja.com), reputation information is collected from consumers as attribute information about the product in advance, and the user can obtain the reputation information by selecting the name of the product. .
[0004]
[Problems to be solved by the invention]
However, in the information search system that can automatically collect the attribute information described above, even if it is possible to handle attribute information that can identify the appearance position by using typical search result information such as product names and price attributes. Attribute information whose appearance position cannot be specified cannot be automatically collected because it does not appear as search result information such as reputation information.
[0005]
On the other hand, in information retrieval systems that manually collect attribute information in advance, it is possible to handle unspecified attributes such as reputation information, but methods that depend on human work are limited in terms of quantity. Even in the above-mentioned reputation information of products, it is the present situation that products other than extremely well-known products are not sufficient for use as judgment material for product purchase.
[0006]
The present invention has been made in view of such problems, and the purpose thereof is to enable automatic retrieval of reputation information that is unspecified attribute information, and each piece of reputation information that is automatically retrieved is most likely to be reputation information. It is to be able to present to the user in order from the thing.
[0007]
[Means for Solving the Problems]
The information retrieval apparatus of the present invention achieves the above-described object,
Reputation information discrimination that extracts reputation information about the designated search term existing in the input document based on the appearance position of the search term in the document and the appearance position of the evaluation expression that determines the value for things Means (13 in FIG. 1);
Reputation information extracted by the reputation information discrimination means (13 in FIG. 1) For each, the reputation information is a rule group related to the positional relationship between the search word in the reputation information and the evaluation expression, a rule group related to the position of the search word in the reputation information, or a rule group related to the position of the evaluation expression in the reputation information. Check which rule in the rule group including at least one of the rules is satisfied, and based on the combination of the satisfied rules, there is a high probability that the respective reputation information is the reputation information related to the search word Reputation information priority determination means (16 in FIG. 1) for assigning priorities in order.
[0008]
By adopting such a configuration and performing automatic determination of the priority order of reputation information in addition to automatic extraction of reputation information, the user can preferentially know what seems to be reputation information.
[0009]
In addition, the information retrieval apparatus of the present invention improves reputation information extraction accuracy and extraction speed,
The reputation information determining means (13a in FIG. 12)
A search term field specifying means (136 in FIG. 12) for specifying a field in which the search term is used;
Search word position specifying means (132 in FIG. 12) for specifying a search word appearance position where the search word appears in the document;
An evaluation expression storage unit (131a in FIG. 12) in which a plurality of evaluation expressions and field information indicating the field of use of each evaluation expression are stored;
Of the evaluation expressions stored in the evaluation expression storage unit (131a in FIG. 12) in the document, an evaluation expression used in the field specified by the search word field specifying means (136 in FIG. 12) appears. Evaluation expression position specifying means (133a in FIG. 12) for specifying the evaluation expression appearance position to be performed;
Based on the search word appearance position specified by the search word position specifying means (132 in FIG. 12) and the evaluation expression appearance position specified by the evaluation expression position specifying means (133a in FIG. 12), the mutual distance is constant. An inter-expression distance determination means (134 in FIG. 12) for obtaining a pair of a search term and an evaluation expression within a range;
Reputation information extraction means (135 in FIG. 12) for extracting reputation information including at least a portion sandwiched between the search word constituting the pair and the evaluation expression obtained by the inter-expression distance determination means (134 in FIG. 12) from the document. ).
[0010]
By adopting such a configuration, when the field in which the search term is used is “book”, for example, the evaluation information that is not used for the reputation information related to “book” such as “delicious” is excluded, and the reputation information Since extraction processing can be performed, reputation information extraction accuracy and extraction processing speed are improved.
[0011]
In addition, the score determination device of the present invention can give priority more accurately when giving priority to reputation information.
For score determination that extracts reputation information about the specified search term existing in the input document based on the appearance position of the search term in the document and the appearance position of the evaluation expression that determines the value for things Reputation information discrimination means (143 in FIG. 14);
Each reputation information extracted by the score determination reputation information discriminating means (143 in FIG. 14) is displayed on a display device and presented to the user, and the score for each reputation information input by the user using the input device. And score determining means (146 in FIG. 14) for determining the score to be stored in the score storage unit (163 in FIG. 4).
[0012]
Adopting such a configuration, using the score input from the user for the extracted reputation information, determine the score to be stored in the score storage unit (score used when determining the priority) Therefore, when assigning priorities to reputation information, it becomes possible to assign priorities more accurately.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments of the present invention will be described in detail with reference to the drawings.
[0014]
[First Embodiment]
Referring to FIG. 1, a first embodiment of an
[0015]
The
[0016]
The search
[0017]
The reputation
[0018]
As shown in FIG. 2, the reputation
[0019]
The evaluation
[0020]
The search word position specifying means 132 receives a document set from the document input means 11, receives a search word from the search word input means 12, and specifies a search word appearance position (search word appearance position) in the document set. The search word appearance position is output to the inter-expression distance determination means 134. The search word appearance position can be specified using a method of calculating a distance from a reference position such as the beginning or the end of the document. The method for calculating the distance from the reference position may be any method as long as the distance from the reference position can be calculated. Specifically, a method for calculating the distance from the number of characters from the top of the document, a method for calculating the distance from the number of bytes from the top of the document, and a method of calculating the distance from the number of lines from the top of the document are included. Further, the position information of the search word to be output includes at least information for specifying the document in which the search word appears and information for specifying the position in which the search word appears in the document.
[0021]
The evaluation expression
[0022]
The inter-expression
[0023]
The reputation
[0024]
The reputation information priority determination means 16 has a function of prioritizing each reputation information stored in the reputation
[0025]
Referring to FIG. 4, the reputation information
[0026]
The rule storage unit 161 stores rules that serve as a basis for determining the priority order of reputation information. FIG. 6 shows an example of the contents of the rule storage unit 161. In the example of FIG. 6, a plurality of rules relating to the positional relationship between the search term and the evaluation expression and a plurality of rules relating to the position of the evaluation expression in the sentence are stored. Rules relating to the positional relationship between the search term and the evaluation expression include
[0027]
The rule matching means 162 checks each reputation information stored in the reputation
[0028]
The
[0029]
The
[0030]
The aligning
[0031]
The presenting
[0032]
A recording medium K1 provided in the
[0033]
[Description of operation]
Next, the operation of the first exemplary embodiment of the present invention will be described with reference to the drawings. The operation will be described in two parts: a part for extracting reputation information and a part for giving priority to the extracted reputation information.
[0034]
[1. Behavior when extracting reputation information)
First, the document input means 11 inputs a document set to the reputation information determination means 13, and the search word input means 12 inputs a character string that is a search word for reputation information (S31 in FIG. 3). The
[0035]
Next, the search word position specifying means 132 in the reputation
[0036]
Now, for example, the document set input from the document input means 11 includes “Product A is very interesting. Product B is recommended because the price is low” as a document with
[0037]
When the processing of S32 ends, the evaluation expression
[0038]
Note that the processing order of S32 and S33 can be reversed.
[0039]
Next, the inter-expression
[0040]
Now, for example, the search word appearance position “
[0041]
In the above operation, the inter-expression
[0042]
Thereafter, the reputation
[0043]
[2. (Operation when priority is given)
Now, it is assumed that the rules for determining the priority order of reputation information stored in the rule storage unit 161 are the 12 rules shown in FIG. 6 and the contents of the
[0044]
The
[0045]
Next, the
[0046]
Next, the
[0047]
After that, the presenting
[0048]
As described above, in the first embodiment of the present invention, reputation information is automatically extracted and the priority order of reputation information is automatically determined. It becomes possible to obtain it preferentially.
[0049]
[Second Embodiment]
Next, a second embodiment of the present invention will be described. The second embodiment of the present invention is that the information search apparatus shown in FIG. 1 includes a reputation information discrimination means 13a having the configuration shown in FIG. This is different from the embodiment.
[0050]
The reputation information discrimination means 13a shown in FIG. 12 is different from the reputation information discrimination means 13 shown in FIG. 2 in that an evaluation expression storage unit 131a is provided instead of the evaluation
[0051]
In the evaluation expression storage unit 131a, in addition to the evaluation expression, field information indicating a field in which the evaluation expression is used or a field in which the evaluation expression is not used is stored in combination with the evaluation expression.
[0052]
The search term
[0053]
The evaluation expression position specifying unit 133a has a function of selecting only an evaluation expression used in the field specified by the search word
[0054]
[Description of operation]
The operation of the second embodiment will be described with reference to the drawings. Since operations other than the reputation information determination unit 13a are the same as those in the first embodiment, only the operation of the reputation information determination unit 13a will be described here.
[0055]
Referring to FIG. 13, in S31, a document set and a search word are input from the document input means 11 and the search word input means 12, and in next S32, the search word position specifying means 132 specifies the appearance position of the search word, Outputs search word appearance position information. The operations of S31 and S32 are the same as S31 and S32 of FIG.
[0056]
Thereafter, the search term field specifying means 136 specifies the search term field (S131). Here, when the field of the search word is also input from the search
[0057]
The evaluation expression position specifying unit 133a selects the evaluation expression used in the field of the search word from the evaluation expression storage unit 131a using the field of the search word output by the search word field specifying unit 136 (S132). Then, the evaluation expression position specifying unit 133a specifies a position where the selected evaluation expression appears in each document, and outputs evaluation expression appearance position information regarding the evaluation expression to the inter-expression distance determination unit 134 (S133). Thereafter, the inter-expression
[0058]
In the operation of the present embodiment, S31 → S131 → S32 → S132 → S133 → S34 → S35 → S36 → S37, S31 → S131 → S132 → S32 → S133 → S34 → S35 → S36 other than those described above. The same processing can be performed in the order of S37, S31, S131, S132, S133, S32, S34, S35, S36, and S37.
[0059]
In the present embodiment, for example, when the field of the search term is “book”, when the evaluation expression position specifying unit 133a specifies the position of the evaluation expression, the evaluation expression stored in the evaluation expression storage unit 131a Therefore, the position of the evaluation expression can be specified by excluding the evaluation expression that is not used in the reputation regarding the “book” such as the evaluation expression “delicious”. For this reason, it is possible to improve reputation information discrimination accuracy and increase discrimination speed.
[0060]
[Score Determination Method]
Next, an example of a method for determining a score stored in the
[0061]
Referring to FIG. 14, the score determination device includes a score determination document input unit 141, a score determination search
[0062]
The score determination document input unit 141 and the score determination search
[0063]
The score determination reputation
[0064]
The score determination means 146 has a function of displaying the reputation information stored in the score determination reputation
[0065]
Referring to FIG. 15, the
[0066]
The score determination
[0067]
The score determination
[0068]
The display control means 206 has a function of displaying the reputation information stored in the score determination reputation
[0069]
The score input unit 207 has a function of receiving a score (score indicating reputation information-likeness) input by a user who has viewed the reputation information displayed on the
[0070]
In addition to the information stored in the
[0071]
The score-with-frequency search means 204 outputs a value indicating whether or not the reputation information output from the score determination rule matching means 202 satisfies each rule stored in the score determination
[0072]
The score calculation means 205 adds the user's score for the reputation information input from the score input means 207 to the sum of the scores searched by the frequency score search means 204 and adds 1 to the total number of score inputs. After that, the sum of the updated score and the total number of input times of the score are stored in the corresponding part of the scored score storage unit 203 (the part searched by the frequencyd score search unit 204), and the total score is calculated as the total score. It has a function to store the average value divided by the number of inputs.
[0073]
[Description of operation]
Next, the operation of the score determination device shown in FIG. 14 will be described in detail.
[0074]
First, the score determination reputation
[0075]
When the reputation information is stored in the score determination reputation
[0076]
The user who sees this display inputs a score of reputation information likelihood for each piece of reputation information using the score input field (S162). Now, for example, assume that the user inputs the score shown in FIG. 20 for each piece of reputation information. The correspondence between FIG. 20 and FIGS. 17 and 18 is indicated by a reputation ID.
[0077]
Next, the score determination
[0078]
Next, the frequency-added
[0079]
Next, the
[0080]
Finally, if there is an unprocessed input, the process returns to S163 (S168). With the above processing, the content of the scored
[0081]
The execution order of S161 to S168 shown in FIG. 16 is not limited to this, and the process of S164 may be performed first as shown in FIG. Further, S164 may be between S161 and S162, or between S162 and S163.
[0082]
As described above, according to the present embodiment, when the priority is determined using the score input from the user for each piece of reputation information extracted by the score determination reputation
[0083]
【The invention's effect】
The first effect of the present invention is that, by performing automatic determination of the priority order of reputation information in addition to automatic determination of the appearance position of reputation information, it can be presented to the user in order from what seems to be reputation information. The reason is that reputation information determination means for extracting reputation information related to a search term included in the input document, and reputation information priority determination that prioritizes each reputation information extracted by the determination information determination means in the order of reputation information likelihood. This is because it has means.
[0084]
The second effect of the present invention is that reputation information extraction accuracy and extraction processing speed are improved. The reason is that a field in which the search term is used is specified, and reputation information is extracted by excluding evaluation expressions that are not used in the field.
[0085]
The third effect of the present invention is that it becomes possible to assign priorities more accurately when assigning priorities to reputation information. The reason is that the score used when determining the priority order is determined using the score input from the user for each piece of reputation information.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example of a first exemplary embodiment of the present invention.
FIG. 2 is a block diagram illustrating a configuration example of reputation information determination means 13;
FIG. 3 is a flowchart showing a processing example of reputation information determination means 13;
FIG. 4 is a block diagram showing a configuration example of reputation information priority determination means 16;
FIG. 5 is a flowchart showing a processing example of reputation information priority determination means 16;
6 is a diagram illustrating an example of contents of a rule storage unit 161. FIG.
FIG. 7 is a diagram illustrating an example of contents of a
FIG. 8 is a diagram illustrating an example of contents of a discrimination
FIG. 9 is a diagram illustrating an example of contents of a reputation
FIG. 10 is a diagram illustrating an example of an array and scores of each piece of reputation information.
FIG. 11 is a diagram illustrating an example of the priority order of each piece of reputation information.
FIG. 12 is a block diagram showing a configuration example of reputation information determination means 13a used in the second embodiment of the present invention.
FIG. 13 is a flowchart showing a processing example of reputation information determination means 13a.
FIG. 14 is a block diagram illustrating a configuration example of a score determination device.
15 is a block diagram showing a configuration example of score determination means 146. FIG.
FIG. 16 is a flowchart illustrating a processing example of the score determination device.
FIG. 17 is a diagram illustrating an example of contents of a score determination determination
FIG. 18 is a diagram illustrating an example of the contents of a score determination reputation
19 is a diagram showing a display example of reputation information and input fields by the display control means 206. FIG.
FIG. 20 is a diagram illustrating an example of a score input by a user.
FIG. 21 is a diagram showing the final contents of a scored storage unit with
FIG. 22 is a flowchart showing another process example of the score determination device.
[Explanation of symbols]
1 Information retrieval device
11 ... Document input means
12 ... Search term input means
13 ... Reputation information discrimination means
131 ... Evaluation expression storage unit
132: Search word position specifying means
133 ... Evaluation expression position specifying means
134: Inter-expression distance determination means
135 ... Reputation information extraction means
14: Discrimination result storage unit
15 ... Reputation information storage
16 ... Reputation information priority determination means
161: Rule storage unit
162 ... Rule matching means
163 ... Score storage unit
164 ... Score search means
165 ... Aligning means
166 ... Presentation means
17 ... Priority storage unit
2 ... Input device
3. Display device
K1 ... Recording medium
13a ... Reputation information discrimination means
131a ... Evaluation expression storage unit
133a ... Evaluation expression position specifying means
136 ... Search term field specifying means
141... Document input means for score determination
142 ... Search term input means for score determination
143 ... Reputation information discrimination means for score determination
144... Score determination determination result storage unit
145 ... Reputation information storage unit for score determination
146 ... Score determining means
147 ... Display device
148 ... Input device
201: Score determination rule storage unit
202... Score matching rule checking means
203 ... Score storage unit with frequency
204... Score search means with frequency
205: Score calculation means
206: Display control means
207 ... Score input means
Claims (18)
該評判情報判別手段で抽出された各評判情報それぞれについて、その評判情報が、評判情報中の検索語と評価表現との位置関係に関するルール群、評判情報中の検索語の位置に関するルール群、或いは評判情報中の評価表現の位置に関するルール群の内の少なくとも1つを含むルール群中のどのルールを満たしているかを調べ、満たしているルールの組み合わせに基づいて、前記各評判情報に対して検索語に関する評判情報である確率が高い順に優先順位を付ける評判情報優先度判定手段と、
を備えたことを特徴とする情報検索装置。Reputation information discrimination that extracts reputation information about the designated search term existing in the input document based on the appearance position of the search term in the document and the appearance position of the evaluation expression that determines the value for things Means,
For each piece of reputation information extracted by the reputation information discriminating means , the reputation information is a rule group relating to the positional relationship between the search word in the reputation information and the evaluation expression, a rule group relating to the position of the search word in the reputation information, or Check which rule in the rule group including at least one of the rule groups regarding the position of the evaluation expression in the reputation information is satisfied, and search for each of the reputation information based on the combination of the satisfied rules Reputation information priority determination means for assigning priorities in descending order of probability of being reputation information about words ;
An information retrieval apparatus comprising:
前記評判情報判別手段が、
前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定手段と、
評価表現が複数格納された評価表現記憶部と、
前記文書において前記評価表現記憶部に格納されている評価表現が出現する評価表現出現位置を特定する評価表現位置特定手段と、
前記検索語位置特定手段が特定した検索語出現位置と前記評価表現位置特定手段が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定手段と、
該表現間距離判定手段で求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出手段と、
を備えたことを特徴とする情報検索装置。The information search device according to claim 1,
The reputation information determination means is
Search word position specifying means for specifying a search word appearance position where the search word appears in the document;
An evaluation expression storage unit storing a plurality of evaluation expressions;
Evaluation expression position specifying means for specifying an evaluation expression appearance position at which an evaluation expression stored in the evaluation expression storage unit appears in the document;
Based on the search word appearance position specified by the search word position specifying means and the evaluation expression appearance position specified by the evaluation expression position specifying means, a pair of a search word and an evaluation expression within a certain distance from each other is determined. An inter-expression distance determination means to be obtained;
Reputation information extracting means for extracting reputation information including at least a portion sandwiched between a search word and an evaluation expression constituting a pair obtained by the inter-expression distance determining means;
An information retrieval apparatus comprising:
前記評判情報判別手段が、
前記検索語が使用される分野を特定する検索語分野特定手段と、
前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定手段と、
複数の評価表現と該各評価表現の使用分野を示す分野情報とが格納された評価表現記憶部と、
前記文書において前記評価表現記憶部に格納されている評価表現の内の、前記検索語分野特定手段で特定された分野で使用される評価表現が出現する評価表現出現位置を特定する評価表現位置特定手段と、
前記検索語位置特定手段が特定した検索語出現位置と前記評価表現位置特定手段が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定手段と、
該表現間距離判定手段で求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出手段と、
を備えたことを特徴とする情報検索装置。The information search device according to claim 1,
The reputation information determination means is
A search term field specifying means for specifying a field in which the search term is used;
Search word position specifying means for specifying a search word appearance position where the search word appears in the document;
An evaluation expression storage unit storing a plurality of evaluation expressions and field information indicating a field of use of each evaluation expression;
The evaluation expression position specification for specifying the evaluation expression appearance position where the evaluation expression used in the field specified by the search word field specifying means among the evaluation expressions stored in the evaluation expression storage unit in the document appears. Means,
Based on the search word appearance position specified by the search word position specifying means and the evaluation expression appearance position specified by the evaluation expression position specifying means, a pair of a search word and an evaluation expression within a certain distance from each other is determined. An inter-expression distance determination means to be obtained;
Reputation information extracting means for extracting reputation information including at least a portion sandwiched between a search word and an evaluation expression constituting a pair obtained by the inter-expression distance determining means;
An information retrieval apparatus comprising:
前記評判情報優先度判定手段が、
前記評判情報判別手段で抽出された各評判情報の優先順位を決定するために使用する複数のルールからなるルール群であって、評判情報中の検索語と評価表現との位置関係に関するルール、評判情報中の検索語の位置に関するルール、或いは評判情報中の評価表現の位置に関するルールの内の少なくとも1つを含むルール群が格納されたルール記憶部と、
前記評判情報判別手段で抽出された評判情報と、前記ルール記憶部に格納されている複数のルールとをそれぞれ照合し、前記各ルールそれぞれについて前記評判情報がそのルールを満足するか否かを示す値を出力するルール照合手段と、
該ルール照合手段から出力される可能性がある、前記各ルールに対するルールを満足するか否かを示す値の組み合わせ毎に、スコアが格納されたスコア記憶部と、
前記ルール照合手段から出力されたルールを満足するか否かを示す値の組み合わせに対応するスコアを、前記スコア記憶部から検索するスコア検索手段と、
前記評判情報判別手段で抽出した各評判情報に対して、前記スコア検索手段で検索した前記各評判情報のスコアに基づいて優先順位を付す整列手段と、
を備えたことを特徴とする情報検索装置。In the information search device according to claim 1, 2, or 3,
The reputation information priority determination means includes
A rule group comprising a plurality of rules used for determining the priority of each piece of reputation information extracted by the reputation information discrimination means, the rule relating to the positional relationship between a search word in reputation information and an evaluation expression, reputation A rule storage unit storing a rule group including at least one of a rule relating to a position of a search term in information or a rule relating to a position of an evaluation expression in reputation information;
Reputation information extracted by the reputation information determination means is compared with a plurality of rules stored in the rule storage unit, and each of the rules indicates whether or not the reputation information satisfies the rule. Rule matching means for outputting a value;
A score storage unit storing a score for each combination of values indicating whether or not the rule for each rule may be output, which may be output from the rule matching unit;
Score search means for searching a score corresponding to a combination of values indicating whether or not the rule output from the rule matching means is satisfied, from the score storage unit;
Alignment means for assigning priorities to each reputation information extracted by the reputation information determination means based on the scores of the reputation information searched by the score search means;
An information retrieval apparatus comprising:
前記スコア記憶部には、前記ルール照合手段から出力される可能性がある値の組み合わせが各々配列の形式で格納され、且つ前記各配列に対応付けてスコアが格納されていることを特徴とする情報検索装置。The information search device according to claim 4, wherein
A combination of values that may be output from the rule matching unit is stored in the form of an array in the score storage unit, and a score is stored in association with each array. Information retrieval device.
入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出するスコア決定用評判情報判別手段と、
該スコア決定用評判情報判別手段で抽出した各評判情報を表示装置に表示して利用者に提示し、前記利用者が入力装置を用いて入力した前記各評判情報に対するスコアに基づいて、前記スコア記憶部に格納するスコアを決定するスコア決定手段とを備えたことを特徴とするスコア決定装置。A score determination device for determining a score to be stored in a score storage unit in the information search device according to claim 4,
For score determination that extracts reputation information about the specified search term existing in the input document based on the appearance position of the search term in the document and the appearance position of the evaluation expression that determines the value for things Reputation information discrimination means,
Each score information extracted by the score determination reputation information discrimination means is displayed on a display device and presented to the user, and the score is based on the score for each reputation information input by the user using the input device. A score determination device comprising score determination means for determining a score to be stored in a storage unit.
前記スコア決定手段が、
前記スコア決定用評判情報判別手段が抽出した各評判情報を前記表示装置に表示する表示制御手段と、
前記入力装置から前記利用者が入力した前記表示装置に表示された各評判情報それぞれに対するスコアを取り込むスコア入力手段と、
前記スコア決定用評判情報判別手段で抽出された各評判情報の優先順位を決定するために使用する複数のルールからなるルール群であって、評判情報中の検索語と評価表現との位置関係に関するルール、評判情報中の検索語の位置に関するルール、或いは評判情報中の評価表現の位置に関するルールの内の少なくとも1つを含むルール群が格納されたスコア決定用ルール記憶部と、
前記スコア決定用評判情報判別手段で抽出された評判情報と、前記スコア決定用ルール記憶部に格納されている複数のルールとをそれぞれ照合し、前記各ルールそれぞれについて前記評判情報がそのルールを満足するか否かを示す値を出力するスコア決定用ルール照合手段と、
該スコア決定用ルール照合手段から出力される可能性がある、前記各ルールに対するルールを満足するか否かを示す値の組み合わせ毎に、スコアの総和とスコアの総入力回数とが格納される頻度付きスコア記憶部と、
前記スコア決定用ルール照合手段から出力されたルールを満足させるか否かを示す値の組み合わせに対応するスコアの総和とスコアの総入力回数とを、前記頻度付きスコア記憶部から検索する頻度付きスコア検索手段と、
該頻度付きスコア検索手段で検索されたスコアの総和に前記スコア入力手段で受け付けたスコアを加算すると共に前記頻度付きスコア検索手段で検索されたスコアの総入力回数に1を加算した後、更新後のスコアの総和を更新後のスコアの総入力回数で割ることによりスコアを求め、更に前記検索されたスコアの総和及びスコアの総入力回数を更新後のスコアの総和及び更新後のスコアの総入力回数で置き換えるスコア算出手段と、
を備えたことを特徴とするスコア決定装置。The score determination device according to claim 6,
The score determination means is
Display control means for displaying each piece of reputation information extracted by the score determination reputation information determination means on the display device;
Score input means for capturing a score for each piece of reputation information displayed on the display device input by the user from the input device;
A rule group consisting of a plurality of rules used for determining the priority of each piece of reputation information extracted by the score determination reputation information discriminating means, which relates to the positional relationship between a search word in reputation information and an evaluation expression A rule determination score storage unit storing a rule group including at least one of a rule, a rule related to a position of a search term in reputation information, or a rule related to a position of an evaluation expression in reputation information;
The reputation information extracted by the score-determining reputation information determining means is collated with a plurality of rules stored in the score-determining rule storage unit, and the reputation information satisfies each rule for each rule. A rule determining means for score determination that outputs a value indicating whether or not to perform,
The frequency at which the sum of scores and the total number of input scores are stored for each combination of values indicating whether the rules for each rule may be output, which may be output from the score determination rule matching means With a score storage unit,
A score with frequency for searching the sum total of scores corresponding to a combination of values indicating whether or not the rule output from the score determination rule matching means is satisfied and the total number of input times of the score from the score storage unit with frequency Search means;
After adding the score received by the score input means to the total score searched by the frequency score search means, adding 1 to the total number of scores input searched by the frequency score search means, and then updating The score is obtained by dividing the total sum of the scores by the total number of times the updated score is entered, and the sum of the retrieved scores and the total number of times the score is entered are further updated. Score calculation means to replace with the number of times;
A score determination device comprising:
前記コンピュータが、入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出する評判情報判別ステップと、
前記コンピュータが、前記評判情報判別ステップで抽出された各評判情報それぞれについて、その評判情報が、評判情報中の検索語と評価表現との位置関係に関するルール群、評判情報中の検索語の位置に関するルール群、或いは評判情報中の評価表現の位置に関するルール群の内の少なくとも1つを含むルール群中のどのルールを満たしているかを調べ、満たしているルールの組み合わせに基づいて、前記各評判情報に対して検索語に関する評判情報である確率が高い順に優先順位を付ける評判情報優先度判定ステップと、
を含むことを特徴とする情報検索方法。 In a method for retrieving information using a computer,
The computer extracts reputation information related to the indicated search word existing in the input document based on the appearance position of the search word in the document and the appearance position of the evaluation expression that determines the value for things. A reputation information determination step,
For each piece of reputation information extracted by the computer in the reputation information determination step , the reputation information is related to a group of rules relating to the positional relationship between the search word in the reputation information and the evaluation expression, and the position of the search word in the reputation information. The rule group or the rule group including at least one of the rule groups relating to the position of the evaluation expression in the reputation information is examined to determine which rule is satisfied, and based on the combination of the satisfied rules, each of the reputation information Reputation information priority determination step that prioritizes in descending order of the probability of being reputation information related to the search term ,
An information search method characterized by including:
前記評判情報判別ステップが、
前記コンピュータが、前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定ステップと、
前記コンピュータが、前記文書において評価表現が出現する評価表現出現位置を特定する評価表現位置特定ステップと、
前記コンピュータが、前記検索語位置特定ステップが特定した検索語出現位置と前記評価表現位置特定ステップが特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定ステップと、
前記コンピュータが、前記表現間距離判定ステップで求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出ステップと、
を含むことを特徴とする情報検索方法。The information search method according to claim 8, wherein
The reputation information determination step includes:
A search word position specifying step for specifying a search word appearance position at which the computer appears in the document;
The computer, the evaluation expression position specifying step of specifying an evaluation expressions occurrence position evaluation expression appears in the document,
Based on the search word appearance position specified by the search word position specifying step and the evaluation expression appearance position specified by the evaluation expression position specifying step, the computer searches for the search word and the evaluation expression within a certain distance from each other. An inter-expression distance determination step for obtaining a pair with
The computer, the reputation information extraction step of extracting at least including reputation information portion sandwiched by the evaluation expression and the search word constituting the pair obtained by the expression distance determination step from the document,
An information search method characterized by including:
前記評判情報判別ステップが、
前記コンピュータが、前記検索語が使用される分野を特定する検索語分野特定ステップと、
前記コンピュータが、前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定ステップと、
前記コンピュータが、複数の評価表現と該各評価表現の使用分野を示す分野情報とが格納された評価表現記憶部に格納されている評価表現の内の、前記検索語分野特定ステップで特定された分野で使用される評価表現が前記文書において出現する評価表現出現位置を特定する評価表現位置特定ステップと、
前記コンピュータが、前記検索語位置特定ステップが特定した検索語出現位置と前記評価表現位置特定ステップが特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定ステップと、
前記コンピュータが、前記表現間距離判定ステップで求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出ステップと、
を含むことを特徴とする情報検索方法。The information search method according to claim 8, wherein
The reputation information determination step includes:
A search term field specifying step in which the computer specifies a field in which the search term is used;
A search word position specifying step for specifying a search word appearance position at which the computer appears in the document;
The computer is specified in the search word field specifying step among the evaluation expressions stored in the evaluation expression storage unit storing a plurality of evaluation expressions and field information indicating the field of use of each evaluation expression. An evaluation expression position specifying step for specifying an evaluation expression appearance position at which an evaluation expression used in the field appears in the document;
Based on the search word appearance position specified by the search word position specifying step and the evaluation expression appearance position specified by the evaluation expression position specifying step, the computer searches for the search word and the evaluation expression within a certain distance from each other. An inter-expression distance determination step for obtaining a pair with
The computer, the reputation information extraction step of extracting at least including reputation information portion sandwiched by the evaluation expression and the search word constituting the pair obtained by the expression distance determination step from the document,
An information search method characterized by including:
前記評判情報優先度判定ステップが、
前記コンピュータが、前記評判情報判別ステップで抽出された評判情報と、前記評判情報判別ステップで抽出された各評判情報の優先順位を決定するために使用する複数のルールからなるルール群であって、評判情報中の検索語と評価表現との位置関係に関するルール、評判情報中の検索語の位置に関するルール、或いは評判情報中の評価表現の位置に関するルールの内の少なくとも1つを含むルール群が格納されたルール記憶部中の各ルールとをそれぞれ照合し、前記各ルールそれぞれについて前記評判情報がそのルールを満足するか否かを示す値を出力するルール照合ステップと、
前記コンピュータが、前記ルール照合ステップから出力される可能性がある、前記各ルールに対するルールを満足するか否かを示す値の組み合わせ毎に、スコアが格納されたスコア記憶部から、前記ルール照合ステップから出力されたルールを満足するか否かを示す値の組み合わせに対応するスコアを検索するスコア検索ステップと、
前記コンピュータが、前記評判情報判別ステップで抽出した各評判情報に対して、前記スコア検索ステップで検索した前記各評判情報のスコアに基づいて優先順位を付す整列ステップと、
を含むことを特徴とする情報検索方法。The information search method according to claim 8, 9 or 10,
The reputation information priority determination step includes:
The computer is a rule group consisting of a plurality of rules used to determine the priority of the reputation information extracted in the reputation information determination step and each reputation information extracted in the reputation information determination step, A rule group including at least one of a rule relating to the positional relationship between a search word in reputation information and an evaluation expression, a rule relating to the position of a search word in reputation information, or a rule relating to the position of an evaluation expression in reputation information is stored. A rule matching step for collating each rule in the rule storage unit and outputting a value indicating whether or not the reputation information satisfies the rule for each of the rules;
For each combination of values indicating whether the computer satisfies a rule for each rule that may be output from the rule matching step, a score is stored in the rule matching step. A score search step of searching for a score corresponding to a combination of values indicating whether or not the rule output from is satisfied,
An alignment step in which the computer assigns a priority to each piece of reputation information extracted in the reputation information determination step based on the score of each piece of reputation information searched in the score search step;
An information search method characterized by including:
前記スコア記憶部には、前記ルール照合ステップから出力される可能性がある値の組み合わせが各々配列の形式で格納され、且つ前記各配列に対応付けてスコアが格納されていることを特徴とする情報検索方法。The information search method according to claim 11, wherein
A combination of values that may be output from the rule matching step is stored in the form of an array in the score storage unit, and a score is stored in association with each array. Information retrieval method.
前記コンピュータが、入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出するスコア決定用評判情報判別ステップと、
前記コンピュータが、前記スコア決定用評判情報判別ステップで抽出した各評判情報を表示装置に表示して利用者に提示し、前記利用者が入力装置を用いて入力した前記各評判情報に対するスコアに基づいて、前記スコア記憶部に格納するスコアを決定するスコア決定ステップと、
を含むことを特徴とするスコア決定方法。A score determination method for determining a score to be stored in a score storage unit in the information search method according to claim 11 using a computer ,
The computer extracts reputation information related to the indicated search word existing in the input document based on the appearance position of the search word in the document and the appearance position of the evaluation expression that determines the value for things. Reputation information determination step for determining a score,
The computer displays each reputation information extracted in the score determination reputation information determination step on a display device and presents it to the user, and based on the score for each reputation information input by the user using the input device A score determining step for determining a score to be stored in the score storage unit;
The score determination method characterized by including.
前記スコア決定ステップが、
前記コンピュータが、前記スコア決定用評判情報判別ステップが抽出した各評判情報を前記表示装置に表示する表示制御ステップと、
前記コンピュータが、前記入力装置から前記利用者が入力した前記表示装置に表示された各評判情報それぞれに対するスコアを取り込むスコア入力ステップと、
前記コンピュータが、前記スコア決定用評判情報判別ステップで抽出された評判情報と、前記スコア決定用評判情報判別ステップで抽出された各評判情報の優先順位を決定するために使用する複数のルールからなるルール群であって、評判情報中の検索語と評価表現との位置関係に関するルール、評判情報中の検索語の位置に関するルール、或いは評判情報中の評価表現の位置に関するルールの内の少なくとも1つを含むルール群が格納されたスコア決定用ルール記憶部中の各ルールとをそれぞれ照合し、前記各ルールそれぞれについて前記評判情報がそのルールを満足するか否かを示す値を出力するスコア決定用ルール照合ステップと、
前記コンピュータが、前記スコア決定用ルール照合ステップから出力されたルールを満足するか否かを示す値の組み合わせに対応するスコアの総和とスコアの総入力回数とを、前記スコア決定用ルール照合ステップから出力される可能性がある、前記各ルールに対するルールを満足するか否かを示す値の組み合わせ毎に、スコアの総和とスコアの総入力回数とが格納される頻度付きスコア記憶部から検索する頻度付きスコア検索ステップと、
前記コンピュータが、前記頻度付きスコア検索ステップで検索されたスコアの総和に前記スコア入力ステップで受け付けたスコアを加算すると共に前記頻度付きスコア検索ステップで検索されたスコアの総入力回数に1を加算した後、更新後のスコアの総和を更新後のスコアの総入力回数で割ることによりスコアを求め、更に前記検索されたスコアの総和及びスコアの総入力回数を更新後のスコアの総和及び更新後のスコアの総入力回数で置き換えるスコア算出ステップと、
を含むことを特徴とするスコア決定方法。The score determination method according to claim 13,
The score determination step includes:
The computer, and a display control step of displaying each reputation information the reputation information determination step for the scoring is extracted on the display device,
A score input step in which the computer captures a score for each piece of reputation information displayed on the display device input by the user from the input device;
The computer comprises reputation information extracted in the score determination reputation information determination step and a plurality of rules used for determining the priority of each reputation information extracted in the score determination reputation information determination step. A rule group, at least one of a rule relating to a positional relationship between a search word in reputation information and an evaluation expression, a rule relating to a position of a search word in reputation information, and a rule relating to the position of an evaluation expression in reputation information Each of the rules in the score determination rule storage unit storing a group of rules including the rule group, and for each of the rules, a value indicating whether the reputation information satisfies the rule is output. A rule matching step;
From the score determination rule matching step , the computer calculates a sum of scores corresponding to a combination of values indicating whether or not the rule output from the score determination rule verification step is satisfied and the total number of input times of the score. The frequency of searching from the score storage unit with a frequency in which the sum of the scores and the total number of input times of the scores are stored for each combination of values indicating whether or not the rules for each rule may be output. With a score search step,
The computer adds the score received in the score input step to the total score searched in the frequency-based score search step, and adds 1 to the total number of input scores searched in the frequency-based score search step Thereafter, the score is obtained by dividing the sum of the updated scores by the total number of times the updated score is input, and further, the sum of the retrieved scores and the total number of times the score is input A score calculation step to replace with the total number of score inputs,
The score determination method characterized by including.
入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出する評判情報判別手段、
該評判情報判別手段で抽出された各評判情報それぞれについて、その評判情報が、評判情報中の検索語と評価表現との位置関係に関するルール群、評判情報中の検索語の位置に 関するルール群、或いは評判情報中の評価表現の位置に関するルール群の内の少なくとも1つを含むルール群中のどのルールを満たしているかを調べ、満たしているルールの組み合わせに基づいて、前記各評判情報に対して検索語に関する評判情報である確率が高い順に優先順位を付ける評判情報優先度判定手段、
として機能させるためのプログラムを記録したことを特徴とするプログラム記録媒体。Computer
Reputation information discrimination that extracts reputation information about the designated search term existing in the input document based on the appearance position of the search term in the document and the appearance position of the evaluation expression that determines the value for things means,
For each of reputation information extracted by the evaluation information determination unit, the reputation information, rule group on the position relationship between the search words and evaluation expressions in reputation information, rule group about the search word position in the reputation information, Alternatively, it is examined which rule in the rule group including at least one of the rule groups regarding the position of the evaluation expression in the reputation information is satisfied, and for each of the reputation information based on the combination of the satisfied rules Reputation information priority determination means for assigning priorities in descending order of the probability of reputation information relating to search terms,
A program recording medium in which a program for functioning as a program is recorded.
前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定手段、
前記文書において評価表現が出現する評価表現出現位置を特定する評価表現位置特定手段、
前記検索語位置特定手段が特定した検索語出現位置と前記評価表現位置特定手段が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定手段、
該表現間距離判定手段で求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出手段、
として機能させるためのプログラムを記録したことを特徴とする請求項15記載のプログラム記録媒体。The reputation information determination means,
Search word position specifying means for specifying a search word appearance position where the search word appears in the document;
Evaluation expression position specifying means for specifying an evaluation expression appearance position where the evaluation expression appears in the document;
Based on the search word appearance position specified by the search word position specifying means and the evaluation expression appearance position specified by the evaluation expression position specifying means, a pair of a search word and an evaluation expression within a certain distance from each other is determined. Means for determining the distance between expressions to be obtained;
Reputation information extracting means for extracting reputation information including at least a portion sandwiched between a search word and an evaluation expression constituting a pair obtained by the inter-expression distance determining means from the document;
16. The program recording medium according to claim 15, wherein a program for causing the program to function as a program is recorded.
前記検索語が使用される分野を特定する検索語分野特定手段、
前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定手段、
複数の評価表現と該各評価表現の使用分野を示す分野情報とが格納された評価表現記憶部に格納されている評価表現の内の、前記検索語分野特定手段で特定された分野で使用される評価表現が前記文書において出現する評価表現出現位置を特定する評価表現位置特定手段、
前記検索語位置特定手段が特定した検索語出現位置と前記評価表現位置特定手段が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定手段、
該表現間距離判定手段で求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出手段、
として機能させるためのプログラムを記録したことを特徴とする請求項15記載のプログラム記録媒体。The reputation information determination means,
Search term field specifying means for specifying a field in which the search term is used;
Search word position specifying means for specifying a search word appearance position where the search word appears in the document;
Among the evaluation expressions stored in the evaluation expression storage unit in which a plurality of evaluation expressions and field information indicating the field of use of each evaluation expression are stored, it is used in the field specified by the search word field specifying means. Evaluation expression position specifying means for specifying an evaluation expression appearance position where the evaluation expression appears in the document;
Based on the search word appearance position specified by the search word position specifying means and the evaluation expression appearance position specified by the evaluation expression position specifying means, a pair of a search word and an evaluation expression within a certain distance from each other is determined. Means for determining the distance between expressions to be obtained;
Reputation information extracting means for extracting reputation information including at least a portion sandwiched between a search word and an evaluation expression constituting a pair obtained by the inter-expression distance determining means from the document;
16. The program recording medium according to claim 15, wherein a program for causing the program to function as a program is recorded.
前記評判情報判別手段で抽出された評判情報と、前記評判情報判別手段で抽出された各評判情報の優先順位を決定するために使用する複数のルールからなるルール群であって、評判情報中の検索語と評価表現との位置関係に関するルール、評判情報中の検索語の位置に関するルール、或いは評判情報中の評価表現の位置に関するルールの内の少なくとも1つを含むルール群が格納されたルール記憶部中の各ルールとをそれぞれ照合し、前記各ルールについて前記評判情報がそのルールを満足するか否かを示す値を出力するルール照合手段、
該ルール照合手段から出力される可能性がある、前記各ルールに対するルールを満足するか否かを示す値の組み合わせ毎に、スコアが格納されたスコア記憶部から、前記ルール照合手段から出力されたルールを満足するか否かを示す値の組み合わせに対応するスコアを検索するスコア検索手段、
前記評判情報判別手段で抽出した各評判情報に対して、前記スコア検索手段で検索した前記各評判情報のスコアに基づいて優先順位を付す整列手段、
として機能させるためのプログラムを記録したことを特徴とする請求項15,16または17記載のプログラム記録媒体。The reputation information priority determination means,
A rule group consisting of a plurality of rules used to determine the priority of the reputation information extracted by the reputation information determination means and each reputation information extracted by the reputation information determination means, A rule memory storing a rule group including at least one of a rule relating to a positional relationship between a search word and an evaluation expression, a rule relating to a position of a search word in reputation information, or a rule relating to the position of an evaluation expression in reputation information Rule matching means for collating each rule in the section and outputting a value indicating whether or not the reputation information satisfies the rule for each rule,
For each combination of values indicating whether or not the rule for each rule is satisfied, which may be output from the rule matching unit, the score is stored from the score storage unit storing the score. Score search means for searching for a score corresponding to a combination of values indicating whether or not a rule is satisfied;
Alignment means for assigning priorities to each reputation information extracted by the reputation information determination means based on the scores of the reputation information searched by the score search means;
18. The program recording medium according to claim 15, 16 or 17, wherein a program for causing the program to function as is recorded.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000371506A JP3820878B2 (en) | 2000-12-06 | 2000-12-06 | Information search device, score determination device, information search method, score determination method, and program recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000371506A JP3820878B2 (en) | 2000-12-06 | 2000-12-06 | Information search device, score determination device, information search method, score determination method, and program recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002175330A JP2002175330A (en) | 2002-06-21 |
JP3820878B2 true JP3820878B2 (en) | 2006-09-13 |
Family
ID=18841220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000371506A Expired - Fee Related JP3820878B2 (en) | 2000-12-06 | 2000-12-06 | Information search device, score determination device, information search method, score determination method, and program recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3820878B2 (en) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006209257A (en) * | 2005-01-25 | 2006-08-10 | Ns Solutions Corp | Information processing apparatus, information processing method and program |
JP4513098B2 (en) * | 2005-03-10 | 2010-07-28 | 日本電信電話株式会社 | Reputation information acquisition device, reputation information acquisition method, program, and storage medium |
JP2006268772A (en) * | 2005-03-25 | 2006-10-05 | Konami Digital Entertainment:Kk | Message character string output system, and method and program for controlling this system |
JP2007219880A (en) | 2006-02-17 | 2007-08-30 | Fujitsu Ltd | Reputation information processing program, method, and apparatus |
JP2008009623A (en) * | 2006-06-28 | 2008-01-17 | Nippon Telegr & Teleph Corp <Ntt> | Method, device and program for calculating intensity of experience, and computer readable recording medium |
JP4744404B2 (en) * | 2006-09-13 | 2011-08-10 | C2cube株式会社 | Evaluation output device, evaluation output method, and program |
JP4912181B2 (en) * | 2007-02-23 | 2012-04-11 | 日本電信電話株式会社 | COMPARATIVE EVALUATION DETECTION DEVICE, COMPARATIVE EVALUATION DETECTION METHOD, COMPARATIVE EVALUATION DETECTION PROGRAM MOUNTING THE METHOD, AND RECORDING MEDIUM CONTAINING THE PROGRAM |
JP5168961B2 (en) * | 2007-03-19 | 2013-03-27 | 富士通株式会社 | Latest reputation information notification program, recording medium, apparatus and method |
JP4359787B2 (en) | 2007-07-02 | 2009-11-04 | ソニー株式会社 | Information processing apparatus, content reputation search method, and content reputation search system |
JP2009064070A (en) * | 2007-09-04 | 2009-03-26 | Nec Biglobe Ltd | Advertisement distribution system and advertisement distribution method |
WO2010003155A1 (en) * | 2008-07-03 | 2010-01-07 | Nuance Communications, Inc. | Methods and systems for processing japanese text on a mobile device |
US8458154B2 (en) * | 2009-08-14 | 2013-06-04 | Buzzmetrics, Ltd. | Methods and apparatus to classify text communications |
JP5265644B2 (en) * | 2010-11-18 | 2013-08-14 | ヤフー株式会社 | Panic demand detecting device and panic demand detecting method |
JP6600229B2 (en) * | 2015-10-30 | 2019-10-30 | 株式会社インタラクティブソリューションズ | Slide search device, slide search system, slide search method, and slide search program |
JP7126168B2 (en) * | 2019-10-04 | 2022-08-26 | 株式会社インタラクティブソリューションズ | SLIDE SEARCH DEVICE, SLIDE SEARCH SYSTEM, SLIDE SEARCH METHOD AND SLIDE SEARCH PROGRAM |
JP7154253B2 (en) * | 2020-05-12 | 2022-10-17 | ヤフー株式会社 | Information processing device, information processing method and program |
-
2000
- 2000-12-06 JP JP2000371506A patent/JP3820878B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002175330A (en) | 2002-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3820878B2 (en) | Information search device, score determination device, information search method, score determination method, and program recording medium | |
US8983977B2 (en) | Question answering device, question answering method, and question answering program | |
JP4129048B2 (en) | Named entity extraction apparatus, method, and program | |
JPH09153066A (en) | Document retrieval device | |
US9256649B2 (en) | Method and system of filtering and recommending documents | |
KR20190038243A (en) | System and method for retrieving documents using context | |
JP3735335B2 (en) | Example-based search method and search system for similarity judgment | |
WO2014050774A1 (en) | Document classification assisting apparatus, method and program | |
JP3654850B2 (en) | Information retrieval system | |
KR101543680B1 (en) | Entity searching and opinion mining system of hybrid-based using internet and method thereof | |
JP5455232B2 (en) | Image selection apparatus, method and program | |
JP4512163B2 (en) | Writing style specifying device and program for causing a computer to specify writing style | |
JPH0484271A (en) | Intra-information retrieval device | |
JP2000163437A (en) | Method and device for classifying document and recording medium where document classifying program is recorded | |
JP2006251975A (en) | Text sorting method and program by the method, and text sorter | |
US20050234975A1 (en) | Related content linking managing system, method and recording medium | |
JP2002092004A (en) | Information sorting device | |
JP2005010848A (en) | Information retrieval device, information retrieval method, information retrieval program and recording medium | |
JP7427510B2 (en) | Information processing device, information processing method and program | |
JP4134975B2 (en) | Topic document presentation method, apparatus, and program | |
JP2008165437A (en) | Explanatory sentence selection device, explanatory sentence selection method, explanatory sentence analysis device and explanatory sentence analysis method | |
JP6612291B2 (en) | Similar document search device, similar document search method and program | |
JP2732661B2 (en) | Text type database device | |
JP3772401B2 (en) | Document classification device | |
JP2009146013A (en) | Content retrieval method, its device, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060612 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100630 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100630 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110630 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110630 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120630 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120630 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130630 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |