JP3820878B2 - Information search device, score determination device, information search method, score determination method, and program recording medium - Google Patents

Information search device, score determination device, information search method, score determination method, and program recording medium Download PDF

Info

Publication number
JP3820878B2
JP3820878B2 JP2000371506A JP2000371506A JP3820878B2 JP 3820878 B2 JP3820878 B2 JP 3820878B2 JP 2000371506 A JP2000371506 A JP 2000371506A JP 2000371506 A JP2000371506 A JP 2000371506A JP 3820878 B2 JP3820878 B2 JP 3820878B2
Authority
JP
Japan
Prior art keywords
score
reputation information
rule
evaluation expression
search word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000371506A
Other languages
Japanese (ja)
Other versions
JP2002175330A (en
Inventor
健二 立石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000371506A priority Critical patent/JP3820878B2/en
Publication of JP2002175330A publication Critical patent/JP2002175330A/en
Application granted granted Critical
Publication of JP3820878B2 publication Critical patent/JP3820878B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、情報検索技術に関し、特に評判情報を検索できる情報検索技術に関する。
【0002】
【従来の技術】
現在、検索語を手掛かりにその属性情報を自動的に収集し利用者に提示する情報検索システムは多く存在する。例えば、MySimon(http://www.mysimon.com) が提供するシステムは、次のようにして検索語(商品名)に関する属性情報(価格)を利用者に提示するようにしている。利用者が検索語として商品名を入力すると、その商品を販売している或るオンラインショップαに対して商品名を送る。これに応答して、オンラインショップαでは、上記商品名に関する価格,大きさ,色,重さ等の属性情報を検索し、検索結果を定型的な形式(フォーマット)で返却する。属性情報が返却されると、予め認識しているオンラインショップαのフォーマットに基づいて価格情報を抽出し、利用者に提示する。
【0003】
また、検索語を手掛かりにその属性情報を検索できるシステムとして、あらかじめ人手で収集した属性情報から利用者が欲しい情報を見ることができるシステムが存在する。例えば、Deja.com(http://www.deja.com) では、あらかじめ消費者から商品に関する属性情報として評判情報を収集し、利用者は商品の名前を選択するとその評判情報を得ることができる。
【0004】
【発明が解決しようとする課題】
しかしながら、上述の属性情報を自動的に収集できる情報検索システムにおいては、商品名や価格属性のように定型的な検索結果情報を利用して出現位置を特定できる属性情報を扱うことはできても、評判情報のような検索結果情報として現れないため出現位置が特定できない属性情報は自動収集することはできなかった。
【0005】
一方で、属性情報を予め人手で収集する情報検索システムにおいては、評判情報のような不特定の属性を扱うことが可能であるが、人間の作業に依存する方法は量の面で限界があり、上記の商品の評判情報においても極端に著名な商品以外は商品購入の判断材料として利用するには十分ではないのが現状である。
【0006】
本発明はこのような問題点に鑑みてなされたもので、その目的は不特定の属性情報である評判情報を自動的に検索できるようにすると共に、自動検索した各評判情報を最も評判情報らしいものから順番に利用者に提示できるようにすることにある。
【0007】
【課題を解決するための手段】
本発明の情報検索装置は、上記目的を達成するため、
入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出する評判情報判別手段(図1の13)と、
該評判情報判別手段(図1の13)で抽出された各評判情報それぞれについて、その評判情報が、評判情報中の検索語と評価表現との位置関係に関するルール群、評判情報中の検索語の位置に関するルール群、或いは評判情報中の評価表現の位置に関するルール群の内の少なくとも1つを含むルール群中のどのルールを満たしているかを調べ、満たしているルールの組み合わせに基づいて、前記各評判情報に対して検索語に関する評判情報である確率が高い順に優先順位を付ける評判情報優先度判定手段(図1の16)とを有する。
【0008】
このような構成を採用し、評判情報の自動抽出に加え、評判情報の優先順位の自動判定を行うことにより、より評判情報らしいものを利用者は優先的に知ることが可能となる。
【0009】
また、本発明の情報検索装置は、評判情報の抽出精度,抽出速度を向上させるため、
前記評判情報判別手段(図12の13a)が、
前記検索語が使用される分野を特定する検索語分野特定手段(図12の136)と、
前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定手段(図12の132)と、
複数の評価表現と該各評価表現の使用分野を示す分野情報とが格納された評価表現記憶部(図12の131a)と、
前記文書において前記評価表現記憶部(図12の131a)に格納されている評価表現の内の、前記検索語分野特定手段(図12の136)で特定された分野で使用される評価表現が出現する評価表現出現位置を特定する評価表現位置特定手段(図12の133a)と、
前記検索語位置特定手段(図12の132)が特定した検索語出現位置と前記評価表現位置特定手段(図12の133a)が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定手段(図12の134)と、
該表現間距離判定手段(図12の134)で求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出手段(図12の135)とを有している。
【0010】
このような構成を採用することにより、検索語が使用される分野が例えば「書籍」の場合、「おいしい」のような「書籍」に関する評判情報には使用されない評価表現を除外して評判情報の抽出処理を行うことが可能になるので、評判情報の抽出精度,抽出処理速度が向上する。
【0011】
また、本発明のスコア決定装置は、評判情報に優先順位を付す際に、より正確に優先順位を付せるようにするため、
入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出するスコア決定用評判情報判別手段(図14の143)と、
該スコア決定用評判情報判別手段(図14の143)で抽出した各評判情報を表示装置に表示して利用者に提示し、前記利用者が入力装置を用いて入力した前記各評判情報に対するスコアに基づいて、スコア記憶部(図4の163)に格納するスコアを決定するスコア決定手段(図14の146)とを備えている。
【0012】
このような構成を採用し、抽出された評判情報に対して利用者から入力されたスコアを利用して、スコア記憶部に格納しておくスコア(優先順位を決める際に使用するスコア)を決定するようにしているので、評判情報に優先順位を付す際に、より正確に優先順位を付すことが可能になる。
【0013】
【発明の実施の形態】
次に本発明の実施の形態について図面を参照して詳細に説明する。
【0014】
〔第1の実施の形態〕
図1を参照すると、本発明に係る情報検索装置1の第1の実施の形態は、文書入力手段11と、検索語入力手段12と、評判情報判別手段13と、判別結果記憶部14と、評判情報記憶部15と、評判情報優先度判定手段16と、優先順位記憶部17と、キーボード等の入力装置2と、LCD等の表示装置3と、記録媒体K1とを含む。尚、情報検索装置1は、コンピュータによって構成されるものである。
【0015】
文書入力手段11は、評判情報検索の対象となる文書の集合である文書集合を入力し、評判情報判別手段13に渡す機能を有する。文書の入力先は、インターネット上のWebページであっても良いし、複数の文書が記録されたファイルであっても構わない。
【0016】
検索語入力手段12は、利用者が入力装置2を用いて入力した検索語を受け付け、評判情報判別手段13に渡す機能を有する。
【0017】
評判情報判別手段13は、文書入力手段11から文書集合を受け取り、検索語入力手段12から検索語を受け取り、文書集合に含まれている検索語に関連する評判情報を抽出する機能を有する。
【0018】
図2に示すように、評判情報判別手段13は、評価表現記憶部131と、検索語位置特定手段132と、評価表現位置特定手段133と、表現間距離判定手段134と、評判情報抽出手段135とを有する。
【0019】
評価表現記憶部131には、複数の評価表現が格納されている。ここで評価表現とは、事物に対する価値を定めることのできる表現である。従って、「遊ぶ」「動く」「研究する」といった事物に対する価値を示さない表現は評価表現でない。評価表現は、「良い」「好き」「最高だ」「面白い」といった用言の他に、「人気」「絶品」「駄作」といった名詞も存在する。また、評価表現記憶部131における評価表現の記憶形式は、各評価表現の活用による表記の違いを吸収する単位で記憶する方式が記憶容量節約の面で効果的であるが、この方式に限定されるものではない。
【0020】
検索語位置特定手段132は、文書入力手段11から文書集合を受け取り、検索語入力手段12から検索語を受け取り、文書集合における検索語の出現位置(検索語出現位置)を特定する機能や、特定した検索語出現位置を表現間距離判定手段134に出力する機能を有する。検索語出現位置は、文書の先頭や最後尾等といった基準位置からの距離を算出する方法を用いて特定することができる。また、基準位置からの距離を算出する方法は、基準位置からの距離を算出することができれば、いかなる方法でも良い。具体的には、文書の先頭からの文字数により距離を算出する方法、文書の先頭からのByte数により距離を算出する方法、文書の先頭からの行数により距離を算出する方法が含まれる。また、出力する検索語の位置情報は、少なくとも検索語が出現する文書を特定する情報と、その文書内で検索語が出現する位置を特定する情報を含む。
【0021】
評価表現位置特定手段133は、文書入力手段11から文書集合を受け取り、評価表現記憶部131から評価表現を取り出し、文書集合における評価表現記憶部131に記憶された何れかの評価表現が出現する位置(評価表現出現位置)を特定する機能や、特定した評価表現出現位置を表現間距離判定手段134に出力する機能を有する。具体的には、評価表現位置特定手段133は、評価表現記憶部131に格納されている各評価表現毎に、その評価表現が文書集合に含まれているかを調べ、文書集合に含まれている場合は、その評価表現の出現位置を特定する。評価表現位置特定手段133における評価表現出現位置の特定は、検索語位置特定手段132と同一の方法で行う。また、出力する評価表現出現位置は、少なくとも評価表現が出現する文書を特定する情報と、その文書内で評価表現が出現する位置を特定する情報とを含んでいる。
【0022】
表現間距離判定手段134は、検索語位置特定手段132が特定した検索語出現位置と評価表現位置特定手段133が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対(検索語・評価表現対)を求める機能や、検索語・評価表現対を構成する検索語,評価表現及びその出現位置を判別結果記憶部14に格納する機能を有する。ここで、距離が一定の範囲内とは、例えば検索語と評価表現との間の数値的差分の大きさが閾値以下である場合や、検索語と評価表現との間に構文解析的依存関係がある場合が該当する。また、判別結果記憶部14に格納する出現位置には、文書を特定する情報と、その文書内での出現位置を特定する情報とが含まれる。尚、本実施の形態では、互いの距離が一定の範囲内の検索語と評価表現との対を検索語・評価表現対としているので、或る1つの検索語に対して、距離が一定の範囲内に複数の評価表現が存在する場合、上記或る検索語と上記複数の評価表現との対それぞれが検索語・評価表現対とされるが、上記或る検索語と上記複数の評価表現の内の1つとの対のみを検索語・評価表現対とするようにしても良い。その際、複数の評価表現の中から1つの評価表現を選択することが必要になるが、例えば、検索語から最も遠いものを選択する方法や、検索語に最も近いものを選択する方法や、最も後ろに存在するものを選択する方法等を採用することができる。
【0023】
評判情報抽出手段135は、判別結果記憶部14に格納されている検索語・評価表現対の出現位置と、文書入力手段11から入力される文書集合とに基づいて、少なくとも検索語・評価表現対によって挟まれる部分の文字列を含んだ評判情報を抽出し、評判情報記憶部15に格納する機能を有する。尚、抽出する評判情報は、例えば、検索語・評価表現対によって挟まれる部分の文字列のみであっても良いし、検索語・評価表現対によって挟まれる部分の文字列とその前後に存在する所定文字数分の文字列とを合わせたものでも良い。
【0024】
評判情報優先度判定手段16は、評判情報記憶部15に格納されている各評判情報に対して、評判情報らしさの順に優先順位を付ける機能や、評判情報記憶部15に格納されている各評判情報を優先順位の順で表示装置3に表示する機能や、各評判情報に対する優先順位を優先順位記憶部17に格納する機能等を有する。
【0025】
図4を参照すると、評判情報優先度判定手段16は、ルール記憶部161と、ルール照合手段162と、スコア記憶部163と、スコア検索手段164と、整列手段165と、提示手段166とを有する。
【0026】
ルール記憶部161には、評判情報の優先順位決定の基準となるルールが格納されている。図6にルール記憶部161の内容例を示す。図6の例においては、検索語と評価表現との位置関係に関する複数のルールと、評価表現の文章内での位置に関する複数のルールとが格納されている。検索語と評価表現との位置関係に関するルールとしては、ルールID1の「検索語と評価表現が別の文にある」や、ルールID2の「検索語と評価表現が接近している」等があり、評価表現の文章内での位置に関するルールとしては、ルールID11の「推量(かも,だろう等)を示す表現の近傍に評価表現が出現する」や、ルールID12の「疑問符の前方近傍に評価表現が出現する」等がある。また、図6の例では示していないが、検索語の文章内での位置に関するルールを使用するようにしても良い。このルールの具体例としては、「逆接(のに,けど等)の表現の前方に検索語が出現する」や、「原因(るから,だから等)の表現の前方に検索語が出現する」等があるルールの記述方法は、文字列の出現パターンを表現できる正規表現が有効であるが、形態素解析による単語の品詞及び原形、構文解析による単語間の依存関係を条件に指定することも可能である。
【0027】
ルール照合手段162は、評判情報記憶部15に格納されている各評判情報毎に、ルール記憶部161に格納されている各ルールと照合し、上記各ルールそれぞれについて評判情報がそのルールを満足するか否かを示す値(本実施の形態では、満足する場合は“1”,満足させていない場合は“0”とする)を出力する機能を有する。ここで、ルールに形態素解析による単語の品詞及び原形、構文解析による単語間の依存関係が条件として指定されている場合には、当該文字列に形態素解析、構文解析を用いる。
【0028】
スコア記憶部163には、ルール照合手段162から出力される可能性がある、各ルールに対する値(“1”或いは“0”)の組み合わせ毎に、評判情報の優先順位を決定する際に使用するスコアが格納されている。より具体的には、各ルールに対する値が配列の形式で格納され、且つ各配列に対応付けてスコアが格納されている。ここで、スコアの格納方法としては、配列をKey とし、スコアをValue として登録する。その例を図7に示す。尚、図7の例は、評判情報の優先順位決定の基準となるルールとして図6のような12個のルールを採用した場合についてのものである。また、スコアは、最高を5、最低を1とし、値が大きい程、優先順位が高いとしている。
【0029】
スコア検索手段164は、ルール照合手段162から出力された各ルールに対する値(12個のルールに対する12個の値)を構成要素とする配列をKey にしてスコア記憶部163を検索することにより、評判情報に対するスコアを検索する機能を有する。
【0030】
整列手段165は、スコア検索手段164で検索された、評判情報記憶部15に格納されている各評判情報に対するスコアに基づいて、上記各評判情報を特定するための情報(評判ID)にスコアが大きい順に優先順位を付す機能や、優先順位を付した後の評判IDを提示手段166に渡す機能や、優先順位を付した後の評判IDを優先順位記憶部17に格納する機能を有する。
【0031】
提示手段166は、整列手段165から渡された優先順位の付された評判IDに従って、評判情報記憶部15に格納されている各評判情報を、優先順位が高い順(評判情報である確率が高い順)に表示装置3に表示する機能を有する。
【0032】
情報検索装置1が備えている記録媒体K1は、ディスク,半導体メモリ,その他の記録媒体であり、コンピュータを情報検索装置1として機能させるためのプログラムが記録されている。このプログラムは、コンピュータによって読み取られ、その動作を制御することで、コンピュータ上に文書入力手段11,検索語入力手段12,評判情報判別手段13,評判情報優先度判定手段16を実現する。
【0033】
〔動作の説明〕
次に本発明の第1の実施の形態の動作について、図面を用いて説明する。尚、動作の説明は、評判情報を抽出する部分と、抽出された評判情報に優先順位を付ける部分の2つに分けて行う。
【0034】
〔1.評判情報抽出時の動作〕
先ず、文書入力手段11が文書集合を評判情報判別手段13に入力すると共に、検索語入力手段12が評判情報の検索語となる文字列を入力する(図3のS31)。尚、文書入力手段11は、文書集合を評判情報判別手段13へ入力する際、文書集合に含まれる各文書に対してユニークな文書番号を付与し、文書集合中の各文書を文書番号によって識別できるようにしている。
【0035】
次に、評判情報判別手段13内の検索語位置特定手段132が、文書集合における検索語の出現位置を特定し、特定した出現位置及び検索語を含む検索語出現位置情報を表現間距離判定手段134に出力する(S32)。
【0036】
今、例えば、文書入力手段11から入力された文書集合に、文書番号1の文書として「商品Aは非常に面白い。また、商品Bは価格が安いのでお勧め。」が含まれ、検索語入力手段12から検索語として「商品A」が入力されていたとすると、検索語位置特定手段132は、文書番号1の文書に対しては、次のような処理を行うことになる(尚、検索語位置特定手段132は、検索語出現位置の特定方法として文書の先頭からのByte数を算出する方法を採用しているとする)。先ず、検索語「商品A」の出現位置を、文書番号1の文書の先頭から0Byte目と特定する。次に、検索語出現位置「文書番号1,0Byte」と検索語「商品A」とを含む検索語出現位置情報「文書番号1,商品A,0Byte」を作成し、表現間距離判定手段134に出力する。
【0037】
S32の処理が終了すると、評価表現位置特定手段133が、評価表現記憶部131に格納されている各評価表現の、文書集合中における出現位置を特定し、特定した出現位置及び評価表現を含む評価表現出現位置情報を表現間距離判定手段134に出力する(S33)。今、例えば、評価表現記憶部131に、評価表現の集合として「面白い、お勧め、好き、いい」が格納されており、評価表現位置特定手段133が、評価表現出現位置の特定方法として文書の先頭からのByte数を算出する方法を採用しているとすると、評価表現位置特定手段133は、文書番号1の文書に対しては、次のような処理を行うことになる。先ず、評価表現位置特定手段133は、評価表現記憶部131に格納されている評価表現の内、「面白い」と「お勧め」が文書番号1の文書に含まれていることを認識し、それぞれの出現位置を「文書番号1,14Byte」「文書番号1,48Byte」と特定する。その後、評価表現出現位置「文書番号1,14Byte」と評価表現「面白い」を含む評価表現出現位置情報「文書番号1,面白い,14Byte」と、評価表現出現位置「文書番号1,48Byte」と評価表現「お勧め」を含む評価表現出現位置情報「文書番号1,お勧め,48Byte」とを作成し、表現間距離判定手段134に出力する。
【0038】
なお、S32とS33とは、その処理順序を反対にすることもできる。
【0039】
次に、表現間距離判定手段134が、検索語位置特定手段132から出力された検索語出現位置情報と評価表現位置特定手段133から出力された評価表現出現位置情報とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対(検索語・評価表現対)を求め、その対を構成する検索語,評価表現及びそれらの出現位置を含む対出現位置情報を判別結果記憶部14に格納する(S34,S35)。
【0040】
今、例えば、検索語位置特定手段132から検索語出現位置「文書番号1,商品A, 0Byte) が出力され、評価表現位置特定手段133から評価表現出現位置情報「文書番号1, 面白い, 14Byte」「文書番号1,お勧め, 48Byte」が出力されたとすると、S34,S35では、次のような処理が行われる。先ず、検索語「商品A」と評価表現「面白い」「お勧め」との間の距離を求める。この例の場合、検索語「商品A」と評価表現「面白い」のと間の距離は14−0=14Byteとなり、検索語「商品A」と評価表現「お勧め」との間の距離は48−0=48Byteとなる。その後、検索語と評価表現との間の距離が予め定められた閾値(この例では、30Byteとする)以下であるか否かを調べ、閾値以下であった場合は、検索語,評価表現及びその出現位置を含む対出現位置情報を判別結果記憶部14に格納する。この例の場合、検索語「商品A」と評価表現「面白い」との間の距離は閾値以下であり、検索語「商品A」と評価表現「お勧め」との間の距離は閾値を超えているので、表現間距離判定手段134は、判別結果記憶部14に対し、検索語「商品A」と評判情報「面白い」とを構成要素とする対に関する対出現位置情報(文書番号1, 商品A, 0Byte, 面白い, 14Byte) を出力することになる。
【0041】
また、上記の動作では、表現間距離判定手段134は、検索位置特定手段132と評価表現位置特定手段133の両方から情報が出力された後に動作を開始する方法を説明したが、それ以外にも検索語位置特定手段132で特定された検索語の位置と評価表現位置特定手段133で特定された評価表現の位置のいずれかを基準として動作を行うことも可能である。今、検索語位置特定手段132により特定された検索語の位置情報を基準とする場合について説明すると、まず基準とした手段である検索語位置特定手段132が、検索語出現位置情報を表現間距離判定手段134に出力し、次に表現間距離判定手段134が、基準としなかった手段である評価表現位置特定手段133に対し、基準とした手段である検索語位置特定手段132の出力した検索語出現位置情報を出力する。そして、基準としなかった手段である評価表現位置特定手段133は、受け取った検索語出現位置と距離の範囲(閾値)とから、検索語の位置から設定された距離の範囲だけ前方又は後方の範囲内に評価表現があるか否かを調べ、評価表現が存在する場合、その評価表現の位置を特定し、その評価表現の評価表現出現位置情報を表現間距離判定手段134に出力する。そして、最後に表現間距離判定手段134は、基準としなかった手段である評価表現位置特定手段133から出力された評価表現出現位置情報を受け取り、検索語出現位置情報と評価表現出現位置情報から、検索語と評価表現の距離が一定の範囲内である場合、対出現位置情報を判別結果記憶部14に格納するという方法でも良い。
【0042】
その後、評判情報抽出手段135が、判別結果記憶部14に格納されている対出現位置情報と、文書入力手段11から入力されている文書集合とに基づいて、少なくとも検索語・評価表現対によって挟まれる文字列を評判情報として抽出し、評判情報記憶部15に格納する(S36,S37)。今、例えば、判別結果記憶部14の記憶内容が図8に示すものであるとすると、図9に示すような評判情報が評判情報記憶部15に格納される。
【0043】
〔2.優先順位付与時の動作〕
今、ルール記憶部161に格納された評判情報の優先順位決定の基準となるルールが、図6に示した12個のルールで、スコア記憶部163の内容を図7に示したものであるとして、動作を説明する。また、図8、図9、図10、図11の対応関係は評判IDで結びついている。
【0044】
評判情報優先度判定手段16内のルール照合手段162は、評判情報記憶部15に格納されている各評判情報毎に、次のような処理を行う。現在処理対象にしている或る1個の評判情報と、ルール記憶部161に格納されている12個のルールそれぞれとを照合し、上記各ルールそれぞれについて処理対象としている評判情報がそのルールを満足するか否かを示す値と、処理対象にしている評判情報の評判IDとを出力する(図5のS51)。
【0045】
次に、スコア検索手段164が、ルール照合手段162から出力された12個の値を構成要素とする配列をKey にしてスコア記憶部163を検索することにより、評判情報に対するスコアを検索し、検索したスコアと評判IDとを出力する(S52)。図10に、各評判IDに対する配列と、それをKey として図7のスコア記憶部163からスコアを検索した結果を示す。
【0046】
次に、整列手段165が、スコア検索手段164から出力された複数の評判IDを、それに付加されているスコアの大きさの順に整列し、その順番を評判情報の優先順位として出力する(S53)。本実施の形態では、スコアが大きい順に優先順位を付け各評判IDに対して図11のような優先順位を付け出力する。
【0047】
その後、提示手段166が、整列手段165から渡された優先順位の付された評判IDに従って、評判情報記憶部15に格納されている各評判情報を、優先順位が高い順(評判情報である確率が高い順)に表示装置3に表示する(S54)。
【0048】
以上のように、本発明の第1の実施の形態においては、評判情報を自動的に抽出し、かつ、評判情報の優先順位の自動判定を行うことから、より評判情報らしいものを利用者は優先的に手に入れることが可能となる。
【0049】
〔第2の実施の形態〕
次に、本発明の第2の実施の形態について説明する。本発明の第2の実施の形態は、図1に示した情報検索装置において、評判情報判別手段13の代わりに、図12に示す構成を有する評判情報判別手段13aを備えている点が第1の実施の形態と相違している。
【0050】
図12に示した評判情報判別手段13aが、図2に示した評判情報判別手段13と異なっている点は、評価表現記憶部131の代わりに評価表現記憶部131aを備えている点と、評価表現位置特定手段133の代わりに評価表現位置特定手段133aを備えている点と、検索語分野特定手段136が追加されている点である。
【0051】
評価表現記憶部131aには、評価表現に加え、その評価表現が使用される分野、またはその評価表現が使用されない分野を示す分野情報が、評価表現と組になって格納されている。
【0052】
検索語分野特定手段136は、検索語入力手段12から入力された検索語の分野を特定し、その結果を評価表現位置特定手段133aに出力する機能を有する。ここで、検索語の分野を特定する方法は、検索語入力手段12の入力が検索語とその検索語の分野とを含んでいる場合は、その入力された分野を検索語の分野として特定し、それ以外の場合については、図示を省略した、検索語と検索語の分野の対応関係を記憶したデータベースを参照することにより検索語の分野を特定する。
【0053】
また、評価表現位置特定手段133aは、評価表現記憶部131aに格納されている複数の評価表現の中から検索語分野特定手段136で特定された分野で使用される評価表現のみを選択する機能や、選択した評価表現の、文書入力手段11から入力された文書における出現位置を特定し、出現した評価表現とその出現位置とを含む評価表現出現位置情報を出力する機能を有する。
【0054】
〔動作の説明〕
第2の実施の形態の動作を図面を参照して説明する。なお、評判情報判別手段13a以外の動作は、第1の実施の形態と同じであるので、ここでは、評判情報判別手段13aの動作のみ説明する。
【0055】
図13を参照すると、S31において、文書入力手段11,検索語入力手段12から文書集合,検索語を入力し、次のS32において、検索語位置特定手段132が検索語の出現位置を特定し、検索語出現位置情報を出力する。このS31,S32の動作は、図3のS31,S32と同様の動作である。
【0056】
その後、検索語分野特定手段136が検索語の分野を特定する(S131)。ここで、検索語入力手段12から検索語の分野も入力されている場合は、その入力された分野を検索語の分野として特定し、それ以外の場合については、検索語と検索語の分野の対応関係を記憶したデータベース(図示せず)を参照することにより検索語の分野を特定する。
【0057】
評価表現位置特定手段133aは、検索語分野特定手段136により出力された検索語の分野を用いて、評価表現記憶部131aからその検索語の分野で使用される評価表現を選択する(S132)。そして、評価表現位置特定手段133aは、各文書における選択した評価表現が出現する位置を特定し、その評価表現に関する評価表現出現位置情報を表現間距離判定手段134に出力する(S133)。その後、表現間距離判定手段134,評判情報抽出手段135が、第1の実施の形態で説明した動作と同様の動作を行う(S34〜S37)。
【0058】
なお、本実施の形態の動作において、上記で説明した以外でも、S31→S131→S32→S132→S133→S34→S35→S36→S37、S31→S131→S132→S32→S133→S34→S35→S36→S37、S31→S131→S132→S133→S32→S34→S35→S36→S37の順序でも同様の処理が可能である。
【0059】
本実施の形態では、例えば、検索語の分野が「書籍」の場合、評価表現位置特定手段133aが評価表現の位置を特定する際に、評価表現記憶部131aに格納されている評価表現の中から、評価表現「おいしい」のような「書籍」に関する評判では使用されない評価表現を除外して、評価表現の位置を特定することができる。このため、評判情報の判別精度の向上および判別速度の高速化が可能となる。
【0060】
〔スコアの決定方法〕
次に、図4に示したスコア記憶部163に格納するスコアの決定方法およびその装置の一例について説明する。
【0061】
図14を参照すると、スコア決定装置は、スコア決定用文書入力手段141と、スコア決定用検索語入力手段142と、スコア決定用評判情報判別手段143と、スコア決定用判別結果記憶部144と、スコア決定用評判情報記憶部145と、スコア決定手段146と、キーボード等の入力装置147と、LCD等の表示装置148とを含んでいる。
【0062】
スコア決定用文書入力手段141,スコア決定用検索語入力手段142は、文書入力手段11,検索語入力手段12と同様の構成,機能を有している。
【0063】
スコア決定用評判情報判別手段143は、第1の実施の形態で説明した評判情報判別手段13、または第2の実施の形態で説明した評判情報判別手段13aと同様の構成,機能を有している。
【0064】
スコア決定手段146は、スコア決定用評判情報記憶部145に格納されている評判情報を表示装置147に表示して利用者に提示する機能や、この表示を見た利用者が入力装置148を用いて入力した評判情報に対するスコアに基づいて、図7に示したスコア記憶部163に格納するスコアを決定する機能を有する。
【0065】
図15を参照するとスコア決定手段146は、スコア決定用ルール記憶部201と、スコア決定用ルール照合手段202と、頻度付きスコア記憶部203と、頻度付きスコア検索手段204と、スコア算出手段205と、表示制御手段206と、スコア入力手段207とを備えている。
【0066】
スコア決定用ルール記憶部201には、第1の実施の形態で説明したルール記憶部161と同様の内容が格納されている。
【0067】
スコア決定用ルール照合手段202は、第1の実施の形態で説明したルール照合手段162と同様の構成,機能を有している。
【0068】
表示制御手段206は、スコア決定用評判情報記憶部145に格納されている評判情報を表示装置147に表示する機能等を有する。
【0069】
スコア入力手段207は、表示装置147に表示された評判情報を見た利用者が入力装置148を見て入力したスコア(評判情報らしさを示すスコア)を受け付ける機能を有している。
【0070】
頻度付きスコア記憶部203には、第1の実施の形態のスコア記憶部163に格納されている情報に加え、スコア入力手段207で入力された利用者からのスコアの総和及びスコアの総入力回数が格納される。尚、ここで格納されるスコアとは、スコアの総和をスコアの総入力回数で割ったスコアの平均値である。
【0071】
頻度付きスコア検索手段204は、スコア決定用ルール照合手段202から出力された、評判情報がスコア決定用ルール記憶部201に格納されている各ルールを満足するか否かを示す値を構成要素とする配列をKey にして頻度付きスコア記憶部203を検索し、上記評判情報に対するスコアの総和とスコアの総入力回数を検索する機能を有する。
【0072】
スコア算出手段205は、頻度付きスコア検索手段204で検索されたスコアの総和にスコア入力手段207から入力された当該評判情報に対する利用者のスコアを加算すると共に、スコアの総入力回数に1を加算した後、頻度付きスコア記憶部203の該当部分(頻度付きスコア検索手段204によって検索された部分)に更新後のスコアの総和,スコアの総入力回数を格納すると共に、スコアの総和をスコアの総入力回数で割った平均値を格納する機能を有する。
【0073】
〔動作の説明〕
次に、図14に示したスコア決定装置の動作について詳細に説明する。
【0074】
先ず、スコア決定用評判情報判別手段143が、検索語・評価表現対の対出現位置情報をスコア決定用判別結果記憶部144に格納すると共に、評判情報をスコア決定用評判情報記憶部145に格納する。この処理により、スコア決定用判別結果記憶部144に図17に示す対出現位置情報が格納され、スコア決定用評判情報記憶部145に図18に示す評判情報が格納されたとする。尚、図17,図18の対応関係は、評判IDによって示されている。
【0075】
スコア決定用評判情報記憶部145に評判情報が格納されると、表示制御手段206は、図19に示すように、スコア決定用評判情報記憶部145に格納されている各評判情報を表示装置147に表示すると共に、スコア入力欄を表示する(図16のS161)。
【0076】
この表示を見た利用者は、各評判情報に対する評判情報らしさのスコアを、スコア入力欄を用いて入力する(S162)。今、例えば、利用者が各評判情報に対して図20に示したスコアを入力したとする。尚、図20と図17,図18との対応関係は、評判IDによって示されている。
【0077】
次に、スコア決定用ルール照合手段202が、スコア入力手段207からスコアが入力された評判情報の内の一つを選択し(S163)、この評判情報に対してスコア決定用ルール記憶部201に格納された評判情報の優先順位決定の基準となるルールの各々を照合し、各ルールを満足させるか否かの値を出力する(S164)。尚、スコア決定用ルール記憶部201には、図6に示す12個のルールと同じルールが格納されているとする。
【0078】
次に、頻度付きスコア検索手段204が、スコア決定用ルール照合手段202から出力された各ルールに対する値を構成要素にする配列をKey として、頻度付きスコア記憶部203からスコアの総和とスコアの総入力回数を検索する(S165)。
【0079】
次に、スコア算出手段205が、頻度付きスコア検索手段204から出力されたスコアの総和にスコア入力手段207から入力された当該評判情報に対する利用者のスコアを加算すると共にスコアの総入力回数に1を加算し、その後、スコアの総和をスコアの総入力回数で割った平均値を算出する(S166)。更に、それらを頻度付きスコア記憶部203の該当する部分(S165において頻度付きスコア検索手段204がスコアの総数,総入力回数を検索した部分)に格納する(S167)。
【0080】
最後に、未だ未処理の入力がある場合はS163に戻る(S168)。以上の処理により、頻度付きスコア記憶部203の内容は、図21に示すものとなる。以上の処理を多数の評判情報に対して行うことにより、図4に示したスコア記憶部163に格納する、各配列毎のスコアを決定することができる。
【0081】
なお、図16に示した各S161〜S168の実行順序は、これに限られるものではなく、図22のように最初にS164の処理を行うようにしても良い。更に、S164が、S161とS162との間にあっても、S162とS163との間にあっても良い。
【0082】
以上のように、本実施の形態によれば、スコア決定用評判情報判別手段143で抽出された各評判情報に対して利用者から入力されたスコアを利用して、優先順位を決定する際に使用するスコアを決定するようにしているので、評判情報に優先順位を付す際に、より正確に優先順位を付すことが可能になる。
【0083】
【発明の効果】
本発明の第1の効果は、評判情報の出現位置の自動判定に加え評判情報の優先順位の自動判定を行うことにより、より評判情報らしいものから順番に利用者に提示できることである。その理由は、入力された文書に含まれる検索語に関する評判情報を抽出する評判情報判別手段と、判別情報判別手段で抽出した各評判情報を評判情報らしさの順に優先順位を付ける評判情報優先度判定手段を有するためである。
【0084】
本発明の第2の効果は、評判情報の抽出精度,抽出処理速度が向上することである。その理由は、検索語が使用される分野を特定し、上記分野で使用されない評価表現は除外して評判情報の抽出処理を行うからである。
【0085】
本発明の第3の効果は、評判情報に優先順位を付す際に、より正確に優先順位を付すことが可能になるということである。その理由は、各評判情報に対して利用者から入力されたスコアを利用して、優先順位を決定する際に使用するスコアを決定するようにしているからである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の構成例を示すブロック図である。
【図2】評判情報判別手段13の構成例を示すブロック図である。
【図3】評判情報判別手段13の処理例を示す流れ図である。
【図4】評判情報優先度判定手段16の構成例を示すブロック図である。
【図5】評判情報優先度判定手段16の処理例を示す流れ図である。
【図6】ルール記憶部161の内容例を示す図である。
【図7】スコア記憶部163の内容例を示す図である。
【図8】判別結果記憶部14の内容例を示す図である。
【図9】評判情報記憶部15の内容例を示す図である。
【図10】各評判情報の配列とスコアの一例を示す図である。
【図11】各評判情報の優先順位の一例を示す図である。
【図12】本発明の第2の実施の形態で使用する評判情報判別手段13aの構成例を示すブロック図である。
【図13】評判情報判別手段13aの処理例を示す流れ図である。
【図14】スコア決定装置の構成例を示すブロック図である。
【図15】スコア決定手段146の構成例を示すブロック図である。
【図16】スコア決定装置の処理例を示す流れ図である。
【図17】スコア決定用判別結果記憶部144の内容例を示す図である。
【図18】スコア決定用評判情報記憶部145の内容例を示す図である。
【図19】表示制御手段206による評判情報,入力欄の表示例を示す図である。
【図20】利用者によって入力されたスコアの一例を示す図である。
【図21】頻度付きスコア記憶部203の最終的な内容を示した図である。
【図22】スコア決定装置の他の処理例を示す流れ図である。
【符号の説明】
1…情報検索装置
11…文書入力手段
12…検索語入力手段
13…評判情報判別手段
131…評価表現記憶部
132…検索語位置特定手段
133…評価表現位置特定手段
134…表現間距離判定手段
135…評判情報抽出手段
14…判別結果記憶部
15…評判情報記憶部
16…評判情報優先度判定手段
161…ルール記憶部
162…ルール照合手段
163…スコア記憶部
164…スコア検索手段
165…整列手段
166…提示手段
17…優先順位記憶部
2…入力装置
3…表示装置
K1…記録媒体
13a…評判情報判別手段
131a…評価表現記憶部
133a…評価表現位置特定手段
136…検索語分野特定手段
141…スコア決定用文書入力手段
142…スコア決定用検索語入力手段
143…スコア決定用評判情報判別手段
144…スコア決定用判別結果記憶部
145…スコア決定用評判情報記憶部
146…スコア決定手段
147…表示装置
148…入力装置
201…スコア決定用ルール記憶部
202…スコア決定用ルール照合手段
203…頻度付きスコア記憶部
204…頻度付きスコア検索手段
205…スコア算出手段
206…表示制御手段
207…スコア入力手段
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information search technique, and more particularly to an information search technique capable of searching for reputation information.
[0002]
[Prior art]
Currently, there are many information retrieval systems that automatically collect attribute information from search terms and present them to users. For example, a system provided by MySimon (http://www.mysimon.com) presents attribute information (price) related to a search term (product name) to the user as follows. When a user inputs a product name as a search term, the product name is sent to a certain online shop α that sells the product. In response to this, the online shop α searches for attribute information such as price, size, color, weight, etc. relating to the product name, and returns the search result in a standard form (format). When the attribute information is returned, price information is extracted based on the format of the online shop α recognized in advance and presented to the user.
[0003]
In addition, as a system that can retrieve attribute information by using a search word as a clue, there is a system that allows a user to see information that the user wants from attribute information collected in advance by hand. For example, at Deja.com (http://www.deja.com), reputation information is collected from consumers as attribute information about the product in advance, and the user can obtain the reputation information by selecting the name of the product. .
[0004]
[Problems to be solved by the invention]
However, in the information search system that can automatically collect the attribute information described above, even if it is possible to handle attribute information that can identify the appearance position by using typical search result information such as product names and price attributes. Attribute information whose appearance position cannot be specified cannot be automatically collected because it does not appear as search result information such as reputation information.
[0005]
On the other hand, in information retrieval systems that manually collect attribute information in advance, it is possible to handle unspecified attributes such as reputation information, but methods that depend on human work are limited in terms of quantity. Even in the above-mentioned reputation information of products, it is the present situation that products other than extremely well-known products are not sufficient for use as judgment material for product purchase.
[0006]
The present invention has been made in view of such problems, and the purpose thereof is to enable automatic retrieval of reputation information that is unspecified attribute information, and each piece of reputation information that is automatically retrieved is most likely to be reputation information. It is to be able to present to the user in order from the thing.
[0007]
[Means for Solving the Problems]
The information retrieval apparatus of the present invention achieves the above-described object,
Reputation information discrimination that extracts reputation information about the designated search term existing in the input document based on the appearance position of the search term in the document and the appearance position of the evaluation expression that determines the value for things Means (13 in FIG. 1);
Reputation information extracted by the reputation information discrimination means (13 in FIG. 1) For each, the reputation information is a rule group related to the positional relationship between the search word in the reputation information and the evaluation expression, a rule group related to the position of the search word in the reputation information, or a rule group related to the position of the evaluation expression in the reputation information. Check which rule in the rule group including at least one of the rules is satisfied, and based on the combination of the satisfied rules, there is a high probability that the respective reputation information is the reputation information related to the search word Reputation information priority determination means (16 in FIG. 1) for assigning priorities in order.
[0008]
By adopting such a configuration and performing automatic determination of the priority order of reputation information in addition to automatic extraction of reputation information, the user can preferentially know what seems to be reputation information.
[0009]
In addition, the information retrieval apparatus of the present invention improves reputation information extraction accuracy and extraction speed,
The reputation information determining means (13a in FIG. 12)
A search term field specifying means (136 in FIG. 12) for specifying a field in which the search term is used;
Search word position specifying means (132 in FIG. 12) for specifying a search word appearance position where the search word appears in the document;
An evaluation expression storage unit (131a in FIG. 12) in which a plurality of evaluation expressions and field information indicating the field of use of each evaluation expression are stored;
Of the evaluation expressions stored in the evaluation expression storage unit (131a in FIG. 12) in the document, an evaluation expression used in the field specified by the search word field specifying means (136 in FIG. 12) appears. Evaluation expression position specifying means (133a in FIG. 12) for specifying the evaluation expression appearance position to be performed;
Based on the search word appearance position specified by the search word position specifying means (132 in FIG. 12) and the evaluation expression appearance position specified by the evaluation expression position specifying means (133a in FIG. 12), the mutual distance is constant. An inter-expression distance determination means (134 in FIG. 12) for obtaining a pair of a search term and an evaluation expression within a range;
Reputation information extraction means (135 in FIG. 12) for extracting reputation information including at least a portion sandwiched between the search word constituting the pair and the evaluation expression obtained by the inter-expression distance determination means (134 in FIG. 12) from the document. ).
[0010]
By adopting such a configuration, when the field in which the search term is used is “book”, for example, the evaluation information that is not used for the reputation information related to “book” such as “delicious” is excluded, and the reputation information Since extraction processing can be performed, reputation information extraction accuracy and extraction processing speed are improved.
[0011]
In addition, the score determination device of the present invention can give priority more accurately when giving priority to reputation information.
For score determination that extracts reputation information about the specified search term existing in the input document based on the appearance position of the search term in the document and the appearance position of the evaluation expression that determines the value for things Reputation information discrimination means (143 in FIG. 14);
Each reputation information extracted by the score determination reputation information discriminating means (143 in FIG. 14) is displayed on a display device and presented to the user, and the score for each reputation information input by the user using the input device. And score determining means (146 in FIG. 14) for determining the score to be stored in the score storage unit (163 in FIG. 4).
[0012]
Adopting such a configuration, using the score input from the user for the extracted reputation information, determine the score to be stored in the score storage unit (score used when determining the priority) Therefore, when assigning priorities to reputation information, it becomes possible to assign priorities more accurately.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments of the present invention will be described in detail with reference to the drawings.
[0014]
[First Embodiment]
Referring to FIG. 1, a first embodiment of an information search apparatus 1 according to the present invention includes a document input unit 11, a search word input unit 12, a reputation information determination unit 13, a determination result storage unit 14, It includes a reputation information storage unit 15, reputation information priority determination means 16, a priority order storage unit 17, an input device 2 such as a keyboard, a display device 3 such as an LCD, and a recording medium K1. The information search device 1 is configured by a computer.
[0015]
The document input unit 11 has a function of inputting a document set that is a set of documents to be searched for reputation information and passing the document set to the reputation information determination unit 13. The input destination of the document may be a Web page on the Internet or a file in which a plurality of documents are recorded.
[0016]
The search word input unit 12 has a function of receiving a search word input by the user using the input device 2 and passing it to the reputation information determination unit 13.
[0017]
The reputation information determination unit 13 has a function of receiving a document set from the document input unit 11, receiving a search term from the search term input unit 12, and extracting reputation information related to the search term included in the document set.
[0018]
As shown in FIG. 2, the reputation information determination unit 13 includes an evaluation expression storage unit 131, a search word position specification unit 132, an evaluation expression position specification unit 133, an inter-expression distance determination unit 134, and a reputation information extraction unit 135. And have.
[0019]
The evaluation expression storage unit 131 stores a plurality of evaluation expressions. Here, the evaluation expression is an expression that can determine the value for a thing. Therefore, expressions that do not show value for things such as “play”, “move”, and “research” are not evaluation expressions. The evaluation expression has nouns such as “popular”, “excellent”, and “unusual” in addition to the phrases “good”, “like”, “best”, “interesting”. Further, as a storage format of evaluation expressions in the evaluation expression storage unit 131, a method of storing in a unit that absorbs a difference in notation due to utilization of each evaluation expression is effective in terms of saving storage capacity, but is limited to this method. It is not something.
[0020]
The search word position specifying means 132 receives a document set from the document input means 11, receives a search word from the search word input means 12, and specifies a search word appearance position (search word appearance position) in the document set. The search word appearance position is output to the inter-expression distance determination means 134. The search word appearance position can be specified using a method of calculating a distance from a reference position such as the beginning or the end of the document. The method for calculating the distance from the reference position may be any method as long as the distance from the reference position can be calculated. Specifically, a method for calculating the distance from the number of characters from the top of the document, a method for calculating the distance from the number of bytes from the top of the document, and a method of calculating the distance from the number of lines from the top of the document are included. Further, the position information of the search word to be output includes at least information for specifying the document in which the search word appears and information for specifying the position in which the search word appears in the document.
[0021]
The evaluation expression position specifying unit 133 receives the document set from the document input unit 11, takes out the evaluation expression from the evaluation expression storage unit 131, and a position at which any evaluation expression stored in the evaluation expression storage unit 131 appears in the document set. It has a function of specifying (evaluation expression appearance position) and a function of outputting the specified evaluation expression appearance position to the inter-expression distance determination means 134. Specifically, the evaluation expression position specifying unit 133 checks whether the evaluation expression is included in the document set for each evaluation expression stored in the evaluation expression storage unit 131 and is included in the document set. In the case, the appearance position of the evaluation expression is specified. The evaluation expression appearance position in the evaluation expression position specifying means 133 is specified by the same method as the search word position specifying means 132. Further, the output evaluation expression appearance position includes at least information for specifying a document in which the evaluation expression appears and information for specifying a position in which the evaluation expression appears in the document.
[0022]
The inter-expression distance determination unit 134 searches within a range where the distance between each other is constant based on the search word appearance position specified by the search word position specification unit 132 and the evaluation expression appearance position specified by the evaluation expression position specification unit 133. A function for obtaining a pair of a word and an evaluation expression (a search word / evaluation expression pair), and a function for storing the search word, the evaluation expression, and the appearance position of the search word / evaluation expression pair in the discrimination result storage unit 14 . Here, the distance is within a certain range, for example, when the magnitude of the numerical difference between the search term and the evaluation expression is less than or equal to the threshold, or between the search word and the evaluation expression This is the case. The appearance position stored in the determination result storage unit 14 includes information for specifying a document and information for specifying an appearance position in the document. In the present embodiment, the search word / evaluation expression pair is a search word / evaluation expression pair within a certain distance from each other, so that the distance is constant for a certain search word. When there are a plurality of evaluation expressions within a range, each of the certain search word and the plurality of evaluation expressions is a search word / evaluation expression pair. The certain search word and the plurality of evaluation expressions Only a pair with one of the above may be used as a search word / evaluation expression pair. At that time, it is necessary to select one evaluation expression from a plurality of evaluation expressions, for example, a method of selecting the one farthest from the search word, a method of selecting the one closest to the search word, It is possible to adopt a method of selecting the most existing one.
[0023]
The reputation information extracting unit 135 is based on at least the search word / evaluation expression pair appearance position stored in the discrimination result storage unit 14 and the document set input from the document input unit 11, and at least the search word / evaluation expression pair. It has a function of extracting reputation information including a character string sandwiched between and storing it in the reputation information storage unit 15. The extracted reputation information may be, for example, only the character string between the search word / evaluation expression pair or the character string between the search word / evaluation expression pair and before and after the character string. A combination of a predetermined number of character strings may be used.
[0024]
The reputation information priority determination means 16 has a function of prioritizing each reputation information stored in the reputation information storage unit 15 in the order of the likelihood of reputation information, and each reputation stored in the reputation information storage unit 15. It has a function of displaying information on the display device 3 in order of priority, a function of storing the priority for each reputation information in the priority storage unit 17, and the like.
[0025]
Referring to FIG. 4, the reputation information priority determination unit 16 includes a rule storage unit 161, a rule matching unit 162, a score storage unit 163, a score search unit 164, an alignment unit 165, and a presentation unit 166. .
[0026]
The rule storage unit 161 stores rules that serve as a basis for determining the priority order of reputation information. FIG. 6 shows an example of the contents of the rule storage unit 161. In the example of FIG. 6, a plurality of rules relating to the positional relationship between the search term and the evaluation expression and a plurality of rules relating to the position of the evaluation expression in the sentence are stored. Rules relating to the positional relationship between the search term and the evaluation expression include rule ID 1 “search word and evaluation expression are in different sentences” and rule ID 2 “search word and evaluation expression are close to each other”. As a rule regarding the position of the evaluation expression in the sentence, rule ID 11 “an evaluation expression appears in the vicinity of an expression indicating a guess (maybe)” or rule ID 12 “an evaluation in front of a question mark” "Expression appears". Moreover, although not shown in the example of FIG. 6, you may make it use the rule regarding the position in the sentence of a search word. As specific examples of this rule, “a search word appears in front of the expression of reverse connection (but, etc.)” or “a search word appears in front of the expression of cause (ie, so, etc.)” For example, a regular expression that can express the appearance pattern of a character string is effective. However, it is also possible to specify the part-of-speech and original form of words by morphological analysis and the dependency between words by syntax analysis. It is.
[0027]
The rule matching means 162 checks each reputation information stored in the reputation information storage unit 15 against each rule stored in the rule storage unit 161, and the reputation information for each of the rules satisfies the rule. (In this embodiment, it is “1” when satisfied, and “0” when not satisfied). Here, when the part-of-speech and original form of the word by morphological analysis and the dependency relation between words by syntax analysis are specified as conditions in the rule, morphological analysis and syntax analysis are used for the character string.
[0028]
The score storage unit 163 is used to determine the priority order of reputation information for each combination of values (“1” or “0”) for each rule that may be output from the rule matching unit 162. A score is stored. More specifically, a value for each rule is stored in the form of an array, and a score is stored in association with each array. Here, as a score storage method, the array is registered as Key and the score is registered as Value. An example is shown in FIG. Note that the example of FIG. 7 is for a case where 12 rules as shown in FIG. 6 are adopted as rules for determining the priority order of reputation information. The score is 5 for the highest and 1 for the lowest, and the higher the value, the higher the priority.
[0029]
The score search unit 164 searches the score storage unit 163 using the array having the values for each rule (12 values for 12 rules) output from the rule matching unit 162 as constituent elements as a key. It has a function of searching a score for information.
[0030]
The aligning unit 165 has a score in the information (reputation ID) for specifying each piece of reputation information based on the score for each piece of reputation information stored in the reputation information storage unit 15 searched by the score search unit 164. It has a function of assigning priorities in descending order, a function of passing a reputation ID after giving priority to the presenting means 166, and a function of storing a reputation ID after giving priority to the priority order storage unit 17.
[0031]
The presenting unit 166 displays each piece of reputation information stored in the reputation information storage unit 15 in the order of the highest priority (the probability of being the reputation information is high) according to the prioritized reputation ID passed from the arranging unit 165. In order) on the display device 3.
[0032]
A recording medium K1 provided in the information retrieval apparatus 1 is a disk, a semiconductor memory, or other recording medium, and a program for causing the computer to function as the information retrieval apparatus 1 is recorded. This program is read by a computer and controls its operation, thereby realizing a document input means 11, a search word input means 12, a reputation information determination means 13, and a reputation information priority determination means 16 on the computer.
[0033]
[Description of operation]
Next, the operation of the first exemplary embodiment of the present invention will be described with reference to the drawings. The operation will be described in two parts: a part for extracting reputation information and a part for giving priority to the extracted reputation information.
[0034]
[1. Behavior when extracting reputation information)
First, the document input means 11 inputs a document set to the reputation information determination means 13, and the search word input means 12 inputs a character string that is a search word for reputation information (S31 in FIG. 3). The document input unit 11 assigns a unique document number to each document included in the document set when inputting the document set to the reputation information determination unit 13, and identifies each document in the document set by the document number. I can do it.
[0035]
Next, the search word position specifying means 132 in the reputation information determining means 13 specifies the appearance position of the search word in the document set, and the search word appearance position information including the specified appearance position and the search word is expressed as an inter-expression distance determination means. It outputs to 134 (S32).
[0036]
Now, for example, the document set input from the document input means 11 includes “Product A is very interesting. Product B is recommended because the price is low” as a document with document number 1. If “product A” is input as a search word from the means 12, the search word position specifying means 132 performs the following processing on the document with the document number 1 (note that the search word It is assumed that the position specifying unit 132 employs a method of calculating the number of bytes from the beginning of the document as a method for specifying the search word appearance position). First, the appearance position of the search term “product A” is specified as the 0th byte from the top of the document of document number 1. Next, search word appearance position information “document number 1, product A, 0 Byte” including the search word appearance position “document number 1, 0 bytes” and the search word “product A” is created, and the inter-expression distance determination unit 134 Output.
[0037]
When the processing of S32 ends, the evaluation expression position specifying unit 133 specifies the appearance position in the document set of each evaluation expression stored in the evaluation expression storage unit 131, and includes the specified appearance position and evaluation expression. The expression appearance position information is output to the inter-expression distance determining means 134 (S33). Now, for example, the evaluation expression storage unit 131 stores “interesting, recommended, likes, good” as a set of evaluation expressions, and the evaluation expression position specifying unit 133 uses the document as a method of specifying the evaluation expression appearance position. If the method of calculating the number of bytes from the beginning is adopted, the evaluation expression position specifying unit 133 performs the following processing on the document with document number 1. First, the evaluation expression position specifying means 133 recognizes that “interesting” and “recommended” are included in the document of document number 1 among the evaluation expressions stored in the evaluation expression storage unit 131, respectively. Are identified as “document number 1,14 bytes” and “document number 1,48 bytes”. After that, evaluation expression appearance position information “document number 1, interesting, 14 bytes” including evaluation expression appearance position “document number 1, 14 bytes” and evaluation expression “interesting” and evaluation expression appearance position “document number 1, 48 bytes” are evaluated. The evaluation expression appearance position information “document number 1, recommendation, 48 bytes” including the expression “recommended” is created and output to the inter-expression distance determination means 134.
[0038]
Note that the processing order of S32 and S33 can be reversed.
[0039]
Next, the inter-expression distance determining unit 134 determines the mutual distance based on the search word appearance position information output from the search word position specifying unit 132 and the evaluation expression appearance position information output from the evaluation expression position specifying unit 133. Finds pairs of search words and evaluation expressions within a certain range (search word / evaluation expression pairs), and stores paired appearance position information including search words, evaluation expressions and their appearance positions that constitute the pair The data is stored in the unit 14 (S34, S35).
[0040]
Now, for example, the search word appearance position “document number 1, product A, 0 bytes” is output from the search word position specifying means 132, and the evaluation expression appearance position information “document number 1, interesting, 14 bytes” is output from the evaluation expression position specifying means 133. If “document number 1, recommended, 48 bytes” is output, the following processing is performed in S34 and S35. First, the distance between the search term “product A” and the evaluation expressions “interesting” “recommended” is obtained. In this example, the distance between the search term “product A” and the evaluation expression “interesting” is 14−0 = 14 bytes, and the distance between the search word “product A” and the evaluation expression “recommended” is 48. −0 = 48 bytes. Thereafter, it is checked whether or not the distance between the search word and the evaluation expression is equal to or less than a predetermined threshold (in this example, 30 bytes). If the distance is equal to or less than the threshold, the search word, the evaluation expression, and The pair appearance position information including the appearance position is stored in the discrimination result storage unit 14. In this example, the distance between the search term “product A” and the evaluation expression “interesting” is less than the threshold, and the distance between the search word “product A” and the evaluation expression “recommended” exceeds the threshold. Therefore, the inter-expression distance determination means 134 provides the discrimination result storage unit 14 with respect to pair appearance position information (document number 1, product) regarding the pair having the search word “product A” and the reputation information “interesting” as components. A, 0 Byte, interesting, 14 Byte) will be output.
[0041]
In the above operation, the inter-expression distance determination unit 134 has been described as a method of starting the operation after information is output from both the search position specifying unit 132 and the evaluation expression position specifying unit 133. It is also possible to operate based on either the position of the search word specified by the search word position specifying means 132 or the position of the evaluation expression specified by the evaluation expression position specifying means 133. Now, the case where the position information of the search word specified by the search word position specifying means 132 is used as a reference will be described. First, the search word position specifying means 132 as the reference means converts the search word appearance position information into the inter-expression distance. The search word output by the search word position specifying means 132 that is a reference means to the evaluation expression position specifying means 133 that is output to the determination means 134 and then the inter-expression distance determination means 134 is a means that is not a reference. Output appearance position information. Then, the evaluation expression position specifying means 133 which is a means not used as a reference is a range that is forward or backward from the received search word appearance position and distance range (threshold) by a distance range set from the position of the search word. Whether or not there is an evaluation expression is determined. If the evaluation expression exists, the position of the evaluation expression is specified, and the evaluation expression appearance position information of the evaluation expression is output to the inter-expression distance determination means 134. Finally, the inter-expression distance determining means 134 receives the evaluation expression appearance position information output from the evaluation expression position specifying means 133 that is a means not used as a reference, and from the search word appearance position information and the evaluation expression appearance position information, When the distance between the search term and the evaluation expression is within a certain range, a method of storing the pair appearance position information in the discrimination result storage unit 14 may be used.
[0042]
Thereafter, the reputation information extraction unit 135 is sandwiched between at least the search word / evaluation expression pair based on the pair appearance position information stored in the discrimination result storage unit 14 and the document set input from the document input unit 11. Character strings to be extracted as reputation information and stored in the reputation information storage unit 15 (S36, S37). Now, for example, assuming that the stored contents of the discrimination result storage unit 14 are as shown in FIG. 8, reputation information as shown in FIG. 9 is stored in the reputation information storage unit 15.
[0043]
[2. (Operation when priority is given)
Now, it is assumed that the rules for determining the priority order of reputation information stored in the rule storage unit 161 are the 12 rules shown in FIG. 6 and the contents of the score storage unit 163 are shown in FIG. The operation will be described. In addition, the correspondence relationships in FIGS. 8, 9, 10 and 11 are linked by reputation IDs.
[0044]
The rule matching unit 162 in the reputation information priority determination unit 16 performs the following process for each piece of reputation information stored in the reputation information storage unit 15. A piece of reputation information that is currently targeted for processing is compared with each of the 12 rules stored in the rule storage unit 161, and the reputation information that is the processing target for each of the rules satisfies the rule. A value indicating whether or not to perform and a reputation ID of the reputation information to be processed are output (S51 in FIG. 5).
[0045]
Next, the score search unit 164 searches the score storage unit 163 by using the array having the 12 values output from the rule matching unit 162 as a key, and searches the score for reputation information. The score and reputation ID are output (S52). FIG. 10 shows an array for each reputation ID and the result of searching the score from the score storage unit 163 in FIG. 7 using it as a key.
[0046]
Next, the alignment unit 165 arranges the plurality of reputation IDs output from the score search unit 164 in the order of the magnitude of the score added thereto, and outputs the order as the priority order of the reputation information (S53). . In the present embodiment, priorities are assigned in descending order of scores, and priorities as shown in FIG.
[0047]
After that, the presenting unit 166 sets the pieces of reputation information stored in the reputation information storage unit 15 in the order of higher priority (probability of reputation information) according to the priority-added reputation ID passed from the arranging unit 165. Are displayed on the display device 3 in descending order (S54).
[0048]
As described above, in the first embodiment of the present invention, reputation information is automatically extracted and the priority order of reputation information is automatically determined. It becomes possible to obtain it preferentially.
[0049]
[Second Embodiment]
Next, a second embodiment of the present invention will be described. The second embodiment of the present invention is that the information search apparatus shown in FIG. 1 includes a reputation information discrimination means 13a having the configuration shown in FIG. This is different from the embodiment.
[0050]
The reputation information discrimination means 13a shown in FIG. 12 is different from the reputation information discrimination means 13 shown in FIG. 2 in that an evaluation expression storage unit 131a is provided instead of the evaluation expression storage unit 131. The point is that an evaluation expression position specifying means 133a is provided instead of the expression position specifying means 133, and a search term field specifying means 136 is added.
[0051]
In the evaluation expression storage unit 131a, in addition to the evaluation expression, field information indicating a field in which the evaluation expression is used or a field in which the evaluation expression is not used is stored in combination with the evaluation expression.
[0052]
The search term field specifying unit 136 has a function of specifying the search term field input from the search term input unit 12 and outputting the result to the evaluation expression position specifying unit 133a. Here, the method of specifying the field of the search word is to specify the input field as the field of the search word when the input of the search word input unit 12 includes the search word and the field of the search word. In other cases, the field of the search word is specified by referring to a database in which the correspondence between the search word and the field of the search word is stored, which is not shown.
[0053]
The evaluation expression position specifying unit 133a has a function of selecting only an evaluation expression used in the field specified by the search word field specifying unit 136 from a plurality of evaluation expressions stored in the evaluation expression storage unit 131a. The function has the function of specifying the appearance position of the selected evaluation expression in the document input from the document input means 11 and outputting evaluation expression appearance position information including the evaluation expression that has appeared and the appearance position.
[0054]
[Description of operation]
The operation of the second embodiment will be described with reference to the drawings. Since operations other than the reputation information determination unit 13a are the same as those in the first embodiment, only the operation of the reputation information determination unit 13a will be described here.
[0055]
Referring to FIG. 13, in S31, a document set and a search word are input from the document input means 11 and the search word input means 12, and in next S32, the search word position specifying means 132 specifies the appearance position of the search word, Outputs search word appearance position information. The operations of S31 and S32 are the same as S31 and S32 of FIG.
[0056]
Thereafter, the search term field specifying means 136 specifies the search term field (S131). Here, when the field of the search word is also input from the search word input unit 12, the input field is specified as the field of the search word, and in other cases, the field of the search word and the field of the search word is specified. The field of the search term is specified by referring to a database (not shown) storing the correspondence relationship.
[0057]
The evaluation expression position specifying unit 133a selects the evaluation expression used in the field of the search word from the evaluation expression storage unit 131a using the field of the search word output by the search word field specifying unit 136 (S132). Then, the evaluation expression position specifying unit 133a specifies a position where the selected evaluation expression appears in each document, and outputs evaluation expression appearance position information regarding the evaluation expression to the inter-expression distance determination unit 134 (S133). Thereafter, the inter-expression distance determining unit 134 and the reputation information extracting unit 135 perform the same operations as those described in the first embodiment (S34 to S37).
[0058]
In the operation of the present embodiment, S31 → S131 → S32 → S132 → S133 → S34 → S35 → S36 → S37, S31 → S131 → S132 → S32 → S133 → S34 → S35 → S36 other than those described above. The same processing can be performed in the order of S37, S31, S131, S132, S133, S32, S34, S35, S36, and S37.
[0059]
In the present embodiment, for example, when the field of the search term is “book”, when the evaluation expression position specifying unit 133a specifies the position of the evaluation expression, the evaluation expression stored in the evaluation expression storage unit 131a Therefore, the position of the evaluation expression can be specified by excluding the evaluation expression that is not used in the reputation regarding the “book” such as the evaluation expression “delicious”. For this reason, it is possible to improve reputation information discrimination accuracy and increase discrimination speed.
[0060]
[Score Determination Method]
Next, an example of a method for determining a score stored in the score storage unit 163 shown in FIG. 4 and an example of the apparatus will be described.
[0061]
Referring to FIG. 14, the score determination device includes a score determination document input unit 141, a score determination search word input unit 142, a score determination reputation information determination unit 143, a score determination determination result storage unit 144, The score determination reputation information storage unit 145, the score determination means 146, an input device 147 such as a keyboard, and a display device 148 such as an LCD are included.
[0062]
The score determination document input unit 141 and the score determination search word input unit 142 have the same configuration and function as the document input unit 11 and the search word input unit 12.
[0063]
The score determination reputation information determination unit 143 has the same configuration and function as the reputation information determination unit 13 described in the first embodiment or the reputation information determination unit 13a described in the second embodiment. Yes.
[0064]
The score determination means 146 has a function of displaying the reputation information stored in the score determination reputation information storage unit 145 on the display device 147 and presenting it to the user, and the user who sees this display uses the input device 148. The score to be stored in the score storage unit 163 shown in FIG.
[0065]
Referring to FIG. 15, the score determination unit 146 includes a score determination rule storage unit 201, a score determination rule matching unit 202, a frequency-added score storage unit 203, a frequency-added score search unit 204, and a score calculation unit 205. Display control means 206 and score input means 207.
[0066]
The score determination rule storage unit 201 stores the same contents as the rule storage unit 161 described in the first embodiment.
[0067]
The score determination rule matching unit 202 has the same configuration and function as the rule matching unit 162 described in the first embodiment.
[0068]
The display control means 206 has a function of displaying the reputation information stored in the score determination reputation information storage unit 145 on the display device 147.
[0069]
The score input unit 207 has a function of receiving a score (score indicating reputation information-likeness) input by a user who has viewed the reputation information displayed on the display device 147 while viewing the input device 148.
[0070]
In addition to the information stored in the score storage unit 163 according to the first embodiment, the frequency-added score storage unit 203 includes the sum of scores input from the user and the total number of input scores. Is stored. The score stored here is an average value of scores obtained by dividing the total sum of scores by the total number of input scores.
[0071]
The score-with-frequency search means 204 outputs a value indicating whether or not the reputation information output from the score determination rule matching means 202 satisfies each rule stored in the score determination rule storage unit 201 as a component. It has a function of searching the frequency-added score storage unit 203 using the sequence to be performed as a key, and searching for the total score and the total number of score inputs for the reputation information.
[0072]
The score calculation means 205 adds the user's score for the reputation information input from the score input means 207 to the sum of the scores searched by the frequency score search means 204 and adds 1 to the total number of score inputs. After that, the sum of the updated score and the total number of input times of the score are stored in the corresponding part of the scored score storage unit 203 (the part searched by the frequencyd score search unit 204), and the total score is calculated as the total score. It has a function to store the average value divided by the number of inputs.
[0073]
[Description of operation]
Next, the operation of the score determination device shown in FIG. 14 will be described in detail.
[0074]
First, the score determination reputation information determination unit 143 stores the paired appearance position information of the search word / evaluation expression pair in the score determination determination result storage unit 144 and stores the reputation information in the score determination reputation information storage unit 145. To do. By this processing, it is assumed that the pair appearance position information shown in FIG. 17 is stored in the score determination discrimination result storage unit 144 and the reputation information shown in FIG. 18 is stored in the score determination reputation information storage unit 145. In addition, the correspondence of FIG. 17, FIG. 18 is shown by reputation ID.
[0075]
When the reputation information is stored in the score determination reputation information storage unit 145, the display control unit 206 displays each piece of reputation information stored in the score determination reputation information storage unit 145 as shown in FIG. And a score input field are displayed (S161 in FIG. 16).
[0076]
The user who sees this display inputs a score of reputation information likelihood for each piece of reputation information using the score input field (S162). Now, for example, assume that the user inputs the score shown in FIG. 20 for each piece of reputation information. The correspondence between FIG. 20 and FIGS. 17 and 18 is indicated by a reputation ID.
[0077]
Next, the score determination rule matching unit 202 selects one of the reputation information for which the score has been input from the score input unit 207 (S163), and the score determination rule storage unit 201 stores this reputation information. Each rule that is a criterion for determining the priority of stored reputation information is collated, and a value indicating whether or not each rule is satisfied is output (S164). It is assumed that the score determination rule storage unit 201 stores the same rules as the 12 rules shown in FIG.
[0078]
Next, the frequency-added score search unit 204 uses the value of each rule output from the score determination rule collating unit 202 as a constituent element as a key, and the sum of the scores and the total score from the frequency-based score storage unit 203. The number of times of input is searched (S165).
[0079]
Next, the score calculation unit 205 adds the user's score for the reputation information input from the score input unit 207 to the sum of the scores output from the frequency-equipped score search unit 204, and adds 1 to the total number of input scores. Then, an average value obtained by dividing the total score by the total number of input scores is calculated (S166). Further, they are stored in the corresponding part of the scored score storage unit 203 (the part where the scored score search means 204 searches the total number of scores and the total number of inputs in S165) (S167).
[0080]
Finally, if there is an unprocessed input, the process returns to S163 (S168). With the above processing, the content of the scored score storage unit 203 is as shown in FIG. By performing the above processing on a large number of pieces of reputation information, the score for each array stored in the score storage unit 163 shown in FIG. 4 can be determined.
[0081]
The execution order of S161 to S168 shown in FIG. 16 is not limited to this, and the process of S164 may be performed first as shown in FIG. Further, S164 may be between S161 and S162, or between S162 and S163.
[0082]
As described above, according to the present embodiment, when the priority is determined using the score input from the user for each piece of reputation information extracted by the score determination reputation information determination unit 143. Since the score to be used is determined, it is possible to assign a more accurate priority when assigning a priority to reputation information.
[0083]
【The invention's effect】
The first effect of the present invention is that, by performing automatic determination of the priority order of reputation information in addition to automatic determination of the appearance position of reputation information, it can be presented to the user in order from what seems to be reputation information. The reason is that reputation information determination means for extracting reputation information related to a search term included in the input document, and reputation information priority determination that prioritizes each reputation information extracted by the determination information determination means in the order of reputation information likelihood. This is because it has means.
[0084]
The second effect of the present invention is that reputation information extraction accuracy and extraction processing speed are improved. The reason is that a field in which the search term is used is specified, and reputation information is extracted by excluding evaluation expressions that are not used in the field.
[0085]
The third effect of the present invention is that it becomes possible to assign priorities more accurately when assigning priorities to reputation information. The reason is that the score used when determining the priority order is determined using the score input from the user for each piece of reputation information.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example of a first exemplary embodiment of the present invention.
FIG. 2 is a block diagram illustrating a configuration example of reputation information determination means 13;
FIG. 3 is a flowchart showing a processing example of reputation information determination means 13;
FIG. 4 is a block diagram showing a configuration example of reputation information priority determination means 16;
FIG. 5 is a flowchart showing a processing example of reputation information priority determination means 16;
6 is a diagram illustrating an example of contents of a rule storage unit 161. FIG.
FIG. 7 is a diagram illustrating an example of contents of a score storage unit 163;
FIG. 8 is a diagram illustrating an example of contents of a discrimination result storage unit 14;
FIG. 9 is a diagram illustrating an example of contents of a reputation information storage unit 15;
FIG. 10 is a diagram illustrating an example of an array and scores of each piece of reputation information.
FIG. 11 is a diagram illustrating an example of the priority order of each piece of reputation information.
FIG. 12 is a block diagram showing a configuration example of reputation information determination means 13a used in the second embodiment of the present invention.
FIG. 13 is a flowchart showing a processing example of reputation information determination means 13a.
FIG. 14 is a block diagram illustrating a configuration example of a score determination device.
15 is a block diagram showing a configuration example of score determination means 146. FIG.
FIG. 16 is a flowchart illustrating a processing example of the score determination device.
FIG. 17 is a diagram illustrating an example of contents of a score determination determination result storage unit 144;
FIG. 18 is a diagram illustrating an example of the contents of a score determination reputation information storage unit 145;
19 is a diagram showing a display example of reputation information and input fields by the display control means 206. FIG.
FIG. 20 is a diagram illustrating an example of a score input by a user.
FIG. 21 is a diagram showing the final contents of a scored storage unit with frequency 203;
FIG. 22 is a flowchart showing another process example of the score determination device.
[Explanation of symbols]
1 Information retrieval device
11 ... Document input means
12 ... Search term input means
13 ... Reputation information discrimination means
131 ... Evaluation expression storage unit
132: Search word position specifying means
133 ... Evaluation expression position specifying means
134: Inter-expression distance determination means
135 ... Reputation information extraction means
14: Discrimination result storage unit
15 ... Reputation information storage
16 ... Reputation information priority determination means
161: Rule storage unit
162 ... Rule matching means
163 ... Score storage unit
164 ... Score search means
165 ... Aligning means
166 ... Presentation means
17 ... Priority storage unit
2 ... Input device
3. Display device
K1 ... Recording medium
13a ... Reputation information discrimination means
131a ... Evaluation expression storage unit
133a ... Evaluation expression position specifying means
136 ... Search term field specifying means
141... Document input means for score determination
142 ... Search term input means for score determination
143 ... Reputation information discrimination means for score determination
144... Score determination determination result storage unit
145 ... Reputation information storage unit for score determination
146 ... Score determining means
147 ... Display device
148 ... Input device
201: Score determination rule storage unit
202... Score matching rule checking means
203 ... Score storage unit with frequency
204... Score search means with frequency
205: Score calculation means
206: Display control means
207 ... Score input means

Claims (18)

入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出する評判情報判別手段と、
該評判情報判別手段で抽出された各評判情報それぞれについて、その評判情報が、評判情報中の検索語と評価表現との位置関係に関するルール群、評判情報中の検索語の位置に関するルール群、或いは評判情報中の評価表現の位置に関するルール群の内の少なくとも1つを含むルール群中のどのルールを満たしているかを調べ、満たしているルールの組み合わせに基づいて、前記各評判情報に対して検索語に関する評判情報である確率が高い順に優先順位を付ける評判情報優先度判定手段と、
を備えたことを特徴とする情報検索装置。
Reputation information discrimination that extracts reputation information about the designated search term existing in the input document based on the appearance position of the search term in the document and the appearance position of the evaluation expression that determines the value for things Means,
For each piece of reputation information extracted by the reputation information discriminating means , the reputation information is a rule group relating to the positional relationship between the search word in the reputation information and the evaluation expression, a rule group relating to the position of the search word in the reputation information, or Check which rule in the rule group including at least one of the rule groups regarding the position of the evaluation expression in the reputation information is satisfied, and search for each of the reputation information based on the combination of the satisfied rules Reputation information priority determination means for assigning priorities in descending order of probability of being reputation information about words ;
An information retrieval apparatus comprising:
請求項1記載の情報検索装置において、
前記評判情報判別手段が、
前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定手段と、
評価表現が複数格納された評価表現記憶部と、
前記文書において前記評価表現記憶部に格納されている評価表現が出現する評価表現出現位置を特定する評価表現位置特定手段と、
前記検索語位置特定手段が特定した検索語出現位置と前記評価表現位置特定手段が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定手段と、
該表現間距離判定手段で求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出手段と、
を備えたことを特徴とする情報検索装置。
The information search device according to claim 1,
The reputation information determination means is
Search word position specifying means for specifying a search word appearance position where the search word appears in the document;
An evaluation expression storage unit storing a plurality of evaluation expressions;
Evaluation expression position specifying means for specifying an evaluation expression appearance position at which an evaluation expression stored in the evaluation expression storage unit appears in the document;
Based on the search word appearance position specified by the search word position specifying means and the evaluation expression appearance position specified by the evaluation expression position specifying means, a pair of a search word and an evaluation expression within a certain distance from each other is determined. An inter-expression distance determination means to be obtained;
Reputation information extracting means for extracting reputation information including at least a portion sandwiched between a search word and an evaluation expression constituting a pair obtained by the inter-expression distance determining means;
An information retrieval apparatus comprising:
請求項1記載の情報検索装置において、
前記評判情報判別手段が、
前記検索語が使用される分野を特定する検索語分野特定手段と、
前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定手段と、
複数の評価表現と該各評価表現の使用分野を示す分野情報とが格納された評価表現記憶部と、
前記文書において前記評価表現記憶部に格納されている評価表現の内の、前記検索語分野特定手段で特定された分野で使用される評価表現が出現する評価表現出現位置を特定する評価表現位置特定手段と、
前記検索語位置特定手段が特定した検索語出現位置と前記評価表現位置特定手段が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定手段と、
該表現間距離判定手段で求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出手段と、
を備えたことを特徴とする情報検索装置。
The information search device according to claim 1,
The reputation information determination means is
A search term field specifying means for specifying a field in which the search term is used;
Search word position specifying means for specifying a search word appearance position where the search word appears in the document;
An evaluation expression storage unit storing a plurality of evaluation expressions and field information indicating a field of use of each evaluation expression;
The evaluation expression position specification for specifying the evaluation expression appearance position where the evaluation expression used in the field specified by the search word field specifying means among the evaluation expressions stored in the evaluation expression storage unit in the document appears. Means,
Based on the search word appearance position specified by the search word position specifying means and the evaluation expression appearance position specified by the evaluation expression position specifying means, a pair of a search word and an evaluation expression within a certain distance from each other is determined. An inter-expression distance determination means to be obtained;
Reputation information extracting means for extracting reputation information including at least a portion sandwiched between a search word and an evaluation expression constituting a pair obtained by the inter-expression distance determining means;
An information retrieval apparatus comprising:
請求項1,2または3記載の情報検索装置において、
前記評判情報優先度判定手段が、
前記評判情報判別手段で抽出された各評判情報の優先順位を決定するために使用する複数のルールからなるルール群であって、評判情報中の検索語と評価表現との位置関係に関するルール、評判情報中の検索語の位置に関するルール、或いは評判情報中の評価表現の位置に関するルールの内の少なくとも1つを含むルール群が格納されたルール記憶部と、
前記評判情報判別手段で抽出された評判情報と、前記ルール記憶部に格納されている複数のルールとをそれぞれ照合し、前記各ルールそれぞれについて前記評判情報がそのルールを満足するか否かを示す値を出力するルール照合手段と、
該ルール照合手段から出力される可能性がある、前記各ルールに対するルールを満足するか否かを示す値の組み合わせ毎に、スコアが格納されたスコア記憶部と、
前記ルール照合手段から出力されたルールを満足するか否かを示す値の組み合わせに対応するスコアを、前記スコア記憶部から検索するスコア検索手段と、
前記評判情報判別手段で抽出した各評判情報に対して、前記スコア検索手段で検索した前記各評判情報のスコアに基づいて優先順位を付す整列手段と、
を備えたことを特徴とする情報検索装置。
In the information search device according to claim 1, 2, or 3,
The reputation information priority determination means includes
A rule group comprising a plurality of rules used for determining the priority of each piece of reputation information extracted by the reputation information discrimination means, the rule relating to the positional relationship between a search word in reputation information and an evaluation expression, reputation A rule storage unit storing a rule group including at least one of a rule relating to a position of a search term in information or a rule relating to a position of an evaluation expression in reputation information;
Reputation information extracted by the reputation information determination means is compared with a plurality of rules stored in the rule storage unit, and each of the rules indicates whether or not the reputation information satisfies the rule. Rule matching means for outputting a value;
A score storage unit storing a score for each combination of values indicating whether or not the rule for each rule may be output, which may be output from the rule matching unit;
Score search means for searching a score corresponding to a combination of values indicating whether or not the rule output from the rule matching means is satisfied, from the score storage unit;
Alignment means for assigning priorities to each reputation information extracted by the reputation information determination means based on the scores of the reputation information searched by the score search means;
An information retrieval apparatus comprising:
請求項4記載の情報検索装置において、
前記スコア記憶部には、前記ルール照合手段から出力される可能性がある値の組み合わせが各々配列の形式で格納され、且つ前記各配列に対応付けてスコアが格納されていることを特徴とする情報検索装置。
The information search device according to claim 4, wherein
A combination of values that may be output from the rule matching unit is stored in the form of an array in the score storage unit, and a score is stored in association with each array. Information retrieval device.
請求項4記載の情報検索装置におけるスコア記憶部に格納するスコアを決定するスコア決定装置であって、
入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出するスコア決定用評判情報判別手段と、
該スコア決定用評判情報判別手段で抽出した各評判情報を表示装置に表示して利用者に提示し、前記利用者が入力装置を用いて入力した前記各評判情報に対するスコアに基づいて、前記スコア記憶部に格納するスコアを決定するスコア決定手段とを備えたことを特徴とするスコア決定装置。
A score determination device for determining a score to be stored in a score storage unit in the information search device according to claim 4,
For score determination that extracts reputation information about the specified search term existing in the input document based on the appearance position of the search term in the document and the appearance position of the evaluation expression that determines the value for things Reputation information discrimination means,
Each score information extracted by the score determination reputation information discrimination means is displayed on a display device and presented to the user, and the score is based on the score for each reputation information input by the user using the input device. A score determination device comprising score determination means for determining a score to be stored in a storage unit.
請求項6記載のスコア決定装置において、
前記スコア決定手段が、
前記スコア決定用評判情報判別手段が抽出した各評判情報を前記表示装置に表示する表示制御手段と、
前記入力装置から前記利用者が入力した前記表示装置に表示された各評判情報それぞれに対するスコアを取り込むスコア入力手段と、
前記スコア決定用評判情報判別手段で抽出された各評判情報の優先順位を決定するために使用する複数のルールからなるルール群であって、評判情報中の検索語と評価表現との位置関係に関するルール、評判情報中の検索語の位置に関するルール、或いは評判情報中の評価表現の位置に関するルールの内の少なくとも1つを含むルール群が格納されたスコア決定用ルール記憶部と、
前記スコア決定用評判情報判別手段で抽出された評判情報と、前記スコア決定用ルール記憶部に格納されている複数のルールとをそれぞれ照合し、前記各ルールそれぞれについて前記評判情報がそのルールを満足するか否かを示す値を出力するスコア決定用ルール照合手段と、
該スコア決定用ルール照合手段から出力される可能性がある、前記各ルールに対するルールを満足するか否かを示す値の組み合わせ毎に、スコアの総和とスコアの総入力回数とが格納される頻度付きスコア記憶部と、
前記スコア決定用ルール照合手段から出力されたルールを満足させるか否かを示す値の組み合わせに対応するスコアの総和とスコアの総入力回数とを、前記頻度付きスコア記憶部から検索する頻度付きスコア検索手段と、
該頻度付きスコア検索手段で検索されたスコアの総和に前記スコア入力手段で受け付けたスコアを加算すると共に前記頻度付きスコア検索手段で検索されたスコアの総入力回数に1を加算した後、更新後のスコアの総和を更新後のスコアの総入力回数で割ることによりスコアを求め、更に前記検索されたスコアの総和及びスコアの総入力回数を更新後のスコアの総和及び更新後のスコアの総入力回数で置き換えるスコア算出手段と、
を備えたことを特徴とするスコア決定装置。
The score determination device according to claim 6,
The score determination means is
Display control means for displaying each piece of reputation information extracted by the score determination reputation information determination means on the display device;
Score input means for capturing a score for each piece of reputation information displayed on the display device input by the user from the input device;
A rule group consisting of a plurality of rules used for determining the priority of each piece of reputation information extracted by the score determination reputation information discriminating means, which relates to the positional relationship between a search word in reputation information and an evaluation expression A rule determination score storage unit storing a rule group including at least one of a rule, a rule related to a position of a search term in reputation information, or a rule related to a position of an evaluation expression in reputation information;
The reputation information extracted by the score-determining reputation information determining means is collated with a plurality of rules stored in the score-determining rule storage unit, and the reputation information satisfies each rule for each rule. A rule determining means for score determination that outputs a value indicating whether or not to perform,
The frequency at which the sum of scores and the total number of input scores are stored for each combination of values indicating whether the rules for each rule may be output, which may be output from the score determination rule matching means With a score storage unit,
A score with frequency for searching the sum total of scores corresponding to a combination of values indicating whether or not the rule output from the score determination rule matching means is satisfied and the total number of input times of the score from the score storage unit with frequency Search means;
After adding the score received by the score input means to the total score searched by the frequency score search means, adding 1 to the total number of scores input searched by the frequency score search means, and then updating The score is obtained by dividing the total sum of the scores by the total number of times the updated score is entered, and the sum of the retrieved scores and the total number of times the score is entered are further updated. Score calculation means to replace with the number of times;
A score determination device comprising:
コンピュータを用いて情報を検索する方法において、
前記コンピュータが、入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出する評判情報判別ステップと、
前記コンピュータが、前記評判情報判別ステップで抽出された各評判情報それぞれについて、その評判情報が、評判情報中の検索語と評価表現との位置関係に関するルール群、評判情報中の検索語の位置に関するルール群、或いは評判情報中の評価表現の位置に関するルール群の内の少なくとも1つを含むルール群中のどのルールを満たしているかを調べ、満たしているルールの組み合わせに基づいて、前記各評判情報に対して検索語に関する評判情報である確率が高い順に優先順位を付ける評判情報優先度判定ステップと、
を含むことを特徴とする情報検索方法。
In a method for retrieving information using a computer,
The computer extracts reputation information related to the indicated search word existing in the input document based on the appearance position of the search word in the document and the appearance position of the evaluation expression that determines the value for things. A reputation information determination step,
For each piece of reputation information extracted by the computer in the reputation information determination step , the reputation information is related to a group of rules relating to the positional relationship between the search word in the reputation information and the evaluation expression, and the position of the search word in the reputation information. The rule group or the rule group including at least one of the rule groups relating to the position of the evaluation expression in the reputation information is examined to determine which rule is satisfied, and based on the combination of the satisfied rules, each of the reputation information Reputation information priority determination step that prioritizes in descending order of the probability of being reputation information related to the search term ,
An information search method characterized by including:
請求項8記載の情報検索方法において、
前記評判情報判別ステップが、
前記コンピュータが、前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定ステップと、
前記コンピュータが、前記文書において評価表現が出現する評価表現出現位置を特定する評価表現位置特定ステップと、
前記コンピュータが、前記検索語位置特定ステップが特定した検索語出現位置と前記評価表現位置特定ステップが特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定ステップと、
前記コンピュータが、前記表現間距離判定ステップで求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出ステップと、
を含むことを特徴とする情報検索方法。
The information search method according to claim 8, wherein
The reputation information determination step includes:
A search word position specifying step for specifying a search word appearance position at which the computer appears in the document;
The computer, the evaluation expression position specifying step of specifying an evaluation expressions occurrence position evaluation expression appears in the document,
Based on the search word appearance position specified by the search word position specifying step and the evaluation expression appearance position specified by the evaluation expression position specifying step, the computer searches for the search word and the evaluation expression within a certain distance from each other. An inter-expression distance determination step for obtaining a pair with
The computer, the reputation information extraction step of extracting at least including reputation information portion sandwiched by the evaluation expression and the search word constituting the pair obtained by the expression distance determination step from the document,
An information search method characterized by including:
請求項8記載の情報検索方法において、
前記評判情報判別ステップが、
前記コンピュータが、前記検索語が使用される分野を特定する検索語分野特定ステップと、
前記コンピュータが、前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定ステップと、
前記コンピュータが、複数の評価表現と該各評価表現の使用分野を示す分野情報とが格納された評価表現記憶部に格納されている評価表現の内の、前記検索語分野特定ステップで特定された分野で使用される評価表現が前記文書において出現する評価表現出現位置を特定する評価表現位置特定ステップと、
前記コンピュータが、前記検索語位置特定ステップが特定した検索語出現位置と前記評価表現位置特定ステップが特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定ステップと、
前記コンピュータが、前記表現間距離判定ステップで求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出ステップと、
を含むことを特徴とする情報検索方法。
The information search method according to claim 8, wherein
The reputation information determination step includes:
A search term field specifying step in which the computer specifies a field in which the search term is used;
A search word position specifying step for specifying a search word appearance position at which the computer appears in the document;
The computer is specified in the search word field specifying step among the evaluation expressions stored in the evaluation expression storage unit storing a plurality of evaluation expressions and field information indicating the field of use of each evaluation expression. An evaluation expression position specifying step for specifying an evaluation expression appearance position at which an evaluation expression used in the field appears in the document;
Based on the search word appearance position specified by the search word position specifying step and the evaluation expression appearance position specified by the evaluation expression position specifying step, the computer searches for the search word and the evaluation expression within a certain distance from each other. An inter-expression distance determination step for obtaining a pair with
The computer, the reputation information extraction step of extracting at least including reputation information portion sandwiched by the evaluation expression and the search word constituting the pair obtained by the expression distance determination step from the document,
An information search method characterized by including:
請求項8,9または10記載の情報検索方法において、
前記評判情報優先度判定ステップが、
前記コンピュータが、前記評判情報判別ステップで抽出された評判情報と、前記評判情報判別ステップで抽出された各評判情報の優先順位を決定するために使用する複数のルールからなるルール群であって、評判情報中の検索語と評価表現との位置関係に関するルール、評判情報中の検索語の位置に関するルール、或いは評判情報中の評価表現の位置に関するルールの内の少なくとも1つを含むルール群が格納されたルール記憶部中の各ルールとをそれぞれ照合し、前記各ルールそれぞれについて前記評判情報がそのルールを満足するか否かを示す値を出力するルール照合ステップと、
前記コンピュータが、前記ルール照合ステップから出力される可能性がある、前記各ルールに対するルールを満足するか否かを示す値の組み合わせ毎に、スコアが格納されたスコア記憶部から、前記ルール照合ステップから出力されたルールを満足するか否かを示す値の組み合わせに対応するスコアを検索するスコア検索ステップと、
前記コンピュータが、前記評判情報判別ステップで抽出した各評判情報に対して、前記スコア検索ステップで検索した前記各評判情報のスコアに基づいて優先順位を付す整列ステップと、
を含むことを特徴とする情報検索方法。
The information search method according to claim 8, 9 or 10,
The reputation information priority determination step includes:
The computer is a rule group consisting of a plurality of rules used to determine the priority of the reputation information extracted in the reputation information determination step and each reputation information extracted in the reputation information determination step, A rule group including at least one of a rule relating to the positional relationship between a search word in reputation information and an evaluation expression, a rule relating to the position of a search word in reputation information, or a rule relating to the position of an evaluation expression in reputation information is stored. A rule matching step for collating each rule in the rule storage unit and outputting a value indicating whether or not the reputation information satisfies the rule for each of the rules;
For each combination of values indicating whether the computer satisfies a rule for each rule that may be output from the rule matching step, a score is stored in the rule matching step. A score search step of searching for a score corresponding to a combination of values indicating whether or not the rule output from is satisfied,
An alignment step in which the computer assigns a priority to each piece of reputation information extracted in the reputation information determination step based on the score of each piece of reputation information searched in the score search step;
An information search method characterized by including:
請求項11記載の情報検索方法において、
前記スコア記憶部には、前記ルール照合ステップから出力される可能性がある値の組み合わせが各々配列の形式で格納され、且つ前記各配列に対応付けてスコアが格納されていることを特徴とする情報検索方法。
The information search method according to claim 11, wherein
A combination of values that may be output from the rule matching step is stored in the form of an array in the score storage unit, and a score is stored in association with each array. Information retrieval method.
コンピュータを用いて請求項11記載の情報検索方法におけるスコア記憶部に格納するスコアを決定するスコア決定方法であって、
前記コンピュータが、入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出するスコア決定用評判情報判別ステップと、
前記コンピュータが、前記スコア決定用評判情報判別ステップで抽出した各評判情報を表示装置に表示して利用者に提示し、前記利用者が入力装置を用いて入力した前記各評判情報に対するスコアに基づいて、前記スコア記憶部に格納するスコアを決定するスコア決定ステップと、
を含むことを特徴とするスコア決定方法。
A score determination method for determining a score to be stored in a score storage unit in the information search method according to claim 11 using a computer ,
The computer extracts reputation information related to the indicated search word existing in the input document based on the appearance position of the search word in the document and the appearance position of the evaluation expression that determines the value for things. Reputation information determination step for determining a score,
The computer displays each reputation information extracted in the score determination reputation information determination step on a display device and presents it to the user, and based on the score for each reputation information input by the user using the input device A score determining step for determining a score to be stored in the score storage unit;
The score determination method characterized by including.
請求項13記載のスコア決定方法において、
前記スコア決定ステップが、
前記コンピュータが、前記スコア決定用評判情報判別ステップが抽出した各評判情報を前記表示装置に表示する表示制御ステップと、
前記コンピュータが、前記入力装置から前記利用者が入力した前記表示装置に表示された各評判情報それぞれに対するスコアを取り込むスコア入力ステップと、
前記コンピュータが、前記スコア決定用評判情報判別ステップで抽出された評判情報と、前記スコア決定用評判情報判別ステップで抽出された各評判情報の優先順位を決定するために使用する複数のルールからなるルール群であって、評判情報中の検索語と評価表現との位置関係に関するルール、評判情報中の検索語の位置に関するルール、或いは評判情報中の評価表現の位置に関するルールの内の少なくとも1つを含むルール群が格納されたスコア決定用ルール記憶部中の各ルールとをそれぞれ照合し、前記各ルールそれぞれについて前記評判情報がそのルールを満足するか否かを示す値を出力するスコア決定用ルール照合ステップと、
前記コンピュータが、前記スコア決定用ルール照合ステップから出力されたルールを満足するか否かを示す値の組み合わせに対応するスコアの総和とスコアの総入力回数とを、前記スコア決定用ルール照合ステップから出力される可能性がある、前記各ルールに対するルールを満足するか否かを示す値の組み合わせ毎に、スコアの総和とスコアの総入力回数とが格納される頻度付きスコア記憶部から検索する頻度付きスコア検索ステップと、
前記コンピュータが、前記頻度付きスコア検索ステップで検索されたスコアの総和に前記スコア入力ステップで受け付けたスコアを加算すると共に前記頻度付きスコア検索ステップで検索されたスコアの総入力回数に1を加算した後、更新後のスコアの総和を更新後のスコアの総入力回数で割ることによりスコアを求め、更に前記検索されたスコアの総和及びスコアの総入力回数を更新後のスコアの総和及び更新後のスコアの総入力回数で置き換えるスコア算出ステップと、
を含むことを特徴とするスコア決定方法。
The score determination method according to claim 13,
The score determination step includes:
The computer, and a display control step of displaying each reputation information the reputation information determination step for the scoring is extracted on the display device,
A score input step in which the computer captures a score for each piece of reputation information displayed on the display device input by the user from the input device;
The computer comprises reputation information extracted in the score determination reputation information determination step and a plurality of rules used for determining the priority of each reputation information extracted in the score determination reputation information determination step. A rule group, at least one of a rule relating to a positional relationship between a search word in reputation information and an evaluation expression, a rule relating to a position of a search word in reputation information, and a rule relating to the position of an evaluation expression in reputation information Each of the rules in the score determination rule storage unit storing a group of rules including the rule group, and for each of the rules, a value indicating whether the reputation information satisfies the rule is output. A rule matching step;
From the score determination rule matching step , the computer calculates a sum of scores corresponding to a combination of values indicating whether or not the rule output from the score determination rule verification step is satisfied and the total number of input times of the score. The frequency of searching from the score storage unit with a frequency in which the sum of the scores and the total number of input times of the scores are stored for each combination of values indicating whether or not the rules for each rule may be output. With a score search step,
The computer adds the score received in the score input step to the total score searched in the frequency-based score search step, and adds 1 to the total number of input scores searched in the frequency-based score search step Thereafter, the score is obtained by dividing the sum of the updated scores by the total number of times the updated score is input, and further, the sum of the retrieved scores and the total number of times the score is input A score calculation step to replace with the total number of score inputs,
The score determination method characterized by including.
コンピュータを、
入力された文書中に存在する、指示された検索語に関する評判情報を、前記文書中における前記検索語の出現位置と、物事に対する価値を定める評価表現の出現位置とに基づいて抽出する評判情報判別手段、
該評判情報判別手段で抽出された各評判情報それぞれについて、その評判情報が、評判情報中の検索語と評価表現との位置関係に関するルール群、評判情報中の検索語の位置に 関するルール群、或いは評判情報中の評価表現の位置に関するルール群の内の少なくとも1つを含むルール群中のどのルールを満たしているかを調べ、満たしているルールの組み合わせに基づいて、前記各評判情報に対して検索語に関する評判情報である確率が高い順に優先順位を付ける評判情報優先度判定手段、
として機能させるためのプログラムを記録したことを特徴とするプログラム記録媒体。
Computer
Reputation information discrimination that extracts reputation information about the designated search term existing in the input document based on the appearance position of the search term in the document and the appearance position of the evaluation expression that determines the value for things means,
For each of reputation information extracted by the evaluation information determination unit, the reputation information, rule group on the position relationship between the search words and evaluation expressions in reputation information, rule group about the search word position in the reputation information, Alternatively, it is examined which rule in the rule group including at least one of the rule groups regarding the position of the evaluation expression in the reputation information is satisfied, and for each of the reputation information based on the combination of the satisfied rules Reputation information priority determination means for assigning priorities in descending order of the probability of reputation information relating to search terms,
A program recording medium in which a program for functioning as a program is recorded.
前記評判情報判別手段を、
前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定手段、
前記文書において評価表現が出現する評価表現出現位置を特定する評価表現位置特定手段、
前記検索語位置特定手段が特定した検索語出現位置と前記評価表現位置特定手段が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定手段、
該表現間距離判定手段で求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出手段、
として機能させるためのプログラムを記録したことを特徴とする請求項15記載のプログラム記録媒体。
The reputation information determination means,
Search word position specifying means for specifying a search word appearance position where the search word appears in the document;
Evaluation expression position specifying means for specifying an evaluation expression appearance position where the evaluation expression appears in the document;
Based on the search word appearance position specified by the search word position specifying means and the evaluation expression appearance position specified by the evaluation expression position specifying means, a pair of a search word and an evaluation expression within a certain distance from each other is determined. Means for determining the distance between expressions to be obtained;
Reputation information extracting means for extracting reputation information including at least a portion sandwiched between a search word and an evaluation expression constituting a pair obtained by the inter-expression distance determining means from the document;
16. The program recording medium according to claim 15, wherein a program for causing the program to function as a program is recorded.
前記評判情報判別手段を、
前記検索語が使用される分野を特定する検索語分野特定手段、
前記文書において前記検索語が出現する検索語出現位置を特定する検索語位置特定手段、
複数の評価表現と該各評価表現の使用分野を示す分野情報とが格納された評価表現記憶部に格納されている評価表現の内の、前記検索語分野特定手段で特定された分野で使用される評価表現が前記文書において出現する評価表現出現位置を特定する評価表現位置特定手段、
前記検索語位置特定手段が特定した検索語出現位置と前記評価表現位置特定手段が特定した評価表現出現位置とに基づいて、互いの距離が一定の範囲内の検索語と評価表現との対を求める表現間距離判定手段、
該表現間距離判定手段で求められた対を構成する検索語と評価表現とによって挟まれる部分を少なくとも含む評判情報を前記文書から抽出する評判情報抽出手段、
として機能させるためのプログラムを記録したことを特徴とする請求項15記載のプログラム記録媒体。
The reputation information determination means,
Search term field specifying means for specifying a field in which the search term is used;
Search word position specifying means for specifying a search word appearance position where the search word appears in the document;
Among the evaluation expressions stored in the evaluation expression storage unit in which a plurality of evaluation expressions and field information indicating the field of use of each evaluation expression are stored, it is used in the field specified by the search word field specifying means. Evaluation expression position specifying means for specifying an evaluation expression appearance position where the evaluation expression appears in the document;
Based on the search word appearance position specified by the search word position specifying means and the evaluation expression appearance position specified by the evaluation expression position specifying means, a pair of a search word and an evaluation expression within a certain distance from each other is determined. Means for determining the distance between expressions to be obtained;
Reputation information extracting means for extracting reputation information including at least a portion sandwiched between a search word and an evaluation expression constituting a pair obtained by the inter-expression distance determining means from the document;
16. The program recording medium according to claim 15, wherein a program for causing the program to function as a program is recorded.
前記評判情報優先度判定手段を、
前記評判情報判別手段で抽出された評判情報と、前記評判情報判別手段で抽出された各評判情報の優先順位を決定するために使用する複数のルールからなるルール群であって、評判情報中の検索語と評価表現との位置関係に関するルール、評判情報中の検索語の位置に関するルール、或いは評判情報中の評価表現の位置に関するルールの内の少なくとも1つを含むルール群が格納されたルール記憶部中の各ルールとをそれぞれ照合し、前記各ルールについて前記評判情報がそのルールを満足するか否かを示す値を出力するルール照合手段、
該ルール照合手段から出力される可能性がある、前記各ルールに対するルールを満足するか否かを示す値の組み合わせ毎に、スコアが格納されたスコア記憶部から、前記ルール照合手段から出力されたルールを満足するか否かを示す値の組み合わせに対応するスコアを検索するスコア検索手段、
前記評判情報判別手段で抽出した各評判情報に対して、前記スコア検索手段で検索した前記各評判情報のスコアに基づいて優先順位を付す整列手段、
として機能させるためのプログラムを記録したことを特徴とする請求項15,16または17記載のプログラム記録媒体。
The reputation information priority determination means,
A rule group consisting of a plurality of rules used to determine the priority of the reputation information extracted by the reputation information determination means and each reputation information extracted by the reputation information determination means, A rule memory storing a rule group including at least one of a rule relating to a positional relationship between a search word and an evaluation expression, a rule relating to a position of a search word in reputation information, or a rule relating to the position of an evaluation expression in reputation information Rule matching means for collating each rule in the section and outputting a value indicating whether or not the reputation information satisfies the rule for each rule,
For each combination of values indicating whether or not the rule for each rule is satisfied, which may be output from the rule matching unit, the score is stored from the score storage unit storing the score. Score search means for searching for a score corresponding to a combination of values indicating whether or not a rule is satisfied;
Alignment means for assigning priorities to each reputation information extracted by the reputation information determination means based on the scores of the reputation information searched by the score search means;
18. The program recording medium according to claim 15, 16 or 17, wherein a program for causing the program to function as is recorded.
JP2000371506A 2000-12-06 2000-12-06 Information search device, score determination device, information search method, score determination method, and program recording medium Expired - Fee Related JP3820878B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000371506A JP3820878B2 (en) 2000-12-06 2000-12-06 Information search device, score determination device, information search method, score determination method, and program recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000371506A JP3820878B2 (en) 2000-12-06 2000-12-06 Information search device, score determination device, information search method, score determination method, and program recording medium

Publications (2)

Publication Number Publication Date
JP2002175330A JP2002175330A (en) 2002-06-21
JP3820878B2 true JP3820878B2 (en) 2006-09-13

Family

ID=18841220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000371506A Expired - Fee Related JP3820878B2 (en) 2000-12-06 2000-12-06 Information search device, score determination device, information search method, score determination method, and program recording medium

Country Status (1)

Country Link
JP (1) JP3820878B2 (en)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209257A (en) * 2005-01-25 2006-08-10 Ns Solutions Corp Information processing apparatus, information processing method and program
JP4513098B2 (en) * 2005-03-10 2010-07-28 日本電信電話株式会社 Reputation information acquisition device, reputation information acquisition method, program, and storage medium
JP2006268772A (en) * 2005-03-25 2006-10-05 Konami Digital Entertainment:Kk Message character string output system, and method and program for controlling this system
JP2007219880A (en) 2006-02-17 2007-08-30 Fujitsu Ltd Reputation information processing program, method, and apparatus
JP2008009623A (en) * 2006-06-28 2008-01-17 Nippon Telegr & Teleph Corp <Ntt> Method, device and program for calculating intensity of experience, and computer readable recording medium
JP4744404B2 (en) * 2006-09-13 2011-08-10 C2cube株式会社 Evaluation output device, evaluation output method, and program
JP4912181B2 (en) * 2007-02-23 2012-04-11 日本電信電話株式会社 COMPARATIVE EVALUATION DETECTION DEVICE, COMPARATIVE EVALUATION DETECTION METHOD, COMPARATIVE EVALUATION DETECTION PROGRAM MOUNTING THE METHOD, AND RECORDING MEDIUM CONTAINING THE PROGRAM
JP5168961B2 (en) * 2007-03-19 2013-03-27 富士通株式会社 Latest reputation information notification program, recording medium, apparatus and method
JP4359787B2 (en) 2007-07-02 2009-11-04 ソニー株式会社 Information processing apparatus, content reputation search method, and content reputation search system
JP2009064070A (en) * 2007-09-04 2009-03-26 Nec Biglobe Ltd Advertisement distribution system and advertisement distribution method
WO2010003155A1 (en) * 2008-07-03 2010-01-07 Nuance Communications, Inc. Methods and systems for processing japanese text on a mobile device
US8458154B2 (en) * 2009-08-14 2013-06-04 Buzzmetrics, Ltd. Methods and apparatus to classify text communications
JP5265644B2 (en) * 2010-11-18 2013-08-14 ヤフー株式会社 Panic demand detecting device and panic demand detecting method
JP6600229B2 (en) * 2015-10-30 2019-10-30 株式会社インタラクティブソリューションズ Slide search device, slide search system, slide search method, and slide search program
JP7126168B2 (en) * 2019-10-04 2022-08-26 株式会社インタラクティブソリューションズ SLIDE SEARCH DEVICE, SLIDE SEARCH SYSTEM, SLIDE SEARCH METHOD AND SLIDE SEARCH PROGRAM
JP7154253B2 (en) * 2020-05-12 2022-10-17 ヤフー株式会社 Information processing device, information processing method and program

Also Published As

Publication number Publication date
JP2002175330A (en) 2002-06-21

Similar Documents

Publication Publication Date Title
JP3820878B2 (en) Information search device, score determination device, information search method, score determination method, and program recording medium
US8983977B2 (en) Question answering device, question answering method, and question answering program
JP4129048B2 (en) Named entity extraction apparatus, method, and program
JPH09153066A (en) Document retrieval device
US9256649B2 (en) Method and system of filtering and recommending documents
KR20190038243A (en) System and method for retrieving documents using context
JP3735335B2 (en) Example-based search method and search system for similarity judgment
WO2014050774A1 (en) Document classification assisting apparatus, method and program
JP3654850B2 (en) Information retrieval system
KR101543680B1 (en) Entity searching and opinion mining system of hybrid-based using internet and method thereof
JP5455232B2 (en) Image selection apparatus, method and program
JP4512163B2 (en) Writing style specifying device and program for causing a computer to specify writing style
JPH0484271A (en) Intra-information retrieval device
JP2000163437A (en) Method and device for classifying document and recording medium where document classifying program is recorded
JP2006251975A (en) Text sorting method and program by the method, and text sorter
US20050234975A1 (en) Related content linking managing system, method and recording medium
JP2002092004A (en) Information sorting device
JP2005010848A (en) Information retrieval device, information retrieval method, information retrieval program and recording medium
JP7427510B2 (en) Information processing device, information processing method and program
JP4134975B2 (en) Topic document presentation method, apparatus, and program
JP2008165437A (en) Explanatory sentence selection device, explanatory sentence selection method, explanatory sentence analysis device and explanatory sentence analysis method
JP6612291B2 (en) Similar document search device, similar document search method and program
JP2732661B2 (en) Text type database device
JP3772401B2 (en) Document classification device
JP2009146013A (en) Content retrieval method, its device, and program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060612

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100630

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100630

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110630

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110630

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120630

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120630

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130630

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees