JPH11338869A - 情報推薦方法及びシステム及び情報推薦プログラムを格納した記憶媒体及び情報蓄積方法及び装置及び情報蓄積プログラムを格納した記憶媒体 - Google Patents

情報推薦方法及びシステム及び情報推薦プログラムを格納した記憶媒体及び情報蓄積方法及び装置及び情報蓄積プログラムを格納した記憶媒体

Info

Publication number
JPH11338869A
JPH11338869A JP10142864A JP14286498A JPH11338869A JP H11338869 A JPH11338869 A JP H11338869A JP 10142864 A JP10142864 A JP 10142864A JP 14286498 A JP14286498 A JP 14286498A JP H11338869 A JPH11338869 A JP H11338869A
Authority
JP
Japan
Prior art keywords
information
word
node
user
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10142864A
Other languages
English (en)
Inventor
Seiji Washisaki
誠司 鷲崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10142864A priority Critical patent/JPH11338869A/ja
Publication of JPH11338869A publication Critical patent/JPH11338869A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 情報提供側で情報が関連づけられていない場
合であても、システムに問い合わせが可能な情報推薦方
法及びシステム及び情報推薦プログラムを格納した記憶
媒体及び情報蓄積方法及び装置及び情報蓄積プログラム
を格納した記憶媒体を提供する。 【解決手段】 本発明は、参照情報に対して、利用者が
興味を持つ部分を指定し、指定された部分をバッファに
取り込み、取り込んだバッファ内のテキスト情報から単
語を抽出し、抽出した単語の出現頻度を計算し、出現頻
度の高い単語に対して、予め保持しているシソーラス中
のノードと比較し、完全一致するものが存在する場合、
当該ノードを抽出し、各々の単語に対して抽出したシソ
ーラスの該当ノードから最も頻度の高いノードを、該情
報が属する分野として決定して蓄積する。参照時は、利
用者による指定された情報の参照時に着目した情報から
単語を抽出し、抽出した単語に該当する情報を蓄積した
興味から検索し、検索された結果を表示することで、他
利用者の知識を利用する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報推薦方法及び
システム及び情報推薦プログラムを格納した記憶媒体及
び情報蓄積方法及び装置及び情報蓄積プログラムを格納
した記憶媒体に係り、特に、膨大な情報の中から自分の
目的とするものを探索するための情報探索装置におけ
る、情報の探索のために、他者が持つ情報を利用して情
報探索を効率良く行うための情報推薦方法及びシステム
及び情報推薦プログラムを格納した記憶媒体及び情報蓄
積方法及び装置及び情報蓄積プログラムを格納した記憶
媒体に関する。
【0002】
【従来の技術】情報探索時における情報推薦方法では、
予め関連付けられている情報に対して匿名利用者が何等
かの方法で評価を下し、その評価に基づき適当な情報を
適切な利用者に提供している。利用者が自分の評価を付
与する情報の単位としては、文書全体または、予め付加
情報が存在するという印を付けられた情報に限られてい
る。そのような情報を様々な利用者が参照することで、
該当利用者はその情報に対して興味を持っていると判断
される。各利用者が興味を持った情報は蓄積されて、他
の利用者の要求に従いアクセスされる。
【0003】この場合、目的とする情報にアクセスした
い利用者は、予め情報に対して静的に関連付け(例え
ば、ハイパーリンク情報が付与されている)がされてい
る情報や、TITAN(http://sting.navi.ntt.co.jp
/)などの検索エンジンと呼ばれる検索システムを用い
て情報を探索する。TITANのような検索システムで
は、予め多くの情報を手元に収集しておき、情報に含ま
れる単語の出現特性に基づいて、利用者の検索要求に最
も合致する情報を表示する機能を持つ。利用者は疑問に
感じたことを検索語句に変換して検索システムに問い合
わせると、システムはそれに最も見合う情報を画面上に
表示する利用者は表示された情報の中から適切なものを
選択する。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来のシステムは、情報提供側で情報が関連付けられてい
ない場合には、システムに問い合わせを行うことができ
ないという問題がある。さらに、推薦する情報の単位が
ページ単位であるので、利用者が不要な情報も混在し、
利用者が必要な情報のみを抽出するために利用者による
取捨選択が必要である。
【0005】本発明は、上記の点に鑑みなされたもの
で、情報提供側で情報が関連づけられていない場合であ
ても、システムに問い合わせが可能な情報推薦方法及び
システム及び情報推薦プログラムを格納した記憶媒体及
び情報蓄積方法及び装置及び情報蓄積プログラムを格納
した記憶媒体を提供することを目的とする。
【0006】
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明(請求項1)は、膨大
な情報の中から利用者の目的と情報を探索する際に、他
利用者が持つ情報を利用して情報探索を行うための情報
推薦方法において、参照情報に対して、利用者が興味を
持つ部分を指定し(ステップ1)、指定された部分をバ
ッファに取り込み(ステップ2)、取り込んだバッファ
内のテキスト情報から単語を抽出し(ステップ3)、抽
出した単語の出現頻度を計算し(ステップ4)、出現頻
度の高い単語に対して、予め保持しているシソーラス中
のノードと比較し(ステップ5)、完全一致するものが
存在する場合、当該ノードを抽出し(ステップ6)、各
々の単語に対して抽出したシソーラスの該当ノードか
ら、同一情報を整理した後で、最も頻度の高いノード
を、該情報が属する分野として決定し(ステップ7)、
利用者が選択した複数の情報に対して、決定した分野
を、利用者毎の興味と見做し、該興味を利用者毎に蓄積
し(ステップ8)、利用者による情報の参照時に着目し
た情報を指定し(ステップ9)、指定した情報から単語
を抽出し(ステップ10)、抽出した単語に該当する情
報を蓄積した興味から検索し(ステップ11)、検索さ
れた結果を表示する(ステップ12)ことで、他利用者
の知識を利用する。
【0007】本発明(請求項2)は、各々の単語に対し
て抽出したシソーラスの該当ノードから、同一情報を整
理する際に、各々の単語に対して抽出されるノードの重
複を計算し、各ノードの頻度を算出する。本発明(請求
項3)は、シソーラスに相当するものとして、予め多数
の情報を階層的に分類し、各々の情報を抽象化する単語
(タグ)を付与しておき、 抽出した単語に対して、階
層的に分類した情報に含まれる文字列と一致するものに
付与されているタグを、該当情報が属する分野として決
定する。
【0008】図2は、本発明の原理構成図である。本発
明(請求項4)は、膨大な情報の中から利用者の目的と
するものを探索する際に、他利用者が持つ情報を利用し
て、情報探索を行うための情報推薦システムであって、
参照情報に対して利用者が興味を持つ部分を指定する参
照情報指定手段110と、参照情報指定手段110によ
り指定された部分を記憶手段220に取り込む指定部分
格納手段210と、記憶手段220内のテキスト情報か
ら単語を抽出する単語抽出手段230と、単語抽出手段
230で抽出された単語の出現頻度を計算する単語出現
頻度計算手段240と、単語出現頻度計算手段240で
計算された出現頻度の高い単語に対して、予め保持して
いるシソーラス60中のノードと比較し、完全一致する
ものが存在する場合、該当ノードを抽出するノード抽出
手段250と、各々の単語に対してノード抽出手段で抽
出されたシソーラス60の該当ノードから、同一情報を
整理した後で、最も頻度の高いノードを、該当情報が属
する分野として決定する分野決定手段260と、利用者
が選択した複数の情報に対して、分野決定手段260で
決定された該当分野を、利用者毎の興味と見做し、該興
味を利用者毎に付加情報記憶手段50に格納する興味情
報格納手段270と、利用者による情報の参照時に着目
した情報を指定する情報指定手段120と、情報指定手
段120で指定された情報から単語を抽出する指定単語
抽出手段280と、指定単語抽出手段280で抽出され
た単語に該当する情報を付加情報記憶手段50に蓄積さ
れている興味から検索する興味検索手段290と、興味
検索手段290で検索された結果を表示する結果表示手
段295とを有する。
【0009】本発明(請求項5)は、分野決定手段26
0において、同一情報を、各々野単語に対して抽出され
るノードの重複を計算し、各ノードの頻度を算出する同
一情報整理手段を含む。本発明(請求項6)は、分野決
定手段260において、シソーラスに相当するものとし
て、予め多数の情報を階層的に分離する階層分類手段
と、各々の情報を抽象化する単語(タグ)を付与するタ
グ付与手段と、単語抽出手段で抽出された単語に対し
て、階層分類手段で分類された情報に含まれる文字列と
一致するものに付与されているタグを、該当情報が属す
る分野として決定する手段を含む。
【0010】本発明(請求項7)は、膨大な情報の中か
ら利用者の目的とするものを探索する際に、他利用者が
持つ情報を利用して、情報探索を行うための情報推薦プ
ログラムを格納した記憶媒体であって、参照情報に対し
て利用者が興味を持つ部分を指定させる参照情報指定プ
ロセスと、参照情報指定プロセスにより指定された部分
を記憶手段に取り込む指定部分格納プロセスと、記憶手
段内のテキスト情報から単語を抽出する単語抽出プロセ
スと、単語抽出プロセスで抽出された単語の出現頻度を
計算する単語出現頻度計算プロセスと、単語出現頻度計
算プロセスで計算された出現頻度の高い単語に対して、
予め保持しているシソーラス中のノードと比較し、完全
一致するものが存在する場合、該当ノードを抽出するノ
ード抽出プロセスと、各々の単語に対してノード抽出プ
ロセスで抽出されたシソーラスの該当ノードから、同一
情報を整理した後で、最も頻度の高いノードを、該当情
報が属する分野として決定する分野決定プロセスと、利
用者が選択した複数の情報に対して、分野決定プロセス
で決定された該当分野を、利用者毎の興味と見做し、該
興味を利用者毎に付加情報記憶手段に格納する興味情報
格納プロセスと、利用者による情報の参照時に着目した
情報を指定させる情報指定プロセスと、情報指定プロセ
スで指定された情報から単語を抽出する指定単語抽出プ
ロセスと、指定単語抽出プロセスで抽出された単語に該
当する情報を付加情報記憶手段に蓄積されている興味か
ら検索する興味検索プロセスと、興味検索プロセスで検
索された結果を表示させる結果表示プロセスとを有す
る。
【0011】本発明(請求項8)は、分野決定プロセス
において、同一情報を、各々野単語に対して抽出される
ノードの重複を計算し、各ノードの頻度を算出する同一
情報整理プロセスを含む。本発明(請求項9)は、分野
決定プロセスにおいて、シソーラスに相当するものとし
て、予め多数の情報を階層的に分離する階層分類プロセ
スと、各々の情報を抽象化する単語(タグ)を付与する
タグ付与プロセスと、単語抽出プロセスで抽出された単
語に対して、階層分類プロセスで分類された情報に含ま
れる文字列と一致するものに付与されているタグを、該
当情報が属する分野として決定するプロセスを含む。
【0012】本発明(請求項10)は、膨大な情報の中
から利用者の目的と情報を探索する際に、他利用者が持
つ情報を利用して情報探索を行うための情報を蓄積する
情報蓄積方法において、参照情報に対して、利用者が興
味を持つ部分を指定し、指定された部分をバッファに取
り込み、取り込んだバッファ内のテキスト情報から単語
を抽出し、抽出した単語の出現頻度を計算し、出現頻度
の高い単語に対して、予め保持しているシソーラス中の
ノードと比較し、完全一致するものが存在する場合、当
該ノードを抽出し、各々の単語に対して抽出したシソー
ラスの該当ノードから、同一情報を整理した後で、最も
頻度の高いノードを、該情報が属する分野として決定
し、利用者が選択した複数の情報に対して、決定した分
野を、利用者毎の興味と見做し、該興味を利用者毎に記
憶手段に蓄積する。
【0013】本発明(請求項11)は、各々の単語に対
して抽出したシソーラスの該当ノードから、同一情報を
整理する際に、各々の単語に対して抽出されるノードの
重複を計算し、各ノードの頻度を算出する。本発明(請
求項12)は、シソーラスに相当するものとして、予め
多数の情報を階層的に分類し、各々の情報を抽象化する
単語(タグ)を付与しておき、抽出した単語に対して、
階層的に分類した情報に含まれる文字列と一致するもの
に付与されているタグを、該当情報が属する分野として
決定する。
【0014】本発明(請求項13)は、膨大な情報の中
から利用者の目的とするものを探索する際に、他利用者
が持つ情報を利用して、情報探索を行うための情報を蓄
積するための情報蓄積装置であって、参照情報に対して
利用者が興味を持つ部分を指定する参照情報指定手段
と、参照情報指定手段により指定された部分を記憶手段
に取り込む指定部分格納手段と、記憶手段内のテキスト
情報から単語を抽出する単語抽出手段と、単語抽出手段
で抽出された単語の出現頻度を計算する単語出現頻度計
算手段と、単語出現頻度計算手段で計算された出現頻度
の高い単語に対して、予め保持しているシソーラス中の
ノードと比較し、完全一致するものが存在する場合、該
当ノードを抽出するノード抽出手段と、各々の単語に対
してノード抽出手段で抽出されたシソーラスの該当ノー
ドから、同一情報を整理した後で、最も頻度の高いノー
ドを、該当情報が属する分野として決定する分野決定手
段と、付加情報を格納する付加情報記憶手段と、利用者
が選択した複数の情報に対して、分野決定手段で決定さ
れた該当分野を、利用者毎の興味と見做し、該興味を利
用者毎に付加情報記憶手段に格納する興味情報格納手段
とを有する。
【0015】本発明(請求項14)は、分野決定手段に
おいて、同一情報を、各々野単語に対して抽出されるノ
ードの重複を計算し、各ノードの頻度を算出する同一情
報整理手段を含む。本発明(請求項15)は、分野決定
手段において、シソーラスに相当するものとして、予め
多数の情報を階層的に分離する階層分類手段と、各々の
情報を抽象化する単語(タグ)を付与するタグ付与手段
と、単語抽出手段で抽出された単語に対して、階層分類
手段で分類された情報に含まれる文字列と一致するもの
に付与されているタグを、該当情報が属する分野として
決定する手段を含む。
【0016】本発明(請求項16)は、膨大な情報の中
から利用者の目的とするものを探索する際に、他利用者
が持つ情報を利用して、情報探索を行うための情報を蓄
積するための情報蓄積プログラムを格納した記憶媒体で
あって、参照情報に対して利用者が興味を持つ部分を指
定させる参照情報指定プロセスと、参照情報指定プロセ
スにより指定された部分を記憶手段に取り込む指定部分
格納プロセスと、記憶手段内のテキスト情報から単語を
抽出する単語抽出プロセスと、単語抽出プロセスで抽出
された単語の出現頻度を計算する単語出現頻度計算プロ
セスと、単語出現頻度計算プロセスで計算された出現頻
度の高い単語に対して、予め保持しているシソーラス中
のノードと比較し、完全一致するものが存在する場合、
該当ノードを抽出するノード抽出プロセスと、各々の単
語に対してノード抽出プロセスで抽出されたシソーラス
の該当ノードから、同一情報を整理した後で、最も頻度
の高いノードを、該当情報が属する分野として決定する
分野決定プロセスと、利用者が選択した複数の情報に対
して、分野決定プロセスで決定された該当分野を、利用
者毎の興味と見做し、該興味を利用者毎に付加情報記憶
手段に格納する興味情報格納プロセスとを有する。
【0017】本発明(請求項17)は、分野決定プロセ
スにおいて、同一情報を、各々野単語に対して抽出され
るノードの重複を計算し、各ノードの頻度を算出する同
一情報整理プロセスを含む。本発明(請求項18)は、
分野決定プロセスにおいて、シソーラスに相当するもの
として、予め多数の情報を階層的に分離する階層分類プ
ロセスと、各々の情報を抽象化する単語(タグ)を付与
するタグ付与プロセスと、単語抽出プロセスで抽出され
た単語に対して、階層分類プロセスで分類された情報に
含まれる文字列と一致するものに付与されているタグ
を、該当情報が属する分野として決定するプロセスを含
む。
【0018】本発明は、情報閲覧中に、情報中にある部
分的な文字列に着目して適当な情報の蓄積や推薦を行
う。即ち、利用者は情報の蓄積時には、自分が興味のあ
る部分はどこでもよいので、指定し、その部分が属する
分野を参照情報に付加して全体を自動的に蓄積する。こ
うして、多くの人により蓄積された情報を相互に検索可
能にしておくことで、ある利用者の情報参照時に、陽に
付加情報が付与されていない場合でも、調査したい部分
を指定すれば、蓄積した情報へ自動的にアクセスできる
ため、効率のよい検索ができる。
【0019】特に有効なのは、ある分野に通じた利用者
が多くの情報を蓄積している状態で、利用者が関連情報
を自分で、あるいは、ハイパーリンク情報として簡単に
探せない場合、システムに問い合わせることができるた
め、厳選された情報が容易に入手可能となる。さらに、
従来では、推薦する情報の単位がページ単位などと大き
く、その情報の中には様々な情報が混在していることが
多い。その場合、本当に必要な情報だけではないので、
利用者側で取捨選択の操作が必要となる。本発明によれ
ば、他の利用者により情報中からその人が必要な部分だ
けを選択して蓄積されているため、蓄積された情報の中
から類似した情報を抽出すれば、真に有効な情報の提供
が可能となる。
【0020】
【発明の実施の形態】図3は、本発明の情報推薦システ
ムの構成を示す。同図に示す情報推薦システムは、検索
モジュール10と蓄積モジュール20、情報30、付加
情報40、付加情報データベース50及びシソーラス格
納部60から構成される。
【0021】検索モジュール10は、領域選択部11、
情報検索部12及び情報表示部13より構成され、蓄積
モジュール20を探索する。蓄積モジュール20は、領
域選択部21、情報分類部22、及び情報蓄積部23か
ら構成され、利用者が興味を持った情報を格納する。上
記の処理を図4、図5のフローチャートを用いて説明す
る。
【0022】図4は、本発明の蓄積モジュールの動作を
示すフローチャートである。まず、蓄積モジュール20
における処理について説明する。 ステップ101) 利用者は領域選択部21において、
参照した情報の中から自分が興味のある部分(領域)を
指定する。領域に含まれる文字列がバッファ(図示せ
ず)に格納される。
【0023】ステップ102) バッファに格納された
文字列は、情報分類部22に渡され、情報分類部22で
は、文字列に含まれる単語(名詞)を一般的な形態素解
析装置を用いて抽出する。 ステップ103) 抽出された単語の特徴に基づいて情
報の分類を行う。これは、例えば、特願平10−457
70で実現される情報分類情報を用いることで可能であ
る。
【0024】ステップ104) ステップ102におい
て、各々の文字列が含まれる領域が属する分野が決定さ
れると、情報蓄積部23は、文字列そのものと、それが
含まれる分野を付加情報データベース50に蓄積する。
情報の再利用が可能なように、各文字列は、単語が抽出
され、単語の重みを利用して検索が可能なようにインデ
ックスデータベース(図示せず)を作成しておき、UR
Lと分野を関連付けて保持する。
【0025】図5は、本発明の検索モジュールの動作を
示すフローチャートである。 ステップ201) 情報選択部11は、自分の探索目的
に近い領域を選択する。 ステップ202) 情報検索部12は、情報選択部11
で選択された領域に含まれる文字列から単語を抽出す
る。
【0026】ステップ203) 情報検索部12は、抽
出された単語に関する分類先を決定する。 ステップ204) 当該分類先に関する付加情報データ
ベース50に対して問い合わせを行い、類似する情報が
当該付加情報データベース50に存在する場合には、ス
テップ205に移行し、存在しない場合にはステップ2
06に移行する。
【0027】ステップ205) 付加情報データベース
50に蓄積されている情報の中から問い合わせに用いた
単語に最も近いと判断された情報を、基の参照情報の指
定した領域に付随させて表示する。 ステップ206) 付加情報データベース50に類似す
る情報が存在しない場合には、付加情報は抽出されなか
ったので、情報のみを表示する。
【0028】
【実施例】以下、図面と共に本発明の実施例を説明す
る。以下の実施例では、利用者がWWW上の情報を参照
している状況を考える。あるURL(Uniform Resouce
Locator )で表される情報の例を図6に示す。図6に示
す情報の先頭には、見出しに相当するような文字が含ま
れることが多く、その下には写真などと並んで詳細情報
が構成されている。図6の例では、全体がスポーツの情
報であり、その中でもサッカーと野球に関する情報が含
まれている。
【0029】利用者は、領域選択部21において、この
ように参照した情報の中から自分が興味のある部分を指
定する。例えば、ある利用者がサッカーに興味があり、
野球に興味がない場合は、サッカーに関する部分だけを
マウス操作などにより領域指定して、バッファに取り込
む。マウス操作による領域指定とバッファに取り込む方
法に関しては、計算機上で動作しているウィンドウシス
テムに依存するが、例えば、UNIX上のX-Windowシス
テムの場合は、マウスの左クリックにより領域の角を指
定して、そのままドラッグすることにより領域を作成す
る。最終的に望みの領域が囲むことができたら、マウス
のボタンを離すことにより領域が確定する。領域が確定
された時点で、領域中に含まれる文字列は、X-Windowシ
ステムが持つ情報操作用バッファ中に取り込まれる(ス
テップ101)。
【0030】バッファに取り込まれた文字列は、情報分
類部22に渡される。情報分類部22では、文字列に含
まれる単語(名詞)を一般的な形態素解析装置を用いて
抽出して(ステップ102)、その特徴を基に情報の分
類を行う(ステップ103)。これは、例えば、特願平
10−45770で実現される情報分類方法を用いるこ
とで可能である。
【0031】この分類の処理例を以下に示す。分類処理
には、図7に示すシソーラス格納部60に格納されてい
るシソーラスを用いる。一般的にシソーラスとは、様々
な概念で表現されるものを、各々の概念間の上位・下位
関係に沿って木構造で表現したものである。図7の例で
は、一番上記のROOTノードから、マルチメディア、
スポーツなどのいくつかのノードに枝分かれし、更に、
スポーツノードは、野球、サッカーなどのノードに細分
化されている様子が分かる。本発明では、このような一
般的なシソーラス体系を用いる手法以外に、各ノードに
対して各々に該当するような情報が蓄積されているもの
も利用できる。即ち、図7に示すサッカーノード以下
に、タイトルが「サッカー掲示板」、「ワールドカッ
プ」などの情報が蓄積されているものである。後者の例
として、WWW上の検索サービスである“Yahoo
!”(http://www.yahoo.co.jp/)が持つ階層構造があ
る。まず、上記処理により情報から抽出した各単語に対
してシソーラス中のノードに一致するものを探索する。
こうして得られるノード情報を全単語に対して収集し、
最も頻度の高いノードの情報を、各々の文字列が属する
分野と見做すことにする。ノードに情報が蓄積されてい
る場合は、予め蓄積されている情報から単語を抽出して
データベース化しておき、文字列から抽出した各単語に
対して、シソーラス中に蓄積された情報のどれに相当す
るかを探索する。合致した情報が属するノードを、各々
の文字列が属する分野と見做すことにする。
【0032】こうして、各々の文字列が含まれる領域が
属する分野が決定されると、情報蓄積部23では、文字
列そのものと、それが含まれる分野を付加情報データベ
ース50に蓄積する。情報の再利用が可能なように、各
文字列は単語が抽出され、単語の重みを利用して検索が
可能なようにインデックスデータベース(図示せず)を
作成しておき、URLと分野を関連付けて保持する。付
加情報データベース50の情報保有の概念図を図8に示
す。
【0033】図8では、ある情報から領域が選択され
て、その領域がある分野に分類された上で、付加情報デ
ータベース50に蓄積されるところを図式化している。
付加情報データベース50内では、利用者により切り取
られた情報が効率よく、検索可能なように整理されて蓄
積されている。この情報は、様々な利用者により蓄積さ
れるため、多様な分野に関する情報が幅広く蓄積される
ことになる。この例では、利用者A〜Cによる5つの情
報を蓄積しており、各々は、スポーツ関係や音楽関係に
分類されて蓄積されていることを表している。
【0034】こうして、付加情報データベース50に情
報が蓄積されている状態で、ある利用者が自分の目的に
沿って情報を探索している状況を考える。その場合、あ
る起点となるWWW上の情報30を、例えば、TITA
Nなどのような探索システムで発見し、参照する。その
情報は有効であるかもしれないし、そうでない可能性も
ある。もしも、自分の目的には大体合っているが、もう
少し詳細な情報が欲しいような場合に、情報選択部11
の機能により、自分の探索目的に近い領域を選択する。
【0035】例えば、その領域にはサッカーに関する事
項が記載されているとすると、情報探索部12に、その
選択された領域に含まれる文字列が渡され、単語が抽出
されて付加情報データベース50に問い合わせを行う。
すると、付加情報データベース50に蓄積されている情
報の中から問い合わせに用いた単語に最も近いと判断さ
れた情報が抽出される。
【0036】こうして得られた情報は、情報表示部13
で現在参照している情報30と共に利用者に提供され
る。図9の例では、指定した領域に含まれる文字列を検
索語句として、付加情報データベース50を探索した際
に、最も合致する情報を抽出して、元の参照情報30の
指定した領域に付随させて表示することで、利用者に付
加情報を提供する。
【0037】また、上記の実施例は、図3に示す構成に
基づいて説明しているが、この例に限定されるこなく、
検索モジュール10の各構成要素及び蓄積モジュール2
0の各構成要素をプログラムとして構築し、情報推薦装
置として利用されるコンピュータに接続されるディスク
や、フロッピーディスクやCD−ROM等の可搬記憶媒
体に格納しておき、本発明を実施する際にインストール
することにより、容易に本発明を実現することが可能で
ある。
【0038】また、図3に示す蓄積モジュール20のみ
を情報蓄積装置として独立して構築することも可能であ
り、検索モジュール10については、既存の検索システ
ムを適用して、情報蓄積装置内の付加情報データベース
50を検索するような構成であってもよい。なお、本発
明は、上記の実施例に限定されることなく、特許請求の
範囲内で種々変更・応用が可能である。
【0039】
【発明の効果】上述のように、本発明によれば、情報の
閲覧中に、情報中にある部分的な文字列に着目して、適
当な情報の蓄積や推薦を行うため、情報提供側で情報が
関連付けられていない場合でも、システムに問い合わせ
ることができるため、厳選された情報が簡単に入手する
ことができる。この方法を用いることにより、よりきめ
細かな情報推薦サービスの構築が可能になる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の情報推薦システムの構成図である。
【図4】本発明の蓄積モジュールの動作を示すフローチ
ャートである。
【図5】本発明の検索モジュールの動作を示すフローチ
ャートである。
【図6】本発明の一実施例の情報の例である。
【図7】本発明の一実施例のシソーラスの例である。
【図8】本発明の一実施例の付加情報データベースの概
念図である。
【図9】本発明の一実施例の情報探索の例を説明するた
めの図である。
【符号の説明】
10 検索モジュール 11 領域選択部 12 情報検索部 13 情報表示部 20 蓄積モジュール 21 領域選択部 22 情報分類部 23 情報蓄積部 30 情報 40 付加情報 50 付加情報記憶手段、付加情報データベース 60 シソーラス、シソーラス格納部 110 参照情報指定手段 120 情報指定手段 210 指定部分格納手段 220 記憶手段 230 単語抽出手段 240 単語出現頻度計算手段 250 ノード抽出手段 260 分野決定手段 270 興味情報格納手段 280 指定単語抽出手段 290 興味検索手段 295 結果表示手段

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 膨大な情報の中から利用者の目的と情報
    を探索する際に、他利用者が持つ情報を利用して情報探
    索を行うための情報推薦方法において、 参照情報に対して、利用者が興味を持つ部分を指定し、 指定された部分をバッファに取り込み、 取り込んだ前記バッファ内のテキスト情報から単語を抽
    出し、 抽出した単語の出現頻度を計算し、 前記出現頻度の高い単語に対して、予め保持しているシ
    ソーラス中のノードと比較し、完全一致するものが存在
    する場合、当該ノードを抽出し、 各々の単語に対して抽出したシソーラスの該当ノードか
    ら、同一情報を整理した後で、最も頻度の高いノード
    を、該情報が属する分野として決定し、 利用者が選択した複数の情報に対して、決定した前記分
    野を、利用者毎の興味と見做し、該興味を利用者毎に蓄
    積し、 前記利用者による情報の参照時に着目した情報を指定
    し、 指定した情報から単語を抽出し、 抽出した単語に該当する情報を蓄積した前記興味から検
    索し、 検索された結果を表示することで、他利用者の知識を利
    用することを特徴とする情報推薦方法。
  2. 【請求項2】 前記各々の単語に対して抽出したシソー
    ラスの該当ノードから、同一情報を整理する際に、 前記各々の単語に対して抽出されるノードの重複を計算
    し、 前記各ノードの頻度を算出する請求項1記載の情報推薦
    方法。
  3. 【請求項3】 前記シソーラスに相当するものとして、
    予め多数の情報を階層的に分類し、 各々の情報を抽象化する単語(タグ)を付与しておき、 前記抽出した単語に対して、階層的に分類した情報に含
    まれる文字列と一致するものに付与されているタグを、
    該当情報が属する分野として決定する請求項1記載の情
    報推薦方法。
  4. 【請求項4】 膨大な情報の中から利用者の目的とする
    ものを探索する際に、他利用者が持つ情報を利用して、
    情報探索を行うための情報推薦システムであって、 参照情報に対して利用者が興味を持つ部分を指定する参
    照情報指定手段と、 前記参照情報指定手段により指定された部分を記憶手段
    に取り込む指定部分格納手段と、 前記記憶手段内のテキスト情報から単語を抽出する単語
    抽出手段と、 前記単語抽出手段で抽出された単語の出現頻度を計算す
    る単語出現頻度計算手段と、 前記単語出現頻度計算手段で計算された出現頻度の高い
    単語に対して、予め保持しているシソーラス中のノード
    と比較し、完全一致するものが存在する場合、該当ノー
    ドを抽出するノード抽出手段と、 各々の単語に対して前記ノード抽出手段で抽出されたシ
    ソーラスの該当ノードから、同一情報を整理した後で、
    最も頻度の高いノードを、該当情報が属する分野として
    決定する分野決定手段と、 利用者が選択した複数の情報に対して、前記分野決定手
    段で決定された該当分野を、利用者毎の興味と見做し、
    該興味を利用者毎に付加情報記憶手段に格納する興味情
    報格納手段と、 前記利用者による情報の参照時に着目した情報を指定す
    る情報指定手段と、 前記情報指定手段で指定された情報から単語を抽出する
    指定単語抽出手段と、 前記指定単語抽出手段で抽出された単語に該当する情報
    を前記付加情報記憶手段に蓄積されている前記興味から
    検索する興味検索手段と、 前記興味検索手段で検索された結果を表示する結果表示
    手段とを有することを特徴とする情報推薦システム。
  5. 【請求項5】 前記分野決定手段は、 前記同一情報を、各々野単語に対して抽出されるノード
    の重複を計算し、各ノードの頻度を算出する同一情報整
    理手段を含む請求項4記載の情報推薦システム。
  6. 【請求項6】 前記分野決定手段は、 前記シソーラスに相当するものとして、予め多数の情報
    を階層的に分離する階層分類手段と、 各々の情報を抽象化する単語(タグ)を付与するタグ付
    与手段と、 前記単語抽出手段で抽出された単語に対して、前記階層
    分類手段で分類された情報に含まれる文字列と一致する
    ものに付与されているタグを、該当情報が属する分野と
    して決定する手段を含む請求項5記載の情報推薦システ
    ム。
  7. 【請求項7】 膨大な情報の中から利用者の目的とする
    ものを探索する際に、他利用者が持つ情報を利用して、
    情報探索を行うための情報推薦プログラムを格納した記
    憶媒体であって、 参照情報に対して利用者が興味を持つ部分を指定させる
    参照情報指定プロセスと、 前記参照情報指定プロセスにより指定された部分を記憶
    手段に取り込む指定部分格納プロセスと、 前記記憶手段内のテキスト情報から単語を抽出する単語
    抽出プロセスと、 前記単語抽出プロセスで抽出された単語の出現頻度を計
    算する単語出現頻度計算プロセスと、 前記単語出現頻度計算プロセスで計算された出現頻度の
    高い単語に対して、予め保持しているシソーラス中のノ
    ードと比較し、完全一致するものが存在する場合、該当
    ノードを抽出するノード抽出プロセスと、 各々の単語に対して前記ノード抽出プロセスで抽出され
    たシソーラスの該当ノードから、同一情報を整理した後
    で、最も頻度の高いノードを、該当情報が属する分野と
    して決定する分野決定プロセスと、 利用者が選択した複数の情報に対して、前記分野決定プ
    ロセスで決定された該当分野を、利用者毎の興味と見做
    し、該興味を利用者毎に付加情報記憶手段に格納する興
    味情報格納プロセスと、 前記利用者による情報の参照時に着目した情報を指定さ
    せる情報指定プロセスと、 前記情報指定プロセスで指定された情報から単語を抽出
    する指定単語抽出プロセスと、 前記指定単語抽出プロセスで抽出された単語に該当する
    情報を前記付加情報記憶手段に蓄積されている前記興味
    から検索する興味検索プロセスと、 前記興味検索プロセスで検索された結果を表示させる結
    果表示プロセスとを有することを特徴とする情報推薦プ
    ログラムを格納した記憶媒体。
  8. 【請求項8】 前記分野決定プロセスは、 前記同一情報を、各々野単語に対して抽出されるノード
    の重複を計算し、各ノードの頻度を算出する同一情報整
    理プロセスを含む請求項7記載の情報推薦プログラムを
    格納した記憶媒体。
  9. 【請求項9】 前記分野決定プロセスは、 前記シソーラスに相当するものとして、予め多数の情報
    を階層的に分離する階層分類プロセスと、 各々の情報を抽象化する単語(タグ)を付与するタグ付
    与プロセスと、 前記単語抽出プロセスで抽出された単語に対して、前記
    階層分類プロセスで分類された情報に含まれる文字列と
    一致するものに付与されているタグを、該当情報が属す
    る分野として決定するプロセスを含む請求項7記載の情
    報推薦プログラムを格納した記憶媒体。
  10. 【請求項10】 膨大な情報の中から利用者の目的と情
    報を探索する際に、他利用者が持つ情報を利用して情報
    探索を行うための情報を蓄積する情報蓄積方法におい
    て、 参照情報に対して、利用者が興味を持つ部分を指定し、 指定された部分をバッファに取り込み、 取り込んだ前記バッファ内のテキスト情報から単語を抽
    出し、 抽出した単語の出現頻度を計算し、 前記出現頻度の高い単語に対して、予め保持しているシ
    ソーラス中のノードと比較し、完全一致するものが存在
    する場合、当該ノードを抽出し、 各々の単語に対して抽出したシソーラスの該当ノードか
    ら、同一情報を整理した後で、最も頻度の高いノード
    を、該情報が属する分野として決定し、 利用者が選択した複数の情報に対して、決定した前記分
    野を、利用者毎の興味と見做し、該興味を利用者毎に記
    憶手段に蓄積することを特徴とする情報蓄積方法。
  11. 【請求項11】 前記各々の単語に対して抽出したシソ
    ーラスの該当ノードから、同一情報を整理する際に、 前記各々の単語に対して抽出されるノードの重複を計算
    し、 前記各ノードの頻度を算出する請求項10記載の情報蓄
    積方法。
  12. 【請求項12】 前記シソーラスに相当するものとし
    て、予め多数の情報を階層的に分類し、 各々の情報を抽象化する単語(タグ)を付与しておき、 前記抽出した単語に対して、階層的に分類した情報に含
    まれる文字列と一致するものに付与されているタグを、
    該当情報が属する分野として決定する請求項10記載の
    情報蓄積方法。
  13. 【請求項13】 膨大な情報の中から利用者の目的とす
    るものを探索する際に、他利用者が持つ情報を利用し
    て、情報探索を行うための情報を蓄積する情報蓄積装置
    であって、 参照情報に対して利用者が興味を持つ部分を指定する参
    照情報指定手段と、 前記参照情報指定手段により指定された部分を記憶手段
    に取り込む指定部分格納手段と、 前記記憶手段内のテキスト情報から単語を抽出する単語
    抽出手段と、 前記単語抽出手段で抽出された単語の出現頻度を計算す
    る単語出現頻度計算手段と、 前記単語出現頻度計算手段で計算された出現頻度の高い
    単語に対して、予め保持しているシソーラス中のノード
    と比較し、完全一致するものが存在する場合、該当ノー
    ドを抽出するノード抽出手段と、 各々の単語に対して前記ノード抽出手段で抽出されたシ
    ソーラスの該当ノードから、同一情報を整理した後で、
    最も頻度の高いノードを、該当情報が属する分野として
    決定する分野決定手段と、 付加情報を格納する付加情報記憶手段と、 利用者が選択した複数の情報に対して、前記分野決定手
    段で決定された該当分野を、利用者毎の興味と見做し、
    該興味を利用者毎に付加情報記憶手段に格納する興味情
    報格納手段とを有することを特徴とする情報蓄積装置。
  14. 【請求項14】 前記分野決定手段は、 前記同一情報を、各々野単語に対して抽出されるノード
    の重複を計算し、各ノードの頻度を算出する同一情報整
    理手段を含む請求項13記載の情報蓄積装置。
  15. 【請求項15】 前記分野決定手段は、 前記シソーラスに相当するものとして、予め多数の情報
    を階層的に分離する階層分類手段と、 各々の情報を抽象化する単語(タグ)を付与するタグ付
    与手段と、 前記単語抽出手段で抽出された単語に対して、前記階層
    分類手段で分類された情報に含まれる文字列と一致する
    ものに付与されているタグを、該当情報が属する分野と
    して決定する手段を含む請求項13記載の情報蓄積装
    置。
  16. 【請求項16】 膨大な情報の中から利用者の目的とす
    るものを探索する際に、他利用者が持つ情報を利用し
    て、情報探索を行うための情報を蓄積する情報蓄積プロ
    グラムを格納した記憶媒体であって、 参照情報に対して利用者が興味を持つ部分を指定させる
    参照情報指定プロセスと、 前記参照情報指定プロセスにより指定された部分を記憶
    手段に取り込む指定部分格納プロセスと、 前記記憶手段内のテキスト情報から単語を抽出する単語
    抽出プロセスと、 前記単語抽出プロセスで抽出された単語の出現頻度を計
    算する単語出現頻度計算プロセスと、 前記単語出現頻度計算プロセスで計算された出現頻度の
    高い単語に対して、予め保持しているシソーラス中のノ
    ードと比較し、完全一致するものが存在する場合、該当
    ノードを抽出するノード抽出プロセスと、 各々の単語に対して前記ノード抽出プロセスで抽出され
    たシソーラスの該当ノードから、同一情報を整理した後
    で、最も頻度の高いノードを、該当情報が属する分野と
    して決定する分野決定プロセスと、 利用者が選択した複数の情報に対して、前記分野決定プ
    ロセスで決定された該当分野を、利用者毎の興味と見做
    し、該興味を利用者毎に付加情報記憶手段に格納する興
    味情報格納プロセスとを有することを特徴とする情報蓄
    積プログラムを格納した記憶媒体。
  17. 【請求項17】 前記分野決定プロセスは、 前記同一情報を、各々野単語に対して抽出されるノード
    の重複を計算し、各ノードの頻度を算出する同一情報整
    理プロセスを含む請求項16記載の情報蓄積プログラム
    を格納した記憶媒体。
  18. 【請求項18】 前記分野決定プロセスは、 前記シソーラスに相当するものとして、予め多数の情報
    を階層的に分離する階層分類プロセスと、 各々の情報を抽象化する単語(タグ)を付与するタグ付
    与プロセスと、 前記単語抽出プロセスで抽出された単語に対して、前記
    階層分類プロセスで分類された情報に含まれる文字列と
    一致するものに付与されているタグを、該当情報が属す
    る分野として決定するプロセスを含む請求項16記載の
    情報蓄積プログラムを格納した記憶媒体。
JP10142864A 1998-05-25 1998-05-25 情報推薦方法及びシステム及び情報推薦プログラムを格納した記憶媒体及び情報蓄積方法及び装置及び情報蓄積プログラムを格納した記憶媒体 Pending JPH11338869A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10142864A JPH11338869A (ja) 1998-05-25 1998-05-25 情報推薦方法及びシステム及び情報推薦プログラムを格納した記憶媒体及び情報蓄積方法及び装置及び情報蓄積プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10142864A JPH11338869A (ja) 1998-05-25 1998-05-25 情報推薦方法及びシステム及び情報推薦プログラムを格納した記憶媒体及び情報蓄積方法及び装置及び情報蓄積プログラムを格納した記憶媒体

Publications (1)

Publication Number Publication Date
JPH11338869A true JPH11338869A (ja) 1999-12-10

Family

ID=15325390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10142864A Pending JPH11338869A (ja) 1998-05-25 1998-05-25 情報推薦方法及びシステム及び情報推薦プログラムを格納した記憶媒体及び情報蓄積方法及び装置及び情報蓄積プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JPH11338869A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321221B1 (en) 1998-07-17 2001-11-20 Net Perceptions, Inc. System, method and article of manufacture for increasing the user value of recommendations
US6334127B1 (en) * 1998-07-17 2001-12-25 Net Perceptions, Inc. System, method and article of manufacture for making serendipity-weighted recommendations to a user
US6412012B1 (en) 1998-12-23 2002-06-25 Net Perceptions, Inc. System, method, and article of manufacture for making a compatibility-aware recommendations to a user
KR100408965B1 (ko) * 2000-06-26 2003-12-06 주식회사쓰리소프트 검색조건을 추천하는 검색결과 제공방법 및 검색서버
US7461058B1 (en) 1999-09-24 2008-12-02 Thalveg Data Flow Llc Optimized rule based constraints for collaborative filtering systems
KR100901623B1 (ko) 2002-12-17 2009-06-08 주식회사 케이티 개인패턴망을 이용한 검색 서비스 방법
JP2012003729A (ja) * 2010-06-21 2012-01-05 Nippon Telegr & Teleph Corp <Ntt> 作品推薦装置及び方法及びプログラム
JP2012222569A (ja) * 2011-04-07 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 番組推薦装置及び方法及びプログラム
CN111026967A (zh) * 2019-12-09 2020-04-17 腾讯科技(深圳)有限公司 一种获得用户兴趣标签的方法、装置、设备和介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321221B1 (en) 1998-07-17 2001-11-20 Net Perceptions, Inc. System, method and article of manufacture for increasing the user value of recommendations
US6334127B1 (en) * 1998-07-17 2001-12-25 Net Perceptions, Inc. System, method and article of manufacture for making serendipity-weighted recommendations to a user
US6412012B1 (en) 1998-12-23 2002-06-25 Net Perceptions, Inc. System, method, and article of manufacture for making a compatibility-aware recommendations to a user
US7461058B1 (en) 1999-09-24 2008-12-02 Thalveg Data Flow Llc Optimized rule based constraints for collaborative filtering systems
KR100408965B1 (ko) * 2000-06-26 2003-12-06 주식회사쓰리소프트 검색조건을 추천하는 검색결과 제공방법 및 검색서버
KR100901623B1 (ko) 2002-12-17 2009-06-08 주식회사 케이티 개인패턴망을 이용한 검색 서비스 방법
JP2012003729A (ja) * 2010-06-21 2012-01-05 Nippon Telegr & Teleph Corp <Ntt> 作品推薦装置及び方法及びプログラム
JP2012222569A (ja) * 2011-04-07 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 番組推薦装置及び方法及びプログラム
CN111026967A (zh) * 2019-12-09 2020-04-17 腾讯科技(深圳)有限公司 一种获得用户兴趣标签的方法、装置、设备和介质
CN111026967B (zh) * 2019-12-09 2023-08-04 腾讯科技(深圳)有限公司 一种获得用户兴趣标签的方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
US6078917A (en) System for searching internet using automatic relevance feedback
US6336112B2 (en) Method for interactively creating an information database including preferred information elements, such as, preferred-authority, world wide web pages
US6691108B2 (en) Focused search engine and method
JP3717808B2 (ja) 情報検索システム
US20020055919A1 (en) Method and system for gathering, organizing, and displaying information from data searches
US20040220905A1 (en) Concept network
US20020165860A1 (en) Selective retrieval metasearch engine
JP2004213675A (ja) 構造化ドキュメントの検索
EP1211616A2 (en) Data storage and retrieval system
US7523109B2 (en) Dynamic grouping of content including captive data
JP2002041546A (ja) 階層的統計分析のシステム及び方法
JP3849318B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
US7024405B2 (en) Method and apparatus for improved internet searching
JP2004054631A (ja) 情報検索システム、情報検索方法、html文書の構造解析方法及びプログラム
KR100434902B1 (ko) 지식 기반 맞춤 정보 제공 시스템 및 그 서비스 방법
KR101355945B1 (ko) 온라인 문맥기반 광고 장치 및 방법
KR20040087205A (ko) 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템
Kao et al. Entropy-based link analysis for mining web informative structures
JPH11338869A (ja) 情報推薦方法及びシステム及び情報推薦プログラムを格納した記憶媒体及び情報蓄積方法及び装置及び情報蓄積プログラムを格納した記憶媒体
JP2000339330A (ja) 座標付きホームページ情報収集提供方法、記録媒体及び装置
JP3746233B2 (ja) 知識分析システムおよび知識分析方法
KR100643979B1 (ko) 인터넷을 이용한 정보검색 결과 제공방법
JP2000331020A (ja) 情報参照方法,情報参照装置および情報参照プログラムを格納した記憶媒体
JPH1145257A (ja) Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005122509A (ja) 階層構造データ分析方法、分析装置および分析プログラム