JP5060020B2 - コンテンツ発見装置 - Google Patents

コンテンツ発見装置 Download PDF

Info

Publication number
JP5060020B2
JP5060020B2 JP2004317285A JP2004317285A JP5060020B2 JP 5060020 B2 JP5060020 B2 JP 5060020B2 JP 2004317285 A JP2004317285 A JP 2004317285A JP 2004317285 A JP2004317285 A JP 2004317285A JP 5060020 B2 JP5060020 B2 JP 5060020B2
Authority
JP
Japan
Prior art keywords
search
keyword
content
group
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004317285A
Other languages
English (en)
Other versions
JP2006127325A (ja
Inventor
希世子 田中
偉元 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2004317285A priority Critical patent/JP5060020B2/ja
Publication of JP2006127325A publication Critical patent/JP2006127325A/ja
Application granted granted Critical
Publication of JP5060020B2 publication Critical patent/JP5060020B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、キーワードを用いてコンテンツを発見するコンテンツ発見装置に関する。
従来、インターネット上のコンテンツの中からユーザが所望のコンテンツを検索するために、種々の検索エンジンが提供されている。検索エンジンには、メタ検索エンジンやディレクトリ型検索エンジン等が存在する。
メタ検索エンジンとは、複数の検索エンジンに対して横断的に検索を行ったうえ、個々の検索エンジンが表示する検索結果をまとめて表示する検索エンジンであり、独自の検索用の情報データベースは保持しておらず、他の複数の検索エンジンのデータベースを利用して検索結果の表示を行う。
統合型のメタ検索エンジンでは、各検索エンジンから取得した検索結果に対して、メタ検索エンジンが独自の手法によって解析及び情報の分類を行い、検索キーワードと個々の検索結果であるWebページとの関連性を考慮して整理された結果を表示する。解析の手法は検索エンジンごとに特徴があるが、その目的とすること、及び、最終的な表示内容は同一である。すなわち、キーワードによって検索結果を絞り込むことを目的としており、キーワードによって絞り込まれた検索結果が表示される。
ディレクトリ型検索エンジンとは、検索用の情報データベースに情報を登録する際に、登録者が情報の内容を判断し、それに応じてあらかじめカテゴリー分けを行っているものである。大分類、中分類、小分類というように情報が階層化されているのが特徴である。ユーザはカテゴリーをたどって深い階層に進んでいくことで検索結果を絞り込むことができる。
従来の検索エンジンを用いたコンテンツの検索手順について、図5を参照しながら具体的に説明する。インターネット上の所望のコンテンツを検索する場合、まず、ユーザはインターネットに接続された端末装置を操作して検索エンジンを起動し、ディスプレイにキーワード入力画面101を表示する(図5(a))。そして、ユーザが、キーワード入力画面101に検索キーワードとしてキーワード1を入力すると、検索エンジンは、キーワード1にマッチする(すなわち、コンテンツの中にキーワード1が含まれている)コンテンツ全体103をコンテンツの内容やリンク数等をもとに検索エンジン独自の手法でグループ分けし、コンテンツのグループ103−1,103−2,103−3を生成する。検索エンジンは、生成されたグループ103−1,103−2,103−3毎に、グループを特徴付けるキーワード(以下「関連キーワード」と呼ぶ)として、キーワード2,2’,2”をつける(図5(b))。
そして、端末装置のディスプレイには、図5(c)に示すコンテンツ表示画面102が表示される。コンテンツ表示画面102は、キーワード表示部102−1とコンテンツ表示部102−2とから構成され、キーワード表示部102−1には検索キーワードであるキーワード1と、グループ毎の関連キーワードであるキーワード2,2’,2”とが表示される。また、コンテンツ表示部102−2には、検索キーワードであるキーワード1にマッチする全コンテンツが表示される。
次に、ユーザが、キーワード表示部102−1に表示されている関連キーワードのうちキーワード2を選択すると、検索エンジンは、キーワード2で特徴付けられる全コンテンツ103−1を、キーワード1の検索結果に対して行ったのと同様に、コンテンツの内容やリンク数等をもとに検索エンジン独自の手法でグループ分けし、コンテンツのグループ105−1,105−2を生成する。そして、検索エンジンは、グループ105−1,105−2毎に各グループを特徴付けるキーワードとしてキーワード3,3’をつける(図5(d))。
以上の処理に基づいて、端末装置のディスプレイには、図5(e)に示すコンテンツ表示画面102が表示される。同図に示すように、コンテンツ表示画面102のキーワード表示部102−1には、図5(c)に示すキーワード表示部102−1で表示されていたキーワード群に加えて、キーワード2の配下に、キーワード2で特徴付けられるコンテンツのグループ分けによって得られたキーワード群(キーワード3,3’)が表示される。また、コンテンツ表示部102−2には、キーワード1にマッチしたコンテンツの中で、キーワード2の特徴をもつグループに含まれる全コンテンツ15−1の一覧が表示される。
このような処理を繰り返すことで、コンテンツ表示画面102中のキーワード表示部102−1に表示されるキーワード群の階層が深くなり、コンテンツ表示部102−2に表示されるコンテンツの数は少なくなり、検索結果の絞込みが行われる。
図6は、上述した検索エンジンの機能を有する検索装置の構成の一例を示した図である。同図に示すように、検索装置は、ユーザからのキーワードの入力や検索結果の表示等の入出力を管理する入出力部、入力されたキーワードをもとにネットワークヘアクセスしてコンテンツを検索するWeb検索部、取得したコンテンツのURL(Uniform Resource Locator)、コンテンツの実体、及び、概要等の、コンテンツに関する情報を管理するコンテンツ管理部、及び、コンテンツの内容などに応じて類似コンテンツのグループ分けを行うグループ管理部から構成される。
図7は、図6に示す検索装置が行う検索処理手順の一例を示すフロー図である。同図を参照しながら、従来の検索装置が行う検索処理手順を説明する。まず、入出力部がユーザから検索キーワードを取得すると(ステップS301)、Web検索部にて、検索キーワードをもとにインターネット等のネットワークを介してコンテンツを取得する(ステップS302)。コンテンツ管理部では、Web検索部が取得したコンテンツのURLや、コンテンツの実体データや、コンテンツの内容から取得される特徴情報等のコンテンツ情報を格納する(ステップS303)。グループ管理部では、コンテンツ管理部によって格納されたコンテンツ情報をもとに、コンテンツ群を複数のグループに分け、グループを特徴付けるキーワードを抽出する(ステップS304)。入出力部では、ユーザに対してグループ分けされた検索結果を表示する(ステップS305)。入出力部がユーザのグループ選択の操作を受け付けると(ステップS306;yes)、グループ管理部では選択済みグループに該当するコンテンツをグループ分け対象コンテンツとして設定し(ステップS307)、再度グループ分けを行い(ステップS304)、そのグループ分けされた結果を入出力部がユーザへ表示する(ステップS305)。また、入出力部がユーザのコンテンツ選択の操作を受け付けると(ステップS308;yes)、コンテンツ管理部は管理しているコンテンツ情報の中から選択済みコンテンツに関する情報を抽出し、入出力部が当該コンテンツに関する情報をユーザへ提示する(ステップS309)。
このような、検索キーワードによる検索結果からキーワードを抽出したり、検索結果をグループ分けするといった技術内容は、例えば、特許文献1、2に開示されている。
特開平09−259133号公報 特開2000−76279号公報
統合型のメタ検索エンジンやディレクトリ型検索エンジンでは、情報群に対してカテゴリー分けを繰り返し行っていくことで情報を絞りこみ、ユーザが検索の目的としている「欲しい情報」に近づくことを目的としている。しかしこのような絞りこみ型の検索エンジンでは、最初の検索キーワードによって取得可能な情報がある程度限定され、以降の検索処理は最初に限られた情報の中での探索となる。このため、ユーザの検索の目的がはっきりしていない場合や、目的や欲しい情報を象徴している検索キーワードの設定が適切でなかった場合には、所望の情報を取得することは難しくなる。また、ある程度一定の興味や目的に応じてユーザにより入力される検索キーワードでは、情報の検索範囲や方向性がある程度決まってしまうため、ユーザが取得可能な情報がマンネリ化する恐れがあり、検索を行いながら新しい興味の発見や気づきにつながるような情報を取得することは難しい。
本発明は、上記問題点に鑑みてなされたものであり、検索キーワードに限定されない多様なコンテンツを発見することが可能なコンテンツ発見装置を提供することを目的とする。
上記課題を解決するために、請求項1に記載の発明は、検索キーワードによるコンテンツの検索を行う検索手段と、前記検索手段による検索結果と、過去の検索結果とをグループ分け対象コンテンツとして選択するグループ分対象選択手段と、前記グループ分対象選択手段により選択された検索結果を類似グループにグループ分けするグループ分手段と、前記グループ分手段によるグループ分けによって生成された類似グループから当該類似グループを特徴づけるキーワードを抽出しこれを関連キーワードとして前記類似グループに対応付ける関連キーワード対応付手段と、前記関連キーワード対応付手段により対応付けられた関連キーワードを提示する提示手段とを備え、前記検索手段は、前記提示手段により提示された関連キーワードが選択された場合に、該選択された関連キーワードを新たな前記検索キーワードとしてコンテンツの再検索を行うことを特徴とするコンテンツ発見装置を提供する。
この構成によれば、コンテンツ発見装置は、検索が繰り返される毎に今までの検索結果をグループ分け対象コンテンツとして取り込んでグループ分けを行い、グループを特徴づける多様な関連キーワードをユーザに提示し、提示された関連キーワードが選択された場合に、選択された関連キーワードを検索キーワードとしてコンテンツの検索を繰り返すことができる。このため、ユーザは、検索キーワードに限定されない多様なコンテンツを発見することが可能となる。
請求項2に記載の発明は、請求項1に記載のコンテンツ発見装置において、検索に用いられた検索キーワードの履歴を記憶するキーワード履歴記憶手段をさらに備え、前記グループ分対象選択手段は、前記キーワード履歴記憶手段に記憶されている検索キーワードによる検索結果をグループ分け対象コンテンツとして選択することを特徴とする。
この構成によれば、過去に検索に用いられた検索キーワードの履歴を記憶させておくことによって、過去の検索キーワードの履歴を正確に管理することができ、グループ分け対象コンテンツとして選択すべき検索結果を把握するのが容易になる。また、過去の検索キーワードの履歴をユーザに提示することができる。
請求項3に記載の発明は、請求項2に記載のコンテンツ発見装置において、前記キーワード履歴記憶手段から抽出すべき検索キーワードの数を記憶する検索キーワード数記憶手段をさらに備え、前記グループ分対象選択手段は、前記検索キーワード数記憶手段に記憶されている数だけの検索キーワードを前記キーワード履歴記憶手段から抽出し、該抽出された検索キーワードによる検索結果をグループ分け対象コンテンツとして選択することを特徴とする。
この構成によれば、検索キーワード数記憶手段を用いてキーワード履歴記憶手段から抽出される検索キーワードの数を制限することができ、グループ分け対象コンテンツの数が膨大となるのを防ぐことができる。また、適切な検索キーワードを優先的に抽出することができる。
請求項4に記載の発明は、請求項1から3の何れか1項に記載のコンテンツ発見装置において、検索キーワードによる検索結果のうち、グループ分け対象コンテンツとして選択すべき検索結果の数を記憶する検索結果数記憶手段をさらに備え、前記グループ分対象選択手段は、前記検索キーワードによる検索結果のうち、前記検索結果数記憶手段に記憶されている数だけの検索結果をグループ分け対象コンテンツとして選択することを特徴とする。
この構成によれば、グループ分け対象コンテンツの数を制限することができ、グループ分け対象コンテンツの数が膨大となり、処理負荷がかかるという不具合を解消することができる。
本発明によれば、コンテンツ発見装置は、検索が繰り返される毎に今までの検索結果をグループ分け対象コンテンツとして取り込んでグループ分けを行い、グループを特徴づける関連キーワードをユーザに提示し、提示された関連キーワードが選択された場合に、選択された関連キーワードを検索キーワードとしてコンテンツの検索を繰り返すことができる。このため、ユーザは、検索キーワードに限定されない多様なコンテンツを発見することが可能となる。
次に、図面を参照しながら、本発明を実施するための最良の形態について説明する。なお、以下の説明において参照する各図においては、他の図と同等部分に同一符号が付されている。
図1は、本発明の実施の形態に係るコンテンツ発見装置10の機能構成を例示する図である。同図に示すように、コンテンツ発見装置10は、ユーザからのキーワードの入力や検索結果の表示等の入出力を管理する入出力部11と、入力されたキーワードをもとにネットワークヘアクセスしてコンテンツを検索するWeb検索部12と、取得したコンテンツのURLやコンテンツの実体、及び、コンテンツの内容に基づく特徴情報等のコンテンツに関する情報を管理するコンテンツ管理部13と、コンテンツの内容に応じて類似コンテンツのグループ分けを行い関連キーワードを抽出するグループ管理部14と、検索キーワードやその検索結果から抽出される関連キーワード、及び、ユーザが選択した関連キーワード等の、キーワードの履歴情報を管理するキーワード管理部15とを含んで構成される。ここで、コンテンツ発見装置10は、プログラムを実行し全体を制御するCPU(Central Processing Unit)と、プログラム及びデータを記憶する記憶装置と、入出力装置とを備えた一般的なコンピュータである。
次に、コンテンツ発見装置10の機能構成について詳細に説明する。Web検索部12は、ネットワークを介して他の装置と通信を行うための通信インターフェース、CPU及びプログラムで構成される。Web検索部12は、ユーザが入力した検索キーワード、及び、ユーザが選択した関連キーワードについての情報を入出力部11から取得する。Web検索部12は、入出力部11から取得した検索キーワードにマッチするコンテンツを、ネットワークを介して検索する。なお、Web検索部12は、ユーザが選択した関連キーワードを入出力部11から取得した場合には、当該関連キーワードを検索キーワードとして扱い、検索を行う。
コンテンツ管理部13は、CPU、プログラム、及び、記憶装置を含んで構成される。コンテンツ管理部13は、Web検索部12で得られたコンテンツの実体、インターネットにおけるコンテンツの所在を表すURL、及び、コンテンツの内容から抽出される特徴情報などを含むコンテンツ情報を、記憶装置に設けられたコンテンツ情報DB(database;データベース)16に保存する。
キーワード管理部15は、CPU、プログラム、及び、記憶装置で構成される。キーワード管理部15は、記憶装置に設けられたキーワード履歴記憶DB18にキーワード履歴情報を保存する。当該キーワード履歴情報には、検索キーワードによる検索結果をグループ分けして生成されたグループ毎の関連キーワードと、検索キーワードの履歴(ユーザが入力した検索キーワード、及び、ユーザがこれまでに選択した関連キーワード群)とが含まれる。
キーワード管理部15はグループ分対象選択機能151を備えている。グループ分対象選択機能151は、Web検索部12による検索結果と、過去の検索結果とをグループ分け対象コンテンツとして選択する。具体的には、グループ分対象選択機能151は、まず、キーワード履歴記憶DB18から検索に使用された検索キーワードの履歴を取得し、当該取得した検索キーワードによる検索結果をグループ分対象コンテンツとしてコンテンツ情報DB16から抽出する。そして、グループ分対象選択機能151は、抽出した過去の検索キーワードによる検索結果と、入出力部11から今回入力された検索キーワードに基づいてWeb検索部12により検索された検索結果とをマージし、当該マージした検索結果を最終的なグループ分け対象コンテンツとしてグループ管理部14へ引き渡す。なお、入出力部11から今回入力された検索キーワードが既にキーワード履歴記憶DB18に登録されており、当該今回入力された検索キーワードが過去の検索キーワードと共にキーワード履歴記憶DB18から抽出される構成としている場合には、グループ分対象選択機能151は、キーワード履歴記憶DB18から抽出した検索キーワードによる検索結果をそのまま最終的なグループ分け対象コンテンツとして選択し、グループ管理部14へ引き渡す。
ここで、グループ分け対象コンテンツの数を制御するためのデータベースとして、検索キーワード数記憶DB19及び検索結果数記憶DB20が記憶装置に設けられている。検索キーワード数記憶DB19には、キーワード履歴記憶DB18から抽出すべき検索キーワードの数が記憶されている。
グループ分対象選択機能151は、検索キーワード数記憶DB19に記憶されている数だけの検索キーワードをキーワード履歴情報DB18から抽出し、当該抽出された検索キーワードによる検索結果をグループ分け対象コンテンツとして選択する。
なお、キーワード履歴記憶DB18からグループ分け対象コンテンツを選択する場合のルールとしては、例えば、直近にキーワード履歴記憶DB18に登録された検索キーワードから優先的に抽出する。このようにすれば、相対的に古い検索キーワードを除外することができ、現在のユーザの興味に近いコンテンツを効率的に発見することができる。また、例えば、今回の検索キーワードに意味が近い過去の検索キーワードを優先的に抽出するようにしてもよい。
なお、検索キーワード数記憶DB19に記憶されている数だけの検索キーワードがキーワード履歴記憶DB18に記憶されていない場合には、グループ分対象選択機能151は、キーワード履歴記憶DB18に記憶されている全ての検索キーワードを抽出する。
また、検索結果数記憶DB20には、検索キーワードによる検索結果のうち、グループ分け対象コンテンツとして選択すべき検索結果の数が記憶されている。ここでの選択すべき検索結果の数は、各検索キーワード(過去の検索キーワード、今回の検索キーワード)による検索結果各々から選択すべき検索結果の数であってもよいし、検索結果がマージされた後の全体の検索結果から選択すべき検索結果の数であってもよい。グループ分対象選択機能151は、検索結果数記憶DB20を参照して、検索キーワードによる検索結果のうち、検索結果数記憶DB20に記憶されている数だけの検索結果をグループ分け対象コンテンツとして選択する。
グループ管理部14は、CPU、プログラム、及び、記憶装置で構成される。グループ管理部14は、グループ分機能141及び関連キーワード対応付機能142を備えている。グループ分機能141は、グループ分対象選択機能151によりグループ分け対象コンテンツとして選択された検索結果各々について、コンテンツ情報中の特徴情報を解析し、コンテンツの特徴を利用したグループ分けを行い、コンテンツのグループを生成する。
関連キーワード対応付機能142は、生成された各グループに対して、当該グループを特徴づける関連キーワードを対応付ける。具体的には、関連キーワード対応付機能142は、各グループに属するコンテンツの中から各グループを特徴付ける関連キーワードを抽出する。そして、関連キーワード対応付機能142は、各コンテンツがどのグループに別けられたかをグループ、関連キーワード及びコンテンツとの対応情報として、記憶装置に設けられている、グループとコンテンツの対応情報データベース(以下「対応情報DB」という)17に保存する。
入出力部11は、例えば、キーボード、ディスプレイ、及び、入出力インターフェースで構成される。入出力部11は、入力機能111と提示機能112とを備えている。入力機能111は、ユーザが入力した検索キーワード及び画面上で選択された関連キーワードを受け付ける。提示機能112は、キーワード管理部15やグループ管理部14等からの指示により、キーワードやコンテンツの一覧をディスプレイに表示する。
図2には、提示機能112によりコンテンツ発見装置10のディスプレイに表示されるコンテンツ表示画面402の一例を示す。同図に示すように、コンテンツ表示画面402は、キーワード表示部402−1とコンテンツ表示部402−2とから構成される。キーワード表示部402−1には、検索キーワード(ここでは「スポーツ」)と、グループ毎の関連キーワード(ここでは「野球」、「運動」、「秋」)とが表示される。また、コンテンツ表示部402−2には、グループ毎のコンテンツ一覧が表示される。
次に、図3に示す処理フローを参照しながら、コンテンツ発見装置10が行うコンテンツ発見の処理の流れを説明する。
まず、コンテンツ発見装置10の入出力部11がユーザから検索キーワードを取得すると(ステップS601)、キーワード管理部15は検索キーワードをキーワード履歴記憶DB18に登録する(ステップS602)。Web検索部12は、検索キーワードをもとに、インターネット等のネットワークを介してコンテンツを取得する(ステップS603)。
コンテンツ管理部13では、Web検索部12が取得したコンテンツを解析し、コンテンツのURL、コンテンツの実体データ、及び、コンテンツの内容から取得される特徴情報等を含むコンテンツ情報をコンテンツ情報DB16に格納する(ステップS604)。コンテンツの内容から特徴情報を抽出する方法としては、例えばHTML(Hyper Text Markup Language)のようなテキストデータからなるコンテンツに対して、形態素解析によってコンテンツ中に出現する単語の頻度を数えることでコンテンツの特徴量として数値化するやり方がある。
グループ管理部14では、キーワード管理部15に対してキーワード履歴記憶DB18に複数の検索キーワードの履歴があるかどうかを問い合わせる(ステップS605)。複数の検索キーワードの履歴がある場合には(ステップS605;yes)、キーワード管理部15のグループ分対象選択機能151は、キーワード履歴記憶DB18から過去の検索キーワードを抽出し、抽出した各検索キーワードに該当するコンテンツ情報をコンテンツ管理部13から取得する。グループ分対象選択機能151は、今回の検索キーワードと過去の検索キーワードとから取得された全コンテンツ情報をマージし、グループ分け対象コンテンツとしてグループ管理部14へ引き渡す(ステップS606)。
グループ管理部14のグループ分機能141は、グループ分け対象コンテンツのコンテンツ情報をもとにコンテンツ群を複数の類似グループに分け、グループとそこに属するコンテンツの対応情報を対応情報DB17に保存する。コンテンツ情報をもとに類似グループに分ける方法としては、数値化された特徴量を利用してクラスタリングによってコンテンツ間の類似度を求め、類似度の高い順にグループを作成するものがある。
また、グループ管理部14の関連キーワード対応付機能142は、各グループからグループを特徴付けるキーワードである関連キーワードを抽出する(ステップS607)。関連キーワードを抽出する方法としては、グループ内の全コンテンツに共通して多く含まれる単語を関連キーワードとして抽出するやり方や、各グループ間での単語の出現頻度のばらつきを調べ、特定のグループにだけ高い頻度で出現する単語を関連キーワードとして抽出するやり方がある。また、コンテンツから抽出する以外に、グループ内の全コンテンツを特徴付ける概念を表すキーワードを新たに生成し、そのキーワードを関連キーワードとしてもよい。
キーワード管理部15は、グループ管理部14によって抽出された関連キーワードをキーワード履歴記憶DB18に保存する(ステップS608)。入出力部11の提示機能112は、検索キーワードおよび関連キーワードのリストと、グループ分けされた検索結果をユーザへ表示する(ステップS609)。
入出力部11の入力機能111がユーザからグループ(又は、関連キーワード)選択の操作を受信すると(ステップS610;yes)、キーワード管理部15はユーザが選択したグループの関連キーワードを検索キーワードとして設定し(ステップS611)、当該検索キーワードをキーワード履歴記憶DB18へ保存する(ステップS602)。Web検索部12及びコンテンツ管理部13によって当該検索キーワードに該当するコンテンツの取得及びコンテンツ情報の格納が行われると(ステップS603、ステップS604)、キーワード管理部15は、キーワード履歴記憶DB18からこれまでにユーザが選択してきた検索キーワードを抽出し、各検索キーワードに対応するコンテンツ情報をコンテンツ管理部13から取得してマージし、より多くのコンテンツをグループ管理部14へ引き渡す(ステップS606)。キーワード管理部15のグループ分対象選択機能151がキーワード履歴記憶DB18から抽出してマージする過去の検索キーワードの数は、検索キーワード数記憶DB19を用いて任意に設定することが可能であり、予めコンテンツ発見装置10側で抽出すべき検索キーワードの数を固定的に設定する場合や、ユーザからの操作によって随時抽出すべき検索キーワードの数を変更する場合もある。また、マージした結果のコンテンツ数が膨大となる場合などに、検索結果数記憶DB20を用いて、各キーワード毎に検索結果として抽出するコンテンツの数を任意に設定する場合もある。
グループ管理部14は、キーワード管理部15から取得したコンテンツ情報に対してグループ分けを行い、各グループに対応する関連キーワードを抽出し(ステップS607)、入出力部11の提示機能112が検索キーワードおよび関連キーワードのリストとグループ分けされたコンテンツ群をユーザへ表示する(ステップS609)。
入出力部11がユーザから個別コンテンツ選択の操作を検知すると(ステップS612;yes)、提示機能112は、選択されたコンテンツに関するコンテンツ情報をコンテンツ管理部13から取得し、ユーザに当該コンテンツ情報を表示する(ステップS613)。
次に、図4を参照しながら、本実施形態に係る動作例について説明する。まず、ユーザはコンテンツ発見装置10のキーボードを操作することにより、図4(a)に示す検索キーワード入力画面を表示する。ユーザが検索キーワード入力画面401に検索キーワードとしてキーワード1を入力すると、コンテンツ発見装置10の入出力部11は、キーワード1を検索キーワードとして受け付ける。Web検索部12は、キーワード1にマッチするコンテンツを検索する。
次に、図4(b)に示すように、グループ管理部14のグループ分機能141は、キーワード1にマッチするコンテンツ全体403をコンテンツの内容でグループ別けし、グループ403−1,403−2,403−3を生成する。関連キーワード対応付機能142は、グループ403−1,403−2,403−3毎に、各グループを特徴付ける関連キーワード(ここでは、キーワード2、キーワード2’、キーワード2”)を対応付ける。
入出力部11の提示機能112は、ディスプレイに図4(c)に示すコンテンツ表示画面402を表示する。コンテンツ表示画面402のキーワード表示部402−1には、検索キーワード(キーワード1)とグループ毎の関連キーワード(キーワード2,2’,2”)とが表示される。またコンテンツ表示部402−2には、キーワード2で特徴付けられるコンテンツ一覧と、キーワード2’で特徴付けられるコンテンツ一覧と、キーワード2”で特徴付けられるコンテンツ一覧とがグループ分けされて表示される。
次に、ユーザが、図4(c)に示すキーワード表示部402−1に表示されているキーワード2を選択する操作を行ったものとすると、キーワード管理部15のグループ分対象選択機能151は、選ばれたキーワード2にマッチするコンテンツと、過去の検索キーワードであるキーワード1にマッチするコンテンツとをグループ分け対象コンテンツとしてマージする。グループ管理部14のグループ分機能141は、キーワード1にマッチするコンテンツとキーワード2にマッチするコンテンツとの全体405をコンテンツの内容でグループ別けし、3つのグループ405−1,405−2,405−3を生成する。関連キーワード対応付機能142は、グループ毎に各グループを特徴付けるキーワード3,3’,3”を対応付ける(図4(d))。
提示機能112は、ディスプレイに図4(e)に示すコンテンツ表示画面402を表示する。コンテンツ表示画面402のキーワード表示部402−1には検索キーワード(キーワード1,2)と関連キーワード(キーワード3,3’、3”)とが表示される。また、コンテンツ表示部402−2には、キーワード3で特徴づけられるコンテンツ一覧と、キーワード2’で特徴付けられるコンテンツ一覧と、キーワード2”で特徴付けられるコンテンツ一覧とがグループ分けされて表示される。
同様の操作を繰り返すと、コンテンツ表示画面402のキーワード表示部402−1には、ユーザが入力又は選択したn個のキーワードによって取得されるコンテンツ全てを対象にグループ分けを行った場合の関連キーワード(キーワード(n+1)、キーワード(n+1)’、・・・)と、入力又は選択済みのn個の全キーワード(キーワード1、キーワード2、・・・、キーワードn)のリストが表示される。また、コンテンツ表示部402−2には、関連キーワード(キーワード(n+1)、キーワード(n+1)’、・・・)各々に特徴付けられるコンテンツの一覧が表示される。
以上説明したように、コンテンツ発見装置10は、ユーザから受信した検索キーワードをもとに検索を行い、取得したコンテンツのグループ分けを行ってグループを特徴付けるキーワードを関連キーワードとして抽出し、検索キーワード及び関連キーワードのリストと、グループ分けされたコンテンツ一覧とを表示する。そして、ユーザが選択した関連キーワードによって再検索を行い、過去の検索結果と共にマージをし、グループ化を行い、関連キーワードを抽出する、という処理を繰り返していくことで、最初に入力された検索キーワードによって限定された検索結果を絞り込んでいくのではなく、最初に入力された検索キーワードに関連した情報をどんどん検索結果として取り込み、検索結果を関連性のあるコンテンツ群に拡張していくことで、マンネリ化しない新たなコンテンツの発見を実現することができる。
このように、検索を繰り返す毎に、より多くのコンテンツを対象にグループ分けを行い、関連キーワードの抽出を行うことができるため、多様な関連キーワードに関連する多様なコンテンツを取得することが可能となり、キーワード検索でありながら、検索キーワードに限定されない多様な検索結果を得ることができる。
従来の絞りこみ型の検索エンジンでは、最初の検索キーワードによって取得可能な情報がある程度限定され、以降の検索処理は最初に限られた情報の中での探索となるため、ユーザの検索の目的がはっきりしていない場合や、目的や欲しい情報を象徴している検索キーワードの設定が適切でない場合に、ユーザは所望の情報を取得することが難しかったが、本実施形態に係るコンテンツ発見装置10によればユーザは所望の情報を取得しやすくなる。また、ユーザが取得可能な情報がマンネリ化することがなく、検索を行いながら新しい興味の発見や気づきにつながるような情報を取得することが可能となる。
[変形例]
以上、本発明の実施形態について説明したが、本発明は係る実施形態に限定されるものではなく、その技術思想の範囲内で様々な変形が可能である。変形例としては、例えば、以下のようなものが考えられる。
(1)上述した実施形態においては、ユーザはコンテンツ発見装置10のキーボード及びディスプレイを用いて検索キーワードの入力や検索結果の確認を行うとして説明したが、ユーザは自己が所持する携帯電話機やパーソナルコンピュータからコンテンツ発見装置10に無線又は有線で接続して検索キーワードの送信や検索結果の受信を行うようにしてもよい。
(2)上述した実施形態においては、インターネット上のコンテンツを検索する実施形態について説明したが、これに限定されることはなく、例えば、コンテンツ発見装置10のデータベースに格納されている文書ファイル等のコンテンツを検索してもよい。
(3)上述した実施形態においては、グループ分け対象となる過去の検索キーワードによる検索結果をコンテンツ情報DB16から取得するとして説明したが、処理負荷がかからない場合には、過去の検索キーワードで再度インターネット検索を行うことにより、グループ分け対象となるコンテンツを取得してもよい。
(4)キーワード履歴記憶DB18に格納されている検索キーワードの履歴及び関連キーワードの履歴と、対応情報DB17に蓄積されているグループ(関連キーワード)とコンテンツの対応情報とを用いて、過去に表示したコンテンツ表示画面402画面を再度表示可能な仕組みを構築してもよい。
(5)上述した実施形態においては、関連キーワード(キーワードn)が選択された場合に、コンテンツ表示部402−2には、新たに抽出された関連キーワード(キーワード(n+1)、キーワード(n+1)’、・・・)に特徴付けられたコンテンツの一覧が表示されるとして説明したが、表示内容はこれに限定されることはない。例えば、コンテンツ表示部402−2に、今までの検索キーワード(キーワード1、キーワード2、・・・、キーワード(n−1))の少なくとも1つにマッチするコンテンツの中で、今回選択された関連キーワード(キーワードn)の特徴をもつコンテンツを表示してもよい。また、画面分割により複合的な表示を行うようにしてもよい。
本発明の実施の形態に係るコンテンツ発見装置の機能構成を示すブロック図である。 同実施の形態に係るコンテンツ表示画面の一例を示す図である。 同実施の形態に係るコンテンツ発見装置が行う処理手順の一例を示すフロー図である。 同実施の形態に係るコンテンツ発見装置が行うコンテンツ発見の手順の一例を説明するための図である。 従来の検索エンジンを用いた検索手順の一例を説明するための図である。 従来の検索装置の機能構成の一例を示す図である。 従来の検索装置が行う検索処理手順の一例を示すフロー図である。
符号の説明
10 コンテンツ発見装置
11 入出力部
111 入力機能
112 提示機能
12 Web検索部
13 コンテンツ管理部
14 グループ管理部
141 グループ分機能
142 関連キーワード対応付機能
15 キーワード管理部
151 グループ分対象選択機能
16 コンテンツ情報DB
17 対応情報DB
18 キーワード履歴記憶DB
19 検索キーワード数記憶DB
20 検索結果数記憶DB
401 検索キーワード入力画面
402 コンテンツ表示画面
402−1 キーワード表示部
402−2 コンテンツ表示部

Claims (4)

  1. 検索キーワードによるコンテンツの検索を行う検索手段と、
    前記検索手段による検索結果と、過去の検索結果とをグループ分け対象コンテンツとして選択するグループ分対象選択手段と、
    前記グループ分対象選択手段により選択された検索結果を類似グループにグループ分けするグループ分手段と、
    前記グループ分手段によるグループ分けによって生成された類似グループから当該類似グループを特徴づけるキーワードを抽出しこれを関連キーワードとして前記類似グループに対応付ける関連キーワード対応付手段と、
    前記関連キーワード対応付手段により対応付けられた関連キーワードを提示する提示手段と
    を備え、
    前記検索手段は、前記提示手段により提示された関連キーワードが選択された場合に、該選択された関連キーワードを新たな前記検索キーワードとしてコンテンツの再検索を行うことを特徴とするコンテンツ発見装置。
  2. 検索に用いられた検索キーワードの履歴を記憶するキーワード履歴記憶手段をさらに備え、
    前記グループ分対象選択手段は、前記キーワード履歴記憶手段に記憶されている検索キーワードによる検索結果をグループ分け対象コンテンツとして選択することを特徴とする
    請求項1に記載のコンテンツ発見装置。
  3. 前記キーワード履歴記憶手段から抽出すべき検索キーワードの数を記憶する検索キーワード数記憶手段をさらに備え、
    前記グループ分対象選択手段は、
    前記検索キーワード数記憶手段に記憶されている数だけの検索キーワードを前記キーワード履歴記憶手段から抽出し、該抽出された検索キーワードによる検索結果をグループ分け対象コンテンツとして選択することを特徴とする
    請求項2に記載のコンテンツ発見装置。
  4. 検索キーワードによる検索結果のうち、グループ分け対象コンテンツとして選択すべき検索結果の数を記憶する検索結果数記憶手段をさらに備え、
    前記グループ分対象選択手段は、
    前記検索キーワードによる検索結果のうち、前記検索結果数記憶手段に記憶されている数だけの検索結果をグループ分け対象コンテンツとして選択することを特徴とする
    請求項1から3の何れか1項に記載のコンテンツ発見装置。
JP2004317285A 2004-10-29 2004-10-29 コンテンツ発見装置 Expired - Fee Related JP5060020B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004317285A JP5060020B2 (ja) 2004-10-29 2004-10-29 コンテンツ発見装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004317285A JP5060020B2 (ja) 2004-10-29 2004-10-29 コンテンツ発見装置

Publications (2)

Publication Number Publication Date
JP2006127325A JP2006127325A (ja) 2006-05-18
JP5060020B2 true JP5060020B2 (ja) 2012-10-31

Family

ID=36721992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004317285A Expired - Fee Related JP5060020B2 (ja) 2004-10-29 2004-10-29 コンテンツ発見装置

Country Status (1)

Country Link
JP (1) JP5060020B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4755122B2 (ja) * 2007-02-16 2011-08-24 日本電信電話株式会社 画像辞書生成方法及び装置及びプログラム
KR100930455B1 (ko) 2007-09-06 2009-12-08 엔에이치엔(주) 쿼리별 검색 컬렉션 생성 방법 및 시스템
JP5161658B2 (ja) 2008-05-30 2013-03-13 株式会社東芝 キーワード入力支援装置、キーワード入力支援方法及びプログラム
JP5355949B2 (ja) * 2008-07-16 2013-11-27 株式会社東芝 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム
KR101172487B1 (ko) * 2010-11-29 2012-08-14 엔에이치엔(주) 검색 결과 내에 첨부된 정보 데이터베이스에 기초한 검색 리스트 및 검색어 순위 제공 방법 및 시스템
JP6925244B2 (ja) * 2017-11-20 2021-08-25 ヤフー株式会社 情報処理装置、情報処理方法、および情報処理プログラム
JP7042720B2 (ja) * 2018-09-11 2022-03-28 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
CN111813828B (zh) * 2020-06-30 2024-02-27 北京百度网讯科技有限公司 一种实体关系挖掘方法、装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4955843B2 (ja) * 1998-08-31 2012-06-20 三菱電機株式会社 情報検索システム、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002312389A (ja) * 2001-04-10 2002-10-25 Gluons Co Ltd 情報検索装置および情報検索方法

Also Published As

Publication number Publication date
JP2006127325A (ja) 2006-05-18

Similar Documents

Publication Publication Date Title
US8204881B2 (en) Information search, retrieval and distillation into knowledge objects
US8661031B2 (en) Method and apparatus for determining the significance and relevance of a web page, or a portion thereof
RU2424566C2 (ru) Использование обратной связи с пользователем для улучшения результатов поиска
US8131684B2 (en) Adaptive archive data management
US20110225115A1 (en) Systems and methods for facilitating open source intelligence gathering
CN110637316B (zh) 用于预期对象识别的系统和方法
US20020090148A1 (en) Image and text searching techniques
WO2007051397A1 (fr) Systeme d’extraction d’informations et procede d’extraction d’informations
EP1158423A2 (en) Internet site search service system using a meta search engine
CN103942198B (zh) 用于挖掘意图的方法和设备
US6522780B1 (en) Indexing of images and/or text
JP6648283B2 (ja) 人工知能ベースの関連度計算を用いたノート提供方法及び装置
CN112000790B (zh) 一种法律文本精确检索方法、终端系统和可读存储介质
JP5060020B2 (ja) コンテンツ発見装置
CN106919593B (zh) 一种搜索的方法和装置
JP2007034772A (ja) Webサイト検索結果の最適表示システム及びその装置及びその方法及びそのプログラム
KR100557874B1 (ko) 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체
EP1158421A2 (en) Internet site search service system having a function of building individual meta search engines
JP6144799B2 (ja) 検索結果内に添付された情報データベースに基づいた検索リスト及び検索語順位の提供方法及びシステム
US20140095465A1 (en) Method and apparatus for determining rank of web pages based upon past content portion selections
KR20210100389A (ko) 유사 특허 검색 방법
KR20020014026A (ko) 웹 개인화에 바탕한 뉴스 추적 및 분석 서비스
JPH11232278A (ja) 情報源推薦装置
US7577649B2 (en) Engine for validating proposed changes to an electronic entity
US20150046437A1 (en) Search Method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100223

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100423

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100608

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100819

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100916

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20101015

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120803

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150810

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150810

Year of fee payment: 3

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D04

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees