JP2009245382A - コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体 - Google Patents

コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2009245382A
JP2009245382A JP2008093987A JP2008093987A JP2009245382A JP 2009245382 A JP2009245382 A JP 2009245382A JP 2008093987 A JP2008093987 A JP 2008093987A JP 2008093987 A JP2008093987 A JP 2008093987A JP 2009245382 A JP2009245382 A JP 2009245382A
Authority
JP
Japan
Prior art keywords
information
content
user
search
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008093987A
Other languages
English (en)
Inventor
Keinosuke Matsumoto
啓之亮 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka University NUC
Osaka Prefecture University
Original Assignee
Osaka University NUC
Osaka Prefecture University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC, Osaka Prefecture University filed Critical Osaka University NUC
Priority to JP2008093987A priority Critical patent/JP2009245382A/ja
Publication of JP2009245382A publication Critical patent/JP2009245382A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】 検索対象情報の中からユーザの嗜好に適合した情報を検索する用途に用いられるコンテンツ検索装置を提供する。
【解決手段】 本発明のコンテンツ検索装置は、個々のコンテンツの属性を数値化したコンテンツ情報を記録するコンテンツデータベースと、ユーザのIDとユーザのコンテンツに対する嗜好を属性ごとに数値化したユーザ情報とを記憶するユーザデータベースと、ユーザが検索情報システムにアクセスするごとに検索情報の属性を数値化したアクセス情報を入力するアクセス情報入力部と、前記コンテンツ情報とユーザ情報とアクセス情報とを、それぞれの特徴量で定まる固有ベクトルを計算する固有ベクトル算出部と、前記アクセス情報とユーザ情報とをそれぞれ重み付けしたベクトルの和と、前記コンテンツ情報のベクトルの内積を計算する演算部と、前記演算部によって実行された演算結果に基づいて、コンテンツを順序付けする順序付け部とを備える。
【選択図】 図3

Description

本発明は、検索対象情報の中からユーザの嗜好に適合した情報を検索する用途に用いられるコンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体に関する。
インターネットなどに代表される通信ネットワークの急速な普及に伴い、ネットワーク上に膨大なデジタルコンテンツが存在する。ユーザは、これらの膨大なデジタルコンテンツを検索し、所望のデジタルコンテンツを入手することができるようになった。このような膨大なデジタルコンテンツにアクセスするための入口として、キーワードを入力してWebサイトを検索する検索サイトや、カテゴリごとにWebサイトを分類したリンク集を持つポータルサイトなどがある。
ユーザは、検索サイトにおいていくつかのキーワードを入力することにより、所望のコンテンツを探し当てる。検索エンジンは、膨大な数のWebサイトの中からキーワードマッチングでヒットしたWebサイトを瞬時に一覧表示させる。しかし、音楽、映像、写真のようなテキスト以外のコンテンツの場合、キーワード検索で所望のコンテンツを探しだすのは、容易でない。
これを解決するための手法として、ベクトル空間モデル(VSM)を用いたものが提案されている。この手法では、入力文書の単語の有無や出現数を特徴量とし、検索対象データと入力文書の類似度を算出する。VSMを用いる手法では、特徴ベクトルの算出手法、ベクトル間の距離について盛んに研究が行われており、Cornell大学のSMART、City大学のOkapi、Massachusetts大学のINQUERYなどが知られている。ところがこれらは文書中に含まれる単語の発生頻度を軸としてベクトルを構成したものであり、ある検索キーワードに対する相対関係はわかっても、文書内容の意味的特徴やユーザの検索意図への適合性は評価できない。
このため、ユーザの問い合わせに対応する問い合わせ情報と検索対象となるコンテンツに付加される特徴情報をそれぞれベクトル化したものを用いてコンテンツを評価して情報を検索するシステムが開示されている。
特開2006−228255号公報
特許文献1に記載の方法では、ユーザが対話処理などにより入力した内容からキーワードと属性値を抽出する。しかし、コンテンツ情報を検索する場合、検索に要求される属性は、ユーザが任意に入力した内容から抽出しなくても、属性を特定できる。また、検索方法に学習機能を持たせておけば、アクセスの回収が増えるにつれて、より正確な検索が可能となる。
また、近年お互い同じ関心を持つユーザ同士でコミュニティを形成することが行われている。コンテンツ情報を検索した結果を用いてコミュニティを形成すると、商品・サービスの情報を共有するユーザ同士を探すのが容易になる。
すなわち、本発明は、上記問題に鑑みなされたものであり、その目的は、簡単な機能で、検索対象情報の中からユーザの嗜好に適合した情報を検索する用途に用いられるコンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体を提供することにある。
また、本発明の別の目的は、商品・サービスの情報を共有するユーザ同士を探すのが容易になるコンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体を提供することにある。
本発明のコンテンツ検索装置は、個々のコンテンツの属性を数値化したコンテンツ情報を記録するコンテンツデータベースと、ユーザのIDとユーザのコンテンツに対する嗜好を属性ごとに数値化したユーザ情報とを記憶するユーザデータベースと、ユーザが検索情報システムにアクセスするごとに検索情報の属性を数値化したアクセス情報を入力するアクセス情報入力部と、前記コンテンツ情報とユーザ情報とアクセス情報とを、それぞれの特徴量で定まる固有ベクトルを計算する固有ベクトル算出部と、前記アクセス情報とユーザ情報とをそれぞれ重み付けしたベクトルの和と、前記コンテンツ情報のベクトルの内積を計算する演算部と、前記演算部によって実行された演算結果に基づいて、コンテンツを順序付けする順序付け部とを備える。
コンテンツ情報は、各コンテンツが有する属性とその属性の属性値(属性を数値化したもの)のリストを含む。コンテンツ情報は、その初期値をコンテンツ検索装置の管理者が設定する。コンテンツ情報は、一定値ではなく、ユーザからのアクセスを受けてその値が更新される。
アクセス情報は、ユーザが検索システムにアクセスする際に、ユーザの検索目的を表現する属性とその属性の属性値のリストである。アクセス情報は、ユーザが検索システムにアクセスするたびに入力する。
ユーザ情報は、ユーザから検索システムへアクセスがあるたびに更新される、属性とその属性の属性値のリストを含む。ユーザ情報は、ユーザが検索システムに登録する際に初期データとして、ID No.、名前やE−mailアドレスなどと共に入力される。ユーザ情報は、ユーザから検索システムへアクセスがあるたびに選択したコンテンツの影響を受け、毎回更新される。
本発明では、これらのコンテンツ情報とアクセス情報とユーザ情報とを、それぞれの特徴量で定まるそれぞれの固有ベクトルを得る。次に、アクセス情報のベクトルとユーザ情報のベクトルとをそれぞれ重み付けしたベクトルの和をとる。
次に、アクセス情報のベクトルとユーザ情報のベクトルとをそれぞれ重み付けしたベクトルの和と、コンテンツ情報のベクトルとの内積をとる。内積の値の大きいものほど、ユーザの嗜好が高いコンテンツとなる。したがって、内積の値の大きい順にコンテンツを順序付けする。順序付けされたコンテンツの上位にあるコンテンツをユーザに表示する。
また、複数のユーザが検索システムを利用することにより、それぞれのユーザのユーザ情報が得られる。これを、それぞれの特徴量で定まるベクトルの座標位置から定まる位置情報をクラスタリングする。このクラスタリングに基づいて共通の嗜好を持つユーザ同士でコミュニティを形成することができる。
本発明では、属性を数値化した、コンテンツ情報とアクセス情報とユーザ情報を用いて、ユーザの嗜好と合致するコンテンツを検索する。数値化されたデータのみを用いて、コンテンツを検索するので、検索が容易である。また、使用頻度に応じて、コンテンツ情報とユーザ情報が更新される。すなわち、検索機能が学習するので、よりユーザの嗜好に合致したコンテンツを検索できる。
また、複数のユーザが行った検索の結果から、共通の嗜好を持つユーザ同士でコミュニティを形成することができる。
以下に、本発明を、図面を用いて詳細に説明する。
[構成]
図1は、本発明におけるコンテンツ検索装置の実施形態の一例を示す図である。図1に示されるように、本発明のコンテンツ検索装置11は、ネットワーク12に接続され、このネットワーク12を介して、ユーザが利用するユーザ端末13に接続されている。
コンテンツ検索装置は、より具体的には、ユーザ端末13は、インターネットまたはローカルエリアネットワークなどのネットワーク12を介して、コンテンツ検索装置11に対して、コンテンツの検索要求をする。コンテンツ検索装置11は、インターネットまたはローカルエリアネットワークなどのネットワーク12を介して、検索結果としてユーザ端末13の画面に、コンテンツの代表画やコンテンツの名前などを表示させる。ユーザは、所望するコンテンツを選択してコンテンツ検索装置11に対して取得を要求する。コンテンツ検索装置11は、ユーザ端末13に、楽曲や動画などのコンテンツを出力させる。
ここで、コンテンツは、静止画像若しくは動画像などの画像、楽曲などの音声、CD・DVD、書籍またはゲームのパラメータなど、属性を数値で表すことができるものであればよい。
コンテンツ検索装置11は、専用のサーバまたはパーソナルコンピュータにより構成される。
なお、この図の例では、ユーザ端末13とコンテンツ検索装置11とは、ネットワーク12を介して接続される構成としている。しかし、この例に限られず、ユーザ端末13とコンテンツ検索装置11とが一体となっていてもよい。また、ユーザ端末13とコンテンツ検索装置11との通信手段は、有線、無線を問わず、1つの回路あるいはソフトウェアにおけるデータ転送であっても良い。
図2は、コンテンツ検索装置11の構成の例を示すブロック図である。CPU(Central Processing Unit)31は、ROM(Read Only Memory)32、または記憶部38に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)33には、CPU31が実行するプログラムやデータなどが適宜記憶される。これらのCPU31、ROM32、及びRAM33は、バス34により相互に接続されている。
CPU31にはまた、バス34を介して入出力インターフェース35が接続されている。入出力インターフェース35には、キーボード、マウスなどよりなる入力部36、ディスプレイ、スピーカなどよりなる出力部37が接続されている。CPU31は、入力部36から入力される指令に対応して各種の処理を実行する。そして、CPU31は、処理の結果を出力部37に出力する。
入出力インターフェース35に接続されている記憶部38は、例えばハードディスクからなり、CPU31が実行するプログラムや各種のデータを記憶する。通信部39は、インターネットやローカルエリアネットワークなどのネットワーク12を介してユーザ端末13などの外部の装置と通信する。
また、通信部39を介してプログラムを取得し、記憶部38に記憶してもよい。
入出力インターフェース35に接続されているドライブ40は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア41が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記憶部38に転送され、記憶される。
図3は、プログラムを実行するCPU31により実現される、コンテンツ検索装置11の機能の構成を示すブロック図である。コンテンツ検索装置11の機能には、コンテンツデータベース61、ユーザデータベース62、アクセス情報入力部63、固有ベクトル算出部64、演算部65、順序付け部66、ユーザ情報更新部67、コンテンツ情報更新部68、キャッシュメモリ69が含まれる。
コンテンツデータベース61は、映像、音声、データなどのコンテンツを格納する。また、コンテンツデータベース61は、コンテンツについてのコンテンツ情報を格納する。
コンテンツ情報は、コンテンツの特徴を示す。例えば、コンテンツ情報は、コンテンツのジャンル、またはコンテンツについてのキーワードなどを示す。また、コンテンツ情報は、属性ごとに数値で評価された表を有する。
ここで、属性は、コンテンツの特徴のうち、相互に強く関連する特徴をいう。例えば、コンテンツが写真の場合、動物、風景、植物、・・・、素材などのように、何の写真かを特徴づけるものをいう。あるいは、コンテンツが書籍の場合は、政治、小説、漫画、・・・、雑誌などのように書籍を特定できるものをいう。属性の数は、増減可能である。例えば、コンテンツが多くあり、検索が難しい場合には、ユーザは、属性の数の増加をコンテンツ検索装置に求めることができる。
コンテンツが写真の場合で、属性が、(動物、植物、建物、風景、乗り物)である場合には、コンテンツ情報として、(60、25、0、15、0)のような数値を与える。数値の与え方は特に制限はないが、例えば全ての属性の数値の合計が100になるなど、数値の合計値が所定の値になるようにルールを決めておく。
コンテンツ情報は、最初は、コンテンツ検索装置の管理者が個々のコンテンツをデータベースに入れるときに、設定する。上記属性についても、そのコンテンツを属性に基づいて数値で評価する。コンテンツ情報は、検索結果を反映して更新される。コンテンツ情報は、コンテンツにユーザがアクセスされるたびに、コンテンツ情報更新部68により更新される。更新されたコンテンツ情報も、コンテンツデータベース61に記憶される。
ユーザデータベース62は、ユーザに関するデータを格納する。すなわち、ユーザデータベース62は、ユーザ端末13を利用するユーザのコンテンツについての嗜好を示すユーザ情報を格納する。
例えば、ユーザ情報は、ユーザの好むコンテンツのジャンル、またはユーザの好むコンテンツについてのキーワードなどを示す。また、ユーザ情報は、属性ごとに数値で評価された表を有する。ここで、ユーザ情報の属性は、コンテンツ情報の属性と同様とされる。また、数値のルールも、コンテンツ情報の数値を入力する場合と同様である。数値の合計値は、コンテンツ情報の数値の合計値と同じになるようにする。
なお。ユーザは、ユーザを特定するID(Identifier)であるユーザIDにより特定され、コンテンツは、コンテンツを特定するIDであるコンテンツIDにより特定される。
ユーザ情報更新部67は、ユーザ情報を更新する。ユーザ情報更新部67は、コンテンツへのアクセスによりリアルタイムにユーザ情報を更新する。あるいは、バッチ処理により、ユーザプロファイルを更新する。
また、ユーザ情報更新部67は、ユーザの要求に応じて、ユーザ端末13にコンテンツが提供されたり、ユーザ端末13によってコンテンツが検索されたり、コンテンツに関する情報がユーザ端末13に送信されたりすると、ユーザ情報をその処理に応じて更新する。
ユーザ情報更新部67は、更新したユーザ情報を、ユーザデータベース62に格納させる。
ユーザは、コンテンツ検索システムにアクセスするたびに、アクセス情報を入力する。アクセス情報は、ユーザが検索を望むコンテンツのジャンル、またはユーザが検索を望むコンテンツについてのキーワードなどを示す。また、アクセス情報は、属性ごとに数値で評価された表を有する。ここで、ユーザ情報の属性は、コンテンツ情報の属性と同様とされる。また、数値のルールも、コンテンツ情報の数値を入力する場合と同様である。数値の合計値は、コンテンツ情報の数値の合計値と同じになるようにする。入力されたアクセス情報は、アクセス情報入力部63からコンテンツ検索システム内に入力され、キャッシュメモリ69で一時的に保存される。
固有ベクトル算出部64は、前記コンテンツ情報とアクセス情報とユーザ情報とを、それぞれの特徴量で定まる固有ベクトルを計算する。
演算部65は、上記得られた固有ベクトルのうち、アクセス情報とユーザ情報とをそれぞれ重み付けしたベクトルの和を計算する。重み付けは、公知の方法によればよい。例えば、ユーザ情報のベクトルをB1、アクセス情報のベクトルをB2とするときに、式(1)を用いて、計算する。
((1−α)B1+αB2)・・・・(1)
ここで、0≦α≦1
式(1)において、αの値が0に近いほど、過去のユーザ情報の値に重みをつけて、すなわちユーザ傾向を反映して計算される。一方、αの値が1に近いほど、アクセス情報の値に重みをつけて、すなわち検索目的を重視して計算される。αの値は、コンテンツ検索システムの管理者が設定してもよく、ユーザが任意の値を設定してもよい。
次に、アクセス情報とユーザ情報とをそれぞれ重み付けしたベクトルの和と、コンテンツ情報のベクトルとの内積を計算する。アクセス情報とユーザ情報とのベクトルの和と、前記コンテンツ情報のベクトルの内積が、1に近づくほど、ユーザの嗜好に応じたコンテンツとなる。
順序付け部65は、演算部によって実行された演算結果に基づいて、コンテンツデータベース内に存在するコンテンツの中から、内積値が大きい順にコンテンツを順序付けする。
コンテンツ検索装置は、ユーザ端末に対して、決定したコンテンツを示す。コンテンツの数は、1個でもよく、複数個であってもよい。ユーザは表示されたコンテンツのリストをみて、アクセスを望むコンテンツを選択してアクセスする。選択できるコンテンツは一つに限らず、複数であってもよい。
コンテンツ検索装置は、ユーザがアクセスしたコンテンツに基づき、コンテンツ情報更新部68がコンテンツ情報を、ユーザ情報更新部67がユーザ情報を更新する。
コンテンツ情報の更新は、例えば以下の更新式を用いて行う。
ユーザ情報値×β+(アクセス情報値×0.5+コンテンツ情報値)×(1−β)・・(2)
ただし、0≦β≦1
これらの各情報値は、属性ごとに数値化した数値である。βは、属性の数値に対する影響率を表す。
ユーザ情報の更新は、例えば以下の更新式を用いて行う。
ユーザ情報値×(1−β)+(アクセス情報値×0.5+コンテンツ情報値)×β・・(3)
ただし、0≦β≦1
これらの各情報地は、属性ごとに数値化した数値である。βは、属性の数値に対する影響率を表す。
また、各コンテンツに対するアクセス回数を加えた更新式とするときは、上記βの代わりに、(β+γ)を用いればよい。ここで、γ=δ×アクセス回数/設定回数である。ただし、設定回数は、あらかじめ決めておく回数を意味し、設定回数を超えてアクセスがあった場合は、γ=δとする。δの値は、アクセス回数をユーザ情報の更新にどれくらい反映させるかにより、0<δ≦1の範囲で決定すればよい。例えば、δ=0.2などである。
次に、図4フローチャートを参照して、本発明のコンテンツ検索処理を説明する。
ステップS11において、ユーザは、ユーザ端末からコンテンツ検索装置にアクセスする。ユーザがコンテンツ検索装置に初めてアクセスする場合には、ステップS12においてユーザ登録および、ユーザ情報の初期値設定を行う。また、すでに、ユーザ登録を行っている場合には、ステップS13においてユーザのIDを入力してユーザ識別を行い、ステップS14においてユーザデータベースからユーザ情報をロードする。
ステップS15において、ユーザは、アクセス情報を入力する。具体的には、検索を求めるコンテンツのジャンルにおける属性について、数値を入力する。
ステップS16において、固有ベクトル算出部は、コンテンツ情報とアクセス情報とユーザ情報とを、それぞれの特徴量で定まる固有ベクトルを計算する。すなわち、コンテンツ情報とアクセス情報とユーザ情報とのベクトルを求める。
ステップS17において、演算部は、前記アクセス情報とユーザ情報とのベクトルの和と、前記コンテンツ情報のベクトルの内積を計算する。この場合に、アクセス情報とユーザ情報とに重み付けを行った値で計算をする場合は、計算式を用いる。
ステップS18において、順序付け部は、内積の値の大きい順に、ユーザの嗜好に応じたコンテンツであると判断し、コンテンツを決定する。決定されるコンテンツ数は、1つであってもよく、複数であってもよい。
ステップS19において、上記決定されたコンテンツをユーザ端末からユーザに表示する。
ステップS20において、ユーザは、表示されたコンテンツが、自己がアクセスを望むコンテンツかどうかを判断する。
ステップS20において、表示されたコンテンツがアクセスを望まないコンテンツである場合は、ステップS15に戻り、再度検索を行う。この場合には、コンテンツ情報とユーザ情報とは更新されない。
ステップS21において、ユーザは、アクセスを望むコンテンツを選択する。選択は例えばラジオボタンをクリックして行う。
ステップS22において、コンテンツ選択装置は、クリックされたコンテンツをユーザに提供する。
ステップS23において、コンテンツ選択装置は、クリックされたコンテンツのコンテンツ情報を更新する。コンテンツ情報は、アクセス数が増えるに従い、コンテンツの内容をより詳細に表す数値に変化していく。
ステップS24において、コンテンツ選択装置は、ユーザ情報を更新する。ユーザ情報は、コンテンツにアクセスする回数が増えるに従い、ユーザの嗜好をより反映したものとなる。また、ユーザの嗜好が変化した場合でも、ユーザ情報が更新されるので、嗜好の変化に対応したユーザ情報が得られる。
ユーザが所望のコンテンツを検索できたときは、検索を終了する。
(コミュニティの形成)
上記検索システムを用い、多数のユーザが利用すると、コンテンツ検索装置内では、多数のユーザ情報が蓄積される。属性がn個あるコンテンツであれば、ユーザ情報はn次元のベクトルとして計算することができる。図6は、本発明のコンテンツ検索装置を用いて、コミュニティを形成する場合を説明する図である。図7は、コミュニティを形成する場合のフローを説明する図である。まず、ユーザは、ユーザ端末13から、コンテンツ検索装置に対してコミュニティの形成を指示する(ステップS31)。図6に示すように、座標情報取得部71は、ユーザデータベース62から、ユーザのユーザ情報と他のユーザのユーザ情報を取得する(ステップS32)。すなわち、取得したユーザ情報から、複数のユーザ情報の特徴量で定まるベクトルの座標位置から定まる位置情報を得る。
次に、座標情報取得部71は、得られた複数のユーザ情報を個々の特徴量で定まるベクトルの座標位置に配置する(ステップS33)。
次に、情報検索装置11は、配置された複数のユーザ情報についての位置情報を、ユーザ端末13に送り、ユーザ端末で表示する(ステップS34)。配置された複数のユーザ情報は、図7に示すように、n次元のベクトルを2次元に変換したものであってもよい。
図7に示すように、嗜好の近いユーザは近くに配置され、嗜好の異なるユーザは遠くに配置され、コンテンツ検索装置の管理者やユーザは、コミュニティを形成したい範囲をクラスタリング処理する(ステップS34)。クラスタリングは、例えば、自己のユーザ情報から所定の半径を持つ範囲をクラスタリングする、円や四角形を用いてコミュニティを形成したい範囲を囲いクラスタリングする、任意の位置に中心を設定して所定の円や四角形を用いてコミュニティを形成したい範囲をクラスタリングするなど、自由に行う。
クラスタリングした情報は、コンテンツ形成装置のクラスタリング処理部73に送られる。クラスタリング処理部は、クラスタリングされた範囲についてのユーザ情報をコミュニティ形成部72に送り、指定した範囲内で、コミュニティが形成される(ステップS36)。形成されたコミュニティを用いて、ユーザ同士の交流、コミュニティ内の検索情報を用いて、コミュニティ特有の検索、コミュニティの中心となるユーザにシステムの一部を管理させ、分散型のコンテンツ検索システムに発展させるなどを行うことができる。
また、形成されたコミュニティは、コミュニティの中心を移動させることで別なコミュニティに接近する。これにより他のコミュニティと結合させることができる。あるいはコミュニティの中心を移動させることで別なコミュニティから離れることができる。
なお、上記各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによりテーブル監視処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
なお、本明細書において、プログラム記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
図1は、本発明におけるコンテンツ検索装置の実施形態の一例を示す図である。 図2は、コンテンツ検索装置11の構成の例を示すブロック図である。 図3は、コンテンツ検索装置11の機能の構成を示すブロック図である。 図4は、本発明にかかるコンテンツ検索システムのフローを説明する図である。 図5は、コンテンツ検索装置11のコミュニティ形成機能の構成を示すブロック図である。 図6は、本発明のコンテンツ検索装置を用いて、コミュニティを形成する場合を説明する図である。 図7は、コミュニティ形成の状態を示す図である。
符号の説明
11 コンテンツ検索装置
12 ネットワーク
13 ユーザ端末
31 CPU
32 ROM
33 RAM
34 バス
35 入出力インターフェース
36 入力部
37 出力部
38 記憶部
39 通信部
40 ドライブ
41 リムーバブルメディア
61 コンテンツデータベース
62 ユーザデータベース
63 アクセス情報入力部
64 固有ベクトル算出部
65 演算部
66 順序付け部
67 ユーザ情報更新部
68 コンテンツ情報更新部
69 キャッシュメモリ
71 座標情報取得部
72 コミュニティ形成部
73 クラスタリング処理部

Claims (9)

  1. 個々のコンテンツの属性を数値化したコンテンツ情報を記録するコンテンツデータベースと、
    ユーザのIDとユーザのコンテンツに対する嗜好を属性ごとに数値化したユーザ情報とを記憶するユーザデータベースと、
    ユーザが検索情報システムにアクセスするごとに検索情報の属性を数値化したアクセス情報を入力するアクセス情報入力部と、
    前記コンテンツ情報とユーザ情報とアクセス情報とを、それぞれの特徴量で定まる固有ベクトルを計算する固有ベクトル算出部と、
    前記アクセス情報とユーザ情報とをそれぞれ重み付けしたベクトルの和と、前記コンテンツ情報のベクトルの内積を計算する演算部と、
    前記演算部によって実行された演算結果に基づいて、コンテンツを順序付けする順序付け部と
    を備える、コンテンツ検索装置。
  2. 前記コンテンツ情報は、コンテンツを選択したユーザの情報を受けて変更される、請求項1に記載のコンテンツ検索装置。
  3. 前記ユーザ情報は、コンテンツを選択したユーザの情報を受けて変更される、請求項1に記載のコンテンツ検索装置。
  4. 前記アクセス情報とユーザ情報とをそれぞれ重み付けしたベクトルの和は、アクセス情報とユーザ情報とに重み付けを定義した関係式に従って計算した値である、請求項1に記載のコンテンツ検索装置。
  5. 複数のユーザ情報の特徴量で定まるベクトルの座標位置から定まる位置情報をクラスタリング処理するクラスタリング処理部と、
    上記クラスタリングに基づいてコミュニティを形成するコミュニティ形成部と
    を有する、請求項1〜3のいずれかに記載のコンテンツ検索装置。
  6. 個々のコンテンツの属性を数値化したコンテンツ情報を記録するコンテンツ情報記録ステップと、
    ユーザのIDとユーザのコンテンツに対する嗜好を属性ごとに数値化したユーザ情報とを記憶するユーザ情報記録ステップと、
    ユーザが検索情報システムにアクセスするごとに検索情報の属性を数値化したアクセス情報を入力するアクセス情報入力ステップと、
    前記コンテンツ情報とユーザ情報とアクセス情報とを、それぞれの特徴量で定まる固有ベクトルを計算する固有ベクトル算出ステップと、
    前記アクセス情報とユーザ情報とをそれぞれ重み付けしたベクトルの和と、前記コンテンツ情報のベクトルの内積を計算する演算ステップと、
    前記演算部によって実行された演算結果に基づいて、コンテンツを順序付けをする順序付けステップと
    を備える、コンテンツ検索方法。
  7. 複数のユーザ情報の特徴量で定まるベクトルの座標位置から定まる位置情報をクラスタリング処理するクラスタリング処理ステップと、
    上記クラスタリングに基づいてコミュニティを形成するコミュニティ形成ステップと
    を有する、請求項6に記載のコンテンツ検索方法。
  8. 請求項6に記載のコンテンツ検索方法をコンピュータに実行させる、コンテンツ検索プログラム。
  9. 請求項7に記載のコンテンツ検索プログラムを記録したことを特徴とするコンピュータに読み取り可能な記録媒体。



JP2008093987A 2008-03-31 2008-03-31 コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体 Pending JP2009245382A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008093987A JP2009245382A (ja) 2008-03-31 2008-03-31 コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008093987A JP2009245382A (ja) 2008-03-31 2008-03-31 コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2009245382A true JP2009245382A (ja) 2009-10-22

Family

ID=41307154

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008093987A Pending JP2009245382A (ja) 2008-03-31 2008-03-31 コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2009245382A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760169A (zh) * 2012-06-13 2012-10-31 天脉聚源(北京)传媒科技有限公司 一种电视直播流中的广告段检测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760169A (zh) * 2012-06-13 2012-10-31 天脉聚源(北京)传媒科技有限公司 一种电视直播流中的广告段检测方法

Similar Documents

Publication Publication Date Title
TWI636416B (zh) 內容個人化之多相排序方法和系統
KR101932618B1 (ko) 검색 쿼리에 응답하여 유사성 스코어에 기초하여 이미지와 콘텐츠에 대해 평가 및 랭킹을 진행하기 위한 방법 및 시스템
CN107145496B (zh) 基于关键词将图像与内容项目匹配的方法
JP6423845B2 (ja) 検索クエリに応答してコンテンツとマッチングしようとする画像を動的にランキングする方法及びシステム
KR101700352B1 (ko) 이력적 검색 결과들을 사용한 향상된 문서 분류 데이터 생성
CN107103016B (zh) 基于关键词表示使图像与内容匹配的方法
US10565255B2 (en) Method and system for selecting images based on user contextual information in response to search queries
US11301528B2 (en) Selecting content objects for recommendation based on content object collections
US10853424B1 (en) Content delivery using persona segments for multiple users
JP6165955B1 (ja) 検索クエリに応答してホワイトリストとブラックリストを使用し画像とコンテンツをマッチングする方法及びシステム
US10275472B2 (en) Method for categorizing images to be associated with content items based on keywords of search queries
JP6966158B2 (ja) 検索データを処理するための方法、装置及びプログラム
JP2007183859A (ja) 情報検索システム、情報検索方法、及び情報管理装置
KR101981136B1 (ko) 추천 컨텐츠 제공 시스템, 방법 및 프로그램
JP6203304B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP4375626B2 (ja) カテゴリ別のキーワードの入力順位を提供するための検索サービスシステムおよびその方法
JP2009265754A (ja) 情報提供装置、情報提供方法及び情報提供プログラム
US10241988B2 (en) Prioritizing smart tag creation
JP2023162154A (ja) 地域知識グラフに基づいて推薦情報を提供する方法、コンピュータ装置、およびコンピュータプログラム
JP2009245382A (ja) コンテンツ検索装置、コンテンツ検索方法、コンテンツ検索プログラムおよびコンピュータに読み取り可能な記録媒体
JP6421146B2 (ja) 情報処理システム、情報処理装置、プログラム
JP2019053520A (ja) 提供装置、提供方法及び提供プログラム
Chen et al. Recommending topics in dialogue
US20200012988A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP2023120934A (ja) 情報処理装置、情報処理方法、および情報処理プログラム