JP4947709B2 - コンテンツ配信システム - Google Patents

コンテンツ配信システム Download PDF

Info

Publication number
JP4947709B2
JP4947709B2 JP2007043943A JP2007043943A JP4947709B2 JP 4947709 B2 JP4947709 B2 JP 4947709B2 JP 2007043943 A JP2007043943 A JP 2007043943A JP 2007043943 A JP2007043943 A JP 2007043943A JP 4947709 B2 JP4947709 B2 JP 4947709B2
Authority
JP
Japan
Prior art keywords
content
cluster
preference
article
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007043943A
Other languages
English (en)
Other versions
JP2008210010A (ja
JP2008210010A5 (ja
Inventor
一博 大槻
元 服部
一則 松本
春男 星野
史昭 菅谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Japan Broadcasting Corp
Original Assignee
KDDI Corp
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp, Japan Broadcasting Corp filed Critical KDDI Corp
Priority to JP2007043943A priority Critical patent/JP4947709B2/ja
Publication of JP2008210010A publication Critical patent/JP2008210010A/ja
Publication of JP2008210010A5 publication Critical patent/JP2008210010A5/ja
Application granted granted Critical
Publication of JP4947709B2 publication Critical patent/JP4947709B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、コンテンツ配信システムに係り、特に、ユーザのコンテンツ視聴履歴に基づいてクラスタを動的に生成・更新し、このクラスタに基づいて、ユーザの嗜好が反映された優先配信を行うコンテンツ配信システムに関する。
ユーザの興味や関心に合わせて情報をカスタマイズするサービスが研究されている。特許文献1には、ユーザへの配信済みのニュース記事の識別情報を含む配信履歴情報と、サービス提供に先立って各ユーザから受け付けたユーザ登録情報に基づいて作成されたユーザプロファイル情報とに基づいて、ユーザ毎にカスタマイズされたニュース配信を可能にする技術が開示されている。
特許文献2には、閲覧者がWebページを閲覧するごとに、そのページに登場する単語を抽出してジャンル分けし、単語やジャンルの出現頻度に、各Webページの閲覧時刻から求まる忘却概念を適用して個人嗜好情報を求め、この個人嗜好情報に基づいて、Webページ上で閲覧者の嗜好に合致した単語を色分け表示したり、あるいは閲覧者の嗜好に合致した複数の単語によるキーワード検索をバックグラウンドで実行する技術が開示されている。
しかしながら、特許文献1に開示された技術では、閲覧を望むニュースジャンルやキーワードをユーザ自身が予め入力しなければならないので煩わしさがある。また、キーワード検索ではキーワードの選択が検索結果に大きく影響するので、キーワードの選択が不適切であると所望の検索結果を得られないことがある。
また、特許文献2に開示された技術では、Webページに出現する単語に基づいて嗜好情報が生成されるが、そもそも嗜好とは抽象的な概念なので、このような抽象的な概念を単語で分類し、その分類結果に基づいて嗜好情報を生成してしまうと、嗜好情報にユーザの嗜好を十分に反映させることができず、またユーザの潜在的な嗜好を反映させることもできない。
このような技術課題に対して、本発明の発明者等は、ユーザの嗜好を十分に反映し、かつユーザの潜在的な嗜好までも反映したコンテンツ配信を可能にするコンテンツ配信方法およびシステムを発明し、特許文献3のごとく特許出願した。
この特許文献3では、コンテンツがニュース記事の場合、ニュースタイトルがその記事内容をコンパクトに表現している点に着目し、ユーザがニュース記事を視聴した履歴を取得し、視聴した記事のタイトルから得られたキーワードに基づくクラスタリングにより生成される嗜好クラスタと、嗜好クラスタに含まれる記事を用いた重み付けとにより、ユーザの嗜好に合ったニュース記事が選択される。
特開2005−242758号公報 特開2002−073677号公報 特願2006−179756号
特許文献3の技術では、ユーザに視聴されたニュース記事に含まれているキーワードを含む新規コンテンツが優先して配信されるので、特定の領域に限定されたような明確な嗜好を持つユーザの場合には推薦精度が低下してしまう可能性があった。
例えば、特定の野球選手Aの記事を視聴するためにプロ野球の記事を多く視聴しているにもかかわらず、「プロ野球」をキーワードとしてクラスタリングが行われてしまうと、野球選手Aが登場していないプロ野球記事まで優先的に配信されてしまう。
本発明の目的は、上記した従来技術の課題を解決し、ユーザの嗜好に合ったコンテンツを正確に配信できるコンテンツ配信システムを提供することにある。
上記した目的を達成するために、本発明は、ユーザのコンテンツ視聴履歴に基づいて嗜好クラスタを動的に生成・更新し、この嗜好クラスタに基づいて、ユーザに配信するコンテンツに優先度を設定するコンテンツ配信システムにおいて、ユーザごとにコンテンツ視聴履歴を取得する履歴取得手段と、視聴履歴に基づいてコンテンツデータベースを参照し、ユーザに視聴された既視聴コンテンツのキーワードおよび視聴されなかった未視聴コンテンツのキーワードを取得するキーワード取得手段と、取得されたキーワードに基づいて、各コンテンツを少なくとも一つのクラスタに分類するクラスタリング手段と、各クラスタに分類されているコンテンツに基づいて、各クラスタの特徴を代表するクラスタベクトルを生成するクラスタベクトル生成手段と、各クラスタに重み値を設定する重み付け手段と、配信しようとする新規コンテンツごとに、そのコンテンツベクトルと各クラスタベクトルとの類似度を、前記重み値を反映して算出する類似度算出手段と、類似度に基づいて各新規コンテンツに優先度を設定する優先度設定手段と、各新規コンテンツを前記優先度に従って配信するコンテンツ配信手段とを含むことを特徴とする。
本発明によれば、ユーザに視聴されたコンテンツのみならず視聴されなかったコンテンツのキーワードも分析し、視聴されたコンテンツに類似した新規コンテンツの優先度を上げる一方、視聴されなかったコンテンツに類似した新規コンテンツの優先度を下げるので、特定の領域に限定されたような明確な嗜好を持つユーザに対しても、その嗜好が正確に反映されたコンテンツ配信が可能になる。
以下、図面を参照して本発明の最良の実施の形態について詳細に説明する。図1は、本発明を適用したコンテンツ配信システムの主要部の構成を示したブロック図であり、ここでは、ユーザの携帯端末2へインターネット3経由で、コンテンツとしてのオンラインニュースを適応的に配信するニュース配信装置1を例にして説明する。
ニュース配信装置1において、ニュースデータベース101では、配信済みのニュース記事および新規に取得した未配信のニュース記事がデータベース化されて管理されている。
図2は、前記ニュースデータベース101で管理されている情報の一例を示した図であり、ニュース記事本文、記事ベクトルファイルおよびキーワード等が各ニュース記事に固有の記事IDで管理されている。ニュース記事本文は、タイトル、ヘッドラインおよび詳細記事に分類されている。
図3は、前記記事ベクトルファイルの一例を示した図であり、主要なタームごとに、そのTF・IDF (Term Frequency・Inverse Document Frequency;タームの出現頻度・タームが出現する文書の割合)が登録されている。なお、TF・IDFはTFとIDFとの積であって、文書におけるタームの重要度を代表する。
ここで、記事Diにおけるタームtjの出現頻度tfijを次式(1)とし、記事Diの出現頻度idfjを、タームtjの出現する記事数dfjおよび記事総数Nを用いて次式(2)とし、さらに、記事Diのタームtjの重みWtjを次式(3)とし、記事全体における全ての異なるタームをnとすれば、記事Diの記事ベクトルは式(4)で表せる。
Figure 0004947709
Figure 0004947709
Figure 0004947709
Figure 0004947709
オンラインニュースサーバ102は、インターネット3に接続可能な携帯端末2からのリクエストに応答してニュース記事を配信するWebサーバであり、履歴取得部102a、類似度算出部102b、優先度設定部102cおよび優先配信部102dを備えている。
前記履歴取得部102aは、ユーザの視聴履歴を取得して嗜好抽出管理部103へ提供する。本実施形態では、ユーザが記事タイトルを選択してヘッドラインまで視聴したときに、初めて視聴履歴が残される。
図4は、前記視聴履歴の一例を示した図であり、ユーザにより視聴されたニュース記事に固有の記事ID、およびそのニュース記事にアクセスした時刻情報を少なくとも含む複数の情報が相互に対応付けられて記憶されている。また、本実施形態ではユーザにより視聴されなかったニュース記事に固有の記事IDも別途に登録されている。前記時刻情報としては、協定世界時のUTC (universal Coordinate Time) 1970年1月1日午前0時と現在事項との差がミリ秒単位で登録されている。
類似度算出部102bは、後に詳述するように、新規に配信しようとする新規コンテンツのコンテンツベクトルと、ユーザの嗜好が反映されたクラスタの特徴を代表するクラスタベクトルとを比較して、両者の類似度を算出する。優先度設定部102cは、前記類似度に基づいて各新規コンテンツに優先度を設定する。優先配信部102dは、優先度の高い新規コンテンツをニュースデータベース101から優先的に選択してユーザへ配信する。
前記嗜好抽出管理部103は、キーワード取得部103a、クラスタリング部103b、クラスタ統合部103c、クラスタベクトル生成部103dおよびクラスタ重み付け部103eを含み、前記履歴情報に基づいてニュースデータベース101を参照し、後に示すアルゴリズムに従って各ユーザの嗜好情報を生成する。
前記キーワード取得部103aは、ユーザに視聴されたニュース記事のキーワードをニュースデータベース101から取得する既視聴キーワード取得部と、ユーザに視聴されなかったニュース記事のキーワードをニュースデータベース101から取得する未視聴キーワード取得部とを含む。
前記クラスタリング部103bは、既視聴記事のキーワードに基づいて、この既視聴記事のIDを少なくとも一つの嗜好クラスタに分類する嗜好クラスタリング部と、未視聴記事のキーワードに基づいて、この未視聴記事のIDを少なくとも一つの非嗜好クラスタに分類する非嗜好クラスタリング部とを含む。
クラスタ統合部103cは、内容が類似した複数の嗜好クラスタを統合する嗜好クラスタ統合部と、内容が類似した複数の非嗜好クラスタを統合する非嗜好クラスタ統合部とを含む。クラスタベクトル生成部103dは、各クラスタに分類された記事の特徴に基づいて、クラスタごとにクラスタベクトルを生成する。クラスタ重み付け部103eは、各クラスタに重み付けを行う。
[第1実施形態]
図5は、前記嗜好抽出管理部103における嗜好情報の抽出および更新処理の第1実施形態の手順を示したフローチャートである。本実施形態では、各ユーザの嗜好情報として複数の嗜好クラスタおよび非嗜好クラスタが生成され、それぞれ嗜好クラスタ群および非嗜好クラスタ群としてユーザIDで管理される。さらに、この嗜好クラスタおよび非嗜好クラスタがユーザのその後の視聴履歴に基づいて継続的に更新される。
ステップS1では、ユーザに提供されたニュース記事に対する視聴履歴を履歴取得部102aから受信したか否かが判定され、受信したと判定されるとステップS2へ進む。この視聴履歴には、携帯端末2に一覧表示された記事タイトルのうち、ユーザにより選択されてヘッドラインまで視聴されたニュース記事のID(既視聴記事ID)、および一覧表示された記事タイトルのうち、ユーザにより選択されずにヘッドラインまで視聴されなかったニュース記事のID(未視聴記事ID)が登録されている。なお、タイトルが一覧表示されたかった記事のIDは嗜好履歴に登録されない。
既視聴記事IDに関してはステップS3以降へ進み、嗜好クラスタを生成・更新する処理が実行される。これに対して、未視聴記事IDに関してはステップS15以降へ進み、非嗜好クラスタを生成・更新する処理が実行される。
ステップS3では、既視聴記事IDを検索キーとしてニュースデータベース101が検索され、その記事のタイトルが抽出される。ステップS4では、この記事タイトルからキーワードが抽出される。
図6は、前記キーワード取得部103aの既視聴キーワード取得部で実行されるキーワード抽出処理の手順を詳細に示したフローチャートである。
ステップS101では、記事タイトルがスペースで分割される。ステップS102では、記事タイトルが形態素解析される。本実施形態では、この形態素解析に「茶筅(登録商標)」(松本裕治,北内啓,山下達雄,平野善隆,松田寛,高岡一馬,浅原正幸,“日本語形態素解析システム『茶筌』version 2.3.3使用説明書,”奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座, 2003)が用いられる。
ステップS103では、接頭詞が、その後に続く語と接続されてキーワードとして抽出される。ステップS104では、未知語がキーワードとして抽出される。ステップS105では、名詞(非自立、代名詞、副詞可能を除く)がキーワードとして抽出される。ステップS106では、名詞(接尾)が、その前の名詞と接続されてキーワードとして抽出される。
図5へ戻り、ステップS5〜S9では、以下に詳述するように、前記クラスタリング部103bにより、前記各キーワードが複数の嗜好クラスタの少なくとも一つに分類(クラスタリング)される。
ステップS5では、前記ステップS4で抽出されたキーワードの一つが今回の注目キーワードとして選択される。ステップS6では、今回の注目キーワードと一致する嗜好クラスタキーワード、あるいは今回の注目キーワードを含む嗜好クラスタキーワードが既に登録されているか否かが判定される。嗜好クラスタキーワードが既登録であればステップS8へ進み、その嗜好クラスタに注目キーワードの記事IDが追加登録される。
これに対して、このような嗜好クラスタキーワードが未登録であればステップS7へ進み、今回の注目キーワードを嗜好クラスタキーワードとする新たな嗜好クラスタが生成され、この嗜好クラスタに記事IDが新規登録される。
このように、本実施形態ではユーザにより視聴された記事に含まれる全てのキーワードに関して嗜好クラスタが生成されるので、多数の既視聴記事が存在するクラスタように明示的な嗜好のみならず、記事が頻繁に出ないが必ず視聴しているような潜在的な嗜好も漏れなく抽出できるようになる。
図7は、嗜好クラスタの一例を模式的に表現した図であり、前記各キーワードを嗜好クラスタキーワードとして、各記事IDを要素とする嗜好クラスタが複数生成され、これらが嗜好クラスタ群としてユーザごとに管理される。なお、複数の嗜好クラスタキーワードをタイトルに含む記事のIDは、それぞれの嗜好クラスタに重複登録される。
図5へ戻り、ステップS8では、視聴された記事の全てのキーワードに関して処理が完了したか否かが判定され、未完了であればステップS5へ戻り、キーワードを切り換えながら上記した各手順が繰り返される。全てのキーワードに関して処理が完了するとステップS10へ進み、視聴履歴で通知された全ての記事IDに関して処理が完了したか否かが判定される。未完了であればステップS2へ戻り、記事IDを切り換えながら上記した各手順が繰り返される。全ての記事IDに関して処理が完了するとステップS11へ進み、嗜好クラスタの統合処理が実行される。
図8は、嗜好クラスタ統合処理の手順を示したフローチャートであり、多数の記事IDが重複する嗜好クラスタ同士が、前記クラスタ結合部103cの嗜好クラスタ結合部により一つの嗜好クラスタに統合される。
ステップS201では、嗜好クラスタの一つが今回の注目クラスタとして選択される。ステップS202では、注目クラスタ以外の他の嗜好クラスタの一つが比較対照クラスタとして選択される。ステップS203では、注目クラスタと比較対照クラスタとに共通する記事ID数が、いずれかのクラスタで所定の基準率(本実施形態では、50%)を超えているか否かが判定される。
基準値を超えていればステップS205へ進み、今回の注目クラスタと比較対照クラスタとが一つの嗜好クラスタに統合される。ステップS206では、嗜好クラスタキーワードが更新される。本実施形態では、統合される一方のクラスタのキーワードが他方のクラスタのキーワードを全て含んでいれば、一方のクラスタのキーワードが統合後の嗜好クラスタキーワードとして採用され、それ以外であれば、両者のキーワードが新たな嗜好クラスタキーワードとなる。
ステップS207では、比較対象クラスタが他にもあるか否かが判定され、全ての嗜好クラスタとの比較が完了するまで上記した各手順が繰り返され、その後、ステップS208へ進む。ステップS208では、嗜好クラスタの全ての組み合わせに関して統合が完了したか否かが判定され、完了していなければステップS201へ戻り、注目クラスタを切り換えながら上記した各処理が繰り返される。
なお、本実施形態では未視聴記事IDに関しても、ステップS15〜S23において前記ステップS3〜S11と同様の処理が実行され、非嗜好クラスタが生成・更新される。
図5へ戻り、ステップS12では、前記クラスタベクトル生成部103dにおいて、嗜好および非嗜好クラスタごとに、それぞれのクラスタに含まれる全ての記事の記事ベクトルを総和することで、各嗜好クラスタおよび非嗜好クラスタの特徴を代表するクラスタベクトルが生成される。ステップS12では、前記クラスタ重み付け部103eにより、各クラスタに重み付けが行われる。ここでは、クラスタごとの重み付け方法を、代表的な2つの方式を例にして説明する。
第1の重み付け方式は、各クラスタに含まれる記事数に応じた重み付けであり、クラスタに含まれる記事数が多いほど、そのクラスタの重みが高くされる。
第2の重み付け方式は、クラスタの忘却の概念による重み付けであり、クラスタに含まれる各記事のアクセス時刻と現在時刻との時間差の総和が小さいほど、そのクラスタの重みが高くされる。
さらに具体的に説明すれば、あるクラスタに含まれる記事(記事ベクトルDi)の重みWiは、現在時刻τおよび記事を視聴した時刻Tiを時間Tで正規化して次式(5)で定義される。なお、λ(0<λ<1)は、時間Tでどれだけ忘却するかを表す忘却定数であり、重み係数W0=1とする。
Figure 0004947709
この重みを用いたクラスタCの重み値Wcは、クラスタに含まれる記事数をmとして次式(6)で与えられる
Figure 0004947709
以上のようにして生成された各嗜好クラスタおよび各嗜好クラスタの重み値Wcは、各ユーザの嗜好情報として、前記嗜好抽出管理部103でユーザIDごとに管理される。
次いで、以上のようにして得られた嗜好情報を用いてニュース記事を選択する方法について、図9のフローチャートを参照して説明する。
ユーザが自身の携帯端末2からニュースの配信を要求し、これがステップS31で検知されると、ステップS32では、そのユーザIDがオンラインニュースサーバ102から嗜好抽出管理部103へ通知される。嗜好抽出管理部103では、通知されたユーザIDと対応付けられた嗜好情報がオンラインニュースサーバ102へ提供される。ステップS33では、オンラインニュースサーバ102において、今回のユーザにとって新しいニュース記事の一つが、今回の注目記事としてニュースデータベース101上で選択され、その記事ベクトルDiが抽出される。
ステップS34では、ユーザIDに対応した嗜好クラスタおよび非嗜好クラスタの中から一つのクラスタが今回の注目クラスタとして選択される。ステップS35では、前記類似度算出部102bにおいて、前記注目クラスタのクラスタベクトルQcと記事ベクトルDiとの類似度sim(Qc,Di)が、このクラスタに割り当てられている重み値Wcと、嗜好クラスタベクトルQcと注目記事の記事ベクトルDiとのコサイン距離との積として、次式(7)により求められる。
Figure 0004947709
ステップS36では、今回の注目記事に関して、全ての嗜好/非嗜好クラスタとの類似度計算が完了したか否かが判定される。完了していなければステップS34へ戻り、注目クラスタを切り換ながら上記した各処理が繰り返される。今回の注目記事と全ての嗜好/非嗜好クラスタとの類似度算出が終了するとステップS37へ進み、類似度が最大となった注目クラスタが嗜好クラスタおよび非嗜好クラスタのいずれであるかが判定される。
嗜好クラスタであればステップS38へ進み、前記優先度設定部102cにより、最大の類似度が今回の注目記事の優先度として登録される。非嗜好クラスタであればステップS39へ進み、最大の類似度を負に変換したマイナスの値が今回の注目記事の優先度として登録される。ステップS40では、新しい記事が他にもあるか否かが判定され、新しい全てのニュース記事との類似度計算が完了するまでステップS33へ戻り、注目記事を切り替えながら上記した処理が繰り返される。
以上のようにして、新しい全ての記事の優先度が求まると、ステップS41では、各記事が優先度の高い順にソートされる。このとき、非嗜好クラスタとの優先度は負の値なので、非嗜好クラスタに基づいて選択された記事の優先度が嗜好クラスタに基づいて選択された記事の優先度を上回ることはない。
ステップS42では、ソートされた記事が前記優先配信部102dからユーザへ配信される。ユーザの携帯端末2では、優先度の高い記事が初期画面に表示され、優先度の低い記事は画面をスクロールさせることで閲覧できるようになる。
[第2実施形態]
次いで、前記嗜好抽出管理部103における嗜好情報の抽出および更新手順の第2実施形態について説明する。
上記した第1実施形態では、既視聴記事IDに基づいて生成・更新される嗜好クラスタと未視聴記事IDに基づいて生成・更新される非嗜好クラスタとが独立していたが、このような方式ではクラスタの数が増大してしまう。そこで、本発明の第2実施形態では、上記した嗜好クラスタおよび非嗜好クラスタが統合された統合クラスタ(群)を構築し、各統合クラスタ内に、既視聴記事IDおよび未視聴記事IDが混在して登録されるようにしている。
図10は、第1実施形態のように嗜好クラスタと非嗜好クラスタとが独立して管理される独立管理手法と、第2実施形態のように嗜好クラスタと非嗜好クラスタとが統合されて管理される統合管理手法とを模式的に表現した図である。
同図(a)に示した独立管理手法では、既視聴記事ID(○)と未視聴記事ID(×)とが異なるクラスタ群で管理されているのに対して、同図(b)に示した統合管理手法では、統合クラスタ群の各クラスタ内に既視聴記事ID(○)と未視聴記事ID(×)とが混在して登録されている。
図11は、第2実施形態における嗜好情報の抽出および更新手順を示したフローチャートである。
本実施形態では、各ユーザの嗜好情報として複数の統合クラスタが生成され、統合クラスタ群としてユーザIDごとに管理される。さらに、この統合クラスタがユーザのその後の視聴履歴に基づいて継続的に更新される。
視聴履歴が履歴取得部102aから嗜好抽出管理部103へ通知され、これがステップS51で検知されると、ステップS52では、視聴履歴で通知された記事IDの一つを検索キーとしてニュースデータベース101が検索され、その記事のタイトルが抽出される。ステップS53では、この記事タイトルからキーワードが抽出される。ステップS54〜S58では、前記クラスタリング部103bにより、前記各キーワードが複数の嗜好クラスタの少なくとも一つにクラスタリングされる。
ステップS54では、前記ステップS53で抽出されたキーワードの一つが今回の注目キーワードとして選択される。ステップS55では、今回の注目キーワードと一致する統合クラスタキーワード、あるいは今回の注目キーワードを含む統合クラスタキーワードが既に登録されているか否かが判定される。統合クラスタキーワードが既登録であればステップS57へ進み、その統合クラスタに注目キーワードの記事IDが追加登録される。このとき、当該記事IDが既視聴記事IDおよび未視聴記事IDのいずれであるかを示す既視聴/未視聴フラグも登録される。
これに対して、このような統合クラスタキーワードが未登録であればステップS56へ進み、今回の注目キーワードを嗜好クラスタキーワードとする新たな嗜好クラスタが生成され、この嗜好クラスタに記事IDが既視聴/未視聴フラグと共に登録される。なお、複数の統合クラスタキーワードをタイトルに含む記事のIDは、本実施形態でもそれぞれの統合クラスタに重複登録される。
ステップS58では、抽出された全てのキーワードに関して処理が完了したか否かが判定され、未完了であればステップS54へ戻り、キーワードを切り換えながら上記した各手順が繰り返される。全てのキーワードに関して処理が完了するとステップS59へ進み、視聴履歴で通知された全ての記事IDに関して処理が完了したか否かが判定される。未完了であればステップS52へ戻り、記事IDを切り換えながら上記した各手順が繰り返される。全ての記事IDに関して処理が完了するとステップS60へ進み、嗜好クラスタの統合処理が前記と同様に実行される。
ステップS61では、前記クラスタベクトル生成部103dにおいて、各統合クラスタの特徴を代表する統合クラスタベクトルが生成される。ステップS62では、前記クラスタ重み付け部103eにより、各統合クラスタに重み付けが行われる。
本実施形態では、各統合クラスタに含まれる記事の閲覧率と閲覧からの経過時間をパラメータとして重みWcが次式(8)に基づいて算出される。ここで、mは統合クラスタに含まれる記事IDの総数、nは統合クラスタに含まれる既視聴記事IDの総数、Piは各記事IDiが視聴されてからの経過時間を代表する変数である。したがって、本実施形態では視聴時刻からの経過時間が短い既視聴記事が多く、未視聴記事が少ない統合クラスタほど、その重み値Wcが大きくなる。
Figure 0004947709
次いで、以上のようにして得られた嗜好情報を用いてニュース記事を選択する方法について、図12のフローチャートを参照して説明する。
ユーザが自身の携帯端末2からニュースの配信を要求し、これがステップS71で検知されると、ステップS72では、そのユーザIDがオンラインニュースサーバ102から嗜好抽出管理部103へ通知される。嗜好抽出管理部103では、通知されたユーザIDと対応付けられた嗜好情報がオンラインニュースサーバ102へ提供される。ステップS73では、オンラインニュースサーバ102において、今回のユーザにとって新しいニュース記事の一つが、今回の注目記事としてニュースデータベース101上で選択され、その記事ベクトルDiが抽出される。
ステップS74では、ユーザIDに対応した嗜好情報から一つの統合クラスタが今回の注目クラスタとして選択される。ステップS75では、前記類似度算出部102bにおいて、前記注目クラスタのベクトルQcと記事ベクトルDiとの類似度sim(Qc,Di)が、各統合クラスタに割り当てられている前記重み値Wcと、統合クラスタベクトルQcと注目記事の記事ベクトルDiとのコサイン距離との積として、上式(7)により求められる。
ステップS76では、今回の注目記事に関して、全ての統合クラスタとの類似度計算が完了したか否かが判定される。完了していなければステップS74へ戻り、注目クラスタを切り替えながら上記した各処理が繰り返される。今回の注目記事と全ての統合クラスタとの類似度算出が終了するとステップS77へ進み、前記優先度設定部102cにより、最大の類似度が今回の注目記事の優先度として登録される。
ステップS78では、新しいニュース記事が他にもあるか否かが判定され、新しい全てのニュース記事との類似度計算が完了するまでステップS73へ戻り、注目記事を切り替えながら上記した処理が繰り返される。
以上のようにして、新しい全てのニュース記事の優先度が求まると、ステップS79では、各ニュース記事が優先度の高い順にソートされる。ステップS80では、ソートされたニュース記事が前記優先配信部102dからユーザへ配信される。ユーザの携帯端末2では、優先度の高い記事が初期画面に表示され、優先度の低い記事は画面をスクロールさせることで閲覧できるようになる。
[第3実施形態]
次いで、本発明の第3実施形態について説明する。上記した第2実施形態の統合管理手法では、未視聴割合が大きい場合には、多くの未視聴記事IDを含んでいるクラスタと少ないクラスタとのばらつきが大きくなる可能性が高い。その結果、多くの未視聴記事IDを含んだクラスタでは、視聴率による重み付けでは重み値が下がってしまう。そのため、統合管理手法は未視聴記事IDの割合が比較的小さい場合に有効となる。
一方、独立管理手法では、未視聴記事IDが大きい場合でも有効に作用するが、クラスタ数が統合管理手法の場合よりも倍程度に増え、これに応じて最も負荷がかかる類似度計算処理が増えるため、なるべく利用を抑える必要がある。
そこで、本実施形態は各ユーザの嗜好情報の管理手法が、視聴率に応じて前記第1実施形態の独立管理手法および第2実施形態の統合管理手法のいずれかに適応的に切り替えられるようにした点に特徴がある。
図13は、本実施形態の動作を示したフローチャートであり、ステップS91ではユーザの未視聴率Pnが基準未視聴率Prefと比較され、Pn>PrefであればステップS92へ進んで独立管理手法が適用される。これに対して、Pn≦PrefであればステップS93へ進んで統合管理手法が適用される。
図14は、前記基準未視聴率Prefの設定手順を示したフローチャートであり、このPref設定処理は、図13に関して説明した管理手法の切り替え処理とは別に独立して定期的に実行され、ここで設定された基準未視聴率Prefが図13のフローチャートのステップS91に反映される。
ステップS301では、基準未視聴率Prefの推奨値Pref_iに初期値Pref0が設定される。ステップS302では、現在の未視聴率Pnが所定の選別閾値Pref1以上であるユーザ群が監視対象のユーザとして抽出され、これらの監視ユーザに独立管理手法が強制的に適用される。ステップS303では、前記監視ユーザの中で未視聴率Pnが低下してきた監視ユーザのみを対象に未視聴率Pnが継続的に測定される。ステップS304では、未視聴率Pnが推奨値Pref_iを下回った監視ユーザの管理手法が統合管理手法に切り換えられる。
ステップS305では、前記統合管理手法が適用されている監視ユーザの中で未視聴率Pnが上昇に転じた監視ユーザの割合が閾値Nref以上であるか否かが判定される。Nref以上であればステップS307へ進み、未視聴率Pnが上昇に転じた監視ユーザの管理手法が独立管理手法に戻される。ステップS308では、推奨値Pref_iが所定の単位量δだけ減ぜられ、その後ステップS303へ戻る。また、前記ステップS305において、未視聴率Pnが上昇に転じた監視ユーザの割合が閾値Nrefを下回っていると判定されるとステップS309へ進み、現在の推奨値Pref_iが基準未視聴履歴Prefに更新登録される。
なお、上記した各実施形態ではコンテンツがオンラインニュースである場合を例にして説明したが、本発明はこれのみに限定されるものではなく、コンテンツがメールマガジンであっても同様に適用できる。
また、上記した各実施形態では優先度の高低にかかわらず全てのニュース記事を配信し、その表示順序や表示位置のみを優先度に応じて異ならせるものとして説明したが、本発明はこれのみに限定されるものではなく、優先度が上位の記事のみが選択的に配信され、それ以外の記事は配信されないようにしても良い。
本発明を適用したコンテンツ配信システムのブロック図である。 ニュースデータベースで管理されている情報の一例を示した図である。 記事ベクトルファイルの一例を示した図である。 視聴履歴の一例を示した図である。 嗜好情報の抽出・更新処理の第1実施形態の手順を示したフローチャートである。 キーワード抽出処理の手順を示したフローチャートである。 嗜好クラスタの一例を模式的に表現した図である。 嗜好クラスタ統合処理の手順を示したフローチャートである。 嗜好情報を用いてニュース記事を選択する第1実施形態の手順を示したフローチャートである。 クラスタの独立管理手法と統合管理手法との違いを模式的に表現した図である。 嗜好情報の抽出・更新処理の第2実施形態の手順を示したフローチャートである。 嗜好情報を用いてニュース記事を選択する第2実施形態の手順を示したフローチャートである。 第3実施形態の手順を示したフローチャートである。 第3実施形態において基準未視聴率を設定する手順を示したフローチャートである。
符号の説明
1…ニュース配信装置,2…携帯端末,3…インターネット,101…ニュースデータベース,102…オンラインニュースサーバ,103…嗜好抽出管理部

Claims (2)

  1. ユーザのコンテンツ視聴履歴に基づいてクラスタを動的に生成・更新し、このクラスタに基づいて、ユーザに配信するコンテンツに優先度を設定するコンテンツ配信システムにおいて、
    コンテンツごとに、その内容を代表するキーワードおよびコンテンツベクトルが登録されたコンテンツデータベースと、
    ユーザごとにコンテンツ視聴履歴を取得する履歴取得手段と、
    前記視聴履歴に基づいてコンテンツデータベースを参照し、ユーザに視聴された既視聴コンテンツのキーワードおよび視聴されなかった未視聴コンテンツのキーワードを取得するキーワード取得手段と、
    前記取得されたキーワードに基づいて、各コンテンツを少なくとも一つのクラスタに分類するクラスタリング手段と、
    各クラスタに分類されているコンテンツに基づいて、各クラスタの特徴を代表するクラスタベクトルを生成するクラスタベクトル生成手段と、
    前記各クラスタに重み値を設定する重み付け手段と、
    配信しようとする新規コンテンツごとに、そのコンテンツベクトルと各クラスタベクトルとの類似度を、前記重み値を反映して算出する類似度算出手段と、
    前記類似度に基づいて各新規コンテンツに優先度を設定する優先度設定手段と、
    各新規コンテンツを前記優先度に従って配信するコンテンツ配信手段とを含
    前記クラスタリング手段が、
    既視聴コンテンツを、そのキーワードに基づいて複数の統合クラスタの少なくとも一つに分類する手段と、
    未視聴コンテンツを、そのキーワードに基づいて、前記複数の統合クラスタの少なくとも一つに分類する手段とを含み、
    前記重み付け手段が、
    登録されている全コンテンツ数に占める既視聴コンテンツの割合が高いクラスタほど重み値を高く設定することを特徴とするコンテンツ配信システム。
  2. 前記請求項に記載の第のコンテンツ配信システムと、
    前記第2のコンテンツ配信システムとは前記クラスタリング手段が異なる第1のコンテンツ配信システムと、
    各ユーザの未視聴率を求める手段とを含み、
    前記第1のコンテンツ配信システムのクラスタリング手段は、
    既視聴コンテンツを、そのキーワードに基づいて複数の嗜好クラスタの少なくとも一つに分類する手段と、
    未視聴コンテンツを、そのキーワードに基づいて複数の非嗜好クラスタの少なくとも一つに分類する手段とを含み、
    前記優先度設定手段は、嗜好クラスタとの類似度が高い新規コンテンツほど優先度を高く設定し、非嗜好クラスタとの類似度が高い新規コンテンツほど優先度を低く設定し、
    前記未視聴コンテンツの割合が所定の基準値以上のユーザへは、前記第1のコンテンツ配信システムでコンテンツを配信し、前記未視聴コンテンツの割合が所定の基準値未満のユーザへは、前記第2のコンテンツ配信システムでコンテンツを配信することを特徴とするコンテンツ配信システム。
JP2007043943A 2007-02-23 2007-02-23 コンテンツ配信システム Expired - Fee Related JP4947709B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007043943A JP4947709B2 (ja) 2007-02-23 2007-02-23 コンテンツ配信システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007043943A JP4947709B2 (ja) 2007-02-23 2007-02-23 コンテンツ配信システム

Publications (3)

Publication Number Publication Date
JP2008210010A JP2008210010A (ja) 2008-09-11
JP2008210010A5 JP2008210010A5 (ja) 2009-11-19
JP4947709B2 true JP4947709B2 (ja) 2012-06-06

Family

ID=39786280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007043943A Expired - Fee Related JP4947709B2 (ja) 2007-02-23 2007-02-23 コンテンツ配信システム

Country Status (1)

Country Link
JP (1) JP4947709B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2010044471A1 (ja) * 2008-10-17 2012-03-15 日本電信電話株式会社 サービス提供システムおよびサービス提供方法
US8635241B2 (en) 2009-02-18 2014-01-21 Hitachi, Ltd. Method of recommending information, system thereof, and server
JP5423101B2 (ja) * 2009-03-30 2014-02-19 富士通株式会社 情報提供装置、および情報提供方法
JP5730734B2 (ja) * 2011-09-28 2015-06-10 株式会社Nttドコモ アプリケーション推薦装置、アプリケーション推薦方法及びアプリケーション推薦プログラム
JP5974868B2 (ja) * 2012-11-30 2016-08-23 富士通株式会社 クラスタリングプログラム、クラスタリング方法、およびクラスタリング装置
JP2016206887A (ja) * 2015-04-21 2016-12-08 株式会社 ディー・エヌ・エー 情報処理装置、情報処理システム及び情報処理プログラム
CN109660591A (zh) * 2018-11-02 2019-04-19 北京奇虎科技有限公司 个性化新闻的自动推送方法、装置和计算设备
JP7267965B2 (ja) * 2020-03-19 2023-05-02 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
WO2022244339A1 (ja) * 2021-05-21 2022-11-24 シャープ株式会社 コンテンツ提供端末およびそれに用いられるコンテンツ提供プログラム
US12481359B2 (en) * 2021-11-29 2025-11-25 Ntt Docomo, Inc. Recommendation device

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10340270A (ja) * 1997-06-06 1998-12-22 N T T Data:Kk 情報フィルタリング方法、情報フィルタリング装置、及び記録媒体
JP2003167907A (ja) * 2001-12-03 2003-06-13 Dainippon Printing Co Ltd 情報提供方法およびシステム
JP4161701B2 (ja) * 2002-12-12 2008-10-08 ソニー株式会社 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP4586343B2 (ja) * 2003-09-01 2010-11-24 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
JP4366593B2 (ja) * 2004-07-22 2009-11-18 ソニー株式会社 電子機器、電子機器における表示制御方法およびグラフィッカル・ユーザ・インターフェース用プログラム
JP4278603B2 (ja) * 2004-11-15 2009-06-17 日本電信電話株式会社 配信スケジュール生成方法、配信スケジュール生成装置及び配信スケジュール生成方法のプログラムを記録した記録媒体
JP2006254076A (ja) * 2005-03-10 2006-09-21 Toshiba Corp 放送受信装置

Also Published As

Publication number Publication date
JP2008210010A (ja) 2008-09-11

Similar Documents

Publication Publication Date Title
JP4947709B2 (ja) コンテンツ配信システム
US8612866B2 (en) Information processing apparatus, information processing method, and information processing program
US8700489B2 (en) Apparatuses and method for recommending items based on determined trend leaders and trend followers
US20130283303A1 (en) Apparatus and method for recommending content based on user's emotion
JP5358395B2 (ja) ユーザ嗜好適合アイテム推薦装置
JP2011175362A (ja) 情報処理装置、重要度算出方法及びプログラム
JP6405704B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP4370850B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP2005056361A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
JP2006157899A (ja) データ項目に関連するデータの表示
JP2010288024A (ja) 動画推薦装置
KR20200057209A (ko) K-means Clustering을 활용한 맞춤형 도서를 추천하는 방법 및 그 장치
KR20150020390A (ko) 컨텐츠 추천 방법과 이를 제공하는 장치 및 시스템
KR101708254B1 (ko) 협업적 필터링과 캐릭터 넷을 이용한 스토리 기반의 영화 추전 시스템 및 방법.
JP5874547B2 (ja) 情報選択装置、情報選択方法、端末装置およびコンピュータプログラム
JP2007011901A (ja) 情報推薦装置、情報推薦方法、及びプログラム
JP4900915B2 (ja) コンテンツ配信方法および装置
JP6191708B2 (ja) 情報選択装置、情報選択方法、端末装置およびコンピュータプログラム
JP6160665B2 (ja) 情報選択装置、情報選択方法、端末装置およびコンピュータプログラム
JP5958578B2 (ja) 情報選択装置、情報選択方法、およびコンピュータプログラム
KR101563625B1 (ko) 온톨로지 기반 메타 데이터 간 연관성을 이용한 영상 콘텐츠 추천 시스템 및 방법
JP5294294B2 (ja) コンテンツ選択支援装置、コンテンツ選択支援方法及びそのプログラム
JP2017102948A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2001101195A (ja) テレビ番組検索装置および自動番組選択装置
JP6477786B2 (ja) 情報選択装置、及びコンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091001

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120229

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120302

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4947709

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees