JP3850013B2 - コンテンツ選択装置、コンテンツ選択方法および記録媒体 - Google Patents

コンテンツ選択装置、コンテンツ選択方法および記録媒体 Download PDF

Info

Publication number
JP3850013B2
JP3850013B2 JP2000186792A JP2000186792A JP3850013B2 JP 3850013 B2 JP3850013 B2 JP 3850013B2 JP 2000186792 A JP2000186792 A JP 2000186792A JP 2000186792 A JP2000186792 A JP 2000186792A JP 3850013 B2 JP3850013 B2 JP 3850013B2
Authority
JP
Japan
Prior art keywords
content
interest
node
undirected graph
system tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000186792A
Other languages
English (en)
Other versions
JP2002007460A (ja
Inventor
健人 宮奥
明人 阿久津
佳伸 外村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000186792A priority Critical patent/JP3850013B2/ja
Publication of JP2002007460A publication Critical patent/JP2002007460A/ja
Application granted granted Critical
Publication of JP3850013B2 publication Critical patent/JP3850013B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、デジタル放送コンテンツやインターネット上のデジタルコンテンツ等で、コンテンツの内容を説明するメタ情報が関連付けられた各種コンテンツを受信し、視聴するデジタル放送用受信装置や、インターネット端末等の装置において、利用者の興味を推定し、受信されたコンテンツの中から、利用者が興味を持っているコンテンツを自動的に選択し、蓄積する装置および方法に関する。
【0002】
【従来の技術】
CS、BSデジタル放送サービスやインターネットにおけるpush型データ配信サービスにおいては、一般的に、個々の利用者の要求とは無関係に、情報提供者の意向に基づいて、一方的に、全ての利用者に対して同一のコンテンツが送信される。
【0003】
したがって、利用者は、自分に必要なコンテンツのみを選別し、視聴することが困難であるという問題がある。また、受信されたデータを一旦、蓄積した後、視聴する仕組みを設けたとしても、大量のコンテンツが蓄積されている場合には、どのコンテンツが必要であるのかを即時に判断するのが困難である。また、大量にコンテンツが受信される場合、蓄積量の制限から、全てのコンテンツを蓄積することが不可能であるので、何らかの手段によって、利用者にとって必要なコンテンツを的確に識別し、この識別されたコンテンツのみを蓄積したいという要請がある。
【0004】
そこで、これまでに各種のコンテンツ受信装置において、利用者が興味を有するジャンルを示すキーワードを予め登録することによって、登録されたキーワードに基づいて、利用者が必要なコンテンツを識別し、これを蓄積する方法、装置が提案されている。
【0005】
さらに、特開平11−134345号公報「嗜好情報選択装置」には、テレビ放送、ラジオ放送において、テレビ放送、ラジオ放送に多重されている連動テキストデータを、メタ情報とし、利用者の嗜好を示すキーワードとその重要度とを利用者の視聴履歴から類推し、これに基づいて、利用者の嗜好に適合した放送コンテンツを選択し、記憶しておく装置が示されている。
【0006】
さらに、デジタル放送用受信装置等においては、EPG(Electric Program Guide)情報等のコンテンツのメタ情報と、利用者のコンテンツ視聴履歴等に基づいて、利用者の興味を示すキーワードを推定し、これらのキーワードを利用して必要なコンテンツを識別するシステムが提案されている。
【0007】
このようなシステムの一般的なアプローチは、EPG等のコンテンツメタ情報から、コンテンツ毎に、コンテンツに関連するキーワードの集合(キーワードベクトル)であるコンテンツプロファイルを作成し、視聴されたコンテンツのコンテンツプロファイルに含まれるキーワードの重みを増加し、このような重み情報が付加されたキーワードの集合を、ユーザプロファイル(利用者の興味データ)として保持するとともに、利用者の視聴履歴に伴い、これを逐次更新する。
【0008】
そして、新たにコンテンツが受信された時点で、受信されたコンテンツのコンテンツプロファイルと上記ユーザプロファイルとの相関度を算出し、相関度が規定値以上であれば、このコンテンツを、利用者にとって必要なコンテンツと見なし、これを蓄積する。
【0009】
ここで、上記相関度は、一般には、コンテンツプロファイル中に存在し、かつ、上記ユーザプロファイルにも含まれるキーワードの重みの和等である。このアプローチを拡張したものとして、「矢川他『個人の嗜好に合ったテレビ番組を自動編集するエージェントの検討』、電子情報通信学会技術研究報告,AI98−55,1998,12.」において、キーワードの重みを決定する条件として、テレビの全視聴時間に対する各コンテンツの視聴時間の比を利用する方法等も提案されている。
【0010】
また、「ソムヌック他『放送型データのユーザ適応型分類、選択方法』,情報処理学会研究技術報告,DPS85−43,1997,11.」においては、放送局側から、コンテンツを分類するためのグローバルツリーと呼ばれる分類木を送信し、受信システム側における利用者のコンテンツの視聴時間等を考慮し、グローバルツリーをユーザにカスタマイズしたカスタムツリーを構築し、このカスタムツリーを利用し、受信コンテンツを自動的に選択蓄積する方法が提案されている。
【0011】
なお、グローバルツリーは、各節点にキーワードが対応し、放送局側で既定される一般的な概念体系に基づいて、ジャンル階層構造を有するものであり、この手法によって構築されるカスタムツリーは、グローバルツリーを部分的に削除し、しかも、それぞれの節点キーワードに重みを有するものである。
【0012】
また、HTMLデータコンテンツのフィルタリング手法において、HTMLデータコンテンツそのものに含まれるテキスト情報をメタ情報として、コンテンツプロファイルを作成し、利用者が参照したコンテンツプロファイル群におけるキーワードの出現頻度をキーワードの重みとして、重み情報が付加されたキーワード群をユーザプロファイルとし、任意のHTMLデータコンテンツとユーザプロファイルとの相関度を算出することによって、選択するコンテンツを決定する方法が提案されている。
【0013】
「宮原他『Webブラウジングに基づいた興味の定量的同定法とその協調フィルタリングへの適用』、電子情報通信学会技術研究報告,ET97−115,1998,3」等においては、HTMLデータ内の構造を解析し、タグ種類によって、キーワードに付加する重みを変化させ、構成されるユーザプロファイルの有意性を向上する試みが提案されている。
【0014】
また、宮原他によって提案されている手法によって構築されるユーザプロファイルは、深さ1の木構造を有し、HTMLテキストを解析して得られるキーワード群から、上記木構造ユーザプロファイルを構成するために、概念体系によって分類された用語辞書を利用している。
【0015】
上記装置、方法を用いることによって、受信される各種放送コンテンツの中から、利用者が興味を有すると推定されるコンテンツのみを選択し、蓄積し、利用者に提供することが、一応実現可能である。
【0016】
【発明が解決しようとする課題】
しかし、キーワードを予め入力する従来方法では、利用者は、興味対象が変化する度に、キーワードを登録し直す必要がある、また、指定されたキーワードに基づいて選定されたコンテンツの量が非常に多い場合には、コンテンツをさらに絞り込むために、キーワードを追加する必要がある。また、膨大なコンテンツの中から、興味対象となる特定小数のコンテンツを選定するためには、1つのジャンルについて、複数のキーワードを指定する必要があり、または、適切なキーワードを選出する必要がある等、利用者への負担が大きいという問題がある。
【0017】
さらに、キーワードの入力によって興味対象を指定する従来方法は、利用者が興味対象を指定するためのキーワードを明確に認識している場合には効果的に利用できるが、興味が漠然としている場合や、興味対象を指定するための適当なキーワードを利用者が認識していない場合等には、利用し難いという問題がある。
【0018】
逆に、コンテンツメタ情報から得られるコンテンツプロファイルと、利用者のコンテンツ視聴履歴とから、コンテンツプロファイル中に出現する各キーワードの利用者にとっての重要度を自動的に推定する従来方法では、視聴されたコンテンツのコンテンツプロファイルに含まれるキーワードは、全て一様にその重要度を増加させるので、興味に全く関係ないキーワードの重要度が高く設定され、結果として、全く興味対象でないコンテンツが多数選択され、蓄積される場合がある。また、利用者の興味対象は、一般に逐次変化するものであるが、上記方法では、利用開始から現在時点までの視聴履歴、または、最近の一定期間における視聴履歴に応じて、キーワードの重要度を自動的に累積算出するので、任意のキーワードへの興味が損失した場合に、これが反映されるまでに時間を要する。
【0019】
したがって、その間、利用者が既に興味を失ったキーワードに関連するコンテンツが蓄積され続けることになり、したがって、利用者の視聴履歴に基づいて興味対象を推測する方法では、興味対象外のコンテンツが無駄に選択され、蓄積されるという問題がある。
【0020】
また、キーワードの重み付けを行うにあたり、視聴時間等を考慮する方法等を用いても、上記問題は、根本的には解決し得ない。
【0021】
さらに、蓄積デバイスの低価格化に伴い、将来、デジタル放送用受信装置等各種デジタルコンテンツを、極めて大量に蓄積することが考えられる。しかし、利用者のコンテンツ視聴履歴から利用者の興味を示す上で重要なキーワード集合であるユーザプロファイルを自動的に推定し、これを利用し、受信されるコンテンツを選択蓄積する方法では、蓄積されたコンテンツ量が膨大である場合には、特定のキーワードに対応するコンテンツがどれかということを知らないと、または、その存否を知る手段がないと、希望するコンテンツに対して迅速にアクセスすることができないという問題が生じる。
【0022】
上記と同様に、利用者が不必要なコンテンツを識別し削除しようとする場合にも、どのコンテンツが不必要かを容易に知る手段がないので、不必要なコンテンツを効率良く削除できないという問題が生じ、結果として、蓄積デバイス内に不要なコンテンツが長期的に残留されることになる。
【0023】
このような問題を解消するために、各コンテンツがどのようなキーワードに関連して選択されたかということを、コンテンツ単位で提示する手段を設けたとしても、上記キーワード集合から成るユーザプロファイルを利用し、コンテンツを自動取得する方法では、取得したコンテンツ名とその関連情報(キーワード)とを一様にリスト表示するような方法でしか、蓄積されたコンテンツに関する情報を利用者に提供できない。しかし、このような方法では、特に、コンテンツ量が多い場合に、希望するコンテンツへの迅速なアクセスを実現することは困難と言える。
【0024】
「ソムヌック他『放送型データのユーザ適応型分類,選択方法』,情報処理学会研究技術報告、DPS85−43,1997,11.」等によって提案されている方法は、カスタムツリーというキーワードを頂点とする木構造で、ユーザプロファイルを表現するので、希望のジャンルキーワードに属するコンテンツへのアクセスは、カスタムツリーを辿ることによって、容易に実現される。したがって、ユーザプロファイルをキーワードの木構造として構築する手法は、大量のコンテンツを蓄積し、管理するためのシステムには適していると考えられる。
【0025】
しかし、ソムヌック他によって提案されているシステムでは、データを分類するための分類木であるグローバルツリーが既に存在していると仮定している。現状の施行されている放送サービスシステムにおいては、上記各データの分類に用いる分類木を提供しているものはないので、ソムヌック他によって提案されている手法は、現状のシステムにおいては実現が困難である。
【0026】
さらに、放送提供される情報中には、従来存在しない新しいジャンルに属する情報や、新出のキーワードが含まれることが頻繁にある。このように、グローバルツリーに含まれない新出のキーワードをメタ情報とするデータを受信した場合、上記従来方法は有効に機能しないという問題がある。また、木構造ユーザプロファイルを構成するために、既存の概念体系によって分類された用語辞書を利用している「宮原他『Webブラウジングに基づいた興味の定量的同定法とその協調フィルタリングへの適用』,電子情報通信学会技術研究報告,ET97−115,1998,3.」の方法も、上記ソムヌック他の方法と同様の問題を内包する。
【0027】
本発明は、各種デジタルコンテンツの放送型サービスを受信し、受信されるコンテンツの中から、利用者の興味のあるコンテンツを選択し、蓄積する装置において、利用者が、逐次、興味対象を示すキーワードを入力する等の手続きを行わなくても、興味対象となるコンテンツを自動的に選択でき、しかも、興味対象となるコンテンツを自動的に選択、蓄積した際に、興味対象以外のコンテンツが蓄積されることをできる限り防ぐことができるコンテンツ選択装置、コンテンツ選択方法および記録媒体を提供することを第1の目的とするものである。
【0028】
また、本発明は、上記装置において、大量のコンテンツが蓄積された際にも、興味対象であるコンテンツを、利用者が効率良く参照することができ、また、興味のないコンテンツを効率良く削除でき、利用者にとって利便性の高い蓄積コンテンツの管理装置および方法を提供することを第2の目的とするものである。
【0029】
この第2の目的を実現するために、利用者が興味を示す情報、すなわちユーザプロファイル情報を木構造情報として保持する手法を用いるが、本発明は、特に、木構造のユーザプロファイル情報を構築する際に、放送局側等から提供されるデータ分類木や、既存の概念体系によって分類された用語辞書を用いずにこれを可能とするものである。
【0030】
【課題を解決するための手段】
本発明は、次の(1)〜(4)の構成を有する。
(1)利用者が参照した各コンテンツのメタ情報に含まれるキーワード群を利用し、1つのキーワードが1つの節点に対応している根付き構造(以下、興味体系木と呼ぶ。)を構成するとともに、この興味体系木の構造と一致したディレクトリ構造を構成し、興味体系木の節点に対応したキーワードを各ディレクトリの名前とする。
(2)興味体系木の節点に対応付けられたキーワードに基づいて、興味指数を計算し、興味指数が一定値以上のコンテンツのみ蓄積し、また、その際、コンテンツのメタ情報に含まれるキーワードと、興味体系木の節点に対応付けられたキーワードとに基づき、蓄積するディレクトリを決定する。
(3)利用者の興味を反映したディレクトリ構造中の任意のディレクトリにおいて、コンテンツへのポインタを削除、移動できる。
(4)利用者の興味を反映したディレクトリ構造において、ディレクトリを削除、移動、追加でき、それらの変更を興味体系木へ反映できる。
【0031】
ところで、請求項1、2、3記載の発明は、コンテンツ選択装置の興味情報抽出手段5において興味体系木を構成する装置に関し、興味情報抽出手段5の興味体系木構築手段の概念を簡単に説明すると次のようになる。
【0032】
1つのコンテンツのメタ情報に含まれるキーワードは、同一のコンテンツを説明しているという点で、ある程度関連性があると考えられ、さらに関連性のあるキーワード群の中で、もっとも出現頻度の高いキーワードは、上記キーワード群を代表するキーワードと言える。ここで、上記関連性のあるキーワード群が1つのジャンルを成すとした場合、その中で最も出現頻度の高いキーワードは、そのジャンルのジャンル名に相当すると考える。このような考えに基づいて抽出されるジャンル名キーワードは、必ずしも、一般的な概念体系において、キーワード群に含まれる他のキーワードを抽象するキーワードにはなり得ない。しかし、利用者の視点を考慮すれば、上記考えに基づいて抽出されるキーワードが適当なジャンル名となる可能性が高いと言える。すなわち、たとえば、あるキーワード群においてタレント名を示す固有名詞がもっとも出現頻度が高い場合、そのタレント名は、一般的な概念体系において、他のキーワードを抽象するキーワードになり得ないが、利用者にとってみれば、そのタレント名が代表ジャンル名であり、その下のサブジャンルとして、「歌」や「ドラマ」や「映画」等が含まれる構成が、より個人的な興味体系を忠実に再現している可能性が高いと考えられる。
【0033】
上記観点から、請求項1、2、3記載のコンテンツ選択装置における興味情報抽出手段5の興味体系木構築の手段では、まず、何度も同一のコンテンツのメタ情報として出現するキーワードの組合せは、相関が高いと見なし、利用者がこれまでに参照したコンテンツのメタ情報に含まれているキーワード全てについて。その相関を示す無向グラフGを構築している。
【0034】
次に、出現回数が既定値に満たないほど少ないキーワードは、興味を表しているとは考えにくいので、これらのキーワードを無向グラフGから削除する。さらに、その後、最も相関の低いキーワード間をつないでいる辺を、無向グラフGから削除し、無向グラフGをいくつかの連結成分に分離する。ここで、それぞれの連結成分は、比較的弱いながら相関のあるキーワードの集合を成しているので、それぞれをジャンルと見なし、各ジャンルについてジャンル名(すなわち、最も出現頻度の高いキーワード)を抽出し、これらを興味体系木において、根を親とする節点とする。
【0035】
さらに、その後、ジャンルを成している各連結成分それぞれについて、相関が次に低いキーワード間をつないでいる辺を削除することによって、1つの連結成分を、さらに複数の連結成分に分離する。そして、分離され生成された連結成分のそれぞれを、サブジャンルと見なし、各サブジャンルについて、サブジャンル名を、ジャンル名決定時と同様の規則によって決定し、これらを興味体系木において、ジャンル名に相当する節点を親とする節点として追加する。以降は、それぞれの連結成分について、相関の低い辺を削除し、分離し、サブジャンルを生成し、サブジャンル名を決定する上記手順を、再帰的に実行し、興味体系木に子孫を追加する。
【0036】
結果として、興味情報抽出手段5は、興味体系木上の任意の節点に対応するキーワードは、その節点の親の節点が有するジャンル名キーワードのサブジャンル名となるような興味体系木を構築する。
【0037】
これによって、本発明では、極めて膨大な量のコンテンツが蓄積されている場合でも、利用者は、ジャンル階層構造を持つ木を辿ることより、目的ジャンルのコンテンツへ容易にアクセスできる仕組みを提供する。
【0046】
【発明の実施の形態および実施例】
[実施例1]
図1は、本発明の第1の実施例であるコンテンツ選択装置100を、CS、BSデジタル放送用受信装置、アナログテレビ放送波に多重されたデータ放送を受信するアナログ放送用受信装置等に適用する場合における構成例を示すブロック図である。
【0047】
コンテンツ選択装置100は、各種放送データを受信するための放送データ受信部12と、テレビ番組映像等を蓄積するコンテンツ蓄積手段10と、表示手段3と、操作手段4と、興味情報抽出手段5と、コンテンツ参照手段7と、コンテンツ取得手段9と、通信手段11とを有する。
【0048】
この場合、表示手段3は、一般のテレビ受像機または相応の機能を有するディスプレイ装置であり、操作手段4は、テレビに付随するリモコン等である。興味情報抽出手段5は、興味体系木6を構築し、これを保持している。
【0049】
また、コンテンツ参照手段7は、興味体系木6の構造に対応するディレクトリ構造を有するコンテンツ選択画面8を、表示手段3に表示し、また、操作手段4を利用して、表示手段3に表示されているコンテンツ選択画面8において、ディレクトリやコンテンツへのポインタを示すアイコンを追加、移動、削除を行う手段である。
【0050】
また,上記実施例を、デジタル放送受信装置に適用する場合を仮定すると、図1中に点線枠で囲まれた部分は、STB101(Set Top Box)101である。ただし、コンテンツ蓄積手段10は、STB101やアナログ放送用受信装置に直接接続されるDVD−RAMデバイスその他の記憶装置であってもよい。
【0051】
通信手段11は、STB101等に内蔵または外部に直接接続されるモデム装置、ISDN回線通信用TA、DSU装置等、IPネットワーク通信プロトコルスタックモジュールである。
【0052】
放送コンテンツ1は、上記実施例をCS、BSデジタル放送用受信装置に適用する場合、放送データ受信部12が受信するコンテンツであり、デジタル映像放送チャネルにおいてMPEG2−AVストリームとして放送されているテレビ番組映像と、コマーシャル映像等と、データ放送チャネルで放送されるBML(Broadcast Markup Language)データその他のテキストデータ、または、それに付随する静止画像と、CSデジタル放送において提供される音楽配信サービス等で入手される音楽とを含むコンテンツである。
【0053】
メタ情報2は、上記コンテンツの関連付けられ興味情報抽出手段5およびコンテンツ取得手段9によって利用され、対象コンテンツがテレビ番組映像である場合には、テレビ番組映像の配信に先立ってデータ放送チャネルから受信され、または、通信手段11を介して、インターネットからも入手し得るEPG(Electric Programming Guide)情報が主たるメタ情報であり、テレビ番組映像とコマーシャル映像とに連動同期し、データ放送チャネルから受信されるBMLデータ、その他のテキストデータも含まれる。さらには、ARIB STD・B10によって規格され、デジタル映像放送チャネルで放送されるMPEG2−AVストリームと多重され、送信される番組配列情報中に含まれる各種番組関連情報も、重要なメタ情報2として利用する。
【0054】
アナログ放送用受信装置に適用する場合において、放送コンテンツ1は、テレビ番組映像と、Web CastまたはBit Cast等のサービス名で提供され、垂直帰線消去期間を使用する伝送方式を用いて、アナログテレビ放送波に多重され放送されるHTML(Hyper Text Markup Language)データ、および、それに付随する画像データ、テキストデータを含む。
【0055】
また、これらのコンテンツに関連付けられ興味情報抽出手段5とコンテンツ取得手段9とが利用するメタ情報2は、アナログテレビ放送波に多重され、放送されるEPG情報と、通信手段11を介して、インターネットから入手し得るEPG情報と、上記アナログテレビ放送波に多重され放送されているデータ中で、テレビ番組に連動した内容を含むHTML(Hyper Text Markup Language)データと、テキストデータとを指す。
【0056】
図2は、本発明の第2の実施例であるコンテンツ選択装置200を示すブロック図である。
【0057】
コンテンツ選択装置200は、インターネット13等のネットワークにおける放送型またはマルチキャスト型の各種コンテンツ配信サービスを受信するインターネット端末装置に適用した場合の構成例である。
【0058】
コンテンツ選択装置200は、通信手段11と、テレビ番組映像等を蓄積するコンテンツ蓄積手段10と、表示手段3と、操作手段4と、興味情報抽出手段5と、コンテンツ参照手段7と、コンテンツ取得手段9とを有し、通信手段11を介して各種コンテンツとこれに付随するメタ情報とを受信する。
【0059】
図2中、点線枠で囲まれた部分は、PC(Personal computer)201であり、上記興味情報抽出手段5、コンテンツ参照手段7、コンテンツ取得手段は、PC201上のソフトウェアとして実装されている。
【0060】
また、表示手段3は、PC201に接続されているディスプレイ装置であり、操作手段4は、PC201に接続されているキーボードやマウス等の装置であり、コンテンツ蓄積手段10は、PC201に内蔵されているハードディスクデバイス、DVD−RAMデバイスその他の記憶装置である。
【0061】
また、通信手段11は、PC201に内蔵または外部に直接接続されているモデム装置、ISDN回線通信用TA、DSU装置等と、PC201上にハードウェアとして、または、PC201上のOS(Operation System)に実装されるIPネットワーク通信プロトコルスタックモジュールとを含む。
【0062】
さらに、興味情報抽出手段5は、興味体系木6を構築し、これを保持する。また、コンテンツ参照手段7によって、興味体系木6の構造に対応するディレクトリ構造を有するコンテンツ選択画面8が、表示手段3に表示される。また、コンテンツ参照手段7は、操作手段4を用いて、表示手段3に表示されるコンテンツ選択画面8において、ディレクトリやコンテンツへのポインタを示すアイコンの追加、移動、削除を行う。
【0063】
通信手段11が受信するネットワーク放送コンテンツ21は、インターネットにおいて、放送またはマルチキャストの配信サービスによって受信される映像、音楽、または、HTMLデータ、SMIL(Synchronized Multimedia Integration Language)データストリーム等を含むコンテンツである。
【0064】
また、興味情報抽出手段5とコンテンツ取得手段9とが利用するメタ情報22は、配信される映像、音楽等のへッダ情報等に含まれる属性情報等や、HTMLデータであれば、HTMLデータそのものをメタ情報22として利用する。また、SMIL形式等で配信される映像や音楽については、同期して配信されるHTMLデータ等をメタ情報22として利用する。
【0065】
図3は、本発明の第3の実施例であるコンテンツ選択装置300を示すブロック図である。
【0066】
コンテンツ選択装置300は、CS、BSデジタル放送コンテンツと、インターネットを介したネットワーク放送コンテンツとを、ともに受信することができる。
【0067】
コンテンツ選択装置300は、テレビ番組映像等を蓄積するコンテンツ蓄積手段10と、表示手段3と、操作手段4と、興味情報抽出手段5と、コンテンツ参照手段7と、コンテンツ取得手段9と、通信手段11と、放送データ受信部12とを有する。
【0068】
各種放送コンテンツ1と、放送から得られるメタ情報2とを放送データ受信部12が受信するとともに、通信手段11を介して、各種ネットワーク放送コンテンツ21と、これに関連するメタ情報22とを受信し、興味惰報抽出手段5とコンテンツ取得手段9とは、放送データ受信部から受信されたコンテンツ1と、メタ情報2と、通信手段11を介して受信されたネットワーク放送コンテンツ21と、メタ情報22とのそれぞれに対して処理を行う。
【0069】
次に、上記実施例の動作について説明する。
【0070】
以下の動作例は、コンテンツ選択装置100、200、300の全てに対応する。
【0071】
上記実施例では、複数のキーワードを含むテキストによって構成されているメタ情報が関連付けられたコンテンツを受信するとともに、参照する装置において、次の(1)〜(3)の動作を実行する。
【0072】
(1)興味情報抽出手段5が、利用者が参照した各コンテンツのメタ情報に含まれるキーワード群を利用し、1つのキーワードが1つの節点に対応している根付き木構造である興味体系木6を構成し、この興味体系木6を保持する。
【0073】
(2)次に、コンテンツ参照手段7が、興味情報抽出手段5に保持されている興味体系木6の構造と一致したディレクトリ構造を有し、各ディレクトリに、当該ディレクトリが対応する興味体系木6中の節点に対応するキーワードを、そのディレクトリ名としたコンテンツ選択画面8を構成し、このコンテンツ選択画面8を、表示手段3に表示する。
【0074】
(3)次に、コンテンツ取得手段9は、既に受信され、コンテンツ蓄積手段10に関連するメタ情報とともに蓄積されているコンテンツを参照するためのポインタ(すなわちアイコン)を、蓄積されているメタ情報と、興味情報抽出手段5に保持されている興味体系木6とを利用して、コンテンツ選択画面8中のディレクトリで、そのコンテンツに最も関連の深いディレクトリを選定し、そのディレクトリ内に、そのコンテンツを参照するためのポインタ(すなわちアイコン)を配置する。
【0075】
これと同様に、コンテンツ取得手段9は、新たに受信された各コンテンツについても、そのコンテンツに関連付けられているメタ情報と、興味情報抽出手段5に保持されている興味体系木6とを利用し、コンテンツ選択画面8中のディレクトリで、そのコンテンツに最も関連の深いディレクトリを選定し、そのディレクトリ内に、そのコンテンツへのポインタを追加する。
【0076】
次に、上記実施例における興味情報抽出手段5の動作について説明する。
【0077】
まず、上記実施例における興味情報抽出手段5が、興味体系木を構築する手順の概念を簡単に説明する。
【0078】
1つのコンテンツのメタ情報に含まれるキーワードは、同一のコンテンツを説明しているという点で、ある程度関連性があると考えられる。さらに、関連性があるキーワード群の中で、もっとも出現頻度の高いキーワードは、上記キーワード群を代表するキーワードと言える。
【0079】
ここで、上記関連性のあるキーワード群が1つのジャンルを構成する場合、その中で最も出現頻度の高いキーワードが、そのジャンルのジャンル名に相当すると考える。このような考えに基づいて抽出されるジャンル名キーワードは、必ずしも、一般的な概念体系において、キーワード群に含まれる他のキーワードを抽象するキーワードにはなり得ない。しかし、利用者の視点を考慮すれば、上記考えに基づいて抽出されるキーワードが、適当なジャンル名である可能性が高いと言える。つまり、たとえば、あるキーワード群において、タレント名を示す固有名詞の出現頻度が最も高い場合、そのタレント名は、一般的な概念体系において、他のキーワードを抽象するキーワードになり得ないが、利用者にとってみれば、そのタレント名が代表ジャンル名であり、その下のサブジャンルとして、「歌」や「ドラマ」や「映画」等が含まれる構成が、より個人的な興味体系を忠実に再現している可能性が高いと考えられる。
【0080】
上記観点から、コンテンツ選択装置における興味情報抽出手段5が興味体系木を構築する手順では、まず、何度も同一のコンテンツのメタ情報2、22として出現するキーワードの組合せは、相関が高いと見なし、利用者がこれまでに参照したコンテンツのメタ情報2、22に含まれるキーワード全てについて、その相関を示す無向グラフGを構築する。
【0081】
次に、出現回数が既定値に満たない程度に少ないキーワードは、興味を表しているとは考えにくいので、これらのキーワードを無向グラフGから削除する。さらに、その後、最も相関の低いキーワード間をつないでいる辺を、無向グラフGから削除し、無向グラフGをいくつかの連結成分に分離する。ここで、それぞれの連結成分は、比較的弱いながら、相関のあるキーワードの集合を成しているので、それぞれをジャンルと見なし、各ジャンルについて、ジャンル名(つまり、最も出現頻度の高いキーワード)を抽出し、これら抽出されたジュンル名を、興味体系木において、根を親とする節点とする。
【0082】
さらに、その後に、ジャンルを成している各連結成分のそれぞれについて、次に相関の低いキーワード間をつないでいる辺を削除し、これによって、1つの連結成分をさらに複数の連結成分に分離する。そして、分離され、生成された連結成分のそれぞれをサブジャンルと見なし、各サブジャンルについてサブジャンル名を、ジャンル名決定時と同様の規則によって決定し、これら決定されたサブジャンル名を、ジャンル名に相当する節点を親とする節点として、興味体系木に追加する。
【0083】
これ以降は、それぞれの連結成分について、相関の低い辺を削除し、分離し、サブジャンルを生成し、サブジャンル名を決定するという上記手順を、再帰的に実行し、興味体系木に、子孫を追加する。
【0084】
結果として、コンテンツ選択装置100〜300における興味情報抽出手段5は、興味体系木上の任意の節点に対応するキーワードが、その節点の親のサブジャンル名になるような興味体系木を構築する。
【0085】
次に、図4〜図17を用いて、興味情報抽出手段5における興味体系木の具体的な構築手順を、2種類説明する。
【0086】
まず、図4、図6、図7、図9〜図17を用いて、第1の興味体系木6を構築する手順について説明する。
【0087】
図4は、上記実施例において、第1の興味体系木を構築する手順を示すフローチャートである。
【0088】
まず、利用者が参照したコンテンツ毎に、メタ情報2、22のテキストに、形態素解析を行うことによって、メタ情報2、22に含まれるキーワードを抽出し、コンテンツ毎に、コンテンツに関連するキーワード集合であるコンテンツプロファイルCPi={keyword1,keyword2,...}(i=1,...,n)を構成する(S1)。なお、ここで、各コンテンツが関連付けられたメタ情報2、22が、URI(Universal Resource Identifier)またはURL(Uniform Resource Locator)を含む場合には、URIまたはURLによって指定される付属情報を、ネットワークを介して、通信手段11が入手し、各コンテンツのメタ情報2、22と上記付属情報に含まれるテキストデータとから、キーワードを抽出し、コンテンツプロファイルを構成するようにしてもよい。
【0089】
また、ここで、HTMLテキストデータ等、極めて大量のキーワードを含むコンテンツのメタ情報2、22から、キーワードを抽出する場合には、「宮原他『Webブラウジングに基づいた興味の定量的同定法とその協調フィルタリングへの適用』、電子情報通信学会技術研究報告、ET97−115,1998,3.」に示される方法等を用いて、当該HTMLテキストデータから、その特徴を示す上で重要度が高いキーワードを規定値数抽出し、これらによって、コンテンツプロファイルを形成するようにしてもよい。
【0090】
図9は、上記実施例において、構成されたコンテンツプロファイル群の一例を示す図である。
【0091】
次に、以下の規則に従い、キーワードを頂点とする無向グラフGを構築する(S2)。
(1)コンテンツプロファイル群CPi(i=1,...,n)中の各キーワードを、頂点とする。
(2)同一のコンテンツプロファイルに含まれているキーワード間には、辺が存在する。
(3)コンテンツプロファイル群CPi(i=1,...,n)中におけるキーワードの出現回数を、当該頂点の重みとする。
(4)コンテンツプロファイル群CPi(i=1,...,n)において、複数のコンテンツプロファイル中に、同一のキーワードの組合せが存在する場合、そのキーワードの組合せの出現回数を、当該辺の重みとする。
【0092】
図10は、上記規則に従い、図9に示すコンテンツプロファイル群から、構築された無向グラフGを示す図である。
【0093】
次に、無向グラフGから、重みがα以下である頂点を削除し、無向グラフGを更新する(S3)。
【0094】
図11は、上記実施例において、図10に示す無向グラフGについて、α=1とし、重みがα以下である頂点を、削除し、更新された無向グラフGを示す図である。
【0095】
さらに、以下の方法によって、無向グラフGから、興味体系木Tを構築する(S4)。
(1)まず、無向グラフGについて、図6に示すアルゴリズムAを適用し、興味体系木Tを、深さ1まで構築する。
【0096】
図12は、図11に示す無向グラフGについて、図6に示すアルゴリズムAを適用することによって、深さ1まで構築された興味体系木Tを示す図である。
(2)次に、n:1とする。
(3)次に、深さnの各節点を代表頂点とする連結グラフのそれぞれについて、図7に示すアルゴリズムB1を適用し、興味体系木Tを、深さn+1まで構築する。
【0097】
各連結グラフに、図7に示すアルゴリズムB1を適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了する。
(4)以降、nを1ずつ増加し、上記(3)の手順を適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了する。
【0098】
次に、アルゴリズムAによって、図11に示す無向グラフGから、図12に示す興味体系木Tを構築する過程について説明する。
【0099】
図6は、上記実施例において使用するアルゴリズムAを示すフローチャートである。
【0100】
無向グラフGがアルゴリズムAに入力された場合、まずω=0が設定され(S41)、次に、興味体系Tの根Pを作成する(S42)。その後の過程において、興味体系木Tの根Pを親とする節点を決定するが、ここで、入力された無向グラフGは、図11に示すように、非連結なグラフであり、2つの連結成分と、連結グラフG1と連結グラフG2とによって構成されているものであるので、「無向グラフGは連結か?」を判別する処理(S43)において、「いいえ」が選択され、無向グラフG中の連結成分G1、G2について、代表頂点を決定する処理(S46)に進む。
【0101】
ここで、連結グラフG1中の代表頂点(すなわち最も重みの高い頂点)は、キーワード「スポーツ」に対応する頂点であり、連結グラフG2中の代表頂点は、キーワード「木村」に対応する頂点であるので、その結果、図12に示すように、興味体系木Tの根(root)を親とする節点として、「スポーツ」と「木村」が追加されている。
【0102】
図11に例として示す無向グラフGは、もともと非連結なグラフであるが、(STEP3)までの過程において生成された無向グラフGが連結グラフである場合もあり得る。この場合には、アルゴリズムA中の「無向グラフGは連結か?」を判別する処理において、「はい」が選択され、ω=ω+1が実行され(S43)、次に、連結である無向グラフGから、重みがω(つまり、1以下)の辺を無向グラフGから削除する(S45)。
【0103】
そして、辺が削除され、更新きれた無向グラフGについて、「無向グラフGは連結か?」を判別する処理を再び行う(S43)。この結果、更新された無向グラフGが非連結となっていれば、「いいえ」のパスが選択され、無向グラフG中の各連結成分について、代表頂点を決定する処理(S46)に進む。しかし、更新された無向グラフGが未だ連結である場合には、無向グラフGが非連結になるまでω=ω+1、および、無向グラフGから、重みがω以下の辺を無向グラフGから削除する処理が繰り返し実行される。
【0104】
つまり、上記アルゴリズムAは、重みω=0が設定され、興味体系Tの根Pを作成し、無向グラフGが連結でなければ、無向グラフG中の連結成分G1、G2について、代表頂点を決定し、一方、無向グラフGが連結であれば、ω=ω+1が実行され、連結である無向グラフGから、重みがωの辺を無向グラフGから削除し、更新するアルゴリズムである。
【0105】
次に、上記(3)(4)の処理過程で適用される図7に示すアルゴリズムB1の動作について説明する。
【0106】
図11に示す例において、まず、連結グラフG1にアルゴリズムB1が適用される。この時点で、連結グラフG1の代表頂点「スポーツ」は、興味体系木T中の外部節点(最も深い位置に位置し子供を持たない節点)の1つとなっている。
【0107】
アルゴリズムB1に入力された連結グラフG1に対して、連結グラフG1中の代表頂点に対応する興味体系木T上の外部節点「スポーツ」を節点Pと定義する(S51)。
【0108】
次に、連結グラフG1から、代表頂点「スポーツ」を削除し、連結グラフG1を更新する(S52)。この結果として、連結グラフG1は、図13に示す状態になる。
【0109】
次に、更新された連結グラフG1に対して、「連結グラフG1が複数の頂点を含むか」を判別する(S53)。この場合、連結グラフG1は、複数の頂点を含むので、「はい」のパスが選択され、次に、「無向グラフG1は連結か」を判別する(S54)。ここでも、図13に示すグラフG1は連結であるので、「はい」のパスが選択され、ω=ω+1が実行され(S55)、さらに、無向グラフG1から、重みがω(すなわち1以下)の辺が無向グラフG1から削除される(S56)。この結果として、連結グラフG1は、図14に示す状態になる。
【0110】
次に、図14に状態になった無向グラフG1に対して、再び「無向グラフG1は連結か」を判別する(S54)。この時点で、無向グラフG1は、非連結となっているので、無向グラフG1中の、各連結成分について、代表頂点を決定する処理(S57)に進む。ここで、無向グラフG1中の連結成分は、それぞれ高々1個しか頂点を含まないので(S53)、それぞれの頂点「サッカ」および「野球」が代表頂点として決定され、節点P(すなわち「スポーツ」を親とする節点)として、興味体系木Tに追加される(S58)。この結果、興味系木Tは、図15に示す構造になる。
【0111】
次に、図11に示す連結グラフG2について、アルゴリズムB1が適用され、連結グラフG2の代表頂点に対応する興味体系木中の節点「木村」を親とする節点を決定する。
【0112】
なお、この時点における図7に示すωの値は、親となる節点「木村」が決定された時点での値である。すなわち、親となる節点を代表頂点とする無向グラフGpが、n個の連結グラフG1,...,Gi,...,Gnを含む場合、各連結グラフGi=(i=1,2,...,n)に対して、図7に示すアルゴリズムB1を適用する際のωの初期値は、親となる節点が決定された時点での値を取る。
【0113】
まず、アルゴリズムB1に入力された連結グラフG2に対して、連結グラフG2中の代表頂点に対応する興味体系木T上の外部節点「木村」を、節点Pと定義する。
【0114】
次に、連結グラフG2から、代表頂点「木村」を削除し、連結グラフG2を更新する。この結果として、連結グラフG2は、図16に示す状態になる。
【0115】
次に、更新された連結グラフG2に対して、「連結グラフG2が複数の頂点を含むか」を判別する。この場合、連結グラフG2は、複数の頂点を含むので、「はい」のパスが選択され、次に、「無向グラフG2は連結か」を判別する。この時点で、無向グラフG2は、既に非連結となっているので、無向グラフG2中の各連結成分について、代表頂点を決定する処理に進む。ここで、無向グラフG2中の連結成分は、それぞれ高々1個しか頂点を含まないので、それぞれの頂点「ドラマ」と「歌」とが代表頂点として決定され、節点P(すなわち「木村」を親とする節点」)として、興味体系木Tに追加される。この結果、興味体系木Tは、図17に示す構造になる。
【0116】
次に、第2の興味体系木6の構築手順を説明する。
【0117】
第2の興味体系木構築手順では、図5に示すように、
まず、利用者が参照したコンテンツ毎に、メタ情報2、22のテキストに形態素解析を行うことによって、メタ情報2、22に含まれるキーワードを抽出し、コンテンツに関連するキーワード集合であるコンテンツプロファイルCPi={keyword1,keyword2,...}(i=1,...,n)を、コンテンツ毎に構成する(S1)。
【0118】
なお、ここで、各コンテンツの関連付けられたメタ情報2、22が、URI(Universal Resource Identifier)またはURL(Uniform Resource Locator)を含む場合には、URIまたはURLによって指定される付属情報を、通信手段によってネットワークを介して、入手し、各コンテンツのメタ情報2、22と、上記付属情報に含まれるテキストデータとから、キーワードを抽出し、コンテンツプロファイルを構成する場合もある。
【0119】
また、ここで、HTMLテキストデータ等極めて大量のキーワードを含むコンテンツメタ情報2、22から、キーワードを抽出する場合には、「宮原他『Webブラウジングに基づいた興味の定量的同定法とその協調フィルタリングへの適用』、電子情報通信学会技術研究報告,ET97−115,1998,3.」に示されている方法等を用いて、当該HTMLテキストデータから、その特徴を示す上で重要度の高いキーワードを、規定値数、抽出し、これらによってコンテンツプロファイルを形成する場合がある。
【0120】
図9は、構成されたコンテンツプロファイル群の一例を示す図である。
【0121】
次に、以下に示す(1)〜(4)の規則に従い、キーワードを頂点とする無向グラフGを構築する(S12)。
【0122】
(1)コンテンツプロファイル群CPi(i=1,...,n)中の各キーワードを頂点とする。
【0123】
(2)同一のコンテンツプロファイルに含まれるキーワード間には辺が、存在する。
【0124】
(3)コンテンツプロファイル群CPi(i=1,...,n)中におけるキーワードの出現回数を、当該頂点の重みとする。
【0125】
(4)コンテンツプロファイル群CPi(i=1,...,n)において、複数のコンテンツプロファイル中に同一のキーワードの組合せが存在する場合、そのキーワードの組合せの出現回数を、当該辺の重みとする。
【0126】
図10は、上記規則に従い、図9に示すコンテンツプロファイル群から構築された無向グラフを示す図である。
【0127】
次に、無向グラフGから、重みがα以下である頂点を削除し、無向グラフGを更新する(S3)。
【0128】
図11は、図10に示す無向グラフGに対して、α=1とし、重みがα以下である頂点を削除し、更新された無向グラフGを示す図である。
【0129】
さらに、以下の(1)〜(4)の方法によって無向グラフGから、興味体系木Tを構築する(S14)。
【0130】
(1)まず、無向グラフGに対して、図6に示すアルゴリズムAを適用し、興味体系木Tを深さ1まで構築する。
【0131】
図12は、図11に示す無向グラフGに対して、図6に示すアルゴリズムAを適用することによって、深さ1まで構築された興味体系木Tを示す図である。
【0132】
図11に示す無向グラフGは、2つの連結成分と、連結グラフG1と、連結グラフG2とによって構成され、連結グラフG1中の代表頂点(すなわち最も重みの高い頂点)は、キーワード「スポーツ」に対応する頂点であり、連結グラフG2中の代表頂点は、キーワード「木村」に対応する頂点であるので、この結果、図12に示すように、興味体系木Tの根(root)を親とする節点として、「スポーツ」と「木村」とが追加されている。
【0133】
(2)次に、n=1とする
(3)次に、深さnの各節点を代表頂点とする連結グラフのそれぞれに対して、図8に示すアルゴリズムB2を適用し、興味体系木Tを、深さn+1まで構築する。図8に示すアルゴリズムB2を、各連結グラフに適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了する。
【0134】
(4)以降、nを1ずつ増加し、上記(3)の手順を適用した結果、全てにおいて、連結グラフが出力されない場合、興味体系木Tの構築を終了する。
【0135】
次に、上記(3)、(4)の処理過程で適用される図8に示すアルゴリズムB2の動作について説明する。
【0136】
つまり、上記アルゴリズムB1は、興味体系木T上の節点をPとし、代表頂点を削除し、連結グラフG1を更新し、連結グラフG1が複数の頂点を含み、無向グラフG1が連結であれば、ω=ω+1を実行し、重みがω以下の辺を無向グラフG1から削除し、一方、無向グラフG1が連結でなければ、無向グラフG1中の、各連結成分について、代表頂点を決定し、他方、連結グラフG1が複数の頂点を含まなければ、無向グラフG1を構成する頂点を、興味体系木Tに追加するアルゴリズムである。
【0137】
図8は、上記実施例において、アルゴリズムB2の動作を示すフローチャートである。
【0138】
図11に示す例において、まず、連結グラフG1にアルゴリズムB2が適用される。この時点で、連結グラフG1の代表頂点「スポーツ」は、興味体系木T中の外部節点(最も深い位置に位置し、子供を持たない節点)の1つになっている(S61)。
【0139】
アルゴリズムB2に入力された連結グラフG1に対して、連結グラフG1中の代表頂点に対応する興味体系木T上の外部節点「スポーツ」を削除し、連結グラフG1を更新する(S62)。この結果として、連結グラフG1は、図13に示す状態になる。
【0140】
次に、更新された連結グラフG1に対して、「連結グラフG1が、複数の頂点を含むか」を判別する(S63)。この場合、連結グラフG1は、複数の頂点を含むので、「はい」のパスが選択され、次に、ω=ω+1が実行され(S64)、無向グラフG1から、重みがω(すなわち1以下)の辺が、無向グラフG1から削除される(S65)。この結果として、連結グラフG1は、図14に示す状態になる。
【0141】
次に、図14の状態になった無向グラフG1に対して、「無向グラフG1は連結か」を判別する(S66)。この時点で、無向グラフG1は、非連結となっているので、無向グラフG1中の各連結成分について、代表頂点を決定する処理(S67)に進む。ここで、無向グラフG1中の連結成分は、それぞれ高々1個しか頂点を含まないので、それぞれの頂点「サッカ」と「野球」とが代表頂点として決定され、節点P(すなわち「スポーツ」を親とする節点)として、興味体系木Tに追加される(S68)。この結果、興味体系木Tは、図15に示す構造になる。
【0142】
つまり、上記アルゴリズムB2は、興味体系木T上の節点をPとし、代表頂点を削除し、連結グラフG1を更新し、連結グラフG1が複数の頂点を含むと、ω=ω+1を実行し、重みがω以下の辺を無向グラフG1から削除し、無向グラフG1が連結でなければ、無向グラフG1中の、各連結成分について、代表頂点を決定し、一方、連結グラフG1が複数の頂点を含まなければ、無向グラフG1を構成する頂点を、興味体系木Tに追加するアルゴリズムである。
【0143】
次に、図11に示す連結グラフG2について、アルゴリズムB2が適用され、連結グラフG2の代表頂点に対応する興味体系木中の節点「木村」を親とする節点を決定する。
【0144】
なお、この時点でおいて、図7に示すωの値は、親となる節点「木村」が決定された時点での値である。すなわち、親となる節点を代表頂点とする無向グラフGpが、n個の連結グラフG1,...,Gi,...,Gnを含む場合、各連結グラフGi=(i=1,2,...,n)に対して、図7に示すアルゴリズムB2を適用する際のωの初期値は、親となる節点が決定された時点での値を取る。
【0145】
まず、アルゴリズムB2に入力された連結グラフG2に対して、連結グラフG2中の代表頂点に対応する興味体系木T上の外部節点「木村」を、節点Pと定義する。
【0146】
次に、連結グラフG2から、代表頂点「木村」を削除し、連結グラフG2を更新する。この結果として、連結グラフG2は、図16に示す状態になる。
【0147】
そして、更新された連結グラフG2に対して、「連結グラフG2が複数の頂点を含むか」を判別する。この場合、連結グラフG2は、複数の頂点を含むので、「はい」のパスが選択され、次に、ω=ω+1が実行され、無向グラフG1から、重みω(すなわち1以下の辺)が、無向グラフG1から削除される。図16に示す連結グラフG2には、既に辺が存在しないので、重みが1以下である辺を削除する処理を行っても、結果として得られる無向グラフG2は、図16に示すものに等しい。
【0148】
この後に、「無向グラフG2は連結か」を判別する。この時点で、無向グラフG2は、既に非連結となっているので、無向グラフG2中の各連結成分について、代表頂点を決定する処理に進む。ここで、無向グラフG2中の連結成分は、それぞれ高々1個しか頂点を含まないので、それぞれの頂点「ドラマ」と「歌」とが、代表頂点として決定され、節点P(すなわち「木村」を親とする節点」として、興味体系木Tに追加される。この結果、興味体系木Tは、図17に示す構造になる。
【0149】
上記第1の興味体系木構築手段と第2の興味体系木構築手段とでは、上記処理(3)、(4)において、アルゴリズムB1を適用するか、アルゴリズムB2を適用するかの違いがある。上記実施例では、アルゴリズムB1とアルゴリズムB2とによって得られる興味体系木Tの構造に差異がない。
【0150】
アルゴリズムB1とアルゴリズムB2とによる効果の差を説明するために、以下の別の実施例を示す。
【0151】
今、図32に示す連結グラフGxが、興味体系木の構築過程において出力されたとする。したがって、次に、グラフGxの代表頂点であるPに対応する節点を親とする節点を決定する処理を行う。
【0152】
上記第1の興味体系木構築手順においても、第2の興味体系木構築手順においても、まず、代表頂点PをグラフGxから削除する。この結果、グラフGxは、図33に示す構造になる。次に、「グラフGxは複数の頂点を含むか」を判別し、図33に示すグラフGxは複数の頂点を含むので、「はい」のパスが選択される。
【0153】
ここで、アルゴリズムB1である場合、まず、「グラフGxは連結か」を判断する。グラフGxは、既に2つの連結成分によって構成される非連結なグラフであるので、「いいえ」のパスが選択され、グラフGx中の各連結成分についてそれぞれ代表頂点が決定され、これらが節点Pの子として興味体系木Tに追加される。さらに、この後、各連結成分についてアルゴリズムB1を再帰的に適用することによって、新しく追加された節点の子となる節点が、逐次追加される。
【0154】
この結果、アルゴリズムB1を用いて構成される節点P以下の木構造は、図35に示す構造になる。
【0155】
これに対して、アルゴリズムB2である場合、「グラフGxは複数の頂点を含むか」を判別し、「はい」が選択された後、ω=ω+1を実施するとともに、重みがω以下の辺をグラフGxから削除する。この際、ω=1だったとした場合、重みがω以下の辺が削除され、更新されたグラフGxは、図34に示す形状になる。この後に、更新されたグラフGxに対して、「グラフGxは連結か」を判断する。重みがω以下の辺を先に削除し、この結果、この時点で、グラフGxは、3つの連結成分(単一頂点)から構成される非連結なグラフであるので、「いいえ」のパスが選択され、グラフGx中の各連結成分についてそれぞれ代表頂点が決定され、これらが節点Pの子として興味体系木Tに、追加される。
【0156】
この結果、アルゴリズムB1を用いて構成される節点P以下の木構造は、図36に示す構造になる。
【0157】
上記実施例のように、アルゴリズムB1を用いる第1の興味体系木構築手順と、アルゴリズムB2を用いる第2の興味体系木構築手順とでは、第1の手順を用いる場合の方が、1つの節点Pを親とする節点の数が少ない。すなわち、各接点における子供の数が、第2の手順を用いて構築される興味体系木に比較して少なくなる特徴がある。
【0158】
興味体系木においては、親は子が属するジャンル名キーワードとなる構造を持つので、ほぼ同等のジャンルに属するキーワード群を、一様に1つの当該ジャンルのサブジャンルとして扱うか、または、さらにサブジャンル内に複数のサブジャンルを設けるようにするかの違いになる。
【0159】
節点(すなわちキーワード数)があまりにも多い場合には、第1の手順を用いる方が、情報が詳細に分類された構造になるので、効果的であると言えるが、キーワード数が少ない場合には、相対的に深い興味体系木を構築する第1の手順よりも、第2の手順を用いる方が、根から目的ジャンルに到達するまでの経路距離が短くなるので、情報へアクセスする手順が少なくなり、効果的である。
【0160】
なお、上記興味情報抽出手段5が構成する上記興味体系木Tは、各節点に、上記コンテンツファイル群中における上記各節点に対応するキーワードの出現回数を、それぞれ重みとして有する場合がある。すなわち、最初に構築した無向グラフGにおいて対応する頂点の重みを、そのまま節点の重みとして有する。
【0161】
次に、上記実施例におけるコンテンツ参照手段7の動作について、説明する。
【0162】
上記のように、コンテンツ参照手段7は、興味情報抽出手段5が構築した興味体系木の構造と一致する構造のディレクトリ構造とを有するコンテンツ選択画面を構成し、これを表示手段に出力する。
【0163】
図18は、図17に示す興味体系木の構造と一致するディレクトリ構造を有するコンテンツ選択画面の例を示す図である。
【0164】
初期時点では、図18に示すコンテンツ選択画面31が表示され、利用者が、操作手段を利用してコンテンツ選択画面31中の「スポーツ」の名前を持つディレクトリアイコンを選択すると、図中のコンテンツ選択画面32に表示を遷移する。これと同様に、コンテンツ選択画面31において、利用者が「木村」の名前を持つディレクトリアイコンを選択すると、コンテンツ選択画面33に表示が遷移する。
【0165】
上記のように、コンテンツ選択手段は、操作手段による利用者の操作に対応して、コンテンツ選択画面32からコンテンツ選択画面31に表示を遷移する等、各ディレクトリ間を移動し、したがって、対象となるカレントディレクトリのコンテンツ選択画面を表示手段に表示する機能を、コンテンツ選択手段が有する。
【0166】
図21に示すコンテンツ選択画面の例では、コンテンツ選択画面31〜34のそれぞれに、コンテンツを参照するポインタとなるアイコンが配置されている。コンテンツ選択手段は、操作手段による利用者の操作によって、上記ポインタとなるアイコンが選択された場合、対象となるコンテンツを表示手段3に表示する、また、コンテンツの参照を止めることを、利用者が操作手段によって指示すると、コンテンツ選択画面を表示手段に再度表示する。なお、図1〜図3に示すシステム構成例では、コンテンツ選択画面とコンテンツとを単一の表示手段に表示ようにしているが、表示手段を2つ具備し、それぞれに、コンテンツ選択画面、コンテンツを表示するようにしてもよい。
【0167】
さらに、コンテンツ選択手段は、操作手段による利用者の操作に対応して、ディレクトリや、コンテンツへのポインタを削除したり、移動したりすることが可能である。図21に示すコンテンツ選択画面31において、利用者の操作によって、「木村」の名前を持つディレクトリを削除した場合、コンテンツ参照手段7は、図22に示すコンテンツ選択画面31のように、コンテンツ選択画面を更新する。
【0168】
また、コンテンツ参照手段7は、コンテンツ選択画面中のディレクトリに対して行われた削除、移動等の操作を、興味情報抽出手段5に保持されている興味体系木に反映させる。上記例では、もともと興味情報抽出手段5には、図17に示す興味情報体系木が保持されているが、「木村」の名前を持つディレクトリを削除した結果、コンテンツ参照手段7は、興味体系木を、図23に示す構造に更新する。
【0169】
さらに、コンテンツ選択手段は、操作手段による利用者の操作に対応して、任意のディレクトリに対応するコンテンツ選択画面内において、任意のキーワード名を有する新しいディレクトリを追加することが可能である。たとえば、図22に示すコンテンツ選択画面31内において、「経済」という名前を有するディレクトリを追加し、図26に示すコンテンツ選択画面31に更新することができる。また、コンテンツ参照手段7は、コンテンツ選択画面中で行われたディレクトリ追加操作を、興味情報抽出手段5に保持されている興味体系木に反映させる。上記例では、もともと、興味情報抽出手段5には、図23に示す興味情報体系木が保持されているが、「経済」の名前を持つディレクトリが追加された結果、コンテンツ参照手段7は、興味体系木を図28に示す構造に更新する。この際、キーワード「経済」に対応する節点の重みは、既定の値βに設定される、
次に、上記実施例におけるコンテンツ取得手段の動作について、説明する、
コンテンツ取得手段は、次の手順(1)〜(3)を実行する。
【0170】
(1)まず、興味情報抽出手段5に保持されている興味体系木と、受信されたコンテンツに関連付けられたメタ情報2、22とを利用して、受信されたコンテンツに対する興味指数を算出する。この際、利用される興味体系木は、コンテンツ参照手段7によって、利用者のコンテンツ選択画面における操作に応じて、逐次その構造が更新されているが、興味指数を算出するコンテンツが受信された時点における最新の興味体系木を利用する。
【0171】
(2)次に、算出された興味指数がλ以上であればこの受信されたコンテンツをコンテンツ蓄積手段10に蓄積する。
【0172】
(3)さらに、蓄積された当該コンテンツへのポインタを、コンテンツ選択画面中のディレクトリ構造におけるどのディレクトリ下に配置するかを決定し、その結果を、コンテンツ参照手段7に通知するとともに、コンテンツ参照手段7は、コンテンツ取得手段の指示に従い、当該ディレクトリ下に蓄積された当該コンテンツへのポインタを示すアイコンを追加する。
【0173】
次に、コンテンツ取得手段が新しく受信したコンテンツに対する興味指数を計算する手順例として、第1の興味指数計算手順例、第2の興味指数計算手順例を説明する。
【0174】
まず、第1の興味指数計算手順例について説明する。
【0175】
第1の興味指数計算手順例は、次の[STEP1]、[STEP2]によって構成されている。
【0176】
[STEP1] 新たに受信したコンテンツのメタ情報2、22に含まれるキーワードを抽出し、このコンテンツのコンテンツプロファイルを構成する。なお、ここで、新たに受信したコンテンツに関連付けられたメタ情報2、22が、URIまたはURLを含む場合には、URIまたはURLによって指定される付属情報を、通信手段11によって、ネットワークを介して入手し、新たに受信したコンテンツのメタ情報2、22と、上記付属情報のテキストデータに含まれるキーワードとを抽出し、このコンテンツのコンテンツプロファイルを構成するようにしてもよい。
【0177】
また、ここで、HTMLテキストデータ等極めて大量のキーワードを含むコンテンツメタ情報2、22から、キーワードを抽出する場合には、「宮原他『Webブラウジングに基づいた興味の定量的同定法とその協調フィルタリングへの適用』,電子情報通信学会技術研究報告,ET97−115.1998,3.」に示されている方法等を用いて、当該HTMLテキストデータから、その特徴を示す上で重要度の高いキーワードを規定値数、抽出し、これらによってコンテンツプロファイルを形成する場合がある。
【0178】
[STEP2] 新たに受信したコンテンツのコンテンツプロファイル中に含まれ、かつ、上記興味体系木に節点として含まれるキーワードの数がnである場合に、γnを、このコンテンツの興味指数とする。
【0179】
図19は、各受信コンテンツ名と、各受信コンテンツのコンテンツプロファイルと、上記第1の興味指数計算手順例においてγ=1として各コンテンツについて算出された興味指数とを示す図である。
【0180】
ただし、この時点で興味惰報抽出手段5が保持している興味体系木は、図17に示す構造であるとする。
【0181】
次に、第2の興味指数計算手順例ついて説明する。
【0182】
第2の興味指数計算手順例は、次の[STEP1]、[STEP2]によって構成されている。
【0183】
[STEP1] 新たに受信したコンテンツのメタ情報2、22に含まれるキーワードを抽出し、このコンテンツのコンテンツプロファイルを構成する。なお、ここで、新たに受信したコンテンツの関連付けられたメタ情報2、22が、URIまたはURLを含む場合には、URいまたはURLによって指定される付属情報を通信手段によって、ネットワークを介して入手し、新たに受信したコンテンツのメタ情報2、22と、上記付属情報のテキストデータに含まれているキーワードとを抽出し、このコンテンツのコンテンツプロファイルを構成するようにしてもよい。
【0184】
また、ここで、HTMLテキストデータ等、極めて大量のキーワードを含むコンテンツメタ情報2、22から、キーワードを抽出する場合には、「宮原他『Weもブラウジングに基づいた興味の定量的同定法とその協調フィルタリングへの適用』,電子情報通信学会技術研究報告,ET97−115,1998,3.」に示されている方法等を用いて、当該HTMLテキストデータから、その特徴を示す上で重要度の高いキーワードを規定値数、抽出し、これらによってコンテンツプロファイルを形成する場合がある。
【0185】
[STEP2] 新たに受信したコンテンツのコンテンツプロファイル中に含まれ、しかも、上記興味体系木に節点として含まれるキーワードの重みの和がWである場合に、γWを、このコンテンツの興味指数とする。
【0186】
図20は、各受信コンテンツ名と、各受信コンテンツのコンテンツプロファイルと、上記第2の興味指数計算手順例においてγ=1として各コンテンツについて算出して興味指数とを示す図である。
【0187】
ただし、この時点で興味情報抽出手段5が保持している興味体系木は、図17に示す構造であるとする。
【0188】
次に、コンテンツ取得手段は、算出された興味指数に基づいて、各コンテンツを蓄積しておくか否かを判断する。λ=1である場合には、図19、図20に示す受信コンテンツ群中では、受信コンテンツ名が「巨人 対 中日」「巨人 対阪神」「プロ野球ニュース」「写真集広告」が選択され、コンテンツ蓄積手段10に、そのメタ情報2、22とともに蓄積されるが、「経済ニュース」は、蓄積されずに破棄される。
【0189】
さらに、コンテンツ取得手段9は、蓄積された当該コンテンツへのポインタをコンテンツ選択画面8中のディレクトリ構造おいて、どのディレクトリ下に配置するかを決定し、その結果をコンテンツ参照手段7に通知する。
【0190】
蓄積された当該コンテンツへのポインタをコンテンツ選択画面8中のディレクトリ構造のどのディレクトリ下に配置するかを決定する配置位置決定手順として、第1の配置位置決定手順、第2の配置位置決定手順について説明する。
【0191】
第1の配置位置決定手順では、興味情報抽出手段5に保持されている興味体系木中の任意の節点であって、この節点から根までの経路と、この節点の子供である節点群との中に、当該コンテンツのコンテンツプロファイル中のキーワードを最も多く含むような節点のうちで、最も深い位置に位置するものを、最関連節点として、選択し、コンテンツ参照手段7が管理するディレクトリ構造において最関連節点に対応するディレクトリ下に、当該コンテンツへのポインタを追加することを決定する。
【0192】
たとえば、図19において「巨人 対 中日」のコンテンツプロファイルCP8中には、図17に示す興味体系木中に共通して存在するキーワードとして、「スポーツ」と「野球」とが含まれる。したがって、図17に示す興味体系木中の節点としては、「スポーツ」に対応する節点と、「野球」に対応する節点とが、ともに節点から根までの経路と、この節点の子供である節点群との中に、コンテンツプロファイルCP8中のキーワードを2つ含み、しかも、「野球」に対応する節点の方が、興味体系本中で深い位置に存在するので、「野球」に対応する節点が、最関連節点として選択される。この結果、コンテンツ参照手段7によって、図21に示すように、図21中のコンテンツ選択画面34中に、「巨人 対 中日」のコンテンツへのポインタが配置される。
【0193】
次に、上記と同様に、上記第1の配置位置決定手順に従って処理を行った結果、「巨人 対 中日」、「巨人 対 阪神」、「プロ野球ニュース」、「写真集広告」の各コンテンツへのポインタは、図21に示す位置に配置される。
【0194】
別の例として、現在、興味情報抽出手段5に保持されている興味体系木が 図28に示す構造である場合について述べる。
【0195】
この場合、コンテンツ選択画面8は、図29に示す構成となる。図19に示す受信コンテンツのうちで、「巨人 対 中日」のコンテンツプロファイルCP8中には、図28に示す興味体系木中に共通して存在するキーワードとして、「スポーツ」、「野球」、「巨人」、「中日」が含まれる。
【0196】
そして図28に示す興味体系木中の節点では、「野球」に対応する節点が、当該節点から根までの経路と、この節点の子供である節点群との中に、コンテンツプロファイルCP8中のキーワードを最大数である3つ含み、同様に、「巨人」に対応する節点が、当該節点から根までの経路上の節点群の中に、コンテンツプロファイルCP8中のキーワードを最大数である3つを含む。
【0197】
しかし、「巨人」に対応する節点の方が、深い位置に存在するので、「巨人」に対応する節点が最関連節点として選択され、この結果、コンテンツ参照手段7によって、図30に示すように、図29中のコンテンツ選択画面35中に、「巨人
対 中日」のコンテンツへのポインタが配置される。
【0198】
次に、上記と同様に、上記第1の配置位置決定手順に従って処理を行った結果、「巨人 対 中日」、「巨人 対 阪神」、「プロ野球ニュース」、「写真集広告」の各コンテンツへのポインタは、図30に示す位置に配置される。
【0199】
次に、第2の配置位置決定手順について説明する。
【0200】
第2の配置位置決定手順では、当該コンテンツのコンテンツプロファイル中に含まれるキーワードで、しかも、興味情報抽出手段5に保持されている興味体系本中の任意の節点であって、この節点から根までの経路と、この節点の子供である節点群とに対応するキーワードの重みの和が最大となるような節点のうちで、最も深い位置に位置するものを、最関連節点として選択し、コンテンツ参照手段7が管理するディレクトリ構造において、最関連節点に対応するディレクトリ下に、当該コンテンツへのポインタを追加することを決定する。
【0201】
たとえば、図19または図20において、「巨人 対 中日」のコンテンツプロファイルCP8中には、図17に示す興味体系木中に共通して存在するキーワードとして、「スポーツ」と「野球」とが含まれる。したがって、図17に示す興味体系木中の節点としては、「スポーツ」に対応する節点と、「野球」に対応する節点が、ともに節点から根までの経路と、この節点の子供である節点群との中に、コンテンツプロファイルCP8中のキーワードを2つ含み、しかも、それらの重みの和が5となっている。
【0202】
さらに、「野球」に対応する節点の方が、興味体系木中で深い位置に存在するので、「野球」に対応する節点が最関連節点として選択され、結果として、コンテンツ参照手段7によって、図21に示すように、図21中のコンテンツ選択画面34中に、「巨人 対 中日」のコンテンツへのポインタが配置される。
【0203】
次に、上記と同様に、上記第2の配置位置決定手順に従って処理を行った結果、「巨人 対 中日」、「巨人 対 阪神」、「プロ野球ニュース」、「写真集広告」の各コンテンツへのポインタは、図21に示す位置に配置される。
【0204】
別の例として、現在、興味情報抽出手段5に保持されている興味体系木が、図28に示す構造である場合について説明する。
【0205】
この場合のコンテンツ選択画面8は、図29に示す構成となる。図19に示す受信コンテンツのうちで、「巨人 対 中日」のコンテンツプロファイルCP8中には、図28に示す興味体系木中に共通して存在するキーワードとして、「スポーツ」、「野球」、「巨人」が含まれる。図28に示す興味体系木中の節点では、「野球」に対応する節点が、当該節点から根までの経路とこの節点の子供である節点群との中に、コンテンツプロファイルCP8中のキーワード「スポーツ」と「中日」とを含み、しかも、それらの重みの和が最大値の9を取る。
【0206】
また、「中日」に対応する節点が、同じく、当該節点から根までの経路上の節点群の中に、コンテンツプロファイルCP8中のキーワード「スポーツ」と「中日」とを含み、しかも、それらの重みの和が最大値の9を取る。
【0207】
しかし、「中日」に対応する節点の方が深い位置に存在するので、「中日」に対応する節点が最関連節点として選択され、この結果、コンテンツ参照手段7によって、図31に示すように、図29中のコンテンツ選択画面35中に、「巨人 対 中日」コンテンツへのポインタが配置される。
【0208】
以下、上記と同様に、上記第1の配置位置決定手順に従って処理を行った結果、「巨人 対 中日」、「巨人 対 阪神」、「プロ野球ニュース」、「写真集広告」の各コンテンツへのポインタは、図31に示す位置に配置される。
【0209】
図24は、図21に示すコンテンツ選択画面31から、利用者が「木村」の名前を有するディレクトリを削除した結果を示す図である。
【0210】
図21に示すコンテンツ選択画面31から、利用者が「木村」の名前を有するディレクトリを削除した結果、コンテンツ参照手段7が、興味情報抽出手段5に保持されている興味体系木を、図23に示す構造に更新した後に、受信された各コンテンツ名と、各受信コンテンツのコンテンツプロファイルと、上記第1の興味指数計算手順例において、γ=1として各コンテンツについて算出された興味指数とを示す図である。
【0211】
図25は、利用者のディレクトリ削除操作に伴い、コンテンツ参照手段7が、興味情報抽出手段5に保持されている興味体系木を、図23に示す構造に更新した後を示す図である。
【0212】
利用者のディレクトリ削除操作に伴い、コンテンツ参照手段7が、興味情報抽出手段5に保持されている興味体系木を、図23に示す構造に更新した後に、受信された各コンテンツ名と、各受信コンテンツのコンテンツプロファイルと、上記第2の興味指数計算手順例において、γ=1として各コンテンツについて算出された興味指数とを示す図である。
【0213】
図24、図25に示す場合、λ=1とすると、受信コンテンツ群中では、受信コンテンツ名が。「巨人 対 中日」、「巨人 対 阪神」、「プロ野球ニュース」が選択され、コンテンツ蓄積手段10に、そのメタ情報2、22とともに蓄積されるが、「写真集広告」、「経済ニュース」は、蓄積されずに破棄される。すなわち、利用者の削除操作に伴い、利用者がキーワード「木村」に対する興味を損失したと見なし、これに関連するコンテンツである「写真集広告」を蓄積しないように処理している。
【0214】
上記と同様に、コンテンツ選択画面31によって、利用者が各ディレクトリを移動することが可能であり、利用者がディレクトリを移動した結果、コンテンツ参照手段7は、上記操作手段による利用者の操作によって、上記興味情報抽出手段5に保持されている興味体系木に対して、移動されたディレクトリに対応する節点を根とする部分木を、移動先ディレクトリに対応する節点の下に移動する。この結果、コンテンツ取得手段9は、ディレクトリの移動操作に伴い更新された興味体系木に基づいて、新しく受信されたコンテンツへの興味指数を計算するとともに コンテンツへのポインタの配置位置を決定する。
【0215】
上記実施例によれば、興味情報抽出手段5が、任意の節点に対応するキーワードがその節点の親のサブジャンル名となるような興味体系木として、利用者の興味を抽出し、コンテンツ参照手段7が、興味体系木の構造に対応するディレクトリ構造を有するコンテンツ選択画面8を利用者に提示し、利用者は。コンテンツ選択画面8においてコンテンツを参照する他、コンテンツ、ディレクトリの移動、不要なコンテンツ、ディレクトリを削除等の処理を行う。利用者がディレクトリを移動したり、削除したり、追加した場合に、操作対象となったディレクトリに対応する興味体系木上の節点の移動、削除、追加と見なし、これを興味体系木に反映する。
【0216】
したがって、たとえば、利用者が「キーワードA」に対応するディレクトリを削除した場合、利用者が「キーワードA」に代表されるジャンルに対する興味がなくなっことを意味し、ディレクトリが削除されたことを、興味体系木に即座に反映させることによって、それ以降、受信されたコンテンツについて、利用者が既に興味を失った「キーワードA」に代表されるジャンルに属するコンテンツが蓄積されない。これによって、利用者は、極めて少ない手続きで、興味対象外のコンテンツを削除することができ、かつ、以後、そのジャンルのコンテンツを蓄積しないように指定することが可能になる。
【0217】
また、コンテンツ取得手段9は、受信されたコンテンツを蓄積する場合、受信されたコンテンツに最も関連の深いキーワード(ジャンル名)に対応するディレクトリに、このコンテンツを参照するためのポインタを配置し、上記のように興味体系木は、子が親のサブジャンルとなるように自動的に構成される。この興味体系木の構造に対応したディレクトリ構造を有するコンテンツ選択画面8において、利用者は興味体系木を辿ることによって、膨大な量の蓄積されたコンテンツの中から目的とするジャンルのコンテンツを、容易に探し出して参照することができる。
【0218】
これと同様に、利用者は、不要なジャンルのコンテンツ群を容易に発見することができ、即座に、これを削除することができる。そして、利用者にとって不要なコンテンツを含むディレクトリが削除された場合に、この削除が興味体系木に反映されることによって、利用者の興味を反映した興味体系木を、より正確に構成することができる。
【0219】
すなわち、上記実施例において、興味情報抽出手段5が抽出した興味体系木が、当初、利用者の興味を正確に反映していない場合でも、利用者の極めて簡単な手続きによって、これを補正することができ、それ以後、コンテンツ取得手段9は、利用者の興味を正確に反映した興味体系木を利用し、新たに受信されたコンテンツを選択蓄積することができるので、結果として、興味対象外の無駄なコンテンツを蓄積することを防ぐことができる。
【0220】
さらに、上記実施例において、興味情報抽出手段5は、既存の概念体系に基づいたデータ分類木等の事前知識を用いずに、興味体系木を構築することができるので、汎用性が高い。すなわち、実施例において述べた、CS、BSデジタルおよびアナログ放送システムや、インターネット上の放送システムとその融合型サービスシステムと以外にも、既存のラジオ放送波に重畳されるテキスト情報放送サービス等にも、上記実施例を適用するようにしてもよい。
【0221】
また、上記実施例は、従来の手法に比べて、既存概念体系に捕らわれず、自由度の高いキーワード木構造である興味体系木を構築するので、利用者の個人的な興味体系を、より忠実に表現したキーワード木構造を抽出することができる。
【0222】
また、上記実施例を記録媒体の発明として把握することができる。つまり、上記実施例は、複数のキーワードを含むテキストによって構成されているメタ情報が関連付けられているコンテンツを、受信するとともに参照するコンテンツ選択手順をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒において、受信されたコンテンツを蓄積するコンテンツ蓄積手順と、上記コンテンツとコンテンツ選択画面とを表示する表示手順と、利用者がコンテンツの選択等において操作する操作手順と、利用者が参照した各コンテンツの上記メタ情報に含まれているキーワード群を利用し、1つのキーワードが1つの節点に対応している根付き木構造である興味体系木を構成し、上記興味体系木を保持する興味情報抽出手順と、上記興味体系木の構造と一致するディレクトリ構造を構成するともに、上記ディレクトリ構造と、各ディレクトリ内に配置され、上記コンテンツ蓄積手段内に保持されているコンテンツと、通信手段を介して、アクセスされるネットワーク上のコンテンツへのポインタを管理し、各ディレクトリに、当該ディレクトリが対応する上記興味体系本中の節点に対応するキーワード名を提示し、各ディレクトリ内に配置されている各コンテンツへのポインタに当該コンテンツ名を提示したコンテンツ選択画面を、上記表示手段に表示するコンテンツ参照手順と、上記興味体系木と、受信されたコンテンツに関連付けられたメタ情報とを利用し、上記受信されたコンテンツに対する興味指数を決定し、上記興味指数が所定の一定値以上であれば、上記受信されたコンテンツを上記コンテンツ蓄積手段に蓄積し、しかも、蓄積された当該コンテンツへのポインタを、上記コンテンツ参照手順が管理する上記コンテンツ選択画面に追加するコンテンツ取得手順とをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体の例である。
【0223】
なお、上記記録媒体として、FD、CD、DVD、HD、半導体メモリ等を想定することができる。
【0224】
【発明の効果】
本発明によれば、各種デジタルコンテンツの放送型サービスを受信し、受信されるコンテンツの中から、利用者の興味のあるコンテンツを選択し、蓄積する装置において、利用者が、逐次、興味対象を示すキーワードを入力する等の手続きを行わなくても、興味対象となるコンテンツを自動的に選択でき、しかも、興味対象となるコンテンツを自動的に選択、蓄積した際に、興味対象以外のコンテンツが蓄積されることをできる限り防ぐことができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の第1の実施例であるコンテンツ選択装置100を示すブロック図である。
【図2】本発明の第2の実施例であるコンテンツ選択装置200を示すブロック図である。
【図3】本発明の第3の実施例であるコンテンツ選択装置300を示すブロック図である。
【図4】上記実施例において、第1の興味体系木を構築する手順を示すフローチャートである。
【図5】上記実施例における興味情報抽出手段5の興味体系木構築ステップを示すシーケンス図である。
【図6】上記実施例における興味情報抽出手段5の興味体系木構築ステップ4において、無向グラフGから、興味体系木を深さ1の節点までを追加するアルゴリズムAを示す」フローチャートである。
【図7】上記実施例における興味情報抽出手段5の興味体系木構築ステップ4において、興味体系木において深さ2以降の節点を追加するアルゴリズムB1を示すフローチャートである。
【図8】上記実施例において、アルゴリズムB2の動作を示すフローチャートである。
【図9】構成されたコンテンツプロファイル群の一例を示す図である。
【図10】上記規則に従い、図9に示すコンテンツプロファイル群から構築された無向グラフを示す図である。
【図11】図10に示す無向グラフGに対して、α=1とし、重みがα以下である頂点を削除し、更新された無向グラフGを示す図である。
、図11に示す無向グラフGに対して、図6に示すアルゴリズムAを適用することによって、深さ1まで構築された興味体系木Tを示す図である。
【図12】図11に示すグラフに基づいて、深さ1の節点まで追加された興味体系木Tを示す図である。
【図13】図10に示す連結グラフG1から代表頂点を削除した状態を示すグラフである。
【図14】図13に示す連結グラフG1から重み1の辺が削除された状態を示すグラフである。
【図15】図13に示すグラフに基づいて、深さ2の節点が1部追加された興味体系木Tを示す図である。
【図16】図10に示す連結グラフG2から代表頂点を削除した状態を示すグラフである。
【図17】図16に示すグラフにも基づいて、深さ2の節点が全て追加された興味体系木Tを示す図である。
【図18】図17に示す興味体系木の構造と一致するディレクトリ構造を有するコンテンツ選択画面の例を示す図である。
【図19】各受信コンテンツ名と、各受信コンテンツのコンテンツプロファイルと、上記第1の興味指数計算手順例においてγ=1として各コンテンツについて算出された興味指数とを示す図である。
【図20】各受信コンテンツ名と、各受信コンテンツのコンテンツプロファイルと、上記第2の興味指数計算手順例においてγ=1として各コンテンツについて算出して興味指数とを示す図である。
【図21】図19または図20に示す受信コンテンツへのポインタがコンテンツ選択画面8に追加された状態を示す図である。
【図22】図21に示すコンテンツ選択画面8において、利用者によって「木村」のデイレクトリが削除された状態を示す図である。
【図23】図22に示す利用者によって「木村」のディレクトリが削除された状態のコンテンツ選択画面8におけるディレクトリ構造が反映された興味体系木Tを示す図である。
【図24】図21に示すコンテンツ選択画面31から、利用者が「木村」の名前を有するディレクトリを削除した結果を示す図である。
【図25】利用者のディレクトリ削除操作に伴い、コンテンツ参照手段7が、興味情報抽出手段5に保持されている興味体系木を、図23に示す構造に更新した後を示す図である。
【図26】図22に示すコンテンツ選択画面8において、利用者によって「経済」のディレクトリが追加された状態を示す図である。
【図27】図26に示す利用者によって「経済」のディレクトリが追加された状態のコンテンツ選択画面8におけるディレクトリ構造が反映された興味体系Tを示す図である。
【図28】興味体系木Tの別の例を示す図である。
【図29】図29に示す興味体系木Tに対応するコンテンツ選択画面8の構成を示す図である。
【図30】第1の手順によって図19に示す受信コンテンツへのポインタが、コンテンツ選択画面8に追加された状態を示す図である。
【図31】第2の手順によって、図19に示す受信コンテンツへのポインタがコンテンツ選択画面8に追加された状態を示す図である。
【図32】興味体系木構築過程において、出力されるグラフの一例を示す図である。
【図33】図32に示すグラフGxから代表頂点Pを削除した後におけるグラフGxを示す図である。
【図34】図33に示すグラフGxから、重みが1以下の辺を削除した後のグラフGxを示す図である。
【図35】アルゴリズムB1を適用することによって構成された節点P以下の木構造を示す図である。
【図36】アルゴリズムB2を適用することによって構成された節点P以下の木構造を示す図である。
【符号の説明】
100、200、300…コンテンツ選択装置、
1…放送コンテンツ、
2、22…メタ情報、
3…表示手段、
4…操作手段、
5…興味情報抽出手段、
6…興味体系木、
7…コンテンツ参照手段、
8…コンテンツ選択画面、
9…コンテンツ取得手段、
10…蓄積手段、
11…通信手段、
12…放送データ受信部、
13…インターネット、
21…ネットワーク放送コンテンツ。

Claims (17)

  1. 複数のキーワードを含むテキストによって構成されているメタ情報が関連付けられているコンテンツを、受信するとともに参照するコンテンツ選択装置において、
    受信されたコンテンツを蓄積するコンテンツ蓄積手段と;
    利用者が参照した各コンテンツの上記メタ情報に含まれているキーワード群を利用し、1つのキーワードが1つの節点に対応している根付き木構造である興味体系木を構成し、上記興味体系木を保持する興味情報抽出手段と;
    上記興味体系木と、受信されたコンテンツに関連付けられたメタ情報とを利用し、上記受信されたコンテンツに対する興味指数を決定し、上記興味指数が所定の一定値以上であれば、上記受信されたコンテンツを上記コンテンツ蓄積手段に蓄積し、しかも、蓄積された当該コンテンツと関連が最もある興味体系木の節点を定め、興味体系木の構造と一致するディレクトリ構造の当該節点に対応するディレクトリに、当該コンテンツへのポインタを追加するコンテンツ取得手段と;
    を具備し、
    上記興味情報抽出手段は、
    コンテンツプログラムファイル郡の各キーワードを頂点とし、コンテンツプロファイル郡中におけるキーワードの出現回数を当該頂点の重みとし、同一のコンテンツプロファイルに含まれるキーワードの組合せに対し、複数のコンテンツプロファイル中に同一のキーワードの組合せが存在する場合、そのキーワードの組合せの出現回数を、キーワードの組合せに対応する頂点間の辺の重みとした無向グラフGを構築し、当該無向グラフGを興味体系木の根Pに対応付ける第1の手段と;
    上記無向グラフGに対して、無向グラフGの連結でなくなるまで重みが小さな辺を削除し、無向グラフGを複数の連結成分にする第2の手段と;
    それぞれの連結成分に対して、重みが最大である頂点のキーワードの節点Qを生成し、無向グラフGに対応付けられた興味体系木の節点の子節点として当該生成された節点Qを興味体系木に加える第3の手段と;
    それぞれの連結成分に対して、節点Qに対応する頂点が削除された連結成分を、節点Qに対応付けられた無向グラフGとみなして、上記第2の手段と上記第3の手段とを働かせる第4の手段と;
    を有することを特徴とするコンテンツ選択装置。
  2. 複数のキーワードを含むテキストによって構成されているメタ情報が関連付けられているコンテンツを、受信するとともに参照するコンテンツ選択装置において、
    受信されたコンテンツを蓄積するコンテンツ蓄積手段と;
    上記コンテンツとコンテンツ選択画面とを表示する表示手段と;
    利用者によるコンテンツの選択等の操作を受け取る操作手段と;
    利用者が参照した各コンテンツの上記メタ情報に含まれているキーワード群を利用し、1つのキーワードが1つの節点に対応している根付き木構造である興味体系木を構成し、上記興味体系木を保持する興味情報抽出手段と;
    上記興味体系木の構造と一致するディレクトリ構造を構成するともに、上記ディレクトリ構造と、各ディレクトリ内に配置され、上記コンテンツ蓄積手段内に保持されているコンテンツと、通信手段を介して、アクセスされるネットワーク上のコンテンツへのポインタを管理し、各ディレクトリに、当該ディレクトリが対応する上記興味体系木中の節点に対応するキーワード名を提示し、各ディレクトリ内に配置されている各コンテンツへのポインタに当該コンテンツ名を提示したコンテンツ選択画面を、上記表示手段に表示するコンテンツ参照手段と;
    上記興味体系木と、受信されたコンテンツに関連付けられたメタ情報とを利用し、上記受信されたコンテンツに対する興味指数を決定し、上記興味指数が所定の一定値以上であれば、上記受信されたコンテンツを上記コンテンツ蓄積手段に蓄積し、しかも、蓄積された当該コンテンツへのポインタを、上記コンテンツ参照手段が管理する上記コンテンツ選択画面に追加するコンテンツ取得手段と;
    を具備し、
    上記興味情報抽出手段は、
    利用者参照したコンテンツ毎にメタ情報に含まれるキーワードを抽出し、コンテンツ毎にコンテンツに関連するキーワード集合であるコンテンツプロファイルCPi={keyword1,keyword2,...}(i=1,...,n)を構成する第1の手段と;
    コンテンツプロファイル群CPi(i=1,...,n)中の各キーワードを、頂点とし、同一のコンテンツプロファイルに含まれるキーワード間に、辺が存在するとし、コンテンツプロファイル群CPi(i=1,...,n)中におけるキーワードの出現回数を、当該頂点の重みとし、コンテンツプロファイル群CPi(i=1,...,n)において、複数のコンテンツプロファイル中に同一のキーワードの組合せが存在する場合、そのキーワードの組合せの出現回数を、当該辺の重みとする規則に従い、キーワードを頂点とする無向グラフGを構築する第2の手段と;
    無向グラフGから、重みが所定値以下である頂点を削除し、無向グラフGを更新する第3の手段と;
    無向グラフGに対して、所定のアルゴリズムAを適用し、興味体系木Tを深さ1まで構築し、n=1とし、深さnの各節点を代表頂点とする連結グラフそれぞれに対して、所定のアルゴリズムB1を適用し、興味体系木Tを深さn+1まで構築し、各連結グラフに上記アルゴリズムB1を適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了し、以降、nを1ずつ増加し、上記手順を適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了することによって無向グラフGから、興味体系木Tを構築する第4の手段と;
    によって,上記興味体系木を構築する手段であり、
    上記所定のアルゴリズムAは、重みω=0が設定され、興味体系木Tの根Pを作成し、無向グラフGが連結でなければ、無向グラフG中の連結成分G1、G2について、代表頂点を決定し、一方、無向グラフGが連結であれば、ω=ω+1が実行され、連結である無向グラフGから、重みがωの辺を無向グラフGから削除して更新し、無向グラフGが連結でなくなるまで繰り返すアルゴリズムであり、
    上記所定のアルゴリズムB1は、興味体系木T上の節点をPとし、代表頂点を削除し、連結グラフG1を更新し、連結グラフG1が複数の頂点を含み、無向グラフG1が連結であれば、ω=ω+1を実行し、重みがω以下の辺を無向グラフG1から削除して無向グラフG1が連結でなくなるまで繰り返し、一方、無向グラフG1が連結でなければ、無向グラフG1中の、各連結成分について、代表頂点を決定し、他方、連結グラフG1が複数の頂点を含まなければ、無向グラフG1を構成する頂点を、興味体系木Tに追加するアルゴリズムであることを特徴とするコンテンツ選択装置。
  3. 複数のキーワードを含むテキストによって構成されているメタ情報が関連付けられているコンテンツを、受信するとともに参照するコンテンツ選択装置において、
    受信されたコンテンツを蓄積するコンテンツ蓄積手段と;
    上記コンテンツとコンテンツ選択画面とを表示する表示手段と;
    利用者によるコンテンツの選択等の操作を受け取る操作手段と;
    利用者が参照した各コンテンツの上記メタ情報に含まれているキーワード群を利用し、1つのキーワードが1つの節点に対応している根付き木構造である興味体系木を構成し、上記興味体系木を保持する興味情報抽出手段と;
    上記興味体系木の構造と一致するディレクトリ構造を構成するともに、上記ディレクトリ構造と、各ディレクトリ内に配置され、上記コンテンツ蓄積手段内に保持されているコンテンツと、通信手段を介して、アクセスされるネットワーク上のコンテンツへのポインタを管理し、各ディレクトリに、当該ディレクトリが対応する上記興味体系木中の節点に対応するキーワード名を提示し、各ディレクトリ内に配置されている各コンテンツへのポインタに当該コンテンツ名を提示したコンテンツ選択画面を、上記表示手段に表示するコンテンツ参照手段と;
    上記興味体系木と、受信されたコンテンツに関連付けられたメタ情報とを利用し、上記受信されたコンテンツに対する興味指数を決定し、上記興味指数が所定の一定値以上であれば、上記受信されたコンテンツを上記コンテンツ蓄積手段に蓄積し、しかも、蓄積された当該コンテンツへのポインタを、上記コンテンツ参照手段が管理する上記コンテンツ選択画面に追加するコンテンツ取得手段と;
    を具備し、
    上記興味情報抽出手段は、
    利用者参照したコンテンツ毎に、メタ情報に含まれるキーワードを抽出し、コンテンツ毎に、コンテンツに関連するキーワード集合であるコンテンツプロファイルCPi={keyword1,keyword2,...}(i=1,...,n)を構成する第1の手段と;
    コンテンツプロファイル群CPi(i=1,...,n)中の各キーワードを、頂点とし、同一のコンテンツプロファイルに含まれるキーワード間に、辺が存在するとし、コンテンツプロファイル群CPi(i=1,...,n)中におけるキーワードの出現回数を、当該頂点の重みとし、コンテンツプロファイル群CPi(i=1,...,n)において、複数のコンテンツプロファイル中に同一のキーワードの組合せが存在する場合、そのキーワードの組合せの出現回数を、当該辺の重みとする規則に従い、キーワードを頂点とする無向グラフGを構築する第2の手段と;
    無向グラフGから、重みがα以下である頂点を削除し、無向グラフGを更新する第3の手段と;
    無向グラフGに対して、所定のアルゴリズムAを適用し、興味体系木Tを、深さ1まで構築し、n=1とし、深さnの各節点を代表頂点とする連結グラフのそれぞれに対して、所定のアルゴリズムB2を適用し、興味体系木Tを深さn+1まで構築し、各連結グラフに所定のアルゴリズムB2を適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了し、以降、nを1ずつ増加し、上記手段を適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了することによって、無向グラフGから、興味体系木Tを構築する第4の手段と;
    によって,上記興味体系木を構築する手段であり、
    上記所定のアルゴリズムAは、重みω=0が設定され、興味体系木Tの根Pを作成し、無向グラフGが連結でなければ、無向グラフG中の連結成分G1、G2について、代表頂点を決定し、一方、無向グラフGが連結であれば、ω=ω+1が実行され、連結である無向グラフGから、重みがωの辺を無向グラフGから削除して更新し、無向グラフGが連結でなくなるまで繰り返すアルゴリズムであり、
    上記所定のアルゴリズムB2は、興味体系木T上の節点をPとし、代表頂点を削除し、連結グラフG1を更新し、連結グラフG1が複数の頂点を含むと、ω=ω+1を実行し、重みがω以下の辺を無向グラフG1から削除して更新し、無向グラフG1が連結でなくなるまで繰り返し、無向グラフG1が連結でなければ、無向グラフG1中の、各連結成分について、代表頂点を決定し、一方、連結グラフG1が複数の頂点を含まなければ、無向グラフG1を構成する頂点を、興味体系木Tに追加するアルゴリズムであることを特徴とするコンテンツ選択装置。
  4. 請求項1〜請求項3のいずれか1項において、
    利用者の操作を受け付け、興味体系木の節点の移動、削除、追加を行う手段をさらに有することを特徴とするコンテンツ選択装置。
  5. 請求項1〜請求項4のいずれか1項において、
    上記コンテンツ取得手段は、
    新たに受信したコンテンツのメタ情報に含まれるキーワードを抽出し、上記新たに受信したコンテンツのコンテンツプロファイルを構成し、上記新たに受信したコンテンツのコンテンツプロファイル中に含まれ、しかも、上記興味体系木に節点として含まれるキーワードの数に基づいて、上記新たに受信したコンテンツに対する興味指数を決定する手段であることを特徴とするコンテンツ選択装置。
  6. 請求項1〜請求項4のいずれか1項において、
    上記コンテンツ取得手段は、
    新たに受信したコンテンツのメタ情報に含まれるキーワードを抽出し、新たに受信したコンテンツのコンテンツプロファイルを構成し、
    上記新たに受信したコンテンツのコンテンツプロファイル中に含まれ、しかも、上記興味体系木に節点として含まれるキーワードの重みの和に基づいて、上記新たに受信したコンテンツに対する興味指数を決定する手段であり、
    上記興味体系木は、その各節点に重みを有するものであることを特徴とするコンテンツ選択装置。
  7. 請求項1〜請求項4のいずれか1項において、
    上記コンテンツ取得手段は、
    上記興味体系木の節点であって、上記節点から根までの経路上の全ての節点群と上記節点の子供である全ての節点群との中で、上記新たに受信したコンテンツのコンテンツプロファイル中のキーワードに対応する節点を最も多く含み、しかも、最も深い位置に位置するものを、最関連節点として決定し、
    上記新たに受信したコンテンツに対する興味指数が一定値以上である場合には、上記コンテンツ参照手段が管理する上記コンテンツ選択画面における上記最関連節点に対応するディレクトリ下に、上記新たに受信したコンテンツへのポインタを追加する手段であることを特徴とするコンテンツ選択装置。
  8. 請求項1〜請求項4のいずれか1項において、
    上記興味情報抽出手段は、
    各節点に重みを有し、上記興味体系木を構成する手段であり、
    上記コンテンツ取得手段は、
    上記興味体系木の節点であって、上記節点から根までの経路上の全ての節点群と上記節点の子供である全ての節点群との中で、上記新たに受信したコンテンツのコンテンツプロファイル中のキーワードに対応する節点群の重みの和が最大となり、しかも、最も深い位置に位置するものを、最関連節点として決定し、
    上記新たに受信したコンテンツに対する興味指数が一定値以上である場合には、上記コンテンツ参照手段が管理する上記コンテンツ選択画面おける上記最関連節点に対応するディレクトリ下に、上記新たに受信したコンテンツへのポインタを追加する手段であり、
    上記興味体系木は、その各節点に重みを有するものであることを特徴とするコンテンツ選択装置。
  9. コンテンツ蓄積手段、興味情報抽出手段、コンテンツ取得手段を有し、複数のキーワードを含むテキストによって構成されているメタ情報が関連付けられているコンテンツを、受信するとともに参照するコンテンツ選択装置が行うコンテンツ選択方法において、
    上記コンテンツ蓄積手段が、受信されたコンテンツをコンテンツ蓄積手段に蓄積するコンテンツ蓄積工程と;
    上記興味情報抽出手段が、利用者が参照した各コンテンツの上記メタ情報に含まれているキーワード群を利用し、1つのキーワードが1つの節点に対応している根付き木構造である興味体系木を構成し、上記興味体系木を保持する興味情報抽出工程と;
    上記コンテンツ取得手段が、上記興味体系木と、受信されたコンテンツに関連付けられたメタ情報とを利用し、上記受信されたコンテンツに対する興味指数を決定し、上記興味指数が所定の一定値以上であれば、上記受信されたコンテンツを上記コンテンツ蓄積手段に蓄積し、しかも、蓄積された当該コンテンツと関連が最もある興味体系木の節点を定め、興味体系木の構造と一致するディレクトリ構造の当該節点に対応するディレクトリに、当該コンテンツへのポインタを追加するコンテンツ取得工程と;
    からなり、
    上記興味情報抽出工程は、
    コンテンツプログラムファイル郡の各キーワードを頂点とし、コンテンツプロファイル郡中におけるキーワードの出現回数を当該頂点の重みとし、同一のコンテンツプロファイルに含まれるキーワードの組合せに対し、複数のコンテンツプロファイル中に同一のキーワードの組合せが存在する場合、そのキーワードの組合せの出現回数を、キーワードの組合せに対応する頂点間の辺の重みとした無向グラフGを構築し、当該無向グラフGを興味体系木の根Pに対応付ける第1の工程と;
    上記無向グラフGに対して、無向グラフGの連結でなくなるまで重みが小さな辺を削除し、無向グラフGを複数の連結成分にする第2の工程と;
    それぞれの連結成分に対して、重みが最大である頂点のキーワードの節点Qを生成し、無向グラフGに対応付けられた興味体系木の節点の子節点として当該生成された節点Qを興味体系木に加える第3の工程と;
    それぞれの連結成分に対して、節点Qに対応する頂点が削除された連結成分を、節点Qに対応付けられた無向グラフGとみなして、上記第2の工程と上記第3の工程とを働かせる第4の工程と;
    を有することを特徴とするコンテンツ選択方法。
  10. コンテンツ蓄積手段、表示手段、操作手段、興味情報抽出手段、コンテンツ参照手段、コンテンツ取得手段を有し、複数のキーワードを含むテキストによって構成されているメタ情報が関連付けられているコンテンツを、受信するとともに参照するコンテンツ選択装置が行うコンテンツ選択方法において、
    上記コンテンツ蓄積手段が、受信されたコンテンツをコンテンツ蓄積手段に蓄積するコンテンツ蓄積工程と;
    上記表示手段が、上記コンテンツとコンテンツ選択画面とを表示手段に表示する表示工程と;
    上記操作手段が、利用者によるコンテンツの選択等の操作を受け取る操作工程と;
    上記興味情報抽出手段が、利用者が参照した各コンテンツの上記メタ情報に含まれているキーワード群を利用し、1つのキーワードが1つの節点に対応している根付き木構造である興味体系木を構成し、上記興味体系木を保持する興味情報抽出工程と;
    上記コンテンツ参照手段が、上記興味体系木の構造と一致するディレクトリ構造を構成するともに、上記ディレクトリ構造と、各ディレクトリ内に配置され、上記コンテンツ蓄積手段内に保持されているコンテンツと、通信手段を介して、アクセスされるネットワーク上のコンテンツへのポインタを管理し、各ディレクトリに、当該ディレクトリが対応する上記興味体系木中の節点に対応するキーワード名を提示し、各ディレクトリ内に配置されている各コンテンツへのポインタに当該コンテンツ名を提示したコンテンツ選択画面を、上記表示手段に表示するコンテンツ参照工程と;
    上記コンテンツ取得手段が、上記興味体系木と、受信されたコンテンツに関連付けられたメタ情報とを利用し、上記受信されたコンテンツに対する興味指数を決定し、上記興味指数が所定の一定値以上であれば、上記受信されたコンテンツを上記コンテンツ蓄積手段に蓄積し、しかも、蓄積された当該コンテンツへのポインタを、上記コンテンツ参照手段で管理する上記コンテンツ選択画面に追加するコンテンツ取得工程と;
    からなり、
    上記興味情報抽出工程は、
    利用者参照したコンテンツ毎にメタ情報に含まれるキーワードを抽出し、コンテンツ毎にコンテンツに関連するキーワード集合であるコンテンツプロファイルCPi={keyword1,keyword2,...}(i=1,...,n)を構成する第1の工程と;
    コンテンツプロファイル群CPi(i=1,...,n)中の各キーワードを、頂点とし、同一のコンテンツプロファイルに含まれるキーワード間に、辺が存在するとし、コンテンツプロファイル群CPi(i=1,...,n)中におけるキーワードの出現回数を、当該頂点の重みとし、コンテンツプロファイル群CPi(i=1,...,n)において、複数のコンテンツプロファイル中に同一のキーワードの組合せが存在する場合、そのキーワードの組合せの出現回数を、当該辺の重みとする規則に従い、キーワードを頂点とする無向グラフGを構築する第2の工程と;
    無向グラフGから、重みが所定値以下である頂点を削除し、無向グラフGを更新する第3の工程と;
    無向グラフGに対して、所定のアルゴリズムAを適用し、興味体系木Tを深さ1まで構築し、n=1とし、深さnの各節点を代表頂点とする連結グラフそれぞれに対して、所定のアルゴリズムB1を適用し、興味体系木Tを深さn+1まで構築し、各連結グラフに上記アルゴリズムB1を適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了し、以降、nを1ずつ増加し、上記手順を適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了することによって無向グラフGから、興味体系木Tを構築する第4の工程と;
    によって,上記興味体系木を構築する工程であり、
    上記所定のアルゴリズムAは、重みω=0が設定され、興味体系木Tの根Pを作成し、無向グラフGが連結でなければ、無向グラフG中の連結成分G1、G2について、代表頂点を決定し、一方、無向グラフGが連結であれば、ω=ω+1が実行され、連結である無向グラフGから、重みがωの辺を無向グラフGから削除して更新し、無向グラフGが連結でなくなるまで繰り返すアルゴリズムであり、
    上記所定のアルゴリズムB1は、興味体系木T上の節点をPとし、代表頂点を削除し、連結グラフG1を更新し、連結グラフG1が複数の頂点を含み、無向グラフG1が連結であれば、ω=ω+1を実行し、重みがω以下の辺を無向グラフG1から削除して無向グラフG1が連結でなくなるまで繰り返し、一方、無向グラフG1が連結でなければ、無向グラフG1中の、各連結成分について、代表頂点を決定し、他方、連結グラフG1が複数の頂点を含まなければ、無向グラフG1を構成する頂点を、興味体系木Tに追加するアルゴリズムであることを特徴とするコンテンツ選択方法。
  11. コンテンツ蓄積手段、表示手段、操作手段、興味情報抽出手段、コンテンツ参照手段、コンテンツ取得手段を有し、複数のキーワードを含むテキストによって構成されているメタ情報が関連付けられているコンテンツを、受信するとともに参照するコンテンツ選択装置が行うコンテンツ選択方法において、
    上記コンテンツ蓄積手段が、受信されたコンテンツをコンテンツ蓄積手段に蓄積するコンテンツ蓄積工程と;
    上記表示手段が、上記コンテンツとコンテンツ選択画面とを表示手段に表示する表示工程と;
    上記操作手段が、利用者によるコンテンツの選択等の操作を受け取る操作工程と;
    上記興味情報抽出手段が、利用者が参照した各コンテンツの上記メタ情報に含まれているキーワード群を利用し、1つのキーワードが1つの節点に対応している根付き木構造である興味体系木を構成し、上記興味体系木を保持する興味情報抽出工程と;
    上記コンテンツ参照手段が、上記興味体系木の構造と一致するディレクトリ構造を構成するともに、上記ディレクトリ構造と、各ディレクトリ内に配置され、上記コンテンツ蓄積手段内に保持されているコンテンツと、通信手段を介して、アクセスされるネットワーク上のコンテンツへのポインタを管理し、各ディレクトリに、当該ディレクトリが対応する上記興味体系木中の節点に対応するキーワード名を提示し、各ディレクトリ内に配置されている各コンテンツへのポインタに当該コンテンツ名を提示したコンテンツ選択画面を、上記表示手段に表示するコンテンツ参照工程と;
    上記コンテンツ取得手段が、上記興味体系木と、受信されたコンテンツに関連付けられたメタ情報とを利用し、上記受信されたコンテンツに対する興味指数を決定し、上記興味指数が所定の一定値以上であれば、上記受信されたコンテンツを上記コンテンツ蓄積手段に蓄積し、しかも、蓄積された当該コンテンツへのポインタを、上記コンテンツ参照工程で管理する上記コンテンツ選択画面に追加するコンテンツ取得工程と;
    からなり、
    上記興味情報抽出工程は、
    利用者参照したコンテンツ毎に、メタ情報に含まれるキーワードを抽出し、コンテンツ毎に、コンテンツに関連するキーワード集合であるコンテンツプロファイルCPi={keyword1,keyword2,...}(i=1,...,n)を構成する第1の手順と;
    コンテンツプロファイル群CPi(i=1,...,n)中の各キーワードを、頂点とし、同一のコンテンツプロファイルに含まれるキーワード間に、辺が存在するとし、コンテンツプロファイル群CPi(i=1,...,n)中におけるキーワードの出現回数を、当該頂点の重みとし、コンテンツプロファイル群CPi(i=1,...,n)において、複数のコンテンツプロファイル中に同一のキーワードの組合せが存在する場合、そのキーワードの組合せの出現回数を、当該辺の重みとする規則に従い、キーワードを頂点とする無向グラフGを構築する第2の手順と;
    無向グラフGから、重みがα以下である頂点を削除し、無向グラフGを更新する第3の手順と;
    無向グラフGに対して、所定のアルゴリズムAを適用し、興味体系木Tを、深さ1まで構築し、n=1とし、深さnの各節点を代表頂点とする連結グラフのそれぞれに対して、所定のアルゴリズムB2を適用し、興味体系木Tを深さn+1まで構築し、各連結グラフに所定のアルゴリズムB2を適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了し、以降、nを1ずつ増加し、上記手順を適用した結果、全てにおいて連結グラフが出力されない場合、興味体系木Tの構築を終了することによって、無向グラフGから、興味体系木Tを構築する第4の手順と;
    によって,上記興味体系木を構築する工程であり、
    上記所定のアルゴリズムAは、重みω=0が設定され、興味体系木Tの根Pを作成し、無向グラフGが連結でなければ、無向グラフG中の連結成分G1、G2について、代表頂点を決定し、一方、無向グラフGが連結であれば、ω=ω+1が実行され、連結である無向グラフGから、重みがωの辺を無向グラフGから削除して更新し、無向グラフGが連結でなくなるまで繰り返すアルゴリズムであり、
    上記所定のアルゴリズムB2は、興味体系木T上の節点をPとし、代表頂点を削除し、連結グラフG1を更新し、連結グラフG1が複数の頂点を含むと、ω=ω+1を実行し、重みがω以下の辺を無向グラフG1から削除して更新し、無向グラフG1が連結でなくなるまで繰り返し、無向グラフG1が連結でなければ、無向グラフG1中の、各連結成分について、代表頂点を決定し、一方、連結グラフG1が複数の頂点を含まなければ、無向グラフG1を構成する頂点を、興味体系木Tに追加するアルゴリズムであることを特徴とするコンテンツ選択方法。
  12. 請求項9〜請求項11のいずれか1項において、
    利用者の操作を受け付け、興味体系木の節点の移動、削除、追加を行う工程をさらに有することを特徴とするコンテンツ選択方法。
  13. 請求項9〜請求項12のいずれか1項において、
    上記コンテンツ取得工程は、
    新たに受信したコンテンツのメタ情報に含まれるキーワードを抽出し、上記新たに受信したコンテンツのコンテンツプロファイルを構成し、上記新たに受信したコンテンツのコンテンツプロファイル中に含まれ、しかも、上記興味体系木に節点として含まれるキーワードの数に基づいて、上記新たに受信したコンテンツに対する興味指数を決定する工程であることを特徴とするコンテンツ選択方法。
  14. 請求項9〜請求項12のいずれか1項において、
    上記コンテンツ取得工程は、
    新たに受信したコンテンツのメタ情報に含まれるキーワードを抽出し、新たに受信したコンテンツのコンテンツプロファイルを構成し、
    上記新たに受信したコンテンツのコンテンツプロファイル中に含まれ、しかも、上記興味体系木に節点として含まれるキーワードの重みの和に基づいて、上記新たに受信したコンテンツに対する興味指数を決定する工程であり、
    上記興味体系木は、その各節点に重みを有するものであることを特徴とするコンテンツ選択方法。
  15. 請求項9〜請求項12のいずれか1項において、
    上記コンテンツ取得工程は、
    上記興味体系木の節点であって、上記節点から根までの経路上の全ての節点群と上記節点の子供である全ての節点群との中で、上記新たに受信したコンテンツのコンテンツプロファイル中のキーワードに対応する節点を最も多く含み、しかも、最も深い位置に位置するものを、最関連節点として決定し、
    上記新たに受信したコンテンツに対する興味指数が一定値以上である場合には、上記コンテンツ参照工程が管理する上記コンテンツ選択画面における上記最関連節点に対応するディレクトリ下に、上記新たに受信したコンテンツへのポインタを追加する工程であることを特徴とするコンテンツ選択方法。
  16. 請求項9〜請求項12のいずれか1項において、
    上記興味情報抽出工程は、
    各節点に重みを有し、上記興味体系木を構成する工程であり、
    上記コンテンツ取得工程は、
    上記興味体系木の節点であって、上記節点から根までの経路上の全ての節点群と上記節点の子供である全ての節点群との中で、上記新たに受信したコンテンツのコンテンツプロファイル中のキーワードに対応する節点群の重みの和が最大となり、しかも、最も深い位置に位置するものを、最関連節点として決定し、
    上記新たに受信したコンテンツに対する興味指数が一定値以上である場合には、上記コンテンツ参照工程で管理する上記コンテンツ選択画面おける上記最関連節点に対応するディレクトリ下に、上記新たに受信したコンテンツへのポインタを追加する工程であり、
    上記興味体系木は、その各節点に重みを有するものであることを特徴とするコンテンツ選択方法。
  17. 請求項9〜請求項16のいずれか1項に記載のコンテンツ選択方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2000186792A 2000-06-21 2000-06-21 コンテンツ選択装置、コンテンツ選択方法および記録媒体 Expired - Fee Related JP3850013B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000186792A JP3850013B2 (ja) 2000-06-21 2000-06-21 コンテンツ選択装置、コンテンツ選択方法および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000186792A JP3850013B2 (ja) 2000-06-21 2000-06-21 コンテンツ選択装置、コンテンツ選択方法および記録媒体

Publications (2)

Publication Number Publication Date
JP2002007460A JP2002007460A (ja) 2002-01-11
JP3850013B2 true JP3850013B2 (ja) 2006-11-29

Family

ID=18686891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000186792A Expired - Fee Related JP3850013B2 (ja) 2000-06-21 2000-06-21 コンテンツ選択装置、コンテンツ選択方法および記録媒体

Country Status (1)

Country Link
JP (1) JP3850013B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1271350A1 (en) * 2001-06-14 2003-01-02 Deutsche Thomson-Brandt Gmbh Method and apparatus for automatically or electronically addressing data within a file or files
WO2005117422A1 (ja) * 2004-05-26 2005-12-08 Matsushita Electric Industrial Co., Ltd. 放送システム、放送局装置、受信装置および放送方法
US7849090B2 (en) 2005-03-30 2010-12-07 Primal Fusion Inc. System, method and computer program for faceted classification synthesis
JP2009059114A (ja) * 2007-08-31 2009-03-19 Brother Ind Ltd クーポン情報出力装置およびクーポン情報出力プログラム
US7836093B2 (en) * 2007-12-11 2010-11-16 Eastman Kodak Company Image record trend identification for user profiles
JP5827874B2 (ja) * 2011-11-11 2015-12-02 株式会社ドワンゴ キーワード取得装置、コンテンツ提供システム、キーワード取得方法、プログラム及びコンテンツ提供方法
JP6979003B2 (ja) * 2017-11-24 2021-12-08 株式会社ドワンゴ サーバおよびプログラム
CN113434784A (zh) * 2021-07-02 2021-09-24 网易传媒科技(北京)有限公司 新闻事件的追踪方法及装置、存储介质、电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1145284A (ja) * 1997-07-28 1999-02-16 Just Syst Corp プロファイルの作成方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP2002007460A (ja) 2002-01-11

Similar Documents

Publication Publication Date Title
JP4363806B2 (ja) オーディオビジュアルプログラム管理システム及びオーディオビジュアルプログラム管理方法
JP3810268B2 (ja) オーディオビジュアルシステム
JP4107811B2 (ja) オーディオビジュアルシステムの使用方法
JP4408768B2 (ja) 記述データの生成装置、記述データを利用したオーディオビジュアル装置
US7698720B2 (en) Content blocking
US8200688B2 (en) Method and system for facilitating information searching on electronic devices
US8392946B2 (en) Method of recommending local and remote content
RU2577189C2 (ru) Основанное на профиле извлечение содержимого для систем средств выдачи рекомендаций
US7181757B1 (en) Video summary description scheme and method and system of video summary description data generation for efficient overview and browsing
JP5985991B2 (ja) メディアコンテンツ空間ナビゲーション
US20010020981A1 (en) Method of generating synthetic key frame and video browsing system using the same
US20090025054A1 (en) Method and system for access to content in a content space
EP1016991A2 (en) Information providing method and apparatus, and information reception apparatus
US20040168121A1 (en) System and method for providing substitute content in place of blocked content
CN101141607A (zh) 可用于iptv的互动关联方法及其实现系统
JP2005529425A (ja) 個人プロファイルに基づくコンテンツ増加の方法、システム及び装置
JP5685373B2 (ja) 映像コンテンツ推奨管理装置、映像コンテンツのシーン再生指示方法及びそのプログラム
CA2387404A1 (en) Video summary description scheme and method and system of video summary description data generation for efficient overview and browsing
JP2005352754A (ja) 情報ナビゲーション装置、方法、プログラム、及び記録媒体
JP3850013B2 (ja) コンテンツ選択装置、コンテンツ選択方法および記録媒体
KR100534604B1 (ko) 티브이-애니타임 표준을 지원하는 멀티미디어 검색 및지능화 서비스 시스템
JP2003323458A (ja) 情報検索方法及びその装置、並びに該方法の実行プログラム及び該方法の実行プログラムを記録した記録媒体
KR101779975B1 (ko) Sns 메시지를 활용한 vod 컨텐츠에 대한 부가 서비스 시스템 및 이를 이용한 부가 서비스 방법
JP2011124655A (ja) 映像コンテンツ推奨管理装置、映像コンテンツの録画を実行させる方法及びそのプログラム
JP2011013860A (ja) 表示処理装置、表示処理方法およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20051129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060303

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060825

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060828

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090908

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100908

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110908

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120908

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130908

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees