〔実施の形態1〕
本発明の一実施形態について図1ないし図10に基づいて説明すると以下の通りである。
図1は、本実施の形態に係る番組情報表示装置の構成を示した図である。番組情報表示装置1は、同図に示すとおり、番組情報抽出装置2と表示装置3とを備えている。番組情報抽出装置2は、番組情報取得部(番組情報取得手段)11、番組情報記憶装置12、視聴情報取得部(視聴情報取得手段)13、視聴番組情報取得部(視聴番組情報取得手段)14、参照用データ記憶装置(第2記憶装置)15、データ更新部16、ユーザデータ記憶装置(第1記憶装置)17、抽出指示受付部18、情報抽出部(情報抽出手段)19、判定部(第1判定手段)20、優先度算出部(優先度算出手段)21、および、表示制御部22を備えている。また、番組情報取得部11は、キーワード抽出部(文字列抽出手段)31を備えている。さらに、データ更新部16は、判定部(第2判定手段)32、および、データ関連付部(関連付手段)33を備えている。
まず、番組情報抽出装置2について説明する。
番組情報取得部11は、所定の放送波を受信することにより、あるいは、データ記録媒体から読み出すことにより、あるいは、インターネットやCATVなどの回線を通じて、各放送番組の属性を示した番組情報を含む番組情報群(EPGデータ)を取得する。また、番組情報取得部11は、例えば、一回の取得処理により、約一週間分の放送番組についての番組情報を取得する。
図2(a)は、番組情報取得部11が取得した番組情報群のうち、ある一つの番組情報の内容を示した図である。なお、同図に示すとおり、番組情報には、放送開始日時を示す情報(開始日時情報)、放送終了日時を示す情報(終了日時情報)、放送局を示す情報(放送局情報)、放送番組のジャンルを示す情報(ジャンル情報)、タイトルを示す情報(タイトル情報)、出演者を示す情報(出演者情報)、および、番組の解説を示した情報(番組解説情報)等がテキストデータとして記されている。
さらに、番組情報取得部11は、各番組情報から、タイトル情報、出演者情報、ジャンル情報、開始日時情報、終了日時情報、放送局情報、番組解説情報、および、キーワードを示した情報(キーワード情報)を抽出する。さらに、番組情報取得部11は、これら抽出した情報を、番組情報記憶装置12に記憶させる。これにより、番組情報記憶装置12には、図2(b)のような形式で上記各抽出された情報(番組情報)が記憶される。
ここで、キーワード情報の抽出について説明する。キーワード情報の抽出には、いわゆる形態素解析の手法を用いる。ここで、形態素解析とは、品詞情報および表記情報等を記録した単語辞書を用いて、テキストデータの切れ目を探し、該テキストデータを単語に分解すると共に、分解された単語の品詞を判断するデータ処理技術である。図3に、形態素解析を行う前と、行った後のテキストデータの状態を示す。
番組情報取得部11のキーワード抽出部31は、上記手法を用いて、タイトル情報および番組解説情報の両テキストデータを単語に分解すると共に、分解して得られた単語から、名詞を示した単語のみを抽出する。つまり、番組情報に含まれる名詞を示す単語(文字列)を、番組情報毎に抽出する。そして、キーワード抽出部31は、この抽出した単語を、キーワード情報とする。
例えば、図2(a)に示す番組情報に関しては、図2(b)に示すとおり、タイトル情報から、「プロ野球」、「チームA」、および「チームB」という名詞がキーワード情報として抽出されると共に、番組解説情報から、「チームA」、「チームB」、「野球」、「試合」、および、「中継」という名詞がキーワード情報として抽出される。また、図4(a)に示す番組情報に関しては、図4(b)に示すとおり、タイトル情報から、「社会人野球」、「チームC」、および「チームD」という名詞がキーワード情報として抽出されると共に、番組解説情報から、「チームC」、「チームD」、「野球」、「試合」、および、「中継」という名詞がキーワード情報として抽出される。
視聴情報取得部13は、表示装置3(例えばテレビ)または録画装置(図示せず)から、ユーザが視聴した放送番組を示す視聴情報を取得する。そして、視聴情報取得部13は、この取得した情報を、視聴番組情報取得部14に送る。
図5に、視聴情報の内容を示す。同図に示すとおり、日時を示した情報に対して、視聴開始および視聴終了という内容のログ情報が付される。
視聴番組情報取得部14は、視聴情報取得部13から視聴情報を順次受け付ける。そして、視聴番組情報取得部14は、視聴情報に示される放送番組の番組情報(以下、視聴番組情報)を取得する。より詳しくは、該視聴番組情報に含まれる、タイトル情報、出演者情報、ジャンル情報、開始日時情報、終了日時情報、放送局情報、番組解説情報、および、キーワード情報を、番組情報記憶装置12から取得する。さらに、視聴番組情報取得部14は、上記取得した視聴番組情報(詳細には、視聴番組情報に含まれる各情報)を、データ更新部16の判定部32に送る。さらに、視聴番組情報取得部14は、視聴情報の内、上記放送番組の視聴終了日時情報を、併せて判定部32に送る。
参照用データ記憶装置15には、例えば図6に示すように、各ジャンル情報に対して参照語彙を示した情報(以下、参照情報)の関連付けがなされた参照語彙関連付情報(第2関連付情報)が予め記憶されている。より詳しくは、同図においては、「野球」というジャンル情報には、プロ野球、社会人野球、チームA、チームB、チームC、チームD等の参照情報が関連付けられ、「バラエティ」というジャンル情報には、野球、コント、ペット、ラーメン等の参照情報が関連付けられている。
データ変更部16は、参照データ記憶装置に記憶された参照語彙関連付情報を参照して、ユーザデータ記憶装置17の記憶内容を変更する。以下、該記憶内容の変更について説明する。
データ変更部16の判定部32は、視聴番組情報取得部14から、上記視聴番組情報および視聴終了日時情報を視聴番組情報毎に受け付ける。そして、判定部32は、上記参照語彙関連付情報に基づいて、視聴番組情報に、上記参照情報が含まれ、かつ、該参照情報と関連付けられたジャンル情報が含まれているか否かを視聴番組情報毎に判定する。そして、判定部32は、参照情報が含まれ、かつ、該参照情報と関連付けられたジャンル情報が含まれていると判定した場合、該参照情報と同一の情報と、該ジャンル情報と、この視聴番組情報のタイトル情報および出演者情報とを、データ関連付部33に送る。さらに、判定部32は、上記の情報とあわせて、視聴終了日時情報をデータ関連付部33に送る。
例えば、図2(b)の場合にはジャンル情報が野球であるため、判定部32は、まず、図6の野球というジャンル情報に関連付けられた参照情報(プロ野球、社会人野球、…)と一致する、図2(b)に示されたキーワード情報(つまり、参照情報と同一の情報)と、野球というジャンル情報とを、データ関連付部33に送る。具体的には、プロ野球、チームA、および、チームBを送る。さらに、判定部32は、「プロ野球〜チームA×チームB」というタイトル情報を送る。なお、出演者情報に関するデータはないため、この場合には、判定部32は該情報を送らない。
一方、判定部32は、参照情報、および、該参照情報と関連付けられたジャンル情報が含まれていないと判定した場合には、該ジャンル情報と、この視聴番組情報のタイトル情報および出演者情報とを、データ関連付部33に送る。この場合にも、判定部32は、視聴終了日時情報をデータ関連付部33に送る。
データ変更部16のデータ関連付部33は、判定部32から、上述した、参照情報と同一の情報と、該ジャンル情報と、タイトル情報と、出演者情報と、視聴終了日時情報とを受け付ける。これら情報を受け付けた場合、データ関連付部33は、ユーザデータ記憶装置17に記憶されたジャンル情報であって、視聴番組情報に含まれるジャンル情報と同一のジャンル情報に、上記参照情報と同一の情報と、タイトル情報と、出演者情報と、視聴終了日時情報とを関連付ける。なお、ユーザデータ記憶装置17に上記ジャンル情報が記憶されていない場合には、このジャンル情報を記憶した上で、上記参照情報と同一の情報を関連付けて記憶する。これは、実施の形態2でも同様である。
ここで、ユーザデータ記憶装置17内で上記ジャンル情報に関連付けた、上記参照情報と同一の情報と、タイトル情報と、出演者情報とを、抽出用情報と称する。なお、この抽出用情報が、特許請求の範囲に記載の所定情報に該当する。
なお、参照情報と同一の情報を受け付けなかった場合には、データ関連付部33は、ユーザデータ記憶装置17に記憶されたジャンル情報であって、視聴番組情報に含まれるジャンル情報と同一のジャンル情報に、タイトル情報と、出演者情報と、視聴終了日時情報とを関連付ける。
さらに、データ関連付部33は、ユーザデータ記憶装置17内の各抽出用情報に付されたポイント情報を更新する。但し、既に、参照情報と同一の情報、タイトル情報、および/または、出演者情報が、抽出用情報として記憶されている場合には、データ関連付部33は、これらの各情報を関連付けることなく、ポイント情報のみを更新する。
つまり、データ関連付部33は、上記各情報が抽出用情報としてユーザデータ記憶装置17に記憶されていない場合のみ、上記ジャンル情報と同一のジャンル情報に関連付けて、上記各情報を抽出用情報としてユーザデータ記憶装置17に追加記憶する。なお、抽出用情報およびポイント情報については、後述する。
ユーザデータ記憶装置17には、図7に示すとおり、ジャンル毎に種別に区分けして、上記抽出用情報、視聴終了日時情報、および、ポイント情報が記憶される。つまり、ユーザデータ記憶装置17には、各ジャンル情報に対して抽出用情報の関連付けがなされると共に、この各抽出用情報に対して、視聴終了日時情報およびポイント情報が関連付けられた所定語彙関連付情報(第1関連付情報)が記憶される。
ここで、ポイント情報とは、取得した視聴番組情報に含まれるキーワードであって、かつ、参照情報と一致する、該視聴番組情報に含まれるキーワードの出現回数に応じた値を示した情報である。つまり、ポイント情報は、視聴回数に基づいた情報であるといえる。ポイント情報が示すポイントは、例えば図7においては、ジャンルがバラエティで語彙がタイトルAのポイントは6、ジャンルがバラエティで語彙が単語Dのポイントは80、ジャンルが野球で語彙が単語Dのポイントは1となっている。なお、単語Dは、バラエティと野球との両ジャンルに記されているが、各ジャンルにおいてそれぞれポイント情報が付される。
ところで、ユーザデータ記憶装置17に新たに追加記憶させる抽出用情報がある場合に、既に、ユーザデータ記憶装置17の記憶容量の残りがほとんどなく、この抽出用情報と視聴終了日時情報とポイント情報とを記憶させることができないという事態が生じる。このときには、所定の手順に従い、既にユーザデータ記憶装置17に記憶されている抽出用情報と、該抽出用情報に関連付けられた視聴終了日時情報およびポイント情報とを削除し、代わりに、新たな抽出用情報と視聴終了日時情報とポイント情報とを該ユーザデータ記憶装置17に記憶させる。上記所定の手順としては、例えば、ポイント情報で示されるポイントが低い抽出用情報、あるいは、視聴終了日時情報で示される視聴終了日時が最も古い抽出用情報を削除する手順が挙げられる。
抽出指示受付部18は、ユーザからの番組情報の抽出指示を受け付ける。そして、抽出指示受付部18は、上記抽出指示を受け付けると、情報抽出部19に対して、所定の指示(以下、第1指示)を送る。
情報抽出部19は、抽出指示受付部18から上記第1指示を受け付ける。この第1指示を受け付けると、情報抽出部19は、判定部20に所定の指示(以下、第2指示)を送る。
判定部20は、上記第2指示を情報抽出部19から受け付ける。そして、上記第2指示を受け付けると、判定部20は、第2指示を受け付けた時刻よりも後に放送される放送番組の番組情報を、番組情報記憶装置12に記憶された番組情報群のなかから特定する。なお、以下では、このようにして特定された各番組情報を第1特定番組情報と、第1番組情報の集合を第1番組情報群と称する。
そして、判定部20は、ユーザデータ記憶装置17に記憶された所定語彙関連付情報に基づいて、各第1特定番組情報に関し、番組情報記憶装置12に記憶した第1特定番組情報のキーワード情報群(文字列群)に、該第1特定番組情報に含まれるジャンル情報に関連付けられた抽出用情報が存在するか否かを判定する。
言い換えると、判定部20は、上記所定語彙関連付情報に基づいて、番組情報記憶装置12に記憶された第1特定番組情報に、上記抽出用情報が含まれ、かつ、該抽出用情報と関連付けられたジャンル情報が含まれているか否かを、第1特定番組情報毎に判定する。
さらに、判定部20は、抽出用情報が含まれ、かつ、該抽出用情報と関連付けられたジャンル情報が含まれている番組情報(以下、第2特定番組情報)を示した情報を、優先度算出部21に送る。また、判定部20は、各第2番組特定情報を示した情報の送信と共に、各第2特定番組情報に含まれていた抽出用情報、および、該抽出用情報が関連づけられたジャンル情報を優先度算出部21に送る。
優先度算出部21は、判定部20から上記各情報を受け付けると、第2特定番組情報に含まれると共に、ユーザデータ記憶装置17内で該第2特定番組情報に含まれるジャンル情報と同一のジャンル情報に関連付けられた抽出用情報に関する上記ポイント情報を用いて、各番組情報の優先度を算出する。
以下、図2(b)、図4(b)、および、図7に基づいて、優先度の算出方法の一例を説明する。なお、この方法では、図7に示す種別毎に、ポイント情報で示されたポイントの平均値を算出して、優先度を算出することとする。
図2(b)に示される番組情報のジャンルは、「野球」である。したがって、優先度算出部21は、図7に示す、「野球」のジャンルに関連付けられた抽出用情報(語彙)およびポイント情報を参照する。つまり、優先度算出部21は、ユーザデータ記憶装置17に記憶された、「野球」のジャンルに関連付けられた抽出用情報(語彙)およびポイント情報を参照する。
ここで、図7においては、種別としてタイトルおよびキーワードがあるため、優先度算出部21は、まず、これら各種別でのポイントの平均値を求める。さらに、優先度算出部21は、各種別で求めた平均値を加算することにより、平均値の総和を求める。
ここで、タイトルという種別に関しては、抽出用情報は「プロ野球〜チームA×チームB」の一情報のみであり、該抽出用情報のポイントは26である。このため、タイトルのポイントの平均値は26となる。また、キーワードという種別に関しては、「チームA」、「チームB」、および、「プロ野球」の3つの抽出用情報がある。そして、これら各抽出用情報のポイントは、それぞれ、95、10、および、95であるため、キーワードのポイントの平均値は66となる。したがって、平均値の総和は、26と66とを加えることにより、92となる。
一方、図4(b)に示されている番組情報のジャンルも、「野球」である。したがって、この場合にも、優先度算出部21は、図7に示す、「野球」のジャンルに関連付けられた抽出用情報(語彙)およびポイント情報を参照する。しかしながら、図7に示す所定語彙関連付情報においては、タイトルという種別に関しては、図4(b)に示した「社会人野球〜チームC×チームD」という抽出用情報が存在していない。また、図7に示す所定語彙関連付情報においては、キーワードという種別に関しては、図4(b)に示した各キーワード情報が何れも存在していない。したがって、各種別の平均値を0となり、平均値の総和も0となる。
なお、ユーザデータ記憶装置17に記憶された所定語彙関連付情報に、キーワード情報を示す抽出用情報が記憶されていないということは、ユーザはそれらのキーワード情報を含む番組を視聴したことがないということである。このため、図4(B)のような番組情報で特定される放送番組は好みでないと考えられ、合致度が0というのは妥当であると判断できる。
ところで、上記平均値の総和は、ユーザの嗜好に合致した度合(合致度)を示した値と言える。つまり、合致度が高い番組情報は、ユーザに優先的に推薦すべき番組情報であると言える。このため、優先度算出部21は、上記合致度に基づいて優先度を決定する。具体的には、合致度の高い番組情報ほど、優先度を高く設定する。そして、優先度算出部21は、算出した優先度を示す情報を、情報抽出部19に送る。
情報抽出部19は、優先度算出部21から上記優先度を示した情報を受け付ける。そして、情報抽出部19は、この情報で示された優先度に基づいて、番組情報記憶装置12から所定数以下の数の番組情報を抽出する。より詳しくは、情報抽出部19は、番組情報記憶装置12から、優先度の高い順に所定数以下の数の番組情報を抽出する。ここで、所定数とは、例えば、表示装置の表示画面に一度に表示できる数であってもよいし、特に限定されるものではない。さらに、情報抽出部19は、上記抽出した番組情報を表示制御部22に送る。
表示制御部22は、情報抽出部19から上記抽出した番組情報を受け付けると、表示装置3の表示画面に、例えば図8に示すとおり、所定の形式で上記受け付けた番組情報を表示させる。なお、番組情報にポイント情報を併記して、これらの情報を表示画面に表示してもよい。
ここで、本実施の形態の手法で番組情報を抽出した場合と従来の手法で番組情報を抽出した場合とを比較するため、従来の手法で抽出を行った場合に得られる番組情報について説明する。具体的には、参照用データ記憶装置15に、図16のようなジャンルに区分けされていない語彙(参照情報に対応する語彙)が記憶されており、かつ、ユーザデータ記憶装置17に、ジャンル分けされずに語彙(抽出用情報に対応する語彙)が記憶されている場合に得られる番組情報について説明する。
従来の手法に従い、図16に示すようにジャンルに区分けされていない語彙を用いて、図2(a)で示される番組情報からキーワードを抽出する場合、タイトル情報から、「プロ野球」、「チームA」、および「チームB」という名詞がキーワード情報として抽出されると共に、番組解説情報から、「チームA」、「チームB」、および、「野球」という名詞がキーワード情報として抽出される。次に、図4(b)で示される番組情報からキーワードを抽出する場合、タイトル情報から、「社会人野球」、「チームC」、および「チームD」という名詞がキーワード情報として抽出されると共に、番組解説情報から、「チームC」、「チームD」、および、「野球」という名詞がキーワード情報として抽出される。
ここで、プロ野球の「チームA」が好きなユーザが、図2(a)で示される番組情報の放送番組を頻繁に視聴している場合、「チームA」と共に「野球」という語彙のポイントが上昇する。このため、「野球」という語彙しか含まないような番組情報の合致度が上昇し、このような番組情報が番組情報記憶装置12から抽出されてしまう。
例えば、図4(a)で示される番組情報の放送番組は、ポイントが高い「野球」というキーワードが存在するために、上記合致度が高くなる。しかしながら、上述したように、ユーザが、「社会人野球」、「チームC」、および、「チームD」を含む放送番組を視聴したことがない場合、図4(a)で示される番組情報の放送番組は好みでないと考えられる。このため、該番組情報の合致度が高いのは適当でない。しかしながら、従来の手法では、図4(a)のような番組情報が抽出されてしまう。
また、例え、番組情報のジャンルが一致する番組情報群から番組情報を抽出する構成であっても、図4(a)に示す番組情報の他にも「野球」という語彙を含む番組情報が「野球」というジャンルの中にはたくさん存在するため、ユーザの好みと合致しない番組情報を抽出してしまう。このため、この構成であっても、ユーザの嗜好に沿った番組情報を抽出することはできない。
また、従来の手法において、「野球」という語彙を登録しなかった場合(つまり、図16に野球という語彙がない場合)には、番組情報に「野球」という語彙が含まれているような、バラエティ放送番組の番組情報が抽出されることはない。したがって、ユーザが、このような放送番組を好んで視聴したとしても、このような放送番組の番組情報は抽出されることはない。したがって、この場合にも、ユーザの嗜好に沿った番組情報を抽出することはできない。
一方、本実施の形態の手法では、ユーザデータ記憶装置17においては、「野球」というジャンル情報には「野球」という抽出用情報は関連付けられていため、図4(a)で示されるような番組情報が抽出されることはない。さらに、本実施の形態の手法では、番組情報に「野球」という語彙が含まれているような、バラエティ放送番組の番組情報を抽出することが可能である。このため、本実施の形態の手法を用いることにより、ユーザの嗜好に沿った番組情報を抽出することが可能となる。
次に、ユーザデータ記憶装置17に対して上述した各情報の記憶する際の処理のフローを図9に基づいて説明する。
まず、視聴情報取得部13が、視聴情報を取得したか否かが判定される(S1)。S1において、視聴情報を取得したと判定された場合には、視聴番組情報取得部14が、視聴番組情報に含まれる、タイトル情報、出演者情報、ジャンル情報、開始日時情報、終了日時情報、放送局情報、番組解説情報、および、キーワード情報を、番組情報記憶装置12から取得する(S2)。一方、S1において、視聴情報を取得したと判定されなかった場合には、再度、S1に戻る。
S2の後は、判定部32により、上記参照語彙関連付情報に基づいて、上記視聴番組情報に、上記参照情報と同一のキーワード情報が含まれ、かつ、該参照情報と関連付けられたジャンル情報が含まれているか否かが判定される(S3)。
S3において、参照情報が含まれ、かつ、該参照情報と関連付けられたジャンル情報が含まれていると判定した場合、判定部32は、該参照情報と同一の情報と、該ジャンル情報と、この視聴番組情報のタイトル情報および出演者情報とを、データ関連付部33に送る(S4)。
一方、S3において、参照情報、および、該参照情報と関連付けられたジャンル情報が含まれていないと判定した場合には、該ジャンル情報と、この視聴番組情報のタイトル情報および出演者情報とを、データ関連付部33に送る(S5)。
S4およびS5の後は、データ関連付部33に送られた各情報(視聴終了日時情報を除く)が、既に、ユーザデータ記憶装置17内で上記ジャンル情報に関連付けられているか否かがデータ関連付部33により判定される(S6)。
S6において、関連付けられていない情報があると判定された場合には、ユーザデータ記憶装置17に、この情報と、該情報に関する視聴終了日時情報およびポイント情報とを記憶するだけの容量が残っているか否かがデータ関連付部33により判定される(S7)。
S7において、容量が残っていないと判定された場合には、ユーザデータ記憶装置17に記憶されている抽出用情報を一つずつ削除する(S8)。なお、削除する抽出用情報は、視聴終了日時情報で示される視聴終了日時が最も古い抽出用情報とする。ただし、これに限定されず、上述したとおり、ポイント情報で示されるポイントが低い抽出用情報であってもよい。一方、S7において容量が残っていると判定された場合、あるいは、S8の後は、データ関連付部33が、この情報と該情報に関する視聴終了日時情報とポイント情報とを上記ジャンル情報に関連付ける(S9)。
一方、S6において、関連付けられていない情報がない(つまり、上記各情報とも既に関連付け済みである)と判定された場合には、データ関連付部33により、ユーザデータ記憶装置17内で各情報に関連付けられたポイント情報が更新される(S10)。そして、S10の後は、データ関連付部33により、ユーザデータ記憶装置17内で各情報に関連付けられた視聴終了日時情報が更新される(S11)。
S9およびS11の後は、全てのキーワード情報に関して、上記参照語彙関連付情報に基づいて、上記視聴番組情報に、上記参照情報と同一のキーワード情報が含まれ、かつ、該参照情報と関連付けられたジャンル情報が含まれていることが判定されたか否かが判定される(S12)。
S12において、全てのキーワードに関し判定が行われていないと判定された場合、S3に戻る。一方、S12において、全てのキーワードに関し判定が行われたと判定された場合、処理を終了する。
次に、ユーザデータ記憶装置17に記憶された所定語彙関連付情報を用いて、番組情報を番組情報記憶装置12から抽出する際の処理フローを、図10に基づいて説明する。
抽出指示受付部18が、ユーザからの番組情報の抽出指示を受け付ける(S21)。S21の後は、判定部20により、上記所定語彙関連付情報に基づいて、番組情報記憶装置12に記憶された上記第1特定番組情報に、上記抽出用情報が含まれ、かつ、該抽出用情報と関連付けられたジャンル情報が含まれているか否かが、第1特定番組情報毎に判定される(S22)。
S22において、上記抽出用情報と、該抽出用情報と関連付けられたジャンル情報とが含まれていると判定された場合には、優先度算出部21により、このように判定された第1特定番組情報(つまり、上記第2特定番組情報)の優先度が、ポイント情報を用いて算出される(S23)。一方、S22において、上記抽出用情報と、該抽出用情報と関連付けられたジャンル情報とが含まれていると判定されなかった場合には、処理を終了する。
S23の後は、全ての第2番組情報に関して、優先度が算出されたか否かが、優先度算出部21により判断される(S24)。S24において、全ての第2番組情報に関して、優先度が算出されたと判断されなかった場合、再度、S23に戻る。一方、S24において、全ての第2番組情報に関して、優先度が算出されたと判断された場合、情報抽出部19が、番組情報記憶装置12から、上記優先度の高い順に番組情報(第2特定番組情報)を抽出する(S25)。以上により、抽出処理が終了する。
ところで、上記の実施の形態においては、番組情報取得部11は、図2(a)に示すとおり、開始日時情報、終了日時情報、放送局情報、ジャンル情報、タイトル情報、出演者情報、および、番組解説情報といった各種情報を一度に取得する構成を説明したが、これに限定されるものではない。
例えば、一度に上記各種情報全てを取得せずに、ユーザやシステムからの指示を受け付けることによって、残りの各種情報を取得する構成としてもよい。つまり、複数の段階を経て番組情報を取得する構成としてもよい。この一例としては、まず、開始日時情報、終了日時情報、放送局情報、ジャンル情報、および、タイトル情報を取得し、ユーザ等からの指示を受け付けた場合に、残りの出演者情報と番組解説情報とを取得する構成が挙げられる。
この構成においては、開始日時情報、終了日時情報、放送局情報、Gコードなど放送番組を特定できるIDから、複数のサーバから、放送番組の詳細な番組情報を取得する共に、複数のサーバからの番組情報を、番組情報の抽出に利用してもよい。
また、番組情報取得部11は、通常、番組情報抽出装置2が、外部から番組情報群を取得可能な状態であるときは、リアルタイムに番組情報を取得する。しかしながら、システムやユーザから指示を受け付けたときに、外部から番組情報群を受信するでもよい。
また、上記の実施の形態においては、キーワード情報の抽出においては、形態素解析の手法を用いて名詞のみを抽出したが、これに限定されない。例えば、参照用データ記憶装置15に記憶した参照語彙関連付情報を参照し、放送番組のジャンルと一致するジャンルに関連付けられた参照情報と一致する語彙を抽出する構成としてもよい。
また、上記実施の形態においては、例えば図2(b)に示すとおり、キーワード情報が重複している場合であっても、全てのキーワード情報を抽出した。しかしながら、これに限定されるものではない。例えば、一度抽出したキーワード情報は、再度抽出しない構成としてもよい。また、キーワード情報の抽出と共に、該キーワード情報が出現した回数を記憶する構成としてもよい。また、複数回出現するキーワード情報に対しては、該キーワード情報によるポイント情報更新の際に、出現する回数に応じて、ポイントの上昇率が高くなるよう、出現回数に基づくポイント情報を付す構成としてもよい。
また、図7においては、抽出用情報等がジャンル別に整理されて記憶されている場合を示した。しかしながら、ユーザデータ記憶装置17内では、識別情報に、ジャンル情報が関連づけされていれば、記憶形式は特に限定されるものではない。例えば、タイトル、出演者、およびキーワードの種別毎に整理して記憶する構成であってもよい。
また、番組情報記憶装置12に番組情報を記憶する際に、参照用データ記憶装置15を参照し、以下の処理を行う構成としてもよい。まず、番組情報のジャンルと同じジャンルに関連付けられている参照情報と一致する情報を、この番組情報から抽出する。そして、データ更新部16が、上記参照情報と一致した情報を抽出用情報として、ユーザデータ記憶装置17において、該番組抽出情報を該番組情報のジャンル情報と同一のジャンル情報に関連付ける。なお、この場合には、判定部32は、参照用データ記憶装置15に記憶された第2関連付情報を参照する必要はない。
また、上記の実施の形態においては、ジャンルを、番組情報に含まれるジャンル情報に従って区分けしたが、これに限定されるものではない。例えば、番組情報の或る所定の単語を含む場合はグループ1と、別の所定の単語を含む場合にはグループ2というように、番組情報内のテキスト情報を用いてグループ分けし、この各グループを一つのジャンルとしてもよい。
また、番組情報に含まれるジャンル情報に従う場合と、上記グループに従う場合との何れかを選択可能な構成としてもよい。この場合には、2つの異なる参照語彙関連付情報を参照用データ記憶装置15に記憶しておき、上記選択に応じて、用いる参照語彙関連情報を使い分ける構成とすればよい。
また、上記実施の形態においては、視聴情報取得部13が、ユーザが視聴した放送番組を示す視聴情報を取得する構成を説明した。
しかしながら、視聴情報取得部13の他に、さらに、録画予約された放送番組を示す録画予約番組情報を取得する録画情報取得部を設け、この放送番組の番組情報を用いて、ユーザデータ記憶装置17に抽出用情報を記憶させる構成としてもよい。なお、録画予約番組情報も、視聴番組情報と同様に、ユーザの嗜好する放送番組の属性を示した番組情報(嗜好番組)といえる。さらに、放送番組を指定する情報を指定情報とすると、ユーザから指定情報を受け付けると共に、この指定情報に示された放送番組についての番組情報を用いて、ユーザデータ記憶装置17に抽出用情報を記憶させる構成としてもよい。
なお、視聴情報以外に、録画情報および指定情報を用いた場合には、図5示すログ内容に、録画開始、録画終了、ユーザ指定といったログが追加される。
また、視聴情報取得部13の代わりに、放送番組を指定する受付部を設け、ユーザが気に入った放送番組を指定する構成としてもよい。ここで、放送番組の指定の仕方も、特に限定されず、例えば、ユーザが、放送番組の視聴中に受付部を介して指定してもよいし、あるいは、番組情報閲覧中に受付部を介して指定してもよい。なお、上記指定された放送番組の番組情報も、嗜好番組情報と言える。
また、番組情報抽出装置が、外部から、コンテンツの内容を説明するテキストデータが付与されたコンテンツ情報を取得し、かつ、この取得したコンテンツ情報を視聴した場合でも、上記と同様に、テキストデータ中の文字列等を、所定情報としてユーザデータ記憶装置17に記憶する構成としてもよい。
また、上記の実施の形態においては、ポイント情報は、視聴回数に基づいた情報としたが、これに限定されるものではない。例えば、視聴終了日時情報と、抽出指示受付部18が抽出指示を受け付けた日時情報(指示日時情報)とを用いて、視聴最終日から指示日までの日数を求め、この日数が長くなるほど、ポイントが高くなるように、ポイント情報を規定してもよい。あるいは、放送番組の視聴時間が長くなるほど、ポイントが高くなるように、ポイント情報を規定してもよい。あるいは、同一の抽出用情報を含む全ての放送番組全てのうち、どれだけの放送番組を視聴したかを示す割合を算出し、この割合が高くなるほど、ポイントが高くなるように、ポイント情報を規定してもよい。
また、上記の実施の形態においては、合致度の算出の対象となる番組情報は、上記第2指示を受け付けた時刻よりも後に放送される放送番組の番組情報としたが、これに限定されるものではない。例えば、ユーザやシステムによって対象となる番組情報の範囲を指定し、その範囲内の番組情報全ての合致度を算出する構成としてもよい。
また、上記の実施形態においては、種別毎にポイントの平均値を算出し、その総計を合致度としたが、これに限定されるものではない。例えば、種別を考慮せずに、各抽出用情報に関連付けられたポイント情報の各ポイントの総和を求め、この総和を合致度としてもよい。
また、上記の実施の形態においては、情報抽出部19が、この情報で示された優先度に基づいて、番組情報記憶装置12から所定数以下の数の番組情報を抽出する構成を示した。しかしながら、これに限定されず、情報抽出部19を、合致度が所定の値以上の番組情報を抽出する構成としてもよい。
また、上記の実施の形態においては、上述したように、ユーザデータ記憶装置17の記憶容量の残りがほとんどなく、抽出用情報と視聴終了日時情報とポイント情報とを記憶させることができない場合には、ポイント情報で示されるポイントが低い抽出用情報、あるいは、視聴終了日時情報で示される視聴終了日時が最も古い抽出用情報を削除する構成とした。しかしながら、これに限定されるものではない。
例えば、データ関連付部33が、視聴終了日時情報に基づいて、視聴終了日からの経過に数を抽出用情報毎に算出すると共に、所定の日数以上経過している抽出用情報、並びに、該抽出用情報に関連づけされている視聴終了日時情報およびポイント情報を削除する構成とすればよい。さらに、所定の日数以上経過している抽出用情報が存在しない場合には、最も日数が経過している抽出用情報、ならびに、該抽出用情報に関連づけされている視聴終了日時情報およびポイント情報を削除する構成としておけばよい。
以上のように、番組情報抽出装置2は、各放送番組の属性を示した番組情報を含む番組情報群を取得する番組情報取得部(番組情報取得手段)11と、放送番組のジャンルを示した情報をジャンル情報とすると、各ジャンル情報に対して、少なくとも抽出用情報(所定情報)の関連付けがなされた所定語彙関連付情報(第1関連付情報)を記憶したユーザデータ記憶装置(第1記憶装置)17と、前記所定語彙関連付情報に基づいて、前記取得した番組情報に、前記抽出用情報が含まれ、かつ、該抽出用情報と関連付けられたジャンル情報が含まれているか否かを、番組情報毎に判定する判定部(第1判定手段)20と、前記判定部20により前記抽出用情報および該抽出用情報と関連付けられたジャンル情報が含まれていると判定された場合、前記番組情報群の中から前記取得した番組情報を抽出する情報抽出部(情報抽出手段)19とを備える構成である。
この構成によれば、番組情報取得部11により、各放送番組の属性を示した番組情報を含む番組情報群を取得できる。また、ユーザデータ記憶装置17には、各ジャンル情報に対して、少なくとも抽出用情報の関連付けがなされた所定語彙関連付情報が記憶されている。
さらに、判定部20により、前記所定語彙関連付情報に基づいて、前記取得した番組情報に、前記抽出用情報が含まれ、かつ、該抽出用情報と関連付けられたジャンル情報が含まれているか否かを、番組情報毎に判定できる。つまり、判定部20により、取得した番組情報中に、所定語彙関連付情報において関連付けられたジャンル情報と抽出用情報との両情報が含まれているか否かが、番組情報毎に判定できる。
また、判定部20により前記抽出用情報および該抽出用情報と関連付けられたジャンル情報が含まれていると判定された場合、情報抽出部19により、前記番組情報群の中から前記取得した番組情報を抽出できる。つまり、情報抽出部19により、所定語彙関連付情報において関連付けられたジャンル情報と抽出用情報との両情報が含まれている番組情報を、番組情報群から抽出できる。
それゆえ、ジャンル情報に対して関連付ける抽出用情報をジャンル情報毎に異ならせることにより、ジャンル情報に応じた抽出用情報を用いて番組情報の抽出を行うことができる。
ところで、あるジャンルにおいて、該ジャンルの放送番組の番組情報内に頻繁に現れる情報であっても、他のジャンルの放送番組の番組情報においては、頻繁に現れない場合がある。この場合、上記情報は、上記あるジャンルにおいては特徴的な情報とならないが、上記他のジャンルにおいては特徴的な情報となる。このように、同じ情報であっても、ジャンルに応じて、特徴的な情報となったり、あるいは、ならなかったりする。それゆえ、上記他のジャンルにおいては、上記情報を抽出用情報として、該他のジャンルを示すジャンル情報に関連付けておけば、該情報と該ジャンル情報とが含まれている番組情報を抽出できる。つまり、特定のジャンルにおいて特徴的となる情報を含む番組情報を抽出することができる。
したがって、上記の構成では、上述したように、ジャンル情報に応じた抽出用情報を用いて番組情報の抽出を行うことができるため、各ジャンル情報に対して、抽出用情報としてユーザの好みを表す情報を関連付けておけば、ユーザの嗜好に沿った番組情報を的確に抽出することが可能となる番組情報抽出装置を提供できる。
また、番組情報抽出装置2は、前記所定語彙関連付情報には、さらに、抽出用情報毎に、抽出用情報の重要度を示した重要度情報が予め関連付けられており、判定部20により前記抽出用情報および該抽出用情報と関連付けられたジャンル情報が含まれていると判定された場合、該番組情報に含まれると共に該ジャンル情報に関連付けられた抽出用情報に関する前記重要度情報を用いて、各番組情報の優先度を算出する優先度算出部(優先度算出手段)21とを備え、情報抽出部19は、前記優先度の高い順に、番組情報群から番組情報を抽出する構成である。
この構成によれば、所定語彙関連付情報には、さらに、抽出用情報毎に、抽出用情報の重要度を示した重要度情報が予め関連付けられている。また、判定部20により前記抽出用情報および該抽出用情報と関連付けられたジャンル情報が含まれていると判定された場合、優先度算出部21により、該番組情報に含まれると共に該ジャンル情報に関連付けられた抽出用情報に関する前記重要度情報を用いて、各番組情報の優先度を算出することができる。さらに、情報抽出手段は、前記優先度の高い順に、番組情報群から番組情報を抽出することができる。
それゆえ、各ジャンル情報に関し、ユーザの嗜好の度合いが高い抽出用情報の重要度を高くなるように設定しておけば、このような抽出用情報を多く含む番組情報の優先度は高くなる。したがって、ユーザの嗜好の度合いが高い順に、番組情報を抽出することができるという効果を奏する。
また、番組情報抽出装置2において、情報抽出部19は、所定数以下の数の番組情報を抽出することが好ましい。
この構成によれば、情報抽出部19により、所定数以下の数の番組情報が抽出される。それゆえ、優先度の低い番組情報は抽出されない。したがって、ユーザの嗜好度合いの高い番組情報のみを抽出することが可能となる。
また、本発明に係る番組情報抽出装置2は、各ジャンル情報に対して参照情報の関連付けがなされた参照語彙関連付情報(第2関連付情報)を記憶した参照用データ記憶装置(第2記憶装置)15と、前記取得された番組情報であって、ユーザが嗜好する放送番組の属性を示した番組情報を嗜好番組情報とすると、前記参照語彙関連付情報に基づいて、嗜好番組情報に、前記参照情報が含まれ、かつ、該参照情報と関連付けられたジャンル情報が含まれているか否かを嗜好番組情報毎に判定する判定部(第2判定手段)32と、判定部32により、嗜好番組情報に前記参照情報および該参照情報と関連付けられたジャンル情報が含まれていると判定された場合、ユーザデータ記憶装置(第1記憶装置)17に記憶された、該嗜好番組情報に含まれる該ジャンル情報と同一のジャンル情報に、該参照情報と同一の情報を抽出用情報として関連付けるデータ関連付部(関連付手段)33とを備える構成である。
この構成によれば、参照用データ記憶装置15には、各ジャンル情報に対して参照情報の関連付けがなされた参照語彙関連付情報が記憶される。また、判定部32により、前記参照語彙関連付情報に基づいて、嗜好番組情報に、前記参照情報が含まれ、かつ、該参照情報と関連付けられたジャンル情報が含まれているか否かが嗜好番組情報毎に判定できる。さらに、判定部32により、嗜好番組情報に前記参照情報および該参照情報と関連付けられたジャンル情報が含まれていると判定された場合、データ関連付部33により、ユーザデータ記憶装置17に記憶された、該嗜好番組情報に含まれる該ジャンル情報と同一のジャンル情報に、該参照情報と同一の情報を抽出用情報として関連付けることができる。
ところで、抽出用情報をジャンル情報に関連付ける場合、嗜好番組情報はユーザの嗜好を表す番組情報であるからといって、ジャンル情報に対して、嗜好番組情報中の情報を分別せずに抽出用情報として関連付けてしまうと、ユーザの嗜好に沿わない番組情報が抽出されるおそれがある。
それゆえ、予め各ジャンルにおいて特徴となりうる情報を参照情報として記憶させておけば、各ジャンルにおいて特徴とならない情報が、該ジャンルを示すジャンル情報に関連付けられてしまう事態を防止できる。したがって、ユーザの嗜好に沿った番組情報を的確に抽出することができるという効果を奏する。
また、番組情報抽出装置2において、データ関連付部33は、さらに、ユーザデータ記憶装置(第1記憶装置)17に記憶された、嗜好番組情報に含まれるジャンル情報と同一のジャンル情報に、該嗜好番組情報に含まれる、タイトルを示したタイトル情報を抽出用情報として関連付ける構成である。
この構成によれば、データ関連付部33により、さらに、ユーザデータ記憶装置17に記憶された、嗜好番組情報に含まれるジャンル情報と同一のジャンル情報に、該嗜好番組情報に含まれる、タイトルを示したタイトル情報が抽出用情報として関連付けられる。
ここで、嗜好番組情報のタイトル情報は、ユーザの嗜好を示した情報であるといえる。
したがって、上述したように、タイトル情報を抽出用情報として、前記嗜好番組情報に含まれるジャンル情報に関連付けることにより、ユーザの嗜好に沿った番組情報を抽出することが可能となる。
また、番組情報抽出装置2において、データ関連付部33は、さらに、ユーザデータ記憶装置17に記憶された、嗜好番組情報に含まれるジャンル情報と同一のジャンル情報に、該嗜好番組情報に含まれる、出演者を示した出演者情報を抽出用情報として関連付ける構成である。
この構成によれば、データ関連付部33により、さらに、ユーザデータ記憶装置17に記憶された、嗜好番組情報に含まれるジャンル情報と同一のジャンル情報に、該嗜好番組情報に含まれる、出演者を示した出演者情報が抽出用情報として関連付けられる。
ここで、嗜好番組情報の出演者情報は、ユーザの嗜好を示した情報であるといえる。
したがって、上述したとおり、出演者情報を抽出用情報として、前記嗜好番組情報に含まれるジャンル情報に関連付けることにより、ユーザの嗜好に沿った番組情報を抽出することが可能となる。
ところで、上記の実施の形態においては、優先度を算出し、優先度の高い番組情報から順に抽出する構成を示したが、これに限定されるものではない。例えば、図11に示すように、番組情報抽出装置2を、優先度算出部21の代わりに抽出用情報数算出部(所定情報数算出手段)23を有する構成としてもよい。
ここで、抽出用情報数算出部23は、判定部20により前記抽出用情報および該抽出用情報と関連付けられたジャンル情報が含まれていると判定された場合、該番組情報に含まれると共に該ジャンル情報に関連付けられた抽出用情報の数を、番組情報毎に算出する。また、この場合には、情報抽出部19を、前記算出した抽出用情報の数が多い順に、番組情報群から番組情報を抽出する構成としておく。
つまり、番組情報抽出装置2aを、判定部20により前記抽出用情報および該抽出用情報と関連付けられたジャンル情報が含まれていると判定された場合、該番組情報に含まれると共に該ジャンル情報に関連付けられた抽出用情報の数を、番組情報毎に算出する抽出用情報数算出部(所定情報数算出手段)23を備え、情報抽出部19は、前記算出した抽出用情報の数が多い順に、番組情報群から番組情報を抽出する構成としておく。
この構成によれば、判定部20により前記抽出用情報および該抽出用情報と関連付けられたジャンル情報が含まれていると判定された場合、抽出用情報数算出部23により、該番組情報に含まれると共に該ジャンル情報に関連付けられた抽出用情報の数が、番組情報毎に算出される。
ここで、各ジャンル情報に対して、抽出用情報としてユーザの好みを表す情報を関連付けておいた場合、抽出用情報が数多く含まれる番組情報ほど、ユーザの嗜好に沿った番組情報であると言える。
したがって、上述したように、情報抽出部19が、前記算出した抽出用情報の数が多い順に、番組情報群から番組情報を抽出することにより、ユーザの嗜好の度合いが高い順に、番組情報を抽出することができる。
〔実施の形態2〕
本発明の他の実施形態について、図12から図15に基づいて説明すれば、以下のとおりである。なお、説明の便宜上、上記実施の形態1の図面に示した部材と同一の機能を有する部材については、同一の符号を付し、その説明を省略する。
本実施の形態に係る番組情報表示装置1′は、番組情報抽出装置2′と表示装置3とを備える。つまり、番組情報表示装置1′は、実施の形態1の番組情報表示装置1と比較すると、番組情報抽出装置の構成が異なっている。そこで、以下では、番組情報抽出装置2′について説明する。
図12は、番組情報抽出装置2′を備えた番組情報表示装置1′の構成を示した図である。番組情報抽出装置2′は、同図に示すとおり、番組情報取得部11、番組情報記憶装置12、視聴情報取得部13、視聴番組情報取得部(視聴番組情報取得手段)14′、データ更新部16′、ユーザデータ記憶装置17、抽出指示受付部18、情報抽出部19、判定部20、優先度算出部21、および、表示制御部22を備えている。また、データ更新部16′は、選択部51、判定部(第3判定手段)52、判定部(第4判定手段)53、判定部(第5判定手段)54、判定部(第6判定手段)55、および、データ関連付部(関連付手段)33′を備えている。
このように、番組情報抽出装置2′は、参照用データ記憶装置15を備えていない点、並びに、視聴番組情報取得部およびデータ変更部の構成が異なる点において、実施の形態1の番組情報抽出装置2と相違する。したがって、以下では、実施の形態1と相違する点を、主として説明する。
視聴番組情報取得部14′は、情報の送り先のみが実施の形態1の視聴番組情報取得部14と異なる。視聴番組情報取得部14′は、実施の形態1で述べた視聴番組情報(詳細には、視聴番組情報に含まれる各情報)を、データ更新部16′に送る。さらに、視聴番組情報取得部14′は、視聴情報の内、上記放送番組の視聴終了日時情報を、併せてデータ更新部16′に送る。なお、視聴番組情報に含まれる各情報とは、実施の形態1でも示したとおり、タイトル情報、出演者情報、ジャンル情報、開始日時情報、終了日時情報、放送局情報、番組解説情報、および、キーワード情報をさす。
また、視聴番組情報取得部14′は、番組情報記憶装置12内に記憶された上記視聴番組情報に対して、該番組情報で示される放送番組が視聴されたか否かを示すフラグ(以下、視聴フラグ)を付す。具体的には、視聴された場合には視聴フラグを「1」と、未視聴の場合には視聴フラグを「0」とする。これにより、例えば、番組情報記憶装置12には、図13に示すような、視聴フラグが付された番組情報が記憶される。
ところで、本実施の形態においては、ユーザデータ記憶装置17に抽出用情報を関連付けるにあたり、2通りの方法がある。第1の方法は、判定部52、判定部53、判定部54、および、データ関連付部33′をこの順に介して、上記関連付けを行う方法であり、第2の方法は、判定部52、判定部53、判定部55、および、データ関連付部33′をこの順に介して、上記関連付けを行う方法である。
つまり、両方法の異なる点は、判定部53から所定の情報を判定部54に送るか、あるいは、判定部53から該所定の情報を判定部55に送るかという点である。ここで、上記所定の情報を、何れの判定部に送るかという2者択一の選択は、選択部51により決定される。
具体的には、選択部51は、番組情報記憶装置12に記憶されている、視聴フラグが「1」の番組情報の数が所定の値以上であるか否かを判定し、所定の値未満の場合には、上記所定の情報を判定部54に送るように判定部53に指示する。一方、所定の値以上の場合には、選択部51は、上記所定の情報を判定部55に送るように判定部53に指示する。
言い換えると、視聴された放送番組の数が少ない場合には、選択部51は、判定部54に上記所定の情報が送られるよう判定部53に指示する一方、視聴された放送番組の数が多い場合には判定部55に上記所定の情報が送られるよう判定部53に指示する。また、視聴履歴が比較的少ない間は判定部54に上記所定の情報が送られるよう判定部53に指示する一方、視聴履歴がある程度蓄積されると判定部55に上記所定の情報が送られるよう判定部53に指示する構成とも言える。なお、所定の情報については、後述する。
以下では、まず、上記第1の方法が選択された場合の、ユーザデータ記憶装置17への抽出用情報の関連付けについて説明する。
判定部52は、上記視聴番組情報内のキーワード情報(つまり、文字列)が、該視聴番組情報に含まれるジャンル情報のジャンルを示した文字列と同じか否かを、キーワード情報毎に判定する。そして、判定部52は、同じであると判定されたキーワード情報を除いたキーワード情報(以下、第1キーワード情報群と称する)を、視聴番組情報毎に判定部53に送る。
例えば、或る視聴番組情報のジャンルがサッカーの場合、このジャンルを示すジャンル情報を含む番組情報は全てサッカーに関する番組情報であるため、「サッカー」という語彙は特徴のある語彙ではない。このため、「サッカー」という語彙は、判定部53に送られず、例えば、サッカーチーム名、大会名等の語彙(第1キーワード情報群)が判定部53に送られる。
判定部53は、判定部52から、視聴番組情報毎に第1キーワード情報群を受け付ける。そして、判定部53は、各第1キーワード情報群に、同一のキーワード情報が所定数以上含まれているか否かを、視聴番組情報毎に判定する。言い換えると、判定部53は、同一のキーワード情報が所定数以上、視聴番組情報に含まれているか否かを、視聴番組情報毎に判定する。
そして、所定数以上含まれていないと判定されたキーワード情報(以下、第2キーワード情報群と称する)は、判定部53により、判定部54に送られる。一方、所定数以上含まれていると判定されたキーワード情報(以下、第3キーワード情報群と称する)は、判定部53により、データ関連付部33′に送られる。
データ関連付部33′が判定部53から、視聴番組情報毎に第3キーワード情報群を受け付けた場合、データ関連付部33′は、ユーザデータ記憶装置17に記憶された、該視聴番組情報に含まれるジャンル情報と同一のジャンル情報に、上記同一のキーワード情報を、上述した抽出用情報として関連付ける。
なお、この場合、データ関連付部33′は、実施の形態1のデータ関連付部33と同様に、ポイント情報の更新および視聴終了日時情報の更新を行う。以下において、データ関連付部33′がキーワード情報を抽出用情報として関連付ける場合には、上記ポイント情報の更新および視聴終了日時情報の更新が行われるものとする。
ところで、ある任意の番組情報に頻繁に出現するキーワード情報は、放送番組の特徴を示す語彙である。このため、上記キーワード情報は、ユーザの嗜好を表すものと考えられる。それゆえ、データ関連付部33′により、ジャンル情報に関連付けておく。
一方、判定部54が、判定部53から視聴番組情報毎に第2キーワード情報群を受け付けた場合には、判定部54は、以下の判定を行う。つまり、視聴番組情報に含まれるジャンル情報と同一のジャンル情報を含んだ他の番組情報を同一ジャンル番組情報とすると、判定部54は、上記同一ジャンル番組情報数に対する、第2キーワード情報群のキーワード情報(文字列)を含んだ番組情報数の割合が所定値以上であるか否かを、キーワード情報毎に判定する。そして、所定値未満であると判定されたキーワード情報(以下、第4キーワード情報群と称する)は、判定部54により、データ関連付部33′に送られる。
データ関連付部33′が、判定部54から視聴番組情報毎に第4キーワード情報群を受け付けた場合、データ関連付部33′は、ユーザデータ記憶装置17に記憶された、各視聴番組情報に含まれるジャンル情報と同一のジャンル情報に対して、各判定の対象となったキーワード情報を、上述した抽出用情報として関連付ける。
なお、上記所定数は、50パーセントとしもよいし、その他の数としてもよい。特に限定されない。
ところで、同一ジャンル内には、同じキーワード情報を含む番組情報が頻繁に出現したり、意味が類似したキーワード情報を含む番組情報が頻繁に出現したりする。しかしながら、これら多くの番組情報で出現するキーワードは、特徴のある語彙ではない。例えば、映画のジャンルにおいて番組解説情報に「字幕」および「監督」といったキーワード情報を含む番組情報の数は多く、これらのキーワード情報は、映画のジャンルにおいては、特徴のある語彙ではない。このため、上記キーワード情報は、ユーザの嗜好を表すものと考えられない。それゆえ、これらのキーワード情報は、ジャンル情報に関連付けないこととする。
また、データ関連付部33′は、実施の形態1のデータ関連付部33と同様に、番組用抽出情報毎に、ポイント情報の更新、並びに、ジャンル情報に対応する、タイトル情報、出演者情報、および、終了日時情報の関連付けを行う。
以上により、ユーザデータ記憶装置17には、実施の形態1と同様、図7に示すとおり、ジャンル毎に種別に区分けして、上記抽出用情報、視聴終了日時情報、および、ポイント情報が記憶される。つまり、ユーザデータ記憶装置17には、各ジャンル情報に対して抽出用情報の関連付けがなされると共に、この各抽出用情報に対して、視聴終了日時情報およびポイント情報が関連付けられた所定語彙関連付情報(第1関連付情報)が記憶される。
ここで、このような第1の方法で得られる具体的な効果について説明する。
同一ジャンル内では同じキーワード情報を含む番組情報が頻繁に出現する。逆に、あるジャンル(以下、ジャンルA)で多くの番組情報に含まれるキーワード情報Xでも、別のジャンル(以下、ジャンルB)ではあまり出現しないことがある。このとき、ジャンルを超えて番組情報全体を考えると、キーワード情報Xを含む番組情報が頻繁に出現していないように判断される場合がある。
したがって、ユーザデータ記憶装置17に対する抽出用情報の記憶を、従来のようにジャンルを無視して行うと、キーワード情報Xがユーザデータ記憶装置17に記憶されてしまう。このような場合、キーワード情報XはジャンルAの番組によく含まれるので、ジャンルAの番組が多く抽出されてしまうこととなる。つまり、ユーザの嗜好に沿わない番組情報が多く抽出される
しかしながら、第1の方法では、実施の形態1と同様、ジャンル情報毎に、抽出用情報として関連付けるキーワード情報を設定できる。したがって、上記キーワード情報Xを、ジャンルAを示すジャンル情報には関連付けない一方、ジャンルBを示すジャンル情報には関連付けるといったことが可能になる。
以上のように、第1の方法は、キーワード情報がジャンルのジャンル名と一致するか否か、そのジャンルに属する放送番組の番組情報内でのキーワード情報の出現回数、および、そのジャンルに属する放送番組の番組情報内での、上記キーワード情報を含む番組情報の割合に基づいて、キーワード情報を抽出用情報として、ユーザデータ記憶装置17に記憶させるか否かを判断する構成である。
次に、上記第2の方法が選択された場合の、ユーザデータ記憶装置17への抽出用情報の関連付けについて説明する。なお、判定部52および判定部53については、第1の方法で説明したため、ここでの説明は省略する。また、以下では、判定部53から、該判定部53において所定数以上含まれていないと判定されたキーワード情報(第2キーワード情報群と称する)が、判定部54に送られたとして説明する。
判定部55が、判定部54から視聴番組情報毎に第2キーワード情報群を受け付けた場合には、判定部55は、以下の判定を行う。なお、以下では、視聴番組情報に含まれるジャンル情報と同一のジャンル情報を含んだ他の番組情報を同一ジャンル番組情報と称する。また、同一ジャンル番組情報群における、第2キーワード情報群の一キーワード情報を含んだ番組情報を第1特定番組情報と称する。さらに、第1特定番組情報群における、ユーザが視聴した放送番組の属性を示した番組情報(視聴フラグが「1」の番組情報)を第2特定番組情報と称する。
判定部55は、前記第2特定番組情報に対する、前記第1特定情報の割合が、所定値以上であるか否かを、キーワード情報毎に判定する。言い換えると、ユーザが視聴した放送番組が属するジャンルと同じジャンルの放送番組のうち、該放送番組の番組情報に含まれるキーワード情報を番組情報に含む放送番組を、ユーザが或る割合以上で視聴しているのかを、上記頻繁に出現しなかったキーワード情報毎に判定する。そして、所定値以上であると判定されたキーワード情報(以下、第5キーワード情報群と称する)は、判定部55により、データ関連付部33′に送られる。
ここで、具体例を挙げて、判定部55での判定を説明する。
まず、「プロ野球」というキーワード情報を含み、「野球」というジャンルの番組情報全体の中で視聴フラグが「1」になっている番組情報をカウントする。このカウント値をCAとする。次に、「プロ野球」というキーワード情報を含み、「野球」というジャンルの番組情報全体をカウントする。このカウント値をCBとする。そして、判定部55により、CBに対するCAの割合を求め、求めた割合が予め定めておいた閾値TH(上記所定値)以上であるならば、判定部55は、この「プロ野球」というキーワード情報をデータ関連付部33′に送る。
なお、閾値THは上記同一の値である必要はない。例えば、判定部55により、視聴フラグが「1」の番組情報が一定数以上、番組情報記憶装置12に記憶されたと判断された場合、判定部55が上記閾値THを変更する構成としてもよい。
また、「プロ野球」というキーワード情報に関するの判定が終了すれば、「チームA」、「チームB」に関しても同様に判定を行う。ただし、「チームA」のように番組情報中に複数回出現するキーワード情報は、一度判定すればよい。
ところで、上記においては、同一ジャンル番組情報群における、第2キーワード情報群の一キーワード情報を含んだ番組情報を第1特定番組情報としたが、これに限定されるものではない。例えば、同一ジャンル番組情報群における、第2キーワード情報群の一キーワード情報を含んだ番組情報であって、さらに、判定部55による判定日時以前の放送番組の番組情報を、第1特定番組情報としてもよい。
データ関連付部33′が、判定部55から視聴番組情報毎に第5キーワード情報群を受け付けた場合、データ関連付部33′は、ユーザデータ記憶装置17に記憶された、判定の対象となったキーワード情報を含む前記視聴番組情報に含まれるジャンル情報と同一のジャンル情報に対して、該キーワード情報を、上述した抽出用情報として関連付ける。
以上のように、第2の方法では、第1の方法と同様に、ユーザが視聴した放送番組の番組情報に含まれるキーワード情報が、該放送番組の属するジャンルと一致するかどうかを判断し、一致したキーワード情報に関しては、ユーザデータ記憶装置17での関連付けを行わない。また、第1の方法と同様に、一致しなかったキーワード情報に関しては、ユーザが視聴した放送番組の一番組情報に頻繁に出現する場合、上記関連付けを行う。
さらに、上述したように、第2の方法では、ユーザが視聴した放送番組が属するジャンルと同じジャンルの放送番組のうち、該放送番組の番組情報に含まれるキーワード情報を番組情報に含む放送番組を、ユーザが或る割合以上で視聴しているのかを、上記頻繁に出現しなかったキーワード情報毎に判定する。そして、このキーワード情報を含む放送番組を、ユーザが高い割合で視聴しているならば、上記関連付けを行う構成である。
ところで、ユーザは、或るジャンル内において、好みのキーワード情報が出現する放送番組をよく視聴すると考えられる。例えば、ユーザが野球というジャンルにおいて、好みのプロ野球のチームの試合だけをよく視聴するとする。プロ野球の試合の放送番組のタイトルは、例えば「プロ野球〜チームAvsチームN」とする。ここで、好みのチームをチームAとすると、「野球」というジャンルの中では、「チームA」というキーワード情報を含む放送番組をユーザが見る割合が高くなるはずである。したがって、第2の方法では、このようなキーワード情報を含む番組情報を抽出できる。
また、同ユーザが「チームA」の試合の放送番組を視聴したとき、「チームA」と共に「プロ野球」というキーワード情報も抽出されるとする。このため、「プロ野球」というキーワード情報の出現回数は多くなる。また、「プロ野球」をキーワード情報として含む番組情報で示される放送番組をユーザが視聴した割合は、「チームA」をキーワード情報として含む番組情報で示される放送番組をユーザが視聴した割合よりも少ないと考えられる。というのは、「チームA」でない他のチーム同士のプロ野球の試合の番組が存在するためである。言い換えると、視聴していない放送番組の番組情報であって、かつ、プロ野球というキーワード情報を含む番組情報が多数存在するからである。
ここで、仮に「プロ野球」というキーワード情報を関連付けてしまうと、「チームA」以外の試合の放送番組の番組情報も抽出してしまうおそれがある。以上の点から、ユーザの視聴の有無に関わらず、よく出現するキーワードはユーザの好みを表すキーワードにはなりにくいと考えられる。このため、ユーザが視聴した放送番組内で出現回数が多くても、ユーザが未視聴の番組でも出現回数が多いキーワード情報は、関連付けるべきでないといえる。しかしながら、上記第2の方法では、このような関連付けを防ぐことができるため、ユーザの嗜好に沿った番組情報を的確に抽出することができる。
また別のユーザが、野球というジャンルにおいて、ほぼ全てのプロ野球の試合の番組を視聴するとする。この場合、「プロ野球」というキーワード情報を含む番組をユーザが視聴した割合は高くなると考えられる。このような場合、このユーザにとっては「プロ野球」というキーワード情報を関連付けるべきである。これは、プロ野球の試合であるならば、どのチームの試合であっても、ユーザは視聴したいと考えるためである。
上記第2の方法では、このような場合には、「プロ野球」というキーワード情報を関連付けできるため、ユーザの嗜好に沿った番組情報を的確に抽出することができる。
以上のように、第2の方法では、ジキーワード情報がジャンルのジャンル名と一致するか否か、そのジャンルに属する放送番組の番組情報内でのキーワード情報の出現回数、および、ジャンル内でそのキーワード情報を番組情報に含む放送番組を視聴した割合に基づいて、キーワード情報を抽出用情報として、ユーザデータ記憶装置17に記憶させるか否かを判断する。
ここで、このような第2の方法で得られる具体的な効果について説明する。
ユーザは、通常、同一ジャンル内では同じキーワード情報を含む番組情報に関する放送番組を頻繁に視聴する。逆に、あるジャンル(以下、ジャンルA′)でキーワード情報X′を番組情報に含む放送番組を頻繁に視聴しても、別のジャンル(以下、ジャンルB′)ではキーワード情報X′を番組情報に含む放送番組をあまり視聴しない場合がある。このような場合には、ジャンルを超えて番組情報全体を考えると、キーワード情報Xを含む番組情報で示される放送番組を、ユーザはあまり視聴していないと判断されるおそれがある。
したがって、ユーザデータ記憶装置17に対する抽出用情報の記憶を、従来のようにジャンルを無視して行うと、キーワード情報Xがユーザデータ記憶装置17に記憶されてない。このため、ユーザの嗜好に沿った番組情報を的確に抽出できない。
しかしながら、第2の方法では、実施の形態1と同様、ジャンル情報毎に、抽出用情報として関連付けるキーワード情報を設定できる。したがって、上記キーワード情報Xを、ジャンルAを示すジャンル情報には関連付ける一方、ジャンルBを示すジャンル情報には関連付けないといったことが可能になる。
ところで、上記においては、視聴履歴が比較的少ない間は、第1の方法を用いて上記抽出用情報の関連付けを行い、視聴履歴がある程度蓄積されると、第2の方法を用いて上記関連付けを行った。
このように、視聴履歴が比較的少ない間において第1の方法を用いる理由は、視聴履歴が比較的少ないうちは、視聴フラグが「1」の番組情報が少ない(つまり、上記カウント値であるCAが小さい)ため、全てのキーワード情報が関連付けされたり、あるいは、全てのキーワード情報が関連付けされなかったりするおそれがあるためである。
また、視聴履歴がある程度蓄積されると第2の方法に切り替える理由は、第2の方法は、第1の方法よりも、よりユーザの視聴傾向に従って、各キーワード情報を抽出用情報として関連付けるか否かを判断することが可能なためである。
以下に、上記第1の方法と第2の方法とを用いて、各キーワード情報を抽出用情報として関連付けるか否かを判定する場合の具体例について説明する。なお、判定部54と判定部55とデータ関連付部33′とにおいて行われる処理についてのみ説明する。
ここでは、野球というジャンルの中で「プロ野球」というキーワード情報を、抽出用情報として関連付けるか否かについて説明する。
まず、上述したように、視聴履歴が比較的少ない間は、第1の方法を用いて判定する。
「野球」というジャンル情報を含む番組情報の中には、通常、図2(a)(b)に示すような「プロ野球」というキーワード情報を含む番組情報が多数存在する。また、図4(a)(b)に示すような「プロ野球」というキーワード情報を含まない番組情報も多数存在する。
判定部54は、「野球」のジャンルに属する放送番組の番組情報(つまり、野球というジャンル情報を有する番組情報)内での、「プロ野球」というキーワード情報を含む番組情報の割合が、所定値(例えば50パーセント)以上であるか否かを判定する。
そして、所定値未満であるならば、データ関連付部33′は、「プロ野球」というキーワード情報を抽出用情報として、ユーザデータ記憶装置17内の野球というジャンル情報に関連付ける。
なお、「プロ野球」というキーワード情報が関連付けられると、この「プロ野球」というキーワード情報に付されたポイント情報も併せて更新する。また、第1の方法では、ユーザデータ記憶装置17に既に記憶されているキーワード情報に関しては、判定部54は、上記の判定を行う必要はなく、ポイント情報のみを更新すればよい。
次に、視聴履歴がある程度蓄積されると、第2の判定方法を用いる。ここでは、第1の方法を行ったときに、「プロ野球」というキーワード情報が、ユーザデータ記憶装置17において関連付けられたとする。
第2の方法では、「プロ野球」というキーワード情報を番組情報に含む放送番組であって、野球というジャンル内の放送番組を視聴した回数(つまり、CA)と、「プロ野球」というキーワード情報を番組情報に含む放送番組であって、野球というジャンル内の放送番組の数(つまり、CB)とをカウントし、さらに、放送番組数のうち視聴した放送番組が占める割合を求める。
ここで、例えば、上記閾値THを60パーセントとすると、上記割合が60%よりも大きいときは、既に、ユーザデータ記憶装置17においては、野球というジャンル情報にプロ野球というキーワード情報が抽出用情報として関連付けられているため、データ関連付部33′は、「プロ野球」という抽出用情報に関連付けられたポイント情報を更新する。一方、上記割合が60%よりも小さいときは、データ関連付部33′は、ポイント情報を更新しない。
ここで、上記割合が閾値THよりも小さいということは、ユーザが、上記キーワード情報を含む番組情報で示される放送番組を視聴しない可能性が高いということを示している。したがって、第2の方法では、上述したように、このようなキーワード情報はユーザデータ記憶装置17において関連付けを行わない。それゆえ、ユーザの嗜好に沿った番組情報を的確に抽出することが可能となる。
ところで、上述したように、CBは、現在の日時以前の放送番組の数であることが好ましい。さらに、CBは、現在の日時以前の放送番組であって、かつ、ユーザが実際にテレビを視聴していた時間内の放送番組の数としてもよい。このようにする理由は、例えば、ユーザが「プロ野球」というキーワード情報を含む番組情報で示される放送番組が好みだとしても、ユーザがテレビを視聴する時間が限られていれば、上記割合が小さくなるおそれがあるためである。
このように、第1の方法では、「プロ野球」というキーワード情報を含む番組情報の、野球というジャンル情報を有する番組情報全体からみた割合があまり高くなかったため、上記の関連付けを行った。
一方、第2の方法では、ユーザが「プロ野球」というキーワード情報を含む番組情報で示される放送番組を視聴する割合が低ければ上記関連付けを行わず、この割合が高ければ上記関連付けを行う。このように、第2の方法では、ユーザの視聴状況に基づいて、上記関連付けを行うか否かの判定が可能となる。これにより、各ユーザの嗜好に応じた、抽出用情報を記憶させることができる。
なお、第1の方法で或るキーワード情報が抽出用情報として既に或るジャンル情報に関連付けされていても、第2の方法により、該キーワード情報が、抽出用情報として該ジャンル情報に関連付ける情報でないと判断された場合、データ関連付部33′が該キーワードを削除する構成としてもよい。
第1の方法または第2の方法を用いることにより、番組情報抽出装置2′が、キーワード情報を抽出用情報として、ジャンル情報に関連付けるか否かを判断する。したがって、本実施の形態では、実施の形態1と相違して、新たに出現したキーワード情報を、番組所抽出用情報としてユーザデータ記憶装置17内に記憶させることができる。
なお、ユーザデータ記憶装置17に新たに追加記憶させる抽出用情報がある場合に、既に、ユーザデータ記憶装置17の記憶容量の残りがほとんどなく、この抽出用情報と視聴終了日時情報とポイント情報とを記憶させることができない場合には、実施の形態1と同様の処理を行えばよい。
次に、ユーザデータ記憶装置17に対して上述した各情報の記憶する際の処理のフローを図14に基づいて説明する。
まず、選択部51により、視聴フラグが「1」の番組情報の数が所定の値以上であるか否かが判定される(S31)。S31において、所定の値未満である場合には、判定部52により、視聴番組情報内のキーワード情報が、該視聴番組情報に含まれるジャンル情報のジャンルを示した文字列と同じか否かが、キーワード情報毎に判定される(S32)。
S32において、上記ジャンルを示した文字列と同じであると判定された場合には、このように判定されたキーワード情報に関しては、ユーザデータ記憶装置17内でのジャンル情報への関連付けを行うことなく、全てのキーワード情報に関して、視聴番組情報内のキーワード情報が、該視聴番組情報に含まれるジャンル情報のジャンルを示した文字列と同じであるかが判定されたか否かが判定される(S37)。一方、S32において、上記ジャンルを示した文字列と同じであると判定されなかった場合には、このように判定されたキーワード情報に関して、判定部53により、上記第1キーワード情報群に、同一のキーワード情報が所定数以上含まれているか否かが判定される(S33)。
S33において、所定数以上含まれていると判定された場合には、データ関連付部33により、この視聴番組情報に含まれるジャンル情報と同一のジャンル情報に、上記同一のキーワード情報が抽出用情報として関連付けられる(S34)。一方、S33において、所定数以上含まれていると判定されなかった場合には、判定部54により、上記同一ジャンル番組情報数に対する、上記第2キーワード情報群のキーワード情報を含んだ番組情報数の割合が所定値以上であるか否かが、キーワード情報毎に判定される(S35)。
S35において、所定の割合以上であると判定された場合には、このように判定されたキーワード情報に関しては、ユーザデータ記憶装置17内でのジャンル情報への関連付けを行うことなく、S37に進む。一方、S35において、所定の割合未満であると判定された場合には、視聴番組情報に含まれるジャンル情報と同一のジャンル情報に対して、判定の対象となったキーワード情報を抽出用情報として関連付ける(S36)。そして、S36の後は、S37に進む。
S37において、全てのキーワードに関し判定が行われていないと判定された場合、S32に戻る。一方、S37において、全てのキーワードに関し判定が行われたと判定された場合、処理を終了する。
一方、S31において、所定の値以上である場合には、S38からS42の処理が行われる。ここで、S38からS40の処理は、それぞれ、上記S32から34と同じであるため説明を省略する。ただし、同図において、S38でYESの場合はS43に進み、NOの場合にはS39に進む。また、S39でYESの場合はS40に進む。さらに、S40の後は、S43に進む。
S39において、所定数以上含まれていると判定されなかった場合には、判定部55により、上記第2特定番組情報に対する、上記第1特定情報の割合が、所定値以上であるか否かを、キーワード情報毎に判定する(S41)。S41において、所定値以上であると判定されなかった場合、このように判定されたキーワード情報に関しては、ユーザデータ記憶装置17内でのジャンル情報への関連付けを行うことなく、全てのキーワード情報に関して、視聴番組情報内のキーワード情報が、該視聴番組情報に含まれるジャンル情報のジャンルを示した文字列と同じであるかが判定されたか否かが判定される(S43)。一方、S41において、所定値以上であると判定された場合、データ関連付部33′は、ユーザデータ記憶装置17に記憶された、判定の対象となったキーワード情報を含む視聴番組情報に含まれるジャンル情報と同一のジャンル情報に対して、このキーワード情報を抽出用情報として関連付ける(S42)。そして、S42の後は、S43に進む。
ところで、上記の実施の形態では、判定部54と判定部55とを備えた構成を例に挙げて説明したが、これに限定されるものではない。例えば、判定部54あるいは判定部55を備える構成としてもよい。なお、この構成の場合には、選択部51は不要である。
また、番組情報抽出装置2′を、さらに、実施の形態1で示した判定部32、データ関連付部33、および、参照用データ記憶装置15を備えた構成としてもよい。つまり、データ更新部16の機能を、番組情報抽出装置2′が備える構成としてもよい。この構成では、例えばユーザから所定の指示を受けた場合、選択部51が上記2者択一の選択を行わず、実施の形態1のように視聴番組情報取得部14から判定部32への視聴番組情報の送信を行う構成とすればよい。また、この場合、判定部54または判定部55のうち、少なくとも1つの判定部を備える構成としてもよい。
また、選択部51は、視聴情報が入力されるたびに2者択一の選択処理を実行したが、これに限定されるものではない。例えば、視聴情報の入力回数を記憶しておき、その回数に基づいて選択処理を行っても良い。この場合、視聴履歴がある程度蓄積され、一旦第2の方法が選択された場合は、次回からは第2の方法が行われる。つまり、判定部55による判定処理が行われる。
なお、実施の形態1では、番組情報に複数回出現するキーワード情報は、各番組情報で少なくとも1回抽出すればよい構成である。一方、実施の形態2では、上述したとおり、番組情報内に出現する回数分同一キーワードを抽出し、この抽出したキーワード数を判定する構成である。これに限定されず、出現回数を示す情報を番組情報に付しておき、同一のキーワード情報が出現するたびに、この情報を更新する構成であってもよい。
また、上記の実施の形態においては、判定部52、判定部53、判定部54、および、判定部55という4つの判定部を設けた構成を示したが、何れか1つの判定部のみを備える構成としてもよい。この場合には、上記1つの判定部による判定結果に基づいて、該判定部がデータ関連付部33′に所定の情報を送ると共に、データ関連付部33′が、該所定の情報に基づいて、ユーザデータ記憶装置17に抽出用情報を記憶させる構成とすればよい。なお、この場合、上記データ関連付部33′は、ポイント情報の更新および視聴終了日時情報の更新も併せて行う。
つまり、判定部52のみを備える場合には、番組情報抽出装置2′の構成は、取得した番組情報に含まれる名詞を示す文字列(単語)を、番組情報毎に抽出するキーワード抽出部(文字列抽出手段)31と、前記抽出された文字列が、番組情報に含まれるジャンル情報のジャンルを示した文字列と同一か否かを、文字列毎に判定する判定部(第3判定手段)52と、判定部52により同一でないと判定された場合、ユーザデータ記憶装置(第1記憶装置)17に記憶されたジャンル情報であって、かつ、該判定された文字列の抽出対象となった番組情報に含まれるジャンル情報と同一のジャンル情報に、該判定された文字列を前記所定情報として関連付けるデータ関連付部(関連付手段)33′とを備える構成といえる。
この構成によれば、キーワード抽出部31により、前記取得した番組情報に含まれる名詞を示す文字列を、番組情報毎に抽出することができる。また、判定部52により、前記抽出された文字列が、番組情報に含まれるジャンル情報のジャンルを示した文字列と同一か否かを、文字列毎に判定することができる。
さらに、判定部52により同一でないと判定された場合、データ関連付部33′により、ユーザデータ記憶装置17に記憶されたジャンル情報であって、かつ、該判定された文字列の抽出対象となった番組情報に含まれるジャンル情報と同一のジャンル情報に、該判定された文字列を前記所定情報として関連付けることができる。
ところで、上記文字列が、番組情報に含まれるジャンル情報のジャンルを示した文字列と同一である場合、このような文字列は特徴的な情報とならない。それゆえ、このような文字列を、所定情報としてジャンル情報に関連付けてしまうと、ユーザの嗜好に沿わない番組情報が抽出されるおそれがある。
しかしながら、上記の構成では、このような文字列の関連付けを防止することができる。したがって、ユーザの嗜好に沿った番組情報を的確に抽出することができる。
また、判定部53のみを備える場合には、番組情報抽出装置2′の構成は、取得した番組情報に含まれる名詞を示す文字列を、番組情報毎に抽出するキーワード抽出部(文字列抽出手段)31と、同一の文字列が所定数以上、番組情報に含まれているかを、番組情報毎に判定する判定部(第4判定手段)53と、判定部53により、番組情報に所定数以上の同一の文字列が含まれていると判定された場合、前記第1記憶装置に記憶された、該番組情報に含まれるジャンル情報と同一のジャンル情報に、該同一の文字列を前記所定情報として関連付けるデータ関連付部(関連付手段)33′とを備える構成といえる。
この構成によれば、キーワード抽出部31により、前記取得した番組情報に含まれる名詞を示す文字列を、番組情報毎に抽出することができる。また、判定部53により、同一の文字列が所定数以上、番組情報に含まれているかを、番組情報毎に判定することができる。
さらに、判定部53により、番組情報に所定数以上の同一の文字列が含まれていると判定された場合、データ関連付部33′により、ユーザデータ記憶装置17に記憶された、該番組情報に含まれるジャンル情報と同一のジャンル情報に、該同一の文字列を前記所定情報として関連付けることができる。
ところで、一つの番組情報に同じ文字列が数多く含まれる場合には、この文字列は特徴的な情報であるといえる。
ここで、上記の構成では、上述したとおり、データ関連付部33′により、このような文字列を、所定情報として、該文字列を抽出した番組情報に含まれるジャンル情報に関連付けることができる。
したがって、ユーザの嗜好に沿った番組情報を的確に抽出することが可能となる。
また、判定部54のみを備える場合には、番組情報抽出装置2′の構成は、取得した番組情報に含まれる名詞を示す文字列を、番組情報毎に抽出するキーワード抽出部(文字列抽出手段)31と、前記番組情報に含まれるジャンル情報と同一のジャンル情報を含んだ他の番組情報を同一ジャンル番組情報とすると、前記同一ジャンル番組情報数に対する、前記抽出された文字列を含んだ番組情報数の割合が所定値以上であるか否かを、前記文字列毎に判定する判定部(第5判定手段)54と、判定部54により前記割合が所定値未満であると判定された場合、ユーザデータ記憶装置17に記憶された、前記抽出された文字列を含んだ番組情報に含まれるジャンル情報と同一のジャンル情報に、該判定の対象となった文字列を前記所定情報として関連付けるデータ関連付部(関連付手段)33′とを備える構成といえる。
この構成によれば、キーワード抽出部31により、前記取得した番組情報に含まれる名詞を示す文字列を、番組情報毎に抽出することができる。また、判定部54により、前記同一ジャンル番組情報数に対する、前記抽出された文字列を含んだ番組情報数の割合が所定値以上であるか否かを、前記文字列毎に判定することができる。
さらに、判定部54により前記割合が所定値未満であると判定された場合、データ関連付部33′により、ユーザデータ記憶装置17に記憶された、前記抽出された文字列を含んだ番組情報に含まれるジャンル情報と同一のジャンル情報に、該判定の対象となった文字列を前記所定情報として関連付けることができる。
ところで、前記同一ジャンル番組情報数に対する、前記抽出された文字列を含んだ番組情報数の割合が高い場合には、該ジャンルにおいては、この文字列は特徴を示した情報とならない。それゆえ、このような文字列を、所定情報として上記ジャンル情報に関連付けてしまうと、ユーザの嗜好に沿わない番組情報が抽出されるおそれがある。
しかしながら、本発明の構成では、上述したとおり、前記割合が所定値未満でない場合には、このような文字列の関連付けが行われない。
したがって、ユーザの嗜好に沿った番組情報を的確に抽出することができる。
また、判定部55のみを備える場合には、番組情報抽出装置2′の構成は、取得された番組情報であって、ユーザが視聴した放送番組の属性を示した番組情報を視聴番組情報とすると、前記視聴番組情報から、視聴番組情報毎に、名詞を示す文字列を抽出するキーワード抽出部(文字列抽出手段)31と、前記視聴番組情報に含まれるジャンル情報と同一のジャンル情報を含んだ他の番組情報を同一ジャンル番組情報と、同一ジャンル番組情報群における前記抽出された文字列の一つを含んだ番組情報を第1特定番組情報と、前記第1特定番組情報群におけるユーザが視聴した放送番組の属性を示した番組情報を第2特定番組情報とすると、第2特定番組情報数に対する、第1特定情報数の割合が、所定値以上であるか否かを、文字列毎に判定する判定部(第6判定手段)55と、判定部55により前記割合が所定値以上であると判定された場合、ユーザデータ記憶装置(第1記憶装置)17に記憶された、該判定の対象となった文字列を含む視聴番組情報に含まれるジャンル情報と同一のジャンル情報に、該文字列を前記所定情報として関連付けるデータ関連付部(関連付手段)33′とを備える構成といえる。
上記の構成によれば、キーワード抽出部31により、前記視聴番組情報から、視聴番組情報毎に、名詞を示す文字列が抽出される。また、判定部55により、前記第2特定番組情報数に対する、前記第1特定情報数の割合が、所定値以上であるか否かが、文字列毎に判定できる。
さらに、判定部55により前記割合が所定値以上であると判定された場合、データ関連付部33′により、ユーザデータ記憶装置17に記憶された、該判定の対象となった文字列を含む視聴番組情報に含まれるジャンル情報と同一のジャンル情報に、該文字列を前記所定情報として関連付けることができる。
ところで、第2特定番組情報数に対する、第1特定情報数の割合が低いということは、このように判定された文字列を含む番組情報で示される放送番組を、ユーザがあまり視聴していないことを示している。それゆえ、このような文字列を所定情報として上記ジャンル情報に関連付けてしまうと、ユーザの嗜好に沿わない番組情報が抽出されるおそれがある。
しかしながら、本発明の構成では、上述したとおり、前記割合が所定値以上でない場合には、このような文字列の関連付けが行われない。したがって、ユーザの嗜好に沿った番組情報を的確に抽出することができる。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
なお、上記実施形態の番組情報抽出装置(2・2′)の各部(各記憶装置(12・15・17)を除く)や各処理ステップは、CPUなどの演算手段が、ROM(Read Only Memory)やRAMなどの記憶手段に記憶されたプログラムを実行し、キーボードなどの入力手段、ディスプレイなどの出力手段、あるいは、インターフェース回路などの通信手段を制御することにより実現することができる。したがって、これらの手段を有するコンピュータが、上記プログラムを記録した記録媒体を読み取り、当前記プログラムを実行するだけで、本実施形態の番組情報抽出装置(2・2′)の各種機能および各種処理を実現することができる。また、上記プログラムをリムーバブルな記録媒体に記録することにより、任意のコンピュータ上で上記の各種機能および各種処理を実現することができる。
この記録媒体としては、マイクロコンピュータで処理を行うために図示しないメモリ、例えばROMのようなものがプログラムメディアであっても良いし、また、図示していないが外部記憶装置としてプログラム読取り装置が設けられ、そこに記録媒体を挿入することにより読取り可能なプログラムメディアであっても良い。
また、何れの場合でも、格納されているプログラムは、マイクロプロセッサがアクセスして実行される構成であることが好ましい。さらに、プログラムを読み出し、読み出されたプログラムは、マイクロコンピュータのプログラム記憶エリアにダウンロードされて、そのプログラムが実行される方式であることが好ましい。なお、このダウンロード用のプログラムは予め本体装置に格納されているものとする。
図15に、CPUなどの演算手段が、記憶手段に記憶されたプログラムを実行し、入力手段、ディスプレイ、あるいは、インターフェース回路などの通信手段を制御することにより、番組情報抽出装置(2・2′)を備えた番組情報表示装置(1・1′)を実現する場合におけるコンピュータシステム構成例を示す。
コンピュータシステム60は、コンピュータ61、モニタ62、および、リモートコントローラ(以下、リモコン)63を備えている。
コンピュータ61は、光ディスクドライブ71、磁気ディスクドライブ72、リモコンインタフェース(I/F)73、CPU(中央処理装置)74、リモコンインタフェース75、バス76、ROM(読出専用メモリ)77、RAM(ランダムアクセスメモリ)78、および、ハードディスク79を備えている。
ここで、リモコンインタフェース(I/F)73は、リモコン63からの信号を受信する。また、光ディスクドライブ71、磁気ディスクドライブ72、および、CPU74は、バス76に接続されている。また、ROM77は、バス76に接続されていると共に、ブートアッププログラム等を記憶している。また、RAM78は、バス76に接続されていると共に、プログラム命令、システムプログラム、および、作業データ等を記憶している。さらに、コンピュータ61は、さらにローカルエリアネットワーク(LAN)への接続を提供するネットワークアダプタボードを備えていてもよい。
コンピュータシステム60に番組情報表示装置(1・1′)の機能を実現させるためのプログラム、EPGデータ(各番組情報で構成させる番組情報群)、および、視聴情報は、いずれも、光ディスクドライブ71に挿入される光ディスク71a、または、磁気ディスクドライブ72に挿入される磁気ディスク72aに記憶され、その後、ハードディスク79に転送される。なお、これに限定されず、上記プログラム、EPGデータ、および、視聴情報は、図示しないネットワークを通じてコンピュータ61に送信され、かつ、ハードディスク79に記憶する構成としてもよい。
ここで、上記プログラムは実行の際にRAM78にロードされる。なお、光ディスク71aから、磁気ディスク72aから、または、ネットワークを介して、直接にRAM78にプログラムをロードしてもよい。
上記プログラムは、コンピュータ61に本実施の形態に係る番組情報表示装置1の機能を実現させる複数の命令を含む。これら機能を実現させるのに必要な基本的機能のいくつかはコンピュータ61上で動作するオペレーティングシステム(OS)、サードパーティのプログラム、または、コンピュータ61にインストールされる各種ツールキットのモジュールにより提供される。
したがって、上記プログラムは、番組情報表示装置1の機能を実現するのに必要な機能全てを必ずしも含まなくてよい。つまり、このプログラムは、命令のうち、所望の結果が得られるような制御手法にて、適切な機能またはツールを呼出すことにより、番組情報表示装置1の制御を実行する命令のみを含んでいればよい。
なお、番組情報表示装置1の機能を実現するためのプログラム、EPGデータ、および、視聴情報が記録される記録媒体としては、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD/MO/MD/DVD等のディスクのディスク系、ICカード(メモリカードを含む)等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する記録媒体等がある。
また、インターネットを含む通信ネットワークを接続可能なシステム構成であれば、通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する記録媒体であることが好ましい。
さらに、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであることが好ましい。