以下、本発明による情報処理システム等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。また、所定の情報等が格納され得る格納部等において、当該格納部に情報等が記憶される過程は問わないものとする。例えば、記録媒体を介して情報等が格納部等で記憶されるようになってもよい。また、通信回線などを介して送信された情報等が格納部等で記憶されるようになってもよい。さらに、入力デバイスを介して入力された情報等が格納部等で記憶されるようになってもよい。また、本実施の形態において、検索とは、検索キーを基に、検索対象となる情報内から、検索キーに一致する情報を検知することや、当該検知した情報を取得すること、当該検知した情報に対応付けられた情報を取得することなどを意味し、広く解する。また、本実施の形態において説明する各情報の形式、内容などは、あくまで例示であり、各情報の持つ意味を示すことができれば、形式、内容などは問わない。
(実施の形態1)
本実施の形態において、ユーザが投稿したCGM(Consumer Generated Media)のデータから、ユーザが視聴した番組を特定し、統計処理を行う情報処理システム1について説明する。なお、CGMとは、例えば、ブログ、ミニブログ、SNS(Social Network Service、ソーシャル・ネットワーキング・サービス)に投稿される情報などであり、各ユーザが発信したその他の情報も含み、広く解する。
図1は、本実施の形態における情報処理システム1の概念図である。図1では、1以上のサーバ装置11と、番組視聴情報処理装置12とが、ネットワーク13を介して接続されている。ネットワーク13は、有線または無線の通信回線であり、例えば、インターネットやイントラネット、LAN(Local Area Network)、公衆電話回線網などである。また、サーバ装置11は、通常、ネットワーク13を介して、端末装置と接続されている。端末装置は、通常、ユーザからの操作や指示を受け付ける受付部や、ユーザから受け付けた指示を送信する送信部、指示や情報を受信する受信部などを備える。
図2は、本実施の形態におけるサーバ装置11のブロック図である。また、図3は、本実施の形態における番組視聴情報処理装置12のブロック図である。
サーバ装置11は、番組視聴情報格納部111、サーバ番組視聴情報受信部112、サーバ番組視聴情報蓄積部113、サーバ番組視聴情報送信部114を備える。
番組視聴情報処理装置12は、電子番組表格納部121、番組視聴情報受信部122、番組特定部123、番組視聴統計情報取得部124、番組視聴統計情報出力部125を備える。番組特定部123は、電子番組表特定手段1231、時刻取得手段1232、番組特定手段1233を備える。番組視聴統計情報取得部124は、感情用語格納手段1241、ユーザ属性情報取得手段1242、感情用語取得手段1243、感情決定手段1244、番組視聴統計情報取得手段1245を備える。
番組視聴情報格納部111は、番組視聴情報を格納し得る。ここで、番組視聴情報とは、ユーザが視聴した番組に関する情報である。番組視聴情報は、例えば、ユーザ識別子や、番組コメント、ユーザ位置情報、時刻情報などを有する。また、番組とは、例えば、テレビ番組や、ラジオ番組などである。また、番組は、地上波や、衛星放送、インターネット放送など、放送の形式は問わない。番組は、これらのものに限定されず、広く解する。
ユーザ識別子とは、ユーザを識別するための情報であり、ユーザを一意に特定するための情報である。ユーザ識別子は、例えば、ユーザIDや、ユーザ名、氏名などである。ユーザIDは、例えば、「1」や、「21」、「009」などである。ユーザ名は、例えば、「account」や、「taro」、「Hanako」などである。氏名は、例えば、「新崎 準」や、「束瀬弘毅」、「太郎」、「花子」などである。
番組コメントとは、番組に関するコメントを示す情報である。番組コメントは、例えば、「クイズ番組難しい」や、「バラエティーはおもしろい」、「ニュースはつまらない」などである。
ユーザ位置情報とは、ユーザが番組視聴情報を送信した位置を示す情報である。ユーザ位置情報は、通常、経緯度情報である。経緯度情報とは、緯度・経度を示す情報である。経緯度情報は、緯度を示す緯度情報と、経度を示す経度情報とを有する。緯度情報は、北緯であることを示す文字、または南緯であることを示す文字を有していてもよい。また、経度情報は、東経であることを示す文字、または西経であることを示す文字を有していてもよい。経緯度情報は、通常、座標を示す形式である。また、経緯度情報は、10進法表記でも、60進法表記でも、どちらでもよい。経緯度情報は、10進法表記である場合、例えば、「(N35.46.57,E135.24.68)」や、「(北35.46.57.69,東135.24.68.80)」、「(北緯35度46分57秒269,東経135度24分68秒480)」などである。また、経緯度情報は、60進法表記である場合、例えば、「(S35.78250000,W135.41888888)」や、「(南35.78269166,西135.41911111)」、「(南緯35.78257472,西経135.41902222)」などである。
また、ユーザ位置情報は、住所情報を有していてもよい。住所情報とは、住所を示す情報である。住所情報は、郵便番号や、都道府県名、市町村名、番地などを有する。住所情報は、例えば、「102−0072 東京都千代田区飯田橋1−2」や、「大阪府大阪市北区扇町1丁目35番」、「奈良市青山4−5−6」などである。
また、時刻情報とは、ユーザが番組視聴情報を送信した時刻を示す情報である。時刻情報は、ユーザからの番組視聴情報を受信した時刻を示す情報であってもよい。時刻情報は、通常、日付(年月日)を示す日付情報や、時間を示す時間情報を有する。時刻情報は、例えば、「2010/12/31 12:34:56」や、「2011年01月11日 11時22分33秒」、「201012311234」、「201101111122」などである。
また、番組視聴情報は、ユーザ属性情報を有していてもよい。ユーザ属性情報とは、ユーザの属性を示す情報である。ユーザ属性情報は、例えば、性別情報や、年齢情報などである。性別情報は、性別を示す情報である。性別情報は、例えば、「男」や、「女」、「男性」、「女性」などである。また、年齢情報は、年齢を示す情報である。年齢情報は、例えば、「18」や、「20歳」、「22才」などである。
また、番組視聴情報は、番組コメントキーワードを有していてもよい。番組コメントキーワードとは、番組コメント中のキーワードを示す情報である。番組コメントが「クイズ番組難しい」である場合、番組コメントキーワードは、例えば、「クイズ」、「番組」、「難しい」である。また、番組コメントが「ニュースはつまらない」である場合、番組コメントキーワードは、例えば、「ニュース」、「つまらない」である。なお、番組コメントからの番組コメントキーワードの抽出は、通常、後述のサーバ番組視聴情報蓄積部113が行う。なお、番組視聴情報が有する各情報は、通常、1対1で対応付けられている。
番組視聴情報格納部111は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
サーバ番組視聴情報受信部112は、2以上の番組視聴情報を受信する。ここでの番組視聴情報は、通常、2以上の端末装置から送信される番組視聴情報である。サーバ番組視聴情報受信部112は、通常、無線または有線の通信手段で実現されるが、放送を受信する手段で実現されてもよい。
サーバ番組視聴情報蓄積部113は、2以上の番組視聴情報を番組視聴情報格納部111に蓄積する。ここでの番組視聴情報は、サーバ番組視聴情報受信部112が受信した番組視聴情報である。サーバ番組視聴情報蓄積部113は、通常、番組視聴情報が有する時刻情報の昇順に、番組視聴情報を蓄積する。また、サーバ番組視聴情報蓄積部113は、番組視聴情報を、例えば、サーバ番組視聴情報受信部112が受信した順に蓄積してもよいし、番組視聴情報が有するユーザ識別子ごとに蓄積してもよい。
また、例えば、サーバ番組視聴情報受信部112が受信した番組視聴情報が時刻情報を有していない場合、サーバ番組視聴情報蓄積部113は、当該番組視聴情報に時刻情報を付与してもよい。この場合、サーバ番組視聴情報蓄積部113は、通常、サーバ番組視聴情報受信部112が番組視聴情報を受信した時刻を付与する。また、この場合、サーバ番組視聴情報蓄積部113は、番組視聴情報を蓄積する瞬間の時刻を、当該番組視聴情報に付与してもよい。
また、サーバ番組視聴情報蓄積部113は、番組視聴情報の蓄積の際に、例えば、ユーザ属性情報を付与してもよい。番組視聴情報にユーザ属性情報を付与する場合、サーバ番組視聴情報蓄積部113は、例えば、ユーザ識別子とユーザ属性情報を有するユーザ管理情報を保持している。ユーザ管理情報は、通常、一のユーザ識別子と、1以上のユーザ属性情報とが対応付けられている。また、ユーザ管理情報は、任意の記憶領域に格納されていてもよい。そして、サーバ番組視聴情報蓄積部113は、番組視聴情報が有するユーザ識別子をキーに、当該ユーザ識別子に対応する1以上のユーザ識別子をユーザ管理情報内から検索する。そして、サーバ番組視聴情報蓄積部113は、検索の結果、取得できたユーザ属性情報を、対応するユーザ識別子を有する番組視聴情報に付与する。なお、ユーザ管理情報は、任意の記憶領域に格納されていてもよい。
また、サーバ番組視聴情報蓄積部113は、番組視聴情報の蓄積の際に、例えば、番組コメントキーワードを付与してもよい。番組視聴情報に番組コメントキーワードを付与する場合、サーバ番組視聴情報蓄積部113は、例えば、形態素解析により、番組視聴情報が有する番組コメントを形態素に分割する。そして、サーバ番組視聴情報蓄積部113は、当該形態素のうち、「名詞」、または「形容詞」と判断されたものを番組コメントキーワードとして抽出する。そして、サーバ番組視聴情報蓄積部113は、抽出した番組コメントキーワードを、対応する番組コメントを有する番組視聴情報に付与する。
サーバ番組視聴情報蓄積部113は、通常、MPUやメモリ等から実現され得る。サーバ番組視聴情報蓄積部113の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
サーバ番組視聴情報送信部114は、番組視聴情報を、番組視聴情報処理装置12に送信する。ここでの番組視聴情報は、番組視聴情報格納部111に格納されている番組視聴情報である。サーバ番組視聴情報送信部114は、通常、番組視聴情報処理装置12から、番組視聴情報送信指示を受信する。そして、サーバ番組視聴情報送信部114は、当該番組視聴情報送信指示が有する検索キーを基に、番組視聴情報格納部111から番組情報を検索する。そして、サーバ番組視聴情報送信部114は、検索の結果、取得できた番組視聴情報を、番組視聴情報処理装置12に送信する。
なお、番組視聴情報送信指示とは、番組視聴情報を送信する旨の指示である。また、番組視聴情報送信指示は、通常、サーバ装置11の場所を示すURLと、番組視聴情報格納部111から番組視聴情報を検索するための検索キーを有する。URLは、例えば、「http://www.tvtvtv.com」や、「http://www.comment-station.co.jp」、「http://www.realtimemovie.net」などである。検索キーは、例えば、番組コメントキーワードや、ユーザ識別子、時刻情報などである。番組コメントキーワード「おもしろい」を含む番組コメントを有する番組視聴情報を送信する場合、番組視聴情報送信指示は、例えば、「http://www.tvtvtv.com/key1/おもしろい」になる。また、時刻情報「2011年1月6日」を有する番組視聴情報を送信する場合、番組視聴情報送信指示は、例えば、「http://www.comment-station.co.jp/date/20110106」になる。また、サーバ番組視聴情報送信部114は、通常、サーバ装置11の場所を示すURLを保持しており、当該URLを用いて、番組視聴情報送信指示に含まれるURLを削除し、検索キーを取得する。
サーバ番組視聴情報送信部114は、通常、無線または有線の通信手段で実現されるが、放送手段で実現されてもよい。
電子番組表格納部121は、1以上の電子番組表を格納し得る。また、電子番組表格納部121は、1以上の地域別電子番組表を格納し得てもよい。地域別電子番組表とは、地域特定位置情報と、1以上の電子番組表とを有する情報である。
電子番組表とは、電子的な番組表のことである。また、番組表とは、放送される番組に関する情報である。電子番組表は、例えば、いわゆるEPG(Electronic Program Guide)や、IPG(Interactive Program Guide)、Webサイト上の番組表などである。電子番組表は、電子的な番組表であれば、その形式、内容などは問わず、広く解する。
電子番組表は、2以上の番組情報を有する。番組情報は、番組を示す情報である。番組情報は、例えば、番組識別子や、番組タイトル、チャンネル情報、放送時間帯などを有する。番組識別子とは、番組を識別するための情報であり、番組を一意に特定するための情報である。番組識別子は、例えば、番組IDや、番組コードなどである。番組IDや番組コードは、例えば、「01−001」や、「20110128−12」、「6825617」などである。また、番組タイトルとは、番組のタイトルを示す情報である。番組タイトルは、例えば、「金曜ミッドナイトドラマ」や、「サッカー大会アジア2次予選」、「プロリーグ野球中継」、「ミュージックパラダイス」などである。チャンネル情報とは、番組が放送されるチャンネルを示す情報である。チャンネル情報は、例えば、「12チャンネル」や、「8ch」、「6」などである。放送時間帯とは、番組の放送時間帯を示す情報である。放送時間帯は、通常、放送の開始時刻を示す開始時刻情報と、放送の終了時刻を示す終了時刻情報とから構成される。開始時刻情報、および終了時刻情報の形式などは、前述の時刻情報と同様であるので、その説明を省略する。なお、放送時間帯は、例えば、「12:00〜13:00」や、「12時30分−13時30分」、「23:30から25:00」などである。また、放送時間帯は、通常、日付情報を有さないが、有していてもよい。放送時間帯が日付情報を有さない場合、番組情報が日付情報を有する。
また、番組情報は、番組関連キーワードを有していてもよい。番組関連キーワードとは、番組に関連するキーワードである。番組関連キーワードは、例えば、形態素解析により、番組タイトルを形態素に分割し、取得できる名詞、または名詞句などである。また、番組キーワードは、番組タイトルの形態素のうち、「名詞」、または「形容詞」と判断されたものであってもよい。また、番組関連キーワードは、ユーザが任意に決定してもよい。
また、地域特定位置情報とは、地域を特定するための情報である。地域特定位置情報は、例えば、場所識別子や、場所位置情報、場所範囲情報などを有する。場所識別子は、場所を識別するための情報である。場所識別子は、例えば、住所情報、地域名称、都道府県名称、市町村名称などである。地域名称は、例えば、「東北」や、「北陸」、「関東」、「関西」などである。都道府県名称は、例えば、「東京」、「大阪」、「京都」、「兵庫」、「福岡」などである。市町村名称は、例えば、「川崎」、「横浜」、「名古屋」、「神戸」などである。場所位置情報は、場所識別子により示される場所の位置を示す情報である。場所位置情報は、例えば、経緯度情報などである。場所範囲情報は、場所識別子により示される場所の範囲を示す情報である。場所範囲情報は、例えば、2以上の経緯度情報であってもよいし、場所の中心を示す経緯度情報と、当該場所の範囲(半径)を示す半径情報であってもよい。
また、電子番組表は、放送局識別子や、放送局位置情報などを有していてもよい。放送局識別子は、放送局を識別する情報である。放送局識別子は、例えば、放送局IDや、放送局名などである。放送局IDは、例えば、「1」や、「002」、「ST108」などである。放送局名は、例えば、「とうきょうテレビ」や、「千葉放送」、「京都チャンネル」、「近畿テレビ」などである。また、放送局位置情報とは、放送局の位置を示す情報である。放送局位置情報は、通常、経緯度情報である。また、放送局位置情報は、2以上の経緯度情報であってもよいし、放送局の位置を示す情報と、当該放送局から送信される電波が届く範囲(半径)を示す半径情報とを有していてもよい。
なお、番組情報が有する各情報は、通常、1対1で対応付けられている。また、地域別電子番組表は、通常、一の地域特定位置情報と、1以上の電子番組表とが対応付けられている。
電子番組表格納部121は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
番組視聴情報受信部122は、番組視聴情報送信指示をサーバ装置11に送信する。そして、番組視聴情報受信部122は、当該送信指示に対応する2以上の番組視聴情報を、サーバ装置11から受信する。番組視聴情報受信部122は、通常、番組視聴情報送信指示の送信なしに番組視聴情報は受信しないが、番組視聴情報送信指示の送信なしに番組視聴情報を受信してもよい。
番組視聴情報送信指示の送信のタイミングは、通常、予め決められているが、そうでなくてもよい。予め決められている場合、番組視聴情報送信指示の送信のタイミングは、例えば、「毎時」や、「毎日」、「毎週」などである。当該タイミングが「毎時」の場合、番組視聴情報受信部122は、例えば、「毎時0分」に、番組視聴情報送信指示をサーバ装置11に送信する。また、当該タイミングが「毎日」の場合、番組視聴情報受信部122は、例えば、「毎日00時00分」に、番組視聴情報送信指示をサーバ装置11に送信する。また、当該タイミングが「毎週」の場合、番組視聴情報受信部122は、例えば、「毎週月曜日 06時00分」に、番組視聴情報送信指示をサーバ装置11に送信する。また、予め決められている場合、番組視聴情報送信指示の送信のタイミングは、通常、番組視聴情報受信部122が保持しているが、任意の記憶領域に格納されていてもよい。
予め決められていない場合、番組視聴情報送信指示の送信のタイミングは、例えば、ユーザからの指示があった時や、ユーザが番組視聴情報を送信した時などである。
また、番組視聴情報送信指示は、通常、サーバ装置11の場所を示すURLと、番組視聴情報を検索するための検索キーを有する。そして、番組視聴情報受信部122は、当該番組視聴情報送信指示をHTTPリクエストとして、サーバ装置11に送信する。なお、サーバ装置11の場所を示すURLは、通常、番組視聴情報受信部122が保持しているが、任意の記憶領域に格納されていてもよい。
番組視聴情報受信部122は、通常、無線または有線の通信手段で実現されるが、放送手段、および放送を受信する手段で実現されてもよい。
番組特定部123は、番組視聴情報に対応する番組を特定する。「番組を特定する」とは、例えば、番組視聴情報が有する情報を用いて、当該番組視聴情報に対応する番組情報を、電子番組表から検索し、当該電子番組表が有する情報により示される番組を、当該番組視聴情報に対応する番組であると決定することである。番組特定部123は、例えば、番組視聴情報を電子番組表に適用し、番組視聴情報に対応する番組を特定する。ここでの番組視聴情報は、番組視聴情報受信部122が受信した2以上の番組視聴情報である。また、ここでの電子番組表は、電子番組表格納部121に格納されている電子番組表であってもよいし、外部の装置に格納されている電子番組表であってもよい。電子番組表が外部の装置(例えば、図示しない電子番組表管理装置)に格納されている電子番組表である場合、番組特定部123は、番組視聴情報受信部122が受信した2以上の各番組視聴情報が1以上の電子番組表に適用された結果の情報であり、各番組視聴情報に対応する番組に関する情報(例えば、番組識別子、番組タイトルなど、番組を識別できる情報)を取得することにより番組を特定する。つまり、電子番組表が外部の装置に格納されている電子番組表である場合、番組特定部123は、番組視聴情報または番組視聴情報の一部の情報を当該外部の装置に送信し、当該外部の装置から番組に関する情報を受信する。
「番組視聴情報を電子番組表に適用」とは、当該番組視聴情報に対応する番組情報を、当該電子番組表から検索することである。番組特定部123は、例えば、形態素解析により、番組視聴情報が有する番組コメントを形態素に分割する。そして、番組特定部123は、当該分割結果から、名詞、または名詞句を取得する。そして、番組特定部123は、当該名詞、または名詞句を含む番組タイトルを有する番組情報を、電子番組表から検索する。そして、番組特定部123は、検索の結果、取得できた番組情報で示される番組を、番組視聴情報に対応する番組であると特定する。
また、番組特定部123は、例えば、形態素解析により、番組情報が有する番組タイトルを形態素に分割する。そして、番組特定部123は、当該分割結果から、名詞、または名詞句を取得する。そして、番組特定部123は、当該名詞、または名詞句を含む番組コメントを有する番組視聴情報を、番組視聴情報受信部122が受信した番組視聴情報から検索する。そして、番組特定部123は、検索の結果、取得できた番組視聴情報が有する番組コメントに含まれる名詞、または名詞句の取得元である番組情報で示される番組を、当該視聴情報に対応する番組であると特定してもよい。
また、番組特定部123は、例えば、番組視聴情報受信部122が受信した番組視聴情報のうち、実際に番組を視聴したであろうと思われる番組視聴情報のみを対象に、番組を特定してもよい。番組特定部123は、例えば、番組視聴用語を含む番組コメントを有する番組視聴情報のみを対象に、番組を特定してもよい。番組視聴用語とは、番組を視聴したであろうことを示す用語である。番組視聴用語は、例えば、「TV」や、「テレビ」、「てれび」、「視聴」、「番組」、「チャンネル」、「見た」などである。また、番組特定部123は、例えば、番組非視聴用語を含まない番組コメントを有する番組視聴情報のみを対象に、番組を特定してもよい。番組非視聴用語とは、番組を視聴していないであろうことを示す用語である。番組非視聴用語は、例えば、「見逃した」や、「見忘れた」、「見てない」などである。
例えば、番組視聴用語を用いる場合、番組特定部123は、番組視聴情報受信部122が受信した各番組視聴情報が有する番組コメントに対し、番組視聴情報を含むか否かを判断する。そして、番組特定部123は、当該含むと判断した番組視聴情報を取得する。そして、番組特定部123は、当該取得した番組視聴情報のみを対象に、番組を特定する。また、例えば、番組非視聴用語を用いる場合、番組特定部123は、番組視聴情報受信部122が受信した各番組視聴情報が有する番組コメントに対し、番組非視聴情報を含まないか否かを判断する。そして、番組特定部123は、当該含まないと判断した番組視聴情報を取得する。そして、番組特定部123は、当該取得した番組視聴情報のみを対象に、番組を特定する。また、例えば、番組視聴用語と、番組非視聴用語を用いる場合、番組特定部123は、まず、番組視聴情報受信部122が受信した各番組視聴情報から、番組コメントに番組非視聴用語を含まない番組視聴情報を取得する。そして、番組特定部123は、当該取得した番組視聴情報から、番組コメントに番組視聴用語を含む番組視聴情報を取得する。そして、番組特定部123は、当該取得した番組視聴情報のみを対象に、番組を特定する。
また、番組特定部123は、電子番組表格納部121から電子番組表、または番組情報を取得する際に、通常、番組視聴情報受信部122が送信した番組視聴情報送信指示が有する検索キーを用いる。例えば、当該検索キーが日付情報「2011/01/02」である場合、番組特定部123は、当該日付情報を有する電子番組表、または番組情報を、電子番組表格納部121から検索する。また、例えば、当該検索キーが時刻情報「2011/01/01 00:00:00〜2011/01/07 24:00:00」である場合、番組特定部123は、当該日付情報の範囲に対応する電子番組表、または番組情報を、電子番組表格納部121から検索する。
また、番組特定部123は、例えば、地域特定処理や、地域番組表取得処理、番組関連度算出処理、番組特定処理などにより、番組を特定してもよい。また、番組特定部123は、例えば、放送局特定処理や、放送局番組表取得処理、番組関連度算出処理、番組特定処理などにより、番組を特定してもよい。ここで、地域特定処理とは、番組視聴情報が有するユーザ位置情報を用いて、当該番組視聴情報が送信された地域を特定する処理である。地域番組表取得処理とは、地域特定処理により特定された地域に対応する電子番組表を、電子番組表格納部121から取得する処理である。放送局特定処理とは、番組視聴情報が有するユーザ位置情報を用いて、当該番組視聴情報が送信された位置に最も近い放送局を特定する処理である。放送局番組表取得処理とは、放送局特定処理により特定された地域に対応する電子番組表を、電子番組表格納部121から取得する処理である。番組関連度算出処理とは、地域番組表取得処理、または放送局番組表取得処理により取得された電子番組表が有する各番組情報と、番組視聴情報との関連度である番組関連度を算出する処理である。番組特定処理とは、番組関連度算出処理により算出した関連度が最大である番組情報で示される番組を、番組視聴情報に対応する番組であると特定する処理である。
また、番組関連度は、通常、番組タイトル関連度と、放送局関連度と、放送時間関連度とから算出される。番組タイトル関連度とは、各番組情報が有する番組タイトルと、番組視聴情報が有する番組コメントとの関連度である。放送局関連度とは、各番組情報が有する放送局位置情報と、番組視聴情報が有するユーザ位置情報との関連度である。放送時間関連度とは、各番組情報が有する放送時間帯と、番組視聴情報が有する時刻情報との関連度である。なお、番組タイトル関連度は、通常、番組タイトル関連度算出処理により算出される。また、放送局関連度算出処理は、通常、放送局関連度算出処理により算出される。また、放送時間関連度は、通常、放送時間関連度算出処理により算出される。
なお、番組特定部123における番組の特定は、通常、後述の電子番組表特定手段1231、時刻取得手段1232、番組特定手段1233により行う。また、番組特定部123は、番組視聴情報受信部122が受信した番組視聴情報に対応する番組を、電子番組表格納部121に格納されている番組情報で示される番組の中から、当該番組視聴情報が有する各情報を基に特定できればよく、その手法、手順などは問わない。
番組特定部123は、通常、MPUやメモリ等から実現され得る。番組特定部123の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
電子番組表特定手段1231は、地域特定処理と地域番組表取得処理を行う。また、電子番組表特定手段1231は、放送局特定処理と放送局番組表取得処理を行ってもよい。電子番組表特定手段1231は、地域特定処理の後に、地域番組表取得処理を行う。また、電子番組表特定手段1231は、放送局特定処理の後に、放送局番組表取得処理を行う。
地域特定処理において、電子番組表特定手段1231は、通常、番組視聴情報が有するユーザ位置情報を用いる。例えば、電子番組表格納部121に格納されている各電子番組表が、地域特定位置情報として経緯度情報と、都道府県名称を有しているとする。この場合、電子番組表特定手段1231は、地域特定処理として、まず、ユーザ位置情報と、各経緯度情報の距離を算出する。当該距離は、例えば、当該位置情報を座標と見なし、当該座標の距離を算出する。そして、電子番組表特定手段1231は、当該算出した各距離のうち、最短のものを取得する。そして、電子番組表特定手段1231は、当該最短の距離に対応する都道府県名称を取得する。これにより、電子番組表特定手段1231は、地域を特定する。
また、例えば、電子番組表格納部121に格納されている各電子番組表が、地域特定位置情報として、2以上の経緯度情報と、都道府県名称を有しているとする。この場合、電子番組表特定手段1231は、地域特定手段として、まず、ユーザ位置情報が、当該2以上の経緯度情報で示される多角形の範囲内にあるか否かを判断する。そして、電子番組表特定手段1231は、当該判断の結果、範囲内にあると判断した2以上の経緯度情報に対応する都道府県名称を取得する。これにより、電子番組表特定手段1231は、地域を特定してもよい。
また、電子番組表特定手段1231は、地域特定処理において、電子番組表が有する地域特定位置情報の代わりに、地域管理情報を用いてもよい。地域管理情報とは、地域を示す情報を管理するための情報である。地域管理情報は、例えば、場所情報と、場所位置情報とを有する。地域管理情報は、通常、電子番組表特定手段1231が保持しているが、任意の記憶領域に格納されていてもよい。
また、地域番組表取得処理において、電子番組表特定手段1231は、通常、地域特定処理において取得した場所識別子を用いる。例えば、電子番組表格納部121に格納されている各電子番組表が、地域特定位置情報が有する場所識別子として、都道府県情報を有しているとする。この場合、電子番組表特定手段1231は、地域番組表取得処理として、当該都道府県名称を検索キーとし、当該都道府県名称を有する電子番組表を検索する。これにより、電子番組表特定手段1231は、電子番組表を取得する。
放送局特定処理において、電子番組表特定手段1231は、通常、番組視聴情報が有するユーザ位置情報を用いる。例えば、電子番組表格納部121に格納されている各電子番組表が、放送局識別子である放送局名と、放送局位置情報である経緯度情報を有しているとする。この場合、電子番組表特定手段1231は、放送局特定処理として、まず、ユーザ位置情報と、各経緯度情報の距離を算出する。当該距離は、例えば、当該位置情報を座標と見なし、当該座標間の距離を算出する。そして、電子番組表特定手段1231は、当該算出した各距離のうち、最短のものを取得する。そして、電子番組表特定手段1231は、当該最短の距離に対応する放送局名を取得する。これにより、電子番組表特定手段1231は、放送局を特定してもよい。
また、例えば、電子番組表格納部121に格納されている各電子番組表が、放送局識別子である放送局名と、放送局位置情報である2以上の経緯度情報を有しているとする。この場合、電子番組表特定手段1231は、放送局特定処理として、まず、ユーザ位置情報が、当該2以上の経緯度情報で示される多角形の範囲内にあるか否かを判断する。そして、電子番組表特定手段1231は、当該判断の結果、範囲内にあると判断した2以上の経緯度情報に対応する放送局名を取得する。これにより、電子番組表特定手段1231は、放送局を特定してもよい。
また、電子番組表特定手段1231は、地域特定処理において、電子番組表が有する放送局位置情報の代わりに、放送局管理情報を用いてもよい。地域管理情報とは、放送局を示す情報を管理するための情報である。放送局管理情報は、例えば、放送局識別子と、放送局位置情報とを有する。放送局管理情報は、通常、電子番組表特定手段1231が保持しているが、任意の記憶領域に格納されていてもよい。
また、地域番組表取得処理において、電子番組表特定手段1231は、通常、放送局特定処理において取得した放送局名を用いる。例えば、電子番組表格納部121に格納されている各電子番組表が、放送局識別子として放送局名を有しているとする。この場合、電子番組表特定手段1231は、放送局番組表取得処理として、当該放送局名を検索キーとし、当該放送局名を有する電子番組表を検索する。これにより、電子番組表特定手段1231は、放送局番組表を取得する。
なお、電子番組表特定手段1231は、番組視聴情報が有する情報を基に、電子番組表を特定することができればよく、その手法、手順などは問わない。
電子番組表特定手段1231は、通常、MPUやメモリ等から実現され得る。電子番組表特定手段1231の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
時刻取得手段1232は、番組視聴情報受信部122が番組視聴情報を受信した時刻である受信時刻を取得する。また、時刻取得手段1232は、ユーザが番組視聴情報を送信した時刻である送信時刻を取得してもよい。
受信時刻を取得する場合、時刻取得手段1232は、通常、時計を有している。そして、例えば、時刻取得手段1232は、番組視聴情報受信部122が、番組視聴情報を受信したか否かを常に監視しておく。そして、時刻取得手段1232は、番組視聴情報受信部122が番組視聴情報を受信したと判断した場合、その瞬間の時刻を時計から取得する。そして時刻取得手段1232は、当該取得した時刻を、受信時刻とする。
また、送信時刻を取得する場合、当該時刻は、通常、番組視聴情報受信部122が受信した番組視聴情報が有している。従って、この場合、時刻取得手段1232は、番組視聴情報が有する時刻情報を、送信時刻として取得する。
また、時刻取得手段1232は、番組視聴情報が有する番組コメントの内容に応じて、受信時刻、または送信時刻を補正してもよい。通常、ユーザが番組視聴情報を送信する際、番組コメントの入力に時間を要する。そのため、実際に番組を視聴している時間を正確に特定するために、受信時刻、または送信時刻を補正する。例えば、時刻取得手段1232は、番組視聴情報が有する番組コメントの文字数をカウントし、当該文字数の1文字につき補正秒数を掛け合わせ、補正時間を算出する。そして、時刻取得手段1232は、取得した受信時刻、または送信時刻から、当該補正時間を差し引く。
例えば、番組コメントが「バラエティーはおもしろい」であり、補正秒数が「0.5秒/文字」である場合、番組コメントの文字数が「12」であるので、補正時間は「12×0.5」で「6秒」となる。そして、例えば、受信時刻が「23:15:24」である場合、補正後の受信時刻は、「23:15:18」となる。
また、時刻取得手段1232は、例えば、ユーザが、番組を視聴しながら番組視聴情報を送信したのか、また、番組を視聴し終わった後に番組視聴情報を送信したのか、また、番組を視聴する前に番組視聴情報を送信したのかを判断し、当該判断結果に応じて、補正時間を算出してもよい。当該判断は、例えば、時刻補正用語管理情報を用いて行う。時刻補正用語管理情報とは、時刻を補正するか否かを判断するための用語である時刻補正用語を管理するための情報である。時刻補正用語管理情報は、例えば、当該時刻補正用語と、補正情報とを有する。時刻補正用語と、補正情報とは、通常、1対1で対応付けられている。補正情報とは、算出した補正時間に対して行う補正の内容を示す情報である。時刻補正用語は、例えば、「なう」や、「うぃる」、「あごう」、「あごー」などである。補正情報は、例えば、「+0秒」や、「+10秒」、「―20秒」、「×1.2」、「÷1.5」などである。
例えば、時刻取得手段1232は、まず、前述のような手順にて補正時間を算出する。そして、時刻取得手段1232は、番組コメント内に時刻補正用語が含まれるか否かを判断する。そして、時刻取得手段1232は、含まれると判断した場合、含まれると判断された時刻補正用語に対応する補正情報を取得する。そして、時刻取得手段1232は、取得した補正時間に対して、補正情報で示される補正を行う。例えば、時刻取得手段1232は、番組コメントの文字数から算出した補正時間が「20秒」であり、補正情報が「+20秒」である場合、「20+20」で「40秒」を新たな補正時間とする。
また、時刻取得手段1232は、例えば、番組コメントの文字数から算出した補正時間に対してではなく、受信時刻、または送信時刻に対して、補正情報で示される補正を行ってもよい。
また、時刻取得手段1232は、取得した受信時刻、または送信時刻に対して補正を行う場合、補正を行うことができれば、その補正の手法、手順は問わない。
時刻取得手段1232は、通常、MPUやメモリ等から実現され得る。時刻取得手段1232の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
番組特定手段1233は、通常、番組関連度算出処理と、番組特定処理を行うことにより、番組視聴情報に対応する番組を特定する。番組特定手段1233は、まず、番組関連度算出処理として、番組タイトル関連度算出処理と、放送局関連度算出処理と、放送時間関連度算出処理とを、順に行う。
番組タイトル関連度算出処理では、例えば、番組特定手段1233は、まず、番組視聴情報が有する番組コメントを、形態素解析により、形態素に分割する。そして、番組特定手段1233は、当該形態素のうち、「名詞」、または「形容詞」と判断されたものを番組コメントキーワードとして抽出する。次に、番組特定手段1233は、各番組情報が有する番組タイトルから、前述と同様にキーワードを抽出する。次に、番組特定手段1233は、番組視聴情報から抽出したキーワード群と、各番組情報から抽出したキーワード群との関連度を算出する。当該関連度の算出は、例えば、Jaccard係数を用いる。Jaccard係数とは、二つの集合の共起の度合いや、関連の度合い、類似の度合いを表す数値である。ここでS1とS2の二つの集合があったとき、Jaccard係数は、「|S1∩S2|/(|S1|+|S2|+|S1∩S2|)」となる。「||」は、ベクトルのノルムを示す記号である。通常、番組視聴情報から抽出したキーワードは文字列であり、数値ではない。そのため、ノルムを算出することはできない。従って、通常、キーワードに対してインデックス値(任意の数値)を割り当て、当該数値にて、ノルムを算出する。インデックス値の割り当ては、例えば、事前に、「TV|1」、「テレビ|2」のように、キーワードとそれに対応するインデックス値を有するキーワードインデックス管理情報を用意しておき、当該キーワードインデックス管理情報を用いて、インデックス値の割り当てを行う。なお、キーワードインデックス値は、通常、番組特定手段1233が保持しているが、任意の記憶領域に格納されていてもよい。
また、Jaccard係数の算出に際し、番組特定手段1233は、例えば、「ニュース」や、「ドラマ」など、番組タイトルに出現しやすいキーワードに対し、番組タイトル関連度に対する寄与度を下げるため、他のキーワードよりも小さい重み(係数)を掛けてもよい。
また、番組タイトル関連度算出処理において、番組特定手段1233は、例えば、番組情報が有する番組関連キーワードを用いて、番組タイトル関連度を算出してもよい。
放送局関連度算出処理では、例えば、番組特定手段1233は、番組視聴情報が有するユーザ位置情報と、各番組情報が有する放送局位置情報を座標と見なし、当該座標間の距離を算出し、当該距離から、放送局関連度を算出する。例えば、座標間の距離を「dist(P1,P2)」と表現することにする。ここで、P1、P2は、経緯度情報を示す記号である。P1、P2は、例えば、X軸方向、Y軸方向の座標を示す(X1,Y1)、(X2,Y2)を有する。この場合、座標間の距離は、「√{(X1−X2)^2×(Y1−Y2)^2}」で算出することができる。ここで、「^2」は、二乗を意味する。この場合において、放送局関連度は、例えば、「log(dist(ユーザ位置情報,放送局位置情報)+1)で算出することができる。
放送時間関連度算出処理では、例えば、番組特定手段1233は、まず、時刻取得手段1232で取得した時刻(取得時刻)と、各番組情報が有する放送時間帯とを取得する。次に、番組特定手段1233は、当該取得時刻が、当該放送時間帯で示される時刻の範囲に含まれるか否かを判断する。含まれる場合、番組特定手段1233は、放送時間関連度を「0」とする。含まれない場合、番組特定手段1233は、当該取得時刻が、当該放送時間帯が有する開始時刻よりも前の時刻であるか否かを判断する。開始時刻よりも前の時刻である場合、番組特定手段1233は、開始時刻から取得時刻を減算した値を用いて算出できる値を、放送時間関連度とする。この値は、例えば、「log(T−Ts+0.1)」で算出することができる。ここで、Tは、取得時間を示す記号であり、Tsは、開始時刻を示す記号である。また、開始時刻よりも後の時刻である場合、つまり終了時刻よりも後の時刻である場合、番組特定手段1233は、取得時刻から終了時刻を減算した値を用いて算出できる値を、放送時間関連度とする。この値は、例えば、「log(Te−T+0.1)」で算出することができる。ここで、Teは、終了時刻を示す記号である。
最後に、番組特定手段1233は、番組関連度算出処理として、番組タイトル関連度と、放送局関連度と、放送時間関連度とから、番組関連度を算出する。番組関連度をR、番組タイトル関連度をα、放送局関連度をβ、放送時間関連度をγとすると、番組関連度Rは、例えば、「α/(β+1)×(γ+1)」で算出することができる。
次に、番組特定手段1233は、番組特定処理を行う。例えば、番組特定手段1233は、まず、算出した各番組情報に対する番組関連度を、関連度の降順にソートする。このとき、例えば、番組識別子などとともに、算出した番組関連度に対応する番組情報が特定できるようにソートする。そして、番組特定手段1233は、当該ソートの結果、最大の番組関連度に対応する番組情報を取得する。そして、番組特定手段1233は、当該番組情報で示される番組を、番組視聴情報に対応する番組であると特定する。
なお、番組特定手段1233は、電子番組表特定手段1231が特定した電子番組表が有する番組情報から、番組視聴情報受信部122が受信した番組視聴情報が有する各情報を基に、当該番組視聴情報に対応する番組を特定することができればよく、その手法、手順は問わない。
番組特定手段1233は、通常、MPUやメモリ等から実現され得る。番組特定手段1233の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
番組視聴統計情報取得部124は、番組視聴情報を統計処理する。そして、番組視聴統計情報取得部124は、統計処理の結果、番組視聴統計情報を取得する。ここで、統計処理とは、例えば、視聴者数を算出することや、視聴率を算出することなどである。また、統計処理は、通常、番組特定部123が特定した番組ごとに行う。また、番組視聴統計情報とは、番組の視聴に関する統計情報のことである。番組視聴率統計情報は、例えば、視聴者数や、視聴率などである。視聴者数は、例えば、「100人」や、「52名」などである。視聴率は、例えば、「90%」や、「56.2%」、「23.4」などである。
視聴者数、および視聴率を算出するに際し、番組視聴統計情報取得部124は、通常、番組視聴情報のユニーク処理を行う。ユニーク処理とは、任意の2以上の情報において、重複する情報を削除し、一の情報をユニークにすることである。例えば、番組視聴統計情報取得部124は、各番組視聴情報が有するユーザ識別子と、当該番組視聴情報に対応する番組とを用いてユニーク処理を行う。また、例えば、番組視聴統計情報取得部124は、各番組視聴情報が有するユーザ識別子と、当該番組視聴情報に対応する番組と、当該番組に対する番組コメントの感情とを用いてユニーク処理を行う。
また、番組視聴統計情報は、例えば、表形式であってもよいし、グラフ形式であってもよいし、画像形式であってもよい。表形式である場合、番組視聴統計情報は、例えば、番組識別子と、視聴者数と、視聴率と、当該統計処理を行った期間を示す2以上の時刻情報を有する。また、グラフ形式である場合、番組視聴統計情報は、例えば、横軸に時刻、縦軸に視聴者数、および視聴率をとる。画像形式である場合、番組視聴統計情報は、例えば、グラフ形式の番組視聴統計情報を画像化したものや、グラフ形式の番組視聴統計情報を画像化したものなどである。番組視聴統計情報は、例えば、「(ひょうごニュース|男性|10人)、(ひょうごニュース|女性|3人)」や、「(爆笑コンテスト|男性|10代|30%)、(爆笑コンテスト|男性|20代|20%)」などである。番組視聴統計情報は、番組の視聴に関する統計情報であればよく、その形式、内容は問わない。
また、番組視聴統計情報取得部124は、番組視聴統計情報の取得に際し、通常、後述の感情用語格納手段1241、ユーザ属性情報取得手段1242、感情用語取得手段1243、感情決定手段1244、番組視聴統計情報取得手段1245により行う。
番組視聴統計情報取得部124は、通常、MPUやメモリ等から実現され得る。番組視聴統計情報取得部124の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
感情用語格納手段1241は、1以上の感情用語を格納し得る。感情用語とは、感情を示す用語である。感情用語は、例えば、肯定用語や、否定用語などである。肯定用語とは、肯定的である旨を示す用語である。肯定用語は、例えば、「いい」、「良い」、「すごい」、「すげー」、「かっこいい」、「おもしろい」などである。また、否定用語とは、否定的である旨を示す用語である。否定用語は、例えば、「悪い」、「ダメ」、「キモい」、「つまらない」、「いまいち」などである。また、否定用語は、準否定用語と、接続否定用語とを有していてもよい。準否定用語とは、否定用語に準ずる用語のことである。準否定用語とは、例えば、「おもしろく」や、「おもしろくは」、「良く」、「良くは」などである。接続否定用語とは、準否定用語に接続されることで、準否定用語を否定用語にするための用語である。接続否定用語は、例えば、「ない」などである。
また、感情用語格納手段1241は、種別情報を格納し得てもよい。種別情報とは、感情用語が示す感情の種別を示す情報である。種別情報は、例えば、「肯定的」や、「肯定」、「否定的」、「否定」、「中立」、「中立的」などである。
また、感情用語と種別情報とは、通常、1対1で対応付けられている。また、感情用語と種別情報とを有する情報を、感情用語管理情報としてもよい。
感情用語格納手段1241は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
ユーザ属性情報取得手段1242は、ユーザ属性情報を取得する。ここでのユーザ属性情報は、番組視聴情報が有するユーザ識別子に対応するユーザ属性情報である。また、ユーザ属性情報は、番組視聴情報が有するユーザ属性情報であってもよい。
例えば、番組視聴情報が有するユーザ属性情報が性別情報である場合、ユーザ属性情報取得手段1242は、当該性別情報を、ユーザ属性情報として取得する。また、番組視聴情報が有するユーザ属性情報が年齢情報である場合、ユーザ属性情報取得手段1242は、当該年齢情報を、ユーザ属性情報として取得する。また、番組視聴情報が有するユーザ属性情報が年齢情報である場合、ユーザ属性情報取得手段1242は、当該年齢情報を取得し、当該年齢情報により示される年齢の年齢層を取得し、当該年齢層を示す情報をユーザ属性情報として取得してもよい。当該年齢層の取得は、例えば、年齢情報で示される年齢の一の位を「0」にすることで取得する。
ユーザ属性情報取得手段1242は、通常、MPUやメモリ等から実現され得る。ユーザ属性情報取得手段1242の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
感情用語取得手段1243は、1以上の番組視聴情報から、感情用語を取得する。ここでの番組視聴情報は、番組特定部123が特定した各番組に対応する番組視聴情報である。
感情用語取得手段1243は、例えば、番組視聴情報が有する番組コメントから、感情用語を取得する。例えば、感情用語取得手段1243は、番組コメントを形態素解析により、形態素に分割する。そして、感情用語取得手段1243は、当該形態素のうち、「名詞」、または「形容詞」と判断されたものを抽出する。そして、感情用語取得手段1243は、当該抽出した形態素を、感情用語格納手段1241から検索する。これにより、感情用語取得手段1243は、感情用語を取得する。また、感情用語取得手段1243は、通常、感情用語の取得に際し、対応付けられている種別情報も取得する。
また、感情用語取得手段1243は、例えば、感情用語格納手段1241に格納されている感情用語が、番組コメントに含まれているか否かを判断し、含まれていると判断した感情用語を、感情用語格納手段1241から取得してもよい。
感情用語取得手段1243は、通常、MPUやメモリ等から実現され得る。感情用語取得手段1243の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
感情決定手段1244は、番組視聴情報が有する番組コメントの番組に対する感情を決定する。感情決定手段1244は、例えば、感情用語取得手段1243が取得した感情用語に対応する種別情報で示される感情により、感情を決定する。また、感情決定手段1244は、例えば、番組特定部123が特定した番組ごとに、感情を決定する。
例えば、感情用語管理情報として感情用語「おもしろい」と種別情報「肯定的」が対応付けられており、感情用語取得手段1243が番組コメントから感情用語「おもしろい」を取得した場合、感情決定手段1244は、当該番組コメントを「肯定的である」と決定する。また、例えば、感情用語管理情報として感情用語「つまらない」と種別情報「否定的」が対応付けられており、感情用語取得手段1243が番組コメントから感情用語「つまらない」を取得した場合、感情決定手段1244は、当該番組コメントを「否定的である」と決定する。また、例えば、感情取得手段が番組コメントから感情用語が取得できなかった場合、感情決定手段1244は、当該番組コメントを「中立的である」と決定してもよい。
感情決定手段1244は、通常、MPUやメモリ等から実現され得る。感情決定手段1244の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
番組視聴統計情報取得手段1245は、1以上の番組視聴情報を統計処理する。そして、番組視聴統計情報取得手段1245は、統計処理の結果、番組視聴統計情報を取得する。このとき、番組視聴統計情報取得手段1245は、通常、番組特定部123が特定した番組ごとに、統計処理を行う。また、番組視聴統計情報取得手段1245は、ユーザ属性情報取得手段1242が取得したユーザ属性情報ごとに統計処理を行ってもよい。また、番組視聴統計情報取得手段1245は、感情決定手段1244が決定した感情ごとに統計処理を行ってもよい。
例えば、番組視聴統計情報取得手段1245は、まず、番組特定部123が特定した番組ごとに、番組視聴情報を取得する。そして、番組視聴統計情報取得手段1245は、当該番組視聴情報が有するユーザ属性情報ごとに、当該番組視聴情報を分類する。そして、番組視聴統計情報取得手段1245は、当該分類後の番組視聴情報ごとに、統計処理を行う。
統計処理として、視聴者数を算出する場合、番組視聴統計情報取得手段1245は、例えば、当該分類後の番組視聴情報ごとに、当該番組視聴情報が有するユーザ識別子で示されるユーザの数をカウントする。例えば、番組視聴情報が有するユーザ識別子が「User01」と、「User02」である場合、視聴者数は「2」となる。また、番組視聴情報が有するユーザ識別子が「User01」と、「User02」と、「User01」である場合、ユニーク処理の結果、視聴者数は「2」となる。
また、統計処理として、視聴率を算出する場合、番組視聴統計情報取得手段1245は、例えば、まず、番組視聴情報受信部122が受信した番組視聴情報が有するユーザ識別子で示されるユーザの数をカウントし、全視聴者数を算出する。当該全視聴者数は、地域ごとに算出してもよい。そして、番組視聴統計情報取得手段1245は、前述と同様の手順にて、番組ごとや、ユーザ属性情報、感情ごとに、番組視聴情報を分類する。そして、番組視聴統計情報取得手段1245は、分類後の番組視聴情報ごとに、ユーザ識別子で示されるユーザの数をカウントし、番組ごとの視聴者数を算出する。ここで、例えば、全視聴者数を「Ua」、番組ごとの視聴者数を「Ue」とすると、番組視聴統計情報取得手段1245は、例えば、「(Ue/Ua)×100」で、視聴率を算出する。例えば、「Ua=100」、「Ue=40」である場合、視聴率は、「(40/100)×100」で「40%」となる。また、番組視聴統計情報取得手段1245は、統計処理として、人気度を算出してもよい。例えば、任意の番組に対するコメントである番組コメントを有する番組視聴情報の数を「C」、番組毎の視聴者数を「U」とすると、番組視聴統計情報取得手段1245は、例えば、「√(C)×U」で、人気度を算出する。例えば、「C=100」、「U=81」である場合、人気度は、「√(100)×81」で「810」となる。なお、当該人気度は、正規化により、「0〜100」の値に変換してもよい。正規化の処理は、例えば、「正規化後の人気度=(正規化前の人気度−人気度の最小値)/(人気度の最大値−人気度の最小値)」である。
なお、番組視聴統計情報取得手段1245は、番組視聴統計情報を取得することができればよく、その手法、手順などは問わない。
番組視聴統計情報取得手段1245は、通常、MPUやメモリ等から実現され得る。番組視聴統計情報取得手段1245の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
番組視聴統計情報出力部125は、番組視聴統計情報を出力する。ここでの番組視聴統計情報は、番組視聴統計情報取得部124が取得した番組視聴統計情報である。
出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。なお、送信や蓄積、処理結果の引渡しについては、出力対象が最終的にユーザに提示されるものとする。
番組視聴統計情報出力部125は、ディスプレイやスピーカーなどの出力デバイスを含むと考えてもよいし、含まないと考えてもよい。番組視聴統計情報出力部125は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイスなどで実現され得る。
次に、情報処理システム1の動作について説明する。なお、所定の情報におけるi番目の情報は、「情報[i]」と記載するものとする。
図4は、サーバ装置11の全体動作を示すフローチャートである。
(ステップS401)サーバ番組視聴情報受信部112は、番組視聴情報を受信したか否かを判断する。受信した場合は、ステップS402に進み、そうでない場合は、ステップS403に進む。
(ステップS402)サーバ番組視聴情報蓄積部113は、サーバ番組視聴情報受信部112が受信した番組視聴情報を、番組視聴情報格納部111に蓄積する。
(ステップS403)サーバ番組視聴情報送信部114は、番組視聴情報送信指示を受信したか否かを判断する。受信した場合は、ステップS404に進み、そうでない場合は、ステップS401に戻る。
(ステップS404)サーバ番組視聴情報送信部114は、ステップS403で受信した番組視聴情報送信指示が有する検索キーに対応する番組視聴情報を、番組視聴情報格納部111から取得し、当該取得した番組視聴情報を送信する。
なお、図4のフローチャートにおいて、電源オフや処理終了の割り込みにより処理を終了してもよい。
図5は、番組視聴情報処理装置12の全体動作を示すフローチャートである。
(ステップS501)番組視聴情報受信部122は、番組視聴情報送信指示の送信のタイミングであるか否かを判断する。タイミングである場合は、ステップS502に進み、そうでない場合は、ステップS501に戻る。
(ステップS502)番組視聴情報受信部122は、番組視聴情報送信指示を送信する。
(ステップS503)番組視聴情報受信部122は、送信した番組視聴情報送信指示に対応する番組視聴情報を受信したか否かを判断する。受信した場合は、ステップS504に進み、そうでない場合は、ステップS503に戻る。
(ステップS504)番組特定部123は、番組視聴情報受信部122が受信した番組視聴情報に対応する番組を特定する。この処理の詳細は、図6のフローチャートを用いて説明する。
(ステップS505)番組視聴統計情報取得部124は、番組視聴情報受信部122が受信した番組視聴情報の番組に対する感情を決定する。この処理の詳細は、図10のフローチャートを用いて説明する。
(ステップS506)番組視聴統計情報取得部124は、番組視聴統計情報を取得する。この処理の詳細は、図11のフローチャートを用いて説明する。
(ステップS507)番組視聴統計情報出力部125は、番組視聴統計情報取得部124が取得した番組視聴統計情報を出力する。
なお、図5のフローチャートにおいて、電源オフや処理終了の割り込みにより処理を終了してもよい。
また、図5のフローチャートにおいて、ステップS504の番組の特定処理後に、同一のユーザ識別子と、特定した番組が同一である番組視聴情報のユニーク処理を行ってもよい。
図6は、図5のフローチャートのステップS504の番組の特定処理を示すフローチャートである。
(ステップS601)電子番組表特定手段1231は、番組視聴情報受信部122が受信した番組視聴情報を取得する。こここで、m個の番組視聴情報が取得できたものとする。
(ステップS602)電子番組表特定手段1231は、電子番組表格納部121に格納されている地域別電子番組表を取得する。
(ステップS603)電子番組表特定手段1231は、カウンタiに1をセットする。
(ステップS604)電子番組表特定手段1231は、番組視聴情報[i]が有するユーザ位置情報に対応する地域名称を、地域管理情報から検索し、地域を特定する。
(ステップS605)電子番組表特定手段1231は、特定した地域に対応する電子番組表を、取得した地域別電子番組表から検索し、電子番組表を取得する。ここで、n個の番組情報を有する電子番組表が取得できたものとする。
(ステップS606)電子番組表特定手段1231は、カウンタjに1をセットする。
(ステップS607)番組特定手段1233は、番組視聴情報[i]と、番組情報[j]の番組タイトルとの関連度αを取得する。この処理の詳細は、図7のフローチャートを用いて説明する。
(ステップS608)番組特定手段1233は、番組視聴情報[i]と、番組情報[j]の放送局との関連度βを取得する。この処理の詳細は、図8のフローチャートを用いて説明する。
(ステップS609)番組特定手段1233は、番組視聴情報[i]と、番組情報[j]の放送時間との関連度γを取得する。この処理の詳細は、図9のフローチャートを用いて説明する。
(ステップS610)番組特定手段1233は、番組視聴情報[i]と番組情報[j]で示される番組との関連度Rを算出する。番組特定手段1233は、例えば、「α/(β+1)×(γ+1)」の値を算出し、関連度R[j]に、当該値をセットする。
(ステップS611)電子番組表特定手段1231は、jがnであるか否かを判断する。nである場合は、ステップS613に進み、そうでない場合は、ステップS612に進む。
(ステップS612)電子番組表特定手段1231は、jを1インクリメントし、ステップS607に戻る。
(ステップS613)番組特定手段1233は、関連度Rを降順にソートする。
(ステップS614)番組特定手段1233は、番組視聴情報[i]に対応する番組を示す番組情報として、関連度R[1]を取得する。
(ステップS615)電子番組表特定手段1231は、iがmであるか否かを判断する。mである場合は、上位処理にリターンし、そうでない場合は、ステップS616に進む。
(ステップS616)電子番組表特定手段1231は、iを1インクリメントし、ステップS604に戻る。
図7は、図6のフローチャートのステップS607の番組タイトルとの関連度の取得処理を示すフローチャートである。なお、図7のフローチャートにおける番組視聴情報は、図6のフローチャートにおける番組視聴情報[i]である。また、図7のフローチャートにおける番組情報は、図6のフローチャートにおける番組情報[j]である。
(ステップS701)番組特定手段1233は、番組視聴情報が有する番組コメントから、キーワードKW1を抽出する。
(ステップS702)番組特定手段1233は、番組タイトルとの関連度αに0をセットする。
(ステップS703)番組特定手段1233は、番組情報が有する番組タイトルに、KW1のいずれかが含まれるか否かを判断する。含まれる場合は、ステップS704に進み、そうでない場合は、上位処理にリターンする。
(ステップS704)番組特定手段1233は、番組情報が有する番組タイトルから、キーワードKW2を抽出する。
(ステップS705)番組特定手段1233は、KW1とKW2のJaccard係数を算出し、番組タイトルとの関連度αに、当該値をセットする。そして、上位処理にリターンする。
図8は、図6のフローチャートのステップS608の放送局との関連度の取得処理を示すフローチャートである。なお、図8のフローチャートにおける番組視聴情報は、図6のフローチャートにおける番組視聴情報[i]である。また、図7のフローチャートにおける番組情報は、図6のフローチャートにおける番組情報[j]である。
(ステップS801)番組特定手段1233は、番組視聴情報から、当該情報が有するユーザ位置情報P1を取得する。
(ステップS802)番組特定手段1233は、番組情報から、当該情報が有する放送局位置情報P2を取得する。
(ステップS803)番組特定手段1233は、P1とP2の距離xを取得する。
(ステップS804)番組特定手段1233は、「log(x+1)」の値を算出し、放送局との関連度βに、当該値をセットする。そして、上位処理にリターンする。
図9は、図6のフローチャートのステップS609の放送時間との関連度の取得処理を示すフローチャートである。
(ステップS901)時刻取得手段1232は、番組視聴情報から、当該情報が有する時刻情報Tを取得する。
(ステップS902)番組特定手段1233は、番組情報から、当該情報が有する開始時刻情報Tsを取得する。
(ステップS903)番組特定手段1233は、番組情報から、当該情報が有する終了時刻情報Teを取得する。
(ステップS904)番組特定手段1233は、TがTs以上かつTe以下であるか否かを判断する。Ts以上かつTe以下である場合は、ステップS905に進み、そうでない場合は、ステップS906に進む。
(ステップS905)番組特定手段1233は、放送時間との関連度γに0をセットする。そして、上位処理にリターンする。
(ステップS906)番組特定手段1233は、TがTsより小さいか否かを判断する。Tsより小さい場合は、ステップS907に進み、そうでない場合は、ステップS908に進む。
(ステップS907)番組特定手段1233は、「log(Ts−T+0.11)」の値を算出し、放送時間との関連度γに、当該値をセットする。そして、上位処理にリターンする。
(ステップS908)番組特定手段1233は、「log(T−Te+0.1)」の値を算出し、放送時間との関連度γに、当該値をセットする。そして、上位処理にリターンする。
図10は、図5のフローチャートのステップS505の感情の決定処理を示すフローチャートである。
(ステップS1001)感情用語取得手段1243は、番組特定部123が特定した番組視聴情報を取得する。ここで、m個の番組視聴情報が取得できたものとする。
(ステップS1002)感情用語取得手段1243は、感情用語格納手段1241に格納されている感情用語管理情報を取得する。ここで、n個の感情用語管理情報が取得できたものとする。
(ステップS1003)感情用語取得手段1243は、カウンタiに1をセットする。
(ステップS1004)感情用語取得手段1243は、カウンタjに1をセットする。
(ステップS1005)感情用語取得手段1243は、番組視聴情報[i]が有する番組コメントに、感情用語管理情報[j]が有する感情用語が含まれるか否かを判断する。含まれる場合は、ステップS1006に進み、そうでない場合は、ステップS1007に進む。
(ステップS1006)感情決定手段1244は、ステップS1005で含まれると判断した感情用語に対応する種別情報を取得し、番組視聴情報[i]に対応する感情として、当該情報をセットする。
(ステップS1007)感情決定手段1244は、番組視聴情報[i]に対応する感情として、「なし」をセットする。
(ステップS1008)感情用語取得手段1243は、jがnであるか否かを判断する。nである場合は、ステップS1010に進み、そうでない場合は、ステップS1009に進む。
(ステップS1009)感情用語取得手段1243は、jを1インクリメントし、ステップS1005に戻る。
(ステップS1010)感情用語取得手段1243は、iがmであるか否かを判断する。mである場合は、上位処理にリターンし、そうでない場合は、ステップS1011に進む。
(ステップS1011)感情用語取得手段1243は、iを1インクリメントし、ステップS1004に戻る。
図11は、図5のフローチャートのステップS506の番組視聴統計情報の取得処理を示すフローチャートである。
(ステップS1101)番組視聴統計情報取得手段1245は、番組特定部123が取得した番組視聴情報を取得する。ここで、m個の番組視聴情報が取得できたものとする。
(ステップS1102)番組視聴統計情報取得手段1245は、番組特定部123が取得した電子番組表を取得する。ここで、n個の番組情報を有する電子番組表が取得できたものとする。
(ステップS1103)番組視聴統計情報取得手段1245は、カウンタiに1をセットする。
(ステップS1104)ユーザ属性情報取得手段1242は、ステップS1101で取得した番組視聴情報[i]から、ユーザ属性情報を取得する。ここで、a種類のユーザ属性情報が取得できたものとする。
(ステップS1105)番組視聴統計情報取得手段1245は、カウンタjに1をセットする。
(ステップS1106)番組視聴統計情報取得手段1245は、番組視聴統計情報[j]の番組情報として、番組情報[j]をセットする。
(ステップS1107)番組視聴統計情報取得手段1245は、番組情報[j]が、番組情報[i]が有する番組情報と同じであるか否かを判断する。同じである場合は、ステップS1108に進み、そうでない場合は、ステップS1116に進む。
(ステップS1108)番組視聴統計情報取得手段1245は、番組視聴統計情報[j]の視聴者数を1インクリメントする。
(ステップS1109)番組視聴統計情報取得手段1245は、番組視聴情報[i]が有する感情を取得する。
(ステップS1110)番組視聴統計情報取得手段1245は、ステップS1109で取得した感情に対応する、番組視聴統計情報[j]のカウンタを1インクリメントする。
(ステップS1111)番組視聴統計情報取得手段1245は、カウンタkに1をセットする。
(ステップS1112)番組視聴統計情報取得手段1245は、ユーザ属性[k]を取得する。
(ステップS1113)番組視聴統計情報取得手段1245は、ステップS1112で取得したユーザ属性に対応する、番組視聴統計情報[j]のカウンタを1インクリメントする。
(ステップS1114)番組視聴統計情報取得手段1245は、kがaであるか否かを判断する。aである場合は、ステップS1116に進み、そうでない場合は、ステップS1115に進む。
(ステップS1115)番組視聴統計情報取得手段1245は、kを1インクリメントし、ステップS1112に戻る。
(ステップS1116)番組視聴統計情報取得手段1245は、jがnであるか否かを判断する。nである場合は、ステップS1118に進み、そうでない場合は、ステップS1117に進む。
(ステップS1117)番組視聴統計情報取得手段1245は、jを1インクリメントする。
(ステップS1118)番組視聴統計情報取得手段1245は、iがmであるか否かを判断する。mである場合は、上位処理にリターンし、そうでない場合は、ステップS1119に進む。
(ステップS1119)番組視聴統計情報取得手段1245は、iを1インクリメントし、ステップS1104に戻る。
なお、図11のフローチャートにおいて、番組視聴統計情報として視聴者数を取得する例を示したが、視聴率や、人気度を取得してもよい。
次に、情報処理システム1の動作の具体例について説明する。なお、本具体例において、サーバ装置11は、例えば、テレビ番組についての意見を投稿するブログや、ミニブログ、SNSを運用するサーバである。また、サーバ装置11内の任意の記憶領域には、図12に示すユーザ管理情報が格納されているものとする。当該ユーザ管理情報は、ユーザ識別子と、性別と、年齢とを有する。また、番組視聴情報処理装置12内の任意の記憶領域には、図13に示す地域管理情報が格納されているものとする。当該地域管理情報は、地域名と、地域位置情報を有する。また、電子番組表格納部121には、図14に示す地域別電子番組表が格納されているものとする。当該地域別電子番組表は、地域名と、放送局名と、放送局位置情報と、番組情報とを有する。当該番組情報は、日付情報と、開始時刻情報と、終了時刻情報と、番組名とを有する。また、感情用語格納手段1241には、図15に示す感情用語管理情報が格納されているものとする。当該感情用語管理情報は、感情用語と、種別を有する。
まず、何人かのユーザが、テレビ番組を視聴し、端末装置を介して、番組視聴情報を送信したとする。このとき、ユーザは、例えば、端末装置に備えられているアプリケーションや、Webサイトを介して、番組視聴情報を送信する。すると、サーバ番組視聴情報受信部112は、ユーザが送信した番組視聴情報を受信する。このとき、サーバ番組視聴情報受信部112は、図16に示す番組視聴情報を受信したものとする。なお、図16では、ある期間内にユーザが送信した番組視聴情報の例を示しているが、サーバ番組視聴情報受信部112は、ユーザが送信するたびに、番組視聴情報を受信してもよい。
次に、サーバ番組視聴情報蓄積部113は、任意の記憶領域に格納されている図12のユーザ管理情報を取得し、サーバ番組視聴情報受信部112が受信した番組視聴情報に対し、当該ユーザ管理情報が有する性別、および年齢を付与する。この結果、サーバ番組視聴情報蓄積部113は、図17に示す番組視聴情報を生成し、当該番組視聴情報を、番組視聴情報格納部111に蓄積する。
次に、番組視聴情報受信部122は、予め決められたタイミングに従い、「日付=2011/01/06」の検索キーを有する番組視聴情報送信指示を、サーバ装置11に送信したとする。すると、サーバ番組視聴情報送信部114は、当該検索キーを有する番組視聴情報送信指示を受信し、当該検索キーにより、番組視聴情報格納部111に格納されている番組視聴情報を検索し、図17の番組視聴情報のうち、「ID=98」から「ID=107」の番組視聴情報を送信したものとする。すると、番組視聴情報受信部122は、図17の「ID=98」から「ID=107」の番組視聴情報を受信する。
次に、電子番組表特定手段1231は、任意の記憶領域に格納されている図13の地域管理情報を取得する。そして、電子番組表特定手段1231は、番組視聴情報受信部122が受信した各番組視聴情報が有するユーザ位置情報と、地域管理情報が有する位置情報との距離を算出し、各番組視聴情報に対応する地域が「兵庫」であると特定したとする。すると、電子番組表特定手段1231は、電子番組表格納部121に格納されている図14の地域別番組表から、地域が「兵庫」である「ID=88」から「ID=117」の電子番組表を取得する。
次に、番組特定手段1233は、番組視聴情報受信部122が受信した各番組視聴情報と、電子番組表特定手段1231が取得した電子番組表が有する各番組情報に対して、番組関連度算出処理と、番組特定処理を行い、各番組情報に対応する番組を示す番組名を取得する。なお、番組関連度算出処理において使用する各番組視聴情報の時刻情報は、時刻取得手段1232が取得するものとする。また、感情用語取得手段1243、および感情決定手段1244は、感情用語格納手段1241に格納されている図15の感情用語管理情報を取得し、各番組視聴情報が有する番組コメントが示す感情を決定する。この結果、各番組視聴情報に対応する番組を示す番組名、および番組コメントが示す感情は、図18のようになったものとする。ここで、「番組名」が「なし」になっているものは、番組関連度算出処理により算出した番組関連度から、番組が特定できなかったことを示す。
次に、番組視聴統計情報取得手段1245は、図18の情報に対しユニーク処理を行い、図19の情報を取得したものとする。このとき、番組視聴統計情報取得手段1245は、図19の各情報(レコード)から、同一のユーザ識別子、性別、年齢、番組名、感情を有する情報を検索し、IDが小さいものを残し、それ以外を削除したものとする。また、番組が特定できなかった番組視聴情報(「番組名」が「なし」になっている番組視聴情報)も、合せて削除したものとする。そして、番組視聴統計情報取得手段1245は、図19の各情報が有する性別、感情などの数、およびユーザ識別子で示されるユーザの数を、番組名ごとにカウントする。このとき、図19の各情報からのユーザ属性情報の取得は、ユーザ属性情報取得手段1242が取得するものとする。そして、これらの情報から視聴率、人気度を算出し、図20に示す番組視聴統計情報を取得したものとする。
最後に、番組視聴統計情報出力部125は、例えば、図21のようなグラフの形式に加工し、番組視聴統計情報を出力する。
なお、具体例では、バッチ処理により、番組視聴情報から番組視聴統計情報を取得する例を示したが、リアルタイム処理により、番組視聴統計情報を取得してもよい。
また、本具体例では、各番組視聴情報に対応する番組を特定する際に、各番組視聴情報が有する番組コメントが示す感情を決定する例を示したが、番組視聴情報から番組視聴統計情報を取得する際に、感情を決定してもよい。
また、本具体例では、各番組視聴情報に対応する番組、および感情を決定した情報に対して、番組視聴統計情報取得手段1245がユニーク処理する例を示したが、当該処理は、番組特定手段1233が行ってもよい。
以上、本実施の形態による情報処理システム1によれば、ユーザが送信した番組視聴情報から、当該番組視聴情報で示される番組の視聴者数や視聴率、人気度、番組に対する視聴者の感想等を取得することができる。
(実施の形態2)
本実施の形態において、ユーザが投稿したCGMデータから、ユーザが視聴した番組を特定し、かつ当該番組内のコーナーを特定し、統計処理を行う情報処理システム2について説明する。
なお、本実施の形態における情報処理システム2の概念図は、図1と同様であり、番組視聴情報処理装置12を、番組視聴情報処理装置22と読み替えたものである。また、本実施の形態におけるサーバ装置11のブロック図は、図2と同様である。また、本実施の形態における番組視聴情報処理装置22のブロック図は、図3と同様であり、図3の電子番組表格納部121を電子番組表格納部221と、番組特定部123を番組特定部223と、番組特定手段1233を番組特定手段2233と、番組視聴統計情報取得部124を番組視聴統計情報取得部224と、感情用語取得手段1243を感情用語取得手段2243と、感情決定手段1244を、感情決定手段2244と、番組視聴統計情報取得手段1245を番組視聴統計情報取得手段2245と読み替えたものである。
サーバ装置11は、番組視聴情報格納部111、サーバ番組視聴情報受信部112、サーバ番組視聴情報蓄積部113、サーバ番組視聴情報送信部114を備える。
番組視聴情報処理装置22は、電子番組表格納部221、番組視聴情報受信部122、番組特定部223、番組視聴統計情報取得部224、番組視聴統計情報出力部125を備える。番組特定部223は、電子番組表特定手段1231、時刻取得手段1232、番組特定手段2233を備える。番組視聴統計情報取得部224は、感情用語格納手段1241、ユーザ属性情報取得手段1242、感情用語取得手段2243、感情決定手段2244、番組視聴統計情報取得手段2245を備える。
電子番組表格納部221は、1以上の電子番組表を格納し得る。また、電子番組表格納部221は、1以上の地域別電子番組表を格納し得てもよい。電子番組表は、1以上の番組情報を有する。番組情報は、1以上の番組詳細情報を有していてもよい。
番組詳細情報とは、番組の詳細を示す情報、または番組の部分的な詳細を示す情報である。番組詳細情報は、例えば、放送内時間情報や、出演者識別子、番組部分識別子などである。番組詳細情報は、これらの情報の組み合わせであってもよい。
放送内時間情報とは、番組の放送時間帯中の時間を特定する情報である。放送内時間情報の形式などは、前述の放送時間帯と同様であるので、その説明を省略する。
出演者識別子とは、番組の出演者を識別するための情報である。出演者識別子は、例えば、出演者IDや、出演者氏名などである。出演者IDは、例えば、「1」や、「21」、「009」などである。出演者氏名は、例えば、「新崎 準」や、「束瀬弘毅」などである。
番組部分識別子とは、番組の部分を識別するための情報である。番組部分識別子は、例えば、番組のコーナー名や、番組の区切り、番組の内容、番組部分IDなどである。番組のコーナー名は、例えば、「トークコーナー」や、「クイズコーナー」などである。番組の区切りは、例えば、「オープニング」や、「エンディング」、「前半」、「後半」などである。番組の内容は、例えば、「政治」や、「経済」、「お天気」などである。
また、番組詳細情報は、番組部分関連キーワードを有していてもよい。番組部分関連キーワードとは、番組の部分に関連するキーワードである。番組関連キーワードは、例えば、形態素解析により、番組タイトルを形態素に分割し、取得できる名詞、または名詞句などである。また、番組キーワードは、番組タイトルの形態素のうち、「名詞」、または「形容詞」と判断されたものであってもよい。また、番組関連キーワードは、ユーザが任意に決定してもよい。
電子番組表格納部221は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
番組特定部223は、番組視聴情報に対応する番組の部分を特定する。「番組の部分を特定する」とは、前述の「番組を特定する」の意味と同様である。番組特定部223は、例えば、番組視聴情報を電子番組表に適用し、番組視聴情報に対応する番組の部分を特定する。ここでの番組視聴情報は、番組視聴情報受信部122が受信した2以上の番組視聴情報である。また、ここでの電子番組表は、電子番組表格納部221に格納されている電子番組表であってもよいし、外部の装置に格納されている電子番組表であってもよい。電子番組表が外部の装置(例えば、図示しない電子番組表管理装置)に格納されている電子番組表である場合、番組特定部223は、番組視聴情報受信部122が受信した2以上の各番組視聴情報が1以上の電子番組表に適用された結果の情報であり、各番組視聴情報に対応する番組の部分に関する情報(例えば、番組部分識別子、番組タイトルなど、番組の部分を識別できる情報)を取得することにより番組の部分を特定する。つまり、電子番組表が外部の装置に格納されている電子番組表である場合、番組特定部223は、番組視聴情報または番組視聴情報の一部の情報を当該外部の装置に送信し、当該外部の装置から番組の部分に関する情報を受信する。
「番組視聴情報を電子番組表に適用」とは、当該番組視聴情報に対応する番組詳細情報を、当該電子番組表から検索することである。番組特定部223は、例えば、形態素解析により、番組視聴情報が有する番組コメントを形態素に分割する。そして、番組特定部223は、当該分割結果から、名詞、または名詞句を取得する。そして、番組特定部223は、当該名詞、または名詞句を含む番組タイトル、および番組部分識別子を有する番組詳細情報を、電子番組表から検索する。そして、番組特定部223は、検索の結果、取得できた番組詳細情報で示される番組の部分を、番組視聴情報に対応する番組の部分であると特定する。
また、番組特定部223は、例えば、形態素解析により、番組情報が有する番組タイトル、および当該番組情報が有する番組詳細情報の番組部分識別子を形態素に分割する。このとき、番組特定部223は、番組タイトルのみ、または番組部分識別子のみを形態素解析してもよい。そして、番組特定部223は、当該分割結果から、名詞、または名詞句を取得する。そして、番組特定部223は、当該名詞、または名詞句を含む番組コメントを有する番組視聴情報を、番組視聴情報受信部122が受信した番組視聴情報から検索する。そして、番組特定部223は、検索の結果、取得できた番組視聴情報が有する番組コメントに含まれる名詞、または名詞句の取得元である番組詳細情報で示される番組の部分を、当該視聴情報に対応する番組の部分であると特定してもよい。
また、番組特定部223は、例えば、番組視聴情報受信部122が受信した番組視聴情報のうち、実際に番組を視聴したであろうと思われる番組視聴情報のみを対象に、番組の部分を特定してもよい。番組特定部223は、例えば、番組視聴用語を含む番組コメントを有する番組視聴情報のみを対象に、番組の部分を特定してもよい。また、番組特定部223は、例えば、番組非視聴用語を含まない番組コメントを有する番組視聴情報のみを対象に、番組の部分を特定してもよい。
なお、番組視聴情報が有する番組コメントが、番組視聴用語を含むか否かの判断、および番組非視聴用語を含まないか否かの判断は、前述の番組特定部123と同様であるので、説明を省略する。また、電子番組表格納部221から電子番組表、または番組詳細情報を取得する方法についても、前述の番組特定部123と同様であるので、説明を省略する。
また、番組特定部223は、例えば、地域特定処理や、地域番組表取得処理、番組部分関連度算出処理、番組部分特定処理などにより、番組の部分を特定してもよい。また、番組特定部223は、例えば、放送局特定処理や、放送局番組表取得処理、番組部分関連度算出処理、番組部分特定処理などにより、番組を特定してもよい。ここで、番組関連度算出処理とは、地域番組表取得処理、または放送局番組表取得処理により取得された電子番組表が有する各番組詳細情報と、番組視聴情報との関連度である番組部分関連度を算出する処理である。番組部分特定処理とは、番組部分関連度算出処理により算出した関連度が最大である番組詳細情報で示される番組の部分を、番組視聴情報に対応する番組の部分であると特定する処理である。
また、番組部分関連度は、通常、番組部分識別子関連度と、放送局部分関連度と、放送時間部分関連度とから算出される。番組部分識別子関連度とは、各番組詳細情報が有する番組部分識別子、および当該番組詳細情報を有する番組情報の番組タイトルと、番組視聴情報が有する番組コメントとの関連度である。また、放送局部分関連度とは、各番組詳細情報が有する放送局位置情報と、番組視聴情報が有するユーザ位置情報との関連度である。放送時間部分関連度とは、各番組詳細情報が有する放送時間帯と、番組視聴情報が有する時刻情報との関連度である。なお、番組部分識別子関連度は、通常、番組部分識別子関連度算出処理により算出される。また、放送局部分関連度算出処理は、通常、放送局部分関連度算出処理により算出される。また、放送時間部分関連度は、通常、放送時間部分関連度算出処理により算出される。
なお、番組特定部223における番組の部分の特定は、通常、電子番組表特定手段1231、時刻取得手段1232、後述の番組特定手段2233により行う。また、番組特定部223は、番組視聴情報受信部122が受信した番組視聴情報に対応する番組の部分を、電子番組表格納部221に格納されている番組詳細情報で示される番組の中から、当該番組視聴情報が有する各情報を基に特定できればよく、その手法、手順などは問わない。
番組特定部223は、通常、MPUやメモリ等から実現され得る。番組特定部123の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
番組特定手段2233は、通常、番組部分関連度算出処理と、番組部分特定処理を行うことにより、番組視聴情報に対応する番組の部分を特定する。番組特定手段2233は、まず、番組部分関連度算出処理として、番組部分識別子関連度算出処理と、放送局部分関連度算出処理と、放送時間部分関連度算出処理とを、順に行う。
番組部分識別子関連度算出処理では、例えば、番組特定手段2233は、まず、番組視聴情報が有する番組コメントを、形態素解析により、形態素に分割する。そして、番組特定手段2233は、当該形態素のうち、「名詞」、または「形容詞」と判断されたものを番組コメントキーワードとして抽出する。次に、番組特定手段2233は、各番組詳細情報が有する番組部分識別子、および当該番組詳細情報を有する番組情報の番組タイトルから、前述と同様にキーワードを抽出する。次に、番組特定手段2233は、番組視聴情報から抽出したキーワード群と、各番組詳細情報から抽出したキーワード群との関連度を算出する。当該関連度の算出は、例えば、Jaccard係数を用いる。
また、Jaccard係数の算出に際し、番組特定手段2233は、例えば、「ニュース」や、「ドラマ」など、番組タイトルに出現しやすいキーワードに対し、番組タイトル関連度に対する寄与度を下げるため、他のキーワードよりも小さい重み(係数)を掛けてもよい。
また、番組部分識別子関連度算出処理において、番組特定手段1233は、例えば、番組詳細情報が有する番組部分関連キーワードを用いて、番組部分識別子関連度を算出してもよい。また、番組部分識別子関連度において、番組特定手段2233は、番組詳細情報が有する出演者識別子を用いて、番組部分識別子関連度を算出してもよい。
放送局部分関連度算出処理、および放送時間部分関連度算出処理については、前述の放送局関連度算出処理、および放送時間関連度算出処理において、処理を行う対象を番組情報から番組詳細情報に置き換えるだけであるので、詳細な説明を省略する。
最後に、番組特定手段2233は、番組部分関連度算出処理として、番組部分識別子関連度と、放送局部分関連度と、放送時間部分関連度とから、番組部分関連度を算出する。番組部分関連度をR、番組部分識別子関連度をα、放送局部分関連度をβ、放送時間部分関連度をγとすると、番組部分関連度Rは、例えば、「α/(β+1)×(γ+1)」で算出することができる。
次に、番組特定手段2233は、番組部分特定処理を行う。例えば、番組特定手段2233は、まず、算出した各番組情報に対する番組部分関連度を、関連度の降順にソートする。このとき、例えば、番組識別子、番組部分識別子などとともに、算出した番組部分関連度に対応する番組詳細情報が特定できるようにソートする。そして、番組特定手段2233は、当該ソートの結果、最大の番組部分関連度に対応する番組詳細情報を取得する。そして、番組特定手段2233は、当該番組詳細情報で示される番組を、番組視聴情報に対応する番組であると特定する。
なお、番組特定手段2233は、電子番組表特定手段1231が特定した電子番組表が有する番組詳細情報から、番組視聴情報受信部122が受信した番組視聴情報が有する各情報を基に、当該番組視聴情報に対応する番組の部分を特定することができればよく、その手法、手順は問わない。
番組特定手段2233は、通常、MPUやメモリ等から実現され得る。番組特定手段2233の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現してもよい。
番組視聴統計情報取得部224は、前述の番組視聴統計情報取得部124と同様に、通常、番組特定部223が特定した番組の部分ごとに、番組視聴情報を統計処理する。また、感情用語取得手段2243は、前述の感情用語取得手段1243と同様に、通常、番組特定部223が特定した番組の部分ごとに、番組視聴情報が有する番組コメントから、感情用語を取得する。また、感情決定手段2244は、前述の感情決定手段1244と同様に、通常、感情用語取得手段2243が取得した感情用語を有する番組コメントに対して、当該コメントが示す番組の部分に対する感情を決定する。また、番組視聴統計情報取得手段2245は、前述の番組視聴統計情報取得手段1245と同様に、通常、番組特定部223が特定した番組の部分ごとや、ユーザ属性情報取得手段1242が取得したユーザ属性情報ごと、感情決定手段2244が決定した感情ごとなどに、番組視聴情報の統計処理を行う。
なお、番組視聴統計情報取得部224や、当該取得部が備える各手段における処理などは、前述の番組視聴統計情報取得部124や、当該取得部が備える各手段における処理において、番組情報を詳細番組情報に置き換えたものと同様である。従って、番組視聴統計情報取得部224や、当該取得部が備える各手段における処理などの詳細な説明は省略する。
また、サーバ装置11の全体動作を示すフローチャートは、図4である。また、番組視聴情報処理装置22の全体動作を示すフローチャートは、図5と同様であり、ステップS104の「番組の特定」を「番組部分の特定」に読み替えたものである。また、番組視聴情報処理装置22の処理の詳細は、図6から図11と同様であり、図6から図11において、「番組情報」を「番組詳細情報」に読み替えたものである。従って、サーバ装置11の全体動作、および番組視聴情報処理装置22の全体動作の詳細については、説明を省略する。
次に、情報処理システム2の動作の具体例について説明する。なお、本具体例において、サーバ装置11内の任意の記憶領域には、図12に示すユーザ管理情報が格納されているものとする。また、番組視聴情報処理装置22内の任意の記憶領域には、図13に示す地域管理情報が格納されているものとする。また、電子番組表格納部221には、図22に示す地域別電子番組表が格納されているものとする。当該地域別電子番組表は、地域名と、放送局名と、放送局位置情報と、番組詳細情報とを有する。当該番組詳細情報は、日付情報と、開始時刻情報と、終了時刻情報と、番組名と、番組部分識別子(「詳細」)を有する。また、感情用語格納手段1241には、図15に示す感情用語管理情報が格納されているものとする。
まず、何人かのユーザが、端末装置を介して番組視聴情報を送信し、番組視聴情報格納部111に蓄積された番組視聴情報を、番組視聴情報受信部122が受信したとする。このとき、番組視聴情報受信部122は、図17の「ID=98」から「ID=107」の番組視聴情報を受信したものとする。
次に、電子番組表特定手段1231は、図13の地域管理情報を用いて、各番組視聴情報が示す地域を特定し、図22の「ID=88」から「ID=102」の電子番組表を取得したものとする。
なお、以上に説明したユーザの番組視聴情報の送信から、電子番組表の取得までは、実施の形態1と同様であるので、詳細な説明は省略する。
次に、番組特定手段2233は、番組視聴情報受信部122が受信した各番組視聴情報と、電子番組表特定手段1231が取得した電子番組表が有する各番組詳細情報に対して、番組部分関連度算出処理と、番組部分特定処理を行い、各番組詳細情報に対応する番組を示す番組名と、番組の部分を示す番組部分識別子を取得する。なお、番組部分関連度算出処理において使用する各番組視聴情報の時刻情報は、時刻取得手段1232が取得するものとする。また、感情用語取得手段2243、および感情決定手段2244は、感情用語格納手段1241に格納されている図15の感情用語管理情報を取得し、各番組視聴情報が有する番組コメントが示す感情を決定する。この結果、各番組視聴情報に対応する番組を示す番組名、番組部分を示す番組識別子、および番組コメントが示す感情は、図23のようになったものとする。ここで、「詳細」は、番組部分識別子を示す項目名である。また、番組部分関連度算出処理により、番組、および番組部分が特定できなかった情報(レコード)については、削除している。また、同一のユーザ識別子、性別、年齢、番組名、詳細、感情についても、ユニーク処理により、削除している。
次に、番組視聴統計情報取得手段2245は、図23の各情報が有する性別、感情などの数、およびユーザ識別子で示されるユーザの数を、番組名、および番組識別子ごとにカウントする。このとき、図23の各情報からのユーザ属性情報の取得は、ユーザ属性情報取得手段1242が取得するものとする。そして、これらの情報から視聴率、人気度を算出し、図24に示す番組視聴統計情報を取得したものとする。
最後に、番組視聴統計情報出力部125は、例えば、図24のような表の形式にて番組視聴統計情報を出力する。
なお、具体例では、バッチ処理により、番組視聴情報から番組視聴統計情報を取得する例を示したが、リアルタイム処理により、番組視聴統計情報を取得してもよい。
また、本具体例では、各番組視聴情報に対応する番組の部分を特定する際に、各番組視聴情報が有する番組コメントが示す感情を決定する例を示したが、番組視聴情報から番組視聴統計情報を取得する際に、感情を決定してもよい。
また、本具体例では、各番組視聴情報に対応する番組、および感情を決定した情報に対して、番組特定手段2233がユニーク処理する例を示したが、当該処理は、番組視聴統計情報取得手段2245が行ってもよい。
以上、本実施の形態による情報処理システム2によれば、ユーザが送信した番組視聴情報から、当該番組視聴情報で示される番組の部分の視聴者数や視聴率、人気度、番組の部分に対する視聴者の感想等を取得することができる。
なお、上記各実施の形態において、電子番組表は外部の装置(例えば、図示しない電子番組表管理装置)に格納されていてもよい。この場合、通常、番組視聴情報処理装置12の番組特定部123は、番組視聴情報を用いて、電子番組表管理装置に問い合わせ、番組を特定する情報を電子番組表管理装置から受信する。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されてもよいことは言うまでもない。
また、上記各実施の形態において、各処理または各機能は、単一の装置または単一のシステムによって集中処理されることによって実現されてもよいし、あるいは、複数の装置または複数のシステムによって分散処理されることによって実現されてもよい。
また、上記各実施の形態において、各構成要素は専用のハードウェアにより構成されてもよいし、あるいは、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。
また、上記各実施の形態における視聴情報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、2以上の番組視聴情報の送信を指示し、2以上の番組視聴情報を受信する番組視聴情報受信部と、前記番組視聴情報受信部が受信した2以上の各番組視聴情報が1以上の電子番組表に適用された結果の情報であり、前記各番組視聴情報に対応する番組に関する情報を取得することにより番組を特定する番組特定部と、前記番組特定部が特定した番組ごとに、各番組に対応する1以上の番組視聴情報を統計処理し、番組の視聴に関する統計情報である番組視聴統計情報を取得する番組視聴統計情報取得部と、前記番組視聴統計情報取得部が取得した番組視聴統計情報を出力する番組視聴統計情報出力部として機能させるためのプログラムである。
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアでしか行われない処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理は少なくとも含まれない。
また、上記プログラムは、サーバなどからダウンロードされることによって実行されてもよいし、所定の記録媒体(例えば、CD−ROMなどの光ディスクや磁気ディスク、半導体メモリなど)に記録されたプログラムが読み出されることによって実行されてもよい。また、このプログラムは、プログラムプロダクトを構成するプログラムとして用いられてもよい。
また、上記プログラムを実行するコンピュータは、単数であってもよいし、複数であってもよい。つまり、集中処理を行ってもよいし、あるいは分散処理を行ってもよい。
また、図25は、前述のプログラムを実行して、前述の実施の形態の情報処理システム等を実現するコンピュータシステム9の概観図である。前述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。
図25において、コンピュータシステム9は、CD−ROM(Compact Disk Read Only Memory)ドライブ9011、FD(Flexible Disk)ドライブ9012を含むコンピュータ901と、キーボード902と、マウス903と、モニタ904とを備える。
図26は、コンピュータシステム9のブロック図である。図26において、コンピュータ901は、CD−ROMドライブ9011、FDドライブ9012に加えて、CPU(Central Processing Unit)9013と、ブートアッププログラム等のプログラムを記憶するためのROM(Read−Only Memory)9014と、CPU9013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM(Random Access Memory)9015と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク9016と、CD−ROMドライブ9011、FDドライブ9012、CPU9013等を相互に接続するバス9017とを備える。ここでは図示しないが、コンピュータ901は、さらに、LANへの接続を提供するネットワークカードを備えていてもよい。
コンピュータシステム9に、前述の実施の形態の情報処理システム等の機能を実行させるプログラムは、CD−ROM9101、またはFD9102に記憶されて、CD−ROMドライブ9011またはFDドライブ9012に挿入され、さらにハードディスク9016に転送されてもよい。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ901に送信され、ハードディスク9016に記憶されてもよい。プログラムは実行の際にRAM9015にロードされる。プログラムは、CD−ROM9101、FD9102またはネットワークから直接、ロードされてもよい。
プログラムは、コンピュータ901に、前述の実施の形態の情報処理システム等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくてもよい。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいればよい。コンピュータシステム9がどのように動作するかは周知であり、詳細な説明は省略する。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。