JP2016163175A - 情報処理システム、端末装置、情報処理方法、及びプログラム - Google Patents

情報処理システム、端末装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JP2016163175A
JP2016163175A JP2015040116A JP2015040116A JP2016163175A JP 2016163175 A JP2016163175 A JP 2016163175A JP 2015040116 A JP2015040116 A JP 2015040116A JP 2015040116 A JP2015040116 A JP 2015040116A JP 2016163175 A JP2016163175 A JP 2016163175A
Authority
JP
Japan
Prior art keywords
content
information
data
viewing
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015040116A
Other languages
English (en)
Inventor
山田 英明
Hideaki Yamada
英明 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2015040116A priority Critical patent/JP2016163175A/ja
Publication of JP2016163175A publication Critical patent/JP2016163175A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】視聴者の嗜好の推定における推定精度を向上させる情報処理システム、端末装置、情報処理方法及びプログラムを提供する。
【解決手段】情報処理装置21において、嗜好推定部216は、視聴者がコンテンツを視聴した履歴を示す視聴履歴情報とコンテンツに紐づけられた属性情報を示すコンテンツ属性情報とが関連付けられたコンテンツ視聴傾向情報を取得し、多数者についての嗜好を示す多数者嗜好情報であって、コンテンツ属性情報に関連付けられた多数者嗜好情報を取得し、コンテンツ視聴傾向情報と多数者嗜好情報とに基づいて、視聴者の嗜好を推定する。
【選択図】図4

Description

本発明は、情報処理システム、端末装置、情報処理方法、及びプログラムに関する。
視聴者が視聴したコンテンツ(例えば、放送番組)の履歴を示す視聴履歴情報を解析して、その視聴者に対してコンテンツを推薦するためのコンテンツの候補リスト(例えば、おすすめ番組表、等)を生成するコンテンツ推薦システムが提案されている。
特許文献1に記載の発明は、過去一定期間のEPG(Electronic Program Guide;電子番組ガイド)データに含まれる各放送番組の番組属性と、過去一定期間の視聴者の視聴履歴情報を解析して抽出した視聴傾向を特徴づける番組属性と、を比較して、視聴者の嗜好を判定する。
また、特許文献2に記載の発明は、EPGデータまたはネットワークに内に存在するサイトが有する情報を示す検索対象情報に含まれる単語と、視聴者が視聴した放送番組または閲覧したサイトに付随する情報を示す選択履歴情報に含まれる単語と、について、単語の出現回数の比較結果に基づいて、視聴者が好む単語を推定する。
特開2008−199406号公報 特開2008−59156号公報
上記のとおり、特許文献1及び特許文献2に記載の発明では、EPGデータに含まれる情報またはネットワークに内に存在するサイトが有する情報のみに基づいて視聴者の嗜好を推定する。そのため、例えばその時の流行等によって、EPGデータに含まれる情報またはネットワークに内に存在するサイトが有する情報が、ある特定の情報をより多く含む場合、すなわち含まれている情報の割合に偏りがある場合には、視聴者の嗜好を推定した結果においても偏りが含まれ、推定精度が低下することになる。
本発明は上記の点に鑑みてなされたものであり、視聴者の嗜好の推定における推定精度を向上させることができる、情報処理システム、端末装置、情報処理方法、及びプログラムを提供する。
(1)本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、視聴者がコンテンツを視聴した履歴を示す視聴履歴情報とコンテンツに紐づけられた属性情報を示すコンテンツ属性情報とが関連付けられたコンテンツ視聴傾向情報を取得し、多数者についての嗜好を示す多数者嗜好情報であって、前記コンテンツ属性情報に関連付けられた多数者嗜好情報を取得し、前記コンテンツ視聴傾向情報と前記多数者嗜好情報とに基づいて、前記視聴者の嗜好を推定する推定部を備える、情報処理システムである。
(2)また、本発明の一態様は、(1)に記載の情報処理システムであって、前記視聴履歴情報として、視聴日時、視聴継続時間、視聴したコンテンツの放送局、視聴したコンテンツのタイトル、のうち少なくともいずれか1つを含む情報を用いて、前記コンテンツ視聴傾向情報を生成する生成部を備えることを特徴とする。
(3)また、本発明の一態様は、(1)または(2)に記載の情報処理システムであって、前記コンテンツ属性情報として、コンテンツのジャンル、出演者、コンテンツに関連するキーワード、のうち少なくともいずれか1つを含む情報を用いて、前記コンテンツ視聴傾向情報を生成する生成部を備えることを特徴とする。
(4)また、本発明の一態様は、(1)から(3)のいずれか1つに記載の情報処理システムであって、前記推定部は、前記多数者嗜好情報として、統計情報に基づく情報を用いて前記視聴者の嗜好を推定することを特徴とする。
(5)また、本発明の一態様は、(4)に記載の情報処理システムであって、前記統計情報に基づく情報に基づいて前記多数者嗜好情報を生成することを特徴とする。
(6)また、本発明の一態様は、視聴者がコンテンツを視聴した履歴を示す視聴履歴情報を生成する視聴履歴情報生成部と、前記視聴履歴情報を情報処理装置へ出力する視聴履歴情報出力部と、前記情報処理装置から、視聴者がコンテンツを視聴した履歴を示す前記視聴履歴情報とコンテンツに紐づけられた属性情報を示すコンテンツ属性情報とが関連付けられたコンテンツ視聴傾向情報、及び、多数者についての嗜好を示す多数者嗜好情報であって前記コンテンツ属性情報に関連付けられた多数者嗜好情報に基づく、レコメンド情報を取得する取得部と、前記取得部が取得したレコメンド情報に基づく出力を行う出力部と、を備える、端末装置である。
(7)また、本発明の一態様は、情報処理装置における方法において、視聴者がコンテンツを視聴した履歴を示す視聴履歴情報とコンテンツに紐づけられた属性情報を示すコンテンツ属性情報とが関連付けられたコンテンツ視聴傾向情報を取得する取得過程と、多数者についての嗜好を示す多数者嗜好情報であって、前記コンテンツ属性情報に関連付けられた多数者嗜好情報を取得する取得過程と、前記コンテンツ視聴傾向情報と前記多数者嗜好情報とに基づいて、前記視聴者の嗜好を推定する推定過程を有する、情報処理方法である。
(8)また、本発明の一態様は、情報処理装置のコンピューターに、視聴者がコンテンツを視聴した履歴を示す視聴履歴情報とコンテンツに紐づけられた属性情報を示すコンテンツ属性情報とが関連付けられたコンテンツ視聴傾向情報を取得する手順と、多数者についての嗜好を示す多数者嗜好情報であって、前記コンテンツ属性情報に関連付けられた多数者嗜好情報を取得する手順と、前記コンテンツ視聴傾向情報と前記多数者嗜好情報とに基づいて、前記視聴者の嗜好を推定する推定手順と、を実行させるためのプログラムである。
本発明によれば、視聴者の嗜好の推定における推定精度を向上させることができる。
本実施形態に係る情報処理システムの一例を示す概略図である。 本実施形態に係る端末装置の構成の一例を示すブロック図である。 本実施形態に係る視聴履歴データのテーブルの一例を示す図である。 本実施形態に係る情報処理装置の構成の一例を示すブロック図である。 本発明の第1の実施形態に係るコンテンツ属性データのテーブルの一例を示す図である。 本発明の第1の実施形態に係るコンテンツ視聴傾向データのテーブルの一例を示す図である。 本実施形態に係るアンケート調査項目の構成(設問)の一例を示す図である。 本実施形態に係る統計データのテーブルの一例を示す図である。 本実施形態に係る視聴嗜好関連性データのテーブルの一例を示す図である。 本実施形態に係る嗜好推定結果データのテーブルの一例を示す図である。 本実施形態に係る情報処理装置の動作の一例を示すフローチャートである。 本発明の第2の実施形態に係るコンテンツ属性データのテーブルの一例を示す図である。 本発明の第2の実施形態に係るコンテンツ視聴傾向データのテーブルの一例を示す図である。
(第1の実施形態)
本発明の第1の実施形態について、図面を参照しながら説明する。
図1は、本実施形態に係る情報処理システムの一例を示す概略図である。
第1の実施形態の情報処理システム1は、端末装置11と、情報処理装置21と、コンテンツ属性情報提供事業者31と、統計情報提供事業者41と、レコメンド事業者51と、を含んで構成される。
端末装置11は、視聴者がコンテンツを視聴した履歴を示す視聴履歴データであってコンテンツを示すコンテンツ情報を含む視聴履歴データを生成し、情報処理装置21へ出力する。コンテンツ属性情報提供事業者31は、コンテンツ情報に紐づけられた属性情報を示すコンテンツ属性データを、情報処理装置21へ提供する。統計情報提供事業者41は、多数者についての嗜好を示す視聴嗜好関連性データ(多数者嗜好情報)であってコンテンツ属性情報に関連付けられた視聴嗜好関連性データを、情報処理装置21へ提供する。
情報処理装置21は、コンテンツ情報に基づいて、端末装置11から取得した視聴履歴データとコンテンツ属性データを関連付けることで、コンテンツ視聴傾向データを生成する。情報処理装置21は、コンテンツ属性データに基づいて、コンテンツ視聴傾向データと視聴嗜好関連性データとを関連付け、関連付けた情報に基づいて、ある視聴者の嗜好を推定する。
これにより、情報処理装置21は、コンテンツ属性情報のみならず、視聴嗜好関連性データ(多数者嗜好情報)を用いて、視聴者の嗜好を推定できるので、視聴者の嗜好の推定における推定精度を向上させることができる。
以下、詳細について説明をする。
本実施形態における「コンテンツ」とは、映像、音声、文字列、またはそれらの組み合わせ、等であるメディアの中身の情報である。また、コンテンツは、例えば、放送事業者が提供するテレビジョン放送番組やラジオ放送番組を構成する情報である。また、コンテンツは、例えば、CP(Contents Provider;コンテンツプロバイダー)等が提供するインターネットコンテンツ等を構成する情報のような、通信ネットワークを経由して伝送される情報も含まれる。
なお、以下において、通信ネットワークとは、例えば、公衆無線通信網(PLMN:Public Land Mobile Network)、PHS(Personal Handy−phone System)網、VPN(Virtual Private Network)、専用通信回線、WAN(Wide Area Network;広域通信網)、LAN(Local Area Network;構内通信網)、PSTN(Public Switched Telephone Neteork;公衆交換電話網)等のいずれか、またはそれらの組み合わせ、で構成される情報通信網のことをいう。通信ネットワークによるデータの伝送形態は、無線、有線、またはそれらの組み合わせ、のいずれの伝送形態でもよい。
端末装置11とは、例えば、コンテンツを配信する事業者が有するコンテンツ配信装置(図示せず。例えば、放送局の送信基地局)によって符号化され、配信された、コンテンツを示すデータを受信する。
端末装置11は、その受信したデータを復号してコンテンツを取得する。そして、端末装置11は、例えば、自端末装置11が備える映像表示部(図示せず)に、そのコンテンツを構成する映像、文字、またはその両方を表示する。または端末装置11は、例えば、自端末装置11に接続された装置(図示せず)が備える映像表示部等に、そのコンテンツを構成する映像、文字、またはその両方を表示させる。
また、端末装置11は、例えば、自端末装置11が備える音声再生部(図示せず)によって、そのコンテンツを構成する音声を再生する。または端末装置11は、例えば、自端末装置11に接続された装置(図示せず)が備える音声再生部等に、そのコンテンツを構成する音声を再生させる。
端末装置11は、例えば、テレビ受信機、多機能携帯電話機(いわゆる、スマートフォンを含む)、フィーチャーフォン、個人情報端末装置(PDA;Personal Digital Assistant)、タブレット型情報端末、パーソナルコンピューター、カーナビゲーションシステム、チューナー専用の機器(TVチューナー、ラジオチューナー)、等である。
なお、映像表示部とは、ディスプレイ、例えば、液晶ディスプレイ、有機EL(Electroluminescence)ディスプレイ、等を含んで構成される。また、音声出力部とは、音響信号に基づく音を再生する拡声器、例えば、各種のスピーカー、ヘッドフォン、等を含んで構成される。
また、端末装置11は、例えば、自端末装置11が備える記憶部(図示せず)に、そのコンテンツを構成する映像、音声、文字列、またはそれらの組み合わせ、を示すデータを記憶する。または端末装置11は、例えば、自端末装置11に接続された装置(図示せず)が備える記憶部等に、そのコンテンツを構成する映像、音声、文字列、またはそれらの組み合わせ、を示すデータを記憶させる。
端末装置11は、例えば、ハードディスク・レコーダー(Harddisk recorder)、ブルーレイ・ディスクレコーダー(Blu−ray Disc recorder)(登録商標)、DVDレコーダー(Digital Versatile Disc recorder)、ビデオテープ・レコーダー(Videotape recorder)、メディア・サーバー(Media server)、等であってもよい。
なお、記憶部とは、記憶媒体、例えば、HDD(Hard Disk Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory;読み出し専用メモリ)、RAM(Random Access read/write Memory;読み書き可能なメモリ)、またはそれらの組み合わせ、を含んで構成される。
なお、以下においては、「表示」とは、視覚を通じて認知できるようにコンテンツを表現することを示すものとする。また、「再生」とは、聴覚を通じて認知できるようにコンテンツを表現することを示すものとする。
また、「視聴」とは、視覚で認知すること、聴覚で認知すること、またはその両方、を含むものとする。さらに、「視聴」とは、以下に示す1)〜3)の状態のうち、少なくともいずれか1つに該当している状態も含むものとする。
1)視覚で認知できるように表現されたコンテンツが、映像表示部に表示されること。
2)聴覚で認知できるように表現されたコンテンツが、音声再生部で再生されること。
3)視覚、聴覚、またはその両方で認知できるように表現されたコンテンツが、記憶部に記憶されること。
「視聴者」とは、端末装置11が受信したコンテンツを視聴(認知)する者、映像表示部にコンテンツを表示させる者、または音声再生部によってコンテンツをさせる者、を示すものとする。
また、端末装置11は、視聴者が視聴したコンテンツの、タイトル(例えば、番組タイトル)、コンテンツ提供事業者(例えば、放送局(チャンネル))、視聴開始時刻、視聴時間、等のコンテンツ属性情報を記録する。端末装置11は、そのコンテンツ属性情報に基づいて構成される視聴履歴データを生成する。なお、視聴履歴データの構成については、後述する。
なお、端末装置11は、例えば、放送事業者が有する送信基地局から、デジタル放送の番組データを構成する映像データ、及び音声データ、とともに多重化されて伝送される番組構成情報の1つである、SI情報(Service Information;番組配列情報)を利用して作られるEPG(Electronic Program Guide;電子番組ガイド)からコンテンツ属性情報を取得することによって、視聴履歴データを生成してもよい。
端末装置11は、生成した視聴履歴データを、例えば、インターネット等の通信ネットワークを介して、情報処理装置21に送信する。
端末装置11は、新たに生成した視聴履歴データを、所定時間(例えば、30分)間隔で、情報処理装置21に送信する。
情報処理装置21とは、公知のサーバー機能を備えるサーバー装置である。
なお、情報処理装置21は、例えば、後述するコンテンツ属性情報提供事業者31、統計情報提供事業者41、レコメンド事業者51、コンテンツを配信する事業者(図示せず。例えば、放送事業者)、等が有する設備を構成するサーバー装置であってもよい。
または、情報処理装置21は、端末装置11の中に組み込まれた情報処理部であってもかまわない。
コンテンツ属性情報提供事業者31とは、各コンテンツとコンテンツ属性情報とが関連付けられたコンテンツ属性データを生成したり、外部から入手したりする。そして、コンテンツ属性情報提供事業者31は、コンテンツ属性データを、例えば、インターネット等の通信ネットワーク等を介して、事業者や個人等に提供する。また、コンテンツ属性情報提供事業者31は、例えば、番組関連情報をインターネットを介して提供する。なお、コンテンツ属性データの構成については、後述する。
コンテンツ属性情報とは、例えば、コンテンツのジャンル、コンテンツの出演者、コンテンツに関するキーワード、等の情報である。ジャンルとは、例えば、「報道」、「アニメ」、、「グルメ」、「映画」、または「旅行」、等の、コンテンツに含まれる内容に基づいてコンテンツを分類するための区分である。
コンテンツ属性情報提供事業者31は、コンテンツ属性データを、情報処理装置21に送信する。
統計情報提供事業者41とは、不特定多数の視聴者(以下、不特定多数者と称する)がよく視聴するコンテンツのコンテンツ属性情報(例えば、コンテンツのジャンル等)と、不特定多数者の嗜好を示す情報と、が関連付られた統計情報を示す統計データを生成したり、または外部から入手したりする。そして、統計情報提供事業者41は、例えば、インターネット等の通信ネットワーク等を介して、その統計データを各事業者や個人等に対して提供する。統計情報提供事業者41は、例えば、インターネット・リサーチや街頭インタビューを通じて得られたアンケート調査の調査結果等、統計情報を有する市場調査業者、等である。なお、統計データの構成については、後述する。
統計情報とは、例えば、不特定多数者へのアンケート調査に対する回答結果に含まれる情報、または、不特定多数者へのアンケート調査に対する回答結果に含まれる情報を解析するために一部集計や加工がなされた情報である。そのアンケート調査に含まれる設問は、例えば、不特定多数者の「趣味」、不特定多数者が「よく視聴する放送番組」、及び、「好きなタレント」等について回答を求める設問である。
統計情報提供事業者41は、統計データを、情報処理装置21に送信する。
情報処理装置21は、端末装置11が生成する視聴履歴データと、コンテンツ属性情報提供事業者31が提供するコンテンツ属性データと、統計情報提供事業者41が提供する統計データと、を取得する。情報処理装置21は、それらの取得したデータを互いに関連付けて、解析をすることによって視聴者の嗜好を推定する。そして、情報処理装置21は、その推定結果を示す情報と、当該視聴者を一意に特定するための識別情報と、が関連づけられた嗜好推定結果データ生成する。なお、嗜好推定結果データの構成については、後述する。
情報処理装置21は、生成した嗜好推定結果データを、例えば、インターネット等の通信ネットワークを介して、レコメンド事業者51に送信する。
レコメンド事業者51とは、情報処理装置21から取得した嗜好推定結果データに基づいて、当該嗜好を推定された視聴者に対して、コンテンツ等をレコメンドする事業者である。レコメンド事業者51は、例えば、視聴者に対し、おすすめ番組リストを送信することによって、放送番組をレコメンドする。なお、レコメンド事業者51は、レコメンドを主たる業務とする事業者であってもよいし、放送事業者、端末装置11の製造・販売・貸与等の事業を行う事業者、コンテンツ属性情報提供事業者31、統計情報提供事業者41、等であってもよい。
なお、「レコメンドする」とは、「勧める」、「推薦する」ことを意味する。例えば、レコメンド事業者51が、映画鑑賞を嗜好する視聴者であると推定された視聴者に対し、放送が予定されている「おすすめ映画番組」を紹介したり、更には、俳優「高山健(仮称)」を好む視聴者に対し、「高山健」が演じる映画番組を紹介したり、するための情報を示すデータを、端末装置11に送信するようなことである。また例えば、レコメンド事業者51が、パスタを好物としていると推定された視聴者に対し、当該視聴者の現地からの距離が300メートル以内にあるイタリア料理店のリストを、視聴者の端末装置11に送信するようなことである。その場合においては、端末装置11は、自端末装置11の位置を測位するためのGPS(Global Positioning System;全地球測位網)等の測位システムを備え、測位した自端末装置11の位置情報を、レコメンド事業者51に提供するためのシステムを備える必要がある。
以上に示した例も含めて、「レコメンドする」とは、レコメンド事業者51が視聴者に対して「勧める」、「推薦する」こと全般を意味するものとする。
なお、本実施形態においては、レコメンド事業者51は、視聴者に対し、コンテンツのレコメンドを行うが、コンテンツ以外のものまたはコンテンツ以外のことをレコメンドしてもよい。
コンテンツ以外のものまたはコンテンツ以外のこととは、例えば、広告に掲載される商品やサービスである。この場合におけるレコメンド事業者51は、例えば、広告代理店やインターネット広告事業者等である。広告代理店やインターネット広告事業者等は、取得した嗜好推定結果データに基づいて広告を生成し、その広告を当該視聴者に対し配信する。また、この場合における広告とは、例えば、バナー広告のような、視聴者が視聴する映像表示部(図示せず)の表示領域の一分に表示されるようなものであってもよい。
また、その他のコンテンツ以外のものまたはコンテンツ以外のこととは、例えば、通信販売等によって商取引がなされる商品、サービス、またはその両者である。この場合、レコメンド事業者51は、例えば通信販売事業者である。通信販売事業者は、取得した嗜好推定結果データに基づいて視聴者にレコメンドする商品、サービス、またはその両者、を選択し、レコメンドをする。
通信販売事業者がレコメンドする商品とは、例えば、本、日用品、衣類、及び電機製品、等の商品全般を指す。また、通信販売事業者がレコメンドするサービスとは、例えば、保険サービス、宅配サービス、旅行サービス、及びインターネットサービス、等のサービス全般を指す。
なお、レコメンド事業者51は、上述したような各種の事業者において、1つの事業者のみに限られるものではなく、複数の事業者の組み合わせによって構成される場合もある。複数の事業者の組み合わせによって構成されるレコメンド事業者51がレコメンドをする場合とは、例えば、嗜好推定結果データが示す情報が、視聴者が「結婚式」に興味があることを示す情報であった際に、ブライダル関連する複数の事業者、すなわち、結婚式場運営業者、貸衣装業者、写真撮影業者、及び旅行業者、等が、それぞれの商品やサービス(結婚式場、ウェディングドレス、カメラマン、新婚旅行プラン、等)を当該視聴者に対し、レコメンドするような場合も含む。
以上のように構成される情報処理システム1は、端末装置11が生成する視聴履歴データと、コンテンツ属性情報提供事業者31が提供するコンテンツ属性データと、統計情報提供事業者41が提供する統計データと、に基づいて、視聴者の嗜好を推定するシステムである。そして、情報処理システム1は、推定した結果に基づいて、当該視聴者に対し、様々なものまたは様々なことをレコメンドする。
(端末装置の構成)
次に、本実施形態に係る端末装置ついて説明する。
図2は、本実施形態に係る端末装置の構成の一例を示すブロック図である。端末装置11は、制御部111、チューナー(受信部)112、復号部113、分離部114、音声復号部115、音声再生部116、映像復号部117、GUI合成部118、映像表示部119、記憶部121、視聴履歴データ生成部122、送信部123、通信部131、及び操作入力部132、を含んで構成される。
制御部111は、コンピューター(CPU)を含み(図示せず)、記憶部121に格納されたソフトウェアを実行することで、端末装置11の上述の部材の種々の動作を制御する。
チューナー112は、コンテンツを配信する事業者が有するコンテンツ配信装置によって配信されたコンテンツを示す所望の搬送波チャネルの放送信号を受信する。
チューナー112は、放送信号をベースバンド信号であるトランスポートストリームに変換する。チューナー112は、トランスポートストリーム(多重化され暗号化されているストリーム)を復号部113に出力する。
また、チューナー112は、現在受信しているコンテンツを配信しているコンテンツ配信事業者(例えば、テレビジョン放送局(チャンネル))を示すデータ(搬送波に乗ったデータ)を取り出して、制御部111に出力する。
復号部113は、チューナー112から入力された多重化データ(暗号化されている)を復号し、復号した多重化データを生成する。その際、コンテンツ配信事業者が有する設備からコンテンツを示す多重化データが配信される際に、当該多重化データに対してなされる秘匿のための暗号化処理において用いられる暗号化方式に対応する復号方式(例えば、AES)によって、復号部113は復号をする。復号部113は、復号によって生成した多重化データを分離部114に出力する。
分離部114は、復号部113から入力された復号後の多重化データを、コンテンツを構成する映像、音声、またはそれらの組み合わせによる情報を示すデータ(以下、コンテンツデータとも称する)と、コンテンツを構成する文字情報、コンテンツの構成に関する情報、またはその両者を示すデータ(以下、コンテンツ構成データとも称する)と、に分離する。分離部114は、コンテンツ構成データを制御部111に出力する。
また、分離部114は、コンテンツデータから音声データと映像データを抽出する。分離部114は、抽出した音声データを音声復号部115に出力し、映像データを映像復号部117に出力する。
音声復号部115には、分離部114から音声データが入力される。入力された音声データは、所定の音声符号化方式(例えば、MPEG−4 オーディオ)で符号化されたデータである。音声復号部115は、符号化に用いられた符号化方式と対応する復号方式で入力された音声データを復号し、復号した音声データを生成する。復号した音声データは、各時刻における音声のレベルを示すデータである。
音声再生部116は、音声復号部115から入力された音声データに基づく音声を再生するものであり、例えば、スピーカーを含んで構成される。
映像復号部117は、分離部114から映像データが入力される。入力された映像データは、所定の映像符号化方式(例えば、HEVC、MPEG−2 ビデオ)で符号化されたデータである。映像復号部117は、符号化に用いられた符号化方式と対応する復号方式で入力された映像データを復号し、復号した映像データを生成する。復号した映像データは、各時刻における映像(フレーム画像)を形成する信号値を示すデータである。映像復号部117は、復号した映像データをGUI合成部118に出力する。
GUI(Graphical User Interface)合成部118は、映像復号部117から入力された映像データと、制御部111から入力された各種のGUI画面データとを合成し、映像表示部119に表示させる映像データを生成する。GUI画面データには、例えば、放送局(チャンネル)を選択するための選局画面データ、電子番組表(例えば、EPG)のデータ、その他の文字データ、等がある。そのほか、GUI画面データには、後述する、視聴に対してレコメンドをするためのレコメンド情報を示すデータ、等がある。
映像表示部119は、映像復号部117で復号された映像データによって生成される映像に、制御部111が生成したGUI画面データによって生成されるGUI画面の映像を、重ねるようにして表示させた(以下、重畳させたと称する)映像を表示する。映像表示部119は、上述したとおり、ディスプレイ、例えば、液晶ディスプレイ、有機ELディスプレイ、等を含んで構成される。
記憶部121は、各種のデータを記憶する。記憶部121は、記憶媒体、例えば、HDD、フラッシュメモリ、EEPROM、ROM、RAM、またはそれらの任意の組み合わせを含んで構成される。
視聴履歴データ生成部122は、視聴者が視聴したコンテンツの、タイトル、コンテンツ配信事業者(例えば、放送局(チャンネル))、視聴開始時刻、視聴時間、等の視聴履歴データを、記憶部121から取得する。そして、取得したデータに基づいて、視聴履歴データを生成する。視聴履歴データの構成については、後述する。
なお、上述したとおり、例えば、視聴履歴データ生成部122が、視聴履歴データを生成する場合において、分離部114が多重化データを分離して生成されるコンテンツ構成データに含まれるSI情報、すなわちEPGを構成する番組属性情報に基づいて、視聴履歴データの一部を構成してもよい。記憶部121が記憶する、上記視聴者が視聴したコンテンツの、タイトル、放送局(チャンネル)、視聴開始時刻、視聴時間、等のデータについては、制御部111が、チューナー112、及びコンテンツ構成データ、等から取得して記憶部121に記憶させる。
視聴履歴データ生成部122は、生成した視聴履歴データを、送信部123に出力する。
送信部123は、視聴履歴データ生成部122から入力された視聴履歴データを、例えば、インターネット等の通信ネットワーク等を介して、情報処理装置21に送信する。送信部123は、通信ネットワークに接続するための装置であり、すなわち、通信インターフェースである。送信部123は、例えば、LAN(Local Area Network;構内通信網)ケーブルを介して有線LANルーターに接続するための接続端子、またはWi−Fi(Wireless Fidelity)接続によって無線LANルーターに接続するための通信装置(無線LAN子機)である。
通信部131は、通信伝送路、例えば、インターネット等の通信ネットワーク等を介して、外部機器の間で、例えば、レコメンド事業者51が有する設備を構成するサーバー装置との間で、各種のデータを送受信する。
なお端末装置11の各構成部において発生する、情報処理装置21とのデータ送受信以外のデータ送受信は、通信部131を介して行われる。通信部131は、通信ネットワークに接続するための装置であり、すなわち、通信インターフェースである。通信部131は、例えば、LANケーブルを介して有線LANルーターに接続するための接続端子、またはWi−Fi接続によって無線LANルーターに接続するための通信装置である。なお、通信部131と送信部123とを統合して、1つの通信インターフェースとするように端末装置11を構成しても構わない。
操作入力部132は、視聴者による操作入力を受け付けることで生成される操作信号を取得し、取得した操作信号を制御部111に出力する。なお、操作入力部132が生成する操作信号とは、例えば、電源のオン/オフを示す信号、受信するコンテンツを選択するための信号(例えば、放送波のチャンネルを示す信号)、等も含まれる。
操作入力部132は、例えば、操作ボタン、リモートコントローラ、キーボード、マウス、携帯型情報端末、等の機器から送信された操作信号を受信する入力インターフェースである。
操作入力部132に操作信号を送信する機器は、例えば、リモートコントローラやキーボード等のように、ボタン、つまみ、等によって視聴者による操作を受け付け、対応する機能を示す操作入力信号を生成する操作部材を有する。そして、操作入力部132に操作信号を送信する機器は、その操作部材のそれぞれが、当該機器の表面上のそれぞれ異なる位置に配置された、ハードウェアで形成される専用の機器であってもよい。
また、操作入力部132に操作信号を送信する機器は、例えば、多機能携帯電話機(スマートフォンを含む)やタブレット型情報端末等のように、画像を表示する表示領域において接触物(例えば、視聴者の指)が接触した位置を検出するタッチセンサを備えたタッチパネルディスプレイ等の操作部材を有する。そして、操作入力部132に操作信号を送信する機器は、その操作部材からの入力信号に基づいて所定のプログラムを動作することによって、所望の機能を実現する多機能型の電子機器であってもよい。
(視聴履歴データの構成)
ここで、本実施形態に係る視聴履歴データの構成について説明する。
図3は、本実施形態に係る視聴履歴データのテーブルの一例を示す図である。図3に示すテーブルの1行目は、視聴履歴データを構成する各項目のデータの名称を示す項目名部分である。すなわち、視聴履歴データは、「視聴開始時刻」、「時間(秒)」、「放送局」、及び「タイトル」の4つの項目の列からなる2次元の表形式のデータである。図3に示すテーブルの2行目以下は、視聴履歴データの実データを示すデータ部分である。
図3に示すテーブルの2行目、つまり、視聴履歴データのデータ部分の1行目には、「視聴開始時刻」の項目に対する値には「2014−12−01 19:05:11」、「時間(秒)」の項目に対する値には「23」、「放送局」の項目に対する値には「ジャパンテレビ」、及び「タイトル」の項目に対する値には「サルも納得!法律相談所」、という内容のデータが記録されている。この行のデータは、「2014年12月01日の19時05分11秒から、23秒間の間、ジャパンテレビという放送局の、サルも納得!法律相談所というタイトルの放送番組を、視聴者が視聴した」ということを意味する。
すなわち、視聴履歴テーブルのデータ部分の各1行は、それぞれ視聴者による1回の視聴に相当する。
同様に、図3に示すテーブルの3行目、つまり、視聴履歴データのデータ部分の2行目には、「視聴開始時刻」の項目に対する値には「2014−12−01 19:05:34」、「時間(秒)」の項目に対する値には「72」、「放送局」の項目に対する値には「首都テレビ」、及び「タイトル」の項目に対する値には「未来文明ミステリー」、という内容のデータが記録されている。この行のデータは、「2014年12月01日の19時05分34秒から、72秒間の間、首都テレビという放送局の、未来文明ミステリーというタイトルの放送番組を、視聴者が視聴した」ということを意味する。
視聴履歴データのデータ部分の各行が示す視聴の始期は、視聴者が当該放送番組の視聴を開始した時点である。例えば、端末装置11の電源をオンにした時、他の放送局からチャンネルを変更した時、または当該放送番組が開始した時、等である。
また、視聴履歴データのデータ部分の各行が示す視聴の終期は、当該放送番組の視聴を終了した時点である。例えば、端末装置11の電源をオフにした時、他の放送局へチャンネルを変更した時、または当該放送番組が終了した時、等である。
(情報処理装置の構成)
次に、本実施形態に係る情報処理装置21の構成について説明する。
図4は、本実施形態に係る情報処理装置の構成の一例を示すブロック図である。情報処理装置21は、視聴履歴データ取得部211と、コンテンツ属性データ取得部212と、視聴傾向データ生成部213と、統計データ取得部214と、統計データ解析部215と、嗜好推定部216と、推定結果送信部217と、を備える。
視聴履歴データ取得部211は、端末装置11から視聴履歴データを取得する。視聴履歴データ取得部211は、取得した視聴履歴データを、視聴傾向データ生成部213に出力する。
コンテンツ属性データ取得部212は、コンテンツ属性情報提供事業者31から、コンテンツ属性データを取得する。コンテンツ属性データ取得部212は、取得したコンテンツ属性データを、視聴傾向データ生成部213に出力する。
(コンテンツ属性データの構成)
ここで、本発明の第1の実施形態に係るコンテンツ属性データの構成について説明する。
図5は、本発明の第1の実施形態に係るコンテンツ属性データのテーブルの一例を示す図である。図5に示すテーブルの1行目は、コンテンツ属性データを構成する各項目のデータの名称を示す項目名部分である。すなわち、コンテンツ属性データは、「タイトル」、及び「ジャンル」の2つの項目の列からなる2次元の表形式のデータである。図5に示すテーブルの2行目以下は、コンテンツ属性データの実データを示すデータ部分である。
図5に示すテーブルの2行目、つまり、視聴履歴データのデータ部分の1行目において、「タイトル」の項目に対する値には「サルも納得!法律相談所」、及び「ジャンル」の項目に対する値には「芸能」、という内容のデータが記録されている。この行のデータは、「サルも納得!法律相談所」というタイトルの放送番組が、「芸能」という放送番組のジャンルに属することを意味する。
同様に、図5に示すテーブルの3行目、つまり、視聴履歴データのデータ部分の2行目において、「タイトル」の項目に対する値には「未来文明ミステリー」、及び「ジャンル」の項目に対する値には「教育・教養」、という内容のデータが記録されている。この行のデータは、「未来文明ミステリー」というタイトルの放送番組が、「教育・教養」という放送番組のジャンルに属することを意味する。
なお、図5に例示するコンテンツ属性データにおいては、「タイトル」の項目に関連付けられた項目は「ジャンル」のみであるが、これに限られない。例えば、コンテンツ属性データは、「タイトル」の項目に対して、番組のコンテンツの「出演者」や「キーワード」等の項目もさらに関連付けられたデータであってもよい。
再び図4に戻って、本実施形態に係る情報処理装置21の構成について説明する。
視聴傾向データ生成部213は、視聴履歴データ取得部211から視聴履歴データを、コンテンツ属性データ取得部212からコンテンツ属性データを取得する。そして、視聴傾向データ生成部213は、視聴履歴データを構成するテーブル(図3)と、コンテンツ属性データを構成するテーブル(図5)とを、「タイトル」の項目に対する値を結合キーとして、テーブル結合をする。
例えば、図3に示すテーブルの2行目、つまり、視聴履歴データのデータ部分の1行目において、「視聴開始時刻」の項目に対する値には「2014−12−01 19:05:11」、「時間(秒)」の項目に対する値には「23」、「放送局」の項目に対する値には「ジャパンテレビ」、及び「タイトル」の項目に対する値には「サルも納得!法律相談所」、という内容のデータが記録されている。また一方、図5に示すテーブルの2行目、つまり、視聴履歴データのデータ部分の1行目において、「タイトル」の項目に対する値には「サルも納得!法律相談所」、及び「ジャンル」の項目に対する値には「芸能」、という内容のデータが記録されている。上記の双方の行のデータは、「タイトル」の項目に対する値がいずれも「サルも納得!法律相談所」という値であり、同一の値であるため、視聴傾向データ生成部213は、双方の行のデータを結合する。
したがって、結合した結果のデータは、図6に示す、コンテンツ視聴傾向データが示すテーブルの2行目の通りとなる。つまり、「視聴開始時刻」の項目に対する値には「2014−12−01 19:05:11」、「時間(秒)」の項目に対する値には「23」、「放送局」の項目に対する値には「ジャパンテレビ」、「タイトル」の項目に対する値には「サルも納得!法律相談所」、及び「ジャンル」の項目に対する値には「芸能」、という値でそれぞれ構成されるデータとなる。なお、コンテンツ視聴傾向データの構成については、後述する。
視聴傾向データ生成部213は、以上と同様の手順の処理を、視聴履歴データのデータ部分の全ての行に対して行うことにより、後述するコンテンツ視聴傾向データのテーブル(図6)が生成される。
以上により、視聴傾向データ生成部213は、「タイトル」の項目を結合キーとして、視聴履歴データのテーブルのデータ部分の各行に、コンテンツ属性データの「ジャンル」項目に対する値を結合することによって、視聴者がコンテンツを視聴したことを示す視聴履歴に関する情報と、そのコンテンツが属するジャンルと、が対応付けられたコンテンツ視聴傾向データを生成する。
視聴傾向データ生成部213は、上記で生成したコンテンツ視聴傾向データを、嗜好推定部216に出力する。
(コンテンツ視聴傾向データの構成)
ここで、本発明の第1の実施形態に係るコンテンツ視聴傾向データの構成について説明する。
図6は、本発明の第1の実施形態に係るコンテンツ視聴傾向データのテーブルの一例を示す図である。図6に示すテーブルの1行目は、コンテンツ視聴傾向データを構成する各項目のデータの名称を示す項目名部分である。すなわち、コンテンツ視聴傾向データは、「視聴開始時刻」、「時間(秒)」、「放送局」、「タイトル」、及び「ジャンル」の5つの項目の列からなる2次元の表形式のデータである。図6に示すテーブルの2行目以下は、コンテンツ視聴傾向データの実データを示すデータ部分である。
図6に示すテーブルの2行目、つまり、コンテンツ視聴傾向データのデータ部分の1行目には、「視聴開始時刻」の項目に対する値には「2014−12−01 19:05:11」、「時間(秒)」の項目に対する値には「23」、「放送局」の項目に対する値には「ジャパンテレビ」、「タイトル」の項目に対する値には「サルも納得!法律相談所」、及び「ジャンル」の項目に対する値には「芸能」、という内容のデータが記録されている。すなわち、この行のデータは、「2014年12月01日の19時05分11秒から、23秒間の間、ジャパンテレビという放送局の、サルも納得!法律相談所というタイトルであって、芸能というジャンルに属する放送番組を、視聴者が視聴した」ということを意味する。
同様に、図6に示すテーブルの3行目、つまり、コンテンツ視聴傾向データのデータ部分の2行目には、「視聴開始時刻」の項目に対する値には「2014−12−01 19:05:34」、「時間(秒)」の項目に対する値には「72」、「放送局」の項目に対する値には「首都テレビ」、「タイトル」の項目に対する値には「未来文明ミステリー」、及び「ジャンル」の項目に対する値には「教育・教養」、という内容のデータが記録されている。すなわち、この行のデータは、「2014年12月01日の19時05分34秒から、72秒間の間、首都テレビという放送局の、未来文明ミステリーというタイトルであって、教育・教養というジャンルに属する放送番組を、視聴者が視聴した」ということを意味する。
再び図4に戻って、本実施形態に係る情報処理装置21の構成について説明する。
統計データ取得部214は、上述の通り、例えば、統計情報提供事業者41等が有する設備を構成するサーバー装置等から統計データを取得する。統計データ取得部214は、取得した統計データを、統計データ解析部215に出力する。
本実施形態においては、統計データは、例えば、統計情報提供事業者41、または統計情報提供事業者41に提供される統計データを生成する事業者、等が不特定多数者に対するアンケート調査を実施することによって得られるデータである。統計データの構成について説明をする前に、まず、統計データを生成するために行うアンケート調査項目の構成(設問)の例について説明する。なお、アンケート調査の実施方法については、例えば、アンケート回答用紙等の紙によってアンケート回答結果を回収する方法であってもよいし、または、デジタルテレビ受信機が備える双方向の通信機能等を通じて送信される電子データとしてアンケート回答結果を回収する方法であってもよい。
(アンケート調査項目の構成)
次に、本実施形態に係るアンケート調査項目の構成について説明する。
図7は、本実施形態に係るアンケート調査項目の構成(設問)の一例を示す図である。図7に示すように、このアンケート調査は、2つの設問によって構成される。
図7が示すアンケート調査の、1番目の設問内容は「Q1.興味があるものまたは興味があることを教えてください(複数選択可)」である。この設問に対する回答の選択肢は、「1.健康・医療」、「2.教育・育児」、・・・、「31.その他( )」であり、全31個の選択肢が用意されている。また、この設問の文には「(複数選択可)」と記載されていることから、不特定多数者は、この31個の選択肢の中から、複数個の回答を選択することができることを示している。
同様に、図7が示すアンケート調査の、2番目の設問内容は「よく見るテレビ番組のジャンルを教えてください(複数選択可)」である。この設問に対する回答の選択肢は、「1:報道」、「2:時事解説」、・・・、「17:各回毎に違う番組」であり、全17個の選択肢が用意されている。また、この設問の文には「(複数選択可)」と記載されていることから、不特定多数者は、この17個の選択肢の中から、複数個の回答を選択することができることを示している。
(統計データの構成)
次に、本実施形態に係る統計データの構成について説明する。
図8は、本実施形態に係る統計データのテーブルの一例を示す図である。図8に示すテーブルの1行目は、統計データを構成する各項目のデータの名称を示す項目名部分である。すなわち、統計データは、「回答者」、「Q1の回答結果」、及び「Q2の回答結果」の3つの項目の列からなる2次元の表形式のデータである。図8に示すテーブルの2行目以下は、統計データの実データを示すデータ部分である。
図8に示すテーブルの2行目、つまり、統計データのデータ部分の1行目には、「回答者」の項目に対する値には「回答者1」、「Q1の回答結果」の項目に対する値には「7.パソコン・インターネット」及び「9.映画鑑賞・ビデオ/DVD鑑賞」、そして「Q2の回答結果」の項目に対する値には「9:コメディ」及び「15:子供向け番組」、という内容のデータが記録されている。この行が示すデータは、「回答者1が、Q1の設問(すなわち、興味があるものまたは興味があることについて回答を求める設問)に対し、7.パソコン・インターネット、及び、9.映画鑑賞・ビデオ/DVD鑑賞、と回答し、Q2の設問(すなわち、よく見るテレビ番組について回答を求める設問)に対し、9:コメディ、及び、15:子供向け番組、と回答したことを意味する。
同様に、図8に示すテーブルの3行目、つまり、統計データのデータ部分の2行目には、「回答者」の項目に対する値には「回答者2」、「Q1の回答結果」の項目に対する値には「19.スポーツ」及び「22.旅行」、そして「Q2の回答結果」の項目に対する値には「12:スポーツ」、という内容のデータが記録されている。この行が示すデータは、「回答者1が、Q1の設問(すなわち、興味があるものまたは興味があることについて回答を求める設問)に対し、19.スポーツ、及び、22.旅行、と回答し、Q2の設問(よく見るテレビ番組について回答を求める設問)に対し、12:スポーツ、と回答したことを意味する。
なお、図8に示すテーブルの「回答者」の項目に記録される値のデータ形式については、回答者を一意に特定することができるデータ形式であれば、図8に例示したデータ形式には限られない。例えば、図8に示すテーブルの「回答者」の項目に記録される値のデータ形式は、不特定多数者の氏名を示す文字列を含んだデータ形式(例えば、「suzuki001」等)であってもよいし、固定長の英数字からなる任意の文字列によって示される回答者ID(identifier;識別子)のようなデータ形式でもよい。
再び図4に戻って、本実施形態に係る情報処理装置21の構成について説明する。
統計データ解析部215は、統計データ取得部214から統計データを取得する。統計データ解析部215は、取得した統計データを解析して、不特定多数者の嗜好と不特定多数者のコンテンツの視聴傾向との関連性に関する情報を示すデータである、視聴嗜好関連性データを生成する。
統計データ解析部215は、例えば、以下のような手法に基づいて統計データを解析し、視聴嗜好関連性データを生成する。なお、統計データ解析部215が、不特定多数者の嗜好と、不特定多数者のコンテンツの視聴傾向と、の関連性を導き出す手法については、以下に示す手法に限られない。以下に示す手法以外の手法として、例えば、統計データ解析部215は、相関分析等の一般的な統計解析の手法に基づいて、不特定多数者の嗜好と、不特定多数者のコンテンツの視聴傾向と、の関連性を導き出してもよい。
統計データ解析部215は、まず例えば、図8の統計データのテーブルにおいて、「Q1の回答結果」の項目に対する値が、「1.健康・医療」のみ、である全ての行のデータを抽出する。図8に図示している統計データにおいて、「Q1の回答結果」の項目に対する値が「1.健康・医療」のみである行とは、例えば、図8のテーブルの4行目の、「回答者」の項目に対する値が「回答者3」である行がそれに該当する。したがって、統計データ解析部215は、この行のデータを抽出対象とする。そして、統計データ解析部215は、統計データ全体の中で、上記に該当する全ての行のデータを抽出した後、その抽出した行の行数(以下、第1の行数と称する)を集計する。
次に、統計データ解析部215は、上記で抽出した行のデータの中で、「Q2の回答結果」の項目に対する値が「1:報道」のみ、である行の行数(以下、第2の行数と称する)を集計する。
そして、統計データ解析部215は、第2の行数を第1の行数で除算する。
以上により、「Q1の回答結果」の項目に対する値が「1.健康・医療」のみ、である全ての行のデータの中で、「Q2の回答結果」の項目に対する値が「1:報道」のみ、である行の割合が算出される。すなわち、アンケート調査における設問「Q1」に対し「1.健康・医療」のみ、と回答した回答者の中で、設問「Q2」に対し「1.報道」のみ、と回答した回答者の割合(以下、第1の割合と称する)を算出する。
統計データ解析部215は、上記と同様の手順に従って、今度は、「Q1の回答結果」の項目に対する値が「1.健康・医療」のみ、ではない全ての行のデータ(すなわち、上記の手順において、抽出されなかった行のデータ)について集計をする。すなわち、アンケート調査における設問「Q1」に対し「1.健康・医療」のみ、と回答した回答者以外の回答者の中で、設問「Q2」に対し「1.報道」のみ、と回答した回答者の割合(以下、第2の割合と称する)を算出する。
次に、統計データ解析部215は、「Q1の回答結果」の項目に対する値である「1.健康・医療」と、「Q2の回答結果」の項目に対する値である「1:報道」と、の間の関連性の有無を判定する。なお、「Q1の回答結果」の項目に対する値と、「Q2の回答結果」の項目に対する値と、の間に「関連性が有ると判定する」、とは、例えば、図7に示すアンケート調査において、「Q1」の設問に対して「1.健康・医療」と回答した回答者は、「Q2」の設問に対して「1.報道」と回答し易い(回答する可能性が高い)、と判定をすることである。以下、このような判定がなされていることを、「正の関連性がある」と言うことがある。
また、「Q1の回答結果」の項目に対する値と、「Q2の回答結果」の項目に対する値と、の間に「関連性が有ると判定する」、とは、例えば、図7に示すアンケート調査において、「Q1」の設問に対して「1.健康・医療」と回答した回答者は、「Q2」の設問に対して「1.報道」と回答し難い(回答する可能性が低い)、と判定をすることである。以下、このような判定がなされていることを、「負の関連性がある」と言うことがある。
また、「Q1の回答結果」の項目に対する値と、「Q2の回答結果」の項目に対する値と、の間に「関連性が無いと判定する」、とは、例えば、図7に示すアンケート調査において、「Q1」の設問に対して「1.健康・医療」と回答した回答者は、「Q2」の設問に対して「1.報道」と回答し易いわけではないが、しかし、回答し難いわけでもない、つまり、どちらでもない(回答する可能性は、特段、高くもなく、低くもない)、と判定をすることである。
統計データ解析部215は、上記で説明した、第1の割合と第2の割合との間の数値を比較することによって、「Q1の回答結果」の項目に対する値と、「Q2の回答結果」の項目に対する値と、の間の関連性の有無を判定する。但し、関連性の有無を判定する手法は、以下の方法には限られない。
まず、統計データ解析部215は、第1の割合を第2の割合で除算する。統計データ解析部215は、その除算した結果の値が、予め定めた閾値(以下、上方の閾値Aと称する)より大きい場合には、「Q1の回答結果」の項目に対する値である「1.健康・医療」と、「Q2の回答結果」の項目に対する値である「1:報道」と、の間に、正の関連性がある、と判定する。すなわち、図7のアンケート調査における、「Q1」及び「Q2」の設問の内容が示すように、「1.健康・医療」のみ、に興味がある不特定多数者は、「1:報道」のジャンルに属するコンテンツを視聴することが多い、と判定することを意味する。
また、逆に、統計データ解析部215が除算した結果の値が、予め定めたもう1つの閾値(以下、下方の閾値Aと称する)より小さい場合には、「Q1の回答結果」の項目に対する値である「1.健康・医療」と、「Q2の回答結果」の項目に対する値である「1:報道」と、の間に、負の関連性がある、と判定する。すなわち、図7のアンケート調査における、「Q1」及び「Q2」の設問の内容が示すように、「1.健康・医療」のみ、に興味がある不特定多数者は、「1:報道」のジャンルに属するコンテンツを視聴することが少ない、と判定することを意味する。
また、統計データ解析部215が除算した結果の値が、上方の閾値Aよりは小さいが、下方の閾値Aよりは大きい、という場合には、「Q1の回答結果」の項目に対する値である「1.健康・医療」と、「Q2の回答結果」の項目に対する値である「1:報道」と、の間には、関連性がない、と判定する。
なお、例えば、上方の閾値Aには「2」を、下方の閾値Aには「0.5」を、予め設定しておく。
上記において、まず、統計データ解析部215は、「Q1の回答結果」の項目に対する値である「1.健康・医療」と、「Q2の回答結果」の項目に対する値である「1:報道」と、の間の関連性の有無を判定した。
以降、続けて、統計データ解析部215は、図8のテーブルの「Q1の回答結果」の項目に対する値として存在している全ての値と、「Q2の回答結果」の項目に対する値として存在している全ての値と、の間それぞれの相互の関連性についても、順番に、上記と同様の手順にしたがって、判定をしていく。
以上により、統計データ解析部215は、統計データに基づいて、嗜好とコンテンツの視聴割合と、の関連性を示す視聴嗜好関連性データを生成する。
(視聴嗜好関連性データの構成)
ここで、本実施形態に係る視聴嗜好関連性データの構成について説明する。
図9は、本実施形態に係る視聴嗜好関連性データのテーブルの一例を示す図である。図9に示すテーブルの1行目は、視聴嗜好関連性データを構成する各項目のデータの名称を示す項目名部分である。すなわち、視聴嗜好関連性データは、「嗜好」、「視聴割合が多いジャンル」、及び「視聴割合が少ないジャンル」の3つの項目の列からなる2次元の表形式のデータである。図9に示すテーブルの2行目以下は、視聴嗜好関連性データの実データを示すデータ部分である。
図9に示すテーブルの2行目、つまり、視聴嗜好関連性データのデータ部分の1行目において、「嗜好」の項目に対する値には「7.パソコン・インターネット」及び「9.映画鑑賞・ビデオ/DVD鑑賞」、「視聴割合が多いジャンル」の項目に対する値には「9:コメディ」及び「15:子供向け番組」、という内容のデータがそれぞれ記録されている。また、「視聴割合が少ないジャンル」の項目に対する値には、データが何も記録されていない。すなわち、この行のデータは、「嗜好」の項目に対する値が「7.パソコン・インターネット」及び「9.映画鑑賞・ビデオ/DVD鑑賞」であることと、「視聴割合が多いジャンル」の項目に対する値が「9:コメディ」及び「15:子供向け番組」であることと、の間に、正の関連性がある、ということを意味する。一方、「視聴割合が少ないジャンル」の項目に対する値には、データが何も記録されていないため、「7.パソコン・インターネット」及び「9.映画鑑賞・ビデオ/DVD鑑賞」と、負の関連性があるジャンルはとくに存在しない、ということを意味する。
同様に、図9に示すテーブルの4行目、つまり、視聴嗜好関連性データのデータ部分の3行目において、「嗜好」の項目に対する値には「1.健康・医療」、「視聴割合が多いジャンル」の項目に対する値には「7:時代劇」、及び「視聴割合が少ないジャンル」の項目に対する値には「15:子供向け番組」、という内容のデータが記録されている。すなわち、この行のデータは、「嗜好」の項目に対する値が「1.健康・医療」であることと、「視聴割合が多いジャンル」の項目に対する値が「7:時代劇」であることと、の間に、正の関連性があるといこうことを意味する。また同様に、この行のデータは、「嗜好」の項目に対する値が「1.健康・医療」であることと、「視聴割合が少ないジャンル」の項目に対する値が「7:子供向け番組」であることと、の間に、負の関連性がある、ということを意味する。
再び図4に戻って、本実施形態に係る情報処理装置21の構成について説明する。
嗜好推定部216は、視聴傾向データ生成部213から取得したコンテンツ視聴傾向データと、統計データ解析部215から取得した視聴嗜好関連性データと、に基づいて、視聴者の「嗜好」を推定する。
まず、嗜好推定部216は、取得したコンテンツ視聴傾向データを参照する。ここでは、参照したデータは、図6に示すコンテンツ視聴傾向データであったものとする。嗜好推定部216は、このコンテンツ視聴傾向データから、視聴者による視聴割合が多いジャンル、及び視聴割合が少ないジャンル、を確認する。
なお、視聴割合が多い、もしくは、視聴割合が少ない、と判定する基準については、例えば、視聴者による、ジャンル毎のコンテンツの「視聴時間」に基づいて判定するものであってもよいし、「視聴頻度(回数)」などに基づいて判定するもの等であってもよい。以下、本実施形態においては、視聴者の、ジャンル毎のコンテンツの「視聴時間」に基づいて、視聴割合が多い、もしくは、視聴割合が少ない、もしくは、どちらでもない、と判定することとする。
嗜好推定部216は、コンテンツ視聴傾向データの「時間(秒)」の項目に対する値と、及び「ジャンル」の項目に対する値と、に基づいて、コンテンツの各ジャンル毎の合計視聴時間を算出する。算出の方法については、以下のとおりである。
嗜好推定部216は、コンテンツ視聴傾向データを参照し、例えば、ジャンルの値が同一のコンテンツ毎に、視聴者が視聴した各コンテンツの視聴時間の値をそれぞれ合算をすることによって、コンテンツのジャンル毎の当該視聴者による合計視聴時間を算出することができる。すなわち、嗜好推定部216は、図6に例示するコンテンツ視聴傾向データにおいて、「ジャンル」の項目に対する値が同一である行の、「時間(秒)」の項目に対する値を合算することによって、当該視聴者の、放送番組のジャンル毎の視聴時間を算出することができる。
例えば、図6に例示するコンテンツ視聴傾向データの場合において、当該視聴者による「芸能」のジャンルに属する放送番組の合計視聴時間を算出するためには、「ジャンル」の項目に対する値が「芸能」である行すべてについて、当該行の「時間(秒)」の項目に対する値を合算すればよい。すなわち、図6に示すテーブルの2行目、及び9行目の「ジャンル」の項目に対する値が「芸能」であるので、視聴傾向データ生成部213は、図6に示すテーブルの2行目の「時間(秒)」に対する値である「23」と、9行目の「時間(秒)」に対する値である「206」とを合算する。したがって、「23(秒)+206(秒)=239(秒)」と算出されることから、当該視聴者による「芸能」のジャンルに属する放送番組の合計視聴時間は、「239(秒)」、すなわち、3分59秒であることが分かる。
同様に、図6に例示するコンテンツ視聴傾向データの場合において、当該視聴者による「教育・教養」のジャンルに属する放送番組の合計視聴時間を算出するためには、「ジャンル」の項目に対する値が「教育・教養」である行すべてについて、当該行の「時間(秒)」の項目に対する値を合算すればよい。すなわち、図6に示すテーブルの3行目、5行目、6行目、7行目、及び8行目の「ジャンル」の項目に対する値が「教育・教養」であるので、視聴傾向データ生成部213は、図6に示すテーブルの3行目の「時間(秒)」に対する値である「72」と、5行目の「時間(秒)」に対する値である「1,510」と、6行目の「時間(秒)」に対する値である「183」と、7行目の「時間(秒)」に対する値である「1,142」と、8行目の「時間(秒)」に対する値である「18」とを合算する。したがって、「72(秒)+1,510(秒)+183(秒)+1,142(秒)+18(秒)=2,925(秒)」と算出されることから、当該視聴者による「教育・教養」のジャンルに属する放送番組の合計視聴時間は、「2,925(秒)」、すなわち、48分45秒であることが分かる。
以上により、嗜好推定部216は、各ジャンル毎の合計視聴時間を算出することができきる。
また、嗜好推定部216は、コンテンツ視聴傾向データに記録されている全ての「時間(秒)」の項目に対する値の合計値(すなわち、全視聴時間)を算出する。例えば、図6のテーブルの、「時間(秒)」の項目に対する値について、データ部分を示す2行目以降の値を全て合算する。すなわち、「23+72+12+1,510+183+1,142+18+206+3,459+・・・」の値を算出する。
そして、嗜好推定部216は、各ジャンル毎の合計視聴時間を全視聴時間で除算する。それにより、嗜好推定部216は、視聴者の全視聴時間における各ジャンル毎の合計視聴時間の割合(以下、ジャンル別視聴割合と称する)を算出することができる。
嗜好推定部216は、視聴者の各ジャンルのジャンル別視聴割合の値を参照する。そして、嗜好推定部216は、あるジャンルのジャンル別視聴割合の値が、予め定めた閾値(以下、上方の閾値Bと称する)よりも大きかったならば、当該ジャンルは、「視聴割合が多い」ジャンルであると判定する。また、嗜好推定部216は、あるジャンル別視聴割合の値が、予め定めたもう1つの閾値(以下、下方の閾値Bと称する)よりも小さかったならば、当該ジャンルは、「視聴割合が少ない」ジャンルであると判定する。また、嗜好推定部216は、あるジャンル別視聴割合の値が、上方の閾値Bよりは小さいが、、下方の閾値Bよりは大きかったならば、当該ジャンルは、「視聴割合が多い」ジャンルでもなく、かつ、「視聴割合が少ない」ジャンルでもない、すなわち、どちらでもないジャンルであると判定する。
そして、嗜好推定部216は、全てのジャンルについて上記の判定を行い、当該視聴者についての、「視聴割合が多い」ジャンル、及び「視聴割合が少ない」ジャンルを抽出する。
なお、上記の説明においては、嗜好推定部216は、ある視聴者の視聴時間全体に対する、当該視聴者のジャンル毎の視聴時間を算出することで、視聴割合が多い、視聴時間が少ない、または、どちらでもない、のいずれに該当するかを判定した。但し、判定の手法は、上記に示した手法に限られるものではない。
例えば、当該視聴者だけでなく、不特定多数者における平均のジャンル別視聴割合のデータを入手することが可能である場合には、嗜好推定部216は、当該視聴者のジャンル別視聴割合の値を、不特定多数者のジャンル別視聴割合の値で、除算をする。それによって、より客観的に、当該視聴者の各ジャンルのコンテンツに対する視聴割合が多いか、少ないか、または、どちらでもないか、を判定することが可能になる。なぜならば、コンテンツのジャンルには、不特定多数者に視聴され易いジャンル、または、不特定多数者に視聴され難いジャンル、等のジャンル毎の特徴が存在するためである。
したがって、極端な場合においては、例えば、どの視聴者も一律に「ニュース」のジャンルのコンテンツの視聴割合が多い、という判定結果になってしまうようなこともありうる。そこで、例えば、嗜好推定部216は、ジャンル別視聴割合の値に対して、コンテンツのジャンル毎に予め定めたパラメーター値で重みづけをした後に、閾値との値の比較をするようにしてもよい。すなわち、不特定多数者に視聴され易いジャンル(例えば、誰もが見るコンテンツのジャンル)については、パラメーター値を小さくすることによって重みを小さくし、逆に、不特定多数者に視聴され易いジャンル(例えば、ある特定の層の人のみが見るコンテンツのジャンル)については、パラメーター値を大きくすることによって重みを大きくする。
なお、上記の重みづけをするためのパラメーター値を決める手法については、例えば、
文書内のキーワードの重みづけをするための公知の手法である、IDF(Inverse Document Frequency;逆文書頻度)の値を算出し、それをパラメーター値に反映させるような手法であってもよい。
ここで、IFD値の算出方法について説明する。情報処理装置21は、アンケート回答結果データの総数(すなわち、統計データのデータ部分の行数)Nと、あるジャンルjが回答結果に含まれているアンケート回答結果データの数(すなわち、当該ジャンルjの出現頻度を示す数)njと、をカウントする。そして、情報処理装置21は、ジャンルj毎にlog(N/nj)をIDFとして算出する。以上により、IDFによれば、アンケート回答結果によく出現するジャンルほど値が大きくなり、アンケート回答結果にあまり出現しないジャンルほど値が小さくなる。
また、不特定多数者における平均のジャンル別視聴割合のデータとして、例えば、視聴率調査を実施するメディアリサーチ及びマーケティングリサーチ事業者等によって提供される調査データに基づいて算出したデータを利用してもよい。
以上の手順に従って嗜好推定部216が判定した結果として、例えば、当該視聴者の、視聴割合が多いジャンルは「3:教育・教養」であり、視聴割合が少ないジャンルは「30:パチンコ・パチスロ」であったものとする。
次に、嗜好推定部216は、統計データ解析部215から取得した視聴嗜好関連性データを参照する。なお、ここでは、図9に例示する視聴嗜好関連性データを参照したものとする。嗜好推定部216は、視聴嗜好関連性データにおいて、「視聴割合が多いジャンル」の項目に対する値が「3:教育・教養」であり、かつ、「視聴割合が少ないジャンル」に対する値が「30:パチンコ・パチスロ」であることを示すデータが存在していないかを検索する。
そして、嗜好推定部216は、図9に示すテーブルの13行目、つまり、視聴嗜好関連性データのデータ部分の12行目に、「視聴割合が多いジャンル」の項目に対する値が「3:教育・教養」であり、「視聴割合が少ないジャンル」の項目に対する値が「30:パチンコ・パチスロ」である行のデータが存在することを検知する。
嗜好推定部216は、検知した行のデータの「嗜好」の項目に対する値を参照し、その値が「12.語学、資格」、及び「17.リラクゼーション」であることを検知する。そして、嗜好推定部216は、その検知した結果に基づいて、検知した行の「嗜好」の項目に対する値である「12.語学、資格」及び「17.リラクゼーション」が当該視聴者の嗜好であると推定したことを示す嗜好推定結果データを生成する。
再び図4に戻って、本実施形態に係る情報処理装置21の構成について説明する。
嗜好推定部216は、推定結果が「12.語学、資格」及び「17.リラクゼーション」であることを示すデータと、当該視聴者を一意に特定するための識別子を示すデータ(例えば、視聴者ID)と、が関連付けられた嗜好推定結果データを生成し、推定結果送信部217に出力する。
なお、嗜好推定部216は、当該視聴者を一意に特定するための識別子を示すデータとして、例えば、端末装置11に記憶されているMACアドレス(Media Access Control address)を、情報処理装置21が端末装置11から取得するようにして、そのMACアドレスを用いてもよい。
また、もし嗜好推定部216が抽出した、当該視聴者についての「視聴割合が多い」ジャンル及び「視聴割合が少ない」ジャンル、と完全一致する値が、コンテンツ視聴傾向データが示す「視聴割合が多いジャンル」の項目に対する値、及び「視聴割合が少ないジャンル」に対する値、の中に存在しなかった場合には、嗜好推定部216は、「推定される嗜好は無し」という推定結果であることを示すデータ(例えば、「0」、「NONE」、NULL等)と、当該視聴者を一意に特定するための識別子を示すデータ(例えば、視聴者ID)と、が関連付けられた嗜好推定結果データを生成し、推定結果送信部217に出力する。
なお、推定結果を「推定される嗜好は無し」とする代わりに、嗜好推定部216が抽出した、当該視聴者についての「視聴割合が多い」ジャンル及び「視聴割合が少ない」ジャンル、の値と、コンテンツ視聴傾向データが示す「視聴割合が多いジャンル」の項目に対する値、及び「視聴割合が少ないジャンル」に対する値、とが、完全一致ではなく部分一致であった場合にも、当該視聴者の嗜好であると推定してもよい。
推定結果送信部217は、取得した嗜好推定結果データを、例えば、インターネット等の通信ネットワーク等を介して、レコメンド事業者51に送信する。
なお、情報処理装置21が有する、視聴履歴データ取得部211、コンテンツ属性データ取得部212、統計データ取得部214、及び推定結果送信部217の4つの通信インターフェースのうち、その全部または一部を統合して共通の通信インターフェースとするような構成にしても構わない。
レコメンド事業者51は、取得した嗜好推定結果データに基づいて、当該視聴者にレコメンドするコンテンツ(例えば、おすすめテレビ番組リスト等)等を生成する。そして、レコメンド事業者51は、例えば、インターネット等の通信ネットワーク、及び端末装置11等を介して、当該視聴者に対しコンテンツ等のレコメンドを行う。
(嗜好推定結果データの構成)
ここで、本実施形態に係る嗜好推定結果データの構成について説明する。
図10は、本実施形態に係る嗜好推定結果データのテーブルの一例を示す図である。図10に示すテーブルの1行目は、嗜好推定結果データを構成する各項目のデータの名称を示す項目名部分である。すなわち、嗜好推定結果データは、「視聴者ID」及び「趣味」の2つの項目の列からなる2次元の表形式のデータである。図10に示すテーブルの2行目は、視聴嗜好関連性データの実データを示すデータ部分である。
図10に示すテーブルの2行目、つまり、嗜好推定結果データのデータ部分において、「視聴者ID」の項目に対する値には「01−A2−34−5B−67−89」、「趣味」の項目に対する値には「語学、資格」及び「リラクゼーション」、という内容のデータが記録されている。すなわち、この行のデータは、視聴者IDが「01−A2−34−5B−67−89」である視聴者の嗜好を推定した結果が、「語学、資格」及び「リラクゼーション」である、ということを意味する。
なお、図10においては、ある1人の視聴者について嗜好を推定した結果を示す、データ部分が1行のみの嗜好推定結果データの例を示した。しかし、複数の視聴者のそれぞれの推定嗜好がリスト化された、データ部分が複数行である嗜好推定結果データを、情報処理装置21が出力するように構成してもよい。
(情報処理装置の動作)
次に情報処理装置21の動作について説明する。
図11は、本実施形態に係る情報処理装置の動作の一例を示すフローチャートである。
(ステップS101)まず、情報処理装置21が端末装置11から、視聴履歴データを受信したとき、図11のフローチャートが示す処理が開始される。
視聴履歴データ取得部211は、視聴履歴データを端末装置11から取得する。視聴履歴データ取得部211は、視聴履歴データを、視聴傾向データ生成部213に出力する。その後、ステップS102に進む。
(ステップS102)コンテンツ属性データ取得部212は、コンテンツ属性情報提供事業者31から、コンテンツ属性データを取得する。コンテンツ属性データ取得部212は、取得したコンテンツ属性データを、視聴傾向データ生成部213に出力する。その後、ステップS103に進む。
(ステップS103)視聴傾向データ生成部213は、視聴履歴データ取得部211から取得した視聴履歴データと、コンテンツ属性データ取得部212から取得したコンテンツ属性データと、に基づいて、コンテンツ視聴傾向データを生成する。視聴傾向データ生成部213は、両データに基づいて生成したコンテンツ視聴傾向データを、嗜好推定部216に出力する。その後、ステップS104に進む。
(ステップS104)統計データ取得部214は、統計情報提供事業者41から、統計データを取得する。統計データ取得部214は、取得した統計データを、統計データ解析部215に出力する。その後、ステップS105に進む。
(ステップS105)統計データ解析部215は、取得した統計データを解析して、不特定多数者の嗜好と不特定多数者のコンテンツの視聴傾向との関連性を示すデータである、視聴嗜好関連性データを生成する。統計データ解析部215は、生成した視聴嗜好関連性データを、嗜好推定部216に出力する。その後、ステップS106に進む。
(ステップS106)嗜好推定部216は、視聴傾向データ生成部213から取得したコンテンツ視聴傾向データに基づいて、コンテンツの各ジャンル毎に、ジャンル別視聴割合を算出する。ジャンル別視聴割合とは、上述のとおり、視聴者による各ジャンルのコンテンツの合計視聴時間を、視聴者によるコンテンツ全体の合計視聴時間で、除算することによって得られる値を示す。その後、ステップS107に進む。
(ステップS107)嗜好推定部216は、全てのジャンルの値に対して、順番に、閾値との比較を行う。嗜好推定部216は、各ジャンル別視聴割合の値が、予め定められた上方の閾値Bより大きいか否かを確認する。ジャンル別視聴割合の値が上方の閾値Bより大きい場合は、ステップS109に進む。ジャンル別視聴割合の値が上方の閾値Bより大きくない場合は、ステップ108に進む。
(ステップS108)嗜好推定部216は、ジャンル別視聴割合の値が、予め定められた下方の閾値Bより小さいか否かを確認する。ジャンル別視聴割合の値が下方の閾値Bより小さい場合は、ステップS110に進む。ジャンル別視聴割合の値が下方の閾値Bより小さくない場合は、ステップS111に進む。
(ステップS109)嗜好推定部216は、上方の閾値Bよりもジャンル別視聴割合の値が大きいジャンルを、当該視聴者の視聴割合が多いコンテンツのジャンルであると判定する。その後、ステップS111に進む。
(ステップS110)嗜好推定部216は、下方の閾値Bよりもジャンル別視聴割合の値が小さいジャンルを、当該視聴者の視聴割合が少ないコンテンツのジャンルであると判定する。その後、ステップS111に進む。
(ステップS111)嗜好推定部216は、全てのジャンルのジャンル別視聴割合の値について、閾値との比較が完了した場合は、ステップS112に進む。閾値の比較が完了していないジャンルがまだ残っているならば、ステップS107に戻って、閾値との比較の処理を続ける。
(ステップS112)嗜好推定部216は、ステップS106〜ステップS111の処理によって、視聴割合が多いコンテンツのジャンルであると判定したジャンル、及び視聴割合が少ないコンテンツのジャンルであると判定したジャンル、と一致する値を含む行を、データ解析部215から取得した視聴嗜好関連性データのテーブルにおいて検索する。
嗜好推定部216は、検索された行における、推定嗜好を示す項目に対する値を抽出する。嗜好推定部216は、視聴者の推定嗜好を示すデータと、視聴者を一意に特定するための識別するデータと、が関連付けられた嗜好推定結果データを、推定結果送信部217に出力する。その後、ステップS113に進む。
(ステップS113)
推定結果送信部217は、嗜好推定結果データを、レコメンド事業者51に送信する。その後、図11に示す処理を終了する。
以上説明したように、本実施形態によれば、情報処理装置21は、不特定多数者のコンテンツの視聴傾向に関する情報と、不特定多数者のコンテンツに限られない嗜好に関する情報と、が関連付けられた統計情報に、当該視聴者のコンテンツの視聴傾向に関する情報を照らし合わせることによって、視聴者の嗜好を推定する。
このように、不特定多数者の統計情報を用いることにより、情報処理装置21は、推定する時点での流行に影響されないように視聴者の嗜好を推定することで、視聴者の嗜好に関する推定精度を向上させ、かつ、コンテンツ及びコンテンツ以外のものまたはコンテンツ以外のことを視聴者に推薦することができる。
(第2の実施形態)
本発明の第2の実施形態について説明する。なお、以下の第2ないし第4の実施形態において、端末装置11(図2)及び情報処理装置(図4)の構成は同様であるが、ただし情報処理装置の機能が以下で説明するように相違するものとなっている。
第1の実施形態においては、情報処理装置21が、コンテンツ属性データとして、コンテンツ(のタイトル)とコンテンツ属性情報が関連付けられた、2次元の表形式のデータを用いる場合について説明した。第2の実施形態では、情報処理装置21が、コンテンツ属性データとして、XML形式によるデータ形式で記憶されたデータを用いる場合について説明する。XML(Extensible Markup Language)とは、データの意味や構造を記述するためのマークアップ言語の1つである。なお、XML形式によるデータ形式は、電子番組表(例えば、EPG)を構成するデータ等においても用いられるデータ形式である。
なお、第1の実施形態と共通する点については説明を省略する。
(コンテンツ属性データの構成)
以下に、本発明の第2の実施形態に係るコンテンツ属性データの構成について説明する。
図12は、本発明の第2の実施形態に係るコンテンツ属性データの構成の一例を示す概略図である。本実施形態におけるコンテンツ属性データは、コンテンツ(例えば、放送番組)を構成するコーナー毎に、XML形式によるデータ形式でコンテンツ属性情報を記憶している。
図11に図示するとおり、コンテンツ属性データは、データの意味や構造を記述するためのマークアップ言語の1つである、XML形式によるデータ形式で表記されたデータである。
図11の例では、コンテンツ属性データを形成する各要素が、タグで囲まれるデータ項目毎に設定されている。コンテンツ属性データが有するデータ項目「xml version“1.0”」は、XMLのバージョンが「1.0版」であることを示す。データ項目「encoding=“utf−8”」は、文字符号化方式が「utf−8」であることを示す。
データ項目「program end=“2014−12−01T20:54:00+0900”」は、放送終了時刻が「2014年12月01日 20時54分00秒」であって、その時刻が協定世界時(UTC:Coordinated Universal Time)よりも9時間先行した時刻であることを示す。
データ項目「genre=“3”」は、コンテンツのジャンルを示す符号が「3」であることを示す。なお、この符号「3」に対応付けられたコンテンツのジャンルは、本実施形態の説明の例においては「教育・教養」であるとする。
データ項目「networkid=“12345”」は、接続先であるネットワークのネットワークIDが「12345」であることを示す。
データ項目「programid=“246802”」は、その番組の番組IDが「246802」であることを示す。
データ項目「serviceid=“1001”」は、放送局情報を示すサービスIDが「1001」であることを示す。
データ項目「start=“2014−12−01T19:00:00+0900”」は、放送開始時刻が「2014年12月01日 19時00分00秒」であって、その時刻が協定世界時から9時間先行した時刻であることを示す。
データ項目「station=“サクラテレビジョン”」は、放送局名が「サクラテレビジョン」であることを示す。
データ項目「title=“世界びっくり映像ショー”」は、タイトルが「世界びっくり映像ショー」であることを示す。
「<cast>」と「</cast>」とで囲まれるデータ項目のそれぞれは、出演者名の情報を示すデータ項目である。例えば、「<cast>マイケル</cast>」は、その番組の出演者名が「マイケル」であることを示す。
データ項目「corner name=“(オープニング)”」は、コーナー名が「(オープニング)」であることを示す。
データ項目「topic name=“先週の世界びっくり映像ベスト作品” context=“ピレネー山脈にほど近いフランスの〜その奇妙な行動とは・・・?”」、は番組「世界びっくり映像ショー」内のコーナー「(オープニング)」を構成する記事のトピック名が「先週の世界びっくり映像ベスト作品」であって、その記事が「ピレネー山脈にほど近いフランスの・・・(中略)・・・震撼させたその奇妙な行動とは・・・?」であることを示す。
データ項目「end=“2014−12−01T19:27:30+0900” start=“2014−12−01T19:01:00+0900”」は、そのコーナーの終了時刻が「2014年12月01日19時27分30秒」、開始時刻が「2014年12月01日19時01分00秒」であって、それぞれの時刻が協定世界時よりも9時間先行した時刻であることを示す。
「<word>」と「</word>」とで囲まれるデータ項目のそれぞれは、キーワード情報を示すデータ項目である。例えば、「<word>フランス</word>」は、そのコーナーのキーワードが「フランス」であることを示す。
次に、再び図4を参照して、本実施形態の構成について説明する。
視聴傾向データ生成部213は、視聴履歴データ取得部211からは視聴履歴データ(図3)を、コンテンツ属性データ取得部212からは上記において説明したXML形式によるデータ形式で表記されたコンテンツ属性データ(図12)を、取得する。そして、視聴傾向データ生成部213は、視聴履歴データのデータ項目「タイトル」の値と、コンテンツ属性データのデータ項目「title」の値と、を結合キーとして、視聴履歴データのテーブルに、コンテンツ属性データの「genre」、「cast」、及び「word」、等の項目に対する値(データ)を結合する。それによって、視聴傾向データ生成部213は、不特定多数者の視聴傾向を示すコンテンツ視聴傾向データを生成する。
すなわち、第1の実施形態と同様に、視聴傾向データ生成部213は、コンテンツ毎の視聴時間等の情報を含む視聴履歴データと、各コンテンツが属するジャンル等を含んだコンテンツ属性情報を示すコンテンツ属性データと、を関連付けることによって、コンテンツ視聴傾向データを生成する。そして、視聴傾向データ生成部213は、生成したコンテンツ視聴傾向データを、嗜好推定部216に出力する。
(コンテンツ視聴傾向データの構成)
ここで、本発明の第2の実施形態に係るコンテンツ視聴傾向データの構成について説明する。
図13は、本発明の第2の実施形態に係るコンテンツ視聴傾向データのテーブルの一例を示す図である。図13に示すテーブルの1行目は、コンテンツ視聴傾向データを構成する各項目のデータの名称を示す項目名部分である。すなわち、本実施形態におけるコンテンツ視聴傾向データは、「視聴開始時刻」、「時間(秒)」、「放送局」、「タイトル」、「ジャンル」、「出演者」、「内容」、及び「キーワード」の8つの項目の列からなる2次元の表形式のデータである。図13に示すテーブルの2行目以下は、コンテンツ視聴傾向データの実データを示すデータ部分である。
図13に示すテーブルの2行目、つまり、本実施形態におけるコンテンツ視聴傾向データのデータ部分の1行目には、「視聴開始時刻」の項目に対する値には「2014−12−01 19:05:11」、「時間(秒)」の項目に対する値には「23」、「放送局」の項目に対する値には「ジャパンテレビ」、「タイトル」の項目に対する値には「サルも納得!法律相談所」、「ジャンル」の項目に対する値には「芸能」、「出演者」の項目に対する値には「鈴木一郎、田中次郎、佐藤甲美」、「内容」の項目に対する値には「<<オープニング>><必見!ちょっとおトクな法律のお話>えっ!そんなことが・・・?もしも知っていたら・・・(以下省略)」、及び「キーワード」の項目に対する値には「法律、税金」という内容のデータが記録されている。
すなわち、この行のデータは、「2014年12月01日の19時05分11秒から、23秒間の間、ジャパンテレビという放送局の、サルも納得!法律相談所というタイトルの放送番組を、視聴者が視聴した。そして、その放送番組は、芸能というコンテンツのジャンルに属する放送番組であり、鈴木一郎、田中次郎、及び佐藤甲美という出演者が出演する放送番組である。また、その放送番組の内容は、<<オープニング>><必見!ちょっとおトクな法律のお話>えっ!そんなことが・・・?もしも知っていたら・・・(以下省略)といった内容であり、この放送番組に関連するキーワードは、法律、及び税金である。」ということを意味する。
同様に、図13に示すテーブルの3行目、つまり、コンテンツ視聴傾向データのデータ部分の2行目には、「視聴開始時刻」の項目に対する値には「2014−12−01 19:05:34」、「時間(秒)」の項目に対する値には「72」、「放送局」の項目に対する値には「首都テレビ」、「タイトル」の項目に対する値には「未来文明ミステリー」、及び「ジャンル」の項目に対する値には「教育・教養」、という内容のデータが記録されている。
すなわち、この行のデータは、「2014年12月01日の19時05分34秒から、72秒間の間、首都テレビという放送局の、未来文明ミステリーというタイトルの放送番組を視聴者が視聴した。そして、その放送番組は、教育・教養というコンテンツのジャンルに属する放送番組であり、渡辺四蔵、及び小林丙子という出演者が出演する放送番組である。また、その放送番組の内容は、<<タイムトラベルその1>><アジアの新盟主>今週のタイムトラベルその1では、150年後のアジアの姿を大予想・・・(以下省略)といった内容であり、この放送番組に関連するキーワードは、未来、及びアジアである。」ということを意味する。
つまり、図3の視聴履歴データの「タイトル」の項目と、図12のコンテンツ属性データの「title」の項目を結合キーとして、図13のコンテンツ視聴傾向データが生成される。生成された図13のコンテンツ視聴傾向データは、図3の視聴履歴データに、図12のコンテンツ属性データから取得される「ジャンル」、「出演者」、「内容」、及び「キーワード」の項目が追加されたものである。
なお、図13のコンテンツ視聴傾向データの「内容」に対する値は、図12のコンテンツ属性データの「corner name」、「topic name」、及び「context」の3つの項目に対する値をそれぞれ結合して、1つにまとめた値である。すなわち、コンテンツ中の内容毎に区切られた一区画(セグメント)である「コーナー」の名前を示す「corner name」の項目に対する値と、そのコーナーにおいて特徴的な点を簡潔に示す「トピック」の名前を示す「topic name」の項目に対する値と、そのコーナーの内容の「概要説明」を示す「context」の項目に対する値と、を図12のコンテンツ視聴傾向データが抽出し、それらを結合して1つにまとめて、図13のコンテンツ視聴傾向データの「内容」の項目に対する値としている。つまり、本実施形態においては、コンテンツの内容に関連する情報が含まれる上記の3つの項目を、1つの項目にまとめる場合について例示をした。
上記により、嗜好推定部216は、XML形式によるデータ形式で記憶されたコンテンツ属性データを用いて、例えば、当該視聴者が視聴したコンテンツの各ジャンル毎の合計視聴時間、等を算出することができる。
以降は、第1の実施形態と同様の構成であるため、説明を省略する。
以上、説明したように、本実施形態によれば、情報処理装置21は、XML形式によるデータ形式で表記されたコンテンツ属性データに基づいて、コンテンツ視聴傾向データを生成することができる。情報処理装置21は、文書やデータの意味や構造を記述するために標準化されたマークアップ言語であるXML形式によるデータ形式を用いることによって、視聴者の嗜好の推定に係るデータの授受をより容易に行うことができ、推定効率をより向上させることができる。
情報処理装置21は、そのコンテンツ視聴傾向データと統計データとに基づいて、視聴者の嗜好を推定する。
そして、本実施形態によれば、第1の実施形態と同様に、不特定多数者の統計情報を用いることにより、情報処理装置21は、推定する時点での流行に影響されないように視聴者の嗜好を推定することで、視聴者の嗜好に関する推定精度を向上させ、かつ、コンテンツ及びコンテンツ以外のものまたはコンテンツ以外のことを視聴者に推薦することができる。
(第3の実施形態)
本発明の第3の実施形態について説明する。
上述した、第1の実施形態、及び第2の実施形態においては、視聴嗜好関連性データとして、「嗜好」、「視聴割合が多いジャンル」、及び「視聴割合が少ないジャンル」の3つの項目の列からなる2次元の表形式のデータを例示して、説明をした。すなわち、不特定多数者の嗜好と、不特定多数者が視聴するコンテンツのジャンルと、を関連付けた視聴嗜好関連性データを用いることによって、情報処理装置21は、視聴者が視聴するコンテンツのジャンル毎の視聴時間に基づいて視聴者の嗜好を推定した。
しかしながら、情報処理装置21が利用するコンテンツ属性情報は、コンテンツのジャンルのみには限られない。その他、例えば、視聴者が視聴するコンテンツの放送局(チャンネル)、出演者、キーワード、またはそれらのコンテンツ属性情報の組み合わせ、毎の視聴時間や視聴頻度(回数)等に基づいて視聴者の嗜好を推定してもよい。情報処理装置21は、視聴者の嗜好を推定するために、より多くの種類のコンテンツ属性情報を利用することによって、推定精度をより向上させることができる。
(第4の実施形態)
本発明の第4の実施形態について説明する。
上述した、第1の実施形態〜第3の実施形態においては、情報処理装置21は、視聴嗜好関連性データとして、「嗜好」と、各種のコンテンツ属性情報(例えば、コンテンツのジャンル等)と、によって構成された視聴嗜好関連性データを用いた。それによって、情報処理装置21は、視聴者が視聴するコンテンツのジャンル等毎の視聴時間に基づいて視聴者の嗜好を推定した。
しかしながら、情報処理装置21が推定結果として出力するのは、嗜好のみには限られない。アンケートの設問において、嗜好についての回答を求める設問を設ける代わりに、その他、例えば、「よく訪れるスポット」や「よく閲覧するインターネットサイト」等についての回答を求める設問を設けてもよい。すなわち、情報処理装置21は、コンテンツのジャンル等毎の合計視聴時間と、「よく訪れるスポット」や「よく閲覧するインターネットサイト」と、の関連性の有無を判定する。
以上の構成によって、レコメンド事業者51は、視聴者毎の「よく訪れるスポット」や「よく閲覧するインターネットサイト」等の情報を示す推定結果データを取得することができる。
さらにレコメンド事業者51は、以上の構成によって、視聴者が有する端末装置11に対してレコメンド情報を送信するだけでなく、視聴が「よく訪れるスポット」や「よく閲覧するインターネットサイト」等に対して、レコメンド情報(例えば、広告等)を予め掲示しておく、等の形態によるレコメンドを実施することができる。
以上により、レコメンド事業者51が実施するレコメンドの内容、及び実施形態、に応じた内容のアンケートの設問を設けることによって、レコメンド事業者51はより柔軟なレコメンドサービスを提供することができる。
(第5の実施形態)
本発明の第5の実施形態について説明する。
第1の実施形態〜第4の実施形態においては、端末装置11と情報処理装置21とは、それぞれ互いに独立した装置である場合について説明した。しかしながら、例えば、情報処理装置21が、端末装置11に内蔵された1構成部として機能するような構成としても構わない。本実施形態によれば、本発明の情報処理システム1をより単純化することができる。
以上、この発明の実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
なお、上述した実施形態における情報処理装置21及び端末装置11の一部または全部を、コンピューターで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムを、コンピューターにより読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現してもよい。
なお、ここでいう「コンピューターシステム」とは、情報処理装置21や端末装置11に内蔵されたコンピューターシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューターにより読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、フラッシュメモリ、EEPROM、ROM、RAM、CD−ROM等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置、またはそれらの任意の組み合わせによって構成される記憶媒体のことをいう。
さらに「コンピューターにより読み取り可能な記録媒体」とは、インターネット等の通信ネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
また、上述した実施形態における情報処理装置21及び端末装置11の一部または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。情報処理装置21及び端末装置11の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
1・・・情報処理システム、11・・・端末装置、21・・・情報処理装置、31・・・コンテンツ属性情報提供事業者、41・・・統計情報提供事業者、51・・・レコメンド事業者、111・・・制御部、112・・・チューナー、113・・・復号部、114・・・分離部、115・・・音声復号部、116・・・音声再生部、117・・・映像復号部、118・・・GUI合成部、119・・・映像表示部、121・・・記憶部、122・・・視聴履歴データ生成部、123・・・送信部、131・・・通信部、132・・・操作入力部、211・・・視聴履歴データ取得部、212・・・コンテンツ属性データ取得部、213・・・視聴傾向データ生成部、214・・・統計データ取得部、215・・・統計データ解析部、216・・・嗜好推定部、217・・・推定結果送信部

Claims (8)

  1. 視聴者がコンテンツを視聴した履歴を示す視聴履歴情報とコンテンツに紐づけられた属性情報を示すコンテンツ属性情報とが関連付けられたコンテンツ視聴傾向情報を取得し、
    多数者についての嗜好を示す多数者嗜好情報であって、前記コンテンツ属性情報に関連付けられた多数者嗜好情報を取得し、
    前記コンテンツ視聴傾向情報と前記多数者嗜好情報とに基づいて、前記視聴者の嗜好を推定する推定部を備える、情報処理システム。
  2. 前記視聴履歴情報として、視聴日時、視聴継続時間、視聴したコンテンツの放送局、視聴したコンテンツのタイトル、のうち少なくともいずれか1つを含む情報を用いて、前記コンテンツ視聴傾向情報を生成する生成部を備える、請求項1に記載の情報処理システム。
  3. 前記コンテンツ属性情報として、コンテンツのジャンル、出演者、コンテンツに関連するキーワード、のうち少なくともいずれか1つを含む情報を用いて、前記コンテンツ視聴傾向情報を生成する生成部を備える、請求項1または請求項2に記載の情報処理システム。
  4. 前記推定部は、前記多数者嗜好情報として、統計情報に基づく情報を用いて前記視聴者の嗜好を推定する、請求項1から3のいずれか1つに記載の情報処理システム。
  5. 前記統計情報に基づく情報に基づいて前記多数者嗜好情報を生成する、請求項4に記載の情報処理システム。
  6. 視聴者がコンテンツを視聴した履歴を示す視聴履歴情報を生成する視聴履歴情報生成部と、
    前記視聴履歴情報を情報処理装置へ出力する視聴履歴情報出力部と、
    前記情報処理装置から、視聴者がコンテンツを視聴した履歴を示す前記視聴履歴情報とコンテンツに紐づけられた属性情報を示すコンテンツ属性情報とが関連付けられたコンテンツ視聴傾向情報、及び、多数者についての嗜好を示す多数者嗜好情報であって前記コンテンツ属性情報に関連付けられた多数者嗜好情報に基づく、レコメンド情報を取得する取得部と、
    前記取得部が取得したレコメンド情報に基づく出力を行う出力部と、
    を備える、端末装置。
  7. 情報処理装置における方法において、
    視聴者がコンテンツを視聴した履歴を示す視聴履歴情報とコンテンツに紐づけられた属性情報を示すコンテンツ属性情報とが関連付けられたコンテンツ視聴傾向情報を取得する取得過程と、
    多数者についての嗜好を示す多数者嗜好情報であって、前記コンテンツ属性情報に関連付けられた多数者嗜好情報を取得する取得過程と、
    前記コンテンツ視聴傾向情報と前記多数者嗜好情報とに基づいて、前記視聴者の嗜好を推定する推定過程を有する、情報処理方法。
  8. 情報処理装置のコンピューターに、
    視聴者がコンテンツを視聴した履歴を示す視聴履歴情報とコンテンツに紐づけられた属性情報を示すコンテンツ属性情報とが関連付けられたコンテンツ視聴傾向情報を取得する手順と、
    多数者についての嗜好を示す多数者嗜好情報であって、前記コンテンツ属性情報に関連付けられた多数者嗜好情報を取得する手順と、
    前記コンテンツ視聴傾向情報と前記多数者嗜好情報とに基づいて、前記視聴者の嗜好を推定する推定手順と、を実行させるためのプログラム。
JP2015040116A 2015-03-02 2015-03-02 情報処理システム、端末装置、情報処理方法、及びプログラム Pending JP2016163175A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015040116A JP2016163175A (ja) 2015-03-02 2015-03-02 情報処理システム、端末装置、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015040116A JP2016163175A (ja) 2015-03-02 2015-03-02 情報処理システム、端末装置、情報処理方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2016163175A true JP2016163175A (ja) 2016-09-05

Family

ID=56845610

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015040116A Pending JP2016163175A (ja) 2015-03-02 2015-03-02 情報処理システム、端末装置、情報処理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2016163175A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019062502A (ja) * 2017-09-28 2019-04-18 有限会社NetA 情報処理装置、情報処理方法およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003216636A (ja) * 2002-01-23 2003-07-31 Hitachi Ltd 最新記事推薦方法およびシステム
JP2005167628A (ja) * 2003-12-02 2005-06-23 Sony Corp 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム
JP2006350871A (ja) * 2005-06-17 2006-12-28 Yasuhito Ooka 各個人の嗜好にあった映画作品情報提供サービス

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003216636A (ja) * 2002-01-23 2003-07-31 Hitachi Ltd 最新記事推薦方法およびシステム
JP2005167628A (ja) * 2003-12-02 2005-06-23 Sony Corp 情報処理装置及び情報処理方法、並びにコンピュータ・プログラム
JP2006350871A (ja) * 2005-06-17 2006-12-28 Yasuhito Ooka 各個人の嗜好にあった映画作品情報提供サービス

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019062502A (ja) * 2017-09-28 2019-04-18 有限会社NetA 情報処理装置、情報処理方法およびプログラム

Similar Documents

Publication Publication Date Title
US11860915B2 (en) Systems and methods for automatic program recommendations based on user interactions
US11354368B2 (en) Displaying information related to spoken dialogue in content playing on a device
JP6235556B2 (ja) コンテンツ提示方法、コンテンツ提示装置及びプログラム
US8613024B2 (en) Cross-platform predictive popularity ratings for use in interactive television applications
US8621506B2 (en) System and method for approximating characteristics of households for targeted advertisement
US20100306708A1 (en) Systems and methods for handling profiles in a community
US20120221645A1 (en) Automatic media asset update over an online social network
US11509964B2 (en) Systems and methods for detecting a reaction by a user to a media asset to which the user previously reacted at an earlier time, and recommending a second media asset to the user consumed during a range of times adjacent to the earlier time
US11089072B2 (en) Real time optimized content delivery framework
US20140172891A1 (en) Methods and systems for displaying location specific content
US11687585B2 (en) Systems and methods for identifying a media asset from an ambiguous audio indicator
US11758234B2 (en) Systems and methods for creating an asynchronous social watching experience among users
US9946769B2 (en) Displaying information related to spoken dialogue in content playing on a device
WO2011118249A1 (ja) コンテンツ推薦サーバ、コンテンツ表示端末、およびコンテンツ推薦システム
JP2016163175A (ja) 情報処理システム、端末装置、情報処理方法、及びプログラム
JP2007274704A (ja) 番組視聴通知装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170925

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180524

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180703

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190219