JP2009232250A - 番組情報表示装置および番組情報表示方法 - Google Patents
番組情報表示装置および番組情報表示方法 Download PDFInfo
- Publication number
- JP2009232250A JP2009232250A JP2008076310A JP2008076310A JP2009232250A JP 2009232250 A JP2009232250 A JP 2009232250A JP 2008076310 A JP2008076310 A JP 2008076310A JP 2008076310 A JP2008076310 A JP 2008076310A JP 2009232250 A JP2009232250 A JP 2009232250A
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature amount
- performer
- information
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/16—Analogue secrecy systems; Analogue subscription systems
- H04N7/173—Analogue secrecy systems; Analogue subscription systems with two-way working, e.g. subscriber sending a programme selection signal
- H04N7/17309—Transmission or handling of upstream communications
- H04N7/17318—Direct or substantially direct transmission and handling of requests
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/441—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
- H04N21/4415—Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/4722—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting additional data associated with the content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8126—Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
- H04N21/8133—Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【課題】番組視聴中、画面上の顔と対応付けて出演者名を知りたいという要求に対し、ノイズの少なく、精度の良い検索を可能とする番組情報表示装置及び番組情報表示方法を提供すること。
【解決手段】番組情報表示装置100は、代表特徴量決定部109は抽出画像の特徴量と関連画像の入手先の情報に基づいて代表特徴量とその信頼度を決定し、出演者情報管理部104は決定された代表特徴量及び信頼度を出演者名と対応付けて出演者情報として管理する。表示画像取得部102は動画像を構成するフレームから表示画像を取得し、特徴量算出部111は表示画像について抽出画像の特徴量を算出する。検索部105は抽出画像の特徴量と代表特徴量との類似度を算出し、代表特徴量に関連付けられた出演者名を取得する。表示情報生成部106は信頼度又は類似度と抽出画像の領域とに基づいて表示情報を生成し、表示部103は出演者名を顔領域に関連付けて表示する。
【選択図】図1
【解決手段】番組情報表示装置100は、代表特徴量決定部109は抽出画像の特徴量と関連画像の入手先の情報に基づいて代表特徴量とその信頼度を決定し、出演者情報管理部104は決定された代表特徴量及び信頼度を出演者名と対応付けて出演者情報として管理する。表示画像取得部102は動画像を構成するフレームから表示画像を取得し、特徴量算出部111は表示画像について抽出画像の特徴量を算出する。検索部105は抽出画像の特徴量と代表特徴量との類似度を算出し、代表特徴量に関連付けられた出演者名を取得する。表示情報生成部106は信頼度又は類似度と抽出画像の領域とに基づいて表示情報を生成し、表示部103は出演者名を顔領域に関連付けて表示する。
【選択図】図1
Description
本発明は、番組情報を表示する番組情報表示装置および番組情報表示方法に関し、例えば、テレビジョン受信機、DVDプレイヤ、ハードディスクレコーダ等の動画像を表示または再生する番組情報表示装置および番組情報表示方法に関する。
従来、テレビなどで視聴している番組の出演者が未知であった場合、その出演者の名前を知りたいという要求は一般的なものである。この見知らぬ出演者の情報を得る方法として、例えば、新聞のテレビ欄あるいはEPG(Electrical Program Guide:電子番組表)から出演者情報を得ることが一般的であった。
このような方法においては、出演者の名前と写真が掲載されているとは限らないため、顔と名前を一致させることが困難となる。ユーザは、番組の情報から出演者名を知ることができた場合であっても、例えばインターネットにアクセスして出演者名をキーワードにより画像を検索することで、顔と名前を一致させることが可能となる場合もある。しかし、ユーザにとってその手間は煩雑であった。
この状況を解決する方法として、動画像から顔画像を抽出して予め登録された顔画像と固有情報を検索し、固有情報を顔画像の近傍に表示する情報表示方法がある(例えば、特許文献1)。
また、別の方法として、画像特徴量を基にして、画像の検索する対象である画像特徴量データベースを最新の情報に更新するために、画像リストと画像を外部装置から定期的に取得する画像検索装置がある(例えば、特許文献2)。
特開2006−293912号公報
特開2006−185320号公報
しかしながら、このような従来の番組情報表示装置にあっては、以下のような課題があった。
特許文献1記載の情報表示法では、画像特徴量データベースが固定的であり、様々な番組に日々新たな出演者が登場する状況において、すべての出演者に関する画像特徴量を保持していることは現実的ではない。
この解決手段として上記特許文献2を用いることで、検索対象の画像特徴量データベースを定期的に更新することが可能となる。しかし、特許文献2記載の画像検索装置は、キーワードから画像特徴量を検索して、画像特徴量を基に類似画像を検索するためのデータベースであり、画像特徴量からキーワード(例えば、出演者名)を検索するものではない。また、上記画像検索装置は、キーワードを基に取得した画像をネットワークで検索すると、関連するが出演者を示すものではない画像(ノイズ)も多く検索され、検索方法が異なることから、ノイズに対する考慮がなされていない。
また、上記方法を組み合わせても、画像特徴量が一致したと判断されるまで出演者名が表示されないという課題がある。
本発明は、上記に鑑みてなされたものであり、番組視聴中、登場人物と出演者名が一致しないときなど、画面上の顔と対応付けて出演者名を知りたいという要求に対し、ノイズの少なく、精度の良い検索を可能とする番組情報表示装置および番組情報表示方法を提供することを目的とする。
本発明の番組情報表示装置は、動画像と出演者名を含む出演者情報からなる番組を取得する番組取得部と、前記出演者情報に基づいて、ネットワークから関連画像を取得する関連画像取得部と、前記関連画像から人物の領域を切り出した抽出画像の特徴量を算出する第1特徴量算出部と、前記抽出画像の特徴量と前記関連画像の入手先の情報に基づいて代表特徴量とその信頼度を決定する代表特徴量決定部と、決定された前記代表特徴量および信頼度を前記出演者名と対応付けて出演者情報として管理する出演者情報管理部と、前記動画像を構成するフレームから表示画像を取得する表示画像取得部と、前記表示画像について前記抽出画像の特徴量を算出する第2特徴量算出部と、前記第2特徴量算出部により算出された前記抽出画像の特徴量と前記出演者情報管理部に保持された前記代表特徴量との類似度を算出し、前記類似度が最大となる代表特徴量に関連付けられた出演者名を取得する検索部と、前記信頼度または前記類似度の少なくとも一方と前記検索部により取得した前記出演者名と前記抽出画像の領域とに基づいて表示情報を生成する表示情報生成部と、前記表示画像および前記表示情報を表示する表示部と、を備える構成を採る。
本発明の番組情報表示方法は、動画像と出演者名を含む出演者情報からなる番組を取得するステップと、前記出演者情報に基づいて、ネットワークから関連画像を取得するステップと、前記関連画像から人物の領域を切り出した抽出画像の特徴量を算出する第1特徴量算出ステップと、前記抽出画像の特徴量と前記関連画像の入手先の情報に基づいて代表特徴量とその信頼度を決定するステップと、決定された前記代表特徴量および信頼度を前記出演者名と対応付けて出演者情報として管理するステップと、前記動画像を構成するフレームから表示画像を取得するステップと、前記表示画像について前記抽出画像の特徴量を算出する第2特徴量算出ステップと、前記第2特徴量算出ステップにより算出された前記抽出画像の特徴量と保持された前記代表特徴量との類似度を算出し、前記類似度が最大となる代表特徴量に関連付けられた出演者名を取得するステップと、前記信頼度または前記類似度の少なくとも一方と前記検索部により取得した前記出演者名と前記抽出画像の領域とに基づいて表示情報を生成するステップと、前記表示画像および前記表示情報を表示するステップとを有する。
本発明によれば、事前に出演者の顔画像データベースを用意する必要がなく、出演者の領域に関連付けて出演者名を表示する際に、出演者の判定結果の正しさを直観的に判断できる効果が得られる。
また、動画像から顔画像を抽出して得られる画像特徴量から出演者を特定する際に、動的に検索するデータベースに基づいた信頼度を反映させることにより、ノイズが少なく、精度の良い検索を実現できる。
以下、本発明の実施の形態について図面を参照して詳細に説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る番組情報表示装置を備える番組情報表示システムの構成を示す図である。本実施の形態に係る番組情報表示装置は、デジタル放送の電波を受信可能なテレビジョン受信機に適用した例である。
図1は、本発明の実施の形態1に係る番組情報表示装置を備える番組情報表示システムの構成を示す図である。本実施の形態に係る番組情報表示装置は、デジタル放送の電波を受信可能なテレビジョン受信機に適用した例である。
図1において、番組情報表示システムは、デジタルテレビジョン受信機である番組情報表示装置100、インターネットまたは専用回線からなるネットワーク200、画像検索サイトである画像検索装置210、掲載するウェブページを公開している一般サイトである画像サーバ220、番組の公式サイトである番組情報サーバ230、番組表を掲載するサイトである番組表サーバ240および番組を放送する放送局250を備えて構成される。
番組情報表示装置100は、放送局250から送信される番組情報を再生するデジタル放送受信機である。本実施の形態では、番組情報表示装置100をテレビジョン受信機に適用した例について説明している。また、番組情報表示装置100は、BD(Blue-ray Disc)、DVD(Digital Versatile Disc)プレイヤ、ハードディスクレコーダなどの動画像を表示または再生する装置に適用することができる。さらに、番組情報表示装置100は、携帯電話機/PHS(Personal Handy-Phone System)、携帯情報端末(以下、PDA(Personal Digital Assistants)という)などの携帯端末、パソコン、さらには携帯ゲーム機なども含まれる。詳細な構成については後述する。
ネットワーク200は、移動体通信網、公衆電話網、LANまたはインターネットなどから構成するネットワークであり、有線系または無線系などネットワークの種類とプロトコルの種類は特に問わない。また、ネットワーク200のアクセス回線としては、FTTH(Fiber To The Home)、HFC(Hybrid Fiber Coax:光同軸ケーブル)、およびADSL(Asymmetric Digital Subscriber Line)等の大容量回線が利用可能である。
画像検索装置210は、ネットワーク200を介して画像サーバ220、番組情報サーバ230をはじめとする複数のサイトが保持する画像、その説明情報および画像のURL(Uniform Resource Locator)を収集し保持している画像検索サイトである。画像検索装置210は、収集した画像に関する情報を、キーワードに基づいて検索し、検索結果である画像および画像のURLを出力する。画像およびその説明情報を収集する対象には、画像サーバ220も含まれており、画像サーバ220に掲載されている情報が適正でない場合もあるため、検索アルゴリズムを工夫することにより精度を向上させようとしている。
画像サーバ220は、不特定多数の一般ユーザあるいは企業等により管理されており、何らかの画像を保持してネットワーク200に向けて公開しているサイトである。公開サイトは、必ずしも情報を適正に表現しているとは限らないが、公式サイトに比べるとはるかに多く存在している。
番組情報サーバ230は、番組の公式サイトであり、一般的には番組の権利者であるテレビ局や番組制作会社が管理している。従って、公式サイトは、番組の内容を適正に表現しているサイトの一つであると言える。ただし、番組によっては、公式サイトが存在しないこともあり、存在している場合であっても内容の充実度は様々である。ここでは、公式サイトを番組のサイトとして説明しているが、番組の出演者の公式サイトも出演者に関する情報を適正に表現しているサイトであることから、出演者の公式サイトも同様に扱うことができる。
番組表サーバ240は、日時あるいは地域等を基に該当する番組情報の一覧である番組表を、ネットワーク200を介して提供するサイトである。番組情報は、番組名、出演者名、公式サイトのURL等を含む。本実施の形態では、インターネットのサイトである番組表サーバを用いているが、番組情報を提供するものであればよい。例えば、番組情報を取得する方法は、番組情報を放送局250が放送波に重畳する方法、あるいは番組がDVD(Digital Versatile Disc)あるいはハードディスクなどのメディアで構成される場合、番組と同一のメディアに番組情報を保持し、番組情報表示装置100から参照してもよい。よって、番組がDVDなどのメディアで構成される場合の番組情報表示システムは、放送局250および番組表サーバ240を全体構成に含まれなくともよい。
上記各サーバ220,230,240は、サーバ全体を制御するコンピュータからなる制御部、ネットワーク200に接続され、例えばインターネット上のURLにアクセスされたデータを送受信する通信インタフェース、およびデータを蓄積するデータベース(DB)などから構成される。
放送局250は、番組を放送し、番組情報表示装置100は番組を受信する。
番組情報表示装置100は、以下の構成を採る。
番組情報表示装置100は、番組取得部101、表示画像取得部102、表示部103、出演者情報管理部104、検索部105、表示情報生成部106、関連画像取得部107、特徴量算出部108(第1特徴量算出部)、代表特徴量決定部109、出演者情報保持部110、および特徴量算出部111(第2特徴量算出部)から構成される。また、図示は省略されているが、番組情報表示装置100は、ユーザからの入力を受け付ける入力操作を行うキーボードあるいはリモコン装置の数値、十字キー等からなる入力装置、外部記録装置あるいは各種機器を接続するためのインタフェースを備えている。
番組取得部101は、番組および番組情報の放送を受信し、番組および番組情報をデコードするチューナである。番組取得部101は、動画像とその出演者情報からなる番組を取得する。番組取得部101により取得される番組表は、放送信号から抽出される。この番組情報は、番組取得部101により番組に関する情報(例えば、番組名、チャンネル、放送日、放送の開始時刻と終了時刻など)としてEPGなどから予め取得される。番組取得部101は、内部にメモリ(図示略)を有し、このメモリに取得した番組情報およびEPGを保存する。番組取得部101が、例えばEPGなどから番組を取得する場合、番組表に記載された出演者名が対象となり、従って番組表に記載されていない出演者等は対象とならない。図2は、電子番組表の一例を示す図である。図2に示すように、この電子番組表は、番組名、あらすじ、出演者およびURLのフィールド名について各設定値を持つ。図2の例では、番組名「グッドモーニングトーキョー」、出演者「タケシ(松山太郎)、ヒロコ(竹田花子)、ユリ(梅川良子)」、URLは番組の公式サイトである。
表示画像取得部102は、番組取得部101より取得した番組に対して、表示する動画像のフレームを抽出し、動画像を構成するフレームから表示画像を取得する。
表示部103は、表示画像取得部102で抽出されたフレーム単位の動画像を表示するディスプレイである。表示部103は、表示画像と同時に表示情報を表示する。
出演者情報管理部104は、番組取得部101に保存された番組情報から出演者名、公式サイトのURLを抽出する。出演者情報管理部104は、代表特徴量決定部109から得られる関連画像に関する代表特徴量および信頼度を出演者名と対応付けて出演者情報保持部110に保持する。
検索部105は、類似画像を検索し、検索結果を一時的に保持する。検索部105は、表示画像について特徴量算出部111により抽出画像の領域および抽出画像特徴量を求める。検索部105は、出演者情報管理部104により代表特徴量を取得して類似度を算出し、類似度が最大となる代表特徴量に関連付けられた出演者名を取得する。
表示情報生成部106は、代表特徴量の信頼度または類似度の少なくとも一方と、検索部105で取得した出演者名と抽出画像の領域とから表示部103に表示する表示情報を生成する。表示情報生成部106による表示情報生成例については、図6により後述する。
関連画像取得部107は、ネットワーク200と通信して画像を取得する。関連画像取得部107は、ネットワーク200に接続して出演者情報を基に1つ以上の関連画像を取得する。
特徴量算出部108,111は、画像から人物の領域を切り出した抽出画像の特徴量を算出する。特徴量算出部108と特徴量算出部111とは、特徴量を算出するアルゴリズムは同じであるが、処理対象が異なる。特徴量算出部108は、ネットワーク200から取得した画像に対して、画像から人物の領域を切り出した抽出画像の特徴量を算出する。特徴量算出部111は、TV画面に表示している画像に対して、画像から人物の領域を切り出した抽出画像の特徴量を算出する。ここで、特徴量算出部108,111は、ネットワーク200から取得した画像またはTV画面に表示している画像に、複数人の人物が映っている場合には、その複数人のそれぞれについて特徴量を算出する。
代表特徴量決定部109は、特徴量に重み付けをして比較して代表特徴量および信頼度を決定する。具体的には、代表特徴量決定部109は、ネットワーク200から取得した関連画像から抽出した抽出画像(顔領域)の特徴量に対して重み付けを行う。重み付けの方法は、例えばその画像の取得元が公式サイトである場合に、その抽出画像の個数を増やす方法がある。この方法によると、該当の抽出画像の特徴量の数が他の抽出画像よりも増えることで、重みを付けることができる。また、代表特徴量の決定条件は、該当する抽出画像のすべての特徴量から、相加平均を用いる方法、あるいは個数が最大となる値を用いる方法が考えられる。
出演者情報保持部110は、ハードディスクあるいはメモリにより構成され、出演者情報管理部104で番組情報から抽出した出演者情報に対して、代表特徴決定部109で決定された代表特徴量とその信頼度を保持する。図3は、出演者情報保持部110に保持される出演者情報の一例を示す図である。図3に示す出演者情報は、図2の電子番組表の出演者の出演者名(役名)「松山太郎(タケシ)、竹田花子(ヒロコ)、梅川良子(ユリ)」に、それぞれ代表特徴量とその信頼度を有する。図3の場合、出演者名(役名)「竹田花子(ヒロコ)」の信頼度が他の二名の信頼度より高い。
上記出演者情報管理部104、検索部105、表示情報生成部106、特徴量算出部108、代表特徴量決定部109、および特徴量算出部111は、CPU等からなり、番組情報表示処理の実行を含む装置全体の制御を行う。上記CPUは、ROM、RAMおよび電気的に書換可能な不揮発性メモリであるEEPROM(electrically erasable programmable ROM)あるいはフラッシュROMなどを備えている。上記メモリには、プログラム、通信制御データ、さらに端末の識別コード等の種々のデータを記憶する。また、上記メモリには、出演者情報保持部110の出演者情報が格納される。
以下、上述のように構成された番組情報表示装置100の動作を説明する。
図4および図5は、番組情報表示装置100の動作を示すフローチャートである。図4は、代表特徴量を決定するまでの処理を、図5は、出演者名の表示までの処理をそれぞれ示す。図4に示すフローは、基本的にはユーザが該当番組を視聴中に実行される。図5に示すフローは、基本的にはユーザ指示をトリガとして実行される。このように、実行条件が異なるので、2つのフローに分けて説明する。図4および図5に示すフローは、上述したようにCPUにより番組情報表示プログラムとして実行される。図中、記号「S」はフローの各ステップを示す。
まず、代表特徴量決定部109により代表特徴量を決定するまでの処理について、図4のフローチャートを用いて説明する。
ステップS11において、番組取得部101は、表示中の番組情報および動画像を取得する。番組情報は、電子番組表(EPG)から取得することが最も容易な方法であるが、動画像中の文字列または音声の認識、クローズドキャプションの認識などで番組情報を取得してもよい。さらに、電子番組表には、インターネット上における出演者の公式サイトのURL、番組の公式サイトのURLが含まれていてもよい。電子番組表の一例は、図2に示す。
ステップS12において、出演者情報管理部104は、ループの始端と終端において「すべての出演者名」について以下の処理を繰り返す。出演者情報管理部104は、番組取得部101で取得した番組情報を基に、電子番組表の出演者のフィールドから出演者名を抽出し、得られたすべての出演者名について、以降の処理を行う。
ステップS13において、出演者情報管理部104は、出演者名が、出演者情報保持部110にあるか否かを確認する。ただし、処理の開始時において出演者情報保持部110には何も登録されていないものとする。
ステップS14において、出演者情報管理部104は、出演者名が、出演者情報保持部110にある場合は次の出演者に移る。出演者名が、出演者情報保持部110にない場合は、ステップS15に進む。
ステップS15において、関連画像取得部107は、出演者名を基に関連画像を取得する。関連画像取得部107は、インターネットをはじめとするネットワーク200経由で、出演者名をキーワードとして画像検索装置210から関連画像とその取得先のURL等の情報を取得し、保持する。番組がDVDなどのメディアであり、そのメディアに画像データを保持している場合には、ネットワーク200経由ではなくメディアから関連画像を取得するとしてもよい。
ステップS16では、ループの始端と終端において「すべての関連画像」について以下の処理を繰り返す。
ステップS17において、特徴量算出部108は、関連画像取得部107で取得した各出演者の全ての関連画像から人物の顔領域を切り出して画像特徴量を求め、出演者名と対応付けて一時的に保存する。人物の領域を切り出す方法としては、色や輝度の情報から顔の輪郭を求めエッジを抽出、顔パーツの抽出によるパターン処理などを用いて行う。画像特徴量は、色調や顔パーツの配置位置などを数値化することで求める。
ステップS18において、代表特徴量決定部109は、得られた画像特徴量から出演者名ごとに代表特徴量と信頼度を決定し、ステップS19において、出演者情報管理部104は、出演者名、代表特徴量、信頼度を関連付けて出演者情報保持部110に保持する。出演者情報保持部110に保持する情報の一例は、図3に示される。なお、画像特徴量は、特徴量算出部108のアルゴリズムや精度、保存形式によるものであり、この例が画像特徴量の一般的な表現を示すものではない。
次に、代表特徴量決定部109の処理について説明する。
なお、代表特徴量決定部109の処理に先立って、特徴量算出部108でノイズ除去処理が行われる。
番組情報表示装置100は、出演者名をキーワードとして、ネットワーク200経由で画像検索装置210から画像を検索する。番組情報表示装置100は、画像検索装置210の検索アルゴリズムに従って番組情報サーバ230あるいは画像サーバ220の画像が抽出される。このような画像検索は、キーワードで関係する画像を検索することが一般的であり、画像サーバ220の画像の中には、キーワードが一致するだけで出演者の顔画像ではない画像も検索される。
画像特徴量は、特徴量算出部108のアルゴリズムに従って得られ、例えば顔パーツの配置位置が複数の特徴値(ここでは特徴値を0以上とする)の組み合わせで表現される。特徴量算出部108は、出演者の複数の関連画像の特徴値のそれぞれについて統計的な分布を求め、平均から予め規定した閾値以内の特徴量の平均を再計算して、代表特徴量として求める。これにより、特徴量が大きく異なるもの(ノイズ)を排除する。特徴量算出部108による特徴量算出の具体例表示情報生成例については、図7により後述する。
目標となる人物の表示画面であるターゲット以外は、全てノイズとする。検索エンジンで行うと関係ない画像が多い。また、該当人物以外の人が写っている場合も多い。検索数が多くなると精度が高くなると考えられるので、何度か繰り返すことにより精度を上げることが可能である。例えば、番組が始まってから番組を受信している間、バックグランド処理により常時、処理を行ってもよい。番組予約がある場合、番組開始に先立って予め、図4のフローを実行することも可能である。このようにすれば、代表特徴量の信頼度を高めることができる。
ここで、出演者情報管理部104は、番組取得部101が保持する番組の公式サイトのURLと、関連画像取得部107が取得した画像のURLとを比較し、同一のドメインである場合には、取得した画像が公式サイトのものであると判断する。そして、代表特徴量決定部109は、その画像の特徴量に重み付けすることで、算出される代表特徴量に反映させる。信頼度の重み付けの計算は、例えば次のように行う。
特徴量算出部108が算出した各出演者の画像特徴量F(x)が、m個の特徴値からなる次式(1)で表現されると、代表特徴量Ftは、ノイズ排除後の画像数n、公式サイトか否かの係数siとして、次式(2)により得られる。
また、信頼度ベクトルCvは、次式(3)として示される。信頼度Cは、次式(4)で求めることができる。
上記公式サイトか否かの係数siは、例えば公式サイトの画像である場合には2、その他サイトからの画像の場合には1というように設定する。
次に、特徴量算出部108が行う特徴量算出の具体例について説明する。
特徴量は、上記式(1)に示すように、m個からなる特徴値の組み合わせである。個々の特徴量は、色情報や顔の各パーツの位置情報から求めることができる。例えば、特徴量算出部108は、色情報を基にした色相などを算出して特徴値とする。位置情報については、色情報を基にした輝度や色相などから画像の中の輪郭を抽出して顔の各パーツを求め、例えば縦横比、各パーツの相対位置などを特徴値とする。
以下、代表特徴量の算出方法の具体例について説明する。簡単のため、m=3とする。
図7は、特徴量算出部108が算出した特徴量の例を示す。図7の場合、特徴量は、特徴量番号毎に、3個の特徴値1乃至3を有する。この特徴量を用いて、代表特徴量の算出の例を説明する。
特徴量算出部108は、ノイズを除去するためと信頼度を算出するために相加平均と分散を計算する。分散は、特徴値のばらつきを意味するものであり、そのばらつき度合いを基にしきい値を算出してノイズを除去する。なお、分散の値を信頼度とする態様でもよい。
図7において、n個の関連画像それぞれの特徴量に番号を付けたものが特徴量番号である。この場合、n個の関連画像を用いて、相加平均と分散を求めることになる。関連画像は、あるキーワード(出演者名)を基にして検索された画像である。したがって、ひとつのキーワード(出演者名)について複数の関連画像がある。この複数の関連画像を用いてキーワード(出演者名)に対する代表特徴量を求める。
ここで、キーワード(出演者名)によって検索される画像には、まったく関係のない画像(ノイズ)が含まれまる。場合によっては、人物の画像でないこともある。ノイズを含めたまま得られた平均値は、妥当な値とは考えにくいので、ノイズを除去した後で、再計算を行う。
複数の関連画像から代表特徴量を求めるために、以下(a)−(e)の処理を行う。
(a)ノイズを含む母集団から仮の平均値を求める。
(b)仮の平均値から分散を求める。
(c)分散を基にノイズを除去する。
(d)ノイズを除いた母集団の平均を求める。これが再計算である。
(e)求められた平均を代表特徴量とする。
(a)ノイズを含む母集団から仮の平均値を求める。
(b)仮の平均値から分散を求める。
(c)分散を基にノイズを除去する。
(d)ノイズを除いた母集団の平均を求める。これが再計算である。
(e)求められた平均を代表特徴量とする。
まず、特徴量算出部108は、図7における特徴値毎に相加平均を求める。その際に公式サイトの特徴量は、他の特徴量よりも所定倍(例えば5倍)の重み付けをする。図7の場合、特徴量番号1の特徴量は、公式サイトから取得した特徴量であるため、他の特徴量よりも5倍の重み付けをする。母集団の数は、4増えることになる。
図7に示す特徴値1乃至3において、特徴値1の場合を例に採り説明する。
特徴値1の相加平均f1mは、次式(5)として示される。分散σ2は、次式(6)として示される。
f1m=((2*5)+3+2+8+1)/(5+4)≒2.67 …(5)
σ2=(2*2*5+3*3+2*2+8*8+1*1)/(5+4)−(f1m)2
≒10.89−7.13=3.76 …(6)
σ2=(2*2*5+3*3+2*2+8*8+1*1)/(5+4)−(f1m)2
≒10.89−7.13=3.76 …(6)
特徴値1が、正規分布になると仮定して、閾値thを±標準偏差σと予め定義した場合、閾値thは、f1mにおいて次式(7)で示される。
th≒±√(3.76)=±1.94 …(7)
すなわち、f1mの取り得る値f1eとしては、次式(8)および(9)となる。
(f1m−th)≦f1e≦(f1m+th) …(8)
0.73≦f1e≦4.61 …(9)
0.73≦f1e≦4.61 …(9)
上記式(9)から、図7に示す特徴量番号4のデータは、f1mの取り得る値f1eに該当しないので、ノイズとみなすことができる。同様にして、残りの特徴値である特徴値2および特徴値3についても計算することができ、ノイズとなる特徴量を除いて新たな平均を求める。例えば、特徴量算出部108は、f1mについて、特徴量番号4のデータを除き重み付けを考慮して、次式(10)により上記再計算を行う。ただし、他の特徴値によるノイズ除去は無視している。
f1m=((2*5)+3+2+1)/(4+4)=2.00 …(10)
以上により、図7において、代表特徴量の特徴値1の値を「2」とすることができる。他の特徴値である特徴値2および特徴値3についても同様に計算することで、代表特徴量を算出することができる。
代表特徴量決定部109は、同一のキーワードに対し、収集された画像特徴量のばらつきが大きい場合は、信頼度が低くなり、ばらつきが小さければ信頼度は高くなると判断する。
代表特徴量決定部109は、計算を簡略するために、ノイズを除いた特徴量の数n、ノイズ排除前の画像数をa、公式サイトの画像数を0とした場合、信頼度Cは、次式(11)により求めてもよい。この場合も同様に、特徴量のばらつきが大きい場合は信頼度が低く、ばらつきが小さければ信頼度は高くなる。
代表特徴量決定部109は、このようにして得られた出演者名、代表特徴量Ft、信頼度Cを関連付けて出演者情報保持部110に保持する。なお、代表特徴量決定部109は、番組情報として出演者名と役名が得られた場合に、役名も合わせて出演者情報保持部110に保持してもよい。代表特徴量決定部109は、ネットワーク経由で画像検索する場合においては多くの画像が検索されることもあるため、代表特徴量Ftを決定するまでの処理を番組表示中に段階的に非同期で行ってもよい。
また、代表特徴量決定部109は、出演者名について数個の画像を処理した時点で次の出演者名の処理を行い、すべての出演者名について処理した後は、再度出演者名について別の数個の画像を取得して処理する。代表特徴量決定部109は、このように段階的に処理することで、番組視聴開始の早い段階から、以下に示す照合処理が実施可能となり、番組視聴中に非同期処理が進むにつれて代表特徴量の信頼度を高めることが可能となる。
次に、出演者名の表示までの処理について、図5のフローチャートを用いて説明する。本フローは、ユーザが番組視聴中に出演者の人物を知りたい場合に、ユーザ指示がトリガとなり実行される。
ステップS20において、表示画像取得部102は、番組取得部101から取得した動画像からフレーム単位で表示画像を取得し保持する。
ステップS21において、表示部103は、取得した表示画像をそのまま動画像として表示する。
ステップS22において、検索部105は、表示画像取得部102で取得したフレーム単位の表示画像から、人物の領域を切り出して抽出画像を出力すると共に、抽出画像の切り出し位置を出力する。特徴量算出部111は、抽出画像から抽出画像特徴量を算出する。複数の人物が写っている場合には、複数の抽出画像が得られる。特徴量算出部111は、特徴量算出部108と同一機能であり、特徴量算出部108については既に詳細に説明した。ただし、特徴量算出部108は、関連画像の特徴量を計算するのに対し、特徴量算出部111は、抽出画像の特徴量を計算する。
ステップS23では、ループの始端と終端において「すべての関連画像」について以下の処理を繰り返す。
ステップS24において、ループの始端と終端において「すべての代表画像」について、検索部105は、出演者情報管理部104を介して出演者情報保持部110に照合済みの代表特徴量がなくなるまで代表特徴量を取得する。
ステップS25において、検索部105は、抽出画像特徴量と代表特徴量の照合を行い、類似度を算出する。検索部105は、代表特徴量をFt、抽出画像特徴量をFe、特徴量の取りうる最大値をFmax(但し各特徴値の最大値は0より大きい)とすると、類似度Sは、例えば次式(12)により求めることができる。
ここで、検索部105は、代表特徴量Ftと該当の信頼度Cを取得し、予め設定した閾値よりも信頼度が低い代表特徴量の照合は行わないとして、処理を高速化することもできる。
ステップS26において、検索部105は、算出した類似度のうち最大となる類似度を抽出する。
ステップS27において、検索部105は、該当する代表特徴量に関連付けられている出演者名を検索結果として保持する。検索部105は、特徴量算出部111により算出された抽出画像特徴量と、図4のフローにおいて代表特徴量決定部109により得られた関連画像に関する代表特徴量とをマッチングする。
ステップS28において、表示情報生成部106は、検索部105で抽出された出演者名と抽出画像により、表示情報を生成する。具体的には、出演者名から決定される表示画面と、抽出画像の位置から決定される表示位置と、信頼度または類似度の少なくとも一方の情報とを用いて表示情報を生成する。表示情報生成部106は、検索部105による抽出画像特徴量と代表特徴量とのマッチング結果および信頼度に基づいて、表示情報を出演者名と同時に表示する表示情報を作成する。基本的には、信頼度が高い表示情報は、より目立つように表示する。
ステップS29において、表示部103は、表示情報生成部106で生成された表示情報に基づいて、検索結果を表示する。
出演者名の表示までの処理は、「すべての関連画像」について以上の処理を実行すると本処理を終了する。
このように、ユーザが知りたいと思ったときに、表示画面に表示されている人物の情報を知ることができる。
次に、表示情報生成部106による具体的な表示情報の生成処理について説明する。
表示情報生成部106は、検索部105で抽出された出演者名から表示内容を決定する。例えば、表示内容は、出演者名である。
表示情報生成部106は、表示内容と検索部105で抽出画像の位置から表示位置を決定する。例えば、表示情報生成部106は、抽出された領域の上、右、下、左の順に表示内容が配置可能かを確認し、配置可能な位置を決定する。ここで配置可能とは、表示内容が表示画面の範囲を超えないこと、既に表示位置を決定済みの表示内容に重ならないこと、既に表示位置を決定済みの表示内容と近接していないこと、などの条件を満たす場合に配置可能と判断する。
表示情報生成部106は、検索部105が照合の際に用いた代表特徴量の信頼度と、抽出画像特徴量と代表特徴量の照合の際に算出した類似度との少なくとも一方からなる精度を基に表示方法を決定する。表示方法を決定する精度は、信頼度と類似度の両方を用いて精度Aを計算する場合には、信頼度C、類似度S、係数をα、βとして、次式(13)に示すように双方の値を乗算してもよい。あるいは、次式(14)に示すように、信頼度と類似度のそれぞれに重み付けをして和算してもよい。
例えば、上記式(14)を用いて、精度Aを出演者名のフォントサイズFsに反映させる場合、基準となる最大のフォントサイズFmとして、演者名のフォントサイズFsは、次式(15)により求めることができる。
図6は、上記式(15)において、表示情報のフォントサイズのみに着目した場合の表示情報の生成例を表にして示す。
図6に示すように、算出基準が「信頼度に基づく場合」は、係数α「1」かつ係数β「0」となり、表示情報生成例Fs=C*Fmとなる。また、算出基準が「類似度に基づく場合」は、係数α「0」かつ係数β「1」となり、表示情報生成例Fs=S*Fmとなる。
また、上記式(7)を用いる場合は、信頼度Cまたは類似度Sのいずれかを固定値にすることで同様に算出することができる。
以上、表示情報生成部106が、代表特徴量の信頼度Cまたは類似度Sの少なくとも一方を用いて表示情報を生成する表示情報生成例について説明した。表示情報は、表示位置、表示内容、フォントタイプ、フォントサイズ、文字色、背景色、枠線の有無、あるいは枠線の色など、文字列などを表示する際に必要な情報である。
表示情報生成部106は、検索部105で取得した出演者名と抽出画像に基づいて、信頼度または類似度を計算する。よって、抽出画像の領域は、信頼度や類似度を算出する際に影響することになる。抽出画像の領域が不適切な場合(例えば、顔の一部分しか領域に設定されなかった場合)、信頼度や類似度が正しく計算できないことがある。
図8は、表示部103がテレビの表示部である場合の表示領域と表示画像を説明する図である。図8において、テレビ画面である表示領域140に、番組の映像である表示画面141が表示される。また、表示画面141には、人物と出演者名142が表示され、その人物の顔を囲む領域が抽出画像143である。図8は、表示領域(テレビ画面)140いっぱいに表示画像(番組の映像)141を表示しない場合である。この場合は、表示画像141の周辺に出演者情報を表示する態様をとることも可能である。表示領域140いっぱいに表示画像141を表示しない場合の例としては、Picture-in-Pictureあるいは地上デジタル放送でのデータ放送の画面など、放送を縮小表示する場合が挙げられる。
上記表示方法には、例えば透過度を用いる方法がある。
表示方法は、例えば、信頼度と類似度の精度が低い場合、すなわち検索結果が正しくないと判断される場合には透過度を上げて表示を見えにくくする。一方、精度が高い場合は、すなわち検索結果が正しいと判断される場合には透過度を下げて表示をはっきり見えるようにする。これ以外の表示方法として、精度が高い場合には文字のサイズを大きくする方法、精度の違いを意味する色のテーブルを示すと同時に該当色で表示する方法がある。また、表示方法として、出演者名を表示する文字の背景色とのコントラストを精度により変えて表示する方法がある。
また、表示位置は、精度の高いものから順に決めることで、精度の高いものほど表示の優先度を高める方法がある。また、精度が低い場合は、表示位置と表示内容の位置を離して引き出し線を表示し、精度が低くなると引き出し線が長くなることで精度の違いを示す方法などが考えられる。さらに、検索結果が複数ある場合には、その精度の違いを共通の表示方法により対比させることもできる。つまり、動画像の表示の進行により精度が変化する場合は、複数の表示内容がひとつの表示内容に絞り込むようにすることもできる。
表示方法として、抽出した人物の領域を示す枠を表示に加えるとさらに視認性が向上する。また、表示方法は、領域の枠と表示内容の表示色を合わせるなどすると、さらに視認性が向上する。また、表示方法として、出演者情報保持部110に役名が登録されていれば、表示内容として役名を併記してもよい。
図9は、表示部103により表示される検索結果の表示の例を示す図である。
図9において、テレビ画面である表示画面150に二人の人物が映っており、左側の人物の顔領域153には出演者名151が併記される。同様に、右側の人物の顔領域154には出演者名152が併記される。この例では、図3の出演者情報の例における信頼度に従って、信頼度が高いほど大きな文字サイズで表示する例を示している。図9に示す方法は、出演者名152の方が出演者名151よりも大きく表示されることにより、ユーザは表示内容の正しさを直観的に判断することができる。また、出演者名の表示の方法は、文字サイズの大きさの変更に代えて、あるいは併用して、文字または背景色の変更、透過度、表示位置などの変更であってもよく、同様の効果を得ることができる。
以上詳細に説明したように、番組情報表示装置100は、番組取得部101が動画像と出演者名を含む出演者情報からなる番組を取得し、関連画像取得部107が出演者情報に基づいて、ネットワークから関連画像を取得する。特徴量算出部108は、関連画像から人物の領域を切り出した抽出画像の特徴量を算出する。代表特徴量決定部109は、抽出画像の特徴量と関連画像の入手先の情報に基づいて代表特徴量とその信頼度を決定し、出演者情報管理部104は、決定された代表特徴量および信頼度を出演者名と対応付けて出演者情報として管理する。一方、表示画像取得部102は、動画像を構成するフレームから表示画像を取得し、特徴量算出部111は、表示画像について抽出画像の特徴量を算出する。そして、検索部105は、特徴量算出部111により算出された抽出画像の特徴量と出演者情報保持部110に保持された代表特徴量との類似度を算出し、類似度が最大となる代表特徴量に関連付けられた出演者名を取得する。表示情報生成部106は、信頼度または類似度の少なくとも一方と検索部105により取得した出演者名と抽出画像の領域とに基づいて表示情報を生成する。表示部103は、出演者名を顔領域に関連付けて表示する。
このように、番組情報表示装置100は、動画像の番組情報から出演者情報を得てネットワークから出演者の顔画像を取得し画像特徴量を求める。番組情報表示装置100は、動画像から顔画像を抽出して得られる画像特徴量から出演者を特定して、出演者の情報を動画像に重畳して表示する。これにより、番組情報表示装置100は、事前に出演者の顔画像データベースを用意する必要がなく、出演者の領域に関連付けて出演者名を表示する際に、出演者の判定結果の正しさを直観的に判断できる効果が得られる。また、番組情報表示装置100は、動画像から顔画像を抽出して得られる画像特徴量から出演者を特定する際に、動的に検索するデータベースに基づいた信頼度を反映させ、ノイズが少なく、精度の良い検索を可能とする効果がある。例えば、ユーザが、番組視聴中に、登場人物と出演者名が一致しないとき、画面上の顔と対応付けて出演者名を知りたいという要求に応えることができる。この場合は、出演者の判定結果がどの程度信頼できるかを直感的に把握させることができる。
また、本実施の形態の代表特徴量決定部109は、関連画像が公式サイトから取得した画像であるかどうかを判定して関連画像に重み付けするので、特徴量の信頼度を高める効果を得ることができる。
(実施の形態2)
図10は、本発明の実施の形態2に係る番組情報表示装置を備える番組情報表示システムの構成を示す図である。図1と同一構成部分には同一符号を付して重複箇所の説明を省略する。
図10は、本発明の実施の形態2に係る番組情報表示装置を備える番組情報表示システムの構成を示す図である。図1と同一構成部分には同一符号を付して重複箇所の説明を省略する。
図10において、番組情報表示装置300は、図1の番組情報表示装置100にさらに検索情報保持部301を備えて構成される。
検索情報保持部301は、検索部105が検索した結果である、代表画像特徴量、信頼度、抽出画像の領域、類似度、および出演者名を保持する。
図11は、番組情報表示装置300の出演者名の表示までの処理を示すフローチャートである。図5に示すフローと同一処理を行うステップには同一ステップ番号を付して重複箇所の説明を省略する。
ステップS23において、ループの始端と終端において「すべての関連画像」について以下の処理を繰り返す。
ステップS31において、検索部105は、抽出画像の領域と近接する抽出画像の領域が検索情報保持部301に登録されているか否かを確認する。
ステップS32において、検索部105は、抽出画像の領域と近接する抽出画像の領域が検索情報保持部301に登録されている場合、ステップS33において、検索部105は、抽出画像特徴量と代表特徴量の照合を行い、類似度を算出してステップS26に進む。
検索部105は、抽出画像の領域と近接する抽出画像の領域が検索情報保持部301に登録されていない場合は、ステップS24に以下に進み、図5の出演者名を決定するステップS27までと同様である。
ステップS27において、検索部105は、該当する代表特徴量に関連付けられている出演者名を検索結果として保持する。
ステップS34において、検索情報保持部301は、出演者名を決定した後に、代表画像特徴量、信頼度、抽出画像の領域、類似度、および出演者名を保持してステップS28に進む。
ここで、上記ステップS33において、検索部105は、最大となる類似度を抽出してステップS26に進むことになる。この場合、ステップS26において、検索部105は、検索情報保持部301に登録されている類似度と比較することになる。検索部105は、予め定めた閾値以内で、類似度がわずかに下がる場合は特徴量の比較における誤差と考えられるため、大きい方の類似度を保持する。これにより、同一人物の領域を捕らえている間、類似度が上がっていく方向にのみ作用させることができる。検索部105は、予め定めた閾値を超えて、類似度が大きく下がる場合は、ほぼ同一となる領域に別の出演者が映し出されていると判断できる。この判断から、検索結果を保持する処理(ステップS34の処理)は、無効のデータを登録、すなわちその抽出領域での登録データを破棄する処理となる。
このように、本実施の形態では、検索部105が検索した結果を保持する検索情報保持部301を有する。検索部105は、検索情報保持部301に保持された検索結果に対して出演者情報に基づいて検索を行う。これにより、検索部105は、抽出画像と登録されているすべての代表画像の特徴量の類似度とを比較する必要がなくなるために、処理を高速化することが可能となる。
(実施の形態3)
図12は、本発明の実施の形態3に係る番組情報表示装置を備える番組情報表示システムの構成を示す図である。本実施の形態は、図1と同一構成部分には同一符号を付して重複箇所の説明を省略する。
図12は、本発明の実施の形態3に係る番組情報表示装置を備える番組情報表示システムの構成を示す図である。本実施の形態は、図1と同一構成部分には同一符号を付して重複箇所の説明を省略する。
図12において、番組情報表示システムは、デジタルテレビジョン受信機である番組情報表示装置400、インターネットまたは専用回線からなるネットワーク200、画像検索サイトである画像検索装置500、掲載するウェブページを公開している一般サイトである画像サーバ220、番組の公式サイトである番組情報サーバ230、番組表を掲載するサイトである番組表サーバ240、および番組を放送する放送局250を備えて構成される。
番組情報表示装置400は、番組取得部101、表示画像取得部102、表示部103、検索部105、表示情報生成部106、および特徴量算出部111を備えて構成される。
画像検索装置500は、出演者情報管理部104、関連画像取得部107、特徴量算出部108、代表特徴量決定部109、出演者情報保持部110、画像情報保持部501、および画像検索部502を備えて構成される。
出演者情報管理部104は、番組情報から出演者名、公式サイトのURLを抽出する。出演者情報管理部104は、代表特徴量決定部109から得られる関連画像に関する代表特徴量および信頼度を、出演者名と対応付けて出演者情報保持部110に保持する。
関連画像取得部107は、ネットワーク200と通信して画像を取得する。関連画像取得部107は、ネットワーク200に接続して出演者情報を基に1つ以上の関連画像を取得する。
特徴量算出部108は、画像から人物の領域を切り出した抽出画像の特徴量を算出する。
代表特徴量決定部109は、特徴量に重み付けをして比較する。代表特徴量決定部109が行う特徴量の重み付けは、前記図7の代表特徴量の算出例と同様にして求めることができる。なお、特徴量算出部108は、特徴量を算出するもので、代表特徴量決定部109は、特徴量算出部108により算出された特徴量から代表特徴量を決定するものである。代表特徴量決定部109は、1つ以上の特徴量から代表特徴量および信頼度を決定する。
出演者情報保持部110は、出演者情報を保持するメモリである。出演者情報保持部110は、例えば図3に示す出演者情報を保持する。
上記出演者情報管理部104、特徴量算出部108、代表特徴量決定部109、および画像検索部502は、CPU等からなり番組情報表示処理の実行を含む装置全体の制御を行う。上記CPUは、ROM、RAMおよびEEPROMなどを備え、プログラム、通信制御データ、さらに画像検索装置の識別コード等の種々のデータを記憶する。また、上記メモリには、出演者情報保持部110の出演者情報、および画像情報保持部501の画像情報が格納される。
本実施の形態の画像検索装置500は、図1の番組情報表示装置100の出演者情報管理部104、検索部105、関連画像取得部107、特徴量算出部108、代表特徴量決定部109、および出演者情報保持部110に加えて、画像情報保持部501および画像検索部502を備える構成を採る。なお、実施の形態1の番組情報表示装置100、または実施の形態2の番組情報表示装置300に、本実施の形態の画像検索装置500を組合わせる態様でもよい。
以上の構成において、画像検索装置500の関連画像取得部107は、URLのリンクなどを基にネットワーク200経由で画像を取得する。関連画像取得部107は、取得した画像と、該当画像の説明あるいは該当ページの内容から得られるキーワードとその画像のURLとを画像情報保持部501に保持する。
画像検索部502は、画像を検索する際、ネットワーク200経由で番組情報表示装置400から番組情報を受け取り、受け取った番組情報を基に画像情報保持部501から画像情報として該当するURLを返す。
特徴量算出部108は、画像を収集する際に、画像の特徴量を求める。出演者情報管理部104は、代表特徴量と出演者名と信頼度を出演者情報保持部110に保持する。あるいは、特徴量算出部108は、画像を検索する際に、画像の特徴量を求め、代表特徴量決定部109が、代表特徴量と信頼度を決定してもよい。
このように構成することで、番組情報表示装置400に代表特徴量を決定するまでの処理がなくなる。検索部105は、出演者名をキーワードとして、ネットワーク113を介して代表特徴量と信頼度を受け取ることになる点が、実施の形態1からの変更となる。
このように、本実施の形態では、代表特徴量を決定するまでの処理を画像検索装置500で行うことにより、機能の分散による番組情報表示装置400の処理の軽減と高速化が期待できる。
なお、本実施の形態では、画像情報保持部501と出演者情報保持部110を個々に説明したが、これらが同一の構成であってもよい。また、画像検索装置500は、番組情報を番組情報表示装置400から受け取る例について説明した。しかし、番組情報を番組情報サーバ230から受け取って、代表特徴量を決定する処理を事前に実行し、番組情報表示装置400から出演者名と番組名を受け取るようにしてもよい。
以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。上記各実施の形態では、放送番組について説明したが、番組情報を用いる装置および方法であればよく、放送番組に限定されるものではない。
また、本実施の形態では、番組情報表示装置、および番組情報表示方法という名称を用いた。しかし、これは、説明の便宜上であり、番組情報表示装置は画像検索装置、番組再生装置、番組情報表示方法は番組情報検索方法等であってもよい。
さらに、上記番組情報表示装置および方法を構成する各部、例えば番組取得部、出演者情報保持部の種類、その数および接続方法などは限定されるものではない。
以上説明した番組情報表示装置および番組情報表示方法は、この番組情報表示方法を機能させるためのプログラムでも実現される。このプログラムはコンピュータで読み取り可能な記録媒体に格納されている。
本発明に係る番組情報表示装置および番組情報表示方法は、動画像から人物の領域を抽出し、出演者名を人物の領域に関連付けて表示するテレビ受信機、携帯電話、DVD再生機、パソコン、ゲーム機等の映像再生端末に適用することができる。
100、300、400 番組情報表示装置
101 番組取得部
102 表示画像取得部
103 表示部
104 出演者情報管理部
105 検索部
106 表示情報生成部
107 関連画像取得部
108、111 特徴量算出部
109 代表特徴量決定部
110 出演者情報保持部
111 特徴量算出部
200 ネットワーク
210、500 画像検索装置
220 画像サーバ
230 番組情報サーバ
240 番組表サーバ
250 放送局
301 検索情報保持部
501 画像情報保持部
502 画像検索部
101 番組取得部
102 表示画像取得部
103 表示部
104 出演者情報管理部
105 検索部
106 表示情報生成部
107 関連画像取得部
108、111 特徴量算出部
109 代表特徴量決定部
110 出演者情報保持部
111 特徴量算出部
200 ネットワーク
210、500 画像検索装置
220 画像サーバ
230 番組情報サーバ
240 番組表サーバ
250 放送局
301 検索情報保持部
501 画像情報保持部
502 画像検索部
Claims (5)
- 動画像と出演者名を含む出演者情報からなる番組を取得する番組取得部と、
前記出演者情報に基づいて、ネットワークから関連画像を取得する関連画像取得部と、
前記関連画像から人物の領域を切り出した抽出画像の特徴量を算出する第1特徴量算出部と、
前記抽出画像の特徴量と前記関連画像の入手先の情報に基づいて代表特徴量とその信頼度を決定する代表特徴量決定部と、
決定された前記代表特徴量及び信頼度を前記出演者名と対応付けて出演者情報として管理する出演者情報管理部と、
前記動画像を構成するフレームから表示画像を取得する表示画像取得部と、
前記表示画像について前記抽出画像の特徴量を算出する第2特徴量算出部と、
前記第2特徴量算出部により算出された前記抽出画像の特徴量と前記出演者情報管理部に保持された前記代表特徴量との類似度を算出し、前記類似度が最大となる代表特徴量に関連付けられた出演者名を取得する検索部と、
前記信頼度又は前記類似度の少なくとも一方と前記検索部により取得した前記出演者名と前記抽出画像の領域とに基づいて表示情報を生成する表示情報生成部と、
前記表示画像及び前記表示情報を表示する表示部と、
を備える番組情報表示装置。 - 前記関連画像取得部は、前記ネットワーク上のサイトから番組出演者の関連画像を取得し、
前記代表特徴量決定部は、取得先の前記サイトに応じて前記関連画像に重み付けして前記信頼度を決定する請求項1記載の番組情報表示装置。 - 前記表示情報生成部は、前記信頼度又は前記類似度に基づいて、透過度、表示色、文字サイズ、又は表示位置の少なくともいずれか一つを変更する表示情報を生成する請求項1記載の番組情報表示装置。
- 前記検索部による検索結果を保持する検索情報保持部をさらに備え、
前記検索部は、前記検索情報保持部に保持された検索結果に対して前記出演者情報に基づいて検索を行う請求項1記載の番組情報表示装置。 - 動画像と出演者名を含む出演者情報からなる番組を取得するステップと、
前記出演者情報に基づいて、ネットワークから関連画像を取得するステップと、
前記関連画像から人物の領域を切り出した抽出画像の特徴量を算出する第1特徴量算出ステップと、
前記抽出画像の特徴量と前記関連画像の入手先の情報に基づいて代表特徴量とその信頼度を決定するステップと、
決定された前記代表特徴量及び信頼度を前記出演者名と対応付けて出演者情報として管理するステップと、
前記動画像を構成するフレームから表示画像を取得するステップと、
前記表示画像について前記抽出画像の特徴量を算出する第2特徴量算出ステップと、
前記第2特徴量算出ステップにより算出された前記抽出画像の特徴量と保持された前記代表特徴量との類似度を算出し、前記類似度が最大となる代表特徴量に関連付けられた出演者名を取得するステップと、
前記信頼度又は前記類似度の少なくとも一方と前記検索部により取得した前記出演者名と前記抽出画像の領域とに基づいて表示情報を生成するステップと、
前記表示画像及び前記表示情報を表示するステップと
を有する番組情報表示方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008076310A JP2009232250A (ja) | 2008-03-24 | 2008-03-24 | 番組情報表示装置および番組情報表示方法 |
PCT/JP2009/001274 WO2009119063A1 (ja) | 2008-03-24 | 2009-03-23 | 番組情報表示装置および番組情報表示方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008076310A JP2009232250A (ja) | 2008-03-24 | 2008-03-24 | 番組情報表示装置および番組情報表示方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009232250A true JP2009232250A (ja) | 2009-10-08 |
Family
ID=41113274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008076310A Pending JP2009232250A (ja) | 2008-03-24 | 2008-03-24 | 番組情報表示装置および番組情報表示方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2009232250A (ja) |
WO (1) | WO2009119063A1 (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011158406A1 (ja) * | 2010-06-16 | 2011-12-22 | パナソニック株式会社 | 映像検索装置、映像検索方法、記録媒体、プログラム、集積回路 |
JP2012231404A (ja) * | 2011-04-27 | 2012-11-22 | Toshiba Corp | 画像処理装置及び画像処理方法 |
JP2013012913A (ja) * | 2011-06-29 | 2013-01-17 | Mitsubishi Electric Corp | デジタル放送受信装置及びデジタル放送受信方法 |
JP2013073392A (ja) * | 2011-09-27 | 2013-04-22 | Fujitsu Ltd | 表示制御装置、表示制御プログラムおよび表示制御方法 |
JP2014119975A (ja) * | 2012-12-17 | 2014-06-30 | Nippon Hoso Kyokai <Nhk> | 映像用メタデータ付与装置及びプログラム |
JP2016046636A (ja) * | 2014-08-21 | 2016-04-04 | 日本電気株式会社 | 動作制御装置、動作制御方法、および動作制御プログラム |
JP2016054504A (ja) * | 2015-11-04 | 2016-04-14 | 三菱電機株式会社 | デジタル放送受信装置及びデジタル放送受信方法 |
JP2017033390A (ja) * | 2015-08-04 | 2017-02-09 | 日本放送協会 | 画像解析装置及びプログラム |
JP6161224B1 (ja) * | 2016-12-28 | 2017-07-12 | アンバス株式会社 | 人物情報表示装置、人物情報表示方法及び人物情報表示プログラム |
WO2017134738A1 (ja) * | 2016-02-02 | 2017-08-10 | 三菱電機株式会社 | レコーダ装置および映像監視システム |
WO2019159333A1 (ja) * | 2018-02-16 | 2019-08-22 | マクセル株式会社 | 携帯情報端末、情報提示システム及び情報提示方法 |
JP2021516501A (ja) * | 2018-10-18 | 2021-07-01 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 映像に基づく情報取得方法及び装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6393635B2 (ja) * | 2015-03-09 | 2018-09-19 | 株式会社鳥山研究室 | 番組再生装置及び番組再生システム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4940712B2 (ja) * | 2006-03-14 | 2012-05-30 | ソニー株式会社 | 番組受信装置、番組受信方法、番組受信方法のプログラム及び番組受信方法のプログラムを記録した記録媒体 |
JP5091529B2 (ja) * | 2007-04-10 | 2012-12-05 | 株式会社東芝 | 電子機器および録画制御方法 |
-
2008
- 2008-03-24 JP JP2008076310A patent/JP2009232250A/ja active Pending
-
2009
- 2009-03-23 WO PCT/JP2009/001274 patent/WO2009119063A1/ja active Application Filing
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011158406A1 (ja) * | 2010-06-16 | 2011-12-22 | パナソニック株式会社 | 映像検索装置、映像検索方法、記録媒体、プログラム、集積回路 |
JPWO2011158406A1 (ja) * | 2010-06-16 | 2013-08-19 | パナソニック株式会社 | 映像検索装置、映像検索方法、記録媒体、プログラム、集積回路 |
US8718444B2 (en) | 2010-06-16 | 2014-05-06 | Panasonic Corporation | Video search device, video search method, recording medium, program, and integrated circuit |
JP5632472B2 (ja) * | 2010-06-16 | 2014-11-26 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 映像検索装置、映像検索方法、記録媒体、プログラム、集積回路 |
JP2012231404A (ja) * | 2011-04-27 | 2012-11-22 | Toshiba Corp | 画像処理装置及び画像処理方法 |
JP2013012913A (ja) * | 2011-06-29 | 2013-01-17 | Mitsubishi Electric Corp | デジタル放送受信装置及びデジタル放送受信方法 |
JP2013073392A (ja) * | 2011-09-27 | 2013-04-22 | Fujitsu Ltd | 表示制御装置、表示制御プログラムおよび表示制御方法 |
JP2014119975A (ja) * | 2012-12-17 | 2014-06-30 | Nippon Hoso Kyokai <Nhk> | 映像用メタデータ付与装置及びプログラム |
JP2016046636A (ja) * | 2014-08-21 | 2016-04-04 | 日本電気株式会社 | 動作制御装置、動作制御方法、および動作制御プログラム |
JP2017033390A (ja) * | 2015-08-04 | 2017-02-09 | 日本放送協会 | 画像解析装置及びプログラム |
JP2016054504A (ja) * | 2015-11-04 | 2016-04-14 | 三菱電機株式会社 | デジタル放送受信装置及びデジタル放送受信方法 |
WO2017134738A1 (ja) * | 2016-02-02 | 2017-08-10 | 三菱電機株式会社 | レコーダ装置および映像監視システム |
JP6161224B1 (ja) * | 2016-12-28 | 2017-07-12 | アンバス株式会社 | 人物情報表示装置、人物情報表示方法及び人物情報表示プログラム |
JP2018106631A (ja) * | 2016-12-28 | 2018-07-05 | アンバス株式会社 | 人物情報表示装置、人物情報表示方法及び人物情報表示プログラム |
WO2018123440A1 (ja) * | 2016-12-28 | 2018-07-05 | アンバス株式会社 | 人物情報表示装置、人物情報表示方法及び人物情報表示プログラム |
US10657417B2 (en) | 2016-12-28 | 2020-05-19 | Ambass Inc. | Person information display apparatus, a person information display method, and a person information display program |
WO2019159333A1 (ja) * | 2018-02-16 | 2019-08-22 | マクセル株式会社 | 携帯情報端末、情報提示システム及び情報提示方法 |
US11647370B2 (en) | 2018-02-16 | 2023-05-09 | Maxell, Ltd. | Mobile information terminal, information presentation system and information presentation method |
JP2021516501A (ja) * | 2018-10-18 | 2021-07-01 | バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド | 映像に基づく情報取得方法及び装置 |
JP7231638B2 (ja) | 2018-10-18 | 2023-03-01 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 映像に基づく情報取得方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2009119063A1 (ja) | 2009-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009232250A (ja) | 番組情報表示装置および番組情報表示方法 | |
EP2417767B1 (en) | Apparatus and method for providing information related to broadcasting programs | |
JP5740814B2 (ja) | 情報処理装置および方法 | |
JP5651231B2 (ja) | コンテンツを決定し検索するためのメディアフィンガープリント | |
US8112420B2 (en) | Information search system, information processing apparatus and method, and information search apparatus and method | |
US8466961B2 (en) | Apparatus and method for outputting video images, and purchasing system | |
JP2006324809A (ja) | 情報処理装置,情報処理方法,およびコンピュータプログラム | |
JP2009043156A (ja) | 番組検索装置および番組検索方法 | |
JP6202815B2 (ja) | 文字認識装置および文字認識方法並びに文字認識プログラム | |
TW200910128A (en) | Keyword extraction method | |
US20030237092A1 (en) | Web page display apparatus | |
KR20130123750A (ko) | 이미지에 기반하여 동영상 서비스를 제공하는 시스템 및 방법 | |
CN108886640B (zh) | 信息提供装置、接收装置、信息提供系统、信息提供方法及程序 | |
TW200834355A (en) | Information processing apparatus and method, and program | |
US20110137896A1 (en) | Information processing apparatus, predictive conversion method, and program | |
US20020067856A1 (en) | Image recognition apparatus, image recognition method, and recording medium | |
JP2008129884A (ja) | 情報検索システム及びその方法並びにそれに用いる放送受信機 | |
US20150020087A1 (en) | System for Identifying Features in a Television Signal | |
US20120150990A1 (en) | System and method for synchronizing with multimedia broadcast program and computer program product thereof | |
JP6150780B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5335500B2 (ja) | コンテンツ検索装置及びコンピュータプログラム | |
CN112445921B (zh) | 摘要生成方法和装置 | |
JP2009188886A (ja) | 情報処理装置および情報処理装置用のプログラム | |
JP2010020630A (ja) | 動画検索装置、動画検索方法及びコンピュータプログラム | |
JP6192224B2 (ja) | 注目キーワード情報抽出装置およびそのプログラム |