JP4292762B2 - Specific image detection apparatus, specific image detection method, program and recording medium, and specific image detection system - Google Patents

Specific image detection apparatus, specific image detection method, program and recording medium, and specific image detection system Download PDF

Info

Publication number
JP4292762B2
JP4292762B2 JP2002221838A JP2002221838A JP4292762B2 JP 4292762 B2 JP4292762 B2 JP 4292762B2 JP 2002221838 A JP2002221838 A JP 2002221838A JP 2002221838 A JP2002221838 A JP 2002221838A JP 4292762 B2 JP4292762 B2 JP 4292762B2
Authority
JP
Japan
Prior art keywords
image
detecting
feature amount
candidate
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002221838A
Other languages
Japanese (ja)
Other versions
JP2004062664A (en
JP2004062664A5 (en
Inventor
彰彦 貝野
哲二郎 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002221838A priority Critical patent/JP4292762B2/en
Publication of JP2004062664A publication Critical patent/JP2004062664A/en
Publication of JP2004062664A5 publication Critical patent/JP2004062664A5/ja
Application granted granted Critical
Publication of JP4292762B2 publication Critical patent/JP4292762B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、連続するフレーム単位の画像からなる映像に含まれる静止画像から特定の画像を検出する特定画像検出装置、特定画像検出方法、プログラム及び記録媒体、並びに特定画像検出システムに関する。
【0002】
【従来の技術】
従来、使用者(ユーザ)にとって重要である情報を予め登録しておき、その登録情報の特徴から画像を検索する技術がある。
【0003】
例えば、特開2000−308017号公報には、限られた時間において関連する映像を効率よく視聴する映像視聴装置が開示されている。この公報に記載の映像視聴装置は、動画像信号及び音声信号を含む入力映像信号を記憶する入力映像記憶手段と、この入力映像記憶手段に記憶された所定の入力映像信号を所定位置から再生する映像再生手段と、その入力映像信号の特徴値を算出する算出手段と、この算出手段により算出された特徴値を記憶する特徴値記憶手段と、算出手段からの特徴値が特徴値記憶手段の特徴値のいずれかと類似するかを検索し、類似した場合にこれらの特徴値が関連していることを示す映像関連情報を作成する映像検索手段と、映像関連情報を記憶する関連情報記憶手段と、この関連情報記憶手段が関連情報を記憶したときに関連情報の存在を表示して視聴者に通知する通知手段と、通知された関連情報が示す特徴値に対応する映像信号の再生を要求する要求信号を入力する入力手段と、要求された映像信号を再生する挿入手段とを有している。これにより、記憶された映像信号の中から現在視聴している映像に関連する映像信号を検出して関連映像信号を視聴することができ、限られた時間において関連する映像を効率よく視聴することができる。
【0004】
また、特開平10−149373号公報には、計算機中に大量の画像情報を蓄積・管理し、検索・利用を行う画像データベースシステムの検索のための画像蓄積・管理装置及び画像インデックス作成方法が開示されている。この公報に記載の画像蓄積・管理装置においては、原画像を入力する入力手段と、入力された原画像を蓄積する蓄積手段と、原画像の視覚特徴に基づいて領域分割をして領域分割情報を生成する領域分割手段と、原画像を格子状に分割し分割情報を生成するブロック分割手段と、これらの分割情報を入力し、各格子毎に代表領域番号を決定し配列化し、領域分割された領域毎に色情報を含む領域属性情報を抽出し画像インデックス情報を記述するインデックス生成手段と、画像インデックス情報を格納する格納手段とを有する。これにより、画像に対して利用者が持っている視覚的な手がかりを利用して画像を検索することができる。
【0005】
【発明が解決しようとする課題】
しかしながら、上述の公報に記載の技術等の従来の技術においては、様々なパターンの画像の変化から目的の画像を効率よく検出する手法は確立されていない。即ち、様々なパターンの画像において、目的の画像を特定する特徴を示す物理量が得られていないこと、及び目的の画像を検索する際の厳密な検索が行えないこと等により、目的の画像を高効率で検出することができないという問題点がある。
【0006】
本発明は、このような従来の実情に鑑みて提案されたものであり、連続する画像中から高効率で目的とする特定の画像をリアルタイムに検出することができる特定画像検出装置、特定画像検出方法、プログラム及び記録媒体、並びに特定画像検出システムを提供することを目的とする。
【0007】
【課題を解決するための手段】
上述した目的を達成するために、本発明に係る特定画像検出装置は、連続するフレーム単位の画像からなる映像に含まれる静止画部分を含む特定の画像を検出する特定画像検出装置であって、登録画像における特性が異なる1以上の特徴量を記憶する記憶手段と、フレーム画像とこれに時間的に近接する近接フレーム画像との間の輝度変化の割合を算出し、該輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出する候補画像検出手段と、上記候補画像における特性が異なる1以上の特徴量を検出する特徴量検出手段と、上記候補画像の特徴量と、上記登録画像の特徴量との類似度が所定の閾値以上であるとき、該候補画像を特定画像として検出する検出手段とを有し、上記記憶手段には、上記登録画像の特徴量と上記類似度の閾値とからなるデータが記憶され、さらに、上記検出手段により検出された特定画像に対する使用者の評価を入力する入力手段と、上記入力手段を介して入力される使用者の評価に基づいて上記記憶手段の上記類似度の閾値を書き換える書き換え手段とを有する。
【0008】
本発明においては、輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出し、予め、ユーザ等により登録した登録画像に類似する候補画像を特定画像として検出することにより、ユーザにとって重要である等の理由で登録された画像を高効率に選択して検出することができ、候補画像を検出してから特徴量により画像を特定するため、誤検出の頻度を軽減することができる。
【0009】
また、上記記憶手段に記憶される特徴量は、上記登録画像における輝度情報、色情報、エッジ量、エッジ密度、輝度ヒストグラム、上記登録画像の静止時間、及び上記登録画像を含む所定期間の映像に含まれる効果音に関する情報のうち1以上の情報を含むものとすることができ、複数の異なる特性の特徴量を使用して類似度を判定することにより、更に正確に登録画像を検出することができる。例えば、テレビジョン映像から特定画像を検出する場合は、類似度の判定に輝度ヒストグラム及び静止時間を使用することにより、ノイズが多いテレビジョン映像等から特定画像を検出する場合にもロバスト性を向上することができる。
【0010】
更に、上記登録画像は使用者が指定した画像であって、上記特徴量検出手段は、上記使用者が指定した画像である登録画像における特性が異なる1以上の特徴量し、上記記憶手段は、上記特徴量検出手段により検出された上記登録画像の特徴量を記憶することができ、必要に応じて使用者は登録画像を随時登録することができる。
【0011】
更にまた、上記記憶手段は、上記登録画像の特徴量と上記類似度の閾値とからなるデータを有し、上記検出手段により検出された特定画像に対する使用者の評価を入力する入力手段と、上記入力手段を介して入力される使用者の評価に基づいて上記記憶手段の上記類似度の閾値を書き換える書き換え手段とを有することができ、使用者の評価によって類似度の閾値が書き換えられるため、更に誤検出が低減される。
【0012】
また、上記検出手段により検出された特定画像を表示手段に表示する提示手段を有することができる。
【0013】
更に、映像を供給する外部機器に接続され、上記検出手段は、上記外部機器から供給される映像から上記特定画像を検出することができる。
【0014】
更にまた、少なくとも2つのチューナ手段を有し、上記提示手段は、一方のチューナ手段により選局された受信チャンネルの映像を上記表示手段に表示し、上記検出手段は、他方のチューナ手段により選局された受信チャンネルの映像から上記特定画像を検出することができ、使用者は、特定画像を検出させながら、テレビジョン映像を視聴することができる。
【0015】
また、少なくとも2つのチューナ手段を有し、上記検出手段は、一方のチューナ手段により選局された受信チャンネルの映像から上記特定画像を検出し、上記提示手段は第1の表示手段及び第2の表示手段に接続され、他方のチューナ手段により選局された受信チャンネルの映像を該第1の表示手段に表示し、上記特定画像を該第2の表示手段に表示することができ、使用者は一方の表示手段でテレビジョン映像を視聴しながら、使用者が見ているテレビジョン映像とは異なるチャンネルのテレビジョン映像等から特定画面を検出させ、他方の表示手段により、検出された特定画像を見ることができる。
【0016】
更に、上記検出手段は、時分割で選局された複数のチャンネルの映像から上記特定画像を検出することができる。
【0017】
更にまた、上記提示手段は、上記検出手段により検出された上記特定画像を複数保持し、該複数の特定画像を縮小して上記表示手段に同時に表示してもよい。
【0018】
また、上記フレーム画像を予め規定したサイズのブロックに分割するブロック分割手段を有し、上記検出手段は、フレーム画像と上記近接フレーム画像とで対応するブロック間の輝度変化が所定の閾値以下であるとき、該フレーム画像を候補画像として検出することができる。
【0019】
更に、上記ブロック分割手段により分割されたブロック毎に輝度ヒストグラムを算出する輝度ヒストグラム算出手段を有し、上記候補画像検出手段は、フレーム画像と上記近接フレーム画像とで対応するブロック間の輝度ヒストグラムの相関係数が所定の閾値以下であるブロックの数が所定の閾値以下であるとき、該フレーム画像を候補画像として検出することができる。
【0020】
更にまた、上記検出手段により特定画像が検出された際に使用者に知らせる通知手段を有してもよく、これにより、使用者の利便性を向上する。
【0021】
本発明に係る特定画像検出方法は、連続するフレーム単位の画像からなる映像に含まれる静止画部分を含む特定の画像を検出する特定画像検出装置の特定画像検出方法であって、コンピュータに、フレーム画像とこれに時間的に近接する近接フレーム画像との間の輝度変化の割合を算出し、該輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出する候補画像検出工程と、上記候補画像における特性が異なる1以上の特徴量を検出する候補画像特徴量検出工程と、上記候補画像の特徴量と、記憶手段に記憶された登録画像における特性が異なる1以上の特徴量との類似度が上記記憶手段に記憶された所定の閾値以上であるとき、該候補画像を特定画像として検出する検出工程とを実行させ、上記検出工程では、上記登録画像の特徴量と上記候補画像の特徴量との類似度が所定の閾値以上である特定画像に対する使用者の評価を入力する入力工程と、上記入力工程にて入力される使用者の評価に基づいて上記記憶手段の上記類似度の閾値を書き換える書き換え工程とをコンピュータに実行させる。
【0022】
本発明に係るプログラム及びこれを記録した記録媒体は、連続するフレーム単位の画像からなる映像に含まれる静止画像から特定の画像を検出する動作をコンピュータに実行させるためのプログラム及びこれを記録した記録媒体あって、コンピュータに、フレーム画像とこれに時間的に近接する近接フレーム画像との間の輝度変化の割合を算出し、該輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出する候補画像検出工程と、上記候補画像における特性が異なる1以上の特徴量を検出する候補画像特徴量検出工程と、上記候補画像の特徴量と、記憶手段に記憶された登録画像における特性が異なる1以上の特徴量との類似度が上記記憶手段に記憶された所定の閾値以上であるとき、該候補画像を特定画像として検出する検出工程とを実行させ、上記検出工程では、上記登録画像の特徴量と上記候補画像の特徴量との類似度が所定の閾値以上である特定画像に対する使用者の評価を入力する入力工程と、上記入力工程にて入力される使用者の評価に基づいて上記記憶手段の上記類似度の閾値を書き換える書き換え工程とをコンピュータに実行させる。
【0023】
本発明に係る特定画像検出システムは、連続するフレーム単位の画像からなる映像に含まれる静止画部分を含む特定の画像を検出し、該特定画像を少なくとも1つの表示手段に表示する特定画像検出システムであって、少なくとも1つの表示手段と、登録画像における特性が異なる1以上の特徴量を記憶する記憶手段と、フレーム画像とこれに時間的に近接する近接フレーム画像との間の輝度変化の割合を算出し、該輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出する候補画像検出手段と、上記候補画像における特性が異なる1以上の特徴量を検出する特徴量検出手段と、上記候補画像の特徴量と、上記登録画像の特徴量との類似度が所定の閾値以上であるとき、該候補画像を特定画像として検出する検出手段とを具備する特定画像検出手段とを有し、上記記憶手段には、上記登録画像の特徴量と上記類似度の閾値とからなるデータが記憶され、上記特定画像検出手段は、さらに、上記検出手段により検出された特定画像に対する使用者の評価を入力する入力手段と、上記入力手段を介して入力される使用者の評価に基づいて上記記憶手段の上記類似度の閾値を書き換える書き換え手段とを有する。
【0024】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。この実施の形態は、本発明を、連続する画像中からユーザが指定した重要情報を有する特定画像を検出及び表示する特定画像検出システムに適用したものである。
【0025】
この特定画像検出システムにおいては、予めユーザが登録画像を登録し、テレビジョン(TV)放送等の映像に含まれる画像を検索し、登録画像に類似した特定画像を検出し、これをリアルタイムで表示(提示、呈示)するものである。ここで、登録画像との類似度判定が行われ、特定画像が検出されるが、検出結果の表示は様々なタイミングで行われるため、本実施の形態においては、ユーザが検出結果を評価する評価手段を設けるものとする。即ち、その時のユーザの状態によって、検出結果の評価が変化しても、検出結果に対するその時のユーザの評価をフィードバックさせることができる。これにより、例えば類似度判定における判定基準を変化させることができ、以降の検出に反映させることができる。こうしてユーザとのやり取りで、効率的に重要な情報(特定画像)を検出して表示することができる。
【0026】
図1は、本実施の形態の特定画像検出システムを示すブロック図である。図1に示すように、特定画像検出装置20に、例えばTV放送された映像からユーザが登録した特定画像を検出するものであって、ユーザが、例えば、TV放送、又はビデオ等の映像を視聴するメインモニタ12と、映像から検出した特定画像を表示するサブモニタ11とが接続され、特定画像検出システム30が構成されている。本実施の形態においては、通常のTV映像等を視聴する際に使用されるテレビ受像機等のメインモニタ12に加え、検出した特定画像を表示するサブモニタ11を使用することで効率的な表示を行う。
【0027】
一般に、TV放送は、受信可能な放送が複数であり、各放送局が独自のコンテンツを放送しているが、それらがユーザにとって見やすい順に並んでいないことは多々あるといえる。例えば、ニュース番組を例にとってみると、複数の放送局が同時刻にニュース番組を放送しているという場合、同じニュース番組であってもその内容は各放送局で異なる。その為、目的とするニュースを見落としてしまう可能性があり、一方、ユーザにとって個人的に興味がないニュースを観ているという場合も考えられる。ここで要求されるのは、複数の番組のある特定部分をユーザにとって重要なものから順に効率よく視聴できるシステムである。ニュース以外でも、例えば天気予報を観たいときに、ニュース番組の中でいつ始まるか分からないという理由から興味がないニュースを観ていなければならなくなったり、ユーザの住む地方とは別の地方のものまで観ることになったりしてしまう等の不便な点がある。更に、TV放送以外であって、外部機器から供給される他の映像を視聴している場合において、TV放送の特定の情報を視聴したい場合、他の映像の視聴を一旦停止しなければならず不便である。本発明の特定画像検出システムは、このような不便な点を解消し、番組を効率よく表示することを可能にするものである。
【0028】
ここで、本実施の形態においては、特定画像検出装置20が複数のチューナ手段を有し、一方のチューナ手段により選局された受信チャンネルの映像をメインモニタ12に表示し、他のチューナ手段により選局された受信チャンネルの映像から特定画像を検出してサブモニタ11に表示することができる。例えは、2つのチューナ手段を有するときは、TV放送には複数のチャンネルがあるため、ユーザが指定した複数のチャンネル又は全チャンネルを時分割で選局し、この時分割で選局した各チャンネルのTV映像から特定画像を検出することができる。また、メインモニタ12用のチューナ手段と、特定画像を検出するために全TVチャンネルに対応するチューナ手段を設けてもよい。
【0029】
また、サブモニタ11及びメインモニタ12にチューナ手段を設け、サブモニタ11及びメインモニタ12がTV放送を受信して特定画像検出装置20に映像を供給するものとしてもよい。また、特定画像検出システムにチューナ手段を有する外部機器を接続して映像を供給するものとしてもよい。なお、特定画像検出装置20には、外部機器として、例えばビデオデッキ、DVD、BS(Broadcast Satelite)デジタルチューナ等のSTB等を接続すれば、例えばメインモニタ12に各種映像を供給して視聴しながら、必要に応じてサブモニタ11又はメインモニタ12に特定画像を表示させることができる。
【0030】
以下、本実施の形態に係る特定画像検出装置について詳細に説明する。図2は、本実施の形態の特定画像検出装置におけるデータの流れを説明する説明図である。
【0031】
図2に示すように、特定画像検出装置20は、入力端子1を介して映像信号が供給される画像特徴量取得部(特徴量検出手段)3、遅延回路(DL)5及び静止判定部(候補画像検出手段)6と、静止判定部6から静止判定された候補画像が供給される画像特徴量取得部(特徴量検出手段)7と、入力端子2を介してユーザからの登録指示信号が供給された場合の入力画像(登録画像)の特徴量が供給され、これを記憶する特徴量テーブル(記憶手段)4と、特徴量テーブル4の特徴と画像特徴量取得部7から供給される候補画像の特徴量との類似度を判定し、登録画像と類似している候補画像を検出する検出手段である類似度判定部8と、類似後判定部8で類似していると判定された類似画像をサブモニタ11に供給すると共に、入力端子10を介してサブモニタ11に表示された類似画像に対するユーザの評価信号が供給され、この評価に応じて類似画像をメインモニタ12に供給する提示制御部(提示手段)9とから構成されている。
【0032】
ここでは、入力端子を介して映像信号(入力画像列)が供給されるものとしているが、上述したように、供給される映像信号は、装置内にチューナ手段を設け、これにより選局された受信チャンネルのTV映像であっても、外部から供給される映像であってもよい。
【0033】
遅延回路5は、入力されるフレーム単位の画像を、例えば1フレーム等、所定フレーム遅延して静止判定部6に供給する。静止判定部6は、入力フレーム画像と、遅延回路5から供給される入力画像より所定フレーム遅延された遅延フレームとの輝度変化が所定の閾値以下である場合、入力フレーム画像を候補画像であると判定する。ここで、候補画像は、静止画像又は静止画部分を含む画像である。ユーザが検出を希望する画像は登録画像として登録されるが、この登録画像が静止画像であるか、静止画部分を含む画像であるかによって、適宜上記閾値を設定するものとする。
【0034】
画像特徴量取得部3は、端子2を介して登録指示信号が供給されると、そのときの入力画像(登録画像)から特徴量を取得し、特徴量テーブル4に送る。特徴量テーブル4は、入力画像のうち、ユーザが重要である、必要である等の理由により登録したい登録画像の特徴量が記憶されるものである。
【0035】
また、画像特徴量取得手段7は、画像特徴量取得部3と同様に、候補画像から特徴量を取得する。なお、図2においては、画像検出装置20は、画像特徴量取得部3,7を備えるものとしたが、いずれか一方の画像特徴量取得部において取得した特徴量を使用するものとしてもよい。
【0036】
類似度判定部8は、特徴量テーブル4に記憶されている全ての特徴量と、候補画像から検出された特徴量とを比較し、類似度を判定する。具体的には、例えば、特徴量の類似度を所定の閾値(判定閾値)を使用して判定するため、特徴量テーブル4には、各登録画像の特徴量と共に、各特徴量に対する判定閾値が記憶されている。この類似度判定部8は、類似度が所定の判定閾値以上であった候補画像を類似画像として提示制御部9に出力し、サブモニタ11に表示させる。
【0037】
サブモニタ11は、ユーザに評価させるため、検出された類似画像を表示するモニタである。ユーザの評価は端子10を介して提示制御部9に入力される。そして、ユーザの評価を例えば複数用意しておき、この評価に基づき提示制御部9の制御を設定しておくことができる。
【0038】
提示制御部9は、ユーザ評価が端子10を介して入力されると、この評価に基づきサブモニタ11、メインモニタ12に出力する画像を制御すると共に特徴量テーブル4に記憶されているデータの書き換え等を行う。例えば、ユーザがサブモニタ11に表示された類似画像を見て、この類似画像がユーザの希望した画像(登録画像)であった場合、これを評価するユーザからの評価信号により、類似画像を特定画像としてメインモニタ12に出力するようにすること等ができる。一方、サブモニタ11に表示された類似画像が登録画像と異なる画像、即ち、誤検出である場合、誤検出であることを指摘するユーザからの評価信号により、提示制御部9は、この類似画像を検出した際の特徴量テーブル4に記憶されている判定閾値を書き換えるよう制御すること等ができる。このように、ユーザの評価に応じて判定閾値を書き換えることで、不要である画像、誤検出である画像が再び検出されることを防止することができる。更に、以前登録した登録画像であって不要になった場合等、不要の登録画像に類似する画像が検出された場合は、これを破棄するよう設定すること等ができる。
【0039】
また、本実施の形態の特定画像検出装置20は、提示制御部9により、類似画像をサブモニタ11に出力し、特定画像をメインモニタ12に出力するため、例えば、ユーザが天気予報に関する画像が必要であってこれを登録しておくことにより、特定画像検出装置20は、天気予報に関する画像を特定画像として検出するが、その間、ユーザは、メインモニタ12において、例えばビデオ等により映画を視聴したり、他のTV番組を視聴したりすることが可能であり、メインモニタ12で視聴していないいわゆる裏番組から登録画像を検出してサブモニタ11に表示することができる。
【0040】
次に、下記表1に、特徴量テーブル4に保存される特徴量の例を示す。
【0041】
【表1】

Figure 0004292762
【0042】
本実施の形態においては、上記表1に示す特徴量の中から、輝度ヒストグラムと静止時間とを使用する場合について説明する。ここで、例えば上記表1に示す例えば全ての特徴量を使用する等して特定画像を検出するものとしてもよいが、入力される映像に合わせ、例えば厳しい判定基準を設定することがロバスト性に影響することがある場合等を考慮して特徴量の種類及び判定基準(判定閾値)等は適宜設定するものとする。本実施の形態において、TV放送される映像から特定画像を検出する際に、輝度ヒストグラム及び静止時間を利用する理由としては、ノイズが入ることが予想されるTV放送においても、ロバスト性を向上するためである。また、以下の説明においては、検出する特定画像は静止画像とするが、上述したように、静止画部分を含む画像、即ち、例えば背景となる部分は動画であって、所定の領域のみが静止しているような場合等においても、同様に検出することができる。
【0043】
図3は、本実施の形態の特定画像検出装置における特定画像検出方法を示すフローチャートである。図3(a)に示すように、先ず、入力されるテレビジョン放映された映像等、連続する画像から候補画像(以下、静止画像という。)を検出するための静止判定が行われる(ステップS1)。一方、入力画像と共に、ユーザにより画像登録信号が入力された場合は、その入力画像を登録画像として登録するため、当該登録画像の特徴量を取得(検出)し(ステップS11)、この特徴量を特徴量テーブル4に記憶する(ステップS12)。この特徴量テーブル4には、ユーザから指定された登録画像の特徴量、即ち、本実施の形態においては、ユーザから登録が指示される毎に、その登録画像の輝度ヒストグラム及び静止時間が取得されて随時記憶され保存される。
【0044】
一方、入力画像から静止判定をして静止画像を検出した場合は、静止画像の特徴量を検出し、得られた特徴量は類似度判定部8に送られ、特徴量テーブル4に記憶されている全ての登録画像の特徴量と比較し、閾値を基に類似度判定が行われる(ステップS2)。本実施の形態においては、輝度ヒストグラムに対する後述する相関係数e、変化がない無変化ブロックの割合、及び図示しない静止カウンタのカウント値である静止時間を基に、類似度判定を行う。
【0045】
図4は、特徴量テーブル4を示す模式図である。図4に示すように、特徴量テーブル4には、各登録画像毎に識別番号(No.0、1、2・・・)が付され、各登録画像に対応する輝度ヒストグラム、静止時間、並びに相関係数、変化ブロックの割合、及び時間誤差等に関する判定閾値が記憶されている。
【0046】
図3に戻って、ステップS3において、登録画像と静止画像とが類似していると判定された場合、提示制御部9にこの画像のデータが送られ、サブモニタ11に表示指示が送られて表示される(ステップS3)。そして、本実施の形態においては、静止画像は表示された後、例えばユーザの注意を促すためのアラームを鳴らし、ユーザから、入力端子10を介して入力される評価を待つ待機状態となる(ステップS4)。一方、類似していないと判定された場合は次のフレームの処理へ進む。
【0047】
次に、表示された画像に対するユーザによる評価が行われる。ユーザの評価としては、上述したように、様々なものが考えられ、複数の評価を設定しておき、これに応じた処理を設定することができる。本実施の形態においては、表示された画像がユーザの指定した登録画像であると判定する(必要であると判定する)場合(Good)、及びユーザの指定した登録画像ではないと判定する(不要であると判定する)場合(Nogood)の2パターンとした場合について説明する。ここで、Nogoodの評価が入力された場合には、類似と判定した際に使用された特徴量テーブル4内の登録画像の判定閾値の値を変更(更新)し(ステップS6)、次のフレームの処理に進む。一方、Goodと評価され、類似画像が登録画像であると判定した場合は、この特定画像をメインモニタ12に出力し(ステップS7)、次のフレームの処理に進む。上述したように、ユーザの評価がNogoodである場合は、判定閾値の値を書き換え、類似と判定する基準を厳しくすることにより、以降の検出において、同様の誤検出が生じることを防止する。また、ここでは、特定画像をメインモニタ12に出力するものとしたが、メインモニタ12には出力せず例えばサブモニタ11に記憶手段を設けてこれを所定期間保持し、ユーザの都合で所望の時間に表示させるようにしてもよい。
【0048】
以下、本実施の形態における特定画像検出方法について更に詳細に説明する。先ず、画像特徴量取得部3における登録画像の特徴量取得方法について説明する。
【0049】
図5は、登録画像の特徴量取得方法を示すフローチャートである。図5では、フレーム(以下、iフレームという。)画像の画素値(F(i,pxl))が入力され、端子2を介してユーザから登録指示信号が入力された場合、即ち、iフレーム画像の特徴量取得の指示が出され、iフレーム画像を登録画像として登録する場合について説明する。本実施の形態においては、上述したように、登録画像の特徴量として、その輝度ヒストグラムと、静止時間とを取得し、特徴量メモリ4に記憶する。
【0050】
図5に示すように、先ず、iフレーム画像のデータが端子1を介して供給されると共に端子2を介して登録指示信号が供給され、iフレームが登録画像として選択されると、画像特徴量取得部3は、このiフレーム画像のデータを規定のブロックに分割し、各ブロック内で輝度値のヒストグラムを求め、得られた輝度ヒストグラムH(i,j)を保持する(ステップS21)。ここで、H(i,j)は、iフレームにおけるj番目のブロックの輝度ヒストグラムを示すものとする。更に、得られた輝度ヒストグラムを特徴量としてコピーし、特徴量テーブル4に保存する(ステップS22)。
【0051】
次に、フレーム番号をインクリメントし(ステップS23)、iフレームとは時間的に連続する(i+1)フレームの画素値(F(i+1,pxl))を入力する。画像特徴量取得部3は、iフレームと同様に、(i+1)フレーム画像においても、ブロック単位の輝度ヒストグラムH(i+1,j)を求めて保持する。
【0052】
そして、得られた輝度ヒストグラムH(i+1,j)と先に求めた輝度ヒストグラムH(i,j)との間で、空間的に対応するブロック間の相関係数eを下記式(1)により計算する。
【0053】
【数1】
Figure 0004292762
【0054】
そして、計算した相関係数eと、所定の閾値(Th_coef)とを比較する(ステップS26)。j番目のブロックにおける相関係数e(j)が閾値(Th_coef)以下ならば、これを変化ブロックとしてカウントし、カウントされた変化ブロックの割合e2(j)が閾値(Th_diff)未満ならば静止画像として静止カウンタのカウント値(stillcnt)の値をインクリメントし(ステップS27)、次のフレーム((i+2)フレーム)へ移り、ステップS23乃至ステップS27の処理を繰り返す。一方、変化ブロックの割合e2(j)が閾値(Th_diff)以上なら静止カウンタのカウント値を特徴量テーブル4に保存し(ステップS28)、終了する。ここで、静止カウンタのカウント値が画像特徴量取得部3で取得された登録画像の静止時間である。このようにして、画像特徴量取得部3は、登録画像に指定されたiフレーム画像の特徴量としてその輝度ヒストグラムと静止時間とを取得し、特徴量テーブル4に記憶させることができる。
【0055】
次に、静止判定部の静止画像検出方法について説明する。静止画像は、フレーム遅延回路5を通した遅延フレーム画像と入力フレーム画像とが静止判定部6に送られ、上述のステップS27と同様に、両者の変化ブロックの割合から静止しているか否かが判定されて静止画像(候補画像)が検出される。図6は、静止判定部6における静止画像の検出方法を示すフローチャートである。
【0056】
静止判定部6は、端子1を介して入力されたiフレーム画像を規定のブロックに分割し、各ブロック内で輝度値のヒストグラムを求め、得られた輝度ヒストグラムH(i,j)を保持する(ステップS31)。次に、フレーム番号を例えば1つインクリメントし(ステップS32)、(i+1)フレームの画素値(F(i+1,pxl))を入力し(ステップS33)、iフレームと同様に、(i+1)フレーム画像においても、ブロック単位の輝度ヒストグラムH(i+1,j)を求めて保持する(ステップS34)。
【0057】
そして、得られた輝度ヒストグラムH(i+1,j)と先に求めた輝度ヒストグラムH(i,j)との間で、空間的に対応するブロック間の相関係数e(j)を上記式(1)により計算し、この相関係数e(j)と、所定の閾値(Th_coef)とを比較し(ステップS35)、変化ブロックの割合を検出する(ステップS36)。j番目のブロックの相関係数e(j)が閾値(Th_coef)以下ならば、これを変化ブロックとしてカウントし、カウントされた変化ブロックの割合e2(j)が閾値(Th_diff)未満ならば、iフレーム画像の輝度ヒストグラムおよび静止カウンタのカウンタ値を保存し(ステップ37)、このiフレーム画像を静止画像とみなして、画像特徴量取得部7に送る。一方、変化ブロックの割合が閾値(Th_diff)以上なら、処理を終了し、次のフレームの処理に進む。
【0058】
静止画像とみなされ画像特徴量取得部7に送られたiフレーム画像は、上述の図5に示す特徴量取得部3の静止時間の取得と同様に静止時間がカウントされ、特徴量として取得される。
【0059】
なお、図6において、説明を簡単にするため、iフレームと(i+1)フレームとで対応するブロックの相関係数を比較するものとしたが、静止判定部6は、実際には、時間的に近接するフレーム間での相関が所定の閾値以下であるか否かを判定するものであり、例えば、図2に示す例では、静止判定部6には、入力フレーム画像(iフレーム画像)と、遅延回路5を介して、入力フレーム画像より所定フレーム遅延されたフレーム画像((i−2)フレーム画像)とが供給され、両者の間の相関が判定されている。
【0060】
次に、画像特徴量取得部3,7におけるヒストグラムの計算方法について説明する。本実施の形態においては、上述したように、静止判定部6の静止判定及び特徴量として輝度ヒストグラムを使用する。輝度ヒストグラムを計算するヒストグラム生成部は、例えば画像特徴量取得部3,7、及び静止判定部6に個別に用意されていてもよく、又は、図2において図示しない輝度ヒストグラム生成部を用意し、その輝度ヒストグラム生成部に必要に応じて画像のデータを送り、輝度ヒストグラムを生成するようにしてもよい。
【0061】
図7は、ヒストグラム計算及びこのヒストグラムをフレーム間で比較する方法を示すフローチャートである。ここでは、iフレームと(i−2)フレームとの間の輝度ヒストグラムを比較する場合について説明する。図7に示すように、先ず、入力されるフレーム画像(iフレーム画像とする。)を規定のサイズのブロックに分割する(ステップS41)。例えば、フレーム画像を例えば720×480ピクセル等とすることができ、ブロックサイズを例えば32×32ピクセル等とすることができる。そして、iフレームにおいて分割したj番目のブロックの輝度ヒストグラムH(i,j)を計算する。次に、既に計算済みの(i−2)フレームのj番目の輝度ヒストグラムH(i−2,j)を読み込み(ステップS43)、上記式(1)により、iフレームにおけるj番目のブロックの輝度ヒストグラムの相関係数e(i,j)を計算し(ステップS45)、閾値判定により変化ブロックであるか否かを判定する。このとき、変化ブロックであると判定された場合には、フラグE(i,j)に1を、無変化ブロックであると判定された場合には、フラグE(i,j)に0を立てる。輝度ヒストグラムH(i,j)は、(i+2)フレームとの相関係数を比較する際に使用するため保存し、カウンタjをインクリメントし(ステップS46)、全部ロックが終了しているか否かを判定し(ステップS47)、全部ロックについて変化ブロックの判定が終了していない場合は、ステップS42乃至ステップS47の処理を繰り返し、全てのブロックにおいて変化ブロックの判定がなされている場合は処理を終了する。こうして、得られた全部ロックのフラグE(i,j)の値を加算し、この値が所定値以下である場合は、iフレーム画像を静止画像と判定することができる。
【0062】
以下、本実施の形態の具体例として、天気予報番組を登録画像とし、これを検出する場合について説明する。天気予報番組の特徴として、以下に示すものがある。即ち、
1.毎回、同様の画面を組み合わせて構成される
2.毎回ほぼ同時刻に放送される
3、番組枠として設定されていないものが多く、番組表からは正確な開始時刻が不明
4.静止画像を使用する頻度が高い
5.地域の依存性など、ユーザ毎に重要とされる画面にばらつきがある
等の特徴を有する。
【0063】
このような天気予報番組は、同様の画像が繰り返し使用されているため、登録画像(登録画面)が長期に亘り使用可能である。また、天気予報番組は、おおよその開始時刻を知ることは可能だが、ニュース番組に含まれる等の状況で天気予報番組のみを正確に試聴することは困難であり、特に他局の放送を試聴しているとき等には、ユーザにとって関心が薄い内容を見ることになり極めて不便である。更に、ユーザが住む地域によって必要ではない情報となる内容もあることから、選択的に画像を抽出するメリットが大きい。
【0064】
ユーザは、番組試聴時に、希望する画像があれば登録指示を出す。図8(a)乃至(c)は、ユーザが登録指示を出した登録画像の一例を示す図であって、夫々東日本の予想天気、東日本の予想気温及び東日本の週間天気を示す画面の模式図である。
【0065】
ここでは、ユーザが関東地方の情報を重要とし、関連する画像を登録した場合について説明する。先ず、登録された画像に類似した画像が検出されるとサブ画面に検出結果として表示される。図9(a)は、サブ画面(検出画面)に表示される類似画像を示す模式図、図9(b)は、そのときのメインモニタ12での表示例、図9(c)は、検出された複数の特定画像を保存し、同時にサブモニタ11に表示した様子を示す模式図である。例えば、図9(b)に示すように、メインモニタ12で、ユーザが映画等、天気予報番組が表示されない映像を試聴していた場合に、図9(a)に示すように、予め登録しておいた登録画像と類似した画像が他局で放送された場合、この登録画像の類似画像が検出されてサブモニタ11に表示される。
【0066】
ここで、ユーザは検出結果の続きを試聴するか否かの判断を行い、例えば、ユーザが試聴する指示を出すとサブモニタ11に表示されていた検出画像がメインモニタ12が切り替わって表示されるようにすること等が可能である。ここで、ユーザに判断を委ねることでその場の状況によって不愉快な表示を行うことを防ぐことができる。また、登録画像とは異なる画面等が検出されユーザによって試聴を選択されなかった場合には、その検出結果に対応する登録画面の判定閾値を変化させることで、その後の誤検出を防止して更に検出効率を向上すると共に、画面に固有の精度が高い検出判定閾値を生成することができる。
【0067】
更に、本実施の形態においては、サブモニタ11を複数台用意し、図9(c)に示すように、検出された画像を保存し、縮小して過去の一覧としてリスト表示してもよい。制作者の意図を考えると、静止画像は、視聴者に注目してもらいたい重要な情報が含まれる場合が多い。更に、何らかの情報をその1枚で表現するために工夫された画像である。そのため、通常の動画における1フレームに比して、静止画像が有する情報量は多く、その1枚を表示するだけでも多くの情報伝達が可能となる。よって、保存すること、一定時間表示すること、及び縮小してリスト表示すること等により、使用者が後から振り返って情報を確認することができ、また、情報を整理する際に極めて便利である。
【0068】
また、チューナ手段を有するサブモニタ11を複数台用意し、各サブモニタ11のチューナを使用し、各サブモニタ11から映像信号を供給することにより、同時に検索できる放送局の数を増やすことができる。
【0069】
また、天気予報番組と同様の効果を奏する例として、ニュース番組のニュースタイトル画面等がある。ニュース番組では、ニュース毎にアナウンサのアンカショット(バストショット)とニュースタイトルのテロップが表示されることが多く、一定時間ほぼ変化がない状態が続く。また、ニュース番組に依存してテロップの演出及び背景等も一定であり、検出対象に好適である。更に、ニュース番組は、必ずしも番組表の時間通り放映されない場合があり、このような画像を登録することにより、任意の番組を見ながら、これとは異なる放送局のニュースタイトルを検出結果として知ることができ、ユーザにとって関心がある場合、又は関心がある内容である場合のみ視聴することが可能である。このような登録に適した登録画像としては、例えば、マーケット情報、スポーツの試合結果、及び番組内の特定コーナのタイトル画面等がある。
【0070】
本実施の形態においては、TV放送等の連続する画像中から予めユーザに特化した重要な画像を選択しておき、この画像の類似画像をリアルタイムに検出しユーザに知らせることで、より効率的な重要情報の表示が可能になる。更に、複数のチューナ手段を有するか、時分割で複数のチャンネルを検索する等により複数の放送から特定画像を検出することで、ユーザが現在視聴している番組とは異なる裏番組の監視も可能となる。
【0071】
更に、静止判定することにより、候補となる静止画像を絞込み、この静止画像と登録画像との類似度を判定することにより、特徴量を取得して類似度判定するデータが少なくてよく、TV放送等の映像からリアルタイムに特定画像を検出することが可能であり、ユーザにとっての重要な情報を効率的に選択して視聴することができると共に、重要な情報の見落としを防止することができる。
【0072】
また、複数の特徴量を統合的に使用することで、誤検出の頻度を軽減することができる。更に、検出結果を一定時間表示し、ユーザからの評価を促すことで、困難である画像検出の精度を柔軟に設定することができる。更にまた、精度を柔軟にすることでロバスト性を向上し、表示された状態でのユーザの判断を活かすことができる。
【0073】
【発明の効果】
以上詳細に説明したように本発明に係る特定画像検出装置は、連続するフレーム単位の画像からなる映像に含まれる静止画部分を含む特定の画像を検出する特定画像検出装置であって、登録画像における特性が異なる1以上の特徴量を記憶する記憶手段と、フレーム画像とこれに時間的に近接する近接フレーム画像との間の輝度変化の割合を算出し、該輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出する候補画像検出手段と、上記候補画像における特性が異なる1以上の特徴量を検出する特徴量検出手段と、上記候補画像の特徴量と、上記登録画像の特徴量との類似度が所定の閾値以上であるとき、該候補画像を特定画像として検出する検出手段とを有するので、予め、ユーザに特化した重要な画像等を登録画像として登録しておき、TV放送等の連続する画像中から、輝度変化の割合が所定の閾値以下であるフレーム画像のみを候補画像として検出し、登録画像に類似する候補画像を特定画像として検出することにより、ユーザにとって重要である等の理由で登録された画像を高効率に選択してリアルタイムで検出することができ、候補画像を検出してから特徴量により画像を特定するため、誤検出の頻度を軽減することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態における特定画像検出システムを示すブロック図である。
【図2】本発明の実施の形態における特定画像検出装置におけるデータの流れを説明する説明図である。
【図3】本発明の実施の形態における特定画像検出装置における特定画像検出方法を示すフローチャートである。
【図4】本発明の実施の形態における特定画像検出装置の特徴量テーブルを示す模式図である。
【図5】本発明の実施の形態における登録画像の特徴量取得方法を示すフローチャートである。
【図6】本発明の実施の形態における静止判定方法(候補画像の検出方法)を示すフローチャートである。
【図7】本発明の実施の形態におけるヒストグラムの計算方法を示すフローチャートである。
【図8】(a)乃至(c)は、ユーザが登録指示を出した登録画像の一例を示す図であって、夫々東日本の予報天気、東日本の予想気温及び東日本の週間天気を示す画面の模式図である。
【図9】(a)は検出された複数の特定画像を保存し、同時にサブモニタに表示した様子を示す模式図、(b)は、そのときのメインモニタでの表示例、(c)は、検出画面(特定画面)を示す模式図である。
【符号の説明】
1,2,10 入力端子、3 画像特徴量取得部、4 特徴量テーブル、5 遅延回路、6 静止判定部、7 画像特徴量取得部、8 類似度判定部、9 提示制御部、11 サブモニタ、12 メインモニタ、20 特定画像検出装置[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a specific image detection apparatus, a specific image detection method, a program and a recording medium, and a specific image detection system for detecting a specific image from still images included in a video composed of images in units of continuous frames.
[0002]
[Prior art]
2. Description of the Related Art Conventionally, there is a technique in which information that is important for a user (user) is registered in advance and an image is searched from the characteristics of the registered information.
[0003]
For example, Japanese Patent Application Laid-Open No. 2000-308017 discloses a video viewing apparatus that efficiently views related video in a limited time. The video viewing device described in this publication reproduces a predetermined input video signal stored in the input video storage means from a predetermined position, and an input video storage means for storing an input video signal including a moving image signal and an audio signal. Video reproduction means, calculation means for calculating the feature value of the input video signal, feature value storage means for storing the feature value calculated by the calculation means, and feature values from the calculation means are features of the feature value storage means A video search unit that searches for video related information indicating that these feature values are related, and a related information storage unit that stores video related information; When the related information storage means stores the related information, it notifies the viewer of the presence of the related information and notifies the viewer, and requests the reproduction of the video signal corresponding to the feature value indicated by the notified related information. Input means for inputting a request signal, and a insertion means for reproducing the requested video signal. Thereby, it is possible to detect a video signal related to the currently viewed video from the stored video signals and view the related video signal, and efficiently view the related video in a limited time Can do.
[0004]
Japanese Patent Laid-Open No. 10-149373 discloses an image storage / management apparatus and an image index creation method for searching an image database system that stores and manages a large amount of image information in a computer and performs search / use. Has been. In the image storage / management apparatus described in this publication, input means for inputting an original image, storage means for storing the input original image, and area division information by dividing an area based on visual characteristics of the original image Area dividing means for generating the original image, block dividing means for dividing the original image into a grid and generating division information, and inputting the division information, determining and arraying the representative area number for each grid, and dividing the area Index generation means for extracting area attribute information including color information for each area and describing image index information; and storage means for storing image index information. Thereby, it is possible to search for an image using a visual clue that the user has with respect to the image.
[0005]
[Problems to be solved by the invention]
However, in conventional techniques such as the technique described in the above-mentioned publication, a method for efficiently detecting a target image from changes in images of various patterns has not been established. In other words, in various patterns of images, the physical quantity indicating the characteristics that identify the target image is not obtained, and the target image cannot be accurately searched. There is a problem that it cannot be detected efficiently.
[0006]
The present invention has been proposed in view of such a conventional situation, and a specific image detection apparatus and a specific image detection capable of detecting a target specific image with high efficiency from a continuous image in real time. It is an object to provide a method, a program and a recording medium, and a specific image detection system.
[0007]
[Means for Solving the Problems]
  In order to achieve the above-described object, a specific image detection apparatus according to the present invention is a specific image detection apparatus that detects a specific image including a still image part included in a video composed of images in consecutive frames. The ratio of the luminance change between the storage means for storing one or more feature quantities having different characteristics in the registered image and the frame image and the adjacent frame image close in time to the frame image is calculated, and the luminance change ratio is predetermined. A candidate image detecting means for detecting a frame image that is equal to or less than a threshold value as a candidate image, a feature quantity detecting means for detecting one or more feature quantities having different characteristics in the candidate image, a feature quantity of the candidate image, and the registration Detecting means for detecting the candidate image as a specific image when the similarity with the feature quantity of the image is equal to or greater than a predetermined threshold, and the storage means includes the feature quantity of the registered image Based on the user's evaluation inputted through the input means for inputting the user's evaluation with respect to the specific image detected by the detecting means and the data including the threshold value of the similarity is stored. And rewriting means for rewriting the threshold value of the similarity of the storage meansThe
[0008]
In the present invention, a frame image having a luminance change rate equal to or less than a predetermined threshold is detected as a candidate image, and a candidate image similar to a registered image registered in advance by a user or the like is detected as a specific image. The registered image can be selected and detected with high efficiency because of its importance, and the frequency of false detection can be reduced because the image is specified by the feature amount after the candidate image is detected. .
[0009]
In addition, the feature amount stored in the storage unit includes luminance information, color information, edge amount, edge density, luminance histogram, stationary time of the registered image, and video of a predetermined period including the registered image. One or more pieces of information regarding the included sound effects can be included, and the registered image can be detected more accurately by determining the degree of similarity using feature quantities having a plurality of different characteristics. For example, when a specific image is detected from a television image, the robustness is improved even when the specific image is detected from a noisy television image by using a luminance histogram and a still time for determining the similarity. can do.
[0010]
Further, the registered image is an image designated by a user, and the feature amount detecting means has one or more feature amounts having different characteristics in the registered image, which is an image designated by the user, and the storage means The feature amount of the registered image detected by the feature amount detecting means can be stored, and the user can register the registered image as needed.
[0011]
Furthermore, the storage means has data consisting of the feature amount of the registered image and the similarity threshold, and an input means for inputting a user's evaluation for the specific image detected by the detection means; Rewriting means for rewriting the similarity threshold of the storage means based on the user's evaluation input via the input means, and the similarity threshold is rewritten by the user's evaluation. False detection is reduced.
[0012]
Moreover, it can have a presentation means which displays the specific image detected by the said detection means on a display means.
[0013]
Further, connected to an external device that supplies video, the detection means can detect the specific image from the video supplied from the external device.
[0014]
Furthermore, the apparatus has at least two tuner means, the presenting means displays the video of the reception channel selected by one tuner means on the display means, and the detecting means is selected by the other tuner means. The specific image can be detected from the received video of the receiving channel, and the user can view the television video while detecting the specific image.
[0015]
Also, it has at least two tuner means, and the detection means detects the specific image from the video of the reception channel selected by one of the tuner means, and the presentation means includes a first display means and a second display means An image of the reception channel connected to the display means and selected by the other tuner means can be displayed on the first display means, and the specific image can be displayed on the second display means. While viewing the television image on one display means, a specific screen is detected from a television image or the like of a channel different from the television image that the user is viewing, and the detected specific image is detected by the other display means. Can see.
[0016]
Furthermore, the detection means can detect the specific image from videos of a plurality of channels selected in time division.
[0017]
Furthermore, the presenting means may hold a plurality of the specific images detected by the detecting means, reduce the plurality of specific images, and display them simultaneously on the display means.
[0018]
Further, the image processing apparatus includes block dividing means for dividing the frame image into blocks of a predetermined size, and the detection means has a luminance change between corresponding blocks in the frame image and the adjacent frame image being equal to or less than a predetermined threshold value. At this time, the frame image can be detected as a candidate image.
[0019]
Furthermore, it has a luminance histogram calculating means for calculating a luminance histogram for each block divided by the block dividing means, and the candidate image detecting means is a luminance histogram between blocks corresponding to the frame image and the adjacent frame image. When the number of blocks whose correlation coefficient is equal to or smaller than a predetermined threshold is equal to or smaller than the predetermined threshold, the frame image can be detected as a candidate image.
[0020]
Furthermore, a notification means for notifying the user when a specific image is detected by the detection means may be provided, thereby improving the convenience for the user.
[0021]
  A specific image detection method according to the present invention is a specific image detection method of a specific image detection apparatus for detecting a specific image including a still image portion included in a video composed of images in units of continuous frames. A candidate image detection step of calculating a ratio of a luminance change between the image and a close frame image that is temporally close to the image, and detecting a frame image in which the ratio of the luminance change is equal to or less than a predetermined threshold; A candidate image feature amount detecting step for detecting one or more feature amounts having different characteristics in the candidate image, a feature amount of the candidate image, and one or more feature amounts having different characteristics in the registered image stored in the storage unit A detection step of detecting the candidate image as a specific image when the similarity is equal to or greater than a predetermined threshold stored in the storage unit, and the registration step Based on an input step of inputting a user's evaluation for a specific image whose similarity between the feature amount of the image and the feature amount of the candidate image is equal to or greater than a predetermined threshold, and the user's evaluation input in the input step Rewriting step of rewriting the threshold value of the similarity of the storage meansThe
[0022]
  A program according to the present invention and a recording medium on which the program is recorded are provided for causing a computer to execute an operation of detecting a specific image from a still image included in a video composed of continuous frame-unit images.as well asRecording medium on which this is recordedsoThen, the computer calculates the ratio of the luminance change between the frame image and the adjacent frame image close in time to the frame image, and detects the frame image whose luminance change ratio is equal to or less than a predetermined threshold as a candidate image. The candidate image detecting step, the candidate image feature amount detecting step for detecting one or more feature amounts having different characteristics in the candidate image, the feature amounts of the candidate image, and the characteristics in the registered image stored in the storage means are different. When the similarity with one or more feature quantities is equal to or greater than a predetermined threshold stored in the storage unit, a detection step of detecting the candidate image as a specific image is executed. In the detection step, An input step for inputting a user's evaluation for a specific image whose similarity between the feature amount and the feature amount of the candidate image is equal to or greater than a predetermined threshold, and a user's evaluation input in the input step To execute a rewriting process of rewriting the threshold of the similarity of the storage means to the computer on the basis of theThe
[0023]
  A specific image detection system according to the present invention detects a specific image including a still image portion included in a video composed of images of successive frames, and displays the specific image on at least one display means. The ratio of the luminance change between at least one display means, storage means for storing one or more feature quantities having different characteristics in the registered image, and the frame image and the adjacent frame image temporally adjacent thereto And a candidate image detection unit that detects a frame image having a luminance change rate equal to or less than a predetermined threshold as a candidate image, and a feature amount detection unit that detects one or more feature amounts having different characteristics in the candidate image. Detecting means for detecting the candidate image as a specific image when the similarity between the feature amount of the candidate image and the feature amount of the registered image is equal to or greater than a predetermined threshold; Specific image detection means provided, and the storage means stores data including the feature amount of the registered image and the threshold value of the similarity, and the specific image detection means is further controlled by the detection means. Input means for inputting the user's evaluation for the detected specific image, and rewriting means for rewriting the similarity threshold of the storage means based on the user's evaluation input via the input meansThe
[0024]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, specific embodiments to which the present invention is applied will be described in detail with reference to the drawings. In this embodiment, the present invention is applied to a specific image detection system that detects and displays a specific image having important information designated by a user from consecutive images.
[0025]
In this specific image detection system, a user registers a registered image in advance, searches for an image included in a video such as a television (TV) broadcast, detects a specific image similar to the registered image, and displays this in real time. (Presentation, presentation). Here, the similarity determination with the registered image is performed, and the specific image is detected. Since the detection result is displayed at various timings, in this embodiment, the user evaluates the detection result. Means shall be provided. That is, even if the evaluation of the detection result changes depending on the state of the user at that time, the user's evaluation at that time with respect to the detection result can be fed back. Thereby, for example, the determination criterion in similarity determination can be changed and reflected in subsequent detection. In this way, important information (specific image) can be efficiently detected and displayed through interaction with the user.
[0026]
FIG. 1 is a block diagram showing a specific image detection system according to the present embodiment. As shown in FIG. 1, the specific image detection device 20 detects a specific image registered by a user from, for example, a TV broadcast video, and the user views a video such as a TV broadcast or a video. The main monitor 12 to be connected to the sub-monitor 11 for displaying the specific image detected from the video, and the specific image detection system 30 is configured. In this embodiment, in addition to the main monitor 12 such as a television receiver used when viewing normal TV video or the like, an efficient display can be achieved by using the sub-monitor 11 that displays the detected specific image. Do.
[0027]
In general, TV broadcasts have a plurality of receivable broadcasts, and each broadcast station broadcasts its own content, but it can often be said that they are not arranged in an order that is easy for the user to see. For example, taking a news program as an example, if a plurality of broadcasting stations are broadcasting a news program at the same time, the contents of the same news program are different for each broadcasting station. Therefore, there is a possibility that the target news may be overlooked. On the other hand, there may be a case where the user is watching news that is not personally interesting to the user. What is required here is a system that can efficiently view a specific part of a plurality of programs in order from the important part to the user. Other than news, for example, when you want to watch the weather forecast, you must watch news that you are not interested in because you do not know when it starts in the news program, or it is in a region other than the region where the user lives There are inconveniences such as going to see. In addition, when viewing other video supplied from an external device other than TV broadcast, if you want to view specific information of TV broadcast, you must temporarily stop viewing the other video. Inconvenient. The specific image detection system of the present invention eliminates such inconveniences and makes it possible to display a program efficiently.
[0028]
Here, in the present embodiment, the specific image detection device 20 has a plurality of tuner means, displays the video of the reception channel selected by one tuner means on the main monitor 12, and uses other tuner means. A specific image can be detected from the video of the selected reception channel and displayed on the sub-monitor 11. For example, when there are two tuner means, since there are a plurality of channels in TV broadcasting, a plurality of channels specified by the user or all channels are selected by time division, and each channel selected by this time division is selected. A specific image can be detected from the TV video. Further, tuner means for the main monitor 12 and tuner means corresponding to all TV channels may be provided in order to detect a specific image.
[0029]
Further, tuner means may be provided in the sub monitor 11 and the main monitor 12 so that the sub monitor 11 and the main monitor 12 receive TV broadcasts and supply video to the specific image detection device 20. Alternatively, an image may be supplied by connecting an external device having tuner means to the specific image detection system. If the STD or the like such as a video deck, a DVD, or a BS (Broadcast Satelite) digital tuner is connected to the specific image detection device 20 as an external device, for example, various videos are supplied to the main monitor 12 and viewed. The specific image can be displayed on the sub monitor 11 or the main monitor 12 as necessary.
[0030]
Hereinafter, the specific image detection apparatus according to the present embodiment will be described in detail. FIG. 2 is an explanatory diagram for explaining the flow of data in the specific image detection apparatus of the present embodiment.
[0031]
As shown in FIG. 2, the specific image detection device 20 includes an image feature quantity acquisition unit (feature quantity detection unit) 3, a delay circuit (DL) 5, and a stillness determination unit (to which a video signal is supplied via the input terminal 1. (Candidate image detection means) 6, an image feature quantity acquisition section (feature quantity detection means) 7 to which a candidate image determined to be stationary from the stillness determination section 6 is supplied, and a registration instruction signal from the user via the input terminal 2 The feature amount of the input image (registered image) when supplied is supplied, the feature amount table (storage means) 4 for storing the feature amount, the features of the feature amount table 4 and the candidates supplied from the image feature amount acquisition unit 7 Similarity determined to be similar by the similarity determination unit 8 that is a detection unit that determines a similarity to the feature amount of the image and detects a candidate image similar to the registered image, and the similarity determination unit 8 An image is supplied to the sub monitor 11 and an input terminal 0 evaluation signal of the user is supplied on the displayed similar image on the sub monitor 11 through, and a similar image according to the voted presentation control unit supplies the main monitor 12 (presenting means) 9.
[0032]
Here, it is assumed that the video signal (input image sequence) is supplied via the input terminal. However, as described above, the supplied video signal is selected by providing the tuner means in the apparatus. It may be a TV image of the receiving channel or an image supplied from the outside.
[0033]
The delay circuit 5 supplies an input frame unit image to the stillness determination unit 6 with a predetermined frame delay, for example, one frame. The stillness determination unit 6 determines that the input frame image is a candidate image when the luminance change between the input frame image and a delay frame delayed by a predetermined frame from the input image supplied from the delay circuit 5 is equal to or less than a predetermined threshold. judge. Here, the candidate image is a still image or an image including a still image portion. An image that the user desires to detect is registered as a registered image. The threshold value is appropriately set depending on whether the registered image is a still image or an image including a still image portion.
[0034]
When the registration instruction signal is supplied via the terminal 2, the image feature amount acquisition unit 3 acquires a feature amount from the input image (registered image) at that time and sends it to the feature amount table 4. The feature amount table 4 stores the feature amount of a registered image that the user wants to register for reasons such as whether the user is important or necessary among input images.
[0035]
In addition, the image feature amount acquisition unit 7 acquires feature amounts from the candidate images, similarly to the image feature amount acquisition unit 3. In FIG. 2, the image detection apparatus 20 includes the image feature amount acquisition units 3 and 7, but the feature amount acquired by any one of the image feature amount acquisition units may be used.
[0036]
The similarity determination unit 8 compares all the feature amounts stored in the feature amount table 4 with the feature amounts detected from the candidate images, and determines the similarity. Specifically, for example, in order to determine the similarity of feature amounts using a predetermined threshold (determination threshold), the feature amount table 4 includes a determination threshold for each feature amount together with the feature amount of each registered image. It is remembered. The similarity determination unit 8 outputs a candidate image whose similarity is equal to or higher than a predetermined determination threshold value to the presentation control unit 9 as a similar image, and causes the sub monitor 11 to display the candidate image.
[0037]
The sub monitor 11 is a monitor that displays the detected similar image for the user to evaluate. The user's evaluation is input to the presentation control unit 9 via the terminal 10. For example, a plurality of user evaluations can be prepared, and the control of the presentation control unit 9 can be set based on the evaluations.
[0038]
When the user evaluation is input via the terminal 10, the presentation control unit 9 controls the image output to the sub-monitor 11 and the main monitor 12 based on the evaluation and rewrites data stored in the feature amount table 4. I do. For example, when the user views a similar image displayed on the sub-monitor 11 and this similar image is an image desired by the user (registered image), the similar image is identified by an evaluation signal from the user who evaluates the similar image. Can be output to the main monitor 12. On the other hand, when the similar image displayed on the sub-monitor 11 is different from the registered image, that is, when it is a false detection, the presentation control unit 9 uses the evaluation signal from the user pointing out that it is a false detection. It is possible to control to rewrite the determination threshold value stored in the feature amount table 4 at the time of detection. In this manner, by rewriting the determination threshold according to the user's evaluation, it is possible to prevent the unnecessary image and the image that is erroneously detected from being detected again. Furthermore, when an image similar to an unnecessary registered image is detected, for example, when it is a registered image that has been registered before, it can be set to be discarded.
[0039]
In addition, the specific image detection apparatus 20 according to the present embodiment outputs a similar image to the sub-monitor 11 and the specific image to the main monitor 12 by the presentation control unit 9, so that, for example, the user needs an image related to the weather forecast. However, by registering this, the specific image detection device 20 detects an image related to the weather forecast as a specific image. During that time, the user can watch a movie on the main monitor 12 by, for example, a video or the like. Other TV programs can be viewed, and a registered image can be detected from a so-called back program that is not viewed on the main monitor 12 and displayed on the sub-monitor 11.
[0040]
Next, Table 1 below shows examples of feature amounts stored in the feature amount table 4.
[0041]
[Table 1]
Figure 0004292762
[0042]
In the present embodiment, a case where a luminance histogram and a stationary time are used from the feature amounts shown in Table 1 will be described. Here, for example, the specific image may be detected by using, for example, all the feature values shown in Table 1 above. However, it is robust to set a strict judgment criterion according to the input video, for example. The type of feature amount, the determination criterion (determination threshold), and the like are set as appropriate in consideration of cases that may be affected. In this embodiment, the reason for using the luminance histogram and the stationary time when detecting a specific image from TV broadcast video is to improve the robustness even in TV broadcast where noise is expected to enter. Because. In the following description, the specific image to be detected is a still image. However, as described above, an image including a still image portion, that is, a background portion, for example, is a moving image, and only a predetermined area is still. Even in such a case, it can be detected in the same manner.
[0043]
FIG. 3 is a flowchart showing a specific image detection method in the specific image detection apparatus of the present embodiment. As shown in FIG. 3A, first, stillness determination is performed to detect a candidate image (hereinafter referred to as a still image) from continuous images such as an input television broadcast video (step S1). ). On the other hand, when an image registration signal is input together with the input image by the user, the input image is registered as a registered image, so that the feature amount of the registered image is acquired (detected) (step S11). It is stored in the feature quantity table 4 (step S12). In the feature amount table 4, the feature amount of the registered image designated by the user, that is, in this embodiment, whenever the registration is instructed by the user, the luminance histogram and the still time of the registered image are acquired. Is stored and saved as needed.
[0044]
On the other hand, when a still image is detected by performing still determination from the input image, the feature amount of the still image is detected, and the obtained feature amount is sent to the similarity determination unit 8 and stored in the feature amount table 4. It compares with the feature-value of all the registration images which exist, and similarity determination is performed based on a threshold value (step S2). In the present embodiment, similarity determination is performed based on a correlation coefficient e, which will be described later, with respect to a luminance histogram, a ratio of unchanged blocks without change, and a still time that is a count value of a still counter (not shown).
[0045]
FIG. 4 is a schematic diagram showing the feature amount table 4. As shown in FIG. 4, the feature amount table 4 is assigned an identification number (No. 0, 1, 2,...) For each registered image, and a luminance histogram, a stationary time, and a sequence corresponding to each registered image. Determination thresholds relating to correlation coefficients, ratios of changed blocks, time errors, and the like are stored.
[0046]
Returning to FIG. 3, when it is determined in step S <b> 3 that the registered image and the still image are similar, the data of this image is sent to the presentation control unit 9, and a display instruction is sent to the sub-monitor 11 for display. (Step S3). In the present embodiment, after the still image is displayed, for example, an alarm for prompting the user's attention is sounded, and a standby state is waited for an evaluation input from the user via the input terminal 10 (steps). S4). On the other hand, if it is determined that they are not similar, processing proceeds to the next frame.
[0047]
Next, the user evaluates the displayed image. As described above, various user evaluations are conceivable. A plurality of evaluations can be set, and processing corresponding to the evaluations can be set. In this embodiment, when it is determined that the displayed image is a registered image specified by the user (determined that it is necessary) (Good), and it is determined that it is not a registered image specified by the user (unnecessary) A case where two patterns of “Nogood” are determined will be described. Here, when the evaluation of Nogood is input, the value of the determination threshold value of the registered image in the feature amount table 4 used when it is determined to be similar is changed (updated) (step S6), and the next frame Proceed to the process. On the other hand, if it is evaluated as Good and it is determined that the similar image is a registered image, the specific image is output to the main monitor 12 (step S7), and the process proceeds to the next frame. As described above, when the user's evaluation is Nogood, by rewriting the value of the determination threshold value and tightening the criteria for determining similarity, it is possible to prevent the same erroneous detection from occurring in subsequent detections. In this example, the specific image is output to the main monitor 12. However, the specific image is not output to the main monitor 12. For example, a storage unit is provided in the sub-monitor 11 and is held for a predetermined period. You may make it display on.
[0048]
Hereinafter, the specific image detection method in the present embodiment will be described in more detail. First, a feature amount acquisition method for registered images in the image feature amount acquisition unit 3 will be described.
[0049]
FIG. 5 is a flowchart illustrating a method for acquiring a feature amount of a registered image. In FIG. 5, when a pixel value (F (i, pxl)) of a frame (hereinafter referred to as i frame) image is input and a registration instruction signal is input from the user via the terminal 2, that is, an i frame image. A case will be described in which an instruction for acquiring a feature amount is issued and an i-frame image is registered as a registered image. In the present embodiment, as described above, the luminance histogram and the stationary time are acquired as the feature amount of the registered image and stored in the feature amount memory 4.
[0050]
As shown in FIG. 5, first, when the i-frame image data is supplied via the terminal 1 and the registration instruction signal is supplied via the terminal 2, and the i-frame is selected as the registered image, the image feature amount The acquisition unit 3 divides this i-frame image data into prescribed blocks, obtains a histogram of luminance values in each block, and holds the obtained luminance histogram H (i, j) (step S21). Here, H (i, j) represents the luminance histogram of the jth block in the i frame. Further, the obtained luminance histogram is copied as a feature value and stored in the feature value table 4 (step S22).
[0051]
Next, the frame number is incremented (step S23), and the pixel value (F (i + 1, pxl)) of the (i + 1) frame that is temporally continuous with the i frame is input. Similarly to the i frame, the image feature quantity acquisition unit 3 obtains and holds a luminance histogram H (i + 1, j) in units of blocks in the (i + 1) frame image.
[0052]
A correlation coefficient e between spatially corresponding blocks between the obtained luminance histogram H (i + 1, j) and the previously obtained luminance histogram H (i, j) is expressed by the following equation (1). calculate.
[0053]
[Expression 1]
Figure 0004292762
[0054]
Then, the calculated correlation coefficient e is compared with a predetermined threshold value (Th_coef) (step S26). If the correlation coefficient e (j) in the j-th block is equal to or less than the threshold (Th_coef), this is counted as a change block. If the counted change block ratio e2 (j) is less than the threshold (Th_diff), a still image As a result, the count value (stillcnt) of the still counter is incremented (step S27), the process proceeds to the next frame ((i + 2) frame), and the processing from step S23 to step S27 is repeated. On the other hand, if the change block ratio e2 (j) is equal to or greater than the threshold (Th_diff), the count value of the stationary counter is stored in the feature amount table 4 (step S28), and the process ends. Here, the count value of the still counter is the still time of the registered image acquired by the image feature amount acquisition unit 3. In this way, the image feature quantity acquisition unit 3 can acquire the luminance histogram and the stationary time as the feature quantity of the i-frame image designated as the registered image and store it in the feature quantity table 4.
[0055]
Next, a still image detection method of the stillness determination unit will be described. As for the still image, the delayed frame image and the input frame image that have passed through the frame delay circuit 5 are sent to the stillness determination unit 6, and whether or not the still image is still is determined from the ratio of the changed blocks in the same manner as in step S 27 described above. Determination is made and a still image (candidate image) is detected. FIG. 6 is a flowchart showing a still image detection method in the stillness determination unit 6.
[0056]
The stillness determination unit 6 divides the i-frame image input via the terminal 1 into prescribed blocks, obtains a histogram of luminance values in each block, and holds the obtained luminance histogram H (i, j). (Step S31). Next, for example, the frame number is incremented by 1 (step S32), and the pixel value (F (i + 1, pxl)) of (i + 1) frame is input (step S33). Also, the luminance histogram H (i + 1, j) in block units is obtained and held (step S34).
[0057]
Then, between the obtained luminance histogram H (i + 1, j) and the previously obtained luminance histogram H (i, j), the correlation coefficient e (j) between spatially corresponding blocks is expressed by the above formula ( 1), the correlation coefficient e (j) is compared with a predetermined threshold (Th_coef) (step S35), and the ratio of changed blocks is detected (step S36). If the correlation coefficient e (j) of the j-th block is equal to or less than the threshold (Th_coef), this is counted as a change block. If the counted change block ratio e2 (j) is less than the threshold (Th_diff), i The brightness histogram of the frame image and the counter value of the still counter are stored (step 37), and this i-frame image is regarded as a still image and sent to the image feature quantity acquisition unit 7. On the other hand, if the ratio of changed blocks is greater than or equal to the threshold value (Th_diff), the process ends and the process proceeds to the next frame.
[0058]
The i-frame image that is regarded as a still image and sent to the image feature amount acquisition unit 7 is counted and acquired as a feature amount in the same manner as the acquisition of the still time of the feature amount acquisition unit 3 shown in FIG. The
[0059]
In FIG. 6, for simplification of explanation, the correlation coefficient of the corresponding block is compared between the i frame and the (i + 1) frame. For example, in the example illustrated in FIG. 2, the stillness determination unit 6 includes an input frame image (i frame image), and a correlation between adjacent frames. A frame image ((i-2) frame image) delayed by a predetermined frame from the input frame image is supplied via the delay circuit 5, and the correlation between the two is determined.
[0060]
Next, a histogram calculation method in the image feature amount acquisition units 3 and 7 will be described. In the present embodiment, as described above, the luminance histogram is used as the stillness determination and the feature amount of the stillness determination unit 6. The histogram generation unit for calculating the luminance histogram may be separately prepared in, for example, the image feature amount acquisition units 3 and 7 and the stillness determination unit 6, or a luminance histogram generation unit (not shown in FIG. 2) is prepared, If necessary, image data may be sent to the luminance histogram generation unit to generate a luminance histogram.
[0061]
FIG. 7 is a flowchart showing a histogram calculation and a method for comparing this histogram between frames. Here, a case where the luminance histograms between the i frame and the (i-2) frame are compared will be described. As shown in FIG. 7, first, an input frame image (referred to as an i-frame image) is divided into blocks of a prescribed size (step S41). For example, the frame image can be 720 × 480 pixels, for example, and the block size can be 32 × 32 pixels, for example. Then, the luminance histogram H (i, j) of the jth block divided in the i frame is calculated. Next, the already calculated jth luminance histogram H (i-2, j) of the (i-2) frame is read (step S43), and the luminance of the jth block in the i frame is calculated by the above equation (1). A correlation coefficient e (i, j) of the histogram is calculated (step S45), and it is determined whether or not the block is a change block by threshold determination. At this time, if it is determined that the block is a change block, 1 is set in the flag E (i, j), and if it is determined that the block is a non-change block, 0 is set in the flag E (i, j). . The luminance histogram H (i, j) is saved for use when comparing the correlation coefficient with the (i + 2) frame, the counter j is incremented (step S46), and whether or not all the locks have been completed. If it is determined (step S47) that the change block determination has not been completed for all locks, the processing from step S42 to step S47 is repeated, and if the change block determination has been made for all blocks, the process ends. . Thus, the value of the obtained all-lock flag E (i, j) is added, and if this value is equal to or less than a predetermined value, the i-frame image can be determined as a still image.
[0062]
Hereinafter, as a specific example of the present embodiment, a case where a weather forecast program is a registered image and this is detected will be described. The following are the features of the weather forecast program. That is,
1. Each time, similar screens are combined
2. Broadcast at almost the same time every time
3. Many programs are not set as program frames, and the exact start time is unknown from the program guide
4). Frequent use of still images
5). There are variations in the screens that are important for each user, such as regional dependence.
Etc.
[0063]
In such a weather forecast program, similar images are used repeatedly, so that a registered image (registration screen) can be used for a long time. In addition, although it is possible to know the approximate start time of a weather forecast program, it is difficult to accurately audition only the weather forecast program in situations such as being included in a news program. When viewing the content, it is extremely inconvenient because the user is not interested in the content. Furthermore, since there are contents that become unnecessary information depending on the area where the user lives, the advantage of selectively extracting images is great.
[0064]
The user issues a registration instruction if there is a desired image at the time of program preview. FIGS. 8A to 8C are diagrams showing examples of registration images for which the user has issued a registration instruction, and are schematic diagrams of screens showing predicted weather in East Japan, predicted temperature in East Japan, and weekly weather in East Japan, respectively. It is.
[0065]
Here, a case where the user registers information related to the Kanto region as important information will be described. First, when an image similar to the registered image is detected, it is displayed as a detection result on the sub-screen. 9A is a schematic diagram showing a similar image displayed on the sub screen (detection screen), FIG. 9B is a display example on the main monitor 12 at that time, and FIG. 9C is a detection. It is a schematic diagram which shows a mode that the several specific image made was preserve | saved and displayed on the sub monitor 11 simultaneously. For example, as shown in FIG. 9B, when the user is listening to a video such as a movie on which the weather forecast program is not displayed on the main monitor 12, as shown in FIG. When an image similar to the registered image is broadcast on another station, the similar image of the registered image is detected and displayed on the sub-monitor 11.
[0066]
Here, the user determines whether or not to audition the continuation of the detection result. For example, when the user gives an instruction to audition, the detection image displayed on the sub monitor 11 is switched and displayed on the main monitor 12. It is possible to make it. Here, it is possible to prevent an unpleasant display from being made depending on the situation of the place by entrusting the determination to the user. In addition, when a screen different from the registered image is detected and the user has not selected trial listening, the determination threshold value of the registered screen corresponding to the detection result is changed to prevent subsequent erroneous detection. It is possible to improve the detection efficiency and generate a detection determination threshold with high accuracy inherent to the screen.
[0067]
Furthermore, in the present embodiment, a plurality of sub-monitors 11 may be prepared, and the detected images may be saved, reduced, and displayed as a past list as shown in FIG. 9C. Considering the creator's intention, still images often contain important information that the viewer wants to pay attention to. Furthermore, this is an image devised to express some information by one piece. For this reason, a still image has a larger amount of information than one frame in a normal moving image, and a large amount of information can be transmitted only by displaying one frame. Therefore, by saving, displaying for a certain period of time, and displaying a reduced list, etc., the user can look back later to check the information, and it is extremely convenient when organizing the information. .
[0068]
Further, by preparing a plurality of sub-monitors 11 having tuner means, using the tuners of each sub-monitor 11, and supplying video signals from each sub-monitor 11, the number of broadcast stations that can be searched simultaneously can be increased.
[0069]
An example of an effect similar to a weather forecast program is a news title screen of a news program. In news programs, an announcer's anchor shot (bust shot) and news title telop are often displayed for each news item, and there is almost no change for a certain period of time. Also, depending on the news program, the effect and background of the telop are constant, which is suitable for the detection target. In addition, news programs may not always be broadcast as scheduled in the program guide. By registering such images, you can view news programs from different broadcast stations as detection results while viewing any program. It can be viewed only if it is of interest to the user or if the content is of interest. Examples of registered images suitable for such registration include market information, sports game results, and a title screen of a specific corner in a program.
[0070]
In the present embodiment, an important image specialized for the user is selected in advance from continuous images such as TV broadcasts, and a similar image of this image is detected in real time and notified to the user in a more efficient manner. Important information can be displayed. In addition, by detecting specific images from multiple broadcasts by having multiple tuner means or searching multiple channels in a time-sharing manner, it is possible to monitor back programs that are different from the program that the user is currently viewing It becomes.
[0071]
Further, by determining still images, candidate still images are narrowed down, and by determining the similarity between the still image and the registered image, the amount of data for acquiring the feature amount and determining the similarity may be small. It is possible to detect a specific image in real time from a video such as the above, and it is possible to efficiently select and view important information for the user and to prevent oversight of important information.
[0072]
Moreover, the frequency of erroneous detection can be reduced by using a plurality of feature amounts in an integrated manner. Furthermore, the accuracy of image detection, which is difficult, can be set flexibly by displaying the detection result for a certain period of time and prompting evaluation from the user. Furthermore, by making the accuracy flexible, the robustness can be improved, and the user's judgment in the displayed state can be utilized.
[0073]
【The invention's effect】
As described above in detail, the specific image detection apparatus according to the present invention is a specific image detection apparatus that detects a specific image including a still image part included in a video composed of images in units of continuous frames. Calculating a luminance change ratio between the storage means for storing one or more feature quantities having different characteristics in the frame, and a frame image and a neighboring frame image close in time to the frame image, and the luminance change ratio is a predetermined threshold value Candidate image detection means for detecting a frame image as a candidate image, feature quantity detection means for detecting one or more feature quantities having different characteristics in the candidate image, feature quantities of the candidate image, and the registered image When the similarity with the feature amount is equal to or greater than a predetermined threshold value, the image processing apparatus includes a detection unit that detects the candidate image as a specific image. Then, only frame images whose luminance change rate is equal to or less than a predetermined threshold are detected as candidate images from continuous images such as TV broadcasts, and candidate images similar to the registered images are detected as specific images. By doing so, registered images can be selected with high efficiency for reasons such as being important to the user and detected in real time. Can be reduced in frequency.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a specific image detection system in an embodiment of the present invention.
FIG. 2 is an explanatory diagram illustrating a data flow in the specific image detection apparatus according to the embodiment of the present invention.
FIG. 3 is a flowchart showing a specific image detection method in the specific image detection apparatus according to the embodiment of the present invention.
FIG. 4 is a schematic diagram showing a feature amount table of the specific image detection apparatus according to the embodiment of the present invention.
FIG. 5 is a flowchart showing a method for acquiring a feature amount of a registered image according to an embodiment of the present invention.
FIG. 6 is a flowchart showing a stillness determination method (candidate image detection method) in the embodiment of the present invention.
FIG. 7 is a flowchart showing a histogram calculation method according to the embodiment of the present invention.
FIGS. 8A to 8C are diagrams showing examples of registration images for which a user has issued a registration instruction, each of which shows forecast weather for East Japan, forecast temperature for East Japan, and weekly weather for East Japan. It is a schematic diagram.
9A is a schematic diagram showing a state in which a plurality of detected specific images are stored and simultaneously displayed on the sub-monitor, FIG. 9B is a display example on the main monitor at that time, and FIG. It is a schematic diagram which shows a detection screen (specific screen).
[Explanation of symbols]
1, 2, 10 input terminals, 3 image feature amount acquisition unit, 4 feature amount table, 5 delay circuit, 6 stillness determination unit, 7 image feature amount acquisition unit, 8 similarity determination unit, 9 presentation control unit, 11 sub monitor, 12 main monitor, 20 specific image detection device

Claims (5)

連続するフレーム単位の画像からなる映像に含まれる静止画部分を含む特定の画像を検出する特定画像検出装置であって、
登録画像における特性が異なる1以上の特徴量を記憶する記憶手段と、
フレーム画像とこれに時間的に近接する近接フレーム画像との間の輝度変化の割合を算出し、該輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出する候補画像検出手段と、
上記候補画像における特性が異なる1以上の特徴量を検出する特徴量検出手段と、
上記候補画像の特徴量と、上記登録画像の特徴量との類似度が所定の閾値以上であるとき、該候補画像を特定画像として検出する検出手段とを有し、
上記記憶手段には、上記登録画像の特徴量と上記類似度の閾値とからなるデータが記憶され、
さらに、上記検出手段により検出された特定画像に対する使用者の評価を入力する入力手段と、
上記入力手段を介して入力される使用者の評価に基づいて上記記憶手段の上記類似度の閾値を書き換える書き換え手段と
を有する特定画像検出装置。
A specific image detection device for detecting a specific image including a still image portion included in a video composed of images in consecutive frames,
Storage means for storing one or more feature quantities having different characteristics in the registered image;
Candidate image detecting means for calculating a ratio of luminance change between the frame image and a neighboring frame image close in time to the frame image, and detecting a frame image having the luminance change ratio equal to or less than a predetermined threshold as a candidate image; ,
Feature quantity detection means for detecting one or more feature quantities having different characteristics in the candidate image;
Detection means for detecting the candidate image as a specific image when the similarity between the feature amount of the candidate image and the feature amount of the registered image is equal to or greater than a predetermined threshold;
In the storage means, data including the feature amount of the registered image and the similarity threshold is stored,
Furthermore, input means for inputting the user's evaluation for the specific image detected by the detection means,
A specific image detection apparatus comprising: a rewriting unit that rewrites the similarity threshold of the storage unit based on a user's evaluation input via the input unit.
連続するフレーム単位の画像からなる映像に含まれる静止画部分を含む特定の画像を検出する特定画像検出装置の特定画像検出方法であって、
コンピュータに、
フレーム画像とこれに時間的に近接する近接フレーム画像との間の輝度変化の割合を算出し、該輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出する候補画像検出工程と、
上記候補画像における特性が異なる1以上の特徴量を検出する候補画像特徴量検出工程と、
上記候補画像の特徴量と、記憶手段に記憶された登録画像における特性が異なる1以上の特徴量との類似度が上記記憶手段に記憶された所定の閾値以上であるとき、該候補画像を特定画像として検出する検出工程とを実行させ、
上記検出工程では、上記登録画像の特徴量と上記候補画像の特徴量との類似度が所定の閾値以上である特定画像に対する使用者の評価を入力する入力工程と、上記入力工程にて入力される使用者の評価に基づいて上記記憶手段の上記類似度の閾値を書き換える書き換え工程とをコンピュータに実行させる
特定画像検出方法。
A specific image detection method of a specific image detection device for detecting a specific image including a still image portion included in a video composed of images of successive frames,
On the computer,
A candidate image detecting step of calculating a luminance change ratio between the frame image and a close frame image that is temporally adjacent thereto and detecting a frame image having the luminance change ratio equal to or less than a predetermined threshold as a candidate image; ,
A candidate image feature amount detecting step of detecting one or more feature amounts having different characteristics in the candidate image;
When the similarity between the feature amount of the candidate image and one or more feature amounts having different characteristics in the registered image stored in the storage unit is equal to or greater than a predetermined threshold stored in the storage unit, the candidate image is identified A detection step of detecting as an image,
In the detection step, an input step for inputting a user's evaluation for a specific image in which the similarity between the feature amount of the registered image and the feature amount of the candidate image is equal to or greater than a predetermined threshold, and the input step are input. A specific image detection method for causing a computer to execute a rewriting step of rewriting the threshold value of the similarity of the storage unit based on a user's evaluation.
連続するフレーム単位の画像からなる映像に含まれる静止画像から特定の画像を検出する動作をコンピュータに実行させるためのプログラムであって、
コンピュータに、
フレーム画像とこれに時間的に近接する近接フレーム画像との間の輝度変化の割合を算出し、該輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出する候補画像検出工程と、
上記候補画像における特性が異なる1以上の特徴量を検出する候補画像特徴量検出工程と、
上記候補画像の特徴量と、記憶手段に記憶された登録画像における特性が異なる1以上の特徴量との類似度が上記記憶手段に記憶された所定の閾値以上であるとき、該候補画像を特定画像として検出する検出工程とを実行させ、
上記検出工程では、上記登録画像の特徴量と上記候補画像の特徴量との類似度が所定の閾値以上である特定画像に対する使用者の評価を入力する入力工程と、上記入力工程にて入力される使用者の評価に基づいて上記記憶手段の上記類似度の閾値を書き換える書き換え工程とをコンピュータに実行させる
プログラム。
A program for causing a computer to execute an operation of detecting a specific image from a still image included in a video composed of continuous frame-unit images,
On the computer,
A candidate image detecting step of calculating a luminance change ratio between the frame image and a close frame image that is temporally adjacent thereto and detecting a frame image having the luminance change ratio equal to or less than a predetermined threshold as a candidate image; ,
A candidate image feature amount detecting step of detecting one or more feature amounts having different characteristics in the candidate image;
When the similarity between the feature amount of the candidate image and one or more feature amounts having different characteristics in the registered image stored in the storage unit is equal to or greater than a predetermined threshold stored in the storage unit, the candidate image is identified A detection step of detecting as an image,
In the detection step, an input step for inputting a user's evaluation for a specific image in which the similarity between the feature amount of the registered image and the feature amount of the candidate image is equal to or greater than a predetermined threshold, and the input step are input. A program that causes a computer to execute a rewriting step of rewriting the similarity threshold of the storage unit based on user evaluation.
連続するフレーム単位の画像からなる映像に含まれる静止画像から特定の画像を検出する動作をコンピュータに実行させるためのプログラムが記録されたコンピュータ読み取り可能な記録媒体であって、
コンピュータに、
フレーム画像とこれに時間的に近接する近接フレーム画像との間の輝度変化の割合を算出し、該輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出する候補画像検出工程と、
上記候補画像における特性が異なる1以上の特徴量を検出する候補画像特徴量検出工程と、
上記候補画像の特徴量と、記憶手段に記憶された登録画像における特性が異なる1以上の特徴量との類似度が上記記憶手段に記憶された所定の閾値以上であるとき、該候補画像を特定画像として検出する検出工程とを実行させ、
上記検出工程では、上記登録画像の特徴量と上記候補画像の特徴量との類似度が所定の閾値以上である特定画像に対する使用者の評価を入力する入力工程と、上記入力工程にて入力される使用者の評価に基づいて上記記憶手段の上記類似度の閾値を書き換える書き換え工程とをコンピュータに実行させる
プログラムが記録された記録媒体。
A computer-readable recording medium on which a program for causing a computer to execute an operation of detecting a specific image from a still image included in a video composed of continuous frame-unit images is recorded,
On the computer,
A candidate image detecting step of calculating a luminance change ratio between the frame image and a close frame image that is temporally adjacent thereto and detecting a frame image having the luminance change ratio equal to or less than a predetermined threshold as a candidate image; ,
A candidate image feature amount detecting step of detecting one or more feature amounts having different characteristics in the candidate image;
When the similarity between the feature amount of the candidate image and one or more feature amounts having different characteristics in the registered image stored in the storage unit is equal to or greater than a predetermined threshold stored in the storage unit, the candidate image is identified A detection step of detecting as an image,
In the detection step, an input step for inputting a user's evaluation for a specific image in which the similarity between the feature amount of the registered image and the feature amount of the candidate image is equal to or greater than a predetermined threshold, and the input step are input. A recording medium on which is recorded a program that causes a computer to execute a rewriting step of rewriting the threshold value of the similarity of the storage unit based on user evaluation.
連続するフレーム単位の画像からなる映像に含まれる静止画部分を含む特定の画像を検出し、該特定画像を少なくとも1つの表示手段に表示する特定画像検出システムであって、
少なくとも1つの表示手段と、
登録画像における特性が異なる1以上の特徴量を記憶する記憶手段と、フレーム画像とこれに時間的に近接する近接フレーム画像との間の輝度変化の割合を算出し、該輝度変化の割合が所定の閾値以下であるフレーム画像を候補画像として検出する候補画像検出手段と、上記候補画像における特性が異なる1以上の特徴量を検出する特徴量検出手段と、上記候補画像の特徴量と、上記登録画像の特徴量との類似度が所定の閾値以上であるとき、該候補画像を特定画像として検出する検出手段とを具備する特定画像検出手段と
を有し、
上記記憶手段には、上記登録画像の特徴量と上記類似度の閾値とからなるデータが記憶され、
上記特定画像検出手段は、さらに、上記検出手段により検出された特定画像に対する使用者の評価を入力する入力手段と、
上記入力手段を介して入力される使用者の評価に基づいて上記記憶手段の上記類似度の閾値を書き換える書き換え手段と
を有する
特定画像検出システム。
A specific image detection system for detecting a specific image including a still image portion included in a video composed of continuous frame-unit images and displaying the specific image on at least one display means,
At least one display means;
The ratio of the luminance change between the storage means for storing one or more feature quantities having different characteristics in the registered image and the frame image and the adjacent frame image close in time to the frame image is calculated, and the luminance change ratio is predetermined. A candidate image detecting means for detecting a frame image that is equal to or less than a threshold value as a candidate image, a feature quantity detecting means for detecting one or more feature quantities having different characteristics in the candidate image, a feature quantity of the candidate image, and the registration A specific image detection means comprising: a detection means for detecting the candidate image as a specific image when the similarity with the feature amount of the image is equal to or greater than a predetermined threshold;
In the storage means, data including the feature amount of the registered image and the similarity threshold is stored,
The specific image detection means further includes an input means for inputting a user's evaluation for the specific image detected by the detection means;
A specific image detection system comprising: a rewriting unit that rewrites the similarity threshold of the storage unit based on a user's evaluation input via the input unit.
JP2002221838A 2002-07-30 2002-07-30 Specific image detection apparatus, specific image detection method, program and recording medium, and specific image detection system Expired - Fee Related JP4292762B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002221838A JP4292762B2 (en) 2002-07-30 2002-07-30 Specific image detection apparatus, specific image detection method, program and recording medium, and specific image detection system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002221838A JP4292762B2 (en) 2002-07-30 2002-07-30 Specific image detection apparatus, specific image detection method, program and recording medium, and specific image detection system

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2009031752A Division JP4788787B2 (en) 2009-02-13 2009-02-13 Specific image detection apparatus, specific image detection method, program, and specific image detection system

Publications (3)

Publication Number Publication Date
JP2004062664A JP2004062664A (en) 2004-02-26
JP2004062664A5 JP2004062664A5 (en) 2005-10-27
JP4292762B2 true JP4292762B2 (en) 2009-07-08

Family

ID=31942040

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002221838A Expired - Fee Related JP4292762B2 (en) 2002-07-30 2002-07-30 Specific image detection apparatus, specific image detection method, program and recording medium, and specific image detection system

Country Status (1)

Country Link
JP (1) JP4292762B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101033296B1 (en) 2009-03-30 2011-05-09 한국전자통신연구원 Apparatus and method for extracting and decision-making of spatio-temporal feature in broadcasting and communication systems

Also Published As

Publication number Publication date
JP2004062664A (en) 2004-02-26

Similar Documents

Publication Publication Date Title
US11682208B2 (en) Methods and apparatus to measure brand exposure in media streams
CN108024145B (en) Video recommendation method and device, computer equipment and storage medium
US20070230781A1 (en) Moving image division apparatus, caption extraction apparatus, method and program
CN108293140B (en) Detection of common media segments
US7676821B2 (en) Method and related system for detecting advertising sections of video signal by integrating results based on different detecting rules
KR100821623B1 (en) Method and apparatus for recommending broadcasting program and computer readable recoding media storing program for executing method thereof in computer
KR20030026529A (en) Keyframe Based Video Summary System
JP2000106661A (en) Image processing method and system and device
US7778470B2 (en) Moving picture processor, method, and computer program product to generate metashots
CN101466013B (en) Signal processor and signal processing method
US20040019899A1 (en) Method of and system for signal detection
US20090158157A1 (en) Previewing recorded programs using thumbnails
CN100508594C (en) Commercial information searching method and apparatus, and provid method and apparatus accompanying information
JP4710350B2 (en) CM additional information supply method, CM additional information supply apparatus, CM additional information receiving apparatus, and CM additional information supply system
JP4788787B2 (en) Specific image detection apparatus, specific image detection method, program, and specific image detection system
JP4292762B2 (en) Specific image detection apparatus, specific image detection method, program and recording medium, and specific image detection system
US20050283793A1 (en) Advertising detection method and related system for detecting advertising according to specific beginning/ending images of advertising sections
JP2007073123A (en) Content storage device, content storage method, and program recording medium
EP1484763A1 (en) Music program contents menu creation apparatus and method
JP4288909B2 (en) Character information detecting apparatus, character information detecting method, program, and recording medium
JP2008028901A (en) Content receiving and reproducing apparatus, view history information recording program and content preference tendency discriminating method
JP4609244B2 (en) Content playback apparatus and content playback method
JP2000125243A (en) Video recording and reproducing device and recording medium
KR20140135090A (en) Method and apparatus for reproducing contents
JP2009021732A (en) Storage type broadcasting receiver and digest video reproduction program

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050712

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050712

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080701

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080901

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080924

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081216

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090317

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090330

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140417

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees