JP2017069596A - 画像処理装置及び方法 - Google Patents

画像処理装置及び方法 Download PDF

Info

Publication number
JP2017069596A
JP2017069596A JP2015189183A JP2015189183A JP2017069596A JP 2017069596 A JP2017069596 A JP 2017069596A JP 2015189183 A JP2015189183 A JP 2015189183A JP 2015189183 A JP2015189183 A JP 2015189183A JP 2017069596 A JP2017069596 A JP 2017069596A
Authority
JP
Japan
Prior art keywords
image
character string
contents
moving image
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015189183A
Other languages
English (en)
Inventor
小薬 弘治
Hiroharu Ogusuri
弘治 小薬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015189183A priority Critical patent/JP2017069596A/ja
Publication of JP2017069596A publication Critical patent/JP2017069596A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Studio Devices (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

【課題】動画像の所望シーンからの再生開始を容易にする目次画像を生成する画像処理装置及び方法を提供する。
【解決手段】画像領域切出し手段32は、撮像部24による撮像されカメラ信号処理手段28により処理された撮像画像から注目領域の画像部分を切り出す。文字列検出手段34は、画像領域切出し手段32により切り出された注目領域画像に含まれる文字列を検出する。CPU12は、文字列の追加・削除に対して、直前の注目領域画像を目次画像として記録媒体50に記録し、対応する動画像のシーン範囲を示す情報を関連付ける。
【選択図】図1

Description

本発明は、画像処理装置及び方法に関し、より具体的には、動画シーン中の注目点からの再生を容易にする目次画像を生成する画像処理装置及び方法に関する。
従来、会議の議事録作成は、会議中に書記が残した文章や板書の撮影画像をもとに、会議終了後に担当者が清書等をおこない作成していた。その他には、ボイスレコーダで音声をファイル化する手法や、TV会議システムでは、会議自体を音声ファイルまたは動画ファイルとして保存する手法も一般化しつつある。
また、監視カメラの技術分野では、撮影画像分析から不審な人物と事象を検出する技術が知られている。さらには、総称Nシステムと呼ばれる自動車ナンバー自動読取装置の技術を応用し、自動車ナンバーの認識率に応じて動画データの圧縮率を動的に制御する技術も提案されている(特許文献1参照)。
特開2006−202000号公報
記録音声を参照して会議終了後に担当者がいわゆる文字起こしにより議事録を作成する場合、一般に、実時間以上の作業時間が必要となる。作成された議事録の内容には、聞き違いや勘違いなどの誤解、及び必要な内容に関しての記載漏れなどの可能性があるので、再チェックか事後的な確認の容易なシステムが必要になる。
また、会議自体を動画記録する場合、所望の議題に対して議論しているシーンを検索する手間がかかるなどの問題がある。動画シーンをいくつかのクリップに分割し、サムネイル一覧を表示し、所望シーンを選択させる機能などもあるが、会議風景の場合は似たようなシーンの縮小画像となるので、所望シーンを再生画面上で視覚的に発見するのは困難である。
本発明は、動画シーン中の注目箇所からの再生を容易にする目次画像を生成する画像処理装置及び方法を提示することを目的とする。
本発明に係る画像処理装置は、動画像のインデックスとなる目次画像を生成する画像処理装置であって、前記動画像から画面上の注目領域を切り出す画像領域切出し手段と、前記画像領域切出し手段により切り出される注目領域画像と、前記画像領域切出し手段により先行して切り出された直前の注目領域画像との間における所定変化の有無を判別する判別手段と、前記所定変化がある場合に、前記画像領域切出し手段により先行して切り出された直前の注目領域画像を目次画像とし、前記動画像との対応を示す対応動画シーン情報と関連付けて出力する出力手段とを有することを特徴とする。
本発明によれば、注目領域において所定変化がある場合に、その注目領域の画像を目次画像として記録するので、再生時の便宜を考慮した目次画像を生成・記録でき、この結果、再生時に希望するシーンを見つけやすくなる。
本発明の一実施例の概略構成ブロック図である。 本実施例の目次画像記録動作のフローチャートである。 目次画像作成要否判断の詳細なフローチャートである。 図2に示す目次画像記録動作による動画シーンと目次画像の関連を示すイメージ図である。 図4に示す例における、目次画像と動画ストリームとの関係を示す対応表である。 図4に示す例に対して、目次画像から動画シーンへジャンプする場合のイメージ図である。 本実施例の別の目次画像記録動作のフローチャートである。 図7Aに続くフローチャートである。 図7A及び図7Bに示す目次画像記録動作で記録される目次画像と、文字列及び文字列領域との関係を示すイメージ図である。 図8に示す例における目次画像、文字列領域及び関連動画シーンの対応関係を示す対応表である。 図8に示す例に対して、目次画像から動画シーンへジャンプする場合のイメージ図である。 本実施例のさらに別の目次画像記録動作のフローチャートである。 図11Aに続くフローチャートである。
以下、図面を参照して、本発明の実施例を詳細に説明する。
図1は、本発明に係る画像処理装置の一実施例を組み込んだ撮像装置10の概略構成ブロック図を示す。撮像装置10は、撮像画像を動画記録する際に、動画像の再生のインデックスとして目次画像を作成して記録する。
12は、撮像装置10の全体を制御するCPUである。14はCPU12上で動作するプログラムが格納されているROM(Read Only Memory)である。16は、CPU12のワークメモリであるRAM(Random Access Memory)である。18は、ユーザがCPU12に種々の指示を入力するための、ボタン及び十字キー等からなる操作装置である。CPU12、ROM14、RAM16及び操作装置18は、プログラムバス20に接続し、プログラムバス20を介して種々の制御信号及びデータをやり取りする。
22は、被写体を撮影するためのレンズを含むレンズユニットである。24は、レンズユニット22からの光束を受光し画像信号に変換する撮像素子を含む撮像部である。撮像部24は、撮像素子から一定レートで読出される画像信号をデジタル信号(画像データ)に変換し、データバス102を介してDRAM(Dynamic Random Access Memory)26に一時格納する。
28は、撮像部24によって得られた画像信号を現像処理し、フレーム画像を生成するカメラ信号処理手段である。カメラ信号処理手段28は、生成したフレーム画像データをDRAM26に一時格納する。DRAM26は、カメラ信号処理手段28からの複数のフレーム画像の画像データを同時に格納可能な容量を有する。
30は、カメラ信号処理手段28によって生成されたフレーム画像から顔領域を検出することで、被写体領域を検出する被写体検出手段である。
32は、カメラ信号処理手段28によって生成されたフレーム画像から、ユーザが任意に選択可能な注目領域を切り出したフレーム画像を生成する画像領域切出し手段である。画像領域切出し手段32は、生成した切出しフレーム画像をDRAM26に格納する。
34は、画像領域切出し手段32によって生成された切出しフレーム画像から文字を認識し文字列データを抽出する文字列検出手段である。文字列検出手段34は、抽出された文字列が切出しフレーム画像中の位置を示す座標データと、その位置近辺の領域を示す領域データも出力する。
36は、JPEG(Joint Photographic Experts Group)圧縮方式を用いて切出しフレーム画像を圧縮する静止画コーデックである。
38は、DRAM26に格納される2つのフレーム画像の任意領域を画像比較し、差分情報を数値化する画像比較手段である。
40は、MPEG(Moving Picture Experts Group)圧縮方式を用いて、撮像部24からDRAM26に一時格納されたフレーム画像を圧縮し、動画ストリームデータを生成する動画コーデックである。
42は記録媒体50にデータを読み書きする記録媒体I/Fである。記録媒体50は撮像装置10から取り外し可能である。
CPU12はデータバス20にも接続し、データバス20を介してDRAM(Dynamic Random Access Memory)26にアクセスできる。DRAM26は、撮像画像データ及び画像の符号化復号化の際の中間データと結果のデータを一時記憶するのに使用される。CPU12は、データバス20に接続する要素24,28,30,32,34,36,38,40,42を制御する。
CPU12は、以下に説明する情報付加プログラム、文字列比較プログラム及び文字列追記削除判別プログラムをROM14から読み込み、実行する。情報付加プログラムは、静止画コーデック36によって生成された静止画データに、動画コーデック40によって生成された動画ストリームデータとの関連情報を付加するプログラムである。文字列比較プログラムは、文字列検出手段34によって検出される文字列に対して、直前の画像から検出された文字列と、現在検出された文字列とを比較するプログラムである。文字列追記削除判別プログラムは、文字列比較プログラムによって比較された文字列に対して、文字列の追記、削除及び変更を判断するプログラムである。
撮像装置10における動画記録動作を簡単に説明する。撮像部24により撮像された画像信号は、カメラ信号処理手段28によって現像処理され、所定形式の画像データとしてDRAM26に一時格納される。動画コーデック40は、DRAM26に格納されたカメラ信号処理手段28からの画像データを圧縮符号化して動画ストリームを生成し、DRAM26に書き戻す。記録媒体I/F42は、DRAM26の動画ストリームを読み出して記録媒体50に記録する。
撮像装置10は、カメラ信号処理手段28により現像処理された動画像の画面上の注目領域内で所定変化の有無を判別し、所定変化がある場合に、その注目領域画像を、動画画像を再生する際の目安となる目次画像として記録する。図2に示すフローチャートを参照して、撮像装置10における目次画像記録動作を説明する。CPU12は、図2に示すフローチャートに対応する制御プログラムをROM14から読み込み、実行することで、以下に説明する各機能を実現する。目次画像記録動作は、撮像装置10における通常の動画記録と並列に実行される。
図2で、Tは動画シーンの撮影時間を示し、Tsは、目次画像に付加する動画シーンの開始時間を示し、Tnは動画シーン記録時間を示す。画像領域切出し手段32が、動画記録動作中にカメラ信号処理手段28により現像処理された記録画像データから順次切り出した注目領域の画像を目次画像M(n)とする。目次画像M(n)は、現在時刻Tの記録画像データから切り出された目次画像M(n+1)の直前の目次画像である。目次画像M(n)から抽出された文字列を文字列S(n)と表現する。ただし、M(n),S(n)の(n)は内容を区別するための表現であり、必ずしも配列変数を意味しない。
動画撮影が開始されると、CPU12は、時間変数Ts,Tn及びループ変数nを0で初期化する(S201)。CPU12は、カメラ信号処理手段28によって現像処理された画像データから画像領域切出し手段32に注目領域を切り出させ、切り出された注目領域画像を目次画像M(n)としてDRAM26に格納する(S202)。同時に、CPU12は、次の目次画像M(n+1)を目次画像M(n)で初期化する。ユーザは、操作装置18を操作することにより事前に、撮像部24から出力される動画のうちのの注目領域を任意に設定できる。例えば、ユーザは、不図示の表示装置に撮像部24の撮像画像を表示させた状態で、その表示画面を見ながら操作装置18を使って撮像画像中に注目領域を指定する。
CPU12は、S202で生成された目次画像M(n)を文字列検出手段34に転送し、この目次画像M(n)に含まれる文字列を抽出させ、変数S(n)に格納する(S203)。このとき、CPU12は、次の文字列S(n+1)を、文字列S(n)で初期化する。
ステップS201〜S203により、目次画像記録動作の初期化が終了する。
CPU12は、動画撮影動作による記録画像データから目次画像を作成すべきか否か判断する(S204)。例えば、最短の間隔として、記録動画像の各フレーム又は一定数ごとのフレームで目次画像を生成するように設定されているときには、そのようなフレームの切り替わりのタイミングかどうかを判断することになる。また、撮影画像内で注目領域が撮像されていない場合には、そもそも目次画像作成の前提を欠くので、目次画像作成処理(S205〜S210)をパスしても構わないことになる。目次画像生成判断(S204)の詳細は、図3を参照して、後述する。
目次画像を作成する必要が無い場合(S204)、CPU12は、動画撮影動作が終了しているかを判断する(S211)。動画撮影動作が終了していない場合(S211)、CPU12は、目次画像M(n+1)を目次画像M(n)で更新すると共に文字列S(n+1)を文字列S(n)で更新し(S212)、S204に戻る。動画撮影動作が終了している場合(S211)、CPU12は、図2に示す制御を終了する。
目次画像を作成する必要がある場合(S204)、CPU12は、現在時刻Tを取得して、動画シーン現在時刻Tnに代入する(S205)。CPU12は、S204で目次画像作成の必要ありと判断された記録画像データから、画像切出し手段32に注目領域を切り出させ、目次画像M(n+1)とする(S206)。CPU12は、目次画像M(n+1)を文字列検出手段34に供給して目次画像M(n+1)に含まれる文字列を抽出させ、文字列S(n+1)に代入する(S207)。
CPU12は、S207で抽出された文字列S(n+1)を、先行して切り出された直前の目次画像M(n)から抽出された文字列S(n)と比較し、文字列の削除が発生したかどうかを判断する(S208)。文字列の削減が発生していない場合(S208)、CPU12は、S209,S210を迂回して、S211に進む。CPU12は、動画撮影動作が終了しているかを判断する(S211)。動画撮影動作が終了していない場合(S211)、CPU12は、目次画像M(n+1)を目次画像M(n)で更新すると共に文字列S(n+1)を文字列S(n)で更新し(S212)、S204に戻る。動画撮影動作が終了している場合(S211)、CPU12は、図2に示す制御を終了する。
文字列の削減が発生している場合(S208)、CPU12は、この時点での動画シーンの開始時間Tsと現在の動画シーン記録時間Tnを目次画像M(n)に付加する(S209)。具体的には、CPU12で実行される情報付加プログラムが、目次画像Mnに対応する動画シーン情報として、動画シーンの開始時間Tsと現在の動画シーン記録時間Tnを付加する。そして、CPU12は、このように動画シーン情報が付加された目次画像M(n)を記録媒体I/F42を介して記録媒体50に記録する(S209)。
CPU12は、目次画像M(n)を記録媒体50に記録したので、動画シーンの開始時間Tsを動画シーン記録時間Tnで更新する(S210)。CPU12は、動画撮影動作が終了しているかを判断する(S211)。動画撮影動作が終了していない場合(S211)、CPU12は、目次画像M(n+1)を目次画像M(n)で更新すると共に文字列S(n+1)を文字列S(n)で更新し(S212)、S204に戻る。動画撮影動作が終了している場合(S211)、CPU12は、図2に示す制御を終了する。
図3は、目次画像作成要否の判断(S204)の詳細なフローチャートを示す。CPU12は、動画撮影動作による記録画像データに更新があったかどうかを判断する(S301)。更新があった場合(S301)、CPU12は、被写体検出手段30を用いて更新のあった記録画像データから人物領域を検出する(S302)。CPU12は、S302で検出された人物領域が注目領域と重なっているか否かを判断する(S303)。人物領域が注目領域と重なっている場合(S303)、CPU12は、目次画像作成不要と判断して(S304)、図2に戻る、人物領域が注目領域と重なっていない場合(S303)、CPU12は、目次画像作成必要と判断して(S305)、図2に戻る。
また、記録画像データに更新が無かった場合(S301)、CPU12は、目次画像作成不要と判断し(S304)、図2に戻る。
図3に示す処理により、目次画像作成処理(S205〜S210)の実行回数を削減できる。すなわち、注目領域の切出しと文字列の抽出を必要な範囲に限定できる。ホワイトボードの前で人物が板書中の場合など、人物が注目領域に重なっていた状態に対して、目次画像作成処理(S205〜S210)を実行してしまい、結果的に不適な目次画像を生成してしまうことを防止できる。
図4は、図2に示す目次画像記録動作による動画シーンと目次画像の関連を示すイメージ図であり、会議風景を示している。撮像装置10は固定されており、定点カメラとして会議風景を撮影している。目次画像を生成する注目領域は、ホワイトボードの板書に設定されている。動画ストリームは時間0〜T4までの動画像である。そして、時間T1、T2、T3、T4で撮影された動画シーン中の注目領域から生成された画像を、それぞれ目次画像M1、M2、M3、M4としている。
目次画像M1〜M4は、図2を参照して説明した目次画像記録処理によって生成される。図5は、図4に示す例における、目次画像と動画ストリームとの関係を示す対応表である。各目次画像M1〜M4に関連付けられる動画シーン(関連動画シーン)は、直前の目次画像時間からその目次画像を記録媒体50に記録するまでの動画シーンである。つまり、注目領域であるホワイトボードの板書が完成するまでの会議風景の動画シーンが、各目次画像M1〜M4に関連づけられる。
このように生成された目次画像を利用することにより、容易に所望の動画シーンを再生できる。図6を参照して、この方法を簡単に説明する。図6は、図4に示す例に対して、目次画像から動画シーンへジャンプする場合のイメージ図である。
CPU12は、ユーザの指示に従い、記録媒体50に記録された目次画像を、複数の目次画像を1画面に同時表示するマルチインデックス表示で表示する。図4及び図5に示す例では、4枚の目次画像M1〜M4が同時に一画面に表示される。ユーザは、表示された目次画像を視認し、所望の目次画像を操作装置18で選択する。CPU12は、ユーザが選択した目次画像の関連動画シーン情報を参照して、その関連動画シーン情報で特定される動画シーンを再生開始する。例えば、ユーザは、目次画像M4に板書されている議題の会議風景を再生したい場合、目次画像M4を選択する。目次画像M4には動画シーンの時間T3〜T4が関連付けられているので、CPU12は、動画ストリームの時間T3の場面から動画再生を開始する。
動画の注目領域で検出される文字列の変化に従い、注目領域の目次画像を生成し、その目次画像に動画の記録位置を関連付けて記録するので、目次画像の閲覧により所望位置を容易に発見でき、関連する動画部分を迅速に再生表示できる。
注目領域の変化を、そこに含まれる文字列の変化で判断するので、この判断に要する処理負担が、画像比較に比べて軽くなる。また、文字列の変化発生に応じて箇所で目次画像を記録するので、記録すべき目次画像数を減らすことが出来る。これは、目次画像を目処に動画再生を支援する再生システムの負担軽減に繋がる。
文字列の追加と削除の両方に対応する目次画像記録処理を説明する。図7A及び図7Bは、その目次画像記録動作のフローチャートを示す。CPU12は、図7A及び図7Bに示すフローチャートに対応する制御プログラムをROM14から読み込み、実行することで、以下に説明する各機能を実現する。ここでも、目次画像記録動作は、撮像装置10における通常の動画記録と並列に実行される。
図7A及び図7Bでも、図2と同様に、Tは動画シーンの撮影時間を示し、Tsは、目次画像に付加する動画シーンの開始時間を示し、Tnは動画シーン記録時間を示す。画像領域切出し手段32が、動画記録動作中にカメラ信号処理手段28により現像処理された記録画像データから順次切り出した注目領域の画像を目次画像M(n)とする。目次画像M(n)は、現在時刻Tの記録画像データから切り出された目次画像M(n+1)の直前の目次画像である。目次画像M(n)から抽出された文字列を文字列S(n)と表現する。ただし、M(n),S(n)の(n)は内容を区別するための表現であり、必ずしも配列変数を意味しない。
動画撮影が開始されると、CPU12は、時間変数Ts,Tn及びループ変数nを0で初期化する(S701)。CPU12は、カメラ信号処理手段28によって現像処理された記録画像データから画像領域切出し手段32に注目領域を切り出させ、切り出された注目領域の画像を目次画像M(n)としてDRAM26に格納する(S702)。同時に、CPU12は、次の目次画像M(n+1)を目次画像M(n)で初期化する。
CPU12は、S702で生成された目次画像M(n)を文字列検出手段34に転送し、この目次画像M(n)に含まれる文字列を抽出させ、変数S(n)に格納する(S703)。このとき、CPU12は、次の文字列S(n+1)を、文字列S(n)で初期化する。
ステップS701〜S703により、目次画像記録動作の初期化が終了する。
CPU12は、S204と同様に、動画撮影動作による記録画像データから目次画像を作成すべきか否か判断する(S704)。図3を参照して説明した処理は、目次画像生成判断(S704)にも適用されうる。
目次画像を作成する必要が無い場合(S704)、CPU12は、動画撮影動作が終了しているかを判断する(S713)。動画撮影動作が終了していない場合(S713)、CPU12は、目次画像M(n+1)を目次画像M(n)で更新すると共に文字列S(n+1)を文字列S(n)で更新し(S714)、S704に戻る。動画撮影動作が終了している場合(S713)、CPU12は、図7A及び図7Bに示す制御を終了する。
目次画像を作成する必要がある場合(S704)、CPU12は、現在時刻Tを取得して、動画シーン現在時刻Tnに代入する(S705)。CPU12は、S704で目次画像作成の必要ありと判断された記録画像データから、画像領域切出し手段32に注目領域を切り出させ、目次画像M(n+1)とする(S706)。CPU12は、目次画像M(n+1)を文字列検出手段34に供給して目次画像M(n+1)に含まれる文字列を抽出させ、文字列S(n+1)に代入する(S707)。
CPU12は、S707で抽出された文字列S(n+1)と直前の目次画像M(n)から抽出された文字列S(n)を比較し、文字列の追加が発生したかどうかを判断する(S708)。文字列の追加が発生していない場合(S708)、CPU12は、文字列の削除が発生したかどうかを判断する(S715)。
文字列の追加が発生していた場合(S708)、CPU12は、文字列検出手段34を用いて、追加された文字列の文字列領域情報を取得する(S709)。CPU12は、S709で取得された文字列領域情報と関連する動画シーンの開始時間Tsと現在の動画シーン時間Tnを、S709で取得された文字列領域情報に追加する(S710)。CPU12は、記録媒体50に記録されている直前の目次画像M(n)と動画シーン関連情報を記録媒体50から削除する(S711)。CPU12は、情報付加プログラムを用いて、S710で生成された文字列領域情報をS706で生成された目次画像M(n+1)に付加し、記録媒体I/F42を介して記録媒体50に記録する(S712)。
文字列の削除が発生していた場合(S715)、CPU12は、文字列検出手段34を用いて、削除された文字列の文字列領域情報を取得する(S716)。CPU12は、S716で取得された文字列領域が文字列領域情報に含まれる場合、S716で取得された文字列領域とこれに付随する動画シーン情報を文字列領域情報から削除する(S717)。CPU12は、情報付加プログラムを用いて、S717で更新された文字列領域情報をS706で生成された目次画像M(n+1)に付加し、記録媒体I/F42を介して記録媒体50に記録する(S712)。
文字列の追加も削除も発生していない場合(S715)、又は、S712の後、CPU12は、動画撮影動作が終了しているかを判断する(S713)。動画撮影動作が終了していない場合(S713)、CPU12は、目次画像M(n+1)を目次画像M(n)で更新すると共に文字列S(n+1)を文字列S(n)で更新し(S714)、S704に戻る。動画撮影動作が終了している場合(S713)、CPU12は、図7A及び図7Bに示す制御を終了する。
図8は、実施例1と同様に会議風景を撮影した場合の、図7A及び図7Bに示す目次画像記録動作で記録される目次画像と、文字列及び文字列領域との関係を示すイメージ図である。撮像装置10は固定されており、定点カメラとして会議風景を撮影している。目次画像を生成する注目領域は、ホワイトボードの板書に設定されている。動画ストリームは時間0〜T4までの動画像である。目次画像M1-3は動画シーンの時間T3の注目領域から生成された目次画像であり、目次画像M3-4は動画シーンの時間T4の注目領域から生成された目次画像である。
目次画像M1-3には文字列領域1、文字列領域2及び文字列領域3の情報が付加されており、各文字列領域1,2,3に対して動画シーンが関連付けされている。目次画像M3-4には、文字列領域4の情報とこれに関連する動画シーンの情報が付加されている。図9は、これらの目次画像、文字列領域及び関連動画シーンの対応関係を示す対応表である。
このように生成された目次画像を利用することにより、容易に所望の動画シーンを再生できる。図10を参照して、この方法を簡単に説明する。図10は、図8に示す例に対して、目次画像から動画シーンへジャンプする場合のイメージ図である。
CPU12は、ユーザの指示に従い、記録媒体50に記録された目次画像を、複数の目次画像を1画面に同時表示するマルチインデックス表示で表示する。図8に示す例に対しては、図10(a)に示すように、2枚の目次画像M1−3,M3−4が同時に一画面に表示される。ユーザは、表示された目次画像を視認し、所望の目次画像を操作装置18で選択する。CPU12は、図10(b)に示すように、ユーザが選択した目次画像の各文字列領域情報を全画面で表示する。図10(b)では、目次領域M1−3が選択された結果を示す。
ユーザは、全画面表示の中の所望の文字列領域情報を選択又は指定できる。CPU12は、ユーザが選択した文字列領域情報に関連付けられている関連動画シーン情報を参照し、その関連動画シーン情報で特定される動画シーンの再生を開始する。図10(b)に示す例では、ユーザは文字列領域2を示す文字列領域情報を選択している。文字列領域2には、動画シーンの時間T1〜T2が関連付けられているので、CPU12は、図10(c)に示すように、動画ストリームの時間T1の場面から動画再生を開始する。
本実施例では、注目領域において、文字列が追加された場合には、動画シーン情報を関連付ける一方で、文字列が削除された場合には、削除された文字列領域に係る関連動画シーン情報を削除する。追記の場合に直前の目次画像を削除し、削除された情報を含む新たな目次画像が登録されるので、記録媒体に記録される目次画像が厳選されたものとなり、目次画像数を削減できる。また、文字列の追加/削除に注目して、関係する動画シーン部分の迅速な再生が可能になる。
文字列の追加と削除の両方に対応し、さらには、文字列領域外の画像差分情報も付加する目次画像記録処理を説明する。図11A及び図11Bは、その目次画像記録動作のフローチャートを示す。CPU12は、図11A及び図11Bに示すフローチャートに対応する制御プログラムをROM14から読み込み、実行することで、以下に説明する各機能を実現する。ここでも、目次画像記録動作は、撮像装置10における通常の動画記録と並列に実行される。
図11A及び図11Bでも、図2並びに図7A及び図7Bと同様に、Tは動画シーンの撮影時間を示し、Tsは、目次画像に付加する動画シーンの開始時間を示し、Tnは動画シーン記録時間を示す。画像領域切出し手段32が、動画記録動作中にカメラ信号処理手段28により現像処理された記録画像データから順次切り出した注目領域の画像を目次画像M(n)とする。目次画像M(n)は、現在時刻Tの記録画像データから切り出された目次画像M(n+1)の直前の目次画像である。目次画像M(n)から抽出された文字列を文字列S(n)と表現する。ただし、M(n),S(n)の(n)は内容を区別するための表現であり、必ずしも配列変数を意味しない。
動画撮影が開始されると、CPU12は、時間変数Ts,Tn及びループ変数nを0で初期化する(S1101)。CPU12は、カメラ信号処理手段28によって現像処理された記録画像データから画像領域切出し手段32に注目領域を切り出させ、切り出された注目領域の画像を目次画像M(n)としてDRAM26に格納する(S1102)。同時に、CPU12は、次の目次画像M(n+1)を目次画像M(n)で初期化する。
CPU12は、S1102で生成された目次画像M(n)を文字列検出手段34に転送し、この目次画像M(n)に含まれる文字列を抽出させ、変数S(n)に格納する(S1103)。このとき、CPU12は、次の文字列S(n+1)を、文字列S(n)で初期化する。
ステップS1101〜S1103により、目次画像記録動作の初期化が終了する。
CPU12は、S204,S704と同様に、動画撮影動作による記録画像データから目次画像を作成すべきか否か判断する(S1104)。図3を参照して説明した処理は、目次画像生成判断(S1104)にも適用されうる。
目次画像を作成する必要が無い場合(S1104)、CPU12は、動画撮影動作が終了しているかを判断する(S1113)。動画撮影動作が終了していない場合(S1113)、CPU12は、目次画像M(n+1)を目次画像M(n)で更新すると共に文字列S(n+1)を文字列S(n)で更新し(S1114)、S1104に戻る。動画撮影動作が終了している場合(S1113)、CPU12は、図11A及び図11Bに示す制御を終了する。
目次画像を作成する必要がある場合(S1104)、CPU12は、現在時刻Tを取得して、動画シーン現在時刻Tnに代入する(S1105)。CPU12は、S1104で目次画像作成の必要ありと判断された記録画像データから、画像切出し手段32に注目領域を切り出させ、目次画像M(n+1)とする(S1106)。CPU12は、目次画像M(n+1)を文字列検出手段34に供給して目次画像M(n+1)に含まれる文字列を抽出させ、文字列S(n+1)に代入する(S1107)。
CPU12は、S1107で抽出された文字列S(n+1)と直前の目次画像M(n)から抽出された文字列S(n)を比較し、文字列の追加が発生したかどうかを判断する(S1108)。
文字列の追加が発生していた場合(S1108)、CPU12は、文字列検出手段34を用いて、追加された文字列の文字列領域情報を取得する(S1109)。CPU12は、S1109で取得された文字列領域情報と関連する動画シーンの開始時間Tsと現在の動画シーン時間Tnを、対応動画シーン情報として、S1109で取得された文字列領域情報に追加する(S1110)。CPU12は、記録媒体50に記録されている直前の目次画像M(n)と動画シーン関連情報を記録媒体50から削除する(S1111)。CPU12は、情報付加プログラムを用いて、S1110で生成された文字列領域情報をS1106で生成された目次画像M(n+1)に付加し、記録媒体I/F42を介して記録媒体50に記録する(S1112)。
文字列の追加が発生していない場合(S1108)、CPU12は、S1107で抽出された文字列S(n+1)の文字列領域を文字列検出手段34を用いて取得する(S1118)。そして、CPU12は、取得された文字列領域ではない目次画像M(n+1)の画像領域を、画像比較手段38を使って直前の目次画像M(n)と比較する(S1118)。CPU12は、比較結果(S1118)が画像差分の存在を示すかどうかを判断する(S1119)。画像差分がある場合(S1119)、CPU12は、画像領域情報にS1119で差分ありと判断された画像差分領域とこれに関連する動画シーンの開始情報Tsと現在時間Tnを追加する(S1120)。そして、CPU12は、記録媒体50に記録されている直前の目次画像M(n)と動画シーン関連情報を記録媒体50から削除する(S1111)。CPU12は、情報付加プログラムを用いて、S1110で生成された文字列領域情報をS1106で生成された目次画像M(n+1)に付加し、記録媒体I/F42を介して記録媒体50に記録する(S1112)。
差分画像が存在しない場合(S1119)、CPU12は、S1107で更新された文字列S(n+1)と直前の目次画像M(n)から抽出された文字列S(n)を比較し、文字列の削除が発生したかどうかを判断する(S1115)。
文字列の削除が発生していた場合(S1115)、CPU12は、文字列検出手段34を用いて、削除された文字列の文字列領域情報を取得する(S1116)。CPU12は、S1116で取得された文字列領域が文字列領域情報に含まれる場合、S1116で取得された文字列領域とこれに付随する動画シーン情報を文字列領域情報から削除する(S1117)。CPU12は、情報付加プログラムを用いて、S1117で更新された文字列領域情報をS1106で生成された目次画像M(n+1)に付加し、記録媒体I/F42を介して記録媒体50に記録する(S1112)。
文字列の削除も発生していない場合(S1115)、又は、S1112の後、CPU12は、動画撮影動作が終了しているかを判断する(S1113)。動画撮影動作が終了していない場合(S1113)、CPU12は、目次画像M(n+1)を目次画像M(n)で更新すると共に文字列S(n+1)を文字列S(n)で更新し(S1114)、S1104に戻る。動画撮影動作が終了している場合(S1113)、CPU12は、図7A及び図7Bに示す制御を終了する。
文字列領域の差分に加えて文字列領域外の画像差分を判別することで、再生時に使い勝手の良い目次画像情報を生成できる。例えば、文字列以外の例えば図形などの領域に関しても関連する動画シーンにジャンプして再生することが容易になる。
撮像装置により撮像及び記録される動画像に対してリアルタイムで目次画像を生成記録する実施例を説明したが、記録済みの動画像又は別の撮像装置から入力する動画像に対して目次画像を生成する場合にも本発明は適用可能である。目次画像及び文字列の生成と動画像との関連付けをサーバ上で実行するようにしてもよい。すなわち、サーバが、クライアントから供給される動画像に対して上述の目次画像生成処理を実行し、その処理結果として目次画像及び文字列並びにこれらの動画像との位置関係を示す情報をクライアントに返送するようにしてもよい。
記録される目次画像と動画像との対応は、目次画像に付加または埋め込みにより関連付けてもよいし、動画像に付加または埋め込みにより関連付けても良い。注目領域から抽出され文字認識された文字列についても同様である。
本発明の目的は、前述した実施例の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を装置に供給することによっても、達成される。このとき、供給された装置の制御部を含むコンピュータ(またはCPUやMPU)は、記憶媒体に格納されたプログラムコードを読み出し実行する。記憶媒体から読み出されたプログラムコード自体が、上述の実施例の機能を実現することになり、プログラムコード自体及びそのプログラムコードを記憶した記憶媒体は、本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、磁気ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード又はROM等を用いることができる。
上述のプログラムコードの指示に基づき、装置上で稼動しているOS(基本システムやオペレーティングシステム)などが処理の一部又は全部を行い、その処理によって前述した実施例の機能が実現される場合も含まれる。
さらに、記憶媒体から読み出されたプログラムコードが、装置に挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれ、前述した実施形態の機能が実現される場合も含まれる。このとき、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行う。
以上、本発明の好ましい実施例を説明したが、本発明は、これらの実施例に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。

Claims (8)

  1. 動画像のインデックスとなる目次画像を生成する画像処理装置であって、
    前記動画像から画面上の注目領域を切り出す画像領域切出し手段と、
    前記画像領域切出し手段により切り出される注目領域画像と、前記画像領域切出し手段により先行して切り出された直前の注目領域画像との間における所定変化の有無を判別する判別手段と、
    前記所定変化がある場合に、前記画像領域切出し手段により先行して切り出された直前の注目領域画像を目次画像とし、前記動画像との対応を示す対応動画シーン情報と関連付けて出力する出力手段
    とを有することを特徴とする画像処理装置。
  2. 前記出力手段が、前記動画像、前記目次画像、前記所定変化を示す内容、及び前記動画像の対応する位置を示す情報を記録媒体に記録する記録手段であることを特徴とする請求項1に記載の画像処理装置。
  3. 前記判別手段が、前記注目領域画像に含まれる文字列を検出する文字列検出手段と、前記文字列検出手段により検出される文字列を、先行する前記目次画像に含まれる文字列と比較する比較手段とを有し、文字列の追加及び削除のいずれかにより前記所定変化があったと判別することを特徴とする請求項2に記載の画像処理装置。
  4. 前記比較手段の結果が文字列の削除である場合に、前記記録手段は、先行して記録される直前の前記目次画像を前記記録媒体から削除し、削除された前記目次画像に先行して記録される目次画像の前記対応動画シーン情報を更新することを特徴とする請求項3に記載の画像処理装置。
  5. 前記判別手段は、前記比較手段の比較結果が文字列の追加でない場合に、前記画像領域切出し手段により切り出される注目領域画像と、前記画像領域切出し手段により先行して切り出された直前の注目領域画像とを、前記文字列が検出された領域を除く領域で画像比較する画像比較手段を有し、前記画像比較手段の比較結果として画像差分がある場合に、前記所定変化があると判別することを請求項3に記載の画像処理装置。
  6. 前記動画像が撮像部から出力される動画像であることを特徴とする請求項1から5のいずれか1項に記載される画像処理装置。
  7. さらに、前記動画像の人物領域を検出する被写体検出手段を有し、前記人物領域が前記注目領域を隠すように重なる場合に、前記判別手段の判別を実行しないことを特徴とする請求項1から6のいずれか1項に記載の画像処理装置。
  8. 動画像のインデックスとなる目次画像を生成する画像処理方法であって、
    前記動画像から画面上の注目領域を切り出し、得られた注目領域画像を記憶手段に記憶する画像領域切出しステップと、
    前記画像領域切出しステップで切り出される注目領域画像と、前記画像領域切出しステップで先行して切り出された直前の注目領域画像との間における所定変化の有無を判別する判別ステップと、
    前記所定変化がある場合に、前記直前の注目領域画像を目次画像とし、前記動画像との対応を示す対応動画シーン情報と関連付けて出力する出力ステップ
    とを有することを特徴とする画像処理方法。
JP2015189183A 2015-09-28 2015-09-28 画像処理装置及び方法 Pending JP2017069596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015189183A JP2017069596A (ja) 2015-09-28 2015-09-28 画像処理装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015189183A JP2017069596A (ja) 2015-09-28 2015-09-28 画像処理装置及び方法

Publications (1)

Publication Number Publication Date
JP2017069596A true JP2017069596A (ja) 2017-04-06

Family

ID=58492909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015189183A Pending JP2017069596A (ja) 2015-09-28 2015-09-28 画像処理装置及び方法

Country Status (1)

Country Link
JP (1) JP2017069596A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109194894A (zh) * 2018-08-30 2019-01-11 努比亚技术有限公司 一种投影录制方法、设备及计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109194894A (zh) * 2018-08-30 2019-01-11 努比亚技术有限公司 一种投影录制方法、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
US7853897B2 (en) Information processing apparatus and method, and program
US8004594B2 (en) Apparatus, method, and program for controlling display of moving and still images
US10033931B2 (en) Image processing apparatus and image processing method for processing still image data
US9071806B2 (en) Reproducing apparatus
EP2787723A2 (en) Image processing system and method therefor, program recording medium, and program for applying an appropriate process for an object to a captured image
JP2010153947A (ja) 画像生成装置、画像生成プログラム及び画像表示方法
KR101812103B1 (ko) 썸네일이미지 설정방법 및 설정프로그램
JP4735388B2 (ja) 再生装置および方法、並びにプログラム
JP2014209707A (ja) 映像再生装置および映像再生方法
JP2008131617A (ja) 映像処理装置
JP6355333B2 (ja) 撮像装置、画像処理装置、画像処理方法、プログラム
JP2017069596A (ja) 画像処理装置及び方法
JP2006101076A (ja) 動画編集方法、動画編集装置及びプログラム
KR102066857B1 (ko) 객체 영상 트랙킹 스트리밍 시스템 및 이를 이용한 스트리밍 방법
KR102361811B1 (ko) 비디오 컨텐츠 자동 편집 시스템 및 자동 편집 방법
JP6249771B2 (ja) 画像処理装置、画像処理方法、プログラム
KR101828601B1 (ko) 비디오 컨텐츠 자동 편집 시스템 및 자동 편집 방법
JP2006005610A (ja) パノラマ映像記録再生装置
JP6263002B2 (ja) 撮像装置およびその制御方法、プログラム
JP2004304486A (ja) 動画像編集装置および動画像編集方法
JP2010287974A (ja) 携帯電話及びプログラム
JP4709070B2 (ja) 記録方法及び装置
JP6643081B2 (ja) アルバム動画生成装置、アルバム動画生成方法及びプログラム
JP6332963B2 (ja) 画像処理装置及び画像処理装置の制御方法
JP5464926B2 (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20180227