JP2011024017A - 動画抽出装置、プログラム、および動画抽出方法 - Google Patents

動画抽出装置、プログラム、および動画抽出方法 Download PDF

Info

Publication number
JP2011024017A
JP2011024017A JP2009167909A JP2009167909A JP2011024017A JP 2011024017 A JP2011024017 A JP 2011024017A JP 2009167909 A JP2009167909 A JP 2009167909A JP 2009167909 A JP2009167909 A JP 2009167909A JP 2011024017 A JP2011024017 A JP 2011024017A
Authority
JP
Japan
Prior art keywords
section
value
moving image
blur
stable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009167909A
Other languages
English (en)
Inventor
Satoshi Kuma
智 隈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009167909A priority Critical patent/JP2011024017A/ja
Priority to US12/796,749 priority patent/US8437548B2/en
Publication of JP2011024017A publication Critical patent/JP2011024017A/ja
Priority to US13/860,222 priority patent/US8792720B2/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47205End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for manipulating displayed content, e.g. interacting with MPEG-4 objects, editing locally
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera

Abstract

【課題】動画抽出装置、プログラム、および動画抽出方法を提供すること。
【解決手段】動画を構成する各フレームのボケの度合を示すボケ値を取得するボケ値取得部と、前記ボケ値取得部により取得された前記ボケ値の分散が第1の値より低い安定区間と、前記安定区間でない不安定区間とに前記動画を区分する区間決定部と、前記動画から、前記区間決定部により得られた前記安定区間または前記不安定区間に基づく区間抽出を行う抽出部と、を動画抽出装置に設ける。
【選択図】図2

Description

本発明は、動画抽出装置、プログラム、および動画抽出方法に関する。
近日、入射光を電気信号に変換することにより動画を得ることが可能な撮像装置が広く普及している。ユーザは、この撮像装置を用い、子供の運動会の様子、旅行での風景、およびペットの仕草などを動画として保存することができる。
また、撮像装置により得られた動画の一区間を抽出してショートムービーを作成する自動編集用ソフトウェアも提案されている。この自動編集用ソフトウェアによれば、動画の抽出区間は例えばランダムに決定される。なお、動画の自動編集用ソフトウェアの一例が特許文献1に記載されている。
特開2004−159331号公報
しかし、上記の自動編集用ソフトウェアでは、動画の抽出区間が例えばランダムに決定されるため、ユーザの所望する区間を抽出することが困難であった。例えば、ユーザが魅力的な動画部分の抽出を所望した場合に、上記の自動編集用ソフトウェアでは焦点の合っていないボケた動画部分が抽出されてしまう場合が想定された。
そこで、本発明は、上記問題に鑑みてなされたものであり、本発明の目的とするところは、動画からの区間抽出を各フレームのボケ値に応じて行うことが可能な、新規かつ改良された動画抽出装置、プログラム、および動画抽出方法を提供することにある。
上記課題を解決するために、本発明のある観点によれば、動画を構成する各フレームのボケの度合を示すボケ値を取得するボケ値取得部と、前記ボケ値取得部により取得された前記ボケ値の分散が第1の値より低い安定区間と、前記安定区間でない不安定区間とに前記動画を区分する区間決定部と、前記動画から、前記区間決定部により得られた前記安定区間または前記不安定区間に基づく区間抽出を行う抽出部と、を備える動画抽出装置が提供される。
前記区間決定部は、動画中の異なるフレームを順次に始点として選択し、選択したフレームを含む区間を、前記ボケ値の分散が前記第1の値を上回るまで広げて安定区間を定義する1次処理部を有してもよい。
前記1次処理部は、安定区間と定義されてなく、かつ、始点として選ばれていないフレームが無くなるまで、前記安定区間の定義を繰り返してもよい。
前記区間決定部は、各不安定区間と、前記各不安定区間の前後に定義された安定区間とを含む区間のボケ値の分散が前記第1の値を下回っているか否かを判断し、前記区間のボケ値の分散が前記第1の値を下回っている場合、前記区間を安定区間と定義する2次処理部を有してもよい。
前記区間決定部は、前記2次処理部により定義された安定区間を、前記ボケ値の分散が前記第1の値を上回るまで広げる3次処理部を有してもよい。
前記抽出部は、前記安定区間または前記不安定区間のうちで、前記ボケ値の平均値が第2の値より小さい区間を抽出してもよい。
前記抽出部は、前記ボケ値の平均値が第2の値より小さいことに加え、区間長さが第3の値より長い区間を抽出してもよい。
前記抽出部は、前記安定区間または前記不安定区間のうちで、最大ボケ値が第4の値より高い区間、および、区間長さが第5の値より短い区間を抽出してもよい。
前記抽出部は、さらに、最大ボケ値が前記第4の値より高い安定区間に隣接する不安定区間を抽出してもよい。
前記動画抽出装置は、ボケ値取得部により取得された新たなフレームのボケ値を一時的に保存するバッファをさらに備え、前記区間決定部は、前記バッファに未処理フレームのボケ値が所定量以上保存された後に前記動画の区分を行なってもよい。
前記区間決定部は、未処理フレームの直前フレームが安定区間に属する場合、前記直前フレームが属する安定区間を、前記ボケ値の分散が前記第1の値を上回るまで未処理フレーム側へ広げてもよい。
また、上記課題を解決するために、本発明の別の観点によれば、コンピュータを、動画を構成する各フレームのボケの度合を示すボケ値を取得するボケ値取得部と、前記ボケ値取得部により取得された前記ボケ値の分散が第1の値より低い安定区間と、前記安定区間でない不安定区間とに前記動画を区分する区間決定部と、前記動画から、前記区間決定部により得られた前記安定区間または前記不安定区間に基づく区間抽出を行う抽出部と、として機能させるためのプログラムが提供される。
また、上記課題を解決するために、本発明の別の観点によれば、動画を構成する各フレームのボケの度合を示すボケ値を取得するステップと、前記ボケ値の分散が第1の値より低い安定区間と、前記安定区間でない不安定区間とに前記動画を区分するステップと、前記動画から、前記安定区間または前記不安定区間に基づく区間抽出を行うステップと、を含む動画抽出方法が提供される。
以上説明したように、本発明にかかる動画抽出装置、プログラム、および動画抽出方法によれば、動画からの区間抽出を各フレームのボケ値に応じて行うことができる。
本発明の一実施形態による画像抽出システムを示した説明図である。 画像抽出装置の動作の概略的な流れを示した説明図である。 画像抽出装置のハードウェア構成を示したブロック図である。 第1の実施形態による画像抽出装置の構成を示した機能ブロック図である。 安定区間および不安定区間の具体例を示した説明図である。 1次処理部による1次処理の具体例を示した説明図である。 2次処理部による2次処理の具体例を示した説明図である。 3次処理部による3次処理の具体例を示した説明図である。 ボケ統計値の一例を示した説明図である。 抽出部が抽出する失敗カットの具体例を示した説明図である。 抽出部が抽出するお奨めカットの具体例を示した説明図である。 第1の実施形態による画像抽出装置の動作の流れを示したフローチャートである。 第2の実施形態による動画抽出装置の構成を示した機能ブロック図である。 未処理フレームのボケ値および処理済みフレームのボケ値を模式的に示した説明図である。 未処理フレームのボケ値および処理済みフレームのボケ値を模式的に示した説明図である。 第2の実施形態における区間決定の流れを示したフローチャートである。 バッファリングの詳細フローを示したフローチャートである。 前処理の詳細の詳細フローを示したフローチャートである。 前処理の具体例を示した説明図である。
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、以下に示す項目順序に従って当該「発明を実施するための形態」を説明する。
1.画像抽出装置の概要
2.第1の実施形態
2−1.画像抽出装置のハードウェア構成
2−2.画像抽出装置の機能
2−3.画像抽出装置の動作
3.第2の実施形態
4.まとめ
<1.画像抽出装置の概要>
まず、図1および図2を参照し、本発明の一実施形態による画像抽出装置20について概略的に説明する。
図1は、本発明の一実施形態による画像抽出システム1を示した説明図である。図1に示したように、画像抽出システム1は、撮像装置10および画像抽出装置20を含む。
撮像装置10は、入射光を電気信号に変換することにより、複数フレームからなる動画を取得する。また、撮像装置10は、取得した動画を、撮像装置10に一体的に搭載されている記憶媒体、または撮像装置10と着脱可能に装着されている記憶媒体に記録する。なお、撮像装置10は、ユーザによる録画開始操作に基づいて動画の取得を開始し、ユーザによる録画停止操作に基づいて動画の取得を終了してもよい。
画像抽出装置20は、撮像装置10における撮像により得られた動画を取得する。例えば、画像抽出装置20は、動画が記録された記憶媒体が装着され、記憶媒体から動画を取得してもよい。または、撮像装置10が有線または無線で動画を送信し、画像抽出装置20は、撮像装置10から送信された動画を受信してもよい。
なお、図1においては画像抽出装置20がPC(Personal Computer)である例を示したが、画像抽出装置20はPCに限定されない。例えば、画像抽出装置20は、家庭用映像処理装置(DVDレコーダ、ビデオデッキなど)、PDA(Personal Digital Assistants)、家庭用ゲーム機器、家電機器などの情報処理装置であってもよい。また画像抽出装置20は、携帯電話、PHS(Personal Handyphone System)、携帯用音楽再生装置、携帯用映像処理装置、携帯用ゲーム機器などの情報処理装置であってもよい。
また、画像抽出装置20は、取得した動画中の一区間を抽出する。例えば、画像抽出装置20は、動画を構成する各フレームのボケの度合に基づき、動画中の失敗カットまたはお奨めカットを抽出する。以下、図2を参照し、画像抽出装置20が失敗カットまたはお奨めカットを抽出するまでの流れを簡単に説明する。
図2は、画像抽出装置20の動作の概略的な流れを示した説明図である。図2に示したように、画像抽出装置20は、動画を構成する各フレームのボケ値を算出する(S40)。なお、ボケ値は、ボケの程度を示す指標であり、値が大きいほどボケの程度が高いことを示す。
その後、画像抽出装置20は、動画中の安定区間および不安定区間を決定する(S42)。なお、安定区間は、ボケ値の分散が閾値Th1以下である区間である。また、不安定区間は、ボケ値の分散が閾値Th1を上回っている区間であり、安定区間よりボケの程度の変動が大きい区間である。
続いて、画像抽出装置20は、各区間のボケ統計値を示すリストに基づき、動画からの抽出区間を決定する(S44)。例えば、画像抽出装置20は、各区間の平均ボケ値、最大ボケ値、ボケ値分散などのボケ統計値を示すリストに基づき、お奨めカット、または失敗カットを抽出してもよい。
以上説明したように、本発明の一実施形態による画像抽出装置20は、動画を構成する各フレームのボケ値に基づき、お奨めカット、または失敗カットを抽出することが可能である。以下、図13〜図19を参照し、このような画像抽出装置20について詳細に説明する。
<2.第1の実施形態>
(2−1.画像抽出装置のハードウェア構成)
図3は、画像抽出装置20のハードウェア構成を示したブロック図である。画像抽出装置20は、CPU(Central Processing Unit)201と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、ホストバス204と、を備える。また、画像抽出装置20は、ブリッジ205と、外部バス206と、インタフェース207と、入力装置208と、出力装置210と、ストレージ装置(HDD)211と、ドライブ212と、通信装置215とを備える。
CPU201は、演算処理装置および制御装置として機能し、各種プログラムに従って画像抽出装置20内の動作全般を制御する。また、CPU201は、マイクロプロセッサであってもよい。ROM202は、CPU201が使用するプログラムや演算パラメータ等を記憶する。RAM203は、CPU201の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を一時記憶する。これらはCPUバスなどから構成されるホストバス204により相互に接続されている。
ホストバス204は、ブリッジ205を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス206に接続されている。なお、必ずしもホストバス204、ブリッジ205および外部バス206を分離構成する必要はなく、一のバスにこれらの機能を実装してもよい。
入力装置208は、マウス、キーボード、タッチパネル、ボタン、マイク、スイッチおよびレバーなどユーザが情報を入力するための入力手段と、ユーザによる入力に基づいて入力信号を生成し、CPU201に出力する入力制御回路などから構成されている。画像抽出装置20のユーザは、該入力装置208を操作することにより、画像抽出装置20に対して各種のデータを入力したり処理動作を指示したりすることができる。
出力装置210は、例えば、CRT(Cathode Ray Tube)ディスプレイ装置、液晶ディスプレイ(LCD)装置、OLED(Organic Light Emitting Diode)装置およびランプなどの表示装置を含む。さらに、出力装置210は、スピーカおよびヘッドホンなどの音声出力装置を含む。出力装置210は、例えば、再生されたコンテンツを出力する。具体的には、表示装置は再生された映像データ等の各種情報をテキストまたはイメージで表示する。一方、音声出力装置は、再生された音声データ等を音声に変換して出力する。
ストレージ装置211は、本実施形態にかかる画像抽出装置20の記憶部の一例として構成されたデータ格納用の装置である。ストレージ装置211は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。ストレージ装置211は、例えば、HDD(Hard Disk Drive)で構成される。このストレージ装置211は、ハードディスクを駆動し、CPU201が実行するプログラムや各種データを格納する。
ドライブ212は、記憶媒体用リーダライタであり、画像抽出装置20に内蔵、あるいは外付けされる。ドライブ212は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体24に記録されている情報を読み出して、RAM203に出力する。
通信装置215は、例えば、通信網12に接続するための通信デバイス等で構成された通信インタフェースである。また、通信装置215は、無線LAN(Local Area Network)対応通信装置であっても、ワイヤレスUSB対応通信装置であっても、有線による通信を行うワイヤー通信装置であってもよい。
(2−2.画像抽出装置の機能)
以上、図3を参照して画像抽出装置20のハードウェア構成を説明した。続いて、図4〜図11を参照し、画像抽出装置20の機能を説明する。
図4は、第1の実施形態による画像抽出装置20の構成を示した機能ブロック図である。図4に示したように、第1の実施形態による画像抽出装置20は、記憶部216と、ボケ値取得部218と、区間決定部220と、統計値取得部230と、抽出部234と、を備える。
記憶部216は、撮像装置10において動画が記録された記憶媒体である。記憶媒体としては、不揮発性メモリ、磁気ディスク、光ディスク、およびMO(Magneto Optical)ディスクなどがあげられる。不揮発性メモリとしては、例えば、EEPROM(Electrically Erasable Programmable Read−Only Memory)、EPROM(Erasable Programmable ROM)があげられる。また、磁気ディスクとしては、ハードディスクおよび円盤型磁性体ディスクなどがあげられる。また、光ディスクとしては、CD(Compact Disc、DVD−R(Digital Versatile Disc Recordable)およびBD(Blu−Ray Disc(登録商標))などがあげられる。なお、記憶部216は、撮像装置10から送信された動画が受信される記憶媒体であってもよい。
ボケ値取得部218は、記憶部216に記録されている動画を構成する各フレームのボケ値を取得する。このボケ値は、フレームのエッジ成分に基づいて取得することができる。例えば、焦点の合っていないボケているフレームほどエッジ部分の輝度分布の変化が緩やかであり、焦点の合っているボケていないフレームほどエッジ部分の輝度分布の変化が急峻である。そこで、ボケ値取得部218は、エッジ部分における輝度分布の変化の急峻さに基づいてボケ値を取得してもよい。
区間決定部220は、ボケ値取得部218により取得された各フレームのボケ値に基づいて、図5に示すように、ボケ値の分散が閾値Th1(第1の値)以下である安定区間と、閾値Th1を上回る不安定区間とに動画を区分する。
図5は、安定区間および不安定区間の具体例を示した説明図である。図5に示したように、区間決定部220は、ボケ値の変動が少ない区間を安定区間として決定し(実線楕円部分)、ボケ値の変動が大きい区間を不安定区間として決定する。このような区間決定を行うために、区間決定部220は、1次処理部221と、2次処理部222と、3次処理部223と、を備える。
1次処理部221は、動画中の異なるフレームを順次に始点として選択し、選択したフレームを含む区間を、ボケ値の分散が閾値Th1を上回るまで広げて安定区間を定義する。より詳細には、1次処理部221は、選択したフレームを始点とする未来方向の区間をボケ値の分散が閾値Th1を上回るまで広げた後、過去方向の区間もボケ値の分散が閾値Th1を上回るまで広げることにより、安定区間を定義する。以下、図6を参照して具体的に説明する。
図6は、1次処理部221による1次処理の具体例を示した説明図である。図6の1段目に示したように、最初は、全フレームが不安定候補区間である。なお、図6において「x−8」・・・「x」・・・「x+7」はフレーム番号を示す。
ここで、図6の2段目に示したように、1次処理部221がフレーム「x」を始点として選択した場合を考える。この場合、1次処理部221は、フレーム「x」を始点として、未来方向の区間をフレーム「x+1」、「x+2」、「x+3」と広げていく。そして、1次処理部221は、未来方向の区間をフレーム「x+4」まで広げるとボケ値の分散が閾値Th1を上回ってしまうため、図6の3段目に示したように、未来方向への区間の延長をフレーム「x+3」で終える。
続いて、1次処理部221は、フレーム「x」を始点として、過去方向の区間をフレーム「x−1」、「x‐2」と広げていく。そして、1次処理部221は、過去方向の区間をフレーム「x−3」まで広げるとボケ値の分散が閾値Th1を上回ってしまうため、図6の4段目に示したように、過去方向への区間の延長をフレーム「x−2」で終える。1次処理部221は、このようにして区間を広げていくことにより、安定区間を定義する。
また、1次処理部221は、安定区間として定義されていない不安定候補区間からあるフレームを選択して図6に示した1次処理を繰り返す。例えば、1次処理部221は、不安定候補区間中でボケ値が最大であるフレームを選択しても、ボケ値が最小であるフレームを選択してもよい。なお、1次処理部221は、このような1次処理を、全てのフレームが、安定区間に属する、または始点として選択されるまで繰り返す。
2次処理部222は、各不安定候補区間(1次的な不安定区間)と、各不安定候補区間の前後に定義された安定区間とを含む区間のボケ値の分散が閾値Th1以下であるか否かを判断する。そして、2次処理部222は、上記区間のボケ値の分散が閾値Th1以下である場合、上記区間全体を安定区間と定義する。以下、2次処理部222による2次処理について図7を参照して具体的に説明する。
図7は、2次処理部222による2次処理の具体例を示した説明図である。なお、図7上段における色つき部分は1次処理部221により安定区間として定義された区間を示し、他の部分は1次処理部221により安定区間として定義されなかった不安定候補区間を示す。例えば、図7上段に示した区間A、C、EおよびGは安定区間であり、区間B、DおよびFは不安定候補区間である。
ここで、2次処理部222は、例えば不安定候補区間である区間Bと、区間Bの前後の安定区間である区間Aおよび区間Cを選択する。続いて、2次処理部222は、選択した区間A、BおよびCにおけるボケ値の分散を算出する。そして、2次処理部222は、算出したボケ値の分散が閾値Th1以下である場合、図7下段に示したように、区間A、BおよびCの全体を安定区間と再定義する。
その後、2次処理部222は、不安定候補区間である区間Bと、安定区間である区間Eおよび再定義された区間Hを選択し、上記同様の2次処理を行う。ここで、区間H、DおよびEにおけるボケ値の分散が閾値Th1を上回っている場合、区間H、DおよびEの状態は維持される。なお、2次処理部222は、図7に示した2次処理を、安定区間として再定義できる区間が無くなるまで繰り返す。
3次処理部223は、1次処理部221および2次処理部222により定義された安定区間を、ボケ値の分散が閾値Th1を上回るまで広げる。これは、2次処理部222における2次処理による複数区間の結合により、安定区間のボケ値の分散が下がり、安定区間をさらに広げられる場合が想定されるためである。以下、3次処理部223による3次処理について図8を参照して具体的に説明する。
図8は、3次処理部223による3次処理の具体例を示した説明図である。なお、図8の上段に示した区間Hは、2次処理部222により安定区間として再定義された区間である。
ここで、3次処理部223は、図8の下段に示したように、ボケ値の分散が閾値Th1を上回るまで区間Hを広げることにより、区間H’を定義する。なお、図8においては3次処理部223が区間Hを未来方向へ広げる例を示したが、3次処理部223は過去方向へも区間Hを広げることができる。また、3次処理部223は、図8に示した3次処理を、全ての安定区間と不安定区間との境界において行う。
以上説明したように、区間決定部220は、1次処理〜3次処理を行い、3次処理部223における3次処理により定義された安定区間を安定区間として決定し、他の区間を不安定区間として決定する。
統計値取得部230は、区間決定部220により決定された各安定区間、および各不安定区間のボケ統計値のリストを取得する。
図9は、ボケ統計値の一例を示した説明図である。図9に示したように、ボケ統計値は、区間ID、開始フレーム番号、終了フレーム番号、平均ボケ値、最大ボケ値、最小ボケ値、およびボケ値分散などを含む。
抽出部234は、統計値取得部230により取得された各区間のボケ統計値に基づいて、動画から失敗カットまたはお奨めカット(成功カット)などを抽出する。以下、失敗カットの抽出基準およびお奨めカットの抽出基準を説明する。
(失敗カットの抽出)
抽出部234は、例えば、以下のいずれかに該当する区間を、失敗カットとして抽出する。
(1)区間の最大ボケ値>閾値Th4(第4の値)である区間
(2)区間の最大ボケ値>閾値Th4(第4の値)である安定区間の前後の不安定区間
(3)区間長<閾値Th5(第5の値)である区間
以下、図10を参照し、抽出部234が抽出する失敗カットの具体例を説明する。
図10は、抽出部234が抽出する失敗カットの具体例を示した説明図である。図10においては、色を付した区間O、Q、S、UおよびWが安定区間を示し、他の区間P、R、TおよびVが不安定区間を示す。また、区間O、SおよびWの最大ボケ値は閾値Th4より大きく、区間QおよびUの最大ボケ値は閾値Th4より小さい。
この場合、抽出部234は、上記(1)に基づき、安定区間QおよびUを失敗カットとして抽出する。また、抽出部234は、上記(2)に基づき、不安定区間P、R、T、およびVを失敗カットとして抽出する。さらに、抽出部234は、上記(3)に基づき、区間長<閾値Th5である安定区間Sを失敗カットとして抽出する。その結果、図10に示した例では、区間P〜区間Vが失敗カットとして抽出される。
ユーザは、例えば、このようにして抽出された失敗カットを動画から削除することにより、動画中で視聴価値のある部分の密度を向上することができる。なお、上記(1)〜(3)に示した抽出基準は一例であり、新たな基準を追加してもよいし、いずれかの基準を削除してもよい。
(お奨めカットの抽出)
抽出部234は、例えば、以下の全てに該当する区間を、お奨めカットとして抽出する。
(4)区間の平均ボケ値≦閾値Th2(第2の値)である区間
(5)区間長≧閾値Th3(第3の値)である区間
(6)区間のボケ値分散≦閾値Th6(第6の値)である区間
以下、図11を参照し、抽出部234が抽出するお奨めカットの具体例を説明する。
図11は、抽出部234が抽出するお奨めカットの具体例を示した説明図である。図11に示したように、安定区間Xの平均ボケ値は閾値Th2を下回っており、上記(4)が満たされている。また、安定区間Xのボケ値分散は閾値Th6を下回っており、上記(6)が満たされている。したがって、抽出部234は、さらに安定区間Xの区間長が閾値Th3であり上記(5)も満たされる場合、安定区間Xをお奨めカットとして抽出する。
画像抽出装置20は、例えば、このようにして抽出されたお奨めカットをユーザに提供する。したがって、ユーザは、動画中の焦点のボケていない視聴価値のある部分を選択的に視聴することが可能となる。なお、上記(4)〜(6)に示した抽出基準は一例であり、新たな基準を追加してもよいし、いずれかの基準を削除してもよい。
(2−3.画像抽出装置の動作)
以上、本発明の第1の実施形態による画像抽出装置20の構成および機能について説明いた。続いて、図12を参照し、第1の実施形態による画像抽出装置20の動作を説明する。
図12は、第1の実施形態による画像抽出装置20の動作の流れを示したフローチャートである。なお、図12においては、図2に示したS42の処理の流れを詳細に示している。
図12に示したように、動画抽出装置20は、ボケ値取得部により各フレームのボケ値が取得された後、1次処理(S1)、2次処理(S2)、および3次処理(S3)を行うことにより不安定区間を確定する(S4)。
(1次処理)
1次処理部221は、全フレームが評価済になるまで1次処理を繰り返す(S1−1)。具体的には、1次処理部221は、動画中の未評価フレームから1のフレームを始点として選択する(S1−2)。ここで、未評価フレームは、安定区間として定義されておらず、かつ、始点として選択されたことのないフレームを指す。
そして、1次処理部221は、選択したフレームを始点とする未来方向の区間をボケ値の分散が閾値Th1を上回るまで広げる(S1−3)。さらに、1次処理部221は、選択したフレームを始点とする過去方向の区間もボケ値の分散が閾値Th1を上回るまで広げることにより、安定区間を定義する(S1−4)。
(2次処理)
2次処理部222は、全不安定候補区間が処理済みになるまで2次処理を繰り返す(S2−1)。具体的には、2次処理部222は、未処理である不安定区間に隣接する安定区間を選択する(S2−2)。そして、2次処理部222は、選択した3(または2)の区間全体でのボケ値の分散が閾値Th1以下であるか否かを判断する(S2−3)。
そして、2次処理部222は、上記区間全体でのボケ値の分散が閾値Th1を上回っている場合、S2−2において選択した不安定候補区間を処理済みにする(S2−4)。一方、2次処理部222は、上記区間全体でのボケ値の分散が閾値Th1以下である場合、上記区間全体を結合し、安定区間として再定義する(S2−5)。
(3次処理)
3次処理部223は、安定区間および不安定候補区間の間の全ての境界が処理済みになるまで3次処理を繰り返す(S3−1)。具体的には、3次処理部223は、未処理の境界を選択し(S3−2)、安定区間をボケ値の分散が閾値Th1を上回るまで1フレームずつ広げる(S3−3)。
以上の1次処理〜3次処理により、3次処理部223における3次処理により定義された安定区間が安定区間として決定され、他の区間が不安定区間として決定される(S4)。その結果、抽出部234が、目的やユーザ指示に応じ、失敗カットまたはお奨めカットなどを抽出することが可能となる。
<3.第2の実施形態>
続いて、図13〜図19を参照し、本発明の第2の実施形態による動画抽出装置20’について説明する。なお、この動画抽出装置20’としては、例えば図1に示したような撮像装置10を想定しており、動画抽出装置20’は、撮像しつつ、安定区間または不安定区間を決定することが可能である。
図13は、第2の実施形態による動画抽出装置20’の構成を示した機能ブロック図である。図13に示したように、第2の実施形態による動画抽出装置20’は、ボケ値取得部218と、区間決定部220’と、統計値取得部230と、抽出部234と、撮像部238と、バッファ242と、を備える。
撮像部238は、撮像により新たなフレームを順次に取得する。ボケ値取得部218は、撮像部238により取得されたフレームのボケ値を取得し、バッファ242は、ボケ値取得部218により取得されたボケ値を順次に一時的に保存する。
区間決定部220’は、1次処理部221と、2次処理部222と、3次処理部223と、前処理部250と、を備える。ここで、図14および図15を参照し、未処理フレームのボケ値および処理済みフレームのボケ値について説明する。
図14および図15は、未処理フレームのボケ値および処理済みフレームのボケ値を模式的に示した説明図である。図14に示したように、区間決定部220’は、動画中でバッファ242に一時的に保存されているフレームのボケ値を参照可能である。また、図15に示したように、バッファ242に一時的に保存されている一番新しいボケ値のフレーム番号を「0」、最も古い未処理フレーム番号を「−L」、最も古い処理済みフレーム番号を「−N」として本実施形態を説明する。
図16は、第2の実施形態における区間決定の流れを示したフローチャートである。図16に示したように、まず、バッファ242においてボケ値がバッファリングされた後(S5)、区間決定部220’の前処理部250が前処理を行い(S6)、1次処理部221〜3次処理部223が1次処理〜3次処理を行う(S7)。以下、図17を参照してバッファリング(S5)の詳細フローを説明し、図18および図19を参照して前処理(S6)の詳細フローを説明する。なお、1次処理〜3次処理(S7)は、第1の実施形態において説明した通りであるため、本実施形態における説明は省略する。
図17は、バッファリングの詳細フローを示したフローチャートである。まず、区間決定部220’は、バッファ242においてバッファ中の未処理フレームのボケ値がLフレーム分未満であるか否かを判断する(S5−1)。そして、バッファ中の未処理フレームのボケ値がLフレーム分以上である場合、区間決定部220’の前処理部250による前処理が行われる(S6)。
一方、バッファ中の未処理フレームのボケ値がLフレーム分未満である場合、バッファ中のフレームに終端のフレームが含まれていなければS5−1からの処理が繰り返される(S5−2)。また、バッファ中のフレームに終端のフレームが含まれている場合、終端のフレームのボケ値まで処理済みでなければ(S5−3)、区間決定部220’の前処理部250による前処理が行われる(S6)。一方、終端のフレームのボケ値まで処理済みである場合、区間決定処理が終了する。
図18は、前処理の詳細の詳細フローを示したフローチャートである。図18に示したように、バッファリングの後(S5)、前処理部250は、フレーム「L−1」が安定区間に属するか否かを判断する(S6−1)。ここで、フレーム「L−1」が安定区間に属する場合、フレーム「L−1」が属する安定区間をフレーム「L」まで広げる(S6−2)。そして、フレーム「L」まで広げられた区間のボケ値の分散が閾値Th1を下回る場合(S6−3)、前処理部250は、フレーム「L」まで広げられた区間を安定区間と再定義する(S6−4)。その後、バッファリング(S5)からの処理が繰り返される。一方、フレーム「L−1」が安定区間に属さない場合(S6−1)、および、フレーム「L」まで広げられた区間のボケ値の分散が閾値Th1以上である場合(S6−3)、バッファ中の参照可能なボケ値に対して1〜3次処理が行われる(S7)。ここで、図19を参照し、上記前処理を具体的に説明する。
図19は、前処理の具体例を示した説明図である。図19に示したように、未処理フレーム「−L」の直前が安定区間である場合、前処理部250は、上記安定区間にフレーム「−L」を加えるとボケ値の分散が閾値Th1以上になるか否かを判断する。そして、ボケ値の分散が閾値Th1以上にならない場合、図19の下段に示したように、安定区間をフレーム「−L」を含むように再定義する。一方、ボケ値の分散が閾値Th1以上になる場合、バッファ中の参照可能なボケ値に対して、第1の実施形態において説明した1〜3次処理が行われる。すなわち、バッファ中の参照可能なボケ値において、未処理フレームからの始点の選択および安定区間の延長(1次処理)、安定区間―不安定区間―安定区間の結合(2次処理)、境界の移動(3次処理)が行われる。
<4.まとめ>
以上説明したように、本発明の第1の実施形態によれば、動画を各フレームのボケ値に基づいて安定区間および不安定区間に区分し、各区分のボケ統計値を利用して失敗カットまたはお奨めカットを抽出することが可能である。さらに、本発明の第2の実施形態によれば、撮像を行いながら安定区間および不安定区間の決定を行うことが可能である。
以上、添付図面を参照しながら本発明の好適な実施形態について詳細に説明したが、本発明はかかる例に限定されない。本発明の属する技術の分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本発明の技術的範囲に属するものと了解される。
例えば、本明細書の画像抽出装置20の処理における各ステップは、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はない。例えば、画像抽出装置20の処理における各ステップは、並列的に実行される処理を含んでもよいし、個別に実行される処理を含んでもよい。
また、画像抽出装置20に内蔵されるCPU201、ROM202およびRAM203などのハードウェアを、上述した画像抽出装置20の各構成と同等の機能を発揮させるためのコンピュータプログラムも作成可能である。また、該コンピュータプログラムを記憶させた記憶媒体も提供される。また、図4の機能ブロック図で示したそれぞれの機能ブロックをハードウェアで構成することで、一連の処理をハードウェアで実現することもできる。
10 撮像装置
20、20’ 画像抽出装置
216 記憶部
218 ボケ値取得部
220、220’ 区間決定部
221 1次処理部
222 2次処理部
223 3次処理部
230 統計値取得部
234 抽出部
238 撮像部
242 バッファ
250 前処理部


Claims (13)

  1. 動画を構成する各フレームのボケの度合を示すボケ値を取得するボケ値取得部と;
    前記ボケ値取得部により取得された前記ボケ値の分散が第1の値より低い安定区間と、前記安定区間でない不安定区間とに前記動画を区分する区間決定部と;
    前記動画から、前記区間決定部により得られた前記安定区間または前記不安定区間に基づく区間抽出を行う抽出部と;
    を備える、動画抽出装置。
  2. 前記区間決定部は、動画中の異なるフレームを順次に始点として選択し、選択したフレームを含む区間を、前記ボケ値の分散が前記第1の値を上回るまで広げて安定区間を定義する1次処理部を有する、請求項1に記載の動画抽出装置。
  3. 前記1次処理部は、安定区間と定義されてなく、かつ、始点として選ばれていないフレームが無くなるまで、前記安定区間の定義を繰り返す、請求項2に記載の動画抽出装置。
  4. 前記区間決定部は、各不安定区間と、前記各不安定区間の前後に定義された安定区間とを含む区間のボケ値の分散が前記第1の値を下回っているか否かを判断し、前記区間のボケ値の分散が前記第1の値を下回っている場合、前記区間を安定区間と定義する2次処理部を有する、請求項2に記載の動画抽出装置。
  5. 前記区間決定部は、前記2次処理部により定義された安定区間を、前記ボケ値の分散が前記第1の値を上回るまで広げる3次処理部を有する、請求項4に記載の動画抽出装置。
  6. 前記抽出部は、前記安定区間または前記不安定区間のうちで、前記ボケ値の平均値が第2の値より小さい区間を抽出する、請求項5に記載の動画抽出装置。
  7. 前記抽出部は、前記ボケ値の平均値が第2の値より小さいことに加え、区間長さが第3の値より長い区間を抽出する、請求項6に記載の動画抽出装置。
  8. 前記抽出部は、前記安定区間または前記不安定区間のうちで、最大ボケ値が第4の値より高い区間、および、区間長さが第5の値より短い区間を抽出する、請求項1に記載の動画抽出装置。
  9. 前記抽出部は、さらに、最大ボケ値が前記第4の値より高い安定区間に隣接する不安定区間を抽出する、請求項8に記載の動画抽出装置。
  10. 前記動画抽出装置は、
    ボケ値取得部により取得された新たなフレームのボケ値を一時的に保存するバッファをさらに備え、
    前記区間決定部は、前記バッファに未処理フレームのボケ値が所定量以上保存された後に前記動画の区分を行う、請求項1に記載の動画抽出装置。
  11. 前記区間決定部は、未処理フレームの直前フレームが安定区間に属する場合、前記直前フレームが属する安定区間を、前記ボケ値の分散が前記第1の値を上回るまで未処理フレーム側へ広げる、請求項10に記載の動画抽出装置。
  12. コンピュータを、
    動画を構成する各フレームのボケの度合を示すボケ値を取得するボケ値取得部と;
    前記ボケ値取得部により取得された前記ボケ値の分散が第1の値より低い安定区間と、前記安定区間でない不安定区間とに前記動画を区分する区間決定部と;
    前記動画から、前記区間決定部により得られた前記安定区間または前記不安定区間に基づく区間抽出を行う抽出部と;
    として機能させるための、プログラム
  13. 動画を構成する各フレームのボケの度合を示すボケ値を取得するステップと;
    前記ボケ値の分散が第1の値より低い安定区間と、前記安定区間でない不安定区間とに前記動画を区分するステップと;
    前記動画から、前記安定区間または前記不安定区間に基づく区間抽出を行うステップと;
    を含む、動画抽出方法。

JP2009167909A 2009-07-16 2009-07-16 動画抽出装置、プログラム、および動画抽出方法 Withdrawn JP2011024017A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009167909A JP2011024017A (ja) 2009-07-16 2009-07-16 動画抽出装置、プログラム、および動画抽出方法
US12/796,749 US8437548B2 (en) 2009-07-16 2010-06-09 Moving image extracting apparatus, program and moving image extracting method
US13/860,222 US8792720B2 (en) 2009-07-16 2013-04-10 Moving image extracting apparatus, program and moving image extracting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009167909A JP2011024017A (ja) 2009-07-16 2009-07-16 動画抽出装置、プログラム、および動画抽出方法

Publications (1)

Publication Number Publication Date
JP2011024017A true JP2011024017A (ja) 2011-02-03

Family

ID=43465350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009167909A Withdrawn JP2011024017A (ja) 2009-07-16 2009-07-16 動画抽出装置、プログラム、および動画抽出方法

Country Status (2)

Country Link
US (2) US8437548B2 (ja)
JP (1) JP2011024017A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3144883A1 (en) * 2015-09-16 2017-03-22 Thomson Licensing Method and apparatus for sharpening a video image using an indication of blurring
JP6849430B2 (ja) * 2016-12-27 2021-03-24 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US10819983B1 (en) * 2019-10-01 2020-10-27 Facebook, Inc. Determining a blurriness score for screen capture videos

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6493042B1 (en) * 1999-03-18 2002-12-10 Xerox Corporation Feature based hierarchical video segmentation
US8111754B1 (en) * 2001-07-11 2012-02-07 Dolby Laboratories Licensing Corporation Interpolation of video compression frames
US7266150B2 (en) * 2001-07-11 2007-09-04 Dolby Laboratories, Inc. Interpolation of video compression frames
US6930718B2 (en) * 2001-07-17 2005-08-16 Eastman Kodak Company Revised recapture camera and method
JP2004180290A (ja) 2002-11-15 2004-06-24 Sony Corp 伝送装置と伝送方法と再生装置と再生方法およびプログラムと記録媒体
US7483618B1 (en) * 2003-12-04 2009-01-27 Yesvideo, Inc. Automatic editing of a visual recording to eliminate content of unacceptably low quality and/or very little or no interest
US7929801B2 (en) * 2005-08-15 2011-04-19 Sony Corporation Depth information for auto focus using two pictures and two-dimensional Gaussian scale space theory
JP2009015749A (ja) * 2007-07-09 2009-01-22 Seiko Epson Corp 画像表示装置、画像表示方法、およびプログラム
US20110255844A1 (en) * 2007-10-29 2011-10-20 France Telecom System and method for parsing a video sequence
EP2286592B1 (en) * 2008-06-02 2013-05-22 Koninklijke Philips Electronics N.V. Signal processing device and method for tuning an audiovisual system to a viewer attention level.

Also Published As

Publication number Publication date
US8792720B2 (en) 2014-07-29
US20130223742A1 (en) 2013-08-29
US20110013838A1 (en) 2011-01-20
US8437548B2 (en) 2013-05-07

Similar Documents

Publication Publication Date Title
US10452713B2 (en) Video analysis techniques for improved editing, navigation, and summarization
JP4774816B2 (ja) 画像処理装置,画像処理方法,およびコンピュータプログラム。
CN101651779B (zh) 信息处理设备、方法
US9626076B2 (en) Display apparatus for displaying images and method thereof
JP2011030159A (ja) 画像編集装置、画像編集方法及びプログラム
JP6429588B2 (ja) 画像処理装置及び画像処理方法
US20130300750A1 (en) Method, apparatus and computer program product for generating animated images
US20120082431A1 (en) Method, apparatus and computer program product for summarizing multimedia content
CN106572381A (zh) 一种图片缩略图的处理方法和智能电视
US8958655B2 (en) Image processor, image processing method, and computer readable medium
JP2011028689A (ja) 動画抽出装置、プログラム、および動画抽出方法
CN105323527A (zh) 用于时移视频的曝光计量的系统和方法
JP2011024017A (ja) 動画抽出装置、プログラム、および動画抽出方法
US9224069B2 (en) Program, method and apparatus for accumulating images that have associated text information
JP2015022351A (ja) 画像処理プログラム及び画像処理装置
KR20180027917A (ko) 디스플레이장치 및 그 제어방법
JP2012044358A (ja) 画像処理装置および画像処理プログラム
JP2011257980A (ja) 画像表示装置、画像表示方法、およびプログラム
KR101828601B1 (ko) 비디오 컨텐츠 자동 편집 시스템 및 자동 편집 방법
JP6094613B2 (ja) 投影制御装置、表示制御装置、および表示制御方法
JP2008020944A (ja) 画像処理方法、プログラムおよび装置
KR101544008B1 (ko) 모바일 기기의 그리드 출력 제어 장치 및 이를 이용한 그리드의 출력 제어 방법
JP2015215372A (ja) 焦点調節装置、焦点調節装置の制御方法、焦点調節装置の制御プログラム及び記憶媒体
CN116894768B (zh) 一种基于人工智能的目标检测优化方法和系统
JP2012119798A (ja) 画像生成方法、画像生成装置及びプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20121002