JP5026152B2 - ディゾルブ検出装置及びプログラム - Google Patents
ディゾルブ検出装置及びプログラム Download PDFInfo
- Publication number
- JP5026152B2 JP5026152B2 JP2007148388A JP2007148388A JP5026152B2 JP 5026152 B2 JP5026152 B2 JP 5026152B2 JP 2007148388 A JP2007148388 A JP 2007148388A JP 2007148388 A JP2007148388 A JP 2007148388A JP 5026152 B2 JP5026152 B2 JP 5026152B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- dissolve
- frames
- dissolve section
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 38
- 230000033001 locomotion Effects 0.000 claims description 70
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 description 40
- 238000003860 storage Methods 0.000 description 16
- 239000002131 composite material Substances 0.000 description 13
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Studio Circuits (AREA)
Description
特許文献1には、フレームのエッジ強度を用いて算出される特徴量に基づいてディゾルブ区間の検出を行う技術が開示されている。
特許文献3には、連結映像から複数フレームにわたって変化傾向が一定している領域(緩変化領域)を抽出し、緩変化領域の画面に占める割合がしきい値よりも大きいフレームをディゾルブ区間内のフレームであると判定することによりディゾルブ区間の検出を行う技術が開示されている。映像内の被写体が動く場合、緩変化領域として抽出できるとは限らない。
特許文献5には、ディゾルブ区間を一旦検出した後、動きシーンやパニングシーンの特徴を有する場合にディゾルブ区間でないと判定する技術が開示されている。この技術は、ディゾルブを検出した後に、防止するものであり、未検出を防止できるものではない。
非特許文献2には、フレーム空間における映像シーケンスの3次元表現が、ディゾルブ区間では直線になるというディゾルブの特徴を利用してディゾルブ区間の検出を行う技術が開示されている。
非特許文献3には、ディゾルブ区間中では輝度が単調増減するというディゾルブの特徴を用いてディゾルブ区間の検出を行う技術が開示されている。
これによれば、動きを考慮した上で予測フレームを生成することができるので、映像内の被写体に動きがあるディゾルブ区間を、ディゾルブパターンの学習による方法を用いずとも、高い精度で検出可能となる。
これによれば、N番目のフレームの前に続く1又は複数のフレーム及びN+M番目のフレームの後に続く1又は複数のフレームに基づいて、ブロックの動きを判定することができる。
これによれば、ディゾルブ区間長が不明な場合であっても、適切にディゾルブ区間を検出できる。
これによれば、効率的にディゾルブ区間の判定を行うことができる。
図1は、本発明の実施の形態にかかるディゾルブ区間検出装置1のシステム構成を示す図である。同図に示すように、ディゾルブ区間検出装置1は、映像入力受付部2、映像記憶部3、隣接フレーム間差分算出部4、ディゾルブ区間候補取得部5、ディゾルブ区間判定部6を含んで構成される。このディゾルブ区間検出装置1は、入力される映像からショット境界を検出するために用いられるものである。
映像記憶部3は、映像入力受付部2から入力された映像を記憶する。図2には、映像記憶部3の記憶内容の例を示している。同図に示すように、映像記憶部3は、映像を構成する一連のフレームを順序付けて記憶するものである。なお、全フレームを描くことはできないので、同図の例では、N−1番目(N≧2)、N番目、N+1番目、N+M−1番目(M≧2)、N+M番目、N+M+1番目の各フレームのみを示している。
ディゾルブ区間候補取得部5は、以上のようにして取得した各ディゾルブ区間候補を、取得した順に、順次ディゾルブ区間判定部6に出力する。
第1動き判定部60は、判定した動きを動きベクトルによって表し、第1予測フレーム群生成部61に出力する。
第2動き判定部62は、判定した動きを動きベクトルによって表し、第2予測フレーム群生成部63に出力する。
より具体的には、第2予測フレーム群生成部63は、以下の式(7)を用いて、順次各第2予測フレームの各画素の画素値を決定していく。
具体的には、類似度算出部65は、以下の式(10)又は式(11)を用いて、上記類似度を算出する。ここで、sim(fi’,fi)は、フレームi(fi)と合成フレームi(fi’)の類似度であり、pfX(r)は、フレームXの座標rにある画素の画素値である。
判定部66は、類似度算出部65により算出された類似度に基づき、ディゾルブ区間候補がディゾルブ区間であるか否かを判定する(判定手段)。具体的には、各フレームの類似度の平均値が所定値以上である場合に、ディゾルブ区間候補がディゾルブ区間であると判定する。なお、各フレームの類似度の平均値Diss(N+1,N+M−1)は、式(12)によって算出することが好適である。
図6は、ディゾルブ区間検出装置1が行うディゾルブ区間判定処理の処理フローを示すフロー図である。同図に示すように、隣接フレーム間差分算出部4は、映像記憶部3から順次フレームを取得し(ステップS1)、隣接フレーム間差分を算出する(ステップS2)。そして、算出した隣接フレーム間差分が所定閾値を上回っているか否かを判定し(ステップS3)、肯定的な判定結果が得られた場合に、処理をステップS4に進める。なおここでは、N番目のフレームにおいて隣接フレーム間差分が所定閾値を上回ったとする。
また、フレームNの前に続く1又は複数のフレーム及びフレームN+Mの後に続く1又は複数のフレームに基づいて、ブロックの動きを判定することができる。
また、隣接フレーム間差分が所定閾値を上回った場合にのみディゾルブ区間候補を取得するようにしているので、効率的にディゾルブ区間の判定を行うことができる。
ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、この「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに、「コンピュータ読み取り可能な記録媒体」には、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
さらに、上記プログラムは、上述した各機能の一部を実現するためのものであってもよい。さらに、上述した各機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
2 映像入力受付部、
3 映像記憶部、
4 隣接フレーム間差分算出部、
5 ディゾルブ区間候補取得部、
6 ディゾルブ区間判定部、
60 第1動き判定部、
61 第1予測フレーム群生成部、
62 第2動き判定部、
63 第2予測フレーム群生成部、
64 合成フレーム群生成部、
65 類似度算出部、
66 判定部、
O1,O2 被写体。
Claims (5)
- 映像を構成する一連のフレームのうち、N番目(N≧2)からN+M番目(M≧2)のフレーム区間をディゾルブ区間候補として取得するディゾルブ区間候補取得手段と、
前記ディゾルブ区間候補がディゾルブ区間であるか否かを判定するディゾルブ区間判定手段と、
を含み、
前記ディゾルブ区間判定手段は、
N−K番目(K≧1)からN番目までの各フレームに基づいて、N+1番目からN+M−1番目までの各第1予測フレームを生成する第1予測フレーム群生成手段と、
N+M番目からN+M+L番目(L≧1)までの各フレームに基づいて、N+1番目からN+M−1番目までの各第2予測フレームを生成する第2予測フレーム群生成手段と、
前記各第1予測フレームそれぞれと、対応する前記第2予測フレームと、を合成することによりN+1番目からN+M−1番目までの各合成フレームを生成する合成フレーム群生成手段と、
前記合成フレーム群生成手段により生成された前記各合成フレームそれぞれと、対応する前記ディゾルブ区間候補内の各フレームと、の類似度を算出する類似度算出手段と、
前記類似度算出手段により算出された類似度に基づき、前記ディゾルブ区間候補がディゾルブ区間であるか否かを判定する判定手段と、
を含む、
ことを特徴とするディゾルブ区間検出装置。 - 請求項1に記載のディゾルブ区間検出装置において、
N−K番目(K≧1)からN番目までの各フレームに基づいて、N番目のフレームを構成する複数ブロックそれぞれの動きを判定する第1動き判定手段と、
N+M番目からN+M+L番目(L≧1)までの各フレームに基づいて、N+M番目のフレームを構成する複数ブロックそれぞれの動きを判定する第2動き判定手段と、
を含み、
前記第1予測フレーム群生成手段は、前記第1動き判定手段の判定結果に基づいて前記各第1予測フレームを生成し、
前記第2予測フレーム群生成手段は、前記第2動き判定手段の判定結果に基づいて前記各第2予測フレームを生成する、
ことを特徴とするディゾルブ区間検出装置。 - 請求項1又は2に記載のディゾルブ区間検出装置において、
前記ディゾルブ区間候補取得手段は、前記Mの複数の値について前記ディゾルブ区間候補の取得を行う、
ことを特徴とするディゾルブ区間検出装置。 - 請求項1から3までのいずれか1項に記載のディゾルブ区間検出装置において、
前記一連のフレームについて、順次隣接フレーム間差分を算出する隣接フレーム間差分算出手段、
を含み、
前記ディゾルブ区間候補取得手段は、I番目のフレームとI+1番目のフレームとの間の前記隣接フレーム間差分が所定の閾値以上である場合に、前記Iを前記Nとして前記ディゾルブ区間候補の取得を行う、
を含むことを特徴とするディゾルブ区間検出装置。 - 映像を構成する一連のフレームのうち、N番目(N≧2)からN+M番目(M≧2)のフレーム区間をディゾルブ区間候補として取得するディゾルブ区間候補取得手段、及び
前記ディゾルブ区間候補がディゾルブ区間であるか否かを判定するディゾルブ区間判定手段、
としてコンピュータを機能させるためのプログラムであって、
前記ディゾルブ区間判定手段は、
N−K番目(K≧1)からN番目までの各フレームに基づいて、N+1番目からN+M−1番目までの各第1予測フレームを生成する第1予測フレーム群生成手段と、
N+M番目からN+M+L番目(L≧1)までの各フレームに基づいて、N+1番目からN+M−1番目までの各第2予測フレームを生成する第2予測フレーム群生成手段と、
前記各第1予測フレームそれぞれと、対応する前記第2予測フレームと、を合成することによりN+1番目からN+M−1番目までの各合成フレームを生成する合成フレーム群生成手段と、
前記合成フレーム群生成手段により生成された前記各合成フレームそれぞれと、対応する前記ディゾルブ区間候補内の各フレームと、の類似度を算出する類似度算出手段と、
前記類似度算出手段により算出された類似度に基づき、前記ディゾルブ区間候補がディゾルブ区間であるか否かを判定する判定手段と、
を含む、
ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007148388A JP5026152B2 (ja) | 2007-06-04 | 2007-06-04 | ディゾルブ検出装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007148388A JP5026152B2 (ja) | 2007-06-04 | 2007-06-04 | ディゾルブ検出装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008301425A JP2008301425A (ja) | 2008-12-11 |
JP5026152B2 true JP5026152B2 (ja) | 2012-09-12 |
Family
ID=40174464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007148388A Active JP5026152B2 (ja) | 2007-06-04 | 2007-06-04 | ディゾルブ検出装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5026152B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6087747B2 (ja) * | 2013-06-27 | 2017-03-01 | Kddi株式会社 | 映像符号化装置、映像復号装置、映像システム、映像符号化方法、映像復号方法、およびプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010087552A (ko) * | 2000-03-07 | 2001-09-21 | 구자홍 | 엠펙(mpeg)압축 비디오 환경에서 매크로 블록의시공간상의 분포를 이용한 디졸브/페이드 검출 방법 |
JP4225503B2 (ja) * | 2005-02-17 | 2009-02-18 | Kddi株式会社 | 動画像のカット点検出装置 |
-
2007
- 2007-06-04 JP JP2007148388A patent/JP5026152B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008301425A (ja) | 2008-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230077355A1 (en) | Tracker assisted image capture | |
US9852511B2 (en) | Systems and methods for tracking and detecting a target object | |
US9179071B2 (en) | Electronic device and image selection method thereof | |
KR100860988B1 (ko) | 시퀀스들에서의 객체 탐지를 위한 방법 및 장치 | |
JP4698754B2 (ja) | シーンチェンジ検出方法および装置 | |
KR100985805B1 (ko) | 적응적인 칼만필터를 이용한 영상 안정화 장치 및 방법 | |
Yaakob et al. | A comparison of different block matching algorithms for motion estimation | |
WO2016036591A1 (en) | A method for selecting frames from video sequences based on incremental improvement | |
US8526500B2 (en) | System and method for global inter-frame motion detection in video sequences | |
KR20110086826A (ko) | 모션 벡터들을 결정하기 위한 방법, 장치 및 소프트웨어 | |
JP4496992B2 (ja) | 動物体アップフレーム検出方法及びプログラム及びプログラムを格納した記憶媒体及び動物体アップショット検出方法及び動物体アップフレームあるいはショット検出方法及びプログラム及びプログラムを格納した記憶媒体 | |
JP7027776B2 (ja) | 移動ベクトル算出方法、装置、プログラム、及びノイズ除去処理を含む移動ベクトル算出方法 | |
CN113269086A (zh) | 一种vlog剪辑方法和剪辑系统 | |
JP2014110020A (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP5788299B2 (ja) | 画像検索装置、画像検索方法およびプログラム | |
JP5026152B2 (ja) | ディゾルブ検出装置及びプログラム | |
JP2006215655A (ja) | 動きベクトル検出方法、動きベクトル検出装置、動きベクトル検出プログラム及びプログラム記録媒体 | |
JP4997179B2 (ja) | 画像処理装置、方法およびプログラム | |
KR101544156B1 (ko) | 동영상 리타겟팅 방법 및 이러한 기능이 탑재된 동영상 장치 | |
JP2000132692A (ja) | 曲線の特徴点抽出方法及びこの方法を記録した記録媒体 | |
KR101534776B1 (ko) | 깊이 정보를 이용한 템플릿 매칭 기반 고속 얼굴 추적 방법 | |
US20230196752A1 (en) | Information processing apparatus, information processing method, and non-transitory computer-readable storage medium | |
KR102089433B1 (ko) | 영상 부호화 장치의 다방향 계층적 움직임 추정방법 | |
Hu et al. | Temporal error concealment using quad-tree prediction and coherency sensitive hashing for HEVC | |
JP2008292179A (ja) | 信号検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120522 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120620 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150629 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5026152 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |