JP6557592B2 - 映像シーン分割装置及び映像シーン分割プログラム - Google Patents
映像シーン分割装置及び映像シーン分割プログラム Download PDFInfo
- Publication number
- JP6557592B2 JP6557592B2 JP2015244026A JP2015244026A JP6557592B2 JP 6557592 B2 JP6557592 B2 JP 6557592B2 JP 2015244026 A JP2015244026 A JP 2015244026A JP 2015244026 A JP2015244026 A JP 2015244026A JP 6557592 B2 JP6557592 B2 JP 6557592B2
- Authority
- JP
- Japan
- Prior art keywords
- scene
- video
- histogram
- shot
- boundary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 9
- 238000003860 storage Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、映像検索において検索結果を提示する場合、コンテンツの内容を構造的に示したり、必要な映像を意味的な単位で再生したりする機能が望まれている。
このように、意味的な映像内容の境界であるシーン境界を自動的に検出することは難しかった。
図1は、本実施形態に係る映像シーン分割装置1の機能構成を示すブロック図である。
具体的には、ショット境界検出部11は、1フレーム毎に、直前のフレームとの間で画像データの差分を求める。そして、この差分値が第1閾値を超えた場合に、ショット境界検出部11は、この第1閾値を超えた前後のフレームの間を、ショット境界として検出する。なお、画像データの差分は、画像データに含まれる画素値の変化量の合計又は平均、あるいは輝度ヒストグラムの変化量等、フレーム間での画像の変化の度合いを評価する値として適宜設定される。
具体的には、静止画像抽出部12は、画像データの差分の累積が第2閾値を超える度に、この第2閾値を超えたフレームを、静止画像として抽出する。
ショット境界検出部11は、映像コンテンツを構成する時間的に連続するフレームを順に比較し、画像データの差分を算出する。
なお、静止画像抽出部12は、一定時間間隔(例えば、10フレーム毎、1秒毎等)で静止画像を抽出してもよい。
具体的には、被写体認識部13は、予め想定されている特定の複数の被写体を学習しておき、これらの被写体が静止画像に含まれているか否かを判定する。
このとき、映像コンテンツに登場する広範囲な被写体を認識できるように多数の被写体が学習されることが望ましいが、認識可能な被写体が限定される場合には、番組内での登場頻度が高いと想定される被写体が選択される。
あるいは、被写体認識部13は、静止画像に含まれる所定の特徴量に基づくクラスタリングにより、複数の被写体それぞれを特定することなく、仮のラベル(Aクラスタ、Bクラスタ、・・・)によって識別してもよい。
このとき、ヒストグラム生成部14は、例えば次の(1)又は(2)のように正規化した度数の分布として、ショットの期間内に各被写体が出現した信頼度を表現する。これにより、ショット毎のヒストグラムにおける度数の最大は一定値に揃えられる。
(2)ヒストグラム生成部14は、被写体が認識された静止画像に対応するショットの期間内の時間を正規化した度数の分布を、ヒストグラムとして生成する。
具体的には、シーン境界判定部15は、シーンに出現する被写体の連続性を判定するために、ショット単位に生成したヒストグラム間の類似度を求め、例えば類似度が一定以下の場合に連続性が途切れ場面が切り替わったと判定する。
なお、ヒストグラム間の類似度の判定には、ヒストグラムインターセクション等の手法が利用されてよい。また、例えば、上位一定数の被写体が同時に変化した、又は一定の割合以上が変化した点を場面の分割点と判定する等、簡易的な手法が利用されてもよい。
映像シーン分割装置1は、入力された映像をショット1〜4に分割すると、それぞれのショットから複数の静止画像(サムネイル)を抽出する。
映像シーン分割装置1は、生成されたヒストグラムについて、時系列に前後の類似度を算出し、類似度が閾値に満たないショット3とショット4との境界を、シーン境界として判定する。
そこで、シーン境界判定部15は、ヒストグラムにおける度数が上位所定数の被写体のみからなる部分ヒストグラムに基づいて、シーン境界を判定する。例えば、ヒストグラムに現れている上位所定数(例えば3)の被写体、又は一定の割合(例えば50%)に注目して類似度を計算する方法が採用される。
ステップS1において、ショット境界検出部11は、映像コンテンツに含まれる一連のフレームから、ショット境界を検出し、映像を複数のショットに分割する。
前述の統計に基づいたヒストグラムの類似度による連続性の判断基準は、映像コンテンツ制作・編集のセオリーに基づいて、例えば、以下の(A)又は(B)の判断基準が用いられてもよい。あるいは、前述の手法により判定されたシーン境界がこれらの判断基準によって調整されてもよい。
シーンは、人手により作られた構造であるが、番組映像の編集には、一定のセオリーもあり、番組映像に関する知識を利用することで、シーン検出の誤りが低減される。
ヒストグラム生成部14及びシーン境界判定部15は、番組ジャンルに基づいて、被写体に対する重みづけを調整してもよい。
例えば、ドラマ等、人物が被写体の中心となり、個人が重要な被写体である場合と、紀行系番組等、特定個人よりも、人物と他の被写体との変化がシーンを分割する要因となる場合とでは、人物と自然物との重みを変化させ、連続性の判断基準を別に設ける。
ドラマの場合(a)、人物A及びBが登場するショットと、人物C及びDが登場するショットとの境界がシーン境界として判定されている。
また、人物C及びDが同一グループの場合、人物C及びDが登場するショットと、人物Dのみが登場するショットとは、被写体が同一グループであるため、同一のシーンとして判定されている。
また、人物E、F又はGが登場する複数のショットは、被写体が同一グループであると判断され、同一のシーンとして判定されている。
シーン境界判定部15は、シーンにおける被写体の時間軸及び位置に関して予め記憶された出現パターンに基づいて、シーン境界の判定結果を調整してもよい。
例えば、人の顔が交互に映されるようなドラマ等の番組では、個人の顔に注目した場合、シーンが細切れになってしまう場合がある。そこで、一般的な編集技法である、2人の人物を交互に映すモンタージュ技法と呼ばれる対話シーンの知識を組み込むことで、顔が交互に被写体となるショットの連続は、1つの対話シーンとして適切に判定される。これにより、シーンの過分割が抑制される。
ヒストグラムの類似度に基づく統計的な手法のみの場合(a)、人物Aが登場するショットと、人物Bが登場するショットとがシーン境界として判定され、複数のシーン1〜4に細かく分割されている。
したがって、映像シーン分割装置1は、映像の内容を表す被写体の認識結果を用い、より意味内容に近い形で、映像コンテンツを意味的な区間の切れ目であるシーンに適切に分割できる。
この結果、映像の検索又は再利用時に、人の感覚により近い意味的な単位であるシーンの単位で表示及び再生が可能になる。また、映像検索の結果をコンテンツ単位で提示する場合、意味区間であるシーン毎に整理して提示することで、コンテンツ全体の概要が把握しやすくなるので、映像検索又はメタデータの付与等の2次利用が容易になる。
したがって、映像シーン分割装置1は、簡易なルールに基づいて効率的に映像をショットに分割し、ショットそれぞれの内容を特徴づける静止画像を抽出できる。
これらの正規化の手法により、映像シーン分割装置1は、ショットの期間内に各被写体が出現した信頼度を表現する。これにより、ショット毎のヒストグラムにおける度数の最大は一定値に揃えられ、ショット間でのヒストグラムの比較がより正確に行える。
10 制御部
11 ショット境界検出部
12 静止画像抽出部
13 被写体認識部
14 ヒストグラム生成部
15 シーン境界判定部
20 記憶部
Claims (7)
- 映像のフレーム間の画像データの差分に基づいて、当該映像の不連続点であるショット境界を検出するショット境界検出部と、
前記ショット境界により分割されたショット毎に複数の静止画像を抽出する静止画像抽出部と、
前記静止画像毎の被写体を認識する被写体認識部と、
前記ショットそれぞれについて、前記被写体の出現頻度を示すヒストグラムを生成するヒストグラム生成部と、
前記ヒストグラムの類似度に基づいて、当該ヒストグラムの不連続点であるシーン境界を判定するシーン境界判定部と、を備える映像シーン分割装置。 - 前記被写体認識部は、前記静止画像に含まれる所定の特徴量に基づくクラスタリングにより、複数の前記被写体を識別する請求項1に記載の映像シーン分割装置。
- 前記ヒストグラム生成部は、前記ショットの期間において前記被写体が認識された前記静止画像の数を正規化した度数、又は前記被写体が認識された前記静止画像に対応する前記ショットの期間内の時間を正規化した度数の分布を、前記ヒストグラムとして生成する請求項1又は請求項2に記載の映像シーン分割装置。
- 前記ヒストグラム生成部は、前記被写体のグループに対して前記ヒストグラムを生成する請求項1から請求項3のいずれかに記載の映像シーン分割装置。
- 前記シーン境界判定部は、前記ヒストグラムにおける度数が上位所定数の前記被写体のみからなる部分ヒストグラムに基づいて、前記シーン境界を判定する請求項1から請求項4のいずれかに記載の映像シーン分割装置。
- 前記シーン境界判定部は、シーンにおける前記被写体の時間軸及び位置に関して予め記憶された出現パターンに基づいて、前記シーン境界の判定結果を調整する請求項1から請求項5のいずれかに記載の映像シーン分割装置。
- コンピュータを、請求項1から請求項6のいずれかに記載の映像シーン分割装置として機能させるための映像シーン分割プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015244026A JP6557592B2 (ja) | 2015-12-15 | 2015-12-15 | 映像シーン分割装置及び映像シーン分割プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015244026A JP6557592B2 (ja) | 2015-12-15 | 2015-12-15 | 映像シーン分割装置及び映像シーン分割プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017112448A JP2017112448A (ja) | 2017-06-22 |
JP6557592B2 true JP6557592B2 (ja) | 2019-08-07 |
Family
ID=59081023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015244026A Active JP6557592B2 (ja) | 2015-12-15 | 2015-12-15 | 映像シーン分割装置及び映像シーン分割プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6557592B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210019553A1 (en) * | 2018-03-30 | 2021-01-21 | Nec Corporation | Information processing apparatus, control method, and program |
CN110879952B (zh) * | 2018-09-06 | 2023-06-16 | 阿里巴巴集团控股有限公司 | 一种视频帧序列的处理方法及装置 |
CN109657096B (zh) * | 2019-01-11 | 2021-06-08 | 杭州师范大学 | 一种基于低学龄教学音视频的辅助统计报告生成方法 |
JP2021132281A (ja) * | 2020-02-19 | 2021-09-09 | Jcc株式会社 | メタデータ生成システムおよびメタデータ生成方法 |
CN111541912B (zh) * | 2020-04-30 | 2022-04-22 | 北京奇艺世纪科技有限公司 | 一种视频拆分方法、装置、电子设备及存储介质 |
CN111757170B (zh) * | 2020-07-01 | 2022-09-23 | 三星电子(中国)研发中心 | 一种视频分段和标记的方法及装置 |
CN115022711B (zh) * | 2022-04-28 | 2024-05-31 | 之江实验室 | 一种电影场景内镜头视频排序系统及方法 |
KR102633528B1 (ko) * | 2022-10-27 | 2024-02-05 | 주식회사 일만백만 | 영상 데이터를 기초로 장면 데이터 생성 방법 및 이를 실행하는 장치 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040006065A (ko) * | 2002-07-09 | 2004-01-24 | 삼성전자주식회사 | 장면전환검출장치 및 그 방법 |
JP2007134986A (ja) * | 2005-11-10 | 2007-05-31 | Kddi Corp | ショット境界検出装置 |
JP4720705B2 (ja) * | 2006-09-27 | 2011-07-13 | ソニー株式会社 | プログラム、検出方法、及び検出装置 |
JP2010251913A (ja) * | 2009-04-13 | 2010-11-04 | Panasonic Corp | コンテンツ再生装置、プログラムおよび半導体集積回路 |
JP5360979B2 (ja) * | 2009-06-25 | 2013-12-04 | Kddi株式会社 | 重要情報抽出方法および装置 |
KR101878182B1 (ko) * | 2011-12-02 | 2018-07-16 | 엘지디스플레이 주식회사 | 장면전환검출장치 및 장면전환검출방법 |
JP6034702B2 (ja) * | 2013-01-15 | 2016-11-30 | 日本放送協会 | 画像処理装置及び画像処理プログラム |
JP6254771B2 (ja) * | 2013-05-16 | 2017-12-27 | 日本放送協会 | 画像処理装置及び画像処理プログラム |
-
2015
- 2015-12-15 JP JP2015244026A patent/JP6557592B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017112448A (ja) | 2017-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6557592B2 (ja) | 映像シーン分割装置及び映像シーン分割プログラム | |
US11113587B2 (en) | System and method for appearance search | |
US10452919B2 (en) | Detecting segments of a video program through image comparisons | |
US8195038B2 (en) | Brief and high-interest video summary generation | |
US8358837B2 (en) | Apparatus and methods for detecting adult videos | |
US8750681B2 (en) | Electronic apparatus, content recommendation method, and program therefor | |
US8270806B2 (en) | Information processing apparatus and method of controlling same | |
US20090290791A1 (en) | Automatic tracking of people and bodies in video | |
Truong et al. | Scene extraction in motion pictures | |
US20220021942A1 (en) | Systems and methods for displaying subjects of a video portion of content | |
JP5096259B2 (ja) | 要約コンテンツ生成装置および要約コンテンツ生成プログラム | |
JP2019003585A (ja) | 要約映像生成装置およびそのプログラム | |
KR102277929B1 (ko) | 얼굴 인식에 기반한 실시간 얼굴 마스킹 시스템 및 이를 이용한 실시간 얼굴 마스킹 방법 | |
JPWO2010084738A1 (ja) | 照合加重情報抽出装置 | |
Zwicklbauer et al. | Video analysis for interactive story creation: the sandmännchen showcase | |
JP2014229092A (ja) | 画像処理装置、画像処理方法、および、そのプログラム | |
KR102179591B1 (ko) | 동영상 내 인물 영역 추출 장치 | |
US9135509B2 (en) | Determining representative images for a video | |
KR102179590B1 (ko) | 동영상 내 등장인물 갈등정보 추출 장치 | |
Zhang et al. | You Talkin'to Me? Recognizing Complex Human Interactions in Unconstrained Videos | |
JP2013093667A (ja) | 写真画像毎の再生時間を最適化する画像再生装置、プログラム及び方法 | |
CN112019923B (zh) | 视频剪切处理方法 | |
US20150139541A1 (en) | Apparatus and method for detecting harmful videos | |
KR20210136564A (ko) | 스포츠 경기 요약 영상 생성 장치 및 스포츠 경기 요약 영상 생성 방법 | |
KR20210061641A (ko) | 스포츠 경기 정보 검출 장치 및 스포츠 경기 정보 검출 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190613 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190618 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190712 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6557592 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |