JP6846216B2 - シーン変化点モデル学習装置、シーン変化点検出装置およびそれらのプログラム - Google Patents
シーン変化点モデル学習装置、シーン変化点検出装置およびそれらのプログラム Download PDFInfo
- Publication number
- JP6846216B2 JP6846216B2 JP2017010651A JP2017010651A JP6846216B2 JP 6846216 B2 JP6846216 B2 JP 6846216B2 JP 2017010651 A JP2017010651 A JP 2017010651A JP 2017010651 A JP2017010651 A JP 2017010651A JP 6846216 B2 JP6846216 B2 JP 6846216B2
- Authority
- JP
- Japan
- Prior art keywords
- change point
- scene change
- model
- scene
- image analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
このような映像コンテンツからシーン変化点を自動検出する手法としては、カメラの切り替わり点をシーン変化点として検出する手法が一般的である。
この従来手法は、放送番組の字幕テキストを利用し、同一番組内の各放送回にわたって繰り返し出現する反復句(キーフレーズ)の統計量に基づいて定義したスコアにより順位付けするとともに、この反復句の出現頻度の時間軸上における分布に関する絞り込み(スクリーニング)を行う。
そして、この従来手法は、順序付けの上位で、かつ、絞り込みを通過した反復句の出現時点をシーン変化点としていた。
これによって、シーン変化点モデル学習装置は、任意の映像コンテンツからシーン変化点を検出するためのシーン変化点モデルを学習することができる。
なお、シーン変化点モデル学習装置は、コンピュータを、前記した各手段として機能させるためのシーン変化点モデル学習プログラムで動作させることができる。
そして、シーン変化点検出装置は、画像解析手段によって、変化点未知映像を時系列で入力し、画像解析モデルを用いて、フレームごとに畳み込みニューラルネットワークにおける複数の層の出力を画像特徴量として抽出する。
そして、シーン変化点検出装置は、変化点検出手段によって、シーン変化点モデルを用いて、画像解析手段で抽出したフレームごとの画像特徴量からシーン変化点を検出する。
そして、シーン変化点検出装置は、画像解析手段によって、シーン変化点モデルの学習段階においては変化点既知映像を、シーン変化点の検出段階においては変化点未知映像をそれぞれ時系列で入力し、画像解析モデルを用いて、フレームごとに畳み込みニューラルネットワークにおける複数の層の出力を画像特徴量として抽出する。
また、シーン変化点検出装置は、検出段階において、変化点検出手段が、学習済みのシーン変化点モデルを用いて、画像解析手段で抽出したフレームごとの画像特徴量からシーン変化点を検出する。
なお、シーン変化点検出装置は、コンピュータを、前記した各手段として機能させるためのシーン変化点検出プログラムで動作させることができる。
本発明によれば、映像コンテンツのシーンの切り替わりに有効な映像の特徴から、シーン変化点モデルを学習し構築することができる。
これによって、本発明は、言語的情報源を利用することなく、言語的特徴とシーン変化点との間に普遍的な関係が自明でない映像コンテンツからでも、シーン変化点モデルを用いて、映像の特徴からシーン変化点を検出することが可能になる。
[シーン変化点検出装置の構成]
まず、図1を参照して、本発明の実施形態に係るシーン変化点検出装置1の構成について説明する。
シーン変化点検出装置1は、画像解析モデル記憶手段10と、画像解析手段11と、変化点検出手段12と、モデル更新手段13と、シーン変化点モデル記憶手段14と、を備える。このシーン変化点検出装置1は、予めシーンの切り替わりとなる変化点の時間情報(以下、「シーン変化点」と呼ぶ)が既知の映像コンテンツ(変化点既知映像)からシーン変化点の特徴を学習し、シーン変化点が未知の映像コンテンツ(変化点未知映像)からシーン変化点を検出するものである。ここで、シーンとは、同一の場面あるいは話題についての連続した映像区間である。
画像解析モデル記憶手段10に記憶するニューラルネットワークは、畳み込みニューラルネットワーク(Convolutional Neural Network:以下、CNNと呼ぶ)を用いることができる。
図1に戻って、シーン変化点検出装置1の構成について説明を続ける。
なお、CNN画像認識手段11aは、モデル学習時においては、映像コンテンツとして変化点既知データを入力し、変化点検出時においては、シーン変化点が未知の映像コンテンツ(新規映像コンテンツ〔変化点未知映像〕)を入力する。
これによって、画像解析手段11は、映像コンテンツ内に存在する対象を認識する際の画像特徴量をフレームの時刻ごとに抽出する。
図1に戻って、シーン変化点検出装置1の構成について説明を続ける。
このRNN変化点判定手段12aは、フレームの時刻ごとに算出されるRNNの内部状態(図6参照)を、モデル学習時のみ、変化点リスト生成手段12bに出力する。また、RNN変化点判定手段12aは、フレームの時刻ごとのシーン変化点の判定結果を内部状態リスト生成手段12cに出力する。
また、変化点リスト生成手段12bは、変化点検出時においては、生成したシーン変化点リストを、シーン変化点検出装置1の検出結果として外部に出力する。
このRNNパラメータ更新手段13aは、起動時、あるいは、変化点既知データが入力された段階で、変化点検出手段12にシーン変化点モデルパラメータの初期値を出力する。この初期値は、例えば、疑似乱数等によって求めた値である。
具体的には、更新終了判定手段13bは、更新前のシーン変化点モデルパラメータと、更新後のシーン変化点モデルパラメータとの差(更新値:例えば、各値を並べたベクトルのユークリッドノルム)が、予め定めた閾値を下回るか否かにより、シーン変化点モデルパラメータの更新の判定を行う。
また、更新終了判定手段13bは、更新前後のシーン変化点モデルパラメータの差が予め定めた閾値以上の場合、更新が終了していないことを示す判定結果をRNNパラメータ更新手段13aに通知する。
パラメータ更新時には、モデル更新手段13が、シーン変化点モデルパラメータの最適解をシーン変化点モデル記憶手段14に記憶する。
また、変化点検出時には、変化点検出手段12が、シーン変化点モデル記憶手段14に記憶されるシーン変化点モデルパラメータを参照する。
次に、図7,図8を参照して、本発明の実施形態に係るシーン変化点検出装置1の動作について説明する。ここでは、シーン変化点検出装置1の動作を、モデル学習時(学習段階)と、変化点検出時(検出段階)とに分けて説明する。
図7を参照(適宜図1,図3参照)して、シーン変化点検出装置1のモデル学習時の動作について説明する。なお、画像解析モデル記憶手段10には、予め画像から当該画像内の主被写体や場面を認識するために学習した畳み込みニューラルネットワーク(CNN)である画像解析モデルを記憶しておくものとする。
ここで、変化点既知データの映像コンテンツの入力が終了していない場合(ステップS4でNo)、シーン変化点検出装置1は、ステップS2に戻って、特徴マップの生成を繰り返す。
ここで、更新値が閾値以上であれば(ステップS10でNo)、シーン変化点検出装置1は、ステップS6に戻って、シーン変化点モデルパラメータの更新を継続する。
以上の動作によって、シーン変化点検出装置1は、学習により最適化したシーン変化点モデル(RNN)のパラメータを生成し、シーン変化点モデル記憶手段14に記憶する。
次に、図8を参照(適宜図1,図4参照)して、シーン変化点検出装置1の変化点検出時の動作について説明する。なお、シーン変化点モデル記憶手段14には、図7で説明したモデル学習時の動作によって、シーン変化点モデルパラメータが記憶されているものとする。
ここで、映像コンテンツの入力が終了していない場合(ステップS22でNo)、シーン変化点検出装置1は、ステップS20に戻って、特徴マップの生成を繰り返す。
シーン変化点検出装置1は、シーン変化点モデルを学習する学習動作と、シーン変化点モデルを用いて、映像コンテンツからシーン変化点を検出する検出動作との2つの動作を1つの装置で行うものである。しかし、これらの動作は、別々の装置で動作させても構わない。
シーン変化点モデル学習装置2は、図9に示すように画像解析モデル記憶手段10と、画像解析手段11と、変化点検出手段12と、モデル更新手段13と、シーン変化点モデル記憶手段14と、を備える。この構成は、図1で説明したシーン変化点検出装置1の構成と同じであるが、シーン変化点モデルを学習する学習動作のみを行う。なお、シーン変化点モデル学習装置2の動作は、図7で説明した動作と同じである。
このシーン変化点モデル学習装置2は、コンピュータを前記した各手段として機能させるためのプログラム(シーン変化点モデル学習プログラム)で動作させることができる。
シーン変化点検出装置1Bは、画像解析モデル記憶手段10と、画像解析手段11と、変化点検出手段12Bと、シーン変化点モデル記憶手段14と、を備える。この構成は、図1で説明したシーン変化点検出装置1の構成から、モデル更新手段13と、変化点検出手段12の内部状態リスト生成手段12cとを削除したものである。また、シーン変化点モデル記憶手段14に記憶するシーン変化点モデルは、図9のシーン変化点モデル学習装置2で学習されたものである。
このシーン変化点検出装置1Bは、映像コンテンツからシーン変化点を検出する検出動作のみを行う。なお、シーン変化点検出装置1Bの動作は、図8で説明した動作と同じである。
このシーン変化点検出装置1Bは、コンピュータを前記した各手段として機能させるためのプログラム(シーン変化点検出プログラム)で動作させることができる。
2 シーン変化点モデル学習装置
10 画像解析モデル記憶手段
11 画像解析手段
11a CNN画像認識手段
11b 特徴ベクトルリスト生成手段
12 変化点検出手段
12a RNN変化点判定手段
12b 変化点リスト生成手段
12c 内部状態リスト生成手段
13 モデル更新手段
13a RNNパラメータ更新手段
13b 更新終了判定手段
14 シーン変化点モデル記憶手段
Claims (5)
- 映像のシーンが切替るシーン変化点が既知の映像コンテンツである変化点既知映像から、前記シーン変化点が未知の映像コンテンツのシーン変化点を検出するための再帰型ニューラルネットワークのシーン変化点モデルを学習するシーン変化点モデル学習装置であって、
映像コンテンツにおけるフレームごとの画像特徴量を抽出し、当該フレーム内の被写体対象を認識する畳み込みニューラルネットワークの画像解析モデルを予め記憶する画像解析モデル記憶手段と、
前記変化点既知映像を時系列で入力し、前記画像解析モデルを用いて、フレームごとに前記畳み込みニューラルネットワークにおける複数の層の出力を前記画像特徴量として抽出する画像解析手段と、
前記シーン変化点モデルを用いて、前記画像解析手段で抽出した前記フレームごとの画像特徴量から前記シーン変化点を検出する変化点検出手段と、
前記シーン変化点モデルのパラメータを更新するモデル更新手段と、を備え、
前記変化点検出手段におけるシーン変化点の検出と、前記モデル更新手段における前記パラメータの更新とを、前記パラメータが予め定めた閾値内で収束するまで繰り返して前記シーン変化点モデルを学習することを特徴とするシーン変化点モデル学習装置。 - 請求項1に記載のシーン変化点モデル学習装置で学習した再帰型ニューラルネットワークのシーン変化点モデルを用いて、シーン変化点が未知の映像コンテンツである変化点未知映像からシーン変化点を検出するシーン変化点検出装置であって、
映像コンテンツにおけるフレームごとの画像特徴量を抽出し、当該フレーム内の被写体対象を認識する畳み込みニューラルネットワークの画像解析モデルを予め記憶する画像解析モデル記憶手段と、
前記変化点未知映像を時系列で入力し、前記画像解析モデルを用いて、フレームごとに前記畳み込みニューラルネットワークにおける複数の層の出力を前記画像特徴量として抽出する画像解析手段と、
前記シーン変化点モデルを用いて、前記画像解析手段で抽出した前記フレームごとの画像特徴量から前記シーン変化点を検出する変化点検出手段と、
を備えることを特徴とするシーン変化点検出装置。 - 映像のシーンが切替るシーン変化点が既知の映像コンテンツである変化点既知映像から、映像コンテンツのシーン変化点を検出する再帰型ニューラルネットワークのシーン変化点モデルを学習し、前記シーン変化点モデルを用いて、シーン変化点が未知の映像コンテンツである変化点未知映像からシーン変化点を検出するシーン変化点検出装置であって、
映像コンテンツにおけるフレームごとの画像特徴量を抽出し、当該フレーム内の被写体対象を認識する畳み込みニューラルネットワークの画像解析モデルを予め記憶する画像解析モデル記憶手段と、
前記シーン変化点モデルの学習段階においては前記変化点既知映像を、前記シーン変化点の検出段階においては前記変化点未知映像をそれぞれ時系列で入力し、前記画像解析モデルを用いて、フレームごとに前記畳み込みニューラルネットワークにおける複数の層の出力を前記画像特徴量として抽出する画像解析手段と、
前記シーン変化点モデルを用いて、前記画像解析手段で抽出した前記フレームごとの画像特徴量から前記シーン変化点を検出する変化点検出手段と、
前記シーン変化点モデルのパラメータを更新するモデル更新手段と、を備え、
前記学習段階において、前記変化点検出手段におけるシーン変化点の検出と、前記モデル更新手段における前記パラメータの更新とを、前記パラメータが予め定めた閾値内で収束するまで繰り返して前記シーン変化点モデルを学習し、
前記検出段階において、前記変化点検出手段が、学習済みの前記シーン変化点モデルを用いて、前記画像解析手段で抽出した前記フレームごとの画像特徴量から前記シーン変化点を検出することを特徴とするシーン変化点検出装置。 - コンピュータを、請求項1に記載のシーン変化点モデル学習装置として機能させるためのシーン変化点モデル学習プログラム。
- コンピュータを、請求項2または請求項3に記載のシーン変化点検出装置として機能させるためのシーン変化点検出プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017010651A JP6846216B2 (ja) | 2017-01-24 | 2017-01-24 | シーン変化点モデル学習装置、シーン変化点検出装置およびそれらのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017010651A JP6846216B2 (ja) | 2017-01-24 | 2017-01-24 | シーン変化点モデル学習装置、シーン変化点検出装置およびそれらのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018120362A JP2018120362A (ja) | 2018-08-02 |
JP6846216B2 true JP6846216B2 (ja) | 2021-03-24 |
Family
ID=63044389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017010651A Active JP6846216B2 (ja) | 2017-01-24 | 2017-01-24 | シーン変化点モデル学習装置、シーン変化点検出装置およびそれらのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6846216B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111797875B (zh) * | 2019-04-09 | 2023-12-01 | Oppo广东移动通信有限公司 | 场景建模方法、装置、存储介质及电子设备 |
CN110333999B (zh) * | 2019-05-06 | 2021-02-23 | 盛威时代科技集团有限公司 | 一种用于手机客户端进行测试环境切换的方法 |
CN112954453B (zh) * | 2021-02-07 | 2023-04-28 | 北京有竹居网络技术有限公司 | 视频配音方法和装置、存储介质和电子设备 |
CN114332716B (zh) * | 2021-12-30 | 2024-06-21 | 北京爱奇艺科技有限公司 | 视频中场景的聚类方法、装置、电子设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014241457A (ja) * | 2011-10-04 | 2014-12-25 | シャープ株式会社 | シーンチェンジ検出装置、表示装置、シーンチェンジ検出方法およびシーンチェンジ検出プログラム |
JP2014110020A (ja) * | 2012-12-04 | 2014-06-12 | Samsung R&D Institute Japan Co Ltd | 画像処理装置、画像処理方法および画像処理プログラム |
JP2016197389A (ja) * | 2015-04-03 | 2016-11-24 | 株式会社デンソーアイティーラボラトリ | 学習システム、学習プログラムおよび学習方法 |
-
2017
- 2017-01-24 JP JP2017010651A patent/JP6846216B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018120362A (ja) | 2018-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10242289B2 (en) | Method for analysing media content | |
JP6755849B2 (ja) | 人工ニューラルネットワークのクラスに基づく枝刈り | |
CN109086873B (zh) | 递归神经网络的训练方法、识别方法、装置及处理设备 | |
JP6846216B2 (ja) | シーン変化点モデル学習装置、シーン変化点検出装置およびそれらのプログラム | |
US11966831B2 (en) | Feedback mechanisms in sequence learning systems with temporal processing capability | |
EP2548096B1 (en) | Temporal memory using sparse distributed representation | |
CN110096938B (zh) | 一种视频中的动作行为的处理方法和装置 | |
US12093843B2 (en) | Inferencing and learning based on sensorimotor input data | |
CN112101207B (zh) | 一种目标跟踪方法、装置、电子设备及可读存储介质 | |
KR102293791B1 (ko) | 반도체 소자의 시뮬레이션을 위한 전자 장치, 방법, 및 컴퓨터 판독가능 매체 | |
CN114450746A (zh) | 用于基于连接机制时间分类的自动语音识别的软遗忘 | |
KR102541660B1 (ko) | 음성 신호에 기반한 감정 인식 장치 및 방법 | |
US9436912B1 (en) | Symmetric schema instantiation method for use in a case-based reasoning system | |
CN112527959B (zh) | 基于无池化卷积嵌入和注意分布神经网络的新闻分类方法 | |
WO2015011521A1 (en) | An incremental learner via an adaptive mixture of weak learners distributed on a non-rigid binary tree | |
CN114818864A (zh) | 一种基于小样本的手势识别方法 | |
CN112948155A (zh) | 模型训练方法、状态预测方法、装置、设备及存储介质 | |
CN114492601A (zh) | 资源分类模型的训练方法、装置、电子设备及存储介质 | |
CN111557010A (zh) | 学习装置和方法以及程序 | |
CA2997888A1 (en) | Method and system for mapping attributes of entities | |
KR102413588B1 (ko) | 학습 데이터에 따른 객체 인식 모델 추천 방법, 시스템 및 컴퓨터 프로그램 | |
CN116340763A (zh) | 一种基于决策树的模型的训练及分类方法 | |
CN116227603A (zh) | 一种事件推理任务的处理方法、设备及介质 | |
CN112742026B (zh) | 游戏控制方法、装置、存储介质和电子设备 | |
Maraghi et al. | Class‐Incremental Learning on Video‐Based Action Recognition by Distillation of Various Knowledge |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210301 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6846216 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |