JP7486337B2 - 映像抽出装置及びプログラム - Google Patents
映像抽出装置及びプログラム Download PDFInfo
- Publication number
- JP7486337B2 JP7486337B2 JP2020073124A JP2020073124A JP7486337B2 JP 7486337 B2 JP7486337 B2 JP 7486337B2 JP 2020073124 A JP2020073124 A JP 2020073124A JP 2020073124 A JP2020073124 A JP 2020073124A JP 7486337 B2 JP7486337 B2 JP 7486337B2
- Authority
- JP
- Japan
- Prior art keywords
- cut
- video
- sub
- unit
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims description 66
- 238000013528 artificial neural network Methods 0.000 claims description 45
- 239000000284 extract Substances 0.000 claims description 30
- 238000005070 sampling Methods 0.000 claims description 25
- 238000011156 evaluation Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000000007 visual effect Effects 0.000 description 19
- 238000000034 method Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000015654 memory Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000001502 supplementing effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Studio Devices (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Image Analysis (AREA)
Description
まず、本発明の実施形態による映像抽出装置について説明する。図1は、本発明の実施形態による映像抽出装置の構成例を示すブロック図である。この映像抽出装置1は、分割部10、サンプリング部11、NN(ニューラルネットワーク)部12、サブカットスコア算出部13、切り出し部14及び抽出部15を備えている。
分割部10は、番組映像等の映像を入力し、映像に対し、所定の手法を用いて分割点を検出し、映像を分割点にて分割することで、複数のサブカット映像SBを抽出する。そして、分割部10は、サブカット映像SBをサンプリング部11及び切り出し部14に出力する。「サブカット」は、分割部10により映像が分割される単位(分割単位)をいう。
図1に戻って、サンプリング部11は、分割部10からサブカット映像SBを入力し、サブカット映像SBを複数のフレーム画像Fにサンプリングする。そして、サンプリング部11は、フレーム画像FをNN部12及び切り出し部14に出力する。
NN部12は、後述する学習装置100により学習されたNNであり、後述する学習装置100により得られた最適なパラメータ(重み係数等)が予め設定される。NNとしては、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)等が用いられる。
サブカットスコア算出部13は、NN部12からフレームスコアFSを入力する。そして、サブカットスコア算出部13は、サブカット映像SBに対応する(を構成する)複数のフレーム画像FのフレームスコアFSを用いて、1つのフレーム画像FあたりのフレームスコアFSの平均値をサブカットスコアSSとして算出する。サブカットスコアSSは、サブカット映像SBのスコアであり、サブカット映像SBの画力の程度を表すスコアである。サブカットスコア算出部13は、サブカットスコアSSを抽出部15に出力する。
切り出し部14は、分割部10からサブカット映像SBを入力すると共に、サンプリング部11から、サブカット映像SBに対応する複数のフレーム画像Fを入力する。また、切り出し部14は、NN部12から、サブカット映像SBに対応する複数のフレーム画像FにおけるそれぞれのフレームスコアFSを入力する。
図1に戻って、抽出部15は、切り出し部14から、映像に対応する(を構成する)複数のサブカット映像SBのそれぞれについて、区間映像KU(切り出し映像KI及びサブカット映像SB)を入力する。また、抽出部15は、サブカットスコア算出部13から、映像に対応する複数のサブカット映像SBにおけるそれぞれのサブカットスコアSSを入力する。
次に、本発明の実施形態による映像抽出装置1に備えたNN部12を学習する学習装置について説明する。図9は、学習装置の構成例を示すブロック図である。この学習装置100は、サンプリング部110、画力付与部111、メモリ112及び学習部113を備えている。学習装置100は、図1に示した映像抽出装置1のNN部12が用いるパラメータを最適化する装置である。
10 分割部
11 サンプリング部
12 NN(ニューラルネットワーク)部
13 サブカットスコア算出部
14 切り出し部
15 抽出部
100 学習装置
110 サンプリング部
111 画力付与部
112 メモリ
113 学習部
120 NN部
121 パラメータ更新部
SB,SB’ サブカット映像
FS フレームスコア
KI,KI’ 切り出し映像
FA 基準点のフレーム画像
FB 前の分割点のフレーム画像
KU,KU’ 区間映像
S 類似性評価値
SS,SS’ サブカットスコア
TH1,TH2 しきい値
Claims (5)
- 映像から区間映像を抽出する映像抽出装置において、
前記映像を所定の分割点にて分割し、複数のサブカット映像を抽出する分割部と、
前記分割部により分割された前記複数のサブカット映像のそれぞれを、複数のフレーム画像にサンプリングするサンプリング部と、
前記サンプリング部によりサンプリングされた前記複数のフレーム画像のそれぞれについて、予め学習されたニューラルネットワークを用いてフレームスコアを求めるニューラルネットワーク部と、
前記分割部により分割された前記複数のサブカット映像のそれぞれについて、前記ニューラルネットワーク部により求めた前記フレームスコアに基づきサブカットスコアを算出するサブカットスコア算出部と、
前記複数のサブカット映像のそれぞれに対応する前記複数のフレーム画像のうち、最大の前記フレームスコアを有するフレーム画像を特定し、特定した前記フレーム画像を含む所定時間のサブカット映像の切り出し区間から、切り出し映像を抽出する切り出し部と、
前記切り出し部により抽出された前記切り出し映像、前記サブカット映像、並びに前記サブカットスコア算出部により算出された前記サブカットスコアを組として、
前記複数のサブカット映像のそれぞれに対応する組のうち、所定のしきい値以上の前記サブカットスコアを有する前記組を抽出し、抽出した前記組の前記切り出し映像を前記区間映像として出力する抽出部と、
を備えたことを特徴とする映像抽出装置。 - 請求項1に記載の映像抽出装置において、
前記抽出部は、
前記複数のサブカット映像のそれぞれに対応する組のうち、所定のしきい値以上の前記サブカットスコアを有する前記組を抽出し、抽出した前記組の前記切り出し映像及び前記サブカット映像を前記区間映像として出力する、ことを特徴とする映像抽出装置。 - 請求項1または2に記載の映像抽出装置において、
前記分割部は、
前記分割点から所定時間後の時点を基準点とし、前記基準点から順番にそれ以降のフレーム画像を第1フレーム画像としてそれぞれ抽出し、前記分割点のフレーム画像と前記第1フレーム画像との間の類似性の程度を示す類似性評価値を算出し、前記類似性評価値が所定のしきい値よりも小さいと判定した最初の前記第1フレーム画像の時点を新しい分割点に設定し、前記分割点と前記新しい分割点との間の映像をサブカット映像として抽出する、ことを特徴とする映像抽出装置。 - 請求項1または2に記載の映像抽出装置において、
前記切り出し部は、
前記サブカット映像の前記切り出し区間から前記切り出し映像を抽出する際に、前記切り出し区間が隣のサブカット映像に跨っている場合、前記切り出し区間が前記サブカット映像の区間に含まれ、かつ前記切り出し区間の端が前記サブカット映像の端に接するように、前記切り出し区間をシフトし、シフト後の前記切り出し区間から前記切り出し映像を抽出する、ことを特徴とする映像抽出装置。 - コンピュータを、請求項1から4までのいずれか一項に記載の映像抽出装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020073124A JP7486337B2 (ja) | 2020-04-15 | 2020-04-15 | 映像抽出装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020073124A JP7486337B2 (ja) | 2020-04-15 | 2020-04-15 | 映像抽出装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021170724A JP2021170724A (ja) | 2021-10-28 |
JP7486337B2 true JP7486337B2 (ja) | 2024-05-17 |
Family
ID=78149713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020073124A Active JP7486337B2 (ja) | 2020-04-15 | 2020-04-15 | 映像抽出装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7486337B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001202522A (ja) | 1999-12-14 | 2001-07-27 | Eastman Kodak Co | 消費者画像の強調及び魅力の自動評価方法 |
JP2012010265A (ja) | 2010-06-28 | 2012-01-12 | Nippon Hoso Kyokai <Nhk> | 要約映像生成装置及び要約映像生成プログラム |
JP2013239796A (ja) | 2012-05-11 | 2013-11-28 | Canon Inc | 画像処理装置 |
JP2017098637A (ja) | 2015-11-18 | 2017-06-01 | カシオ計算機株式会社 | 画像特定装置、画像特定方法及びプログラム |
WO2019194906A1 (en) | 2018-04-03 | 2019-10-10 | Google Llc | Systems and methods that leverage deep learning to selectively store audiovisual content |
-
2020
- 2020-04-15 JP JP2020073124A patent/JP7486337B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001202522A (ja) | 1999-12-14 | 2001-07-27 | Eastman Kodak Co | 消費者画像の強調及び魅力の自動評価方法 |
JP2012010265A (ja) | 2010-06-28 | 2012-01-12 | Nippon Hoso Kyokai <Nhk> | 要約映像生成装置及び要約映像生成プログラム |
JP2013239796A (ja) | 2012-05-11 | 2013-11-28 | Canon Inc | 画像処理装置 |
JP2017098637A (ja) | 2015-11-18 | 2017-06-01 | カシオ計算機株式会社 | 画像特定装置、画像特定方法及びプログラム |
WO2019194906A1 (en) | 2018-04-03 | 2019-10-10 | Google Llc | Systems and methods that leverage deep learning to selectively store audiovisual content |
Also Published As
Publication number | Publication date |
---|---|
JP2021170724A (ja) | 2021-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111143610B (zh) | 一种内容推荐方法、装置、电子设备和存储介质 | |
CN106921891B (zh) | 一种视频特征信息的展示方法和装置 | |
US20200195983A1 (en) | Multimedia stream analysis and retrieval | |
CN107636651B (zh) | 使用自然语言处理生成主题索引 | |
JP5886733B2 (ja) | 映像群再構成・要約装置、映像群再構成・要約方法及び映像群再構成・要約プログラム | |
Wang et al. | Toward automatic audio description generation for accessible videos | |
JP4920395B2 (ja) | 動画要約自動作成装置、方法、及びコンピュータ・プログラム | |
CN109684647B (zh) | 电影评论情感分析方法及装置 | |
US10326829B2 (en) | Television key phrase detection | |
WO2012020668A1 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
Tapaswi et al. | Aligning plot synopses to videos for story-based retrieval | |
CN112733654B (zh) | 一种视频拆条的方法和装置 | |
KR101916874B1 (ko) | 자동으로 동영상 하이라이트 영상의 제목을 생성하는 방법, 장치 및 컴퓨터 판독가능 기록 매체 | |
Bonini | Podcasting as a hybrid cultural form between old and new media | |
JP2007150723A (ja) | 映像視聴支援システムおよび方法 | |
CN112511854A (zh) | 一种直播视频精彩片段生成方法、装置、介质和设备 | |
CN113055741A (zh) | 视频摘要的生成方法、电子设备及计算机可读存储介质 | |
CN115357755B (zh) | 视频生成方法、视频展示方法和装置 | |
WO2023173539A1 (zh) | 一种视频内容处理方法、系统、终端及存储介质 | |
CN111242110B (zh) | 一种新闻自动拆条的自适应条件随机场算法的训练方法 | |
JP7486337B2 (ja) | 映像抽出装置及びプログラム | |
Klug et al. | Struggle for strategy. Presence, practices, and communicative strategies of legacy news providers on TikTok | |
Bost et al. | Serial speakers: a dataset of tv series | |
CN113301268A (zh) | 基于风格迁移与语音识别的视频自动生成连环画的方法 | |
CN109800326B (zh) | 一种视频处理方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230301 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240326 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7486337 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |