JP7444250B2 - 情報処理装置、制御方法、及び、プログラム - Google Patents
情報処理装置、制御方法、及び、プログラム Download PDFInfo
- Publication number
- JP7444250B2 JP7444250B2 JP2022527326A JP2022527326A JP7444250B2 JP 7444250 B2 JP7444250 B2 JP 7444250B2 JP 2022527326 A JP2022527326 A JP 2022527326A JP 2022527326 A JP2022527326 A JP 2022527326A JP 7444250 B2 JP7444250 B2 JP 7444250B2
- Authority
- JP
- Japan
- Prior art keywords
- video data
- candidate
- slow
- video
- digest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 97
- 238000000034 method Methods 0.000 title claims description 20
- 239000000463 material Substances 0.000 claims description 99
- 238000012545 processing Methods 0.000 claims description 13
- 230000015654 memory Effects 0.000 description 20
- 238000012986 modification Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000013077 target material Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Television Signal Processing For Recording (AREA)
Description
(1)システム構成
図1は、第1実施形態に係るダイジェスト候補選定システム100の構成を示す。ダイジェスト候補選定システム100は、素材となる映像データ(「素材映像データDm」とも呼ぶ。)のダイジェストの候補となる映像データ(「ダイジェスト候補Cd」とも呼ぶ。)を好適に選定する。ダイジェスト候補選定システム100は、主に、情報処理装置1と、入力装置2と、出力装置3と、記憶装置4とを備える。以後において、映像データは、音データを含んでもよい。
図2は、情報処理装置1のハードウェア構成を示す。情報処理装置1は、ハードウェアとして、プロセッサ11と、メモリ12と、インターフェース13とを含む。プロセッサ11、メモリ12及びインターフェース13は、データバス19を介して接続されている。
情報処理装置1は、スロー映像を生成する区間映像データDpの候補(「第1候補映像データCd1」とも呼ぶ。)を第1スコアSc1に基づき選定し、ダイジェスト候補Cdに含めるスロー映像の候補(「第2候補映像データCd2」とも呼ぶ。)を第2スコアSc2に基づき選定する。そして、情報処理装置1は、第1候補映像データCd1と第2候補映像データCd2に基づき、ダイジェスト候補Cdを生成する。以下では、上述の処理を実現するための情報処理装置1の機能ブロックについて説明する。
次に、図3の機能ブロックに基づくダイジェスト候補Cdの生成の具体例について図4(A)~(E)を参照して説明する。以後では、一例として、情報処理装置1は、スロー映像SLとして、第1再生速度に対応する第1速度スロー映像「SL1」と、第2再生速度に対応する第2速度スロー映像「SL2」とを生成するものとする。ここで、第1再生速度は、等倍速度未満であり、第2再生速度は、第1再生速度未満である。
次に、第1推論器及び第2推論器の学習による第1推論器情報D1及び第2推論器情報D2の生成について説明する。図5は、第1推論器及び第2推論器の学習を行う学習システムの概略構成図である。上記学習システムは、学習データD3を参照可能な学習装置6を有する。
図6は、第1実施形態において情報処理装置1が実行する処理の手順を示すフローチャートの一例である。情報処理装置1は、図6に示すフローチャートの処理を、例えば、対象となる素材映像データDmを指定して処理の開始を指示するユーザ入力を検知した場合、又は、外部装置から素材映像データDmの供給が開始された場合等に実行する。
次に、上記実施形態に好適な各変形例について説明する。以下の変形例は任意に組み合わせて上述の実施形態に適用してもよい。
第1推論器と第2推論器とは、同一のパラメータを用いて構成される同一の推論器であってもよい。
ダイジェスト候補生成部18は、素材映像データDmにおいて同一区間に対応する第1候補映像データCd1及び第2候補映像データCd2のうち、いずれか一方のみをダイジェスト候補Cdに含めてもよい。
情報処理装置1は、重要区間か否かを識別するためのラベルが予め付されている素材映像データDmに基づきダイジェスト候補Cdを生成してもよい。この場合、情報処理装置1は、第1推論器情報D1を参照して第1候補映像データCd1を選定する代わりに、上述のラベルを参照して第1候補映像データCd1を選定する。
情報処理装置1は、スロー映像SLを生成する対象となる区間映像データDpと、ダイジェスト候補Cdに含まれる対象となる区間映像データDpとを別々に選定してもよい。以後では、スロー映像SLを生成する対象となる区間映像データDpを引き続き第1候補映像データCd1と呼び、ダイジェスト候補Cdに含まれる対象となる区間映像データDpを「第3候補映像データCd3」とも呼ぶ。
図9は、第2実施形態における情報処理装置1Xの機能ブロック図である。情報処理装置1Xは、主に、スロー映像生成手段16Xと、ダイジェスト候補生成手段18Xとを有する。
素材映像データから選定された一部の区間に対応する映像データである第1候補映像データに対し、当該第1候補映像データの再生速度を等倍速未満とした映像データであるスロー映像を生成するスロー映像生成手段と、
前記素材映像データと、前記スロー映像とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成するダイジェスト候補生成手段と、
を有する情報処理装置。
前記スロー映像生成手段は、前記第1候補映像データ毎に複数の再生速度に対応する前記スロー映像を生成する、付記1に記載の情報処理装置。
前記スロー映像の各々に対するスコアに基づき、前記スロー映像から第2候補映像データを選定する第2候補選定手段をさらに有し、
前記ダイジェスト候補生成手段は、前記素材映像データと、前記第2候補映像データとに基づき、前記ダイジェスト候補を生成する、付記1または2に記載の情報処理装置。
前記第2候補選定手段は、前記スコアが閾値以上となる前記スロー映像を、前記第2候補映像データとして選定する、付記3に記載の情報処理装置。
前記スロー映像生成手段は、前記第1候補映像データ毎に複数の再生速度に対応する前記スロー映像を生成し、
前記第2候補選定手段は、前記第1候補映像データ毎の前記スロー映像のうち、前記スロー映像の各々に対して算出されたスコアが閾値以上であって、かつ、最も前記スコアが高いスロー映像を、前記第2候補映像データとして選定する、付記3に記載の情報処理装置。
前記ダイジェスト候補生成手段は、前記素材映像データの同一区間に対応する前記第1候補映像データと前記第2候補映像データのうち、前記スコアが最も高い映像データのみを、前記ダイジェスト候補に含める、付記3~5のいずれか一項に記載の情報処理装置。
前記ダイジェスト候補生成手段は、前記第1候補映像データと、前記第2候補映像データとを結合した映像データを、前記ダイジェスト候補として生成する、付記3~6のいずれか一項に記載の情報処理装置。
入力された映像データに対して第1スコアを推論するように学習された第1推論器に基づき、前記素材映像データから前記第1候補映像データを選定する第1候補選定手段をさらに有し、
前記第2候補選定手段は、入力された映像データに対して第2スコアを推論するように学習された第2推論器に基づき、前記スロー映像の各々に対する第2スコアを前記スコアとして算出する、付記3~7のいずれか一項に記載の情報処理装置。
前記第1推論器は、重要区間か否かに関するラベルが付された学習用素材映像データに基づき学習された推論器であり、
前記第2推論器は、特定のイベントが発生しているか否かに関するラベルが付された学習用素材映像データに基づき学習された推論器である、付記8に記載の情報処理装置。
なお、「重要区間か否かに関するラベル」は、区間ごとに重要度を示すラベルであってもよい。
前記第1推論器及び前記第2推論器は、重要区間か否かに関するラベルが付された学習用素材映像データに基づき学習された推論器であり、
前記第1スコアと前記第2スコアとは、対応する映像データの重要度に関するスコアである、付記8に記載の情報処理装置。
なお、この場合、「前記第1推論器及び前記第2推論器」は、同一の推論器であってもよく、異なる推論器であってもよい。
前記素材映像データの区間毎の区間映像データに対する第1スコアを第1閾値と比較することで、前記第1候補映像データとなる前記区間映像データを選定する第1候補選定手段をさらに有し、
前記ダイジェスト候補生成手段は、前記第1スコアを第1閾値と異なる第2閾値と比較することで選定した前記区間映像データと、前記スロー映像とに基づき、前記ダイジェスト候補を生成する、付記3~7のいずれか一項に記載の情報処理装置。
コンピュータにより、
素材映像データから選定された一部の区間に対応する映像データである第1候補映像データに対し、当該第1候補映像データの再生速度を等倍速未満とした映像データであるスロー映像を生成し、
前記素材映像データと、前記スロー映像とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成する、
制御方法。
素材映像データから選定された一部の区間に対応する映像データである第1候補映像データに対し、当該第1候補映像データの再生速度を等倍速未満とした映像データであるスロー映像を生成するスロー映像生成手段と、
前記素材映像データと、前記スロー映像とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成するダイジェスト候補生成手段
としてコンピュータを機能させるプログラムが格納された記憶媒体。
2 入力装置
3 出力装置
4 記憶装置
6 学習装置
100 ダイジェスト候補選定システム
Claims (8)
- 素材映像データから選定された一部の区間に対応する映像データである第1候補映像データに対し、当該第1候補映像データの再生速度を等倍速未満とした映像データであるスロー映像を生成するスロー映像生成手段と、
前記スロー映像毎に重要度を推論して算出したスコアが第2の閾値以上であるスロー映像を第2候補映像データとして選定する第2候補選定手段と、
前記第1候補映像データ毎に重要度を推論して算出したスコアが第1の閾値以上である第1候補映像データと、前記第2候補映像データと、に基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成するダイジェスト候補生成手段と、
を有する情報処理装置。 - 前記スロー映像生成手段は、前記第1候補映像データ毎に複数の再生速度に対応する前記スロー映像を生成する、請求項1に記載の情報処理装置。
- 前記スロー映像生成手段は、前記第1候補映像データ毎に複数の再生速度に対応する前記スロー映像を生成し、
前記第2候補選定手段は、前記第1候補映像データ毎の前記スロー映像のうち、前記スロー映像の各々に対して算出されたスコアが前記第2の閾値以上であって、かつ、最も前記スコアが高いスロー映像を、前記第2候補映像データとして選定する、請求項1に記載の情報処理装置。 - 前記ダイジェスト候補生成手段は、前記素材映像データの同一区間に対応する前記第1候補映像データと前記第2候補映像データのうち、前記スコアが最も高い映像データのみを、前記ダイジェスト候補に含める、請求項1~3のいずれか一項に記載の情報処理装置。
- 前記ダイジェスト候補生成手段は、前記第1候補映像データと、前記第2候補映像データとを結合した映像データを、前記ダイジェスト候補として生成する、請求項1~4のいずれか一項に記載の情報処理装置。
- 入力された映像データに対して第1スコアを推論するように学習された第1推論器に基づき、前記素材映像データから前記第1候補映像データを選定する第1候補選定手段をさらに有し、
前記第2候補選定手段は、入力された映像データに対して第2スコアを推論するように学習された第2推論器に基づき、前記スロー映像の各々に対する第2スコアを前記スコアとして算出する、請求項1~5のいずれか一項に記載の情報処理装置。 - コンピュータにより、
素材映像データから選定された一部の区間に対応する映像データである第1候補映像データに対し、当該第1候補映像データの再生速度を等倍速未満とした映像データであるスロー映像を生成し、
前記スロー映像毎に重要度を推論して算出したスコアが第2の閾値以上であるスロー映像を第2候補映像データとして選定し、
前記第1候補映像データ毎に重要度を推論して算出したスコアが第1の閾値以上である第1候補映像データと、前記第2候補映像データと、に基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成する、
制御方法。 - 素材映像データから選定された一部の区間に対応する映像データである第1候補映像データに対し、当該第1候補映像データの再生速度を等倍速未満とした映像データであるスロー映像を生成するスロー映像生成手段と、
前記スロー映像毎に重要度を推論して算出したスコアが第2の閾値以上であるスロー映像を第2候補映像データとして選定する第2候補選定手段と、
前記第1候補映像データ毎に重要度を推論して算出したスコアが第1の閾値以上である第1候補映像データと、前記第2候補映像データと、に基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成するダイジェスト候補生成手段
としてコンピュータを機能させるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/020773 WO2021240653A1 (ja) | 2020-05-26 | 2020-05-26 | 情報処理装置、制御方法及び記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021240653A1 JPWO2021240653A1 (ja) | 2021-12-02 |
JPWO2021240653A5 JPWO2021240653A5 (ja) | 2023-02-02 |
JP7444250B2 true JP7444250B2 (ja) | 2024-03-06 |
Family
ID=78723027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022527326A Active JP7444250B2 (ja) | 2020-05-26 | 2020-05-26 | 情報処理装置、制御方法、及び、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230352052A1 (ja) |
JP (1) | JP7444250B2 (ja) |
WO (1) | WO2021240653A1 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006008923A3 (ja) | 2004-06-29 | 2006-03-09 | Matsushita Electric Ind Co Ltd | 映像編集装置及び方法 |
JP2010074323A (ja) | 2008-09-17 | 2010-04-02 | Sony Corp | 記録装置および方法、並びに記録再生装置および方法 |
JP2017199994A (ja) | 2016-04-26 | 2017-11-02 | 日本放送協会 | 映像配信装置及び映像配信方法 |
JP2019186689A (ja) | 2018-04-06 | 2019-10-24 | キヤノン株式会社 | 情報処理装置、システム、分析方法、コンピュータプログラム、及び記憶媒体 |
-
2020
- 2020-05-26 JP JP2022527326A patent/JP7444250B2/ja active Active
- 2020-05-26 WO PCT/JP2020/020773 patent/WO2021240653A1/ja active Application Filing
- 2020-05-26 US US17/925,895 patent/US20230352052A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006008923A3 (ja) | 2004-06-29 | 2006-03-09 | Matsushita Electric Ind Co Ltd | 映像編集装置及び方法 |
JP2010074323A (ja) | 2008-09-17 | 2010-04-02 | Sony Corp | 記録装置および方法、並びに記録再生装置および方法 |
JP2017199994A (ja) | 2016-04-26 | 2017-11-02 | 日本放送協会 | 映像配信装置及び映像配信方法 |
JP2019186689A (ja) | 2018-04-06 | 2019-10-24 | キヤノン株式会社 | 情報処理装置、システム、分析方法、コンピュータプログラム、及び記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021240653A1 (ja) | 2021-12-02 |
US20230352052A1 (en) | 2023-11-02 |
WO2021240653A1 (ja) | 2021-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11025879B2 (en) | Image processing apparatus, image processing method, and storage medium storing program | |
JP2005236993A (ja) | 複数画像の要約方法および装置 | |
JP6597643B2 (ja) | 画像処理装置、画像処理システム、画像処理方法およびプログラム | |
JP2014106637A (ja) | 情報処理装置および方法、並びにプログラム | |
US20240171817A1 (en) | Systems and methods for applying behavioral-based parental controls for media assets | |
JP4252030B2 (ja) | 記憶装置およびコンピュータ読取り可能な記録媒体 | |
JP4812733B2 (ja) | 情報編集装置、情報編集方法、情報編集プログラムおよびそのプログラムを記録した記録媒体 | |
JP7444250B2 (ja) | 情報処理装置、制御方法、及び、プログラム | |
KR20180080642A (ko) | 음원과 동기화되는 동영상을 편집하는 방법 | |
US20230379538A1 (en) | Content recommendations for users with disabilities | |
JP7268739B2 (ja) | 学習データ生成装置、学習装置、識別装置、生成方法及びプログラム | |
JP5733688B2 (ja) | 動画編集装置、動画編集方法およびコンピュータプログラム | |
JP7375926B2 (ja) | 情報処理装置、制御方法及び、プログラム | |
JP7420243B2 (ja) | 情報処理装置、制御方法及びプログラム | |
KR102439599B1 (ko) | 클라우드 영상 편집 서비스 시스템 및 방법 | |
US11665373B2 (en) | Virtual spectator experience for live events | |
JP4513904B2 (ja) | 画像処理装置および方法、並びにプログラム | |
WO2021240677A1 (ja) | 映像処理装置、映像処理方法、訓練装置、訓練方法、及び、記録媒体 | |
US11350157B2 (en) | Systems and methods for delayed pausing | |
JP7452641B2 (ja) | 情報処理装置、制御方法、及び、プログラム | |
US11330307B2 (en) | Systems and methods for generating new content structures from content segments | |
US20210314653A1 (en) | Systems and methods for delayed pausing | |
JP7420245B2 (ja) | 映像処理装置、映像処理方法、及び、プログラム | |
KR20200130969A (ko) | 어댑티브 멀티트랙 스트리밍 장치 및 방법 | |
KR102649599B1 (ko) | 배경 음원 추천 및 결합 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221116 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240205 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7444250 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |