JP7452641B2 - 情報処理装置、制御方法、及び、プログラム - Google Patents
情報処理装置、制御方法、及び、プログラム Download PDFInfo
- Publication number
- JP7452641B2 JP7452641B2 JP2022527400A JP2022527400A JP7452641B2 JP 7452641 B2 JP7452641 B2 JP 7452641B2 JP 2022527400 A JP2022527400 A JP 2022527400A JP 2022527400 A JP2022527400 A JP 2022527400A JP 7452641 B2 JP7452641 B2 JP 7452641B2
- Authority
- JP
- Japan
- Prior art keywords
- inference
- digest
- video data
- input
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 78
- 238000000034 method Methods 0.000 title claims description 17
- 239000000463 material Substances 0.000 claims description 49
- 239000000284 extract Substances 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 6
- 230000015654 memory Effects 0.000 description 23
- 238000012545 processing Methods 0.000 description 15
- 230000008859 change Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 239000013077 target material Substances 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/75—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
入力された映像データに対して重要度に関する推論を行う複数の推論器による素材映像データへの前記推論器毎の推論結果を取得する推論手段と、
前記推論器毎の推論結果に関するパラメータを指定する入力を受け付け、前記パラメータは前記推論器毎の推論結果を統合した総合スコアに対する閾値に関する情報を含み、前記映像データ対して指定された再生時刻に応じて画像を表示する入力受付手段と、
前記画像が表示された画面に備えられた決定ボタンの選択に応じて、前記パラメータと、前記推論器毎の推論結果とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成するダイジェスト候補生成手段と、
を有する情報処理装置である。
コンピュータにより、
入力された映像データに対して重要度に関する推論を行う複数の推論器による素材映像データへの前記推論器毎の推論結果を取得し、
前記推論器毎の推論結果に関するパラメータを指定する入力を受け付け、前記パラメータは前記推論器毎の推論結果を統合した総合スコアに対する閾値に関する情報を含み、前記映像データ対して指定された再生時刻に応じて画像を表示し、
前記画像が表示された画面に備えられた決定ボタンの選択に応じて、前記パラメータと、前記推論器毎の推論結果とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成する、制御方法である。
入力された映像データに対して重要度に関する推論を行う複数の推論器による素材映像データへの前記推論器毎の推論結果を取得する推論手段と、
前記推論器毎の推論結果に関するパラメータを指定する入力を受け付け、前記パラメータは前記推論器毎の推論結果を統合した総合スコアに対する閾値に関する情報を含み、前記映像データ対して指定された再生時刻に応じて画像を表示する入力受付手段と、
前記画像が表示された画面に備えられた決定ボタンの選択に応じて、前記パラメータと、前記推論器毎の推論結果とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成するダイジェスト候補生成手段としてコンピュータを機能させるプログラムである。
(1)システム構成
図1は、第1実施形態に係るダイジェスト生成支援システム100の構成を示す。ダイジェスト生成支援システム100は、素材となる映像データのダイジェストの候補となる映像データ(「ダイジェスト候補Cd」とも呼ぶ。)の生成を好適に支援する。ダイジェスト生成支援システム100は、主に、情報処理装置1と、入力装置2と、出力装置3と、記憶装置4とを備える。以後において、映像データは、音データを含んでもよい。
図2は、情報処理装置1のハードウェア構成を示す。情報処理装置1は、ハードウェアとして、プロセッサ11と、メモリ12と、インターフェース13とを含む。プロセッサ11、メモリ12及びインターフェース13は、データバス19を介して接続されている。
情報処理装置1は、複数の推論器の推論結果Reに関するパラメータ(「パラメータPd」とも呼ぶ。)を指定するユーザ入力を受け付け、パラメータPdに基づきダイジェスト候補Cdを生成する。ここで、パラメータPdは、複数の推論器の推論結果Reからダイジェスト候補Cdを生成するために必要なパラメータである。以下では、上述の処理を実現するための情報処理装置1の機能ブロックについて説明する。
次に、入力受付部16が実行する具体的な処理について、ダイジェスト生成支援画面の表示例(第1表示例及び第2表示例)と共に説明する。
St=(W1・Si1+W2・Si2+W3・Si3)/(W1+W2+W3)
図6は、第1実施形態において情報処理装置1が実行する処理の手順を示すフローチャートの一例である。情報処理装置1は、図6に示すフローチャートの処理を、例えば、対象となる素材映像データD1を指定して処理の開始を指示するユーザ入力を検知した場合等に実行する。
次に、上記実施形態に好適な各変形例について説明する。以下の変形例は任意に組み合わせて上述の実施形態に適用してもよい。
情報処理装置1は、ダイジェスト生成支援画面上において、ユーザが希望するダイジェストの時間長を実現するために推奨されるパラメータPdの推奨値をダイジェスト生成支援画面上において明示してもよい。
ダイジェスト生成支援システム100は、サーバクライアントモデルであってもよい。
図9は、第2実施形態における情報処理装置1Xの機能ブロック図である。情報処理装置1Xは、主に、推論手段15Xと、入力受付手段16Xと、ダイジェスト候補生成手段17Xとを有する。
入力された映像データに対して重要度に関する推論を行う複数の推論器による素材映像データへの前記推論器毎の推論結果を取得する推論手段と、
前記推論器毎の推論結果に関するパラメータを指定する入力を受け付ける入力受付手段と、
前記パラメータと、前記推論器毎の推論結果とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成するダイジェスト候補生成手段と、
を有する情報処理装置。
前記パラメータは、前記推論器毎の推論結果に対する重みに関する情報を少なくとも含み、
前記ダイジェスト候補生成手段は、前記重みと、前記推論器毎の推論結果とに基づき、前記素材映像データから前記ダイジェスト候補を抽出する、付記1に記載の情報処理装置。
前記パラメータは、前記推論器毎の推論結果を統合した総合スコアに対する閾値に関する情報を少なくとも含み、
前記ダイジェスト候補生成手段は、前記閾値と、前記総合スコアとに基づき、前記素材映像データから前記ダイジェスト候補を抽出する、付記1または2に記載の情報処理装置。
前記入力受付手段は、前記閾値の現在の設定値を明示した前記総合スコアのグラフの表示を行う、付記3に記載の情報処理装置。
前記入力受付手段は、前記総合スコアに対する前記推論器毎の推論結果の寄与分を明示した前記総合スコアのグラフの表示を行う、付記3または4に記載の情報処理装置。
前記入力受付手段は、前記パラメータの現在の設定値に基づき前記ダイジェスト候補が生成された場合の前記ダイジェスト候補の時間長に関する情報の表示を行う、付記1~5のいずれか一項に記載の情報処理装置。
前記入力受付手段は、前記ダイジェスト候補の希望時間長を指定する入力を少なくも受け付け、前記ダイジェスト候補の時間長を前記希望時間長にするための前記パラメータの推奨設定値の表示を行う、付記1~6のいずれか一項に記載の情報処理装置。
前記入力受付手段は、出力装置に表示信号を送信することで、前記出力装置に前記表示を実行させる、付記4~7のいずれか一項に記載の情報処理装置。
前記推論手段は、前記素材映像データに含まれる画像に基づき前記重要度に関する推論を行う推論器の推論結果と、前記素材映像データに含まれる音データに基づき前記重要度に関する推論を行う推論器との推論結果とを少なくとも取得する、付記1~8のいずれか一項に記載の情報処理装置。
前記推論手段は、前記素材映像データに含まれる画像の全体領域に基づき前記重要度に関する推論を行う推論器の推論結果と、前記素材映像データに含まれる画像において特定箇所を示す領域に基づき前記重要度に関する推論を行う推論器の推論結果とを少なくとも取得する、付記1~9のいずれか一項に記載の情報処理装置。
コンピュータにより、
入力された映像データに対して重要度に関する推論を行う複数の推論器による素材映像データへの前記推論器毎の推論結果を取得し、
前記推論器毎の推論結果に関するパラメータを指定する入力を受け付け、
前記パラメータと、前記推論器毎の推論結果とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成する、
制御方法。
入力された映像データに対して重要度に関する推論を行う複数の推論器による素材映像データへの前記推論器毎の推論結果を取得する推論手段と、
前記推論器毎の推論結果に関するパラメータを指定する入力を受け付ける入力受付手段と、
前記パラメータと、前記推論器毎の推論結果とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成するダイジェスト候補生成手段
としてコンピュータを機能させるプログラムが格納された記憶媒体。
2 入力装置
3 出力装置
4 記憶装置
5 端末装置
100、100A ダイジェスト生成支援システム
Claims (10)
- 入力された映像データに対して重要度に関する推論を行う複数の推論器による素材映像データへの前記推論器毎の推論結果を取得する推論手段と、
前記推論器毎の推論結果に関するパラメータを指定する入力を受け付け、前記パラメータは前記推論器毎の推論結果を統合した総合スコアに対する閾値に関する情報を含み、前記映像データ対して指定された再生時刻に応じて画像を表示する入力受付手段と、
前記画像が表示された画面に備えられた決定ボタンの選択に応じて、前記パラメータと、前記推論器毎の推論結果とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成するダイジェスト候補生成手段と、
を有する情報処理装置。 - 前記パラメータは、前記推論器毎の推論結果に対する重みに関する情報を少なくとも含み、
前記ダイジェスト候補生成手段は、前記重みと、前記推論器毎の推論結果とに基づき、前記素材映像データから前記ダイジェスト候補を抽出する、請求項1に記載の情報処理装置。 - 前記ダイジェスト候補生成手段は、前記閾値と、前記総合スコアとに基づき、前記素材映像データから前記ダイジェスト候補を抽出する、請求項1または2に記載の情報処理装置。
- 前記入力受付手段は、前記閾値の現在の設定値を明示した前記総合スコアのグラフの表示を行う、請求項3に記載の情報処理装置。
- 前記入力受付手段は、前記総合スコアに対する前記推論器毎の推論結果の寄与分を明示した前記総合スコアのグラフの表示を行う、請求項3または4に記載の情報処理装置。
- 前記入力受付手段は、前記パラメータの現在の設定値に基づき前記ダイジェスト候補が生成された場合の前記ダイジェスト候補の時間長に関する情報の表示を行う、請求項1~5のいずれか一項に記載の情報処理装置。
- 前記入力受付手段は、前記ダイジェスト候補の希望時間長を指定する入力を少なくも受け付け、前記ダイジェスト候補の時間長を前記希望時間長にするための前記パラメータの推奨設定値の表示を行う、請求項1~6のいずれか一項に記載の情報処理装置。
- 前記入力受付手段は、表示装置に表示信号を送信することで、前記表示装置に前記表示を実行させる、請求項4~7のいずれか一項に記載の情報処理装置。
- コンピュータにより、
入力された映像データに対して重要度に関する推論を行う複数の推論器による素材映像データへの前記推論器毎の推論結果を取得し、
前記推論器毎の推論結果に関するパラメータを指定する入力を受け付け、前記パラメータは前記推論器毎の推論結果を統合した総合スコアに対する閾値に関する情報を含み、前記映像データ対して指定された再生時刻に応じて画像を表示し、
前記画像が表示された画面に備えられた決定ボタンの選択に応じて、前記パラメータと、前記推論器毎の推論結果とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成する、制御方法。 - 入力された映像データに対して重要度に関する推論を行う複数の推論器による素材映像データへの前記推論器毎の推論結果を取得する推論手段と、
前記推論器毎の推論結果に関するパラメータを指定する入力を受け付け、前記パラメータは前記推論器毎の推論結果を統合した総合スコアに対する閾値に関する情報を含み、前記映像データ対して指定された再生時刻に応じて画像を表示する入力受付手段と、
前記画像が表示された画面に備えられた決定ボタンの選択に応じて、前記パラメータと、前記推論器毎の推論結果とに基づき、前記素材映像データのダイジェストの候補であるダイジェスト候補を生成するダイジェスト候補生成手段としてコンピュータを機能させるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/021146 WO2021240732A1 (ja) | 2020-05-28 | 2020-05-28 | 情報処理装置、制御方法及び記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021240732A1 JPWO2021240732A1 (ja) | 2021-12-02 |
JPWO2021240732A5 JPWO2021240732A5 (ja) | 2023-02-02 |
JP7452641B2 true JP7452641B2 (ja) | 2024-03-19 |
Family
ID=78723141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022527400A Active JP7452641B2 (ja) | 2020-05-28 | 2020-05-28 | 情報処理装置、制御方法、及び、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230205816A1 (ja) |
JP (1) | JP7452641B2 (ja) |
WO (1) | WO2021240732A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012044390A (ja) | 2010-08-18 | 2012-03-01 | Nippon Telegr & Teleph Corp <Ntt> | 映像要約装置および映像要約プログラム |
JP2013031009A (ja) | 2011-07-28 | 2013-02-07 | Fujitsu Ltd | 情報処理装置、ダイジェスト生成方法、及びダイジェスト生成プログラム |
JP2014229092A (ja) | 2013-05-23 | 2014-12-08 | 株式会社ニコン | 画像処理装置、画像処理方法、および、そのプログラム |
US20170109584A1 (en) | 2015-10-20 | 2017-04-20 | Microsoft Technology Licensing, Llc | Video Highlight Detection with Pairwise Deep Ranking |
JP2019186689A (ja) | 2018-04-06 | 2019-10-24 | キヤノン株式会社 | 情報処理装置、システム、分析方法、コンピュータプログラム、及び記憶媒体 |
CN110933519A (zh) | 2019-11-05 | 2020-03-27 | 合肥工业大学 | 一种基于多路特征的记忆网络视频摘要方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4891737B2 (ja) * | 2006-11-17 | 2012-03-07 | 日本放送協会 | 知識メタデータ生成装置、ダイジェスト生成装置、知識メタデータ生成プログラム、及びダイジェスト生成プログラム |
WO2009035764A2 (en) * | 2007-07-16 | 2009-03-19 | Novafora, Inc. | Method and apparatus for video digest generation |
JP2011223287A (ja) * | 2010-04-09 | 2011-11-04 | Sony Corp | 情報処理装置、情報処理方法、及び、プログラム |
JP5664374B2 (ja) * | 2011-03-17 | 2015-02-04 | 富士通株式会社 | ダイジェスト映像生成装置およびプログラム |
US20160014482A1 (en) * | 2014-07-14 | 2016-01-14 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and Methods for Generating Video Summary Sequences From One or More Video Segments |
US10681391B2 (en) * | 2016-07-13 | 2020-06-09 | Oath Inc. | Computerized system and method for automatic highlight detection from live streaming media and rendering within a specialized media player |
US11277583B2 (en) * | 2019-12-13 | 2022-03-15 | Google Llc | Personalized automatic video cropping |
-
2020
- 2020-05-28 US US17/927,068 patent/US20230205816A1/en active Pending
- 2020-05-28 JP JP2022527400A patent/JP7452641B2/ja active Active
- 2020-05-28 WO PCT/JP2020/021146 patent/WO2021240732A1/ja active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012044390A (ja) | 2010-08-18 | 2012-03-01 | Nippon Telegr & Teleph Corp <Ntt> | 映像要約装置および映像要約プログラム |
JP2013031009A (ja) | 2011-07-28 | 2013-02-07 | Fujitsu Ltd | 情報処理装置、ダイジェスト生成方法、及びダイジェスト生成プログラム |
JP2014229092A (ja) | 2013-05-23 | 2014-12-08 | 株式会社ニコン | 画像処理装置、画像処理方法、および、そのプログラム |
US20170109584A1 (en) | 2015-10-20 | 2017-04-20 | Microsoft Technology Licensing, Llc | Video Highlight Detection with Pairwise Deep Ranking |
JP2019186689A (ja) | 2018-04-06 | 2019-10-24 | キヤノン株式会社 | 情報処理装置、システム、分析方法、コンピュータプログラム、及び記憶媒体 |
CN110933519A (zh) | 2019-11-05 | 2020-03-27 | 合肥工业大学 | 一种基于多路特征的记忆网络视频摘要方法 |
Also Published As
Publication number | Publication date |
---|---|
US20230205816A1 (en) | 2023-06-29 |
JPWO2021240732A1 (ja) | 2021-12-02 |
WO2021240732A1 (ja) | 2021-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4586880B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
EP3040883A1 (en) | Clustering of musical content for playlist creation | |
JP2014106637A (ja) | 情報処理装置および方法、並びにプログラム | |
US11368666B2 (en) | Information processing apparatus, information processing method, and storage medium | |
JP7452641B2 (ja) | 情報処理装置、制御方法、及び、プログラム | |
JP4812733B2 (ja) | 情報編集装置、情報編集方法、情報編集プログラムおよびそのプログラムを記録した記録媒体 | |
JP5764005B2 (ja) | 再生装置および再生方法 | |
JP2007295479A (ja) | 撮影装置および撮影方法、並びにプログラム | |
JP5169239B2 (ja) | 情報処理装置および方法、並びにプログラム | |
KR20180080642A (ko) | 음원과 동기화되는 동영상을 편집하는 방법 | |
JP6934402B2 (ja) | 編集システム | |
KR20170130729A (ko) | 동영상 데이터와 음성 데이터의 자동 편집 방법 및 컴퓨터-판독가능 매체 | |
JP5759253B2 (ja) | 画像再生装置およびその制御方法およびプログラム | |
JP2007295478A (ja) | 撮影装置および撮影方法、並びにプログラム | |
JP7420243B2 (ja) | 情報処理装置、制御方法及びプログラム | |
JP7444250B2 (ja) | 情報処理装置、制御方法、及び、プログラム | |
JP7420242B2 (ja) | 情報処理装置、制御方法及びプログラム | |
JP7451999B2 (ja) | 録画装置、動画システム、録画方法、及びプログラム | |
JP6110731B2 (ja) | ジェスチャーによるコマンド入力識別システム | |
KR102625045B1 (ko) | 영상 편집 장치, 영상 편집 방법 및 컴퓨터 프로그램 | |
CN110262716B (zh) | 一种数据操作方法、装置以及计算机可读存储介质 | |
US20220310126A1 (en) | Information processing device, information processing method, and program | |
EP4174841A1 (en) | Systems and methods for generating a mixed audio file in a digital audio workstation | |
WO2023286367A1 (ja) | 情報処理装置、情報処理方法、プログラム | |
JP2009032039A (ja) | 検索装置および検索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221116 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231024 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240219 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7452641 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |