JP5326910B2 - 情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP5326910B2 JP5326910B2 JP2009177877A JP2009177877A JP5326910B2 JP 5326910 B2 JP5326910 B2 JP 5326910B2 JP 2009177877 A JP2009177877 A JP 2009177877A JP 2009177877 A JP2009177877 A JP 2009177877A JP 5326910 B2 JP5326910 B2 JP 5326910B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- frame
- metadata
- moving image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 140
- 238000003672 processing method Methods 0.000 title claims description 24
- 238000006243 chemical reaction Methods 0.000 claims abstract description 77
- 238000004458 analytical method Methods 0.000 claims abstract description 31
- 230000000694 effects Effects 0.000 claims description 222
- 238000000034 method Methods 0.000 claims description 103
- 238000010191 image analysis Methods 0.000 claims description 82
- 230000008569 process Effects 0.000 claims description 42
- 239000000284 extract Substances 0.000 claims description 25
- 238000007664 blowing Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 162
- 238000012545 processing Methods 0.000 description 48
- 230000004048 modification Effects 0.000 description 34
- 238000012986 modification Methods 0.000 description 34
- 238000004891 communication Methods 0.000 description 31
- 238000003860 storage Methods 0.000 description 31
- 230000006870 function Effects 0.000 description 26
- 230000008859 change Effects 0.000 description 24
- 238000000605 extraction Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 17
- 238000003384 imaging method Methods 0.000 description 14
- 230000007704 transition Effects 0.000 description 14
- 238000004590 computer program Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 7
- 230000033001 locomotion Effects 0.000 description 6
- 241000556720 Manga Species 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000010187 selection method Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/782—Television signal recording using magnetic recording on tape
- H04N5/783—Adaptations for reproducing at a rate different from the recording rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7837—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
- G06F16/784—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
- H04N21/4314—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for fitting data in a restricted space on the screen, e.g. EPG data in a rectangular grid
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Processing Or Creating Images (AREA)
- Television Signal Processing For Recording (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
(1)第1の実施形態
(1−1)コミック表示の概要について
(1−2)情報処理装置の構成について
(1−3)情報処理方法について
(1−4)第1変形例
(2)第2の実施形態
(2−1)情報処理装置の構成について
(2−2)情報処理方法について
(3)第3の実施形態
(3−1)情報処理装置の構成について
(4)本発明の各実施形態に係る情報処理装置のハードウェア構成について
(5)まとめ
<コミック表示の概要について>
まず、本発明の第1の実施形態に係る情報処理装置および情報処理方法について詳細に説明するに先立ち、本実施形態に係る動画のコミック表示の概要について、図1を参照しながら説明する。図1は、本実施形態に係る動画のコミック表示について説明するための説明図である。
以下では、図2〜図22を参照しながら、上述のような動画のコミック表示を実現することが可能な情報処理装置の構成について、詳細に説明する。
まず、図2を参照しながら、本実施形態に係る情報処理装置の全体構成について、詳細に説明する。図2は、本実施形態に係る情報処理装置の構成を説明するためのブロック図である。
続いて、図4〜図6を参照しながら、本実施形態に係る動画解析部103の構成について、詳細に説明する。図4は、本実施形態に係る動画解析部103の構成を説明するためのブロック図であり、図5および図6は、動画メタデータを説明するための説明図である。
次に、図7〜22を参照しながら、本実施形態に係るコミック表示変換部107の構成について、詳細に説明する。まず、図7を参照しながら、コミック表示変換部107の全体構成について、詳細に説明する。図7は、本実施形態に係るコミック表示変換部107の構成を説明するためのブロック図である。
(2)(0.1×FPS×2)≧カメラワークの積分値>(0.1×FPS×1)の場合:n=4
(3)(0.1×FPS×1)≧カメラワークの積分値>(0.1×FPS×0.5)の場合:n=8
(4)(0.1×FPS×0.5)≧カメラワークの積分値の場合:n=12
(2)アニメーション枚数(n)が2枚超過4枚以下の場合:再生速度=2(FPS)
(3)アニメーション枚数(n)が4枚超過8枚以下の場合:再生速度=8(FPS)
(4)アニメーション枚数(n)が8枚超過の場合:再生速度=24(FPS)
続いて、図23〜図29を参照しながら、本実施形態に係る情報処理方法(より具体的には、動画データのコミック表示方法)について、詳細に説明する。図23〜図29は、本実施形態に係る情報処理方法を説明するための流れ図である。
まず、図23を参照しながら、本実施形態に係る情報処理方法の全体的な流れについて、詳細に説明する。
続いて、図24を参照しながら、代表フレーム画像の選択方法の流れについて、詳細に説明する。図24は、本実施形態に係る代表フレーム画像の選択方法を説明するための流れ図である。
次に、図25を参照しながら、カメラワークに応じたアニメーションフレーム画像の選択方法について、詳細に説明する。図25は、カメラワークに応じたアニメーションフレーム画像の選択方法を説明するための流れ図である。
続いて、図26Aおよび図26Bを参照しながら、本実施形態に係る代表フレーム画像の動的配置方法について、詳細に説明する。図26Aおよび図26Bは、本実施形態に係る代表フレーム画像の動的配置方法を説明するための流れ図である。
続いて、図27を参照しながら、カメラワークを考慮した代表フレーム画像の配置方法について、詳細に説明する。図27は、カメラワークを考慮した代表フレーム画像の配置方法を説明するための流れ図である。
次に、図28を参照しながら、カメラワークを考慮したエフェクト画像の配置方法について、詳細に説明する。図28は、カメラワークを考慮したエフェクト画像の配置方法について説明するための流れ図である。
次に、図29を参照しながら、サムネイルアニメーションの再生速度の決定方法について、詳細に説明する。図29は、サムネイルアニメーションの再生速度の決定方法を説明するための流れ図である。
(2)アニメーション枚数(n)が2枚超過4枚以下の場合:再生速度=2(FPS)
(3)アニメーション枚数(n)が4枚超過8枚以下の場合:再生速度=8(FPS)
(4)アニメーション枚数(n)が8枚超過の場合:再生速度=24(FPS)
続いて、本実施形態に係る情報処理装置10の第1変形例について、図30〜図32を参照しながら、詳細に説明する。
まず、本変形例に係る動画解析部103について、図30を参照しつつ詳細に説明する。図30は、本変形例に係る動画解析部103の構成について説明するためのブロック図である。
続いて、図31A〜図31Eおよび図32を参照しながら、本変形例に係るコミック表示変換部107が実施するエフェクト画像の配置処理について、詳細に説明する。図31A〜図31Eおよび図32は、本変形例に係るエフェクト画像の配置方法について説明するための説明図である。
次に、図33〜図37を参照しながら、本発明の第2の実施形態に係る情報処理装置および情報処理方法について、詳細に説明する。本実施形態に係る情報処理装置および情報処理方法は、動画および静止画の解析結果を利用して、動画および静止画の内容を把握するために有効な画像を自動的に抽出し、抽出した画像を内容把握が容易なように表示する。これにより、あるイベントに関する記録が動画と静止画の双方を用いて行われた場合に、動画と静止画の区別を行うことなく、あるイベントの内容を容易に把握することができる。
まず、図33〜図35を参照しながら、本実施形態に係る情報処理装置の構成について、詳細に説明する。図33は、本実施形態に係る情報処理装置の構成を説明するためのブロック図である。図34は、本実施形態に係る静止画解析部1003の構成を説明するためのブロック図であり、図35は、本実施形態に係るコミック表示変換部1005の構成を説明するためのブロック図である。
本実施形態に係る情報処理装置10は、例えば図33に示したように、動画データ取得部101、動画解析部103、音声抽出部105、フレーム画像データ生成部109、コミック表示データ生成部111およびコミック表示実行部113を備える。また、情報処理装置10は、表示制御部115、記憶部117、静止画データ取得部1001、静止画解析部1003およびコミック表示変換部1005を更に備える。なお、情報処理装置10は、これらの各処理部以外にも、例えば任意の通信網を介して任意の装置との間で行なわれる通信を制御する通信制御部(図示せず。)等を有していても良い。
続いて、図34を参照しながら、本実施形態に係る静止画解析部1003の構成について、詳細に説明する。
なお、図34では、静止画解析部1003が、顔検出部1011、人物検出部1013、被写体検出部1015および物体検出部1017を備える場合について図示しているが、静止画解析部1003は、上述の処理部のうちいくつかを備えていてもよい。
次に、図35を参照しながら、本実施形態に係るコミック表示変換部1005の構成について、詳細に説明する。
続いて、図36および図37を参照しながら、本実施形態に係る情報処理方法について、詳細に説明する。図36は、本実施形態に係る情報処理方法の全体的な流れを説明するための流れ図である。図37は、静止画の画像サイズの決定方法を説明するための流れ図である。
まず、図36を参照しながら、本実施形態に係る情報処理方法の全体的な流れについて、詳細に説明する。
続いて、図37を参照しながら、画像サイズ決定部1031で実施される静止画の画像サイズの決定方法について、詳細に説明する。
次に、図38を参照しながら、本発明の第3の実施形態に係る情報処理装置について、詳細に説明する。本実施形態に係る情報処理装置は、静止画の解析結果を利用して、一連の静止画の内容を把握するために有効な画像を自動的に抽出し、抽出した画像を内容把握が容易なように表示する。
図38は、本実施形態に係る情報処理装置の構成を説明するためのブロック図である。
本実施形態に係る情報処理装置10は、例えば図38に示したように、フレーム画像データ生成部109、コミック表示データ生成部111、コミック表示実行部113、表示制御部115および記憶部117を備える。また、本実施形態に係る情報処理装置10は、静止画データ取得部1001、静止画解析部1003およびコミック表示変換部1101を更に備える。
次に、図39を参照しながら、本発明の各実施形態に係る情報処理装置10のハードウェア構成について、詳細に説明する。図39は、本発明の各実施形態に係る情報処理装置10のハードウェア構成を説明するためのブロック図である。
以上説明したように、本手法を用いることで、様々なイベント(例えば、飲み会、旅行など)のプライベートビデオを、漫画のように表示することが可能である。長さ数分程度のプライベートビデオも、コマの大きさにもよるが数ページ程度で表現することができるため、より手短に閲覧することが可能である。また、Flashなどのコンテンツとしてコミック表示データを生成することで、Webブラウザ上などでページをめくりつつ、指定したコマの音声を再生しながら閲覧するようなことも可能である。
101 動画データ取得部
103 動画解析部
105 音声抽出部
107,1005,1101 コミック表示変換部
109 フレーム画像データ生成部
111 コミック表示データ生成部
113 コミック表示実行部
115 表示制御部
117 記憶部
131 動画データ分割部
133,1011 顔検出部
135 シーン遷移検出部
137 カメラワーク検出部
139 音声解析部
141 動画メタデータ生成部
151 ダイジェストスコア算出部
153 サムネイル枚数決定部
155 カメラワークメタデータ利用部
157,1031 画像サイズ決定部
159 コマ画像配置部
161 エフェクト画像配置部
163 コマ情報生成部
1001 静止画データ取得部
1003 静止画解析部
171,1013 人物検出部
173,1015 被写体検出部
175,1017 物体検出部
1019 タイムスタンプ判定部
1021 静止画メタデータ生成部
Claims (19)
- 時刻情報が関連づけられた複数の画像および音声からなる動画のデータである動画データを解析し、当該動画を特徴付ける複数の特徴量に関するメタデータである動画メタデータを生成する動画解析部と、
前記動画メタデータに基づいて前記動画データの中から複数の静止画像を抽出するとともに、所定の表示領域をコマ割りして抽出した複数の静止画像を漫画的に配置変換し、それぞれのコマに配置された静止画像に関する情報を含むコマ情報を生成するコミック表示変換部と、
前記コマ情報と、前記抽出されたそれぞれの静止画像のデータと、前記動画の音声のデータとを少なくとも含むコミック表示データを生成するコミック表示データ生成部と、
を備える、情報処理装置。 - 前記コミック表示変換部は、生成された前記動画メタデータに基づいて、前記それぞれのコマに配置される前記複数の静止画像の大きさを決定する、請求項1に記載の情報処理装置。
- 前記コミック表示変換部は、
前記動画メタデータに基づき、前記動画データを構成する複数の画像それぞれに対して前記複数の特徴量を重み付け加算した値であるダイジェストスコアを算出するダイジェストスコア算出部と、
前記ダイジェストスコアに基づいて前記動画データを構成する複数の画像の中から前記コマに配置するサムネイル画像を抽出し、当該サムネイル画像の枚数を決定するサムネイル枚数決定部と、
前記所定の表示領域に配置されるサムネイル画像の大きさを、前記ダイジェストスコアに基づいて決定する画像サイズ決定部と、
画像サイズが決定された前記サムネイル画像を所定の順序で前記コマに配置するコマ画像配置部と、
サムネイル画像が配置されたコマに関する前記コマ情報を生成するコマ情報生成部と、
を更に備える、請求項2に記載の情報処理装置。 - 前記サムネイル枚数決定部は、抽出された前記サムネイル画像に連続する所定の時間分の複数の画像をアニメーション用の画像として更に抽出する、請求項3に記載の情報処理装置。
- 前記動画メタデータは、前記動画を撮像する際のカメラワークに関する動画メタデータを含み、
前記コミック表示変換部は、前記カメラワークに関する動画メタデータに基づいて、前記サムネイル枚数決定部により前記アニメーション用の画像として抽出される画像の枚数を決定するカメラワークメタデータ利用部を更に備える、請求項4に記載の情報処理装置。 - 前記カメラワークメタデータ利用部は、抽出された前記サムネイル画像から前記カメラワークの積分値が所定の閾値となった時点に対応する画像までの間に存在する複数の画像の中から、前記アニメーション用の画像を選択する、請求項5に記載の情報処理装置。
- 前記カメラワークメタデータ利用部は、前記カメラワークの積分値の大きさに応じて、前記サムネイル画像および前記アニメーション用の画像からなるアニメーションの再生速度を設定する、請求項6に記載の情報処理装置。
- 前記情報処理装置は、静止画に対応するデータである静止画データを解析し、当該静止画を特徴付ける複数の特徴量に関するメタデータである静止画メタデータを生成する静止画解析部を更に備え、
前記画像サイズ決定部は、前記静止画メタデータに基づいて、前記所定の表示領域に配置される前記静止画の大きさを決定する、請求項3に記載の情報処理装置。 - 前記コマ画像配置部は、前記静止画データに関連付けられた当該静止画データの生成された時刻情報に基づいて、前記静止画の配置順序を決定する、請求項8に記載の情報処理装置。
- 前記コミック表示変換部は、前記サムネイル画像が配置されたコマに対して、前記動画メタデータに基づいて吹き出しおよび画面効果の少なくとも何れかを配置するエフェクト画像配置部を更に備える、請求項5に記載の情報処理装置。
- 前記エフェクト画像配置部は、前記動画データに含まれる音声データに関する前記動画メタデータを利用して、前記吹き出しおよび前記画面効果の少なくとも何れかを配置する、請求項10に記載の情報処理装置。
- 前記エフェクト画像配置部は、前記カメラワークに関する動画メタデータを利用して、前記サムネイル画像に対して前記画面効果を配置する、請求項11に記載の情報処理装置。
- 前記画像サイズ決定部は、画像中に顔が存在することを表す前記動画メタデータが存在する画像について、顔が表示されている領域である顔領域を拡大して前記サムネイル画像とする、請求項3に記載の情報処理装置。
- 前記動画メタデータは、画像中に人物が存在することを表す動画メタデータ、画像中に存在する被写体に関する動画メタデータおよび画像中に存在する予め登録された物体に関する動画メタデータの少なくともいずれかを更に含み、
前記エフェクト画像配置部は、前記画像中に人物が存在することを表す動画メタデータ、前記画像中に存在する被写体に関する動画メタデータまたは前記画像中に存在する予め登録された物体に関する動画メタデータに基づいて、前記画面効果を配置する、請求項10に記載の情報処理装置。 - 前記情報処理装置は、静止画に対応するデータである静止画データを解析し、当該静止画を特徴付ける複数の特徴量に関するメタデータである静止画メタデータを生成する静止画解析部を更に備え、
前記静止画メタデータは、画像中に顔が存在することを表す静止画メタデータ、画像中に人物が存在することを表す静止画メタデータ、画像中に存在する被写体に関する静止画メタデータおよび画像中に存在する予め登録された物体に関する静止画メタデータの少なくともいずれかを含み、
前記エフェクト画像配置部は、前記画像中に顔が存在することを表す静止画メタデータ、前記画像中に人物が存在することを表す静止画メタデータ、前記画像中に存在する被写体に関する静止画メタデータまたは前記画像中に存在する予め登録された物体に関する静止画メタデータに基づいて、前記画面効果を配置する、請求項10に記載の情報処理装置。 - 前記エフェクト画像配置部は、前記サムネイル画像のうち所定のオブジェクトが検出された領域の重心と前記所定の表示領域の重心との相対的な位置関係に基づいて、前記所定のオブジェクトが検出された領域以外の領域に前記画面効果を配置する、請求項10に記載の情報処理装置。
- 前記画像サイズ決定部は、画像中に複数の前記顔領域が存在する場合には、全ての前記顔領域を含むように拡大処理を行い前記サムネイル画像とする、請求項13に記載の情報処理装置。
- 時刻情報が関連づけられた複数の画像および音声からなる動画のデータである動画データを解析し、当該動画を特徴付ける特徴量に関するメタデータである動画メタデータを生成するステップと、
前記動画メタデータに基づいて前記動画データの中から複数の静止画像を抽出するとともに、所定の表示領域をコマ割りして抽出した複数の静止画像を漫画的に配置変換し、それぞれのコマに配置された静止画像に関する情報を含むコマ情報を生成するステップと、
前記コマ情報と、前記抽出されたそれぞれの静止画像のデータと、前記動画の音声のデータとを少なくとも含むコミック表示データを生成するステップと、
を含む、情報処理方法。 - コンピュータに、
時刻情報が関連づけられた複数の画像および音声からなる動画のデータである動画データを解析し、当該動画を特徴付ける特徴量に関するメタデータである動画メタデータを生成する動画解析機能と、
前記動画メタデータに基づいて前記動画データの中から複数の静止画像を抽出するとともに、所定の表示領域をコマ割りして抽出した複数の静止画像を漫画的に配置変換し、それぞれのコマに配置された静止画像に関する情報を含むコマ情報を生成するコミック表示変換機能と、
前記コマ情報と、前記抽出されたそれぞれの静止画像のデータと、前記動画の音声のデータとを少なくとも含むコミック表示データを生成するコミック表示データ生成機能と、
を実現させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009177877A JP5326910B2 (ja) | 2009-01-20 | 2009-07-30 | 情報処理装置、情報処理方法およびプログラム |
US12/688,511 US8416332B2 (en) | 2009-01-20 | 2010-01-15 | Information processing apparatus, information processing method, and program |
CN2010100043070A CN101783886B (zh) | 2009-01-20 | 2010-01-20 | 信息处理设备、信息处理方法和程序 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009009920 | 2009-01-20 | ||
JP2009009920 | 2009-01-20 | ||
JP2009177877A JP5326910B2 (ja) | 2009-01-20 | 2009-07-30 | 情報処理装置、情報処理方法およびプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013154347A Division JP5630541B2 (ja) | 2009-01-20 | 2013-07-25 | 情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010191934A JP2010191934A (ja) | 2010-09-02 |
JP5326910B2 true JP5326910B2 (ja) | 2013-10-30 |
Family
ID=42338300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009177877A Expired - Fee Related JP5326910B2 (ja) | 2009-01-20 | 2009-07-30 | 情報処理装置、情報処理方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8416332B2 (ja) |
JP (1) | JP5326910B2 (ja) |
CN (1) | CN101783886B (ja) |
Families Citing this family (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5041229B2 (ja) * | 2007-12-07 | 2012-10-03 | ソニー株式会社 | 学習装置および方法、認識装置および方法、並びにプログラム |
JP5515890B2 (ja) * | 2010-03-15 | 2014-06-11 | オムロン株式会社 | 画像処理装置、画像処理方法、画像処理システム、制御プログラムおよび記録媒体 |
JP2012039523A (ja) * | 2010-08-10 | 2012-02-23 | Sony Corp | 動画像処理装置、動画像処理方法およびプログラム |
JP2012039522A (ja) * | 2010-08-10 | 2012-02-23 | Sony Corp | 動画像処理装置、動画像処理方法およびプログラム |
JP2012060239A (ja) * | 2010-09-06 | 2012-03-22 | Sony Corp | 動画像処理装置、動画像処理方法およびプログラム |
JP5674450B2 (ja) * | 2010-12-22 | 2015-02-25 | 富士フイルム株式会社 | 電子コミックのビューワ装置、電子コミックの閲覧システム、ビューワプログラム、該ビューワプログラムが記録された記録媒体ならびに電子コミックの表示方法 |
KR101244789B1 (ko) * | 2011-05-11 | 2013-03-18 | (주)판도라티비 | 3차원 재구성을 이용한 디지털 만화 콘텐츠 생성 방법 |
JP5760888B2 (ja) * | 2011-09-15 | 2015-08-12 | 株式会社リコー | 表示制御装置と画像形成装置とプログラム |
JP5817400B2 (ja) | 2011-09-30 | 2015-11-18 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP5439455B2 (ja) * | 2011-10-21 | 2014-03-12 | 富士フイルム株式会社 | 電子コミック編集装置、方法及びプログラム |
JP6186775B2 (ja) * | 2012-05-31 | 2017-08-30 | 株式会社リコー | 通信端末、表示方法、及びプログラム |
JP6065913B2 (ja) | 2012-09-03 | 2017-01-25 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP5604700B2 (ja) * | 2012-10-29 | 2014-10-15 | 弘一 関根 | 動き検出用撮像装置、動き検出カメラおよび動き検出システム |
KR20140100784A (ko) * | 2013-02-07 | 2014-08-18 | 삼성전자주식회사 | 디스플레이 장치 및 디스플레이 방법 |
US20160029106A1 (en) * | 2013-03-06 | 2016-01-28 | Zhibo Chen | Pictorial summary of a video |
EP3282716B1 (en) | 2013-03-28 | 2019-11-20 | Dolby Laboratories Licensing Corporation | Rendering of audio objects with apparent size to arbitrary loudspeaker layouts |
JP6369462B2 (ja) * | 2013-05-30 | 2018-08-08 | ソニー株式会社 | クライアント装置、制御方法、システム、およびプログラム |
US20160217699A1 (en) * | 2013-09-02 | 2016-07-28 | Suresh T. Thankavel | Ar-book |
WO2015100518A1 (en) * | 2013-12-31 | 2015-07-09 | Google Inc. | Systems and methods for converting static image online content to dynamic online content |
JP2015130070A (ja) * | 2014-01-07 | 2015-07-16 | 富士通株式会社 | 検出プログラム、検出方法および検出装置 |
USD765690S1 (en) * | 2014-02-11 | 2016-09-06 | Samsung Electronics Co., Ltd. | Display screen or portion thereof with graphical user interface |
CN103810740A (zh) * | 2014-02-27 | 2014-05-21 | 厦门市信达益机电设备有限公司 | 一种连环画制作装置及制作方法 |
JP5791745B1 (ja) * | 2014-03-18 | 2015-10-07 | 株式会社ドワンゴ | 動画配信装置、動画配信方法、及びプログラム |
TWI522888B (zh) * | 2014-03-19 | 2016-02-21 | 宏碁股份有限公司 | 電子裝置及其影像檢視方法 |
CN110083303A (zh) | 2014-05-22 | 2019-08-02 | 索尼公司 | 信息处理设备、信息处理方法与计算机可读介质 |
EP3223516A4 (en) * | 2014-12-15 | 2018-08-01 | Sony Corporation | Information processing method, video processing device, and program |
CN104539942B (zh) * | 2014-12-26 | 2017-07-18 | 江苏赞奇科技股份有限公司 | 基于帧差聚类的视频镜头切换检测方法及其装置 |
KR102306538B1 (ko) | 2015-01-20 | 2021-09-29 | 삼성전자주식회사 | 콘텐트 편집 장치 및 방법 |
KR101650153B1 (ko) * | 2015-03-19 | 2016-08-23 | 네이버 주식회사 | 만화 데이터 편집 방법 및 만화 데이터 편집 장치 |
JP6062474B2 (ja) * | 2015-03-20 | 2017-01-18 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
JP6389801B2 (ja) * | 2015-05-27 | 2018-09-12 | 富士フイルム株式会社 | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
JP6389803B2 (ja) * | 2015-05-27 | 2018-09-12 | 富士フイルム株式会社 | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
US10381022B1 (en) | 2015-12-23 | 2019-08-13 | Google Llc | Audio classifier |
CN105608725A (zh) * | 2015-12-30 | 2016-05-25 | 联想(北京)有限公司 | 一种图像处理方法及电子设备 |
US20170213576A1 (en) * | 2016-01-22 | 2017-07-27 | Artur Nugumanov | Live Comics Capturing Camera |
US10198147B2 (en) * | 2016-03-17 | 2019-02-05 | Samsung Electronics Co., Ltd. | Object management and visualization using a computing device |
JP6819670B2 (ja) | 2016-03-17 | 2021-01-27 | ソニー株式会社 | 画像処理装置と画像処理方法およびプログラム |
CN105898522A (zh) * | 2016-05-11 | 2016-08-24 | 乐视控股(北京)有限公司 | 一种弹幕信息处理方法和装置、系统 |
BR112018074203A2 (pt) * | 2016-05-30 | 2019-05-14 | Sony Corporation | dispositivo e método de processamento audiovisual, e, programa |
US11169661B2 (en) * | 2017-05-31 | 2021-11-09 | International Business Machines Corporation | Thumbnail generation for digital images |
CN108197364B (zh) * | 2017-12-25 | 2021-10-29 | 浙江工业大学 | 一种基于运动片元拼接的多角色人体运动合成方法 |
JP2019133605A (ja) * | 2018-02-02 | 2019-08-08 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
CN110569373B (zh) * | 2018-03-29 | 2022-05-13 | 北京字节跳动网络技术有限公司 | 一种媒体特征的比对方法及装置 |
JP6514386B1 (ja) * | 2018-03-29 | 2019-05-15 | 株式会社スクウェア・エニックス | プログラム、記録媒体及び画像生成方法 |
JP7166796B2 (ja) * | 2018-06-13 | 2022-11-08 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
CN108833992A (zh) * | 2018-06-29 | 2018-11-16 | 北京优酷科技有限公司 | 字幕显示方法及装置 |
KR102086780B1 (ko) * | 2018-08-22 | 2020-03-09 | 네이버웹툰 주식회사 | 만화 데이터 생성 장치, 방법 및 프로그램 |
CN109859298B (zh) * | 2019-03-05 | 2023-06-30 | 腾讯科技(深圳)有限公司 | 一种图像处理方法及其装置、设备和存储介质 |
JP2021009608A (ja) | 2019-07-02 | 2021-01-28 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
JP2021009607A (ja) | 2019-07-02 | 2021-01-28 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
US10929677B1 (en) * | 2019-08-07 | 2021-02-23 | Zerofox, Inc. | Methods and systems for detecting deepfakes |
CN110659393B (zh) * | 2019-09-12 | 2022-10-14 | 河南九商科技有限公司 | 一种xml代码生成方法和系统 |
US11222429B2 (en) * | 2020-01-07 | 2022-01-11 | International Business Machines Corporation | Object movement indication in a video |
CN111429341B (zh) * | 2020-03-27 | 2023-08-18 | 咪咕文化科技有限公司 | 一种视频处理方法、设备及计算机可读存储介质 |
US11288540B2 (en) * | 2020-03-31 | 2022-03-29 | Fujitsu Limited | Integrated clustering and outlier detection using optimization solver machine |
WO2022113293A1 (ja) * | 2020-11-27 | 2022-06-02 | 日本電信電話株式会社 | 画像生成装置、画像生成方法及び画像生成プログラム |
KR102345729B1 (ko) * | 2021-04-08 | 2022-01-03 | 주식회사 닫닫닫 | 영상 생성 방법 및 장치 |
WO2022236651A1 (en) * | 2021-05-11 | 2022-11-17 | Novi Digital Entertainment Private Limited | Method and system for generating smart thumbnails |
CN113946701B (zh) * | 2021-09-14 | 2024-03-19 | 广州市城市规划设计有限公司 | 一种基于图像处理的城乡规划数据的动态更新方法及装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6069622A (en) * | 1996-03-08 | 2000-05-30 | Microsoft Corporation | Method and system for generating comic panels |
JP4142184B2 (ja) * | 1998-12-14 | 2008-08-27 | オリンパス株式会社 | 撮像装置 |
JP2001266159A (ja) * | 2000-03-17 | 2001-09-28 | Toshiba Corp | 物体領域情報生成方法及び物体領域情報生成装置並びに近似多角形生成方法及び近似多角形生成装置 |
JP2004080599A (ja) * | 2002-08-21 | 2004-03-11 | Canon Inc | 画像記録再生装置及びその制御方法 |
JP4095537B2 (ja) | 2003-11-04 | 2008-06-04 | 株式会社国際電気通信基礎技術研究所 | 体験表示装置、体験表示方法及び体験表示プログラム |
JP3976000B2 (ja) * | 2003-11-06 | 2007-09-12 | ソニー株式会社 | 情報処理装置および方法、プログラム記録媒体、プログラム、並びに撮影装置 |
JP4565317B2 (ja) * | 2004-04-12 | 2010-10-20 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP2006099671A (ja) * | 2004-09-30 | 2006-04-13 | Toshiba Corp | 動画像のメタデータの検索テーブル |
JP2006270676A (ja) * | 2005-03-25 | 2006-10-05 | Fujitsu Ltd | パノラマ画像生成プログラム、パノラマ画像生成装置、パノラマ画像生成方法 |
JP2006295236A (ja) * | 2005-04-05 | 2006-10-26 | Sony Corp | 記録再生装置、コンテンツ管理装置、コンテンツ管理方法および撮像装置 |
JP4172507B2 (ja) | 2006-07-13 | 2008-10-29 | ソニー株式会社 | 撮像装置、および撮像装置制御方法、並びにコンピュータ・プログラム |
US20090041352A1 (en) * | 2007-08-10 | 2009-02-12 | Naoki Okamoto | Image formation device, image formation method, and computer-readable recording medium recording image formation program |
US8243076B2 (en) * | 2008-11-05 | 2012-08-14 | Clive Goodinson | System and method for comic creation and editing |
-
2009
- 2009-07-30 JP JP2009177877A patent/JP5326910B2/ja not_active Expired - Fee Related
-
2010
- 2010-01-15 US US12/688,511 patent/US8416332B2/en active Active
- 2010-01-20 CN CN2010100043070A patent/CN101783886B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101783886A (zh) | 2010-07-21 |
US8416332B2 (en) | 2013-04-09 |
US20100182501A1 (en) | 2010-07-22 |
JP2010191934A (ja) | 2010-09-02 |
CN101783886B (zh) | 2013-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5326910B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP5630541B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
TWI579838B (zh) | 編譯視訊的自動產生 | |
TWI375917B (en) | Image processing apparatus, imaging apparatus, image processing method, and computer program | |
TWI388212B (zh) | An image processing apparatus, an image reproduction apparatus, an image processing method, and a memory medium | |
JP4618166B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP4902499B2 (ja) | 画像表示装置、画像表示方法、および画像表示システム | |
JP4774816B2 (ja) | 画像処理装置,画像処理方法,およびコンピュータプログラム。 | |
US20190267040A1 (en) | Information processing method and image processing apparatus | |
JP4640515B2 (ja) | サムネイル生成装置、サムネイル生成方法、及びサムネイル生成プログラム | |
TW201545120A (zh) | 自動產生編譯視訊 | |
US20110243452A1 (en) | Electronic apparatus, image processing method, and program | |
JP2014106637A (ja) | 情報処理装置および方法、並びにプログラム | |
JP2009141821A (ja) | 画像処理装置、動画再生装置、これらにおける処理方法およびプログラム | |
KR20080004368A (ko) | 정보 처리 장치와 방법 및 프로그램 | |
KR20100095363A (ko) | 촬상 장치, 그 제어 방법 및 프로그램 | |
KR20100043138A (ko) | 화상 처리 장치, 동화상 재생 장치, 이들에서의 처리 방법 및 프로그램 | |
KR20100114453A (ko) | 화상 처리 장치, 그 처리 방법 및 프로그램 | |
JP6149862B2 (ja) | 表示制御装置、表示制御システムおよび表示制御方法 | |
CN105556947A (zh) | 用于色彩检测以生成文本色彩的方法和装置 | |
KR20100103776A (ko) | 화상 처리 장치, 동화상 재생 장치, 이것들에 있어서의 처리 방법 및 프로그램 | |
JP2014209707A (ja) | 映像再生装置および映像再生方法 | |
KR102426089B1 (ko) | 전자 장치 및 전자 장치의 요약 영상 생성 방법 | |
JP4667356B2 (ja) | 映像表示装置及びその制御方法、プログラム、記録媒体 | |
JP6602423B2 (ja) | コンテンツ提供サーバ、コンテンツ提供端末及びコンテンツ提供方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120606 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130403 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130409 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130625 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130708 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5326910 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |