JP4264028B2 - 要約番組生成装置、及び要約番組生成プログラム - Google Patents
要約番組生成装置、及び要約番組生成プログラム Download PDFInfo
- Publication number
- JP4264028B2 JP4264028B2 JP2004149972A JP2004149972A JP4264028B2 JP 4264028 B2 JP4264028 B2 JP 4264028B2 JP 2004149972 A JP2004149972 A JP 2004149972A JP 2004149972 A JP2004149972 A JP 2004149972A JP 4264028 B2 JP4264028 B2 JP 4264028B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- program
- audio
- frame image
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000605 extraction Methods 0.000 claims description 57
- 238000000034 method Methods 0.000 claims description 52
- 239000000284 extract Substances 0.000 claims description 15
- 238000009825 accumulation Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 23
- 238000003860 storage Methods 0.000 description 19
- 239000013598 vector Substances 0.000 description 14
- 238000010586 diagram Methods 0.000 description 9
- 238000013075 data extraction Methods 0.000 description 8
- 238000000926 separation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Description
本発明は、番組の内容を理解しやすい画像及び音声を効率的に抽出することにより、高精度な要約番組を生成する。具体的に説明すると、例えばドラマ映像及び音声をコンピュータに取り込み、映像の切り替わりを示す部分(以下、「カット点」という。)及びセリフの喋り出し等に基づいて画像を抽出し、抽出した画像及びフレーム情報等からなるデータ(以下「画像データ構造体」)を蓄積する。次に、利用者がグラフィカルユーザインターフェース(以下、GUIという。)上で記録された画像データ構造体の削除あるいは変更等を行い、利用者により設定される画像に対応する画像データ構造体を抽出しドラマの要約を生成する。
以下に、本発明を適用した実施形態について図を用いて説明する。図1は、本発明における要約番組生成装置の一構成例を示す図である。
次に、本実施形態における画像抽出部12の具体的な機能構成例について図を用いて説明する。図2は、本実施形態における画像抽出部の機能構成の一例を示す図である。図2に示す画像抽出部12は、フレーム画像抽出手段21と、カット点検出手段22と、音声開始点検出・画像抽出手段(音声・画像抽出手段)23と、出力候補画像蓄積手段(蓄積手段)24とを有するよう構成されている。
次に、本実施形態における最終出力画像設定部13について、具体的に説明する。最終出力画像設定部13は、画像抽出部12から得られる画像データ構造体を用いて、予め設定される要約番組に出力する枚数や画像サイズ、生成する要約番組の時間等の出力条件や、画像を抽出する際の抽出条件等に基づいて最終的に要約番組の画像として出力する画像の設定を行う。
ここで、最終出力画像設定部13により利用者に表示される設定画面例について図を用いて説明する。図4は、本実施形態における設定画面の一例の図である。図4に示す最終出力設定画面41は、画像設定領域42と、ボタン領域43とを有するよう構成されている。
ここで、本発明における要約番組の生成が実行可能なコンピュータのハードウェア構成例について図を用いて説明する。図9は、本発明における要約番組生成が実現可能なハードウェア構成の一例を示す図である。
次に、実行プログラムにおける処理手順について、フローチャートを用いて説明する。図10は、番組生成処理手順の一例を示すのフローチャートである。まず、入力される映像及び音声からなる番組を入力し、映像データと音声データとに分離する(S01)、次に、S01により分離された映像データを用いてフレーム画像抽出処理を行う(S02)。次に、S01にて分離された音声データとS02により抽出された画像データに基づいて音声データ抽出処理を行う(S03)、また、S03の処理により得られる画像データ構造体を出力候補画像として蓄積する(S04)。なお、上述したフレーム画像抽出処理手順(S02)及び音声データ抽出処理手順(S03)の具体的な処理手順については後述する。
図11は、フレーム画像抽出処理手順の一例を示すフローチャートである。まず、映像データを入力し(S11)、入力した画像から予め設定された時間Tfのフレーム画像の抽出を行う(S12)。次に、抽出したフレーム画像の特徴ベクトルを算出する(S13)。ここで、S13の処理により算出された特徴ベクトルと、前に抽出したフレーム画像の特徴ベクトルとの距離Dを算出し(S14)、予め設定された閾値と距離との比較を行う。具体的には、例えば距離Dが閾値よりも大きいかを判断する(S15)。なお、判断条件はこの限りではない。
次に、音声データ抽出処理について、フローチャートを用いて説明する。図12は、音声データ抽出処理手順を説明するための一例のフローチャートである。まず、音声データを入力し(S21)、更に、上述したフレーム画像抽出処理により得られるフレーム画像を入力する(S22)。次に、フレーム画像の時間情報に対応する時間Tsから予め設定される時間Tssまでの音声データを抽出する(S23)。
11 映像・音声分離部
12 画像抽出部
13 最終出力画像設定部
14 要約番組再生部
21 フレーム画像抽出手段
22 カット点検出手段
23 音声開始点検出・画像抽出手段
24 出力候補画像蓄積手段
31 画像データ構造体
41 最終出力設定画面
42 画像設定領域
43,53 ボタン領域
44 テキストボックス
45 コンボボックス45
46,56 OKボタン
47,57 キャンセルボタン
51 詳細設定画面
52 画像表示領域
54 画面情報表示領域
55 スクロールバー
61,71,72, 画像
62 シーケンス番号
63,82 チェックボックス
64 候補番号
65 移動ボタン
81 表示画像
83 出力画像
91 入力装置
92 出力装置
93 ドライブ装置
94 補助記憶装置
95 メモリ装置
96 CPU
97 ネットワーク接続装置
98 記録媒体
Claims (6)
- 映像及び音声からなる番組から前記映像に含まれる画像を抽出して番組の要約を生成する要約番組生成装置において、
前記映像からフレーム毎に画像データを抽出し、抽出されたフレーム画像の画像データ構造体を生成するフレーム画像抽出手段と、
前記フレーム画像抽出手段により得られる画像データ構造体に基づいて音声データを抽出し、抽出された音声データに基づいて設定されるフレーム画像を抽出する音声・画像抽出手段と、
前記音声・画像抽出手段により得られる前記フレーム画像の画像データ構造体及び前記音声データを蓄積する蓄積手段とを有し、
前記音声・画像抽出手段は、
カット点を含むフレーム画像の時間情報と音声レベルとに基づいて、前記カット点を含むフレーム画像に対応する音声データが出力される時間以降で音声の大きさが設定値以上となる音声データを抽出し、抽出された音声データの時間情報に基づいて、要約の出力候補となるフレーム画像を選定することを特徴とする要約番組生成装置。 - 前記蓄積手段により蓄積された前記画像データ構造体及び前記音声データに基づいて要約の出力画像を設定する設定手段を有し、
前記設定手段は、ユーザに要約の出力画像を設定させるための設定画面を生成し、前記設定画面により設定された画像データ及び該画像データに対応する音声データを出力することを特徴とする請求項1に記載の要約番組生成装置。 - 前記設定手段は、
前記設定画面に前記フレーム画像と、前記フレーム画像を要約の出力画像として出力するかを設定するための設定情報とを、予め設定される前記フレーム画像の抽出条件に基づいて、前記時間情報の時間順に配列させて表示させることを特徴とする請求項2に記載の要約番組生成装置。 - 前記設定手段により得られる画像データ及び該画像データに対応する音声データから要約番組を生成し、生成された要約番組を再生する再生手段を有することを特徴とする請求項1乃至3の何れか1項に記載の要約番組生成装置。
- 前記再生手段は、
前記フレーム画像に対応する音声データが再生される時間よりも先に前記フレーム画像を再生させることを特徴とする請求項4に記載の要約番組生成装置。 - 映像及び音声からなる番組から前記映像に含まれる画像を抽出して番組の要約を生成する処理をコンピュータに実行させるための要約番組生成プログラムにおいて、
コンピュータを、
前記映像からフレーム毎に画像データを抽出し、抽出されたフレーム画像の画像データ構造体を生成するフレーム画像抽出手段、及び、
前記フレーム画像抽出手段により得られる画像データ構造体に基づいて音声データを抽出し、抽出された音声データに基づいて設定されるフレーム画像を抽出する音声・画像抽出手段として機能させ、
前記音声・画像抽出手段は、
カット点を含むフレーム画像の時間情報と音声レベルとに基づいて、前記カット点を含むフレーム画像に対応する音声データが出力される時間以降で音声の大きさが設定値以上となる音声データを抽出し、抽出された音声データの時間情報に基づいて、要約の出力候補となるフレーム画像を選定することを特徴とする要約番組生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004149972A JP4264028B2 (ja) | 2004-05-20 | 2004-05-20 | 要約番組生成装置、及び要約番組生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004149972A JP4264028B2 (ja) | 2004-05-20 | 2004-05-20 | 要約番組生成装置、及び要約番組生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005332486A JP2005332486A (ja) | 2005-12-02 |
JP4264028B2 true JP4264028B2 (ja) | 2009-05-13 |
Family
ID=35487029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004149972A Expired - Lifetime JP4264028B2 (ja) | 2004-05-20 | 2004-05-20 | 要約番組生成装置、及び要約番組生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4264028B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9948862B2 (en) | 2013-11-12 | 2018-04-17 | Casio Computer Co., Ltd. | Data display apparatus which controls display of a plurality of data, image display apparatus which individually displays a series of images, data display method, image display method, and storage medium |
JP5867907B2 (ja) * | 2013-11-12 | 2016-02-24 | カシオ計算機株式会社 | データ表示装置、データ表示方法及びプログラム |
-
2004
- 2004-05-20 JP JP2004149972A patent/JP4264028B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2005332486A (ja) | 2005-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4170808B2 (ja) | 情報表示装置、情報表示方法及びプログラム | |
KR101958664B1 (ko) | 멀티미디어 콘텐츠 재생 시스템에서 다양한 오디오 환경을 제공하기 위한 장치 및 방법 | |
US20130110267A1 (en) | Audio reproducton method and apparatus supporting audio thumbnail function | |
US20160071524A1 (en) | Audio Modification for Multimedia Reversal | |
US10734029B2 (en) | Signal processing apparatus, signal processing method, and non-transitory computer-readable storage medium | |
EP1924092A1 (en) | Content replay apparatus, content reproducing apparatus, content replay method, content reproducing method, program and recording medium | |
JP6641045B1 (ja) | コンテンツ生成システム、及びコンテンツ生成方法 | |
KR101944365B1 (ko) | 콘텐츠 싱크 생성 방법, 그 장치 및 이를 위한 인터페이스 모듈 | |
JP2007336593A (ja) | 情報表示装置、情報表示方法及びプログラム | |
JP5109496B2 (ja) | データ配信装置、データ配信方法およびプログラム | |
JP2007213040A (ja) | オーディオファイル再生装置およびこれを利用したオーディオファイルナビゲーション方法 | |
JP4264028B2 (ja) | 要約番組生成装置、及び要約番組生成プログラム | |
JP2010109852A (ja) | 映像インデクシング方法、映像録画再生装置、及び映像再生装置 | |
JP2005252372A (ja) | ダイジェスト映像作成装置及びダイジェスト映像作成方法 | |
JP5213630B2 (ja) | 映像信号再生装置 | |
JP4342529B2 (ja) | オーサリング支援装置、オーサリング支援方法及びプログラム、並びにオーサリング情報共有システム | |
JP6609795B2 (ja) | 映像音声処理装置、映像音声処理方法およびプログラム | |
JP4929127B2 (ja) | Cm検出方法及びこれを用いた動画再生装置 | |
JP4509188B2 (ja) | 動画再生装置、動画再生方法及びそのコンピュータ・プログラム | |
JP4086886B2 (ja) | 動画再生装置、動画再生方法及びそのコンピュータ・プログラム | |
JP2008312066A (ja) | 字幕付映像再生装置、プログラム | |
JP2005352330A (ja) | 音声分割記録装置 | |
WO2017026387A1 (ja) | 映像処理装置、映像処理方法および記録媒体 | |
JP4335175B2 (ja) | 情報再生装置、情報再生方法及びコンピュータプログラム | |
WO2021255831A1 (ja) | 送信装置、コミュニケーション方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081014 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090120 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090213 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120220 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4264028 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130220 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140220 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |