JP3325809B2 - 映像制作方法及び装置及びこの方法を記録した記録媒体 - Google Patents
映像制作方法及び装置及びこの方法を記録した記録媒体Info
- Publication number
- JP3325809B2 JP3325809B2 JP22026097A JP22026097A JP3325809B2 JP 3325809 B2 JP3325809 B2 JP 3325809B2 JP 22026097 A JP22026097 A JP 22026097A JP 22026097 A JP22026097 A JP 22026097A JP 3325809 B2 JP3325809 B2 JP 3325809B2
- Authority
- JP
- Japan
- Prior art keywords
- section
- music
- moving image
- video
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Studio Circuits (AREA)
- Television Signal Processing For Recording (AREA)
Description
【0001】
【発明の属する技術分野】本発明は、動画像と音楽を組
み合わせて映像を制作する方法および装置に関するもの
である。その際に問題となる動画像と音楽の時間同期を
自動的に行うため、音楽及び動画像から抽出した特徴点
から同期に用いる基準点を設定し、その基準点に従って
一部を削除する等の操作を行って同期を行う。ただし、
音楽または動画像にある特徴的な内容が含まれている場
合には、一部を削除するなどの操作を行わない区間を動
画像や音楽に与えることで、重要なコンテンツを残した
まま、時間同期が自動的に行われた映像を制作すること
ができ、映像の自動制作といった分野への応用が考えら
れる。
み合わせて映像を制作する方法および装置に関するもの
である。その際に問題となる動画像と音楽の時間同期を
自動的に行うため、音楽及び動画像から抽出した特徴点
から同期に用いる基準点を設定し、その基準点に従って
一部を削除する等の操作を行って同期を行う。ただし、
音楽または動画像にある特徴的な内容が含まれている場
合には、一部を削除するなどの操作を行わない区間を動
画像や音楽に与えることで、重要なコンテンツを残した
まま、時間同期が自動的に行われた映像を制作すること
ができ、映像の自動制作といった分野への応用が考えら
れる。
【0002】
【従来の技術】ディジタル技術の進歩により、映像を放
送局やプロダクション以外の一般の人々が気軽に扱える
ようになった。一般の人々は各々の興味のある対象を小
型ビデオカメラで撮影したり、ネットワークでそれに類
する映像を入手したりして、映像作品を制作することが
可能な時代になっている。
送局やプロダクション以外の一般の人々が気軽に扱える
ようになった。一般の人々は各々の興味のある対象を小
型ビデオカメラで撮影したり、ネットワークでそれに類
する映像を入手したりして、映像作品を制作することが
可能な時代になっている。
【0003】一方で、こうした映像を視聴する側には、
膨大な映像の中から自分に有益な映像を選択する必要が
生じる。そこで、視聴者の目に付きやすいように内容を
要約し、かつ宣伝するための映像を提供する必要があ
る。また、本編にあたる映像作品においても、その冒頭
だけを見て、視聴者が飽きて視聴を止めてしまうことを
防ぐために、興味を惹くような映像を冒頭や途中、乃至
は全編に渡って必要とする。
膨大な映像の中から自分に有益な映像を選択する必要が
生じる。そこで、視聴者の目に付きやすいように内容を
要約し、かつ宣伝するための映像を提供する必要があ
る。また、本編にあたる映像作品においても、その冒頭
だけを見て、視聴者が飽きて視聴を止めてしまうことを
防ぐために、興味を惹くような映像を冒頭や途中、乃至
は全編に渡って必要とする。
【0004】こうした映像は、音楽が付加してあった
り、映像作品の一部を名場面としてつないだりなどの工
夫が凝らされているのが一般的である。これらの映像を
制作するためには、良い動画像素材と良い音楽素材を、
最適に組み合せる必要がある。
り、映像作品の一部を名場面としてつないだりなどの工
夫が凝らされているのが一般的である。これらの映像を
制作するためには、良い動画像素材と良い音楽素材を、
最適に組み合せる必要がある。
【0005】こうした映像は、現在のテレビ番組や映画
における次回予告、上映予告、番組宣伝、または、オー
プニング映像と同等の利用価値が見出されることもあ
る。これらは、本編よりも十分に短く、かつ、本編の魅
力を十分に伝える効果が求められる。これらの映像の作
成方法は、様々なノウハウの積み重ねで作られている
が、なかでも、代表的な制作方法として、映像本編の内
容の雰囲気や魅力を効果的にあらわすテーマを表す音楽
と、本編で用いられた、または、深く関連する映像の一
部を組み合わせて制作する方法である。こうすることで
本編の一部がわかり、かつ、テーマ音楽の利用によって
映像本編の雰囲気を伝える効果を有する。なお、便宜
上、テーマ音楽に動画像情報を付加することで制作され
た映像をテーマ音楽映像と呼ぶ。
における次回予告、上映予告、番組宣伝、または、オー
プニング映像と同等の利用価値が見出されることもあ
る。これらは、本編よりも十分に短く、かつ、本編の魅
力を十分に伝える効果が求められる。これらの映像の作
成方法は、様々なノウハウの積み重ねで作られている
が、なかでも、代表的な制作方法として、映像本編の内
容の雰囲気や魅力を効果的にあらわすテーマを表す音楽
と、本編で用いられた、または、深く関連する映像の一
部を組み合わせて制作する方法である。こうすることで
本編の一部がわかり、かつ、テーマ音楽の利用によって
映像本編の雰囲気を伝える効果を有する。なお、便宜
上、テーマ音楽に動画像情報を付加することで制作され
た映像をテーマ音楽映像と呼ぶ。
【0006】上述のテーマ音楽映像を初めとする動画像
と音楽との組み合せによる映像の作成には、まず素材と
して利用する音楽と動画像が重要となる。次に、音楽と
動画像の時間長が一致していることが最低条件である。
さらに、音楽のメロディの変化や音量の変化と共にシー
ンが変化する等の工夫が行われている方がより完成度の
高い映像になることが知られている。
と音楽との組み合せによる映像の作成には、まず素材と
して利用する音楽と動画像が重要となる。次に、音楽と
動画像の時間長が一致していることが最低条件である。
さらに、音楽のメロディの変化や音量の変化と共にシー
ンが変化する等の工夫が行われている方がより完成度の
高い映像になることが知られている。
【0007】例えば、テーマ音楽映像の制作において、
従来の映像制作プロダクション等では、全てを人手を用
いて制作、編集している。しかし、これは本編に加えて
新たに一本の作品を構成することと等しい。
従来の映像制作プロダクション等では、全てを人手を用
いて制作、編集している。しかし、これは本編に加えて
新たに一本の作品を構成することと等しい。
【0008】そこで、テーマ音楽映像の制作を目的の一
つとして、映像中の音楽、人の声、等を分類し、映像中
のより重要な部分を自動的に抽出して映像のダイジェス
トを制作する試みが(Enhanced Video
Handling based on Audio A
nalysis:K.Minami,A.Akuts
u,H.Hamada,Y.Tonomura:Pro
ceedings ofthe IEEE Multi
media Computing and Syste
ms 1997,p.219)によって行われている。
しかし、こうした自動処理によって作成された映像は、
最適な動画像や音楽が素材として選択されているとは言
い難く、次回予告や番組宣伝などの目的を十分満たして
いるとは言い難い。すなわち、素材の選択には、内容把
握の能力が必要となるため、自動化が困難な面がある。
つとして、映像中の音楽、人の声、等を分類し、映像中
のより重要な部分を自動的に抽出して映像のダイジェス
トを制作する試みが(Enhanced Video
Handling based on Audio A
nalysis:K.Minami,A.Akuts
u,H.Hamada,Y.Tonomura:Pro
ceedings ofthe IEEE Multi
media Computing and Syste
ms 1997,p.219)によって行われている。
しかし、こうした自動処理によって作成された映像は、
最適な動画像や音楽が素材として選択されているとは言
い難く、次回予告や番組宣伝などの目的を十分満たして
いるとは言い難い。すなわち、素材の選択には、内容把
握の能力が必要となるため、自動化が困難な面がある。
【0009】テーマ音楽映像の場合には、その素材とな
る動画像は、本編の動画像から選択すれば良いだけなの
で、従来の映像作品の制作とは異なって素材を集めると
いう労力は軽減され人手を介しても十分容易に行うこと
ができる。しかし、それら素材を編集する作業は従来と
同様の困難が伴う。編集作業の労力を軽減する目的で作
成されたノンリニア編集機は、頭出しや反復して表示す
るなどの編集作業時の労力を軽減する目的には対応して
いるが、音楽と動画像に工夫を加えながら自動的に同期
する機能はない。
る動画像は、本編の動画像から選択すれば良いだけなの
で、従来の映像作品の制作とは異なって素材を集めると
いう労力は軽減され人手を介しても十分容易に行うこと
ができる。しかし、それら素材を編集する作業は従来と
同様の困難が伴う。編集作業の労力を軽減する目的で作
成されたノンリニア編集機は、頭出しや反復して表示す
るなどの編集作業時の労力を軽減する目的には対応して
いるが、音楽と動画像に工夫を加えながら自動的に同期
する機能はない。
【0010】
【発明が解決しようとする課題】上述したように動画像
と音楽を組み合せによる映像の作成のための従来技術の
問題点は、映像の作成に用いる良い素材を自動抽出でき
ないこと、と、素材としての音楽及び動画像を簡単に同
期させる機能が不十分であることの2点があげられる。
しかし、素材の選択方法は非常に困難を伴うため、自動
化することは困難である。従って、本発明ではこれは取
り上げない。
と音楽を組み合せによる映像の作成のための従来技術の
問題点は、映像の作成に用いる良い素材を自動抽出でき
ないこと、と、素材としての音楽及び動画像を簡単に同
期させる機能が不十分であることの2点があげられる。
しかし、素材の選択方法は非常に困難を伴うため、自動
化することは困難である。従って、本発明ではこれは取
り上げない。
【0011】本発明は、前述した問題点のうちの素材を
編集し映像を制作する処理における問題点である音楽と
動画像の同期処理及び同期の際に良い映像ができるよう
な工夫を含めた編集処理、すなわち自動同期を行う映像
制作方法および装置を実現することを課題とし、その課
題を解決するためのものである。
編集し映像を制作する処理における問題点である音楽と
動画像の同期処理及び同期の際に良い映像ができるよう
な工夫を含めた編集処理、すなわち自動同期を行う映像
制作方法および装置を実現することを課題とし、その課
題を解決するためのものである。
【0012】
【課題を解決するための手段】前述の課題解決のため、
本発明は、以下の(1)〜(13)の発明によって利用
者が音楽と動画像をあらかじめ選択した後、音楽と動画
像からより効果的な映像を作成しつつ、自動的に音楽と
動画像の同期を行なうことを可能にする。
本発明は、以下の(1)〜(13)の発明によって利用
者が音楽と動画像をあらかじめ選択した後、音楽と動画
像からより効果的な映像を作成しつつ、自動的に音楽と
動画像の同期を行なうことを可能にする。
【0013】(1)の発明は、動画像と音楽を組み合わ
せて、音楽付き映像を制作する映像制作方法または装置
において、音楽からあらかじめ定められた一種類乃至は
複数種類の特徴的なイベントが発生したことを示す特徴
点を算出しておく音楽特徴点算出工程または音楽特徴点
算出部と、利用者が対象としたい音楽区間を指定する音
楽指定工程または音楽指定部と、動画像からあらかじめ
定められた一種類乃至は複数種類の特徴的なイベントが
発生したことを示す特徴点を算出しておく動画像特徴点
算出工程または動画像特徴点算出部と、利用者が対象と
したい動画像区間を指定する動画像指定工程または動画
像指定部と、指定された該音楽区間に、指定された該動
画像区間を組み合わせて映像を構成するために必要な時
間長を、該音楽区間に含まれる特徴点を基準点として該
動画像区間を時間同期させて切り替えるとともに、該切
り替えた動画像区間の一部を削除してあわせる時間長調
整工程または時間長調整部と、時間長を調整した該音楽
区間と該動画像区間を組み合わせて構成された映像を保
存、表示する映像保存表示工程または映像保存表示部
と、を具備することを特徴とする。
せて、音楽付き映像を制作する映像制作方法または装置
において、音楽からあらかじめ定められた一種類乃至は
複数種類の特徴的なイベントが発生したことを示す特徴
点を算出しておく音楽特徴点算出工程または音楽特徴点
算出部と、利用者が対象としたい音楽区間を指定する音
楽指定工程または音楽指定部と、動画像からあらかじめ
定められた一種類乃至は複数種類の特徴的なイベントが
発生したことを示す特徴点を算出しておく動画像特徴点
算出工程または動画像特徴点算出部と、利用者が対象と
したい動画像区間を指定する動画像指定工程または動画
像指定部と、指定された該音楽区間に、指定された該動
画像区間を組み合わせて映像を構成するために必要な時
間長を、該音楽区間に含まれる特徴点を基準点として該
動画像区間を時間同期させて切り替えるとともに、該切
り替えた動画像区間の一部を削除してあわせる時間長調
整工程または時間長調整部と、時間長を調整した該音楽
区間と該動画像区間を組み合わせて構成された映像を保
存、表示する映像保存表示工程または映像保存表示部
と、を具備することを特徴とする。
【0014】あるいは、動画像と音楽を組み合わせて、
音楽付き映像を制作する映像制作方法または装置におい
て、音楽からあらかじめ定められた一種類乃至は複数種
類の特徴的なイベントが発生したことを示す特徴点を算
出しておく音楽特徴点算出工程または音楽特徴点算出部
と、利用者が対象としたい音楽区間を指定する音楽指定
工程または音楽指定部と、動画像からあらかじめ定めら
れた一種類乃至は複数種類の特徴的なイベントが発生し
たことを示す特徴点を算出しておく動画像特徴点算出工
程または動画像特徴点算出部と、利用者が対象としたい
動画像区間を指定する動画像指定工程または動画像指定
部と、指定された該音楽区間に、指定された該動画像区
間を組み合わせて映像を構成するために必要な時間長
を、該動画像区間に含まれる特徴点を基準点として該音
楽区間を時間同期させて切り替えるとともに、該切り替
えた音楽区間の一部を削除してあわせる時間長調整工程
または時間長調整部と、時間長を調整した該音楽区間と
該動画像区間を組み合わせて構成された映像を保存、表
示する映像保存表示工程または映像保存表示部と、を具
備することを特徴とする。
音楽付き映像を制作する映像制作方法または装置におい
て、音楽からあらかじめ定められた一種類乃至は複数種
類の特徴的なイベントが発生したことを示す特徴点を算
出しておく音楽特徴点算出工程または音楽特徴点算出部
と、利用者が対象としたい音楽区間を指定する音楽指定
工程または音楽指定部と、動画像からあらかじめ定めら
れた一種類乃至は複数種類の特徴的なイベントが発生し
たことを示す特徴点を算出しておく動画像特徴点算出工
程または動画像特徴点算出部と、利用者が対象としたい
動画像区間を指定する動画像指定工程または動画像指定
部と、指定された該音楽区間に、指定された該動画像区
間を組み合わせて映像を構成するために必要な時間長
を、該動画像区間に含まれる特徴点を基準点として該音
楽区間を時間同期させて切り替えるとともに、該切り替
えた音楽区間の一部を削除してあわせる時間長調整工程
または時間長調整部と、時間長を調整した該音楽区間と
該動画像区間を組み合わせて構成された映像を保存、表
示する映像保存表示工程または映像保存表示部と、を具
備することを特徴とする。
【0015】この(1)の発明により、音楽付き映像を
制作する際の素材となる音楽と動画像とを選択し、より
効果的な映像となるように時間同期をとってこれらを組
み合わせて構成することで、効果的な映像の制作、表
示、保存を可能とする。また、音楽と動画像からなる映
像を制作する際に、音楽及び動画像の両素材をより効果
的な同期をとる際に必要な基準点に用いる特徴的なイベ
ントが発生したことを示す特徴点を算出できる。また、
これらの特徴点は素材に用いる情報区間の選択にも有効
利用できるため、効果的な映像制作を可能とする。ま
た、音楽から抽出された特徴点を動画像切り替えの為の
基準点に用いるため、音楽の変化にあわせて動画像のシ
ーンチェンジを発生させることを可能にし、完成度の高
い映像の制作を可能にしている。
制作する際の素材となる音楽と動画像とを選択し、より
効果的な映像となるように時間同期をとってこれらを組
み合わせて構成することで、効果的な映像の制作、表
示、保存を可能とする。また、音楽と動画像からなる映
像を制作する際に、音楽及び動画像の両素材をより効果
的な同期をとる際に必要な基準点に用いる特徴的なイベ
ントが発生したことを示す特徴点を算出できる。また、
これらの特徴点は素材に用いる情報区間の選択にも有効
利用できるため、効果的な映像制作を可能とする。ま
た、音楽から抽出された特徴点を動画像切り替えの為の
基準点に用いるため、音楽の変化にあわせて動画像のシ
ーンチェンジを発生させることを可能にし、完成度の高
い映像の制作を可能にしている。
【0016】(2)の発明は、(1)の発明の映像制作
方法または装置における前記時間長調整工程または時間
長調整部では、該動画像区間の時間短縮を目的とした削
除を行う場合において、該動画像区間の削除を禁止する
区間を設ける機能を有すること、または該音楽区間の時
間短縮を目的とした削除を行う場合において、該音楽区
間の削除を禁止する区間を設ける機能を有することを特
徴とする。
方法または装置における前記時間長調整工程または時間
長調整部では、該動画像区間の時間短縮を目的とした削
除を行う場合において、該動画像区間の削除を禁止する
区間を設ける機能を有すること、または該音楽区間の時
間短縮を目的とした削除を行う場合において、該音楽区
間の削除を禁止する区間を設ける機能を有することを特
徴とする。
【0017】(3)の発明は、(2)の発明の映像制作
方法または装置における時間長調整工程または時間長調
整部において、該動画像区間における時間短縮を目的と
した削除を禁止する区間を設ける場合に、その区間を動
画像区間に含まれる特徴点を基に設定すること、また
は、該音楽区間における時間短縮を目的とした削除を禁
止する区間を設ける場合に、その区間を音楽区間に含ま
れる特徴点を基に設定することを特徴とする。
方法または装置における時間長調整工程または時間長調
整部において、該動画像区間における時間短縮を目的と
した削除を禁止する区間を設ける場合に、その区間を動
画像区間に含まれる特徴点を基に設定すること、また
は、該音楽区間における時間短縮を目的とした削除を禁
止する区間を設ける場合に、その区間を音楽区間に含ま
れる特徴点を基に設定することを特徴とする。
【0018】これらの(2),(3)の発明により、時
間同期のための時間短縮を目的とした動画像の一部の削
除において、より重要と思われるカメラワークや動き被
写体が存在している動画像の削除を防ぐことが可能とな
る。従って、より効果的な映像を作成できる。
間同期のための時間短縮を目的とした動画像の一部の削
除において、より重要と思われるカメラワークや動き被
写体が存在している動画像の削除を防ぐことが可能とな
る。従って、より効果的な映像を作成できる。
【0019】(4)の発明は、(1)〜(3)のいずれ
かの発明の映像制作方法または装置において、前記音楽
特徴点算出工程または音楽特徴点算出部では、特徴的な
イベントとして音量極点、同一音量継続区間、周波数分
布変曲点、周波数類似区間の一種類以上が発生したこと
を示す特徴点を算出しておくことを特徴とする。
かの発明の映像制作方法または装置において、前記音楽
特徴点算出工程または音楽特徴点算出部では、特徴的な
イベントとして音量極点、同一音量継続区間、周波数分
布変曲点、周波数類似区間の一種類以上が発生したこと
を示す特徴点を算出しておくことを特徴とする。
【0020】(5)の発明は、(1)〜(4)のいずれ
かの発明の映像制作方法または装置において、前記動画
像特徴点算出工程または動画像特徴点算出部では、特徴
的なイベントとしてシーン変化点、カメラワーク、動き
被写体の有無、動き被写体の領域の大きさ、動き被写体
の速度の一種類以上が発生したことを示す特徴点を算出
しておくことを特徴とする。
かの発明の映像制作方法または装置において、前記動画
像特徴点算出工程または動画像特徴点算出部では、特徴
的なイベントとしてシーン変化点、カメラワーク、動き
被写体の有無、動き被写体の領域の大きさ、動き被写体
の速度の一種類以上が発生したことを示す特徴点を算出
しておくことを特徴とする。
【0021】これらの(4),(5)の発明により、時
間同期のための時間短縮を目的とした動画像の一部の削
除や削除の禁止において、より重要性を考慮した動画像
や音声の削除や削除の禁止が可能となる。従って、より
効果的な映像を作成できる。
間同期のための時間短縮を目的とした動画像の一部の削
除や削除の禁止において、より重要性を考慮した動画像
や音声の削除や削除の禁止が可能となる。従って、より
効果的な映像を作成できる。
【0022】(6)の発明は、(1)〜(5)のいずれ
かの発明の映像制作方法または装置にける動画像指定工
程または動画像指定部において、動画像区間の指定に際
して、あらかじめ抽出された該特徴点を基準に、一つ乃
至複数の動画像区間を選択することを特徴とする。この
発明により、複数の動画像を抽出することで、映像作品
の様々な動画像の一部ずつを抽出して利用することがで
きる。
かの発明の映像制作方法または装置にける動画像指定工
程または動画像指定部において、動画像区間の指定に際
して、あらかじめ抽出された該特徴点を基準に、一つ乃
至複数の動画像区間を選択することを特徴とする。この
発明により、複数の動画像を抽出することで、映像作品
の様々な動画像の一部ずつを抽出して利用することがで
きる。
【0023】なお、以上の(1)〜(6)の発明におけ
る映像制作装置は、(1)〜(6)の発明における映像
制作方法を実施することを可能としている。
る映像制作装置は、(1)〜(6)の発明における映像
制作方法を実施することを可能としている。
【0024】(7)の発明は、コンピュータに、(1)
〜(6)のいずれかの発明の映像制作方法を機能させる
ための処理プログラムを、コンピュータが読み取り可能
な媒体に記録した記録媒体であり、(1)〜(6)の発
明の映像制作方法ないしそれに準ずるアルゴリズムを記
述した処理プログラムやそれに準ずるコンピュータ制御
方法を、コンピュータに与え、制御、実行、処理させる
ことで、実現することが可能である。なお、上記は、処
理プログラムやそれに準ずるコンピュータ制御方法を、
コンピュータが実行する際に読み出すことが可能なディ
スク等やそれに準ずる記録媒体に格納されていることを
示す。
〜(6)のいずれかの発明の映像制作方法を機能させる
ための処理プログラムを、コンピュータが読み取り可能
な媒体に記録した記録媒体であり、(1)〜(6)の発
明の映像制作方法ないしそれに準ずるアルゴリズムを記
述した処理プログラムやそれに準ずるコンピュータ制御
方法を、コンピュータに与え、制御、実行、処理させる
ことで、実現することが可能である。なお、上記は、処
理プログラムやそれに準ずるコンピュータ制御方法を、
コンピュータが実行する際に読み出すことが可能なディ
スク等やそれに準ずる記録媒体に格納されていることを
示す。
【0025】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態を詳しく説明する。
の形態を詳しく説明する。
【0026】本発明の第1の実施形態例として、音楽と
動画像によって映像を制作する映像制作方法についての
その流れ図を図1に示す。本映像制作方法は、入力され
る音楽1及び動画像2から、それぞれ音楽特徴点算出工
程11及び動画像特徴点算出工程12によってそれぞれ
の特徴点を算出する。そして、算出された特徴点の一部
乃至全部をインデクスとして双方の情報に付加する。こ
れによって、インデクス付き音楽情報3及びインデクス
付き動画像情報4を得る。このインデクス付き音楽情報
3及びインデクス付き動画像情報4からそれぞれ利用者
が、音楽区間指定工程13及び動画像区間指定工程14
によって、利用したい音楽区間5と動画像区間6を指定
する。それぞれ指定された音楽区間5及び動画像区間6
に対して、同期をとって時間長を適合させるため、それ
ぞれのインデクス同士を基準に同期を行う。この際に行
われる時間長調整工程15では、様々なアプローチがあ
るが、音楽区間5乃至動画像区間6の一方乃至双方から
一部を削除し、時間長をあわせ、最適な切り替えのタイ
ミングで双方の情報区間を同期させることを目的として
いる。なお、一方的に動画像区間6を削除しても良い
し、逆に一方的に音楽区間5を削除しても良い。また、
情報区間の時間長に応じて適宜変更しても構わない。時
間長を同期をさせるための制御信号として同期信号7を
出力後、映像保存表示工程16にて、同期信号7を基
に、指定された音楽区間5及び動画像区間6から音楽と
動画像からなる映像8を出力する。
動画像によって映像を制作する映像制作方法についての
その流れ図を図1に示す。本映像制作方法は、入力され
る音楽1及び動画像2から、それぞれ音楽特徴点算出工
程11及び動画像特徴点算出工程12によってそれぞれ
の特徴点を算出する。そして、算出された特徴点の一部
乃至全部をインデクスとして双方の情報に付加する。こ
れによって、インデクス付き音楽情報3及びインデクス
付き動画像情報4を得る。このインデクス付き音楽情報
3及びインデクス付き動画像情報4からそれぞれ利用者
が、音楽区間指定工程13及び動画像区間指定工程14
によって、利用したい音楽区間5と動画像区間6を指定
する。それぞれ指定された音楽区間5及び動画像区間6
に対して、同期をとって時間長を適合させるため、それ
ぞれのインデクス同士を基準に同期を行う。この際に行
われる時間長調整工程15では、様々なアプローチがあ
るが、音楽区間5乃至動画像区間6の一方乃至双方から
一部を削除し、時間長をあわせ、最適な切り替えのタイ
ミングで双方の情報区間を同期させることを目的として
いる。なお、一方的に動画像区間6を削除しても良い
し、逆に一方的に音楽区間5を削除しても良い。また、
情報区間の時間長に応じて適宜変更しても構わない。時
間長を同期をさせるための制御信号として同期信号7を
出力後、映像保存表示工程16にて、同期信号7を基
に、指定された音楽区間5及び動画像区間6から音楽と
動画像からなる映像8を出力する。
【0027】図2は、本実施形態の映像制作方法を実施
する映像制作装置の一実施形態例の構成の概要を示すブ
ロック線図であり、21は音楽入力バッファ、22は動
画像入力バッファであり、それぞれ音楽1及び動画像2
を保管しておくバッファである。なお、音楽1及び動画
像2は、あらかじめデジタルデータ化されているもので
あり、様々な圧縮形式で圧縮されていても良く、ランダ
ムなアクセスが可能であれば良い。したがって本ブロッ
ク線図上では、便宜上バッファとしているが、CD−R
OMやハードディスク等のデジタルデータを保管する記
録メディアであっても良い。
する映像制作装置の一実施形態例の構成の概要を示すブ
ロック線図であり、21は音楽入力バッファ、22は動
画像入力バッファであり、それぞれ音楽1及び動画像2
を保管しておくバッファである。なお、音楽1及び動画
像2は、あらかじめデジタルデータ化されているもので
あり、様々な圧縮形式で圧縮されていても良く、ランダ
ムなアクセスが可能であれば良い。したがって本ブロッ
ク線図上では、便宜上バッファとしているが、CD−R
OMやハードディスク等のデジタルデータを保管する記
録メディアであっても良い。
【0028】情報入力バッファに格納された音楽1及び
動画像2を、それぞれの特徴的なイベントを表す特徴点
を算出するために、音楽特徴量算出部23及び動画像特
徴量算出部24へ入力する。なお、音楽1を解析して得
られる特徴的なイベントとは、音量変化、周波数変化、
等であり、動画像2で得られる特徴的なイベントとは、
シーン変化点、カメラワーク、動き被写体の有無、動き
被写体の領域の大きさや速度等である。音楽特徴量算出
部23及び動画像特徴量算出部24についてはその詳細
を後述する。
動画像2を、それぞれの特徴的なイベントを表す特徴点
を算出するために、音楽特徴量算出部23及び動画像特
徴量算出部24へ入力する。なお、音楽1を解析して得
られる特徴的なイベントとは、音量変化、周波数変化、
等であり、動画像2で得られる特徴的なイベントとは、
シーン変化点、カメラワーク、動き被写体の有無、動き
被写体の領域の大きさや速度等である。音楽特徴量算出
部23及び動画像特徴量算出部24についてはその詳細
を後述する。
【0029】音楽特徴量算出部23と動画像特徴量算出
部24にて算出された特徴点をインデクスとして、それ
ぞれの情報に付加することで、インデクス付き音楽情報
3及びインデクス付き動画像情報4を得る。音楽と動画
像から成る映像の作成にあたっては、利用者が素材とし
て利用したい音楽1と動画像2のうちの一部を選択、指
定する必要がある。音楽1と動画像2のうちの一部の指
定にあたっては、タイムコード等の時間情報だけを手が
かりとして指定しても良いし、撮影した場所や時刻等の
情報を手がかりとしても良い。しかし、ある程度の単位
にあらかじめ分類されている方が区間単位で選択しやす
いため、本実施形態例では、インデクス付き音楽情報3
及びインデクス付き動画像情報4のそれぞれのインデク
スを分類の手がかりとし、利用者が指定しやすいよう
に、インデクス毎に分類した結果を音楽区間分類表示部
25及び動画像区間分類表示部26にて行う。利用者2
7は、利用者指示部28を通じて、インデクスによって
分類表示された動画像及び音楽から映像として利用した
い音楽区間5と動画像区間6をそれぞれ音楽区間指定部
29及び動画像区間指定部30によって指定する。
部24にて算出された特徴点をインデクスとして、それ
ぞれの情報に付加することで、インデクス付き音楽情報
3及びインデクス付き動画像情報4を得る。音楽と動画
像から成る映像の作成にあたっては、利用者が素材とし
て利用したい音楽1と動画像2のうちの一部を選択、指
定する必要がある。音楽1と動画像2のうちの一部の指
定にあたっては、タイムコード等の時間情報だけを手が
かりとして指定しても良いし、撮影した場所や時刻等の
情報を手がかりとしても良い。しかし、ある程度の単位
にあらかじめ分類されている方が区間単位で選択しやす
いため、本実施形態例では、インデクス付き音楽情報3
及びインデクス付き動画像情報4のそれぞれのインデク
スを分類の手がかりとし、利用者が指定しやすいよう
に、インデクス毎に分類した結果を音楽区間分類表示部
25及び動画像区間分類表示部26にて行う。利用者2
7は、利用者指示部28を通じて、インデクスによって
分類表示された動画像及び音楽から映像として利用した
い音楽区間5と動画像区間6をそれぞれ音楽区間指定部
29及び動画像区間指定部30によって指定する。
【0030】次に、指定された両区間5,6を時間長調
整部31にて同期を取る。動画像区間5または音楽区間
6の一部を除去し、つなげ、同期を行う処理が必要とさ
れる。この詳細な方法については、後述する。時間長調
整部31では、音楽区間5及び動画像区間6をどのよう
なタイミングでそれぞれ再生させると効果的な映像にな
るを考慮して同期を行う。この再生を行うべきタイミン
グを時間調長整部31から同期信号7として出力する。
この同期信号7に基いて、音楽区間5と動画像区間6を
互いにどのタイミングで区間の先頭乃至途中から区間の
途中乃至最後までを再生させ、メモリ32へ出力する。
この出力メモリ32には、テーマ音楽付き映像8が格納
されており、利用者27が利用者指示部28を介して行
った指示に従って、再生表示部33で映像8を再生した
り、ファイル等として保存したりするといった処理を行
なう。
整部31にて同期を取る。動画像区間5または音楽区間
6の一部を除去し、つなげ、同期を行う処理が必要とさ
れる。この詳細な方法については、後述する。時間長調
整部31では、音楽区間5及び動画像区間6をどのよう
なタイミングでそれぞれ再生させると効果的な映像にな
るを考慮して同期を行う。この再生を行うべきタイミン
グを時間調長整部31から同期信号7として出力する。
この同期信号7に基いて、音楽区間5と動画像区間6を
互いにどのタイミングで区間の先頭乃至途中から区間の
途中乃至最後までを再生させ、メモリ32へ出力する。
この出力メモリ32には、テーマ音楽付き映像8が格納
されており、利用者27が利用者指示部28を介して行
った指示に従って、再生表示部33で映像8を再生した
り、ファイル等として保存したりするといった処理を行
なう。
【0031】なお、上述の実施形態例で映像素材の指定
を行う音楽区間指定部29と動画像区間指定部30にお
いて、音楽に時間連続性を持たせた映像を制作したい場
合には、指定される音楽区間5は時間的に連続した音楽
の一部乃至全部であることが望ましく、動画像区間6
は、動画像2から切り出した時間的に異なる短い区間を
複数個指定する方が映像の制作が容易となる。一方で、
動画像に連続性を持たせた映像を制作したい場合には、
上述の例と全く逆の特性を持つように区間を指定する方
が制作が容易となる。そこで、利用者指示部28で、音
楽、動画像のいずれに連続性を持たせた映像を制作した
いかという指示を利用者に指定させ、その指定にかなう
ような区間指定を行わせるような機能を含んでも良い。
を行う音楽区間指定部29と動画像区間指定部30にお
いて、音楽に時間連続性を持たせた映像を制作したい場
合には、指定される音楽区間5は時間的に連続した音楽
の一部乃至全部であることが望ましく、動画像区間6
は、動画像2から切り出した時間的に異なる短い区間を
複数個指定する方が映像の制作が容易となる。一方で、
動画像に連続性を持たせた映像を制作したい場合には、
上述の例と全く逆の特性を持つように区間を指定する方
が制作が容易となる。そこで、利用者指示部28で、音
楽、動画像のいずれに連続性を持たせた映像を制作した
いかという指示を利用者に指定させ、その指定にかなう
ような区間指定を行わせるような機能を含んでも良い。
【0032】以下、上述した音楽特徴量算出部23の詳
細について述べ、図3に音楽特徴量算出部23を実現す
る場合のブロック線図の例を示す。この例で、音楽特徴
量算出部23は、音量極点算出部41と、同一音音量継
続区間算出部42と、周波数分布算出部43と、周波数
分布相関算出部44を具備する。
細について述べ、図3に音楽特徴量算出部23を実現す
る場合のブロック線図の例を示す。この例で、音楽特徴
量算出部23は、音量極点算出部41と、同一音音量継
続区間算出部42と、周波数分布算出部43と、周波数
分布相関算出部44を具備する。
【0033】音楽特徴点はインデクスとしても用いら
れ、時間長を調節し同期をとる際の基準点として用いら
れる。本実施形態例では、音量のパワー変化の際の極大
点、極小点、最大点及び最小点45、と、音量が一定し
ている区間である同一音量区間の開始点及び終了点4
6、周波数分布変曲点47、周波数分布類似区間の開始
点、終了点48、を特徴的なイベントが発生した特徴点
として用いる。これら特徴点として用いる例を図4に示
す。
れ、時間長を調節し同期をとる際の基準点として用いら
れる。本実施形態例では、音量のパワー変化の際の極大
点、極小点、最大点及び最小点45、と、音量が一定し
ている区間である同一音量区間の開始点及び終了点4
6、周波数分布変曲点47、周波数分布類似区間の開始
点、終了点48、を特徴的なイベントが発生した特徴点
として用いる。これら特徴点として用いる例を図4に示
す。
【0034】それぞれの特徴点算出の具体的な方法を以
下に述べる。図4は、この一連の特徴点算出のプロセス
を、音声波形101から周波数分布103、周波数分布
の個数変化104、周波数分布の相関107を通じて説
明している。
下に述べる。図4は、この一連の特徴点算出のプロセス
を、音声波形101から周波数分布103、周波数分布
の個数変化104、周波数分布の相関107を通じて説
明している。
【0035】音量変化の極大点、極小点、最大点、最小
点については、音量極点算出部41により、音量分布1
02での音量の変化を追跡し、その変化から算出するこ
とができる。
点については、音量極点算出部41により、音量分布1
02での音量の変化を追跡し、その変化から算出するこ
とができる。
【0036】また、同一音量区間の開始点と終了点につ
いては、同一音量継続区間算出部42により、音量分布
102での音量変化を追跡し、単位時間当たりの変化の
微分値を計算し、微分値が十分0に近い区間がどの程度
続くかを観察することで算出することができる。
いては、同一音量継続区間算出部42により、音量分布
102での音量変化を追跡し、単位時間当たりの変化の
微分値を計算し、微分値が十分0に近い区間がどの程度
続くかを観察することで算出することができる。
【0037】周波数変曲点については、周波数分布算出
部43により、FFT等によって得られた周波数分布1
03をサンプリングしたもの(単位時間当たりの分布1
06)から、高周波数領域である閾値105を上回るパ
ワーをもつ周波数帯域の個数と、低周波領域である閾値
105を上回るパワーをもつ周波数帯域との個数とを比
較し、それぞれの周波数分布の個数の差分を算出し、個
数の+,−の値が変化した点を周波数変曲点としてい
る。この周波数変曲点は、周波数分布103の変化を表
していることになり、高周波数成分主体の音楽から低周
波数成分主体の音楽への移行やその逆の移行を示し、曲
調の変化を反映しやすい。
部43により、FFT等によって得られた周波数分布1
03をサンプリングしたもの(単位時間当たりの分布1
06)から、高周波数領域である閾値105を上回るパ
ワーをもつ周波数帯域の個数と、低周波領域である閾値
105を上回るパワーをもつ周波数帯域との個数とを比
較し、それぞれの周波数分布の個数の差分を算出し、個
数の+,−の値が変化した点を周波数変曲点としてい
る。この周波数変曲点は、周波数分布103の変化を表
していることになり、高周波数成分主体の音楽から低周
波数成分主体の音楽への移行やその逆の移行を示し、曲
調の変化を反映しやすい。
【0038】周波数分布類似区間の開始点及び終了点に
ついては、周波数分布相関算出部44により、単位時間
当たりの周波数分布の相関106の高い区間の開始点と
終了点としている。分布が類似している区間は同一メロ
ディが連続して何度も繰り返されていることになる重要
な区間だと思われるため、その開始点、終了点を特徴点
としている。
ついては、周波数分布相関算出部44により、単位時間
当たりの周波数分布の相関106の高い区間の開始点と
終了点としている。分布が類似している区間は同一メロ
ディが連続して何度も繰り返されていることになる重要
な区間だと思われるため、その開始点、終了点を特徴点
としている。
【0039】次に、上述した動画像特徴点算出部24の
詳細について述べ、図5に動画像特徴点算出工程12を
実現するための動画像特徴点算出部24のブロック線図
の例を示す。本例で、動画像特徴点算出部12は、シー
ン変化算出部51と、カメラワーク算出部52と、動き
被写体算出部53とを具備する。
詳細について述べ、図5に動画像特徴点算出工程12を
実現するための動画像特徴点算出部24のブロック線図
の例を示す。本例で、動画像特徴点算出部12は、シー
ン変化算出部51と、カメラワーク算出部52と、動き
被写体算出部53とを具備する。
【0040】動画像特徴点はインデクスとしても用いる
ことができ、時間長を調節する際に、同期を取る際の基
準点や時間短縮のために行う削除を禁止する動画像区間
の範囲の選択にも利用される。本実施形態例では、シー
ン変化点54とカメラワークの開始点及び終了点55、
動き被写体の出現点及び消滅点56、動き被写体の領域
の大きさと速度を算出する。なお、これら特徴点の例を
図6に示す。
ことができ、時間長を調節する際に、同期を取る際の基
準点や時間短縮のために行う削除を禁止する動画像区間
の範囲の選択にも利用される。本実施形態例では、シー
ン変化点54とカメラワークの開始点及び終了点55、
動き被写体の出現点及び消滅点56、動き被写体の領域
の大きさと速度を算出する。なお、これら特徴点の例を
図6に示す。
【0041】それぞれの特徴点の算出するための具体的
な方法について述べる。
な方法について述べる。
【0042】シーン変化の検出は、シーン変化算出部5
1により、連続する動画像の類似度を算出し、大きく類
似度が変化したところをシーン変化として算出する(図
6(a))。
1により、連続する動画像の類似度を算出し、大きく類
似度が変化したところをシーン変化として算出する(図
6(a))。
【0043】カメラワークに関しては、カメラワーク算
出部52により、連続する画像中で対応する注目点同士
を追跡する。注目点同士の間の距離と方向が画面全体で
均一だった場合には、カメラワークがあったと判定す
る。こうして、カメラワークの有無を判定し、同一シー
ン内でのカメラワークの開始点および終了点を決定でき
る(図6(b))。
出部52により、連続する画像中で対応する注目点同士
を追跡する。注目点同士の間の距離と方向が画面全体で
均一だった場合には、カメラワークがあったと判定す
る。こうして、カメラワークの有無を判定し、同一シー
ン内でのカメラワークの開始点および終了点を決定でき
る(図6(b))。
【0044】動き被写体の有無については、動き被写体
算出部53により、動き被写体領域をカメラワークの有
無の抽出方法と同様の方法で抽出する。ただし、カメラ
ワークの場合と動き被写体の場合で異なる点は、画像間
で類似している注目点同士の距離と方向の分布が、カメ
ラワークの場合は、画面全体に出現するのに対し、動き
被写体の場合には、これらの分布がある時空間の特定の
部分に集中する点である。そこで、注目点同士の距離と
方向の分布をみて、類似している分布がある時空間に集
中的に出現している場合は、動き被写体が存在すると判
定する。動き被写体の有無から、同一シーン内での動き
被写体出現点及び消滅点を決定することができる(図6
(c))。また動き被写体の有無が判定された、動き被
写体の領域の速度と大きさを特徴量として算出すること
ができる。
算出部53により、動き被写体領域をカメラワークの有
無の抽出方法と同様の方法で抽出する。ただし、カメラ
ワークの場合と動き被写体の場合で異なる点は、画像間
で類似している注目点同士の距離と方向の分布が、カメ
ラワークの場合は、画面全体に出現するのに対し、動き
被写体の場合には、これらの分布がある時空間の特定の
部分に集中する点である。そこで、注目点同士の距離と
方向の分布をみて、類似している分布がある時空間に集
中的に出現している場合は、動き被写体が存在すると判
定する。動き被写体の有無から、同一シーン内での動き
被写体出現点及び消滅点を決定することができる(図6
(c))。また動き被写体の有無が判定された、動き被
写体の領域の速度と大きさを特徴量として算出すること
ができる。
【0045】以上のようにして、音楽及び動画像から特
徴点を算出し、インデクスとして各情報に付加すること
で、インデクス付き音楽情報3及びインデクス付き動画
像情報4を得る。
徴点を算出し、インデクスとして各情報に付加すること
で、インデクス付き音楽情報3及びインデクス付き動画
像情報4を得る。
【0046】次に、インデクス付き音楽情報3及びイン
デクス付き動画像情報4から利用者27によって指定さ
れた音楽区間5及び動画像区間6を同期させて映像を制
作する時間長調整部31に関する詳細な説明を加える。
デクス付き動画像情報4から利用者27によって指定さ
れた音楽区間5及び動画像区間6を同期させて映像を制
作する時間長調整部31に関する詳細な説明を加える。
【0047】時間長調整部31では、音楽区間と動画像
区間の双方ないし一方から区間の一部を除去する処理を
行っている。その場合には、音楽を動画像に同期させる
ために、音楽の方を一方的に除去する、乃至は、その逆
など様々な場合を考えることができる。
区間の双方ないし一方から区間の一部を除去する処理を
行っている。その場合には、音楽を動画像に同期させる
ために、音楽の方を一方的に除去する、乃至は、その逆
など様々な場合を考えることができる。
【0048】ただし、本実施形態例では、映像と音楽を
組み合せて制作させる際の最も簡単な実施形態例とし
て、テーマ音楽に複数の動画像を付加させる例を取り上
げて、説明を行う。従って、本実施形態例の場合、音楽
区間における音楽は、時系列上での連続性を重んじて、
除去されることはないものとする一方で、動画像に関し
ては、適宜音楽との同期を行うため、その一部を除去す
ることにしている。この場合の実施形態例の説明図を図
7から図10で示す。また、説明を簡単に行うため、音
楽の連続性を重視するための条件として、音楽区間5
は、音楽1のある連続する区間が選択されているものと
し、動画像区間6は、動画像2の時間的に不連続な複数
の区間が選択され、かつ、音楽区間の時間長よりも、動
画像区間の時間長の累計の方が短いとする。
組み合せて制作させる際の最も簡単な実施形態例とし
て、テーマ音楽に複数の動画像を付加させる例を取り上
げて、説明を行う。従って、本実施形態例の場合、音楽
区間における音楽は、時系列上での連続性を重んじて、
除去されることはないものとする一方で、動画像に関し
ては、適宜音楽との同期を行うため、その一部を除去す
ることにしている。この場合の実施形態例の説明図を図
7から図10で示す。また、説明を簡単に行うため、音
楽の連続性を重視するための条件として、音楽区間5
は、音楽1のある連続する区間が選択されているものと
し、動画像区間6は、動画像2の時間的に不連続な複数
の区間が選択され、かつ、音楽区間の時間長よりも、動
画像区間の時間長の累計の方が短いとする。
【0049】まず、映像の作成の際に用いる素材とし
て、音楽区間5と、動画像区間6が与えられる。その与
えられ方は、一つの音楽に対し、複数の動画像情報、シ
ーン1、シーン2、…、シーンNまでが与えられる。
て、音楽区間5と、動画像区間6が与えられる。その与
えられ方は、一つの音楽に対し、複数の動画像情報、シ
ーン1、シーン2、…、シーンNまでが与えられる。
【0050】それぞれ選択された情報を基に音楽に同期
させて動画像の時間長を調整する。図7の例では、音楽
情報インデクス同士の間にあたる音楽パートの時間長に
あわせて、動画像情報の各シーンを同期させている。動
画像情報のシーンの時間長が音楽パートよりも長けれ
ば、動画像情報のシーンの一部を削除し、動画像情報の
シーンの時間長の方が短ければ、対象としている動画像
情報の次のシーンとあわせて同期をとるというルールを
用いている。また、カメラワークと動き被写体がある場
合には動画像の削除を行わないという禁則処理も行なっ
ている。この条件下での処理プロセスをより詳細に説明
する。
させて動画像の時間長を調整する。図7の例では、音楽
情報インデクス同士の間にあたる音楽パートの時間長に
あわせて、動画像情報の各シーンを同期させている。動
画像情報のシーンの時間長が音楽パートよりも長けれ
ば、動画像情報のシーンの一部を削除し、動画像情報の
シーンの時間長の方が短ければ、対象としている動画像
情報の次のシーンとあわせて同期をとるというルールを
用いている。また、カメラワークと動き被写体がある場
合には動画像の削除を行わないという禁則処理も行なっ
ている。この条件下での処理プロセスをより詳細に説明
する。
【0051】まず、音楽区間の先頭と音楽情報インデク
ス1の間にあたるパート1に、複数の動画像区間の先頭
区間にあたるシーン1を付加させる。このとき、動画像
区間のシーン1の時間長が対象としている音楽区間の時
間長よりも長いので、シーン1の一部のみを付加させ
る。この場合、シーン1には特に動画像インデクスがな
いため、先頭からパート1と同じ時間長分だけ切り出
す。
ス1の間にあたるパート1に、複数の動画像区間の先頭
区間にあたるシーン1を付加させる。このとき、動画像
区間のシーン1の時間長が対象としている音楽区間の時
間長よりも長いので、シーン1の一部のみを付加させ
る。この場合、シーン1には特に動画像インデクスがな
いため、先頭からパート1と同じ時間長分だけ切り出
す。
【0052】次に、インデクス1とインデクス2に挟ま
れたパート2に対して、動画像区間を同期させる試みを
行う。この場合、同期に用いる動画像区間にあたるシー
ン2の時間長は、パート2の時間長よりも短いため、シ
ーン2だけでなく、次のシーン3を用いてパート2に同
期させる。シーン2とシーン3をあわせた時間長とパー
ト2の時間長を比較し、映像区間が十分な長さであれ
ば、シーン2の先頭からシーン3の途中のパート2と同
じ時間長さ分を切り出す。
れたパート2に対して、動画像区間を同期させる試みを
行う。この場合、同期に用いる動画像区間にあたるシー
ン2の時間長は、パート2の時間長よりも短いため、シ
ーン2だけでなく、次のシーン3を用いてパート2に同
期させる。シーン2とシーン3をあわせた時間長とパー
ト2の時間長を比較し、映像区間が十分な長さであれ
ば、シーン2の先頭からシーン3の途中のパート2と同
じ時間長さ分を切り出す。
【0053】次に、音楽区間のパート3に動画像区間を
付加させる。パート3に対応する動画像区間は、図1の
場合、それまでの動画像区間の利用から、シーン4が第
一の候補となる。この実施形態例では、パート1とシー
ン1の場合と同様、シーン4の時間長の方がパート3の
時間長よりも長いので、シーン4の一部を切り出して、
パート3に同期させる。しかし、シーン4には、カメラ
ワークが存在するというインデクスが含まれている。そ
こで、カメラワークに関わる部分には、時間短縮のため
の削除を行わないと言う禁則処理を適用し、先頭からカ
メラワーク以前の前半部分の一部を切り出したシーン4
をパート3に同期させる。これは、カメラワークには重
要と思われる情報が含まれており、さらにカメラワーク
後の画像の方により重要な情報が含まれているといわれ
ていることから、上述の処理を適用する。
付加させる。パート3に対応する動画像区間は、図1の
場合、それまでの動画像区間の利用から、シーン4が第
一の候補となる。この実施形態例では、パート1とシー
ン1の場合と同様、シーン4の時間長の方がパート3の
時間長よりも長いので、シーン4の一部を切り出して、
パート3に同期させる。しかし、シーン4には、カメラ
ワークが存在するというインデクスが含まれている。そ
こで、カメラワークに関わる部分には、時間短縮のため
の削除を行わないと言う禁則処理を適用し、先頭からカ
メラワーク以前の前半部分の一部を切り出したシーン4
をパート3に同期させる。これは、カメラワークには重
要と思われる情報が含まれており、さらにカメラワーク
後の画像の方により重要な情報が含まれているといわれ
ていることから、上述の処理を適用する。
【0054】パート4に対するシーン5の同期処理で
は、カメラワークではなく、動き被写体を含む場合を示
している。シーン4と同様に動き被写体を含む動画像部
分をシーン5から切り出して、パート4に同期させてい
る。ただし、動き被写体の場合には、カメラワークの終
了時と異なり、動き被写体を含む領域に加えて、その前
後時間長が等しくなるような区間を、パート4の時間長
分だけシーン5から切り出して、パート4に同期させて
いる。これにより、音楽区間と同期のとれた映像を得
る。
は、カメラワークではなく、動き被写体を含む場合を示
している。シーン4と同様に動き被写体を含む動画像部
分をシーン5から切り出して、パート4に同期させてい
る。ただし、動き被写体の場合には、カメラワークの終
了時と異なり、動き被写体を含む領域に加えて、その前
後時間長が等しくなるような区間を、パート4の時間長
分だけシーン5から切り出して、パート4に同期させて
いる。これにより、音楽区間と同期のとれた映像を得
る。
【0055】以上の処理の結果、図7の例では、音楽区
間と動画像区間の同期によって映像(動画像情報71)
を得ることができた。
間と動画像区間の同期によって映像(動画像情報71)
を得ることができた。
【0056】次に、別の例を図8にて示す。これは、音
楽区間のパート11、パート12に動画像区間のシーン
11を同期させる方法である。この例では、音楽区間の
パート11とパート12をあわせた時間長よりも動画像
区間シーン11の方の時間長の方が長い場合である。こ
の場合、シーン11に含まれているカメラワークを途中
で切断するような同期の方法は行わず、音楽区間のパー
ト11とパート12を含めて、カメラワークを含めた同
期を行うこととする。
楽区間のパート11、パート12に動画像区間のシーン
11を同期させる方法である。この例では、音楽区間の
パート11とパート12をあわせた時間長よりも動画像
区間シーン11の方の時間長の方が長い場合である。こ
の場合、シーン11に含まれているカメラワークを途中
で切断するような同期の方法は行わず、音楽区間のパー
ト11とパート12を含めて、カメラワークを含めた同
期を行うこととする。
【0057】また、別の例を図9にて示す。これは、音
楽区間のパート21、パート22、パート23に、動画
像区間のシーン21、シーン22を同期させる場合であ
る。このときパート21の時間長は、シーン21の時間
長よりも長い為、パート21に同期させる動画像区間と
してシーン22までを用いる。しかし、シーン22の大
半には動き被写体を多く含み、シーン21とシーン22
中の動き被写体部分を含んだ時間長は、パート21の時
間長よりも長く、このままでは同期が不可能であるの
で、図7の例に基いて、パート21とパート22とパー
ト23にシーン21とシーン22を用いて同期を行うこ
とを提案している。なお、それ以上に動画像区間の時間
長が、音楽区間の時間長よりも長い場合には、パート2
1を含めて同期を行うことにしている。すなわち、図9
に示したように、音楽区間において必ず同期が取れるよ
うに、音楽区間のパートないし動画像区間のシーンの部
分を逐次延長していき、最終的に動画像区間の一部を削
ることで、同期がとれる処理を行う。
楽区間のパート21、パート22、パート23に、動画
像区間のシーン21、シーン22を同期させる場合であ
る。このときパート21の時間長は、シーン21の時間
長よりも長い為、パート21に同期させる動画像区間と
してシーン22までを用いる。しかし、シーン22の大
半には動き被写体を多く含み、シーン21とシーン22
中の動き被写体部分を含んだ時間長は、パート21の時
間長よりも長く、このままでは同期が不可能であるの
で、図7の例に基いて、パート21とパート22とパー
ト23にシーン21とシーン22を用いて同期を行うこ
とを提案している。なお、それ以上に動画像区間の時間
長が、音楽区間の時間長よりも長い場合には、パート2
1を含めて同期を行うことにしている。すなわち、図9
に示したように、音楽区間において必ず同期が取れるよ
うに、音楽区間のパートないし動画像区間のシーンの部
分を逐次延長していき、最終的に動画像区間の一部を削
ることで、同期がとれる処理を行う。
【0058】以上の図7から図9のように、シーンの一
部を削っていくと、想定したよりもシーンの組み合わせ
による動画像区間の時間長が短縮されてしまう場合があ
る。その場合には、シーンの中で最も多く削ったシーン
について、シーンの構成を見直し、削除を行わず、パー
トの延長を行うことにする。図10に示すように一度削
ったものを基に戻して再度検討をする。図10では、パ
ート31、パート32に、シーン31、シーン32をあ
わせるため、シーン32の一部を除去している。その場
合、動画像区間がなくなってしまい、パート33にあわ
せる動画像区間が存在しないことになってしまう(74
の時間長調整中動画像情報)。そのような場合には、パ
ート32にあわせて、シーン32の一部を削ることな
く、パート32とパート33とをあわせて、シーン32
を削るようにしている(75の時間長調整後動画像情
報)。この補正は、全パート及び全シーンが終了した時
点で、同期がうまく取れなかった場合に行われる。ただ
し、後述するように、ある音楽区間及びある動画像区間
を必ず同期させるような指示が与えられた場合には、そ
の同期情報より前とその同期情報よりも後にわけてそれ
ぞれ時間長調整処理を行う。
部を削っていくと、想定したよりもシーンの組み合わせ
による動画像区間の時間長が短縮されてしまう場合があ
る。その場合には、シーンの中で最も多く削ったシーン
について、シーンの構成を見直し、削除を行わず、パー
トの延長を行うことにする。図10に示すように一度削
ったものを基に戻して再度検討をする。図10では、パ
ート31、パート32に、シーン31、シーン32をあ
わせるため、シーン32の一部を除去している。その場
合、動画像区間がなくなってしまい、パート33にあわ
せる動画像区間が存在しないことになってしまう(74
の時間長調整中動画像情報)。そのような場合には、パ
ート32にあわせて、シーン32の一部を削ることな
く、パート32とパート33とをあわせて、シーン32
を削るようにしている(75の時間長調整後動画像情
報)。この補正は、全パート及び全シーンが終了した時
点で、同期がうまく取れなかった場合に行われる。ただ
し、後述するように、ある音楽区間及びある動画像区間
を必ず同期させるような指示が与えられた場合には、そ
の同期情報より前とその同期情報よりも後にわけてそれ
ぞれ時間長調整処理を行う。
【0059】図7から図10で示した例は、映像制作方
法の一つの実施形態例であり、その時間調整のルールに
は他にも様々なバリエーションが考えられる。
法の一つの実施形態例であり、その時間調整のルールに
は他にも様々なバリエーションが考えられる。
【0060】図7から図10の例では、音楽情報インデ
クスの音量の最大、最小、極小、極大点、同一音量継続
区間の開始点、終了点、周波数変曲点の全てのインデク
スの全てのインデクスの間に含まれるものをパートとし
てみなした。そうではなく、極大点だけを基準としてパ
ートを分割する等の例も考えられる。
クスの音量の最大、最小、極小、極大点、同一音量継続
区間の開始点、終了点、周波数変曲点の全てのインデク
スの全てのインデクスの間に含まれるものをパートとし
てみなした。そうではなく、極大点だけを基準としてパ
ートを分割する等の例も考えられる。
【0061】動画像インデクスでは、シーン変化を一つ
の単位とし、同期の基準とし、動画像情報から必要な情
報を抜き出す際に、カメラワークのある部分や動き被写
体のある場合には、一部の除去を行わないことにした
が、実際には、この限りでなく、カメラワークや動き被
写体のある間でも、一部を削除して構わない。
の単位とし、同期の基準とし、動画像情報から必要な情
報を抜き出す際に、カメラワークのある部分や動き被写
体のある場合には、一部の除去を行わないことにした
が、実際には、この限りでなく、カメラワークや動き被
写体のある間でも、一部を削除して構わない。
【0062】また、インデクスとして、上述したインデ
クス以外を用いても構わない。また、利用者等の指定に
よって特定のパートに特定のシーンを必ず同期させると
いった指定も例としてあげられる、特定のシーンに関し
ては、パートの時間長に関わらず、その一部を削除し、
切り抜いて同期するのではなく、必ず利用するなどの指
定が考えられる。
クス以外を用いても構わない。また、利用者等の指定に
よって特定のパートに特定のシーンを必ず同期させると
いった指定も例としてあげられる、特定のシーンに関し
ては、パートの時間長に関わらず、その一部を削除し、
切り抜いて同期するのではなく、必ず利用するなどの指
定が考えられる。
【0063】こうしたルールのバリエーションを持たせ
ることで、より完成度の高い映像を制作することが可能
となる。
ることで、より完成度の高い映像を制作することが可能
となる。
【0064】なお、上述の映像制作装置において、時間
長調整部31は、音楽区間と動画像区間を組み合わせて
いる。その際に、音楽区間に基準点を設定し、かつ、動
画像区間のあらかじめ指定された条件を除いて削除する
ことにより、音楽区間と動画像区間の同期を行なってい
る。利用者27が利用者指示部28を介することで、基
準点とするインデクスや、削除をおこわない動画像の特
定の区間を指定しても良い。一方で、必ず同期させる音
楽区間と動画像区間を設定するなどしてもよい。また、
自動的な同期が行われた後、その結果に操作を加えるな
どの拡張を行っても良い。本実施形態例では、素材とす
る音楽区間及び動画像区間はそれぞれオリジナルな情報
があるとしているが、複数の素材から任意に選択する等
の拡張も構わない。
長調整部31は、音楽区間と動画像区間を組み合わせて
いる。その際に、音楽区間に基準点を設定し、かつ、動
画像区間のあらかじめ指定された条件を除いて削除する
ことにより、音楽区間と動画像区間の同期を行なってい
る。利用者27が利用者指示部28を介することで、基
準点とするインデクスや、削除をおこわない動画像の特
定の区間を指定しても良い。一方で、必ず同期させる音
楽区間と動画像区間を設定するなどしてもよい。また、
自動的な同期が行われた後、その結果に操作を加えるな
どの拡張を行っても良い。本実施形態例では、素材とす
る音楽区間及び動画像区間はそれぞれオリジナルな情報
があるとしているが、複数の素材から任意に選択する等
の拡張も構わない。
【0065】本発明では、音楽と動画像から映像を自動
制作するために、各区間を指定し、時間長調整部にて音
楽と同期をとっている。時間長調整部では、双方の同期
を行う際に一方の情報から他方の情報の切り替え基準点
を設定し、その部分で切り替えるような設定を与えてい
る。その処理過程において、情報の一部を削除する場合
には、その内容を特徴量から推定し、削除することを防
ぐといった禁則処理を設けている。
制作するために、各区間を指定し、時間長調整部にて音
楽と同期をとっている。時間長調整部では、双方の同期
を行う際に一方の情報から他方の情報の切り替え基準点
を設定し、その部分で切り替えるような設定を与えてい
る。その処理過程において、情報の一部を削除する場合
には、その内容を特徴量から推定し、削除することを防
ぐといった禁則処理を設けている。
【0066】この時間長調整部における時間同期と禁則
処理を応用した他の実施形態例も考えられる。上述の実
施形態例では、あらかじめ素材を全て選択した段階で時
間長調整部に全素材を投入しているが、逐次素材が投入
される毎に最適な時間同期を自動的に行うという逐次時
間同期を時間長調整部において適用も可能である。
処理を応用した他の実施形態例も考えられる。上述の実
施形態例では、あらかじめ素材を全て選択した段階で時
間長調整部に全素材を投入しているが、逐次素材が投入
される毎に最適な時間同期を自動的に行うという逐次時
間同期を時間長調整部において適用も可能である。
【0067】例えば、ノンリニア編集機では、音楽、動
画像、の適当な区間をGUI(グラフィカル ユーザ
インタフェース)を通じて逐次配置することで映像を徐
々に構築している。そこで、一つ一つの音楽や動画像が
与えられた際、与えられた音楽及び動画像の内容を特徴
量から推測し、すでに過去に与えられた音楽や動画像の
情報とを自動的に時間同期させる。例えば、動画像が与
えられていて、さらに音楽が与えられた際に、音楽のメ
ロディやリズムの変わり目を自動検出する。実際に音楽
がある時系列上に配置したい際に、既に時系列上に配置
された動画像からあらかじめ検出されているシーンチェ
ンジが時系列上の近傍に存在したら、そこにあわせて自
動的に配置するとといった応用例も考えられる。
画像、の適当な区間をGUI(グラフィカル ユーザ
インタフェース)を通じて逐次配置することで映像を徐
々に構築している。そこで、一つ一つの音楽や動画像が
与えられた際、与えられた音楽及び動画像の内容を特徴
量から推測し、すでに過去に与えられた音楽や動画像の
情報とを自動的に時間同期させる。例えば、動画像が与
えられていて、さらに音楽が与えられた際に、音楽のメ
ロディやリズムの変わり目を自動検出する。実際に音楽
がある時系列上に配置したい際に、既に時系列上に配置
された動画像からあらかじめ検出されているシーンチェ
ンジが時系列上の近傍に存在したら、そこにあわせて自
動的に配置するとといった応用例も考えられる。
【0068】この実施形態例を、本発明の第2の実施形
態例として以下に説明する。本実施形態例を構成するブ
ロック線図を図11に示す。
態例として以下に説明する。本実施形態例を構成するブ
ロック線図を図11に示す。
【0069】従来のノンリニア編集機と同様に時間情報
を基に編集に用いる動画像区間5及び音楽区間6を切り
出す。次に、それら区間をタイムコードをベースとした
編集フィールドに配置する前にそれら区間から特徴的な
イベントを算出し、特徴点を算出し、インデクスとして
動画像及び音楽に付加して、インデクス付き音楽情報3
乃至インデクス付き動画像情報4を得る。
を基に編集に用いる動画像区間5及び音楽区間6を切り
出す。次に、それら区間をタイムコードをベースとした
編集フィールドに配置する前にそれら区間から特徴的な
イベントを算出し、特徴点を算出し、インデクスとして
動画像及び音楽に付加して、インデクス付き音楽情報3
乃至インデクス付き動画像情報4を得る。
【0070】指定された動画像乃至音楽区間を映像編集
フィールド34の利用者の配置したい時系列に配置す
る。その際に、既存の編集済映像9が映像編集フィール
ド34にあるため、編集フィールド34では、既存の編
集済み映像9にインデクス付き音楽情報3乃至インデク
ス付き動画像情報4を追加していく。映像編集フィール
ド34上の編集済映像9は、あらかじめインデクス付き
音楽及び動画像から構成された映像であるため、インデ
クスが存在している。そこで、追記する動画像乃至音楽
のインデクスと、既存の編集済み映像上のインデクスと
の比較を行う。追記したい音楽乃至動画像にあるインデ
クスの近傍に、既存の編集済み映像上のインデクスが存
在していれば、それらのインデクスが適合するように時
間同期を行う。もしインデクス付き動画像区間に、複数
の特徴点が存在し、禁則処理にかかるような特徴を持つ
区間(例えば、動き被写体が存在する区間)が存在する
場合には、既に編集済みの音楽区間に含まれる特徴点
と、そうした禁則処理に関わる区間とが同期しないよう
に、自動同期を行う。
フィールド34の利用者の配置したい時系列に配置す
る。その際に、既存の編集済映像9が映像編集フィール
ド34にあるため、編集フィールド34では、既存の編
集済み映像9にインデクス付き音楽情報3乃至インデク
ス付き動画像情報4を追加していく。映像編集フィール
ド34上の編集済映像9は、あらかじめインデクス付き
音楽及び動画像から構成された映像であるため、インデ
クスが存在している。そこで、追記する動画像乃至音楽
のインデクスと、既存の編集済み映像上のインデクスと
の比較を行う。追記したい音楽乃至動画像にあるインデ
クスの近傍に、既存の編集済み映像上のインデクスが存
在していれば、それらのインデクスが適合するように時
間同期を行う。もしインデクス付き動画像区間に、複数
の特徴点が存在し、禁則処理にかかるような特徴を持つ
区間(例えば、動き被写体が存在する区間)が存在する
場合には、既に編集済みの音楽区間に含まれる特徴点
と、そうした禁則処理に関わる区間とが同期しないよう
に、自動同期を行う。
【0071】この実施形態例を実装したインタフェース
上での例を図12に示す。この例では、あらかじめ動画
像と音楽から編集済の映像9が映像編集フィールド34
で編集対象となっている。そこへ、新たに動画像区間が
指定され、動画像時系列上に挿入を試みる。動画像区間
は、あらかじめ指定された時点で動画像特徴点算出部2
6によって、インデクス付き動画像情報となっていると
する。そこで、動画像へ挿入する際に、既に編集済みの
音楽情報に特徴点と、挿入したインデクス付き動画像情
報の特徴点とを比較し、それらが時系列上である閾値以
内に収まっている場合には、自動的に同期を行うように
処理する。この同期処理により35に示す映像が得られ
る。利用者27は、そのような同期が適切であれば、そ
れを基に映像編集を続ければ良いし、同期が不適切であ
ると思えば任意の時系列上に動画像を挿入すれば良い。
上での例を図12に示す。この例では、あらかじめ動画
像と音楽から編集済の映像9が映像編集フィールド34
で編集対象となっている。そこへ、新たに動画像区間が
指定され、動画像時系列上に挿入を試みる。動画像区間
は、あらかじめ指定された時点で動画像特徴点算出部2
6によって、インデクス付き動画像情報となっていると
する。そこで、動画像へ挿入する際に、既に編集済みの
音楽情報に特徴点と、挿入したインデクス付き動画像情
報の特徴点とを比較し、それらが時系列上である閾値以
内に収まっている場合には、自動的に同期を行うように
処理する。この同期処理により35に示す映像が得られ
る。利用者27は、そのような同期が適切であれば、そ
れを基に映像編集を続ければ良いし、同期が不適切であ
ると思えば任意の時系列上に動画像を挿入すれば良い。
【0072】この第2の実施形態例では、編集済みの映
像に、動画像区間を新たに編集素材として加える場合
に、逐次、時間同期を行う例を示した。もちろん、動画
像区間だけでなく音楽区間も同様に扱って良い。また、
今回は特徴点としてどのような特徴点を用いるか限定し
ていないが、シーン変化だけといった特徴点に限定を加
えてももちろん構わない。
像に、動画像区間を新たに編集素材として加える場合
に、逐次、時間同期を行う例を示した。もちろん、動画
像区間だけでなく音楽区間も同様に扱って良い。また、
今回は特徴点としてどのような特徴点を用いるか限定し
ていないが、シーン変化だけといった特徴点に限定を加
えてももちろん構わない。
【0073】なお、本発明は、音楽データ及び動画像デ
ータを保存し、それらを自由に読み出し可能なハードデ
ィスクやそれに準ずる装置と、データを処理する際に必
要なバッファやそれに準ずる装置と、最終的に検出され
たカット点を表示、出力するディスプレイなどの装置を
備え、それらハードディスク、バッファ及びディスプレ
イなどをあらかじめ定められた手順に基いて制御する中
央演算装置などを備えたコンピュータやそれに準ずる装
置を基に、上述した実施形態の処理、乃至は、図1から
図12までの一連の図に示した方法ないしアルゴリズム
を記述した処理プログラムやそれに準ずる物を、該コン
ピュータに対して与え、制御、実行させることで実現す
ることが可能である。そこで、該処理プログラムやそれ
に準ずる物が、コンピュータが実行する際に読み出しを
実行できるフロッピーディスク(FD)、光磁気ディス
ク(MO)やそれに準ずる記憶媒体に格納されていても
構わない。
ータを保存し、それらを自由に読み出し可能なハードデ
ィスクやそれに準ずる装置と、データを処理する際に必
要なバッファやそれに準ずる装置と、最終的に検出され
たカット点を表示、出力するディスプレイなどの装置を
備え、それらハードディスク、バッファ及びディスプレ
イなどをあらかじめ定められた手順に基いて制御する中
央演算装置などを備えたコンピュータやそれに準ずる装
置を基に、上述した実施形態の処理、乃至は、図1から
図12までの一連の図に示した方法ないしアルゴリズム
を記述した処理プログラムやそれに準ずる物を、該コン
ピュータに対して与え、制御、実行させることで実現す
ることが可能である。そこで、該処理プログラムやそれ
に準ずる物が、コンピュータが実行する際に読み出しを
実行できるフロッピーディスク(FD)、光磁気ディス
ク(MO)やそれに準ずる記憶媒体に格納されていても
構わない。
【0074】また、本装置を小型のビデオカメラに搭載
し、ビデオカメラで撮影したあとすぐに編集し、音楽付
きの映像作品を作り出す装置などへの拡張や、ビデオデ
ッキに搭載し、あちらこちらで録画した映像から自分な
りの映像作品を作り出す装置などへの拡張等様々な発
展、応用が考えられる。
し、ビデオカメラで撮影したあとすぐに編集し、音楽付
きの映像作品を作り出す装置などへの拡張や、ビデオデ
ッキに搭載し、あちらこちらで録画した映像から自分な
りの映像作品を作り出す装置などへの拡張等様々な発
展、応用が考えられる。
【0075】
【発明の効果】以上説明したように本発明は、音楽を動
画像へ同期させる、または、動画像を音楽へ同期させる
ようにしたので、より効果的に映像を制作することが可
能となる。これによって、音楽と動画像を組み合せる音
楽付き映像の制作が容易になる。例えば、既存の映像作
品に対し、その雰囲気を伝えるテーマ音楽と、内容の一
部を抽出し、それらを組み合せることで、短い映像でか
つ重要な意味を含み、次回予告や、宣伝、等に利用でき
る映像を制作することが容易になる効果がある。
画像へ同期させる、または、動画像を音楽へ同期させる
ようにしたので、より効果的に映像を制作することが可
能となる。これによって、音楽と動画像を組み合せる音
楽付き映像の制作が容易になる。例えば、既存の映像作
品に対し、その雰囲気を伝えるテーマ音楽と、内容の一
部を抽出し、それらを組み合せることで、短い映像でか
つ重要な意味を含み、次回予告や、宣伝、等に利用でき
る映像を制作することが容易になる効果がある。
【図1】本発明の第1の実施形態例を示す映像制作方法
の流れ図である。
の流れ図である。
【図2】上記第1の実施形態例の映像制作方法を実施す
るための映像制作装置の実施形態例を示すブロック線図
である。
るための映像制作装置の実施形態例を示すブロック線図
である。
【図3】上記映像制作装置の実施形態例での音楽特徴点
算出部の例を示すブロック線図である。
算出部の例を示すブロック線図である。
【図4】上記第1の実施形態例での音楽インデクスの例
を示す説明図である。
を示す説明図である。
【図5】上記映像制作装置の実施形態例での動画像特徴
点算出部の例を示すブロック線図である。
点算出部の例を示すブロック線図である。
【図6】(a),(b),(c)は、上記第1の実施形
態例での動画像インデクスの例を示す説明図である。
態例での動画像インデクスの例を示す説明図である。
【図7】上記映像制作装置の実施形態例での時間長調整
部の時間長調整例(その1)を示す説明図である。
部の時間長調整例(その1)を示す説明図である。
【図8】上記映像制作装置の実施形態例での時間長調整
部の時間長調整例(その2)を示す説明図である。
部の時間長調整例(その2)を示す説明図である。
【図9】上記映像制作装置の実施形態例での時間長調整
部の時間長調整例(その3)を示す説明図である。
部の時間長調整例(その3)を示す説明図である。
【図10】上記映像制作装置の実施形態例での時間長調
整部の時間長調整例(その4)を示す説明図である。
整部の時間長調整例(その4)を示す説明図である。
【図11】本発明の第2の実施形態例を示す映像制作装
置のブロック線図である。
置のブロック線図である。
【図12】上記第2の実施形態例でのインタフェース上
での映像編集例を示す模式図である。
での映像編集例を示す模式図である。
1…音楽 2…動画像 3…インデクス付き音楽情報 4…インデクス付き動画像情報 5…音楽区間 6…動画像区間 7…同期信号 8…音楽付き映像 9…編集済映像 11…音楽特徴点算出工程 12…動画像特徴点算出工程 13…音楽区間指定工程 14…動画像区間指定工程 15…時間長調整工程 16…映像保存表示工程 21…音楽入力バッファ 22…動画像入力バッファ 23…音楽特徴量算出部 24…動画像特徴量算出部 25…音楽区間分類表示部 26…動画像区間分類表示部 27…利用者 28…利用者指示部 29…音楽区間指定部 30…動画像区間指定部 31…時間長調整部 32…出力メモリ 33…再生表示部 34…映像編集フィールド 41…音量極点算出部 42…同一音音量継続区間算出部 43…周波数分布算出部 44…周波数分布相関算出部 51…シーン変化算出部 52…カメラワーク算出部 53…動き被写体算出部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 外村 佳伸 東京都新宿区西新宿3丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 平6−203009(JP,A) 特開 平9−107517(JP,A) 特開 平9−214879(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04N 5/76 - 5/956 H04N 5/262 - 5/278
Claims (19)
- 【請求項1】 動画像と音楽を組み合わせて、音楽付き
映像を制作する映像制作方法において、音楽からあらかじめ定められた一種類乃至は複数種類の
特徴的なイベントが発生したことを示す特徴点を算出し
ておく音楽特徴点算出工程と、 利用者が対象としたい音楽区間を指定する音楽指定工程
と、動画像からあらかじめ定められた一種類乃至は複数種類
の特徴的なイベントが発生したことを示す特徴点を算出
しておく動画像特徴点算出工程と、 利用者が対象としたい動画像区間を指定する動画像指定
工程と、 指定された該音楽区間に、指定された該動画像区間を組
み合わせて映像を構成するために必要な時間長を、該音
楽区間に含まれる特徴点を基準点として該動画像区間を
時間同期させて切り替えるとともに、該切り替えた動画
像区間の一部を削除してあわせる時間長調整工程と、 時間長を調整した該音楽区間と該動画像区間を組み合わ
せて構成された映像を保存、表示する映像保存表示工程
と、 を具備することを特徴とする映像制作方法。 - 【請求項2】 前記時間長調整工程では、該動画像区間
の時間短縮を目的とした削除を行う場合において、該動
画像区間の削除を禁止する区間を設ける、 ことを特徴とする請求項1に記載の映像制作方法。 - 【請求項3】 前記時間長調整工程では、該動画像区間
における時間短縮を目的とした削除を禁止する区間を設
ける場合に、その区間を動画像区間に含まれる特徴点を
基に設定する、 ことを特徴とする請求項2に記載の映像制作方法。 - 【請求項4】 動画像と音楽を組み合わせて、音楽付き
映像を制作する映像制作方法において、 音楽からあらかじめ定められた一種類乃至は複数種類の
特徴的なイベントが発生したことを示す特徴点を算出し
ておく音楽特徴点算出工程と、 利用者が対象としたい音楽区間を指定する音楽指定工程
と、 動画像からあらかじめ定められた一種類乃至は複数種類
の特徴的なイベントが 発生したことを示す特徴点を算出
しておく動画像特徴点算出工程と、 利用者が対象としたい動画像区間を指定する動画像指定
工程と、 指定された該音楽区間に、指定された該動画像区間を組
み合わせて映像を構成するために必要な時間長を、該動
画像区間に含まれる特徴点を基準点として該音楽区間を
時間同期させて切り替えるとともに、該切り替えた音楽
区間の一部を削除してあわせる時間長調整工程と、 時間長を調整した該音楽区間と該動画像区間を組み合わ
せて構成された映像を保存、表示する映像保存表示工程
と、 を具備することを特徴とする映像制作方法。 - 【請求項5】 前記時間長調整工程では、該音楽区間の
時間短縮を目的とした削除を行う場合において、該音楽
区間の削除を禁止する区間を設ける、 ことを特徴とする請求項4に記載の映像制作方法。 - 【請求項6】 前記時間長調整工程では、該音楽区間に
おける時間短縮を目的とした削除を禁止する区間を設け
る場合に、その区間を音楽区間に含まれる特徴点を基に
設定する、 ことを特徴とする請求項5に記載の映像制作方法。 - 【請求項7】 前記音楽特徴点算出工程では、特徴的な
イベントとして音量極点、同一音量継続区間、周波数分
布変曲点、周波数類似区間の一種類以上が発生したこと
を示す特徴点を算出しておく、 ことを特徴とする請求項1乃至6のいずれか1項に記載
の映像制作方法。 - 【請求項8】 前記動画像特徴点算出工程では、特徴的
なイベントとしてシーン変化点、カメラワーク、動き被
写体の有無、動き被写体の領域の大きさ、動き被写体の
速度の一種類以上が発生したことを示す特徴点を算出し
ておく、 ことを特徴とする請求項1乃至7のいずれか1項に記載
の映像制作方法。 - 【請求項9】 前記動画像指定工程では、動画像区間の
指定に際して、あらかじめ算出された該特徴点を基準
に、一つ乃至複数の動画像区間を選択する、 ことを特徴とする請求項1乃至8のいずれか1項に記載
の映像制作方法。 - 【請求項10】 請求項1乃至9のいずれか1項に記載
の映像制作方法における各工程の手順をコンピュータに
実行させるための処理プログラムを、該コンピュータが
読み取り可能な媒体に記録した、 ことを特徴とする映像制作方法を記録した記録媒体。 - 【請求項11】 動画像と、音楽を組み合わせて、音楽
付き映像を制作する映像制作装置において、音楽からあらかじめ定められた一種類乃至は複数種類の
特徴的なイベントが発生したことを示す特徴点を算出し
ておく音楽特徴点算出部と、 利用者が対象としたい音楽区間を指定する音楽指定部
と、動画像からあらかじめ定められた一種類乃至は複数種類
の特徴的なイベントが発生したことを示す特徴点を算出
しておく動画像特徴点算出部と、 利用者が対象としたい動画像区間を指定する動画像指定
部と、 指定された該音楽区間に、指定された該動画像区間を組
み合わせて映像を構成するために必要な時間長を、該音
楽区間に含まれる特徴点を基準点として該動画像区間を
時間同期させて切り替えるとともに、該切り替えた動画
像区間の一部を削除してあわせる時間長調整部と、 時間長を調整した該音楽区間と該動画像区間を組み合わ
せて構成された映像を保存、表示する映像保存表示部
と、 を具備することを特徴とする映像制作装置。 - 【請求項12】 前記時間長調整部は、該動画像区間の
時間短縮を目的とした削除を行う場合において、該動画
像区間の削除を禁止する区間を設ける機能を具備する、 ことを特徴とする請求項11に記載の映像制作装置。 - 【請求項13】 前記時間長調整部は、該動画像区間に
おける時間短縮を目的とした削除を禁止する区間を設け
る場合に、その区間を動画像区間に含まれる特徴点を基
に設定するものである、 ことを特徴とする請求項12に記載の映像制作装置。 - 【請求項14】 動画像と、音楽を組み合わせて、音楽
付き映像を制作する映像制作装置において、 音楽からあらかじめ定められた一種類乃至は複数種類の
特徴的なイベントが発生したことを示す特徴点を算出し
ておく音楽特徴点算出部と、 利用者が対象としたい音楽区間を指定する音楽指定部
と、 動画像からあらかじめ定められた一種類乃至は複数種類
の特徴的なイベントが発生したことを示す特徴点を算出
しておく動画像特徴点算出部と、 利用者が対象としたい動画像区間を指定する動画像指定
部と、 指定された該音楽区間に、指定された該動画像区間を組
み合わせて映像を構成するために必要な時間長を、該動
画像区間に含まれる特徴点を基準点として該音楽区間を
時間同期させて切り替えるとともに、該切り替えた音楽
区間の一部を削除してあわせる時間長調整部と、 時間長を調整した該音楽区間と該動画像区間を組み合わ
せて構成された映像を保存、表示する映像保存表示部
と、 を具備することを特徴とする映像制作装置。 - 【請求項15】 前記時間長調整部は、該音楽区間の時
間短縮を目的とした削除を行う場合において、該音楽区
間の削除を禁止する区間を設ける機能を具備する、 ことを特徴とする請求項14に記載の映像制作装置。 - 【請求項16】 前記時間長調整部は、該音楽区間にお
ける時間短縮を目的とした削除を禁止する区間を設ける
場合に、その区間を音楽区間に含まれる特徴点を基に設
定するものである、 ことを特徴とする請求項15に記載の映像制作装置。 - 【請求項17】 前記音楽特徴点算出部は、特徴的なイ
ベントとして音量極点、同一音量継続区間、周波数分布
変曲点、周波数類似区間の一種類以上が発生したことを
示す特徴点を算出しておくものである、 ことを特徴とする請求項11乃至16のいずれか1項に
記載の映像制作装置。 - 【請求項18】 前記動画像特徴点算出部は、特徴的な
イベントとしてシーン変化点、カメラワーク、動き被写
体の有無、動き被写体の領域の大きさ、動き被写体の速
度の一種類以上が発生したことを示す特徴点を算出して
おくものである、 ことを特徴とする請求項11乃至17のいずれか1項に
記載の映像制作装置。 - 【請求項19】 前記動画像指定部は、動画像区間の指
定に際して、あらかじめ算出された該特徴点を基準に、
一つ乃至複数の動画像区間を選択するものである、 ことを特徴とする請求項11乃至18のいずれか1項に
記載の映像制作装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22026097A JP3325809B2 (ja) | 1997-08-15 | 1997-08-15 | 映像制作方法及び装置及びこの方法を記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22026097A JP3325809B2 (ja) | 1997-08-15 | 1997-08-15 | 映像制作方法及び装置及びこの方法を記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1169290A JPH1169290A (ja) | 1999-03-09 |
JP3325809B2 true JP3325809B2 (ja) | 2002-09-17 |
Family
ID=16748404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP22026097A Expired - Fee Related JP3325809B2 (ja) | 1997-08-15 | 1997-08-15 | 映像制作方法及び装置及びこの方法を記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3325809B2 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6925455B2 (en) * | 2000-12-12 | 2005-08-02 | Nec Corporation | Creating audio-centric, image-centric, and integrated audio-visual summaries |
US6956904B2 (en) * | 2002-01-15 | 2005-10-18 | Mitsubishi Electric Research Laboratories, Inc. | Summarizing videos using motion activity descriptors correlated with audio features |
JP4005470B2 (ja) | 2002-10-09 | 2007-11-07 | オリンパス株式会社 | 情報処理装置及び情報処理プログラム |
JP2004134985A (ja) | 2002-10-09 | 2004-04-30 | Olympus Corp | データ編集装置及びデータ編集プログラム |
JP2004233698A (ja) * | 2003-01-30 | 2004-08-19 | Ricoh Co Ltd | 音楽支援装置、音楽支援サーバ、音楽支援方法およびプログラム |
KR101109023B1 (ko) * | 2003-04-14 | 2012-01-31 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 콘텐트 분석을 사용하여 뮤직 비디오를 요약하는 방법 및 장치 |
JP4839952B2 (ja) * | 2006-05-01 | 2011-12-21 | ソニー株式会社 | 画像処理装置および方法、並びにプログラム |
JP2009015119A (ja) * | 2007-07-06 | 2009-01-22 | Sanyo Electric Co Ltd | サビ位置検出装置 |
WO2010055627A1 (ja) * | 2008-11-14 | 2010-05-20 | パナソニック株式会社 | 撮像装置及びダイジェスト再生方法 |
JP5663953B2 (ja) * | 2010-05-26 | 2015-02-04 | ヤマハ株式会社 | 音楽生成装置 |
JP2012015809A (ja) * | 2010-06-30 | 2012-01-19 | Kddi Corp | 楽曲選択装置、楽曲選択方法および楽曲選択プログラム |
JP4890637B1 (ja) * | 2010-10-07 | 2012-03-07 | 株式会社MoSo | コンテンツ編集装置および方法、並びにプログラム |
CN107005676A (zh) | 2014-12-15 | 2017-08-01 | 索尼公司 | 信息处理方法、影像处理装置和程序 |
EP3217655A4 (en) | 2014-12-15 | 2018-07-18 | Sony Corporation | Information processing method, video processing device and program |
CN105791938B (zh) * | 2016-03-14 | 2019-06-21 | 腾讯科技(深圳)有限公司 | 多媒体文件的拼接方法和装置 |
US11915722B2 (en) * | 2017-03-30 | 2024-02-27 | Gracenote, Inc. | Generating a video presentation to accompany audio |
CN112235631B (zh) * | 2019-07-15 | 2022-05-03 | 北京字节跳动网络技术有限公司 | 视频处理方法、装置、电子设备及存储介质 |
CN112822541B (zh) * | 2019-11-18 | 2022-05-20 | 北京字节跳动网络技术有限公司 | 视频生成方法、装置、电子设备和计算机可读介质 |
-
1997
- 1997-08-15 JP JP22026097A patent/JP3325809B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1169290A (ja) | 1999-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3325809B2 (ja) | 映像制作方法及び装置及びこの方法を記録した記録媒体 | |
US8320743B2 (en) | Dynamic variation of output media signal in response to input media signal | |
JP4615166B2 (ja) | 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム | |
US6597859B1 (en) | Method and apparatus for abstracting video data | |
KR100403238B1 (ko) | 비디오의 지능형 빨리 보기 시스템 | |
US7903927B2 (en) | Editing apparatus and control method thereof, and program and recording medium | |
US20090273712A1 (en) | System and method for real-time synchronization of a video resource and different audio resources | |
US20020051081A1 (en) | Special reproduction control information describing method, special reproduction control information creating apparatus and method therefor, and video reproduction apparatus and method therefor | |
US20100040349A1 (en) | System and method for real-time synchronization of a video resource and different audio resources | |
US20130330062A1 (en) | Automatic creation of movie with images synchronized to music | |
GB2312081A (en) | Text-based video editing system | |
JP2000350159A (ja) | 視覚画像編集システム | |
JP2017505012A (ja) | ビデオ処理方法、装置及び再生装置 | |
US20040240005A1 (en) | Editing apparatus and method using thumbnail image | |
JP2002125199A (ja) | フレーム情報記述方法、フレーム情報生成装置及び方法、映像再生装置及び方法並びに記録媒体 | |
KR100555426B1 (ko) | 비디오 콘텐트의 동적 탐색 방법 및 장치 | |
JP5775814B2 (ja) | 視聴覚システムを視聴者の注目度に合わせる装置及び方法 | |
JP2000023062A (ja) | ダイジェスト作成システム | |
JP3767033B2 (ja) | 画像編集装置 | |
JP4198331B2 (ja) | 録画装置 | |
CN101325679B (zh) | 信息处理设备、信息处理方法 | |
JP2005252372A (ja) | ダイジェスト映像作成装置及びダイジェスト映像作成方法 | |
JP3506410B2 (ja) | 劇的映像制作支援方法および装置 | |
JP2005167822A (ja) | 情報再生装置及び情報再生方法 | |
JP4010598B2 (ja) | 映像情報編集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080705 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080705 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090705 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |