JP3918772B2 - Video editing apparatus, video editing method, and video editing program - Google Patents
Video editing apparatus, video editing method, and video editing program Download PDFInfo
- Publication number
- JP3918772B2 JP3918772B2 JP2003132040A JP2003132040A JP3918772B2 JP 3918772 B2 JP3918772 B2 JP 3918772B2 JP 2003132040 A JP2003132040 A JP 2003132040A JP 2003132040 A JP2003132040 A JP 2003132040A JP 3918772 B2 JP3918772 B2 JP 3918772B2
- Authority
- JP
- Japan
- Prior art keywords
- scene
- group
- scene group
- scenes
- groups
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、映像データを映像のシーンごとに分割する映像編集装置、映像編集方法および映像編集プログラムに関する。
【0002】
【従来の技術】
近年、パーソナルコンピュータ等で動画像を扱うようになり、動画像の検索や、編集等の作業をいかに効率よく行うかが重要になってきている。動画像の検索や編集等を行う場合、動画像を構成しているシーンに動画像を分解し、動画像内の各シーンの配置や、構成等を把握することが必要である。ここで、シーンとは、動画像においてカメラが切り替わる単位、または音声(例えば、話者。)が切り替わる単位等を意味する。
【0003】
動画像である映像を編集する際に、映像を符号化した信号である映像データを用いて映像を編集する映像編集システムの一例として、特許文献1に記載されている従来の映像編集システムの一構成例を図12のブロック図に示す。図12に示す構成の従来の映像編集システムは、符号化パラメータ抽出部121が、符号化された映像データから符号化パラメータを抽出し、シーンチェンジフレーム検出部122が、符号化パラメータに基づいて映像のシーンの切り替わりのフレームであるシーンチェンジフレームを検出する。そして、シーン群決定部123が、シーンチェンジフレームの位置に基づいてシーンを区切ってシーンの集まりであるシーン群を特定し、シーン群における先頭フレームの位置の情報であるシーン群情報を生成する。シーン情報階層化部124は、映像全体にわたってシーンチェンジフレームの位置の情報とシーン群情報とを、階層化して蓄積部125に蓄積させる。
【0004】
ここで、シーン群決定部123は、隣り合うシーンのシーンチェンジフレームの位置の差分であるシーンチェンジフレーム間の時間差を算出する。そして、算出したフレーム間の時間差と所定のしきい値とを比較してシーンチェンジフレーム間の時間差が所定のしきい値以上であれば隣り合うシーンはそれぞれ異なるシーン群に属すると決定して、隣り合うシーンのうち時間的に後にあるシーンを新たなシーン群の先頭シーンとする。また、シーンチェンジフレーム間の時間差が所定のしきい値以下であれば隣り合うシーンは同一のシーン群に属すると決定する。このようにシーン群決定部123は、隣り合う全てのシーンについてシーンチェンジフレーム間の時間差を所定のしきい値と比較して、映像全体をシーン群に区分する。
【0005】
また、例えば特許文献2に記載されている従来の映像構造化装置の一構成例を、図13のブロック図に示す。図13に示す構成の映像構造化装置は、特徴量抽出部131が、入力された映像の時間的に分割された区間の特徴量ベクトルを抽出し、量子化部132が、特徴量ベクトルを番号に変換し映像を番号列で表現する。そして、計数部133が、番号列の出現回数を数え、出現頻度の高い部分列を抽出する。このように、入力された映像の時間的に分割された区間のうち、特定のパターンで高い頻度で出現する区間の並びを抽出する。
【0006】
【特許文献1】
特開2001−326901号公報 (第4−7頁、第1図)
【特許文献2】
特開平11−242685号公報 (第4−10頁、第1図)
【0007】
【発明が解決しようとする課題】
特許文献1に記載された映像編集システムは、シーン群の判定をシーンチェンジフレーム間の時間差で判定している。そのため、類似したシーンが繰り返し同じ順番で出現するという繰り返し構造が所定の時間内に含まれる場合、シーン群決定部123は、繰り返し構造を構成する各シーンをシーン群として特定しない。
【0008】
また、特許文献2に記載された映像構造化装置は、入力された映像の時間的に分割された区間のうち、特定のパターンで高い頻度で出現する区間の並びを抽出するが、高い頻度で出現する区間の並びとして抽出されなかった区間に対する処理を行わない。そのため、入力された映像の中で高い頻度で出現する区間の並びとして抽出されなかった区間に対する編集作業を、特許文献2に記載された映像構造化装置以外の手段を用いて行わなくてはならない。
【0009】
そこで、本発明は、入力された映像に含まれるシーンの出現順と出現回数とを利用して、入力された映像全体を自動的にシーン群に区分する映像編集装置、映像編集方法、および映像編集プログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】
本発明による映像編集装置は、入力された映像データによる映像のシーンが変わるタイミングであるシーンチェンジを検出して、映像データを複数のシーンに分割するシーン検出手段と、各シーンの特徴量を抽出し、抽出した特徴量に応じて、映像データにおける各シーンを複数のグループに分類したシーングループを生成し、各シーングループを特定する対応情報を各シーンに対応付けるシーン分類手段と、時間軸上で複数回同じ並びで出現する対応情報の並びに応じたシーンの集まりをシーン群と特定して抽出するシーン群抽出手段と、シーン群抽出手段の抽出の対象とならなかったシーングループの並びと、シーン群抽出手段が抽出したシーン群とのマッチングを行い、マッチングの結果に応じてシーングループの並びをシーン群に含めるシーン群決定手段と、映像データをシーン群に分類した結果の情報を蓄積する蓄積手段とを備えたことを特徴とする。
【0011】
シーン群決定手段は、シーン群の最初のシーンのシーングループと、シーングループの並びのうち最初のシーンのシーングループとが一致するか否か判定し、シーン群の最後のシーンのシーングループと、シーングループの並びのうち最後のシーンのシーングループとが一致するか否か判定し、ともに一致すると判定されたシーングループの並びをシーン群に含めてもよい。そのような構成によれば、シーン群の構成に類似するシーングループの並びを、シーン群と特定することができる。
【0012】
シーン群決定手段は、映像データ中に登場する回数の多い順にシーン群を選択してマッチングを行ってもよく、映像データ中に登場する回数が同じシーン群が複数存在する場合は、時間軸上で登場する順にシーン群を選択してマッチングを行ってもよい。そのような構成によれば、類似したシーンが繰り返し同じ順番で出現するという繰り返し構造を構成する各シーンをシーン群として特定することができる。
【0013】
シーン群決定手段は、マッチングの結果、シーン群と特定されなかったシーンの並びを、シーン群と特定してもよい。そのような構成によれば、すべてのシーンの並びを、シーン群に特定することができる。
【0014】
本発明による映像編集装置は、入力された映像データによる映像の場面が切り替わるタイミングまたは音声が切り替わるタイミングであるシーンチェンジを検出してシーンチェンジの位置を特定する位置情報を生成し、時間軸上でシーンチェンジに挟まれた複数の区間に映像データを区分し、区分された複数の区間に時間順にシーン番号を付与してシーンを作成し、作成された複数のシーンを出力するシーン検出手段と、
シーン検出手段で作成された複数のシーンの特徴量を抽出してシーン間の類似度を算出し、シーンの間の類似度に基づいて複数のシーンを複数のグループに分類し、分類した複数のグループにシーングループIDを付与して複数のシーングループを作成し、複数のシーンのそれぞれにシーングループを特定するシーングループIDを付与するシーン分類手段と、シーングループIDが繰り返し同じ順番で出現するシーングループIDの組を抽出し、抽出された複数のシーングループIDの組にシーン群グループIDを付与して複数のシーン群グループを作成し、複数のシーン群グループが映像データに出現する回数を数えて出現回数の多い順に並べ、シーン群グループごとにシーン群グループIDとシーングループIDの出現順と入力された映像データ中の出現回数とで構成されるシーン群グループ情報を出力し、シーングループIDの出現順がシーン群グループのシーングループIDの出現順に一致する時間軸に沿った複数のシーンの組をシーン群として抽出し、抽出された複数のシーン群にシーン群を特定するシーン群IDを付与し、シーン群IDとシーングループIDの出現順が抽出されたシーン群でのシーングループIDの出現順に一致するシーン群グループのシーン群グループIDと抽出されたシーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を出力するシーン群抽出手段と、シーン群グループを映像データ中の出現回数が多い順から1つずつ選択し、シーン群抽出手段でシーン群として抽出されなかった残りのシーンから時間軸上で連続したシーンの並びを1つずつ選択し、選択したシーンの並びの中に選択したシーン群グループの最初のシーンのシーングループIDと同じシーングループIDを持つシーンが存在し、そのシーンより時間軸上で後ろに、選択したシーン群グループの最後のシーンのシーングループIDと同じシーングループIDを持つシーンが存在する場合に、選択したシーン群グループの最初のシーンのシーングループIDと同じシーングループIDを持つシーンで始まり、選択したシーン群グループの最後のシーンのシーングループIDと同じシーングループIDを持つシーンで終わる複数のシーンの組をシーン群として抽出し、抽出した複数のシーン群にシーン群を特定するシーン群IDを付与し、抽出されたシーン群のシーン群IDと選択したシーン群グループのシーン群グループIDと抽出されたシーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を生成し、シーン群の抽出を選択した全てのシーンの並びと選択した全てのシーン群グループとについて繰り返しおこない、シーン群グループ情報を利用してもシーン群として抽出されなかった時間軸に沿った1つ以上のシーンの並びをシーングループの出現順が一致するシーン群グループが存在しないシーン群と決定し、決定された複数のシーン群にシーン群IDを付与し、シーン群とシーングループの出現順が一致するシーン群グループが存在しないことを意味する値と決定されたシーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を生成するシーン決定手段と、シーン群情報をシーン群情報データベースに蓄積する蓄積手段とを備えたことを特徴とする。
【0015】
本発明による映像編集方法は、入力された映像データによる映像のシーンが変わるタイミングであるシーンチェンジを検出して、映像データをシーンに分割し、シーンの特徴量を抽出し、抽出した特徴量に応じてシーンをグループに分類したシーングループを生成し、映像データの時間軸上に複数回同じ並びで出現するシーングループの並びをシーンの集まりであるシーン群と特定して抽出し、抽出の対象とならなかったシーングループの並びとシーン群とのマッチングを行い、マッチングの結果に応じてシーングループの並びをシーン群と特定し、映像データをシーン群に分類した結果の情報を蓄積することを特徴とする。
【0016】
本発明による映像編集方法は、入力された映像データによる映像の場面が切り替わるタイミングまたは音声が切り替わるタイミングであるシーンチェンジを検出してシーンチェンジの位置を特定する位置情報を生成し、時間軸上でシーンチェンジに挟まれた複数の区間に映像データを区分し、区分された複数の区間に時間順にシーン番号を付与してシーンを作成し、作成された複数のシーンを出力し、作成された複数のシーンの特徴量を抽出してシーン間の類似度を算出し、シーンの間の類似度に基づいて複数のシーンを複数のグループに分類し、分類した複数のグループを構成するフレームにシーングループIDを付与して複数のシーングループを作成し、複数のシーンのそれぞれにシーングループを特定するシーングループIDを付与し、シーングループIDが繰り返し同じ順番で出現するシーングループIDの組を抽出し、抽出された複数のシーングループIDの組にシーン群グループIDを付与して複数のシーン群グループを作成し、複数のシーン群グループが映像データに出現する回数を数えて出現回数の多い順に並べ、シーン群グループごとにシーン群グループIDとシーングループIDの出現順と入力された映像データ中の出現回数とで構成されるシーン群グループ情報を出力し、シーングループIDの出現順がシーン群グループのシーングループIDの出現順に一致する時間軸に沿った複数のシーンの組をシーン群として抽出し、抽出された複数のシーン群にシーン群を特定するシーン群IDを付与し、シーン群IDとシーングループIDの出現順が抽出されたシーン群でのシーングループIDの出現順に一致するシーン群グループのシーン群グループIDと抽出されたシーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を出力し、シーン群グループを映像データ中の出現回数が多い順から1つずつ選択し、シーン群として抽出されなかった残りのシーンから時間軸上で連続したシーンの並びを1つずつ選択し、選択したシーンの並びの中に選択したシーン群グループの最初のシーンのシーングループIDと同じシーングループIDを持つシーンが存在し、そのシーンより時間軸上で後ろに、選択したシーン群グループの最後のシーンのシーングループIDと同じシーングループIDを持つシーンが存在する場合に、選択したシーン群グループの最初のシーンのシーングループIDと同じシーングループIDを持つシーンで始まり、選択したシーン群グループの最後のシーンのシーングループIDと同じシーングループIDを持つシーンで終わる複数のシーンの組をシーン群として抽出し、抽出した複数のシーン群にシーン群を特定するシーン群IDを付与し、抽出されたシーン群のシーン群IDと選択したシーン群グループのシーン群グループIDと抽出されたシーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を生成し、シーン群の抽出を選択した全てのシーンの並びと選択した全てのシーン群グループとについて繰り返しおこない、シーン群グループ情報を利用してもシーン群として抽出されなかった時間軸に沿った1つ以上のシーンの並びをシーングループの出現順が一致するシーン群グループが存在しないシーン群と決定し、決定された複数のシーン群にシーン群IDを付与し、シーン群とシーングループの出現順が一致するシーン群グループが存在しないことを意味する値と決定されたシーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を生成し、シーン群情報をシーン群情報データベースに蓄積することを特徴とする。
【0017】
本発明による映像編集プログラムは、映像データを編集して、シーンの集まりであるシーン群を生成する映像編集装置に搭載される映像編集プログラムであって、コンピュータに、入力された映像データによる映像のシーンが変わるタイミングであるシーンチェンジを検出して、映像データをシーンに分割する処理と、シーンの特徴量を抽出し、抽出した特徴量に応じてシーンをグループに分類したシーングループを生成する処理と、映像データの時間軸上に複数回同じ並びで出現するシーングループの並びをシーンの集まりであるシーン群と特定して抽出する処理と、抽出の対象とならなかったシーングループの並びと抽出されたシーン群とのマッチングを行い、マッチングの結果に応じてシーングループの並びをシーン群に含める処理と、映像データをシーン群に分類した結果の情報を記憶装置に記憶させる処理とを備えることを特徴とする。
【0018】
【発明の実施の形態】
本発明の実施の形態について図面を参照して説明する。図1は、本発明の実施の形態の一構成例を示すブロック図である。本発明による映像編集装置は、入力された映像データ101に含まれるカメラが切り替わる場面あるいは音声(例えば、話者。)が切り替わるタイミングであるシーンチェンジを検出して、映像データ101をシーンに分割するシーン検出手段102と、シーンの特徴量を算出し、算出した特徴量に応じてシーンをグループに分類したシーングループを生成するシーン分類手段103と、繰り返し同じ順番で出現するシーングループが構成するシーングループの集合であるシーン群を抽出するシーン群抽出手段104と、シーン群の抽出の対象とならなかったシーングループを分類してシーン群を生成するシーン群決定手段105と、映像データをシーン群に分類した結果の情報をシーン群情報データベース107に蓄積する蓄積手段106とを含む。本発明による映像編集装置は、コンピュータ等により実現され、各手段はプログラム等により実現される。
【0019】
シーン検出手段102は、動画像のデータである映像データ101が入力されると、映像データ101の映像において、カメラが切り替わるタイミングあるいは音声が切り替わるタイミングであるシーンチェンジを検出する。シーンチェンジの検出方法は、例えば映像データ101による映像の、連続するフレーム間の画素の色情報のレイアウトの差分を算出し、算出した差分が所定のしきい値以上となった場合、シーンチェンジであると判定することにより行う。シーン検出手段102は、映像データ101をシーンチェンジを検出したタイミングで区切る。そして、区切られた映像データ101の各区間である各シーンに対応する情報のファイルであるシーン情報ファイルを生成する。
【0020】
シーン検出手段102は、区切られた各シーンに時間順に先頭から番号を付与し、付与した番号を各シーンに対応付けてシーン情報ファイルに記録する。そして、シーン検出手段102は、シーンに区切られた映像データ101と、シーン情報ファイルとをシーン分類手段103に出力する。また、シーン検出手段102は、シーンチェンジのしたフレームであるシーンチェンジフレームを特定する情報であるシーンチェンジ位置情報を生成してシーン群決定手段105に出力する。ここで、映像データ101は、シーン検出手段102がシーンチェンジを検出できる信号形式であればよく、例えば、アナログVTRやDV(Digital Video)等の記録媒体に記録されているデータや、MPEG等のデータである。
【0021】
シーン分類手段103は、シーンに区切られた映像データ101が入力されると各シーンの特徴量を抽出し、抽出した各シーンの特徴量を互いに比較して類似度を算出する。ここで、シーンの特徴量は、映像データ101による映像のフレームにおける各画素の色情報のレイアウトである。また、映像データに含まれる音声信号がステレオ音声であるか、モノラル音声であるか、または多重音声であるか等の音声信号の種類や、音声信号の波形を特徴量に用いてもよい。さらに、字幕の有無、字幕の表示位置や、表示言語等の情報を特徴量に用いてもよい。また、類似度は、例えば、シーン間の特徴量の差分絶対値和である。そして、シーンの類似度が、所定のしきい値よりも小さいシーンのグループであるシーングループに分類し、シーングループを特定する記号である対応情報(例えば、シーングループID。)を各シーンに付与する。つまり、シーン分類手段103は、各シーングループを特定するシーングループIDを各シーンに対応付ける。
【0022】
シーン分類手段103は、特異値分解(SVD)法等の既存の方法を用い、シーンを特徴量の類似度に基づいてグループに分類する。具体的には、各シーンの特徴量を抽出し、特徴量空間にマッピングすると、特徴量空間に特徴量の類似するシーンの固まりができる。特徴量空間において、特徴量間の距離があらかじめ決められているしきい値よりも小さい場合に、それらは1つの固まりに属するとする。それぞれの固まりを各々のグループとする。シーン分類手段103は、各シーンに付与されたシーングループIDを各シーンに対応付けてシーン情報ファイルに記録する。シーン分類手段103は、映像データ101とシーン情報ファイルとをシーン群抽出手段104に出力する。
【0023】
シーン群抽出手段104は、映像データ101が入力されると、シーン情報ファイルに記録されているシーングループIDに基づいて、同じシーングループIDが繰り返し同じ順番で出現するシーングループIDの組であるシーン群グループを抽出する。シーン群グループの抽出は、テキストデータマイニングの手法である動的計画法等の既存の手法を用いてよい。そして、シーン群グループを特定する記号であるシーン群グループIDを各シーンに付与する。シーン群抽出手段104は、各シーンに付与されたシーン群グループIDを、各シーンに対応付けてシーン情報ファイルに記録する。そして、シーン群抽出手段104は、各シーン群グループが映像データ101に存在する数と、各シーン群グループの映像データ101における時間軸上の順序とを特定する。
【0024】
シーン群抽出手段104は、シーン群グループIDと、シーン群グループが映像データ101に存在する数の情報と、シーン群グループの映像データ101における時間軸上の順序の情報とによって構成されるシーン群グループ情報を生成する。このとき、シーン群グループ情報におけるシーン群グループIDの順序を、映像データ101に存在するシーン群グループの数が多い順序にしてもよい。
【0025】
シーン群抽出手段104は、シーン群グループを抽出し、抽出した各シーン群グループをシーン群とする。そして、各シーン群に、シーン群を特定する記号であるシーン群IDをシーン群を構成する各シーンに付与する。シーン群抽出手段104は、シーン群IDを各シーンに対応付けてシーン情報ファイルに記録する。そして、シーン群抽出手段104は、シーン群のシーン群IDと、シーン群を構成する各シーンのシーン群グループIDの情報と、各シーン群の先頭のシーンチェンジフレームを特定する情報とによって構成されるシーン群情報を生成する。シーン群抽出手段104は、シーン群と、シーン群として抽出されなかった部分の映像データ101と、シーン群グループ情報と、シーン群情報とをシーン群決定手段105に出力する。シーン群抽出手段104は、シーン群情報を蓄積手段106に出力して、シーン群情報データベースに蓄積させてもよい。
【0026】
シーン群決定手段105は、シーン検出手段102が出力したシーンチェンジ位置情報に基づいて、シーン群として抽出されなかった部分の映像データ101をシーンに区切る。そして、シーン群決定手段105は、シーン群グループを1つ選択する。選択したシーン群グループの最初のシーンのシーングループIDと、選択したシーン群グループの最後のシーンのシーングループIDとを抽出する。また、シーン群抽出手段104がシーン群として抽出しなかった残りのシーンのうち、時間軸上で連続したシーンの並びを特定する。そして、シーン群抽出手段104がシーン群として抽出しなかった残りのシーンのうち、選択したシーン群の最初のシーンのシーングループIDと同じシーングループIDを有するシーンを特定する。
【0027】
そして、特定したシーンと連続したシーンであって、時間軸上における後方に、選択したシーン群グループの最後のシーンのシーングループIDと同じシーングループIDを有するシーンが存在していた場合、選択したシーン群グループの最初のシーンのシーングループIDと同じシーングループIDを有するシーンと、選択したシーン群グループの最後のシーンのシーングループIDと同じシーングループIDを有するシーンとの間のシーンを、シーン群として抽出し、シーン群を特定するシーン群IDをシーン群を構成する各シーンに付与する。シーン群決定手段105は、シーン群IDを各シーンに対応付けてシーン情報ファイルに記録する。
【0028】
シーン群決定手段105は、入力された全てのシーン群について、出現回数の多い順序でシーン群を選択して上記の処理を行い、出現回数が同じシーン群が複数存在する場合は、時間軸上で登場する順にシーン群を選択して上記の処理を行い、シーン群を抽出する。そして、入力された全てのシーン群について上記の処理に行う。上記の処理を行っても抽出されなかったシーンをシーン群として抽出し、シーン群を特定するシーン群IDをシーン群を構成する各シーンに付与する。シーン群決定手段105は、シーン群IDを各シーンに対応付けてシーン情報ファイルに記録する。
【0029】
シーン群決定手段105は、シーン群決定手段105が抽出したシーン群のシーン群IDと、シーン群を構成する各シーンのシーン群グループIDと、各シーン群の先頭のシーンチェンジフレームを特定する情報とを新たに含む、シーン群情報を生成する。そして、シーン群決定手段105は、シーン情報ファイルと、シーン群グループ情報と、シーン群情報とを蓄積手段106に出力する。
【0030】
蓄積手段106は、シーン群情報データベース107を備え、入力されたシーン情報ファイルと、シーン群グループ情報と、シーン群情報とをシーン群情報データベース107に蓄積する。
【0031】
本発明による映像編集プログラムは、映像データを編集して、シーンの集まりであるシーン群を生成する映像編集装置に搭載されて各手段を実現する映像編集プログラムであって、コンピュータに、入力された映像データによる映像のシーンが変わるタイミングであるシーンチェンジを検出して、映像データをシーンに分割する処理と、シーンの特徴量を抽出し、抽出した特徴量に応じてシーンをグループに分類したシーングループを生成する処理と、映像データの時間軸上に複数回同じ並びで出現するシーングループの並びをシーンの集まりであるシーン群と特定して抽出する処理と、抽出の対象とならなかったシーングループの並びとシーン群とのマッチングを行い、マッチングの結果に応じてシーングループの並びをシーン群と特定する処理と、映像データをシーン群に分類した結果の情報を記憶装置に記憶させる処理とを備える。
【0032】
次に、図面を参照して本発明の実施の形態の動作について説明する。図2は、本発明の実施の形態の映像編集装置の動作を示すフローチャートである。図2において、ステップS201はシーン検出手段102の動作を表し、ステップS202は、シーン分類手段103の動作を表し、ステップS203はシーン群抽出手段104の動作を表し、ステップS204はシーン群決定手段105の動作を表し、ステップS205は蓄積手段106の動作を表す。
【0033】
各手段の動作について説明する。まず、シーン検出手段102の動作について説明する。図3は、本発明におけるシーン検出手段102の動作を示すフローチャートである。図4は、本発明における映像編集装置による映像編集の対象となる映像データを模式的に表した図である。シーン検出手段102は、編集対象となる映像データ101が入力されると(ステップS301)、入力された映像データ101による映像のシーンチェンジを検出する(ステップS302)。すなわち、図4の例に示すように、シーンチェンジのフレーム701〜724を検出する。そして、シーンチェンジフレームを特定するシーンチェンジ位置情報を生成してシーン群決定手段105に出力する。
【0034】
シーン検出手段102は、検出したシーンチェンジのタイミングで、映像データ101を分割し(ステップS303)、分割した各区間である各シーンのフレームに時間順に先頭からシーン番号を付与してシーンを作成し(ステップS304)、シーン番号をシーン情報ファイルに記録する。図5のシーン番号の欄に、各シーンに付与したシーン番号の一例を示す。ここで、シーン番号「S1」が付与されたフレームによって構成されるシーンは、シーンチェンジフレーム701以降であって、シーンチェンジフレーム702の前のフレームまでを含む。以下、同様に、シーン番号「S2」が付与されたフレームによって構成されるシーンは、シーンチェンジフレーム702以降であって、シーンチェンジフレーム703の前のフレームまでを含む。そして、作成した各シーンを、シーン分類手段103に出力する(ステップS305)。
【0035】
つぎに、シーン分類手段103の動作について説明する。図6は、本発明におけるシーン検出手段103の動作を示すフローチャートである。シーン分類手段103は、シーン検出手段102が映像データ101を区分したシーンが入力されると(ステップS401)、各シーンの特徴量を抽出し(ステップS402)、複数のシーンの特徴量の類似度に基づいて複数のシーンを複数のグループに分類する(ステップS403)。そして、分類した各グループのIDであるシーングループIDを各グループに付与してシーングループを作成し(ステップS404)、各シーンに各シーングループIDを付与する(ステップS405)。シーン分類手段103は、各シーンに付与されたシーングループIDを各シーンに対応付けてシーン情報ファイルに記録する。図5のシーングループIDの欄に、各シーンに付与されたシーングループIDの一例を示す。シーン分類手段103は、シーン番号「S1」が付与されている各フレームに、シーングループID「a」を付与し、以下、図5に示すように、シーングループID「b」から「f」までを付与したものとする。シーン分類手段103は、映像データ101とシーン情報ファイルとをシーン群抽出手段104に出力する。
【0036】
つぎに、シーン分類手段104の動作について説明する。図7は、本発明におけるシーン検出手段104の動作を示すフローチャートである。シーン群抽出手段104は、映像データ101とシーン情報ファイルが入力されると(ステップS501)、シーン情報ファイルに記録されているシーングループIDに基づいて、映像データ101の中にシーングループIDが繰り返し同じ順番で出現するシーングループIDの組を抽出する(ステップ502)。図5を参照すると、シーングループIDが、「abc」の順序で連続する組が存在することと、「dbe」の順序で連続する組が存在することとが分かる。そして、抽出したシーングループIDの組にシーン群グループIDを付与して複数のシーン群グループを作成する(ステップ503)。
【0037】
シーン群抽出手段104は、各シーンに付与されたシーン群グループIDを、各シーンに対応付けてシーン情報ファイルに記録する。図8に示すように、「abc」の順序で連続するシーングループIDの組を構成する各フレームに、シーン群グループID「sg1」を付与してシーン群グループを作成し、「dbe」の順序で連続するシーングループIDの組を構成する各フレームに、シーン群グループID「sg2」を付与してシーン群グループを作成したものとする。
【0038】
シーン分類手段104は、シーン情報ファイルを参照して、各シーン群グループが映像データ101に存在する数を特定する(ステップS504)。図5を参照すると、図8の出現回数の欄に示すように、シーン群グループ「sg1」が3回出現し、シーン群グループ「sg1」が2回出現している。そして、シーン群グループを出現回数の多い順序に並べ、シーン群グループIDと、シーン群グループが映像データ101に存在する数の情報と、シーン群グループの映像データ101における時間軸上の順序の情報とによって構成されるシーン群グループ情報を生成する。すなわち、シーン群グループ情報は、図8に示すような構成となる。シーン分類手段104は、シーン群グループ情報をシーン群決定手段105に出力する(ステップS506)。
【0039】
シーン群抽出手段104は、シーン群グループを抽出し、抽出した各シーン群グループをシーン群とする(ステップS507)。そして、抽出した各シーン群にシーン群IDを付与する(ステップS508)。シーン群抽出手段104は、各シーンに付与されたシーン群グループIDを、各シーンに対応付けてシーン情報ファイルに記録する。シーン番号「S1、S2、S3」にシーン群ID「SG1」を付与し、以下、図9に示すように、シーン群ID「SG2」から「SG5」までを付与したものとする。そして、シーン群のシーン群IDと、シーン群を構成する各シーンのシーン群グループIDの情報と、各シーン群の先頭のシーンチェンジフレームを特定する情報とによって構成されるシーン群情報を生成し、シーン群決定手段105に出力する(ステップS509)。また、シーン群抽出手段104は、シーン情報ファイルと、シーン群と、シーン群として抽出されなかった各シーンとをシーン群決定手段105に出力する。
【0040】
つぎに、シーン群決定手段105の動作について説明する。図7は、本発明におけるシーン群決定手段105の動作を示すフローチャートである。シーン群決定手段105は、シーン群グループ情報と、シーン群抽出手段104がシーン群として抽出しなかった残りのシーンが入力されると(ステップS601)、シーンチェンジ位置情報に基づいて、シーンを区切る。そして、シーン群グループを出現回数の多い順から1つ選択する(ステップS602)。図8を参照すると、シーン群グループ「sg01」の出現回数が最も多いので、シーン群グループ「sg01」を選択する。そして、シーン群抽出手段104がシーン群として抽出しなかった残りのシーンの並びのうち、時間軸に沿った連続したシーンの並びを1つ特定する(ステップS603)。例えば、図9におけるシーン番号「S10」から「S12」までを特定する。
【0041】
そして、特定したシーンの並びと、シーン群グループとのマッチングをおこなう。すなわち、シーン群抽出手段104がシーン群として抽出しなかった残りのシーンのうち、選択したシーン群グループの最初のシーンのシーングループIDと同じシーングループIDを有するシーンを特定する。そして、特定したシーンと連続したシーンであって、時間軸上における後方に、選択したシーン群グループの最後のシーンのシーングループIDと同じシーングループIDを有するシーンが存在していた場合、選択したシーン群グループの最初のシーンのシーングループIDと同じシーングループIDを有するシーンから、選択したシーン群グループの最後のシーンのシーングループIDと同じシーングループIDを有するシーンまでのシーンをシーン群として抽出し、シーン群IDを付与する(ステップS604、605)。シーン群決定手段105は、シーン群IDを各シーンに対応付けてシーン情報ファイルに記録する。シーン群決定手段105は、このとき抽出したシーン群の情報を新たに含むシーン群情報を生成して、蓄積手段106に出力してもよい。
【0042】
図8を参照すると、シーン群グループ「sg01」の最初のシーンのシーングループIDは「a」である。そこで、シーン情報ファイルを用いて、図9におけるシーン「S10」から「S12」のうちシーングループIDが「a」であるシーンを検索すると、シーン「S10」のシーングループIDが「a」であることが分かる。また、シーン群グループ「sg01」の最後のシーンのシーングループIDは「c」である。そこで、シーン「S10」から「S12」までのうち、シーン「S10」から時間軸上における後方に、シーングループIDが「c」であるシーンを検索する。すると、シーン「S12」のシーングループIDが「c」であることが分かる。そこで、シーン「S10」から「S12」までを、シーン群として抽出し、シーン群ID「SG06」を付与する。
【0043】
シーン群決定手段105は、特定したシーンの並びのうち、シーン群グループとマッチングを行わなかったシーンが存在するか否かを判断し(ステップS604)、存在していた場合、ステップS605の動作を行う。特定したシーンの並び「S10」から「S12」までのうち、シーン群グループとマッチングをしなかったシーンの並びは存在しないため、ステップS605の動作は行わない。そして、シーン群として抽出しなかった他のシーンにおける時間軸に沿った連続したシーンの並びについて、ステップS605およびステップS606の動作を行ったか否かを判断し(ステップS607)、動作を行っていない並びを選択して(ステップS603)、同様の動作を行う。
【0044】
図9を参照すると、シーン「S16」から「S20」までについて同様の動作を行う。すなわち、シーン「S16」から「S20」までのうちシーングループIDが「a」であるシーンを検索すると、シーン「S16」のシーングループIDが「a」であることが分かる。また、シーン群グループ「sg01」の最後のシーンのシーングループIDは「c」である。そこで、シーン「S16」から「S20」までのうち、シーン「S16」から時間軸上における後方に、シーングループIDが「c」であるシーンを検索する。すると、シーン「S17」のシーングループIDが「c」であることが分かる。そこで、シーン「S16」から「S17」までを、シーン群として抽出し、シーン群ID「SG07」を付与する。
【0045】
次に、シーン「S18」から「S20」までのうちシーングループIDが「a」であるシーンを検索すると、シーングループIDが「a」であるシーンは存在しない。シーン群決定手段105は、全てのシーンの並びについて、シーン群グループ「sg01」とのマッチングが終了すると、全てのシーン群グループによるマッチングが終了したか否かを判断する(ステップS607)。図8を参照すると、シーン群グループ「sg02」についてマッチングを行っていないので、シーン群決定手段105は、シーン群グループ「sg02」を選択して(ステップS602)、マッチングを行う。そして、シーン群として抽出しなかった残りのシーンの並びのうち、時間軸に沿った連続したシーンの並びを特定する(ステップS603)。すると、図9におけるシーン番号「S18」から「S20」までを特定される。
【0046】
図8を参照すると、シーン群グループ「sg02」の最初のシーンのシーングループIDは「d」である。そこで、図9におけるシーン「S18」から「S20」のうちシーングループIDが「d」であるシーンを検索すると、シーン「S18」のシーングループIDが「d」であることが分かる。また、シーン群グループ「sg02」の最後のシーンのシーングループIDは「e」である。そこで、シーン「S18」から「S20」までのうち、シーン「S18」から時間軸上における後方に、シーングループIDが「e」であるシーンを検索する。すると、シーン「S19」のシーングループIDが「e」であることが分かる。そこで、シーン「S18」から「S19」までを、シーン群として抽出し、シーン群ID「SG08」を付与する。
【0047】
残ったシーンは、シーン「S20」のみである。シーンがただ一つだけの場合は、シーン群決定手段105は、シーン群の抽出を行わない。シーン群決定手段105は、全てのシーンの並びと、全てのシーン群グループによるマッチングが終了したと判断する。
【0048】
シーン群決定手段105は、全てのシーンの並びと、全てのシーン群グループによるマッチングを行ってもシーン群として抽出されなかった時間軸に沿った1つ以上のシーンの並びを、シーングループの出現順が一致するシーン群グループが存在しないシーン群と決定し(ステップS608)、決定された複数のシーン群にシーン群IDを付与する(ステップS609)。シーン「S20」に、シーン群ID「SG09」を付与する。図11に、映像データ101の全てのシーンにシーン群IDを付与した結果を示す。
【0049】
シーン群決定手段105は、シーン群決定手段105が抽出したシーン群の、シーン群IDと、シーン群を構成する各シーンのシーン群グループIDの情報と、各シーン群の先頭のシーンチェンジフレームを特定する情報とを新たに含む、シーン群情報を生成する。そして、シーン群決定手段105は、シーン群グループ情報と、シーン群情報とを蓄積手段106に出力する(ステップS609)。
【0050】
蓄積手段106は、シーン群決定手段105が出力したシーン群グループ情報と、シーン群情報とをシーン群情報データベース107に蓄積する(ステップS205)。
【0051】
【発明の効果】
以上のように、本発明によれば、入力された映像をシーンの特徴量で分類してシーンの集まりであるシーン群に区分する編集を自動的に行うことができる。また、シーンが繰り返し同じ順番で出現する構造である繰り返し構造が入力した映像に含まれる場合に、繰り返し構造をシーン群として抽出できる。すると、本発明による映像編集装置による映像の編集後、一の繰り返し構造に含まれる一のシーンを検索する際に、シーン群を検索することにより、所望のシーンの映像を発見することができる効果がある。
【図面の簡単な説明】
【図1】 本発明の実施の形態の一構成例を示すブロック図である。
【図2】 本発明の実施の形態の動作を示すフローチャートである。
【図3】 本発明によるシーン検出手段の動作を示すフローチャートである。
【図4】 本発明の実施の形態が編集の対象とする映像データのフレーム構成例を示した図である。
【図5】 映像データの各シーンのシーン番号と各シーンに付与されたシーングループIDとを示した図である。
【図6】 本発明によるシーン分類手段の動作を示すフローチャートである。
【図7】 本発明によるシーン抽出手段の動作を示すフローチャートである。
【図8】 シーン群グループIDと、シーングループIDの出現順と、シーン群グループの出現回数とを示した図である。
【図9】 シーン番号と、シーングループIDと、シーン抽出手段が抽出したシーン群のシーン群IDとを示した図である。
【図10】 本発明によるシーン決定手段の動作を示す流れ図である。
【図11】 シーン番号と、シーングループIDと、シーン抽出手段が抽出したシーン群のシーン群IDとシーン決定手段が決定したシーン群のシーン群IDとを示した図である。
【図12】 特許文献1に記載の、従来の映像編集システムの実施の形態の構成を示すブロック図である。
【図13】 特許文献2に記載の、従来の映像編集システム実施の形態の構成を示すブロック図である。
【符号の説明】
101 映像データ
102 シーン検出手段
103 シーン分類手段
104 シーン群抽出手段
105 シーン群決定手段
106 蓄積手段
107 シーン群情報データベース
121 符号パラメータ抽出部
122 シーンチェンジフレーム検出部
123 シーン群決定部
124 シーン情報階層化部
125 蓄積部
131 特徴量抽出部
132 量子化部
133 計数部
701 第1のシーンチェンジの先頭フレーム
702 第2のシーンチェンジの先頭フレーム
703 第3のシーンチェンジの先頭フレーム
704 第4のシーンチェンジの先頭フレーム
705 第5のシーンチェンジの先頭フレーム
706 第6のシーンチェンジの先頭フレーム
707 第7のシーンチェンジの先頭フレーム
708 第8のシーンチェンジの先頭フレーム
709 第9のシーンチェンジの先頭フレーム
710 第10のシーンチェンジの先頭フレーム
711 第11のシーンチェンジの先頭フレーム
712 第12のシーンチェンジの先頭フレーム
713 第13のシーンチェンジの先頭フレーム
714 第14のシーンチェンジの先頭フレーム
715 第15のシーンチェンジの先頭フレーム
716 第16のシーンチェンジの先頭フレーム
717 第17のシーンチェンジの先頭フレーム
718 第18のシーンチェンジの先頭フレーム
719 第19のシーンチェンジの先頭フレーム
720 第20のシーンチェンジの先頭フレーム
721 第21のシーンチェンジの先頭フレーム
722 第22のシーンチェンジの先頭フレーム
723 第23のシーンチェンジの先頭フレーム
724 第24のシーンチェンジの先頭フレーム[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a video editing apparatus, a video editing method, and a video editing program that divide video data for each video scene.
[0002]
[Prior art]
In recent years, moving images have been handled by personal computers and the like, and it has become important to efficiently perform operations such as moving image search and editing. When searching or editing a moving image, it is necessary to disassemble the moving image into scenes that make up the moving image and grasp the arrangement, configuration, and the like of each scene in the moving image. Here, the scene means a unit in which a camera is switched in a moving image or a unit in which a sound (for example, a speaker) is switched.
[0003]
As an example of a video editing system that edits a video using video data that is a signal obtained by encoding a video when editing a video that is a moving image, a conventional video editing system described in
[0004]
Here, the scene group determination unit 123 calculates a time difference between scene change frames, which is a difference in position of scene change frames of adjacent scenes. Then, the time difference between the calculated frames is compared with a predetermined threshold, and if the time difference between the scene change frames is equal to or greater than the predetermined threshold, it is determined that adjacent scenes belong to different scene groups, A scene that is temporally later among adjacent scenes is set as the first scene of a new scene group. If the time difference between scene change frames is equal to or smaller than a predetermined threshold value, adjacent scenes are determined to belong to the same scene group. In this way, the scene group determination unit 123 compares the time difference between scene change frames for all adjacent scenes with a predetermined threshold value, and divides the entire video into scene groups.
[0005]
A block diagram of FIG. 13 shows an example of the configuration of a conventional video structuring apparatus described in
[0006]
[Patent Document 1]
JP 2001-326901 A (page 4-7, FIG. 1)
[Patent Document 2]
Japanese Patent Laid-Open No. 11-242585 (page 4-10, FIG. 1)
[0007]
[Problems to be solved by the invention]
The video editing system described in
[0008]
In addition, the video structuring apparatus described in
[0009]
Accordingly, the present invention provides a video editing apparatus, a video editing method, and a video that automatically classify the entire input video into scene groups using the appearance order and the number of appearances of scenes included in the input video. The purpose is to provide an editing program.
[0010]
[Means for Solving the Problems]
A video editing apparatus according to the present invention detects a scene change that is a timing at which a video scene changes according to input video data, and extracts a scene detection unit that divides the video data into a plurality of scenes and a feature amount of each scene Then, according to the extracted feature amount, a scene group in which each scene in the video data is classified into a plurality of groups is generated, and correspondence information for identifying each scene group is associated with each scene, and on the time axis Scene group extraction means for identifying and extracting a set of scenes corresponding to the correspondence information appearing in the same sequence multiple times as a scene group, an arrangement of scene groups that were not extracted by the scene group extraction means, and a scene Matches the scene group extracted by the group extraction means, and includes the scene group sequence in the scene group according to the matching result. And a scene group determination means that, characterized by comprising a means for storing the information of the result of classifying the image data into the scene group.
[0011]
The scene group determining means determines whether the scene group of the first scene of the scene group matches the scene group of the first scene in the sequence of the scene groups, and the scene group of the last scene of the scene group, It may be determined whether or not the scene group of the last scene in the sequence of scene groups matches, and the sequence of scene groups determined to match together may be included in the scene group. According to such a configuration, an arrangement of scene groups similar to the configuration of the scene group can be specified as the scene group.
[0012]
The scene group determination means may perform matching by selecting scene groups in descending order of appearances in the video data. If there are multiple scene groups having the same number of appearances in the video data, Matching may be performed by selecting scene groups in the order in which they appear. According to such a configuration, it is possible to specify each scene constituting a repeating structure in which similar scenes repeatedly appear in the same order as a scene group.
[0013]
The scene group determination means may specify an arrangement of scenes not specified as a scene group as a result of matching as a scene group. According to such a configuration, the arrangement of all scenes can be specified as a scene group.
[0014]
The video editing apparatus according to the present invention detects a scene change that is a timing at which a video scene changes according to input video data or a timing at which a sound switches, and generates position information for specifying the position of the scene change on the time axis. Scene detection means for dividing video data into a plurality of sections sandwiched between scene changes, creating scenes by assigning scene numbers to the plurality of sections divided in time order, and outputting the plurality of created scenes;
The feature quantity of the plurality of scenes created by the scene detection means is extracted to calculate the similarity between the scenes, and the plurality of scenes are classified into a plurality of groups based on the similarity between the scenes. A scene classification unit that assigns a scene group ID to a group, creates a plurality of scene groups, and assigns a scene group ID that identifies the scene group to each of the plurality of scenes, and a scene in which the scene group IDs repeatedly appear in the same order A group ID group is extracted, a scene group group ID is assigned to the plurality of extracted scene group ID groups to create a plurality of scene group groups, and the number of times the plurality of scene group groups appear in the video data is counted. Arranged in descending order of appearance frequency, and the scene group group ID and the appearance order of the scene group ID are input for each scene group. Scene group group information including the number of appearances in the image data is output, and a set of scenes along the time axis in which the appearance order of the scene group IDs matches the appearance order of the scene group IDs of the scene group groups As a group, a scene group ID for identifying the scene group is assigned to the extracted plurality of scene groups, and the appearance order of the scene group ID and the scene group ID matches the appearance order of the scene group ID in the extracted scene group Scene group extraction means for outputting scene group information composed of a scene group group ID of the scene group to be performed and position information of the first scene change of the extracted scene group, and the number of appearances of the scene group in the video data The scenes are selected one by one in descending order, and the scenes that have not been extracted as scene groups by the scene group extraction means are consecutive on the time axis. A scene with the same scene group ID as the scene group ID of the first scene of the selected scene group exists in the selected scene sequence, and the selected scene sequence has a time axis more than that scene. When there is a scene having the same scene group ID as the scene group ID of the last scene of the selected scene group group, the scene group ID is the same as the scene group ID of the first scene of the selected scene group group. A set of scenes starting with a scene and ending with a scene having the same scene group ID as the scene group ID of the last scene of the selected scene group group is extracted as a scene group, and the scene group is specified for the extracted scene groups. Scene group ID to be assigned, the scene group ID of the extracted scene group and the selected scene group group Generating scene group information consisting of the scene group group ID of the group and the position information of the first scene change of the extracted scene group, and arranging all the scenes selected for scene group extraction and all selected scenes There is no scene group in which the order of appearance of the scene groups matches the sequence of one or more scenes along the time axis that is not extracted as a scene group even if the scene group group information is used. It is determined as a scene group, a scene group ID is assigned to the determined plurality of scene groups, and a value that means that there is no scene group group in which the appearance order of the scene group and the scene group matches is determined. Scene determination means for generating scene group information composed of position information of the first scene change, and scene group information as scene group information database Characterized by comprising a means for storing the scan.
[0015]
The video editing method according to the present invention detects a scene change that is a timing at which a video scene changes according to input video data, divides the video data into scenes, extracts scene feature values, and extracts the extracted feature values. In response, a scene group is generated by classifying the scenes into groups, and the scene group sequence that appears multiple times on the time axis of the video data is identified and extracted as a scene group that is a collection of scenes. To match the scene group sequence and the scene group that did not become, identify the scene group sequence as a scene group according to the matching result, and accumulate information on the result of classifying the video data into scene groups Features.
[0016]
According to the video editing method of the present invention, a scene change that is a timing at which a video scene is switched or a voice is switched according to input video data is detected to generate position information for specifying the position of the scene change on the time axis. Divide video data into multiple sections sandwiched between scene changes, create scenes by assigning scene numbers to the divided sections in chronological order, and output the created multiple scenes. Scene features are extracted to calculate the similarity between scenes, and multiple scenes are classified into multiple groups based on the similarity between scenes. A plurality of scene groups are created by assigning IDs, and scene group IDs are assigned to each of the plurality of scenes. A set of scene group IDs in which scene group IDs repeatedly appear in the same order is extracted, and a plurality of scene group groups are created by assigning scene group group IDs to the extracted sets of scene group IDs. Count the number of times the group groups appear in the video data and arrange them in the descending order of appearance. Each scene group group is composed of the scene group group ID, the order of appearance of the scene group ID, and the number of appearances in the input video data. A scene group group information is output, a set of a plurality of scenes along the time axis in which the appearance order of the scene group ID matches the appearance order of the scene group ID of the scene group group is extracted as a scene group, and the extracted plurality of scenes A scene group ID that identifies the scene group is assigned to the group, and the scene group ID and the appearance order of the scene group ID are extracted. Output scene group information composed of the scene group ID of the scene group that matches the order of appearance of the scene group ID in the scene group and the position information of the first scene change of the extracted scene group. Select one by one in descending order of appearance in the video data, select one sequence of consecutive scenes on the time axis from the remaining scenes not extracted as a scene group, and select the sequence of selected scenes. There is a scene having the same scene group ID as the scene group ID of the first scene of the selected scene group group, and the scene group ID of the last scene of the selected scene group group is located behind the scene on the time axis. When a scene having the same scene group ID exists, the scene group ID of the first scene of the selected scene group group and A plurality of scenes are extracted by extracting a set of scenes starting with a scene having the same scene group ID and ending with a scene having the same scene group ID as the scene group ID of the last scene of the selected scene group group. A scene group ID for specifying a scene group is assigned to the group, and the scene group ID of the extracted scene group, the scene group group ID of the selected scene group group, and the position information of the first scene change of the extracted scene group Generate configured scene group information, and repeat the extraction of scene groups for all selected scenes and all selected scene group groups. Even if scene group group information is used, they are not extracted as scene groups. A group of scene groups in which the order of appearance of the scene groups matches the arrangement of one or more scenes along the time axis Is determined to be a value that means that there is no scene group having the same appearance order of the scene group and the scene group by assigning a scene group ID to the determined plurality of scene groups. Scene group information composed of position information of a scene change at the head of the scene group is generated, and the scene group information is stored in a scene group information database.
[0017]
A video editing program according to the present invention is a video editing program installed in a video editing apparatus that edits video data to generate a scene group that is a collection of scenes. Processing to detect a scene change that is the timing when the scene changes, divide the video data into scenes, extract scene feature values, and generate scene groups that classify scenes into groups according to the extracted feature values And a process of extracting scene groups that appear in the same sequence multiple times on the time axis of the video data as scene groups that are a collection of scenes, and the arrangement and extraction of scene groups that were not subject to extraction Matching with the selected scene group, and including the arrangement of the scene group in the scene group according to the matching result Characterized in that it comprises a process of storing the information of the result of classifying the image data into the scene groups in the storage device.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration example of an embodiment of the present invention. The video editing apparatus according to the present invention detects a scene change which is a scene where a camera included in
[0019]
When the
[0020]
The
[0021]
When the
[0022]
The
[0023]
When the
[0024]
The scene group extraction means 104 is a scene group constituted by a scene group group ID, information on the number of scene group groups existing in the
[0025]
The scene
[0026]
The scene
[0027]
The selected scene is a scene that is continuous with the specified scene and has a scene group ID that is the same as the scene group ID of the last scene of the selected scene group group on the rear side in the time axis. A scene between a scene having the same scene group ID as the scene group ID of the first scene of the scene group and a scene having the same scene group ID as the last scene of the selected scene group As a group, a scene group ID for specifying the scene group is assigned to each scene constituting the scene group. The scene
[0028]
The scene group determining means 105 selects the scene groups in the order of appearance frequency for all the input scene groups and performs the above processing. If there are a plurality of scene groups having the same appearance frequency, The scene group is selected in the order of appearance, and the above processing is performed to extract the scene group. Then, the above process is performed for all input scene groups. Scenes that are not extracted even if the above processing is performed are extracted as scene groups, and a scene group ID that identifies the scene group is assigned to each scene constituting the scene group. The scene
[0029]
The scene
[0030]
The
[0031]
A video editing program according to the present invention is a video editing program that is mounted on a video editing device that edits video data and generates a scene group that is a collection of scenes and realizes each means, and is input to a computer A scene that detects the scene change that is the timing when the video scene changes due to the video data, divides the video data into scenes, extracts the scene features, and classifies the scenes into groups according to the extracted features Processing to generate groups, processing to identify and extract scene groups that appear in the same order multiple times on the video data time axis, and scenes that were not subject to extraction Match the sequence of groups and scene groups, and identify the scene group sequence as a scene group according to the matching result. Comprising a processing, and processing to store the information of the result of classifying the image data into the scene groups in the storage device.
[0032]
Next, the operation of the embodiment of the present invention will be described with reference to the drawings. FIG. 2 is a flowchart showing the operation of the video editing apparatus according to the embodiment of the present invention. 2, step S201 represents the operation of the
[0033]
The operation of each means will be described. First, the operation of the
[0034]
The scene detection means 102 divides the
[0035]
Next, the operation of the
[0036]
Next, the operation of the
[0037]
The scene
[0038]
The
[0039]
The scene group extraction means 104 extracts a scene group group and sets each extracted scene group group as a scene group (step S507). Then, a scene group ID is assigned to each extracted scene group (step S508). The scene
[0040]
Next, the operation of the scene
[0041]
Then, matching between the specified scene sequence and the scene group is performed. That is, the scene having the same scene group ID as the scene group ID of the first scene of the selected scene group among the remaining scenes not extracted as the scene group by the scene
[0042]
Referring to FIG. 8, the scene group ID of the first scene of the scene group group “sg01” is “a”. Therefore, when a scene having the scene group ID “a” in the scenes “S10” to “S12” in FIG. 9 is searched using the scene information file, the scene group ID of the scene “S10” is “a”. I understand that. The scene group ID of the last scene of the scene group group “sg01” is “c”. Therefore, the scene having the scene group ID “c” is searched from the scenes “S10” to “S12” on the time axis behind the scene “S10”. Then, it can be seen that the scene group ID of the scene “S12” is “c”. Therefore, scenes “S10” to “S12” are extracted as scene groups, and a scene group ID “SG06” is assigned.
[0043]
The scene group determination means 105 determines whether or not there is a scene that has not been matched with the scene group group in the specified sequence of scenes (step S604). If there is a scene, the operation of step S605 is performed. Do. Since there is no scene sequence that has not been matched with the scene group among the specified sequence of scenes “S10” to “S12”, the operation of step S605 is not performed. Then, it is determined whether or not the operations in steps S605 and S606 have been performed on the sequence of consecutive scenes along the time axis in the other scenes not extracted as the scene group (step S607), and no operation is performed. A sequence is selected (step S603), and the same operation is performed.
[0044]
Referring to FIG. 9, the same operation is performed for scenes “S16” to “S20”. That is, when a scene with the scene group ID “a” is searched from the scenes “S16” to “S20”, it is found that the scene group ID of the scene “S16” is “a”. The scene group ID of the last scene of the scene group group “sg01” is “c”. Therefore, among the scenes “S16” to “S20”, the scene having the scene group ID “c” is searched behind the scene “S16” on the time axis. Then, it can be seen that the scene group ID of the scene “S17” is “c”. Therefore, scenes “S16” to “S17” are extracted as scene groups, and a scene group ID “SG07” is assigned.
[0045]
Next, when a scene with the scene group ID “a” is searched from the scenes “S18” to “S20”, there is no scene with the scene group ID “a”. When the matching with the scene group group “sg01” is finished for all the scene arrangements, the scene
[0046]
Referring to FIG. 8, the scene group ID of the first scene of the scene group “sg02” is “d”. Therefore, when the scene having the scene group ID “d” is searched from the scenes “S18” to “S20” in FIG. 9, it is found that the scene group ID of the scene “S18” is “d”. The scene group ID of the last scene of the scene group group “sg02” is “e”. Therefore, among the scenes “S18” to “S20”, the scene having the scene group ID “e” is searched behind the scene “S18” on the time axis. Then, it can be seen that the scene group ID of the scene “S19” is “e”. Therefore, scenes “S18” to “S19” are extracted as scene groups, and a scene group ID “SG08” is assigned.
[0047]
The only remaining scene is the scene “S20”. If there is only one scene, the scene group determination means 105 does not extract the scene group. The scene group determination means 105 determines that the alignment of all scenes and the matching by all scene group groups have been completed.
[0048]
The scene group determination means 105 displays the arrangement of all scenes and the arrangement of one or more scenes along the time axis that are not extracted as scene groups even after matching by all scene group groups. A scene group having no matching scene group is determined (step S608), and a scene group ID is assigned to the determined plurality of scene groups (step S609). The scene group ID “SG09” is assigned to the scene “S20”. FIG. 11 shows the result of assigning scene group IDs to all the scenes of the
[0049]
The scene
[0050]
The accumulating
[0051]
【The invention's effect】
As described above, according to the present invention, it is possible to automatically perform editing in which the input video is classified by the scene feature amount and is classified into a scene group which is a collection of scenes. In addition, when a repeated structure, which is a structure in which scenes repeatedly appear in the same order, is included in the input video, the repeated structure can be extracted as a scene group. Then, after editing the video by the video editing apparatus according to the present invention, when searching for one scene included in one repeating structure, it is possible to find a video of a desired scene by searching for a scene group There is.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration example of an embodiment of the present invention.
FIG. 2 is a flowchart showing the operation of the exemplary embodiment of the present invention.
FIG. 3 is a flowchart showing the operation of the scene detection means according to the present invention.
FIG. 4 is a diagram showing a frame configuration example of video data to be edited by the embodiment of the present invention.
FIG. 5 is a diagram showing a scene number of each scene of video data and a scene group ID assigned to each scene.
FIG. 6 is a flowchart showing the operation of the scene classification means according to the present invention.
FIG. 7 is a flowchart showing the operation of the scene extracting means according to the present invention.
FIG. 8 is a diagram showing scene group group IDs, appearance order of scene group IDs, and number of appearances of scene group groups.
FIG. 9 is a diagram showing a scene number, a scene group ID, and a scene group ID of a scene group extracted by a scene extracting unit.
FIG. 10 is a flowchart showing the operation of the scene determining means according to the present invention.
FIG. 11 is a diagram showing a scene number, a scene group ID, a scene group ID of a scene group extracted by a scene extraction unit, and a scene group ID of a scene group determined by a scene determination unit.
12 is a block diagram showing a configuration of an embodiment of a conventional video editing system described in
13 is a block diagram showing a configuration of a conventional video editing system embodiment described in
[Explanation of symbols]
101 Video data
102 Scene detection means
103 Scene classification means
104 Scene group extraction means
105 Scene group determining means
106 Storage means
107 Scene group information database
121 Code parameter extraction unit
122 Scene change frame detector
123 Scene group determination unit
124 Scene information layering section
125 Accumulator
131 Feature extraction unit
132 Quantization unit
133 Counting unit
701 First frame of the first scene change
702 First frame of second scene change
703 The first frame of the third scene change
704 First frame of the fourth scene change
705 First frame of the fifth scene change
706 First frame of the sixth scene change
707 First frame of the seventh scene change
708 First frame of the eighth scene change
709 First frame of the ninth scene change
710 First frame of the 10th scene change
711 The first frame of the eleventh scene change
712 First frame of the 12th scene change
713 First frame of the 13th scene change
714 First frame of the 14th scene change
715 First frame of 15th scene change
716 First frame of the 16th scene change
717 First frame of the 17th scene change
718 First frame of the 18th scene change
719 The first frame of the 19th scene change
720 First frame of the 20th scene change
721 The first frame of the 21st scene change
722 First frame of the 22nd scene change
723 First frame of the 23rd scene change
724 First frame of the 24th scene change
Claims (8)
各シーンの特徴量を抽出し、抽出した特徴量に応じて、映像データにおける各シーンを複数のグループに分類したシーングループを生成し、各シーングループを特定する対応情報を各シーンに対応付けるシーン分類手段と、
時間軸上で複数回同じ並びで出現する対応情報の並びに応じたシーンの集まりをシーン群と特定して抽出するシーン群抽出手段と、
前記シーン群抽出手段の抽出の対象とならなかったシーングループの並びと、前記シーン群抽出手段が抽出したシーン群とのマッチングを行い、マッチングの結果に応じてシーングループの並びをシーン群に含めるシーン群決定手段と、
映像データをシーン群に分類した結果の情報を蓄積する蓄積手段と
を備えたことを特徴とする映像編集装置。A scene detection unit that detects a scene change that is a timing at which a video scene changes according to input video data, and divides the video data into a plurality of scenes;
A scene classification that extracts the feature amount of each scene, generates a scene group in which each scene in the video data is classified into a plurality of groups according to the extracted feature amount, and associates correspondence information for identifying each scene group with each scene Means,
Scene group extraction means for identifying and extracting a set of scenes corresponding to a series of corresponding information appearing in the same sequence multiple times on the time axis;
Matches the sequence of scene groups that have not been extracted by the scene group extraction unit with the scene group extracted by the scene group extraction unit, and includes the sequence of scene groups in the scene group according to the matching result Scene group determination means;
A video editing apparatus comprising storage means for storing information as a result of classifying video data into scene groups.
シーン群の最初のシーンのシーングループと、シーングループの並びのうち最初のシーンのシーングループとが一致するか否か判定し、
シーン群の最後のシーンのシーングループと、シーングループの並びのうち最後のシーンのシーングループとが一致するか否か判定し、
ともに一致すると判定されたシーングループの並びをシーン群に含める
請求項1に記載の映像編集装置。The scene group determination means
Determine whether the scene group of the first scene in the scene group matches the scene group of the first scene in the sequence of scene groups,
Determine whether the scene group of the last scene in the scene group matches the scene group of the last scene in the sequence of scene groups,
The video editing apparatus according to claim 1, wherein the scene group includes an arrangement of scene groups determined to match each other.
請求項2に記載の映像編集装置。The scene group determination means performs matching by selecting scene groups in descending order of appearance in the video data, and when there are multiple scene groups having the same number of appearances in the video data, they appear on the time axis. The video editing apparatus according to claim 2, wherein matching is performed by selecting scene groups in order.
請求項2または請求項3に記載の映像編集装置。4. The video editing apparatus according to claim 2, wherein the scene group determining means identifies a sequence of scenes not identified as a scene group as a result of matching as a scene group.
前記シーン検出手段で作成された前記複数のシーンの特徴量を抽出してシーン間の類似度を算出し、前記シーンの間の類似度に基づいて前記複数のシーンを複数のグループに分類し、分類した前記複数のグループにシーングループIDを付与して複数のシーングループを作成し、前記複数のシーンのそれぞれにシーングループを特定する前記シーングループIDを付与するシーン分類手段と、
前記シーングループIDが繰り返し同じ順番で出現する前記シーングループIDの組を抽出し、抽出された前記複数のシーングループIDの組にシーン群グループIDを付与して複数のシーン群グループを作成し、前記複数のシーン群グループが映像データに出現する回数を数えて出現回数の多い順に並べ、前記シーン群グループごとにシーン群グループIDとシーングループIDの出現順と入力された映像データ中の出現回数とで構成されるシーン群グループ情報を出力し、前記シーングループIDの出現順が前記シーン群グループのシーングループIDの出現順に一致する時間軸に沿った複数のシーンの組をシーン群として抽出し、抽出された前記複数のシーン群にシーン群を特定するシーン群IDを付与し、前記シーン群IDとシーングループIDの出現順が前記抽出されたシーン群でのシーングループIDの出現順に一致するシーン群グループのシーン群グループIDと抽出された前記シーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を出力するシーン群抽出手段と、
前記シーン群グループを映像データ中の出現回数が多い順から1つずつ選択し、前記シーン群抽出手段でシーン群として抽出されなかった残りのシーンから時間軸上で連続したシーンの並びを1つずつ選択し、選択した前記シーンの並びの中に選択した前記シーン群グループの最初のシーンのシーングループIDと同じシーングループIDを持つシーンが存在し、そのシーンより時間軸上で後ろに、選択した前記シーン群グループの最後のシーンのシーングループIDと同じシーングループIDを持つシーンが存在する場合に、選択した前記シーン群グループの最初のシーンのシーングループIDと同じシーングループIDを持つ前記シーンで始まり、選択した前記シーン群グループの最後のシーンのシーングループIDと同じシーングループIDを持つ前記シーンで終わる複数のシーンの組をシーン群として抽出し、抽出した前記複数のシーン群にシーン群を特定するシーン群IDを付与し、抽出された前記シーン群のシーン群IDと選択した前記シーン群グループのシーン群グループIDと抽出された前記シーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を生成し、前記シーン群の抽出を選択した全ての前記シーンの並びと選択した全ての前記シーン群グループとについて繰り返しおこない、前記シーン群グループ情報を利用してもシーン群として抽出されなかった時間軸に沿った1つ以上のシーンの並びをシーングループの出現順が一致するシーン群グループが存在しないシーン群と決定し、決定された前記複数のシーン群にシーン群IDを付与し、シーン群とシーングループの出現順が一致するシーン群グループが存在しないことを意味する値と決定された前記シーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を生成するシーン決定手段と、
前記シーン群情報をシーン群情報データベースに蓄積する蓄積手段と
を備えたことを特徴とする映像編集装置。Detects scene changes that are the timing of switching video scenes or the timing of switching audio based on the input video data, and generates position information that identifies the position of the scene change. Scene detection means for dividing video data into sections, creating scenes by assigning scene numbers to the plurality of sections divided in time order, and outputting the plurality of created scenes;
Extracting the feature quantities of the plurality of scenes created by the scene detection means to calculate the similarity between the scenes, classifying the plurality of scenes into a plurality of groups based on the similarity between the scenes, Scene classification means for creating a plurality of scene groups by assigning scene group IDs to the plurality of classified groups, and assigning the scene group IDs for specifying a scene group to each of the plurality of scenes;
Extracting a set of scene group IDs in which the scene group ID repeatedly appears in the same order, and creating a plurality of scene group groups by assigning a scene group group ID to the extracted set of scene group IDs; Count the number of appearances of the plurality of scene group groups in the video data, arrange them in descending order of appearance numbers, and for each scene group group, the appearance order of the scene group group ID and scene group ID and the number of appearances in the input video data And a group of a plurality of scenes along the time axis in which the appearance order of the scene group ID matches the appearance order of the scene group ID of the scene group group is extracted as a scene group. A scene group ID for specifying a scene group is assigned to the plurality of extracted scene groups, and the scene group ID and the scene are assigned. The scene group ID of the scene group that matches the order of appearance of the scene group ID in the extracted scene group and the positional information of the first scene change of the extracted scene group. Scene group extraction means for outputting scene group information;
The scene group groups are selected one by one in descending order of appearance in the video data, and one continuous scene sequence on the time axis is selected from the remaining scenes not extracted as scene groups by the scene group extracting means. There is a scene having the same scene group ID as the scene group ID of the first scene of the selected scene group in the selected scene sequence, and the scene is selected behind the scene on the time axis. The scene having the same scene group ID as the scene group ID of the first scene of the selected scene group group when there is a scene having the same scene group ID as the scene group ID of the last scene of the selected scene group group The same scene group as the scene group ID of the last scene of the selected scene group group starting with A set of a plurality of scenes ending with the scene having an ID is extracted as a scene group, a scene group ID for specifying the scene group is assigned to the extracted plurality of scene groups, and a scene group ID of the extracted scene group and All the scenes selected to generate scene group information including scene group group ID of the selected scene group group and position information of the first scene change of the extracted scene group, and selected to extract the scene group Iterate over all the selected scene group groups and the scene group appears as a sequence of one or more scenes along the time axis that was not extracted as a scene group using the scene group group information A scene group that does not have a scene group having the same order is determined, and a scene group ID is assigned to the plurality of determined scene groups; A scene that generates scene group information including a value that means that there is no scene group that matches the appearance order of the scene group and the scene group, and position information of the first scene change of the determined scene group A determination means;
A video editing apparatus comprising storage means for storing the scene group information in a scene group information database.
各シーンの特徴量を抽出し、抽出した特徴量に応じて、映像データにおける各シーンを複数のグループに分類したシーングループを生成し、各シーングループを特定する対応情報を各シーンに対応付け、
時間軸上で複数回同じ並びで出現する対応情報の並びに応じたシーンの集まりをシーン群と特定して抽出し、
抽出の対象とならなかったシーングループの並びとシーン群とのマッチングを行い、マッチングの結果に応じてシーングループの並びをシーン群と特定し、
映像データをシーン群に分類した結果の情報を蓄積する
を備えたことを特徴とする映像編集方法。Detects scene changes that are the timing when the video scene changes according to the input video data, divides the video data into multiple scenes,
Extracting the feature quantity of each scene, generating a scene group in which each scene in the video data is classified into a plurality of groups according to the extracted feature quantity, and associating correspondence information for identifying each scene group with each scene,
A set of scenes corresponding to a series of corresponding information appearing in the same sequence multiple times on the time axis is identified and extracted as a scene group,
Match the scene group and the scene group that was not the target of extraction, specify the scene group and the scene group according to the matching result,
A video editing method comprising storing information on a result of classifying video data into scene groups.
作成された前記複数のシーンの特徴量を抽出してシーン間の類似度を算出し、前記シーンの間の類似度に基づいて前記複数のシーンを複数のグループに分類し、分類した前記複数のグループを構成するフレームにシーングループIDを付与して複数のシーングループを作成し、前記複数のシーンのそれぞれにシーングループを特定する前記シーングループIDを付与し、
前記シーングループIDが繰り返し同じ順番で出現する前記シーングループIDの組を抽出し、抽出された前記複数のシーングループIDの組にシーン群グループIDを付与して複数のシーン群グループを作成し、前記複数のシーン群グループが映像データに出現する回数を数えて出現回数の多い順に並べ、前記シーン群グループごとにシーン群グループIDとシーングループIDの出現順と入力された映像データ中の出現回数とで構成されるシーン群グループ情報を出力し、前記シーングループIDの出現順が前記シーン群グループのシーングループIDの出現順に一致する時間軸に沿った複数のシーンの組をシーン群として抽出し、抽出された前記複数のシーン群にシーン群を特定するシーン群IDを付与し、前記シーン群IDとシーングループIDの出現順が前記抽出されたシーン群でのシーングループIDの出現順に一致するシーン群グループのシーン群グループIDと抽出された前記シーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を出力し、
前記シーン群グループを映像データ中の出現回数が多い順から1つずつ選択し、シーン群として抽出されなかった残りのシーンから時間軸上で連続したシーンの並びを1つずつ選択し、選択した前記シーンの並びの中に選択した前記シーン群グループの最初のシーンのシーングループIDと同じシーングループIDを持つシーンが存在し、そのシーンより時間軸上で後ろに、選択した前記シーン群グループの最後のシーンのシーングループIDと同じシーングループIDを持つシーンが存在する場合に、選択した前記シーン群グループの最初のシーンのシーングループIDと同じシーングループIDを持つ前記シーンで始まり、選択した前記シーン群グループの最後のシーンのシーングループIDと同じシーングループIDを持つ前記シーンで終わる複数のシーンの組をシーン群として抽出し、抽出した前記複数のシーン群にシーン群を特定するシーン群IDを付与し、抽出された前記シーン群のシーン群IDと選択した前記シーン群グループのシーン群グループIDと抽出された前記シーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を生成し、前記シーン群の抽出を選択した全ての前記シーンの並びと選択した全ての前記シーン群グループとについて繰り返しおこない、前記シーン群グループ情報を利用してもシーン群として抽出されなかった時間軸に沿った1つ以上のシーンの並びをシーングループの出現順が一致するシーン群グループが存在しないシーン群と決定し、決定された前記複数のシーン群にシーン群IDを付与し、シーン群とシーングループの出現順が一致するシーン群グループが存在しないことを意味する値と決定された前記シーン群の先頭のシーンチェンジの位置情報とで構成されるシーン群情報を生成し、
前記シーン群情報をシーン群情報データベースに蓄積する
ことを特徴とする映像編集方法。Detects scene changes that are the timing of switching video scenes or the timing of switching audio based on the input video data, and generates position information that identifies the position of the scene change. Dividing video data into sections, creating scenes by assigning scene numbers to the plurality of sections divided in time order, outputting the plurality of created scenes,
The feature quantities of the plurality of scenes created are extracted to calculate the similarity between scenes, the plurality of scenes are classified into a plurality of groups based on the similarity between the scenes, and the plurality of classified A plurality of scene groups are created by assigning scene group IDs to frames constituting the group, and each of the plurality of scenes is assigned the scene group ID for specifying a scene group,
Extracting a set of scene group IDs in which the scene group ID repeatedly appears in the same order, and creating a plurality of scene group groups by assigning a scene group group ID to the extracted set of scene group IDs; Count the number of appearances of the plurality of scene group groups in the video data, arrange them in descending order of appearance numbers, and for each scene group group, the appearance order of the scene group group ID and scene group ID and the number of appearances in the input video data And a group of a plurality of scenes along the time axis in which the appearance order of the scene group ID matches the appearance order of the scene group ID of the scene group group is extracted as a scene group. A scene group ID for specifying a scene group is assigned to the plurality of extracted scene groups, and the scene group ID and the scene are assigned. The scene group ID of the scene group that matches the order of appearance of the scene group ID in the extracted scene group and the positional information of the first scene change of the extracted scene group. Output scene group information,
The scene group groups are selected one by one from the order of appearance frequency in the video data, and the sequence of scenes that are consecutive on the time axis are selected one by one from the remaining scenes that are not extracted as scene groups. A scene having the same scene group ID as the scene group ID of the first scene of the selected scene group group exists in the sequence of scenes, and the scene group ID of the selected scene group group is located behind the scene on the time axis. If there is a scene having the same scene group ID as the scene group ID of the last scene, the selected scene starts with the scene having the same scene group ID as the scene group ID of the first scene of the selected scene group. The scene having the same scene group ID as the scene group ID of the last scene in the scene group Extracting a set of a plurality of scenes as a scene group, assigning a scene group ID for specifying a scene group to the extracted plurality of scene groups, and selecting the scene group ID of the extracted scene group and the selected scene group group Generating scene group information composed of the scene group group ID of the scene group and the position information of the first scene change of the extracted scene group, and selecting all of the scenes selected to extract the scene group and all the selected scenes. The scene group in which the order of appearance of the scene groups matches the sequence of one or more scenes along the time axis that is not extracted as a scene group even when the scene group group information is used. It is determined that the scene group does not exist, a scene group ID is assigned to the determined plurality of scene groups, and the scene group and the scene group are assigned. And generating a composed scene group information in the position information of the start of a scene change of the scene group scene group group is determined to a value that means it is absent the order of appearance matches,
A video editing method, wherein the scene group information is stored in a scene group information database.
コンピュータに、
入力された映像データによる映像のシーンが変わるタイミングであるシーンチェンジを検出して、映像データを複数のシーンに分割する処理と、
各シーンの特徴量を抽出し、抽出した特徴量に応じて、映像データにおける各シーンを複数のグループに分類したシーングループを生成し、各シーングループを特定する対応情報を各シーンに対応付ける処理と、
時間軸上で複数回同じ並びで出現する対応情報の並びに応じたシーンの集まりをシーン群と特定して抽出する処理と、
抽出の対象とならなかったシーングループの並びと抽出されたシーン群とのマッチングを行い、マッチングの結果に応じてシーングループの並びをシーン群に含める処理と、
映像データをシーン群に分類した結果の情報を記憶装置に記憶させる処理と
を備えたことを特徴とする映像編集プログラム。A video editing program installed in a video editing apparatus that edits video data and generates a scene group that is a collection of scenes,
On the computer,
A process of detecting a scene change that is a timing at which a video scene changes according to input video data, and dividing the video data into a plurality of scenes;
A process of extracting the feature amount of each scene, generating a scene group in which each scene in the video data is classified into a plurality of groups according to the extracted feature amount, and associating correspondence information identifying each scene group with each scene ,
A process of identifying and extracting a set of scenes corresponding to a series of corresponding information appearing in the same sequence multiple times on the time axis,
A process of matching the sequence of scene groups that were not extracted with the extracted scene groups, and including the sequence of scene groups in the scene groups according to the matching results;
A video editing program comprising: processing for storing information on a result of classifying video data into scene groups in a storage device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003132040A JP3918772B2 (en) | 2003-05-09 | 2003-05-09 | Video editing apparatus, video editing method, and video editing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003132040A JP3918772B2 (en) | 2003-05-09 | 2003-05-09 | Video editing apparatus, video editing method, and video editing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004336556A JP2004336556A (en) | 2004-11-25 |
JP3918772B2 true JP3918772B2 (en) | 2007-05-23 |
Family
ID=33507057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003132040A Expired - Fee Related JP3918772B2 (en) | 2003-05-09 | 2003-05-09 | Video editing apparatus, video editing method, and video editing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3918772B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5010292B2 (en) | 2007-01-18 | 2012-08-29 | 株式会社東芝 | Video attribute information output device, video summarization device, program, and video attribute information output method |
JP5209593B2 (en) * | 2009-12-09 | 2013-06-12 | 日本電信電話株式会社 | Video editing apparatus, video editing method, and video editing program |
KR102422493B1 (en) * | 2014-06-30 | 2022-07-20 | 소니그룹주식회사 | Information processor and information-processing method |
KR101776910B1 (en) * | 2016-07-26 | 2017-09-19 | 주식회사 핀텔 | System of processing video data improving image recognition speed by omitting images |
-
2003
- 2003-05-09 JP JP2003132040A patent/JP3918772B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004336556A (en) | 2004-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3780623B2 (en) | Video description method | |
JP4905103B2 (en) | Movie playback device | |
JP5005154B2 (en) | Apparatus for reproducing an information signal stored on a storage medium | |
JP4559935B2 (en) | Image storage apparatus and method | |
EP1081960B1 (en) | Signal processing method and video/voice processing device | |
KR100912984B1 (en) | Metadata edition device, metadata reproduction device, metadata distribution device, metadata search device, metadata regeneration condition setting device, contents distribution device, metadata distribution method, metadata regeneration device and metadata regeneration method | |
US7941031B2 (en) | Video processing apparatus, IC circuit for video processing apparatus, video processing method, and video processing program | |
EP1600973A1 (en) | Moving image processing apparatus and method | |
JP4778231B2 (en) | System and method for indexing video sequences | |
US20050257151A1 (en) | Method and apparatus for identifying selected portions of a video stream | |
CN102823265A (en) | Content processing device, method, and program | |
JP2011223325A (en) | Content retrieval device and method, and program | |
JP2002117037A (en) | Device and method for image retrieval and recording medium where the same method is written | |
US8634708B2 (en) | Method for creating a new summary of an audiovisual document that already includes a summary and reports and a receiver that can implement said method | |
JP4197014B2 (en) | Video search method and apparatus | |
JP5096259B2 (en) | Summary content generation apparatus and summary content generation program | |
JP3918772B2 (en) | Video editing apparatus, video editing method, and video editing program | |
JP4719604B2 (en) | Commercial detection method, commercial detection apparatus, and recording medium on which commercial detection program is recorded | |
JP3997882B2 (en) | Video search method and apparatus | |
JP2009022018A (en) | Method and device for retrieving video | |
JPH11265396A (en) | Music video classification method, its device and medium for recording music video classification program | |
JP2003069946A (en) | Video analyzer, video analysis method, video analysis program and its program recording medium | |
Volkmer et al. | Gradual transition detection using average frame similarity | |
JP2000261757A (en) | Method and system for classifying video block for edit and recording medium recording this method | |
CN101325679B (en) | Information processing apparatus, information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20051117 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20051117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070205 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100223 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110223 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110223 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120223 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120223 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130223 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130223 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140223 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |