WO2007039994A1

WO2007039994A1 - ダイジェスト作成装置およびそのプログラム

Info

Publication number: WO2007039994A1
Application number: PCT/JP2006/316511
Authority: WO
Inventors: Shinya Hashimoto; Harumi Nakamura
Original assignee: Pioneer Corporation
Priority date: 2005-09-30
Filing date: 2006-08-23
Publication date: 2007-04-12
Also published as: JP4757876B2; JPWO2007039994A1; EP1954041A1; EP1954041A4

Abstract

　視聴者の視聴意欲を損ねることがないダイジェストを作成可能なダイジェスト作成装置およびそのプログラムを提供することを課題とする。【解決手段】映像情報と音声情報の少なくともいずれか一方を含むコンテンツを取得するコンテンツ取得部２０と、取得したコンテンツの全コンテンツ区間から、映像情報と音声情報の少なくともいずれか一方に基づいて、ハイライトシーンを含む大音圧区間を検索する大音圧区間検索部４１と、全コンテンツ区間からハイライト区間を除いた残区間の中から、コンテンツのダイジェストを作成するための要素となる部分シーンを抽出する部分シーン抽出部３２と、抽出した部分シーンを用いて、ダイジェストを作成するダイジェスト作成部３３と、を備えたものである。

Description

明細書

ダイジェスト作成装置およびそのプログラム

技術分野

[0001] 本発明は、映像情報と音声情報の少なくともいずれか一方を含むコンテンツのダイジェストを作成するダイジェスト作成装置およびそのプログラムに関するものである。背景技術

[0002] 近年、映像情報や音声情報を含むコンテンツ (テレビ放送番組など)を記録'再生可能な記録再生装置にお、て、記録したコンテンツを要約したダイジェストを作成し、これを再生するものが知られている。このダイジェスト再生は、記録したコンテンツ中のハイライトシーンなど特徴的なシーンを中心に再生させることができるため、ユーザが短時間で大まかなコンテンツの内容を把握した!/、場合や、見た、番組を検索する場合に利用される。

[0003] ところで、ダイジェストを作成するに当たって、その特徴的なシーンを抽出する方法として、各種提案が為されている。例えば、特許文献 1や特許文献 2では、画像の顔領域が存在するフレーム、画像の連続性が無、フレーム（シーンチェンジ後のフレーム）等に応じて代表フレームを抽出し、当該代表フレームを先頭としてダイジェスト再生を行うようにしている。また、特許文献 3では、コンテンツに含まれる音声情報に着目し、基準となる基準音声レベルよりも大きい区間が所定時間継続した場合に、その基準音声レベルより大きい区間を抽出してダイジェスト再生を行うようにしている。特許文献 1：特開 2003— 283993号公報

特許文献 2 :特開平 9一 312827号公報

特許文献 3：特開平 10— 32776号公報

発明の開示

発明が解決しょうとする課題

[0004] し力しながら、上記の特許文献に記載されたダイジェスト再生方法は、顔領域が存在するフレームや音声レベルが大きい区間など、いずれも特徴的なシーンを抽出しているため、見たい番組を検索するためにダイジェスト再生を行う際に、ユーザが望まないシーンを含んでいる可能性がある。例えば、スポーツ番組を記録した際に、試合結果がダイジェストに含まれていたり、ドラマを記録した際に、その結末がダイジェストに含まれていたりするような場合である。このため、ダイジェストを番組検索用として用いる場合は、コンテンツの結果が判らない範囲で、いわゆる番組予告編に近いものを再生することが望まれて、る。

[0005] そこで、本発明は、視聴者の視聴意欲を損ねることがな、ダイジェストを作成可能なダイジェスト作成装置およびそのプログラムを提供することを目的とする。

課題を解決するための手段

[0006] 本発明のダイジェスト作成装置は、映像情報と音声情報の少なくともいずれか一方を含むコンテンツを取得するコンテンツ取得手段と、取得したコンテンツの時間軸上における全コンテンツ区間から、映像情報と音声情報の少なくともいずれか一方に基づいて、ハイライトシーンを含むハイライト区間を検索するハイライト区間検索手段と、全コンテンッ区間力もハイライト区間を除ヽた残区間の中から、コンテンッのダイジェストを作成するための要素となる部分シーンを抽出する部分シーン抽出手段と、抽出した部分シーンを用いて、ダイジェストを作成するダイジェスト作成手段と、を備えていることを特徴とする。

[0007] この構成によれば、全コンテンツ区間から、ハイライトシーンを含むノ、イライト区間を除いた残区間の中から、ダイジェストを作成するための要素となる部分シーンを抽出するため、ダイジェストの中にハイライトシーンが含まれることがない。従って、作成されたダイジェストを視聴することによって、そのコンテンツの特徴的な内容や結果が判つてしま、、視聴者の視聴意欲を損ねてしまう t 、つたことがな!/、。

[0008] なお、「コンテンツ」には、映像情報および音声情報から成るもの (テレビジョン番組など）、映像情報だけのもの（例えば無声映画など）、並びに音声情報だけのもの（例えば音楽やラジオ番組など）が含まれる。また、「ハイライトシーン」とは、スポーツ番組の試合結果やドラマの結末など、視聴者が最も興味をそそられるシーンや盛り上がるシーンなど、そのコンテンツの特徴的なシーンを指す。また、ハイライトシーン (ハイライト区間）の検索は、例えば映像に顔領域が含まれているシーンを抽出する方法や、音声レベルや音圧レベルが基準値を超えているシーンを抽出する方法など、従来技術を適用可能である。また、「ダイジェスト」とは、コンテンツの内容を要約した要約情報を指す。

[0009] 上記のダイジェスト作成装置において、取得したコンテンツを記録する記録手段をさらに備え、ハイライト区間検索手段は、記録手段による記録と同期して、ハイライト区間の検索を行うことが好まし、。

[0010] この構成によれば、コンテンツの記録に伴ってハイライト区間を検索するため、記録終了時には、ノ、イライト区間の検索を終えた状態となる。従って、コンテンツの記録後にハイライト区間を検索する場合と比較して、その分ダイジェストの作成に要する時間を短縮することができる。

[0011] 上記のダイジェスト作成装置において、ダイジェストを再生するダイジェスト再生手段をさらに備え、ダイジェスト作成手段は、抽出した部分シーンの開始点を示すアドレスと当該部分シーンの区間長とを示す区間データ力成るダイジェスト再生情報を作成し、ダイジェスト再生手段は、ダイジェスト再生情報と、記録手段によるコンテンツの記録データとに基づ、て、ダイジェストを再生することが好ま、。

[0012] この構成によれば、コンテンツの記録データの中力ダイジェスト再生情報に該当する部分シーンを読み出すことによって、ダイジェストを再生することができる。すなわち、コンテンツの記録データの一部を抽出したダイジェスト用のデータを、コンテンツの記録データとは別に保存しておくといった必要が無ぐ部分シーンの開始点を示すアドレスとその区間長とを示す区間データを保存しておくだけで良いため、ダイジエスト保存用のメモリ使用量を少なくすることができる。

[0013] 上記のダイジェスト作成装置において、コンテンツには、シーン毎に記録されたメタデータが付帯されており、ハイライト区間検索手段は、映像情報と音声情報の少なくともいずれか一方と共にメタデータに基づいて、ハイライト区間を検索することが好ましい。

[0014] この構成によれば、映像情報や音声情報以外に、メタデータも考慮するため、より的確にハイライトシーンを含むハイライト区間を検索することができる。なお、「メタデータ」とは、コンテンツ全体の内容に関する記述、制作者、著作権などに関する情報などの他、コンテンツに含まれる各シーンの詳細な情報を含むものである。 [0015] 上記のダイジェスト作成装置において、コンテンツは、音声情報を含むものであり、ノ、イライト区間検索手段は、ハイライト区間として、音声情報に基づいて算出した音圧レベルが、所定の大音閾値以上となる大音圧区間を検索し、部分シーン抽出手段は

、ハイライト区間の開始点から所定時間 taだけ (ta>0)遡った時点を開始点とする部分シーンを抽出することが好ましい。

[0016] この構成によれば、音圧レベルが所定の閾値以上となる大音圧区間の開始点から所定時間 taだけ (ta >0)遡った時点を開始点とする部分シーン、すなわちハイライトシーンの前のシーンを抽出するため、視聴者の視聴意欲を高めると想定されるシーンを含むダイジェストを作成することができる。

[0017] 上記のダイジェスト作成装置において、所定時間 taは、ハイライト区間の区間長 hi ( hl>0)と、定数 a (0< a≤ 1)とを乗算して得られる時間であることが好ましい。

[0018] この構成によれば、ハイライト区間の区間長に応じて、抽出する部分シーンの開始点を決定することができる。これは、ハイライトシーンが長い場合は、その前段となるシーンも長いとの経験則に基づくものである。

[0019] 上記のダイジェスト作成装置において、部分シーンの終了点は、ハイライト区間の開始点から所定時間 tb (0≤tb< ta)だけ遡った時点であることが好ま、。

[0020] この構成によれば、ハイライト区間の開始点力所定時間 tb (0≤tb< ta)だけ遡つた時点を抽出する部分シーンの終了点とするため、例えばハイライト区間の区間長に応じて、抽出する部分シーンの開始点を決定する場合は、区間長に応じた長さ（区間長: ta— tb)の部分シーンを抽出することができる。

[0021] 上記のダイジェスト作成装置において、部分シーンの終了点は、部分シーンの開始点から、当該部分シーンの区間長に相当する所定時間 tp (tp≤hl * α )だけ経過した時点であることが好まし、。

[0022] これらの構成によれば、ハイライト区間の長さに関わらず、一定の長さ（区間長： ta

—tb)の部分シーンを抽出することができる。従って、ダイジェストに複数の部分シーンが含まれる場合、シーン長が一定のバランスの良いダイジェストを作成することができる。

[0023] 上記のダイジェスト作成装置において、ハイライト区間検索手段により、複数のハイライト区間が検索された場合、ダイジェスト作成手段は、各部分シーンを抽出する基準となる各ハイライト区間の区間長に応じて、抽出された部分シーンに優先度を設定し、当該優先度の高い部分シーンから、ダイジェストの要素として組み込んでいくことが好ましい。

[0024] この構成によれば、ハイライト区間の区間長に応じた優先順位で、そのハイライト区間に基づ、て抽出した部分シーンをダイジェストに組み込んで行くことができる。従つて、ハイライトシーンの長いもの、すなわち盛り上がりのより大きいシーンを優先的にダイジェストに組み込むことで、視聴者の視聴意欲をより高めることができる。一方、ハイライトシーンではある力その長さの短いものを優先的にダイジェストに組み込むようにすれば、コンテンツの結末がより想定しづらいダイジェストを作成することができる。

[0025] なお、この場合、音声情報に基づいて算出した音圧レベルが、所定の小音閾値以下となる小音圧区間を検索する小音圧区間検索手段と、小音区間検索手段との検索結果に基づいて、全コンテンツ区間から、コマーシャルシーンを含む本編外シーンを抽出する本編外シーン抽出手段と、をさらに備え、部分シーン抽出手段は、抽出された本編外シーンの直後の所定区間を、重要部分シーンとして抽出し、ダイジェスト作成手段は、重要部分シーンの優先度を最大値に設定して、当該重要部分シーン力もダイジェストの要素として組み込んで!/、くようにしても良!、。

[0026] この構成によれば、検索した小音圧区間に基づいて、コマーシャルシーンを含む本編外シーンを抽出し、その直後のシーンを重要部分シーンとして優先的にダイジエストに含めることができる。例えば、コンテンツがアニメの場合などは、コマーシャル直後にアニメの題目やテロップが表示されることが多いが、これをダイジェストに含めることで、視聴者はより的確に内容を把握することができる。なお、「本編外シーン」とは、コマーシャルシーンの他、天気予報や番組コーナーなど、コンテンツの本編ではないと考えられる区間を指す。

[0027] また、この場合、部分シーン抽出手段は、ハイライト区間を基準にして抽出した各部分シーンの一部または全体が本編外シーンと重なる場合、その重複したシーンを部分シーン力削除しても良い。 [0028] この構成によれば、例えばノヽイライトシーンの前のシーンとして抽出した部分シーン

1S コマーシャルシーンと重なってしまった場合、そのコマーシャルシーンを除く部分シーンを抽出することができる。従って、確実に本編外シーンを含まないダイジェストを作成することができる。

[0029] 上記のダイジェスト作成装置において、大音閾値を設定する閾値設定手段をさらに備えていることが好ましい。

[0030] この構成によれば、視聴者の好みやニーズに応じて、大音圧区間の検索基準となる大音閾値を設定することができる。

[0031] 上記のダイジェスト作成装置において、部分シーン抽出手段により抽出された複数の部分シーンのうち、少なくとも 2つの部分シーンの一部または全体が重なる場合、ダイジェスト作成手段は、重なった 2つ以上の部分シーンを、連続する 1つの部分シーンとして、ダイジェストに組み込むことが好まし!/、。

[0032] この構成によれば、抽出した部分シーンが重なってしまった場合でも、ダイジェスト中に同じシーンが含まれることがない。すなわち、一般にダイジェストは、短時間で効率的に内容を把握することを課題としているため、そういった点において、より適切なダイジェストを作成することができる。

[0033] 上記のダイジェスト作成装置にぉ、て、ダイジェスト作成手段は、複数の部分シーンを用いてダイジェストを作成する場合、当該複数の部分シーンを、時系列に従って並び替えることが好ましい。

[0034] この構成によれば、抽出した複数の部分シーンを時系列に従って並び替えるため、ダイジェストを再生する際に、連続して再生される部分シーンが時間的に前後するといった違和感を無くすことができる。また、番組予告編に近いダイジェストを作成することができる。

[0035] 上記のダイジェスト作成装置において、部分シーン抽出手段は、全コンテンツ区間内の任意の区間である対象区間の中から、部分シーンを抽出することが好ましい。

[0036] また、上記のダイジェスト作成装置にぉ、て、対象区間は、コンテンツの開始点から、全コンテンツ区間と定数 j8 (0< j8 < 1)とを乗算して得られる時間だけ経過した時点までの区間であることが好ま U、。 [0037] これらの構成によれば、全コンテンツ区間の中から、部分シーンの抽出対象区間を絞ることができる。これにより、例えばスポーツ番組の試合結果をダイジェストに含めたくないような場合、対象区間を全コンテンツ区間の前半 (全コンテンツ区間と定数 |8 (0< /3ぐ 1)とを乗算して得られる時間）に絞ることで、より確実にダイジェスト内に試合結果が含まれることを避けることができる。

[0038] 上記のダイジェスト作成装置において、部分シーン抽出手段は、全コンテンツ区間または対象区間を複数の小区間に分割し、各小区間から少なくとも 1つの部分シーンを抽出することが好ましい。

[0039] この構成によれば、複数の小区間から少なくとも 1つの部分シーンを抽出するため、全コンテンツ区間または対象区間からバランス良ぐ部分シーンを抽出することができる。すなわち、コンテンツの中の一部に長いハイライトシーンがあるような場合であつても、その長いハイライトシーンに基づいて抽出された部分シーンだけを含むようなダイジストが作成されることがな、。

[0040] 本発明のプログラムは、上記のダイジェスト作成装置における各手段として機能させるためのものであることを特徴とする。

[0041] このプログラムを用いることにより、視聴者の視聴意欲を損ねることがな、ダイジエストを作成可能なダイジェスト作成装置を実現することができる。

図面の簡単な説明

[0042] [図 1]本発明の一実施形態に係る録音再生装置のブロック構成図である。

[図 2]部分シーンの抽出方法を説明する音圧レベル波形図である。

[図 3]部分シーンをダイジェストに組み込む際の優先度の決定方法を説明する図である。

[図 4]大音圧区間の検索処理を示すフローチャートである。

[図 5]第 1実施形態に係るダイジェスト作成処理を示すフローチャートである。

[図 6]部分シーンを抽出する他の方法を説明する音圧レベル波形図である。

[図 7]重複する部分シーンの抽出方法を説明する音圧レベル波形図である。

[図 8]部分シーンの優先度を決定する他の方法を説明する音圧レベル波形図である [図 9]第 2実施形態に係る対象区間力の部分シーンの抽出方法を説明する音圧レベル波形図である。

[図 10]第 2実施形態に係るダイジェスト作成処理を示すフローチャートである。

[図 11]第 3実施形態に係る各小区間力もの部分シーンの抽出方法を説明する音圧レベル波形図である。

[図 12]第 3実施形態に係るダイジェスト作成処理を示すフローチャートである。

[図 13]第 4実施形態に係る録音再生装置のブロック構成図である。

[図 14]第 4実施形態に係る本編外シーン直後の重要部分シーンの抽出方法を説明する音圧レベル波形図である。

[図 15]第 4実施形態に係るダイジェスト作成処理を示すフローチャートである。

符号の説明

[0043] 10:録音再生装置， 20:コンテンツ取得部， 30:制御部， 40:音声解析部， 50:記憶部， 60:再生部， 61:コンテンツ再生部， 62:ダイジェスト再生部， 81:受信アンテナ， 82:外部機器， 91:表示装置， 92:UI入力装置， DCs:本編外シーンの開始点 , DCe:本編外シーンの終了点， Ds:全コンテンツの区間の開始点， De:全コンテンッの区間の終了点， DHs:大音圧区間の開始点， DHe:大音圧区間の終了点， DPs ：部分シーンの開始点， DPe:部分シーンの終了点， DPis:重要部分シーンの開始点， DPie:重要部分シーンの終了点， hi:大音圧区間の区間長， tp:部分シーンの区間長， T:全コンテンツの区間長， THb:大音閾値， THs:小音閾値

発明を実施するための最良の形態

[0044] 以下、添付の図面を参照して、本発明の一実施形態に係るダイジェスト作成装置およびそのプログラムについて説明する。本発明は、映像情報（映像信号)および/ または音声情報 (音声信号)を含むコンテンツの全コンテンツ区間から、 1以上のハイライトシーンを抽出し、当該ハイライトシーンを除く残区間の中からダイジェストを作成するための要素となる部分シーンを抽出することを特徴とするものである。そこで、本発明のダイジェスト作成装置を、映像情報および音声情報を含むコンテンツの記録および再生を行う記録再生装置に適用した場合を例に挙げて説明する。

[0045] 図 1は、本発明の一実施形態に係る記録再生装置 10のブロック構成図である。同図に示すように、記録再生装置 10は、外部からコンテンツを取得するコンテンツ取得部 20と、各種制御を行う制御部 30と、音声情報に基づく解析を行う音声解析部 40と、各種情報を記憶する記憶部 50と、コンテンツやダイジェストの再生を行う再生部 60 と、力も成る。なお、「ダイジェスト」とは、コンテンツの内容を要約した要約情報を指す

[0046] コンテンツ取得部 20は、受信アンテナ 81から、地上波、 BS、 CS等のテレビジョン放送を受信する場合、いわゆるチューナが主要構成要素となる。また、外部機器 82 ( 外部出力端子を有するテレビ、ビデオ再生機、 DVD再生機、パーソナルコンビユータ、各種チューナ等)からコンテンツを取得する場合は、外部入力端子が主要構成要素となる。なお、特に図示しないが、コンテンツ取得部 20は、インターネットなど通信網を介して配信される映像 Z音楽データをコンテンツとして取得することも可能であり、その場合にはインターネット接続部分が主要構成要素となる。また、コンテンツ取得部 20として各種半導体メモリや各種光ディスクの読み取り装置を搭載している場合は、それらに記録されているコンテンツを取得することも可能である。

[0047] 制御部 30は、記録再生装置 10の各部を統括して各種制御を行うものであり、具体的には、取得したコンテンツを記録するコンテンツ記録部 31と、取得したコンテンツからダイジェストを作成するための要素となる部分シーンを抽出する部分シーン抽出部 32と、抽出した部分シーンに基づいてダイジェストを再生するための情報（以下、「ダイジエスト再生情報」と称する）を作成するダイジェスト作成部 33と、コンテンツの中からハイライトシーンを検索するための基準レベルとなる閾値を設定する閾値設定部 3 4と、を備えている。

[0048] なお、上記の「ノヽイライトシーン」とは、スポーツ番組の試合結果やドラマの結末など、視聴者が最も興味をそそられるシーンや盛り上がるシーンなど、そのコンテンツの特徴的なシーンを指す。本実施形態では、このハイライトシーンを音声情報に基づいて検索する。すなわち、音声によって盛り上がりを判断する。

[0049] 音声解析部 40は、コンテンツの中からハイライトシーン（=ハイライト区間 =大音圧区間）を検索する大音圧区間検索部 41を備えている。音声解析部 40は、コンテンツに含まれる音声情報 (音声波形情報)を解析して、単位時間あたりの平均音圧レベル (以下、単に「音圧レベル」と称する）を算出し、図 2等に示すような音圧レベル波形を生成する。そして、大音圧区間検索部 41は、この生成された音圧レベル波形に基づいて、上記の閾値設定部 34により設定された (後述の閾値記憶部 54に記憶されている)所定の閾値 (以下、「大音閾値」と称する)以上となる区間 (以下、「大音圧区間」と称する)を検索する。

[0050] 記憶部 50は、上記のコンテンツ記録部 31によって記録されたコンテンツの記録データ（以下、「コンテンツ記録データ」と称する）を記憶するコンテンツ記録データ記憶部 51と、大音圧区間検索部 41の検索結果を記憶する大音圧区間記憶部 52と、ダイジェスト作成部 33によって作成されたダイジェスト再生情報を記憶するダイジェスト再生情報記憶部 53と、閾値設定部 34によって設定された大音閾値を記憶する閾値記憶部 54と、を備えている。なお、記憶部 50は、ハードディスク、各種半導体メモリ、各種光ディスク等により構成可能であり、その種類は問わない。

[0051] 再生部 60は、記録したコンテンツを再生するコンテンツ再生部 61と、ダイジェストを再生するダイジェスト再生部 62と、を備えている。コンテンツ再生部 61は、上記のコンテンッ記録データ記憶部 51から読み出したコンテンッ記録データに基づ!/、てコンテンッを再生し、表示装置 91に表示させる。また、ダイジェスト再生部 62は、上記のダイジェスト再生情報記憶部 53から読み出したダイジェスト再生情報と、上記のコンテンッ記録データとに基づいてダイジェストを再生し、同じく表示装置 91に表示させる。

[0052] ここで、上記のとおり構成された記録再生装置 10の一連の処理について、図 2および図 3に示す音圧レベル波形の一例を参照して説明する。例えば、リモコン等の UI ( ユーザインターフェース)入力装置 92を用いて、ユーザ (視聴者)からコンテンツの記録が指示された場合、記録再生装置 10は、コンテンツ取得部 20を介してコンテンツを取得し、コンテンツ記録咅 31によってこの取得したコンテンツを記録する。また、コンテンッの記録に同期して、大音圧区間検索部 41により大音圧区間を検索する。具体的には、音圧レベルが大音閾値 (THb)以上となる大音圧区間を検索し、その開始点 (DHs)のアドレスとその区間長 (hi)とを示すデータを大音圧区間記憶部 52に記憶する（図 2参照)。 [0053] コンテンツの記録を終了すると、そのコンテンツ記録データはコンテンツ記録データ記憶部 51に格納しておく。また、大音圧区間記憶部 52に記憶されているデータに基づいて、部分シーン抽出部 32によりダイジェストに含めるための部分シーンを抽出する。図 2に示すように、部分シーンとしては、大音圧区間の開始点（DHs)力も所定時間 ta遡った時点を開始点 (DPs)とすると共に、大音圧区間の開始点 (DHs)力も所定時間 tb (但し、 ta>tb≥0)遡った時点を終了点 (DPe)とする区間（図示斜線部）を抽出する。従って、抽出される部分シーンの区間長は、 tp = ta— tbである。

[0054] 続いて、ダイジェスト作成部 33により、部分シーン抽出部 32の抽出結果に基づいて、ダイジェスト再生情報を作成する。ダイジェスト作成部 33では、部分シーンを抽出する基準となる大音圧区間の区間長 (hi)に応じて、優先順位を付け、優先順位の高いものからダイジェストに組み込んでいく。例えば、図 3に示すように、録画時間に相当する全コンテンツ区間（区間長: T,開始点: Ds,終了点: De)の中に、大音圧区間 (区間長: hll, hl2, hl3)が 3つ存在する場合、各大音圧区間に基づいて部分シーン（区間長: tpl, tp2, tp3)が抽出されることとなる力その部分シーンに対応する大音圧区間の区間長の長い順 (hl2→hl3→hll)にダイジェストに組み込んでいく。従つて、部分シーンの優先順位は、第 2部分シーン→第 3部分シーン→第 1部分シーンとなり、各部分シーンの開始点（DPs2, DPs3, DPsl)のアドレスと区間長（tp2, tp 3, tpl)とを示す区間データを、ダイジェスト再生情報として、ダイジェスト再生情報記憶部 53に記憶する。

[0055] 一方、ユーザが見たい番組を検索するために、 UI入力装置 92を用いて、ダイジェストの再生を指示した場合、ダイジェスト再生部 62は、コンテンツ記録データ記憶部 5 1力読み出したコンテンツ記録データの中から、ダイジェスト再生情報に含まれる区間データに該当する区間を読み出して、ダイジェストを再生する。なお、ダイジェスト再生情報とコンテンツ記録データとに基づ、てダイジェストを作成するのではなく、ダイジエストを作成するためのデータを別途作成し、そのデータに基づ、てダイジェストを再生することも可能である。

[0056] また、ユーザにより、ダイジェストの再生中においてコンテンツの再生指示が為された場合は、そのダイジェストを作成する基となったコンテンツを、コンテンツ再生部 61 により再生する。なお、必ずしもダイジェストを再生させる必要はなぐ表示装置 91にコンテンツリストを表示しておき、その中力もユーザが選択したコンテンツを再生することも可能である。

[0057] また、ユーザは、 UI入力装置 92を用いて、大音閾値 (THb)の値を設定することが可能である（閾値設定部 34)。設定された大音閾値の値は、閾値記憶部 53に記憶され、大音圧区間検索部 41の検索時において参照される。なお、大音閾値以外にも、ユーザは UI入力装置 92を用いて、作成するダイジェストの全体長さや、抽出する部分シーンの開始点や終了点を決定するための値 (ta, tb)を設定可能となっている。但し、これら大音閾値、ダイジェストの全体長さ、 ta, tbの値は、ユーザによって特に設定されない場合、デフォルトの設定値を利用する。

[0058] 次に、図 4のフローチャートを参照し、大音圧区間検索部 41による大音圧区間の検索処理について説明する。当該処理は、コンテンツの記録に同期して、単位時間毎（例えば 1Z60秒毎）に実行される。同図に示すように、まず単位時間における音圧レベルが、設定されている大音閾値以上であるか否かを判別する（S01)。大音閾値以上でない場合（SOI :No)、 1つ前の単位時間は大音閾値以上であつたか否かを判別し (S02)、大音閾値以上であった場合は (S02 :Yes)、大音圧区間の終了点を設定する（S03)。

[0059] 一方、 S01において、今回検索対象となっている単位時間の音圧レベルが大音閾値以上であると判別した場合は（S01： Yes)、 1つ前の単位時間も大音閾値以上であった力否かを判別し (S04)、大音閾値以上でな力つた場合は（S04 : No)、大音圧区間の開始点を設定する (S05)。

[0060] 大音圧区間の開始点または終了点の設定後、若しくは S04において、 1つ前の単位時間が大音閾値以上であつたと判別した場合や（S04 : Yes)、 S02において、 1つ前の単位時間が大音閾値以上でな力つたと判別した場合は（S02 :No)、コンテンツの記録を終了した力否かを判別し（S06)、終了していない場合は（S06 : No)、上記の処理を繰り返す。

[0061] また、記録を終了した場合は（S06： Yes)、 S05で大音圧区間の開始点を設定して V、れば大音圧区間の終了点が設定されて、る力否かを判別し (S07)、設定されて!、ない場合は（S07 :No)、大音圧区間の終了点を設定して (S08)、処理を終了する。すなわち、大音圧区間の終了点が設定されないまま記録を終えた場合は終了点を設定して、処理を終了する。

[0062] 次に、図 5のフローチャートを参照し、ダイジェスト作成部 33による本実施形態のダイジェスト作成処理について説明する。上記のとおり、ダイジェスト作成処理はコンテンッの記録開始 (ユーザによる記録指示、若しくは予約記録の場合はその指定時間の計時）に伴って、処理を開始する（Sl l)。そして、周期的に記録終了か否かを判別し (S12)、記録終了でない場合は（S12 :No)、コンテンツの音圧レベル力大音閾値 (THb)以上となる大音圧区間を検索する（S13)。なお、これら S12および S13 の処理は、図 4に示した大音圧区間の検索処理に相当するものである。

[0063] この検索を記録終了まで繰り返すと（S12 : Yes)、続いて大音圧区間の区間長 hiに比例した優先度を付け、抽出する部分シーンの開始点（DPs)を決定する（S14)。すなわち、図 3の例の場合、 [DPs2, DPs3, DPsl]を決定する。さらに、優先度の高いものから、部分シーンの終了点（DPe)を決定し、ダイジェストに組み込む (ダイジェスト再生情報に組み込む， S15) ₀すなわち、図 3の例の場合、まず [DPe2]を決定し、第 2部分シーンをダイジェストに組み込む。

[0064] さらに、ダイジェストに組み込む度に、抽出した部分シーンの合計（区間長の合計）力ダイジェストの全体長さ (ダイジェストの全再生時間）を超えているか否かを判別し (S16)、超えていない場合は（S16 :No)、次に優先度の高い部分シーンの終了点を決定し、その部分シーンをダイジェストに組み込んでいく（S15)。

[0065] また、抽出した部分シーンの合計力ダイジェストの全体長さを超えた場合は（S16 ： Yes)、最後にダイジェストにカ卩えた部分シーンを削除する（S17)。これは、ダイジェストの全体長さが予め所定時間内に定められているためであり、時間に制限が無い場合は (ユーザの設定により、ダイジェストの再生時間の制限を無くすことも可能である）、 S16および S17に代えて、抽出した全ての部分シーンをダイジェストに組み込む。また、ダイジェストの全体長さが予め所定時間内に定められている場合でも、全ての部分シーンの組み込みを終了した場合は、ダイジェストの全体長さとして定められている所定時間に達しなくとも、次の工程 (S 18)に移行する。 [0066] そして、最後に抽出した部分シーンを時系列に従って並び替えを行い（S18)、処理を終了する。すなわち、図 3の例の場合、第 2部分シーン→第 3部分シーン→第 1 部分シーンの順にダイジェストに組み込まれたこととなる力これを第 1部分シーン→ 第 2部分シーン→第 3部分シーンの順に並び替える。

[0067] 以上のとおり、本実施形態によれば、大音圧区間の開始点 (DHs)力も所定時間 ta 遡った時点を開始点 (DPs)とすると共に、大音圧区間の開始点 (DHs)から所定時間 tb (但し、 ta>tb≥0)遡った時点を終了点 (DPe)とする区間（区間長: tp)を、ダイジェストに組み込むための部分シーンとして抽出するため、ハイライトシーン前のシーン、すなわちユーザが最も興味をそそられるシーンや盛り上がるシーンをダイジェストに組み込むことができる。また、ノ、イライトシーンそのもの（例えば、スポーツの試合結果ゃドラマの結末な）をダイジェストに含めないため、作成されたダイジェストの視聴によって、ユーザの視聴意欲が損なわれることがな、。

[0068] また、ダイジェスト作成処理にぉ、ては、コンテンツの記録に伴って大音圧区間を検索するため、記録終了時には、大音圧区間の検索を終えた状態となる。従って、コンテンッの記録後に、再度コンテンツを読み出して大音圧区間を検索する必要が無ぐその分ダイジェストの作成に要する時間を短縮することができる。

[0069] また、ダイジェストの再生は、コンテンツ記録データの中力ダイジェスト再生情報（ 1以上の区間データ (部分シーンの開始点を示すアドレスとその区間長とを示すデータ）から成る）に該当する部分シーンを読み出すことによって行うため、コンテンツ記録データの一部を抽出したダイジェスト用のデータを作成して、コンテンツ記録データとは別に保存しておくといった必要が無い。このため、ダイジェスト保存用のメモリ（ダイジェスト再生情報記憶部 53)としては、ダイジェスト再生情報を保存するだけの容量で済む。

[0070] また、ダイジェストに組み込む部分シーンは、これを抽出した基準となる大音圧区間の区間長に応じた優先順位に従って決定するため、ハイライトシーンの長いもの、すなわち盛り上がりのより大きいシーンを優先的にダイジェストに組み込むことができ、ひいてはユーザの視聴意欲をより高めることができる。

[0071] また、抽出した複数の部分シーンは、時系列に従って並び替えるため、ダイジェストを再生する際に、連続して再生される部分シーンが時間的に前後するといつた違和感を無くし、より番組予告編に近いダイジェストを作成することができる。

[0072] なお、上記の例では、音圧区間の開始点（DHs)から所定時間 ta遡った時点を部分シーンの開始点 (DPs)としたが（図 2参照）、抽出する部分シーンの開始点 (DPs) を、抽出する基準となる大音圧区間の区間長 hiに比例して、決定しても良い。これは、ノ、イライトシーンが長い場合は、一般にその前段となるシーンも長いと考えられるためである。この場合、部分シーンの開始点（DPs)を決定するための所定時間 ta'は、図 6に示すように、大音圧区間の開始点 (DHs)から、大音圧区間の区間長 hl (hl>0 )と、定数 α (0< α≤1)とを乗算した値により決定することができる。

[0073] 一方、上記の例では、大音圧区間の開始点 (DHs)から所定時間 tb遡った時点を部分シーンの終了点（DPe)とするものとした力図 6に示すように、部分シーンの終了点は、部分シーンの開始点（DPs)から、当該部分シーンの区間長に相当する所定時間 tp' (tp，≤hl* α )だけ経過した時点として、決定するようにしても良い。この構成によれば (図 2の例の場合も同様であるが）、大音圧区間の長さに関わらず、一定の長さ（区間長: tp' )の部分シーンを抽出することになるため、ダイジェストに複数の部分シーンが含まれる場合、シーン長が一定のバランスの良いダイジェストを作成することができる。

[0074] 一方、部分シーンの区間長を一定とするのではなぐ大音圧区間の区間長 hiに応じて部分シーンの区間長を可変しても良い。この場合、例えば部分シーンの開始点（ DPs)を、大音圧区間の区間長 hiに応じて決定し (大音圧区間の開始点 (DHs)から (hi * α )だけ遡った時点）、部分シーンの終了点 (DPe)を、大音圧区間の開始点（ DHs)から一定時間 tbだけ遡った時点として決定しても良い（図示省略)。また、この場合、所定時間 tbの値を 0とすれば、大音圧区間の区間長 hiに比例して部分シーンの区間長を決定することができる。これらの構成によれば、ハイライトシーンの長さに応じて、興味深いと考えられる部分シーンをより長ぐダイジェストの 1シーンとして再生させることができる。

[0075] また、上記の例では、大音圧区間の開始点 (DHs)を基準にして、部分シーンを抽出しているため、所定時間 ta, tbの値や音圧レベル波形によっては、抽出した部分シーンが重なってしまう場合がある。図 7は、その一例を示したものであるが、第 1大音圧区間（区間長: hll)に基づいて抽出した第 1部分シーン（区間長: tpl,図示左下がり斜線部)の後半と、第 2大音圧区間（区間長: hl2,図示右下がり斜線部）に基づ、て抽出した第 2部分シーン（区間長： tp2)の前半が重なって、る。このような場合、第 1部分シーンの開始点（DPsl)力も第 2部分シーンの終了点（DPe2)までを、 1つの部分シーンとして抽出することが好ましい（図示（1)参照)。

[0076] 但し、同図の例の場合、第 2部分シーン（開始点: DPs2,終了点: DPe2)が第 1大音圧区間（開始点： DHsl,終了点： DHel)と重なっているため、その重複した区間（ DHsl〜DHel)は、部分シーンから削除することが好ま、（図示（2)参照)。

[0077] さらに、この削除によって、抽出される部分シーンは、 DPsl〜DHsl, DHel〜DP e2までとなる力 DHel〜DPe2のように、抽出した部分シーンの区間長がごく僅かとなる場合 (人間が視聴してその内容を把握できない程度、例えば 2秒以下など）は、部分シーンとして抽出しないことが好ましい。従って、図 7に示す例の場合、最終的に区間 DPsl〜DHslを部分シーン（区間長： tp,開始点： DPs,終了点： DPe)として抽出することが好ま U、（図示 (3)参照)。

[0078] これらの構成によれば、抽出した部分シーンが重なってしまった場合でも、ダイジェスト中に同じシーンが含まれることがない。また、抽出した部分シーンに大音圧区間が含まれるような場合は、その大音圧区間と重なるシーンを削除するため、コンテンツの結果が判ってしまうようなことが無ぐユーザの視聴意欲を損ねることがない。また、ごく僅かなシーンの抽出を無くすことができるため、ユーザに違和感を与えないダイジェストを作成することができる。

[0079] また、上記の例では、大音圧区間や部分シーン (ダイジェスト再生情報)など、各区間の開始点のアドレスとその区間長とを示すデータ（区間データ)を記憶するものとした力これに代えて各区間の開始点と終了点のアドレスを記憶しても良い。

[0080] また、上記の例では、図 3に示すように、大音圧区間の区間長の長いものから、部分シーンの優先度を決定するものとしたが、逆に大音圧区間の区間長の短いものを優先しても良い。この構成によれば、ハイライトシーンの長さの短いものを優先的にダイジェストに組み込むことで、コンテンツの結末がより想定しづら、ダイジェストを作成することができる。

[0081] 一方、図 8に示すように、区間長 hiの長いものを優先とするだけでなぐ大音閾値（ THb)を超えた音圧レベルの値も考慮して、優先度を決定するようにしても良い。すなわち、大音圧区間における単位時間あたりの音圧レベルの累計（図示網掛部 HI, H2, H3の面積に相当）によって、優先度を決定しても良い。従って、図 8に示す例では、優先順位が、第 3部分シーン→第 2部分シーン→第 1部分シーンとなる。この構成によれば、盛り上がりの長さだけでなぐ盛り上がりの程度に応じて、抽出する部分シーンを決定することができる。

[0082] また、上記の例では、音圧レベルに基づいて、大音圧区間を検索するものとしたが、コンテンツにメタデータのような付帯情報が付帯されている場合、そのメタデータも考慮して、ノ、イライトシーンを検索するようにしても良い。すなわち、「メタデータ」には、一般に、コンテンツ全体の内容に関する記述、制作者、著作権などに関する情報などの他、コンテンツに含まれる各シーンの詳細な情報 (例えば、コンテンツが、サッカ一の試合映像の場合、シュート 'コーナーキックなどの試合の動きを示す情報）を含むため、この各シーンの詳細情報を利用して、ハイライトシーンを検索し、そのハイライトシーンに基づいて部分シーンを抽出するようにしても良い。この構成によれば、より的確にハイライトシーンを検索することができる。

[0083] また、メタデータ以外にも、映像情報も考慮して、ハイライトシーンを検索するようにしても良い。この場合、例えば映像に顔領域が含まれているシーン、シーンチェンジが早、シーン、テロップなど文字情報が表示されて、るシーンなどを画像解析によつて調査し、それらのシーンを優先的に部分シーンに含めることが好ましい。

[0084] また、上記の例では、大音圧区間の前のシーンをダイジェストの部分シーンとして抽出するものとしたが、大音圧区間の後のシーンを部分シーンとして抽出しても良い。すなわち、全コンテンツ区間から大音圧区間を除いた残区間内の任意のシーンを、部分シーンとして抽出しても良い。

[0085] 次に、図 9および図 10を参照し、本発明の第 2実施形態について説明する。上記の実施形態では、全コンテンツ区間を対象としてダイジェストを作成するための要素となる部分シーンを抽出したが、本実施形態では、部分シーンを抽出する対象区間を制限することを特徴とする。そこで、第 1実施形態と異なる点を中心に説明する。

[0086] 図 9は、本実施形態を説明するための一例となる音圧レベル波形を示したものである。本実施形態では、全コンテンツ区間（区間長: T)の開始点 Dsから、全コンテンツ区間 Tと定数 |8 (0< j8 < 1)とを乗算して得られる時間だけ経過した時点までの区間 (区間長： P1 =T* ）を対象区間として決定する。なお、 j8の値は、 0. 5〜0. 7程度であることが好ましい。

[0087] 従って、同図の例の場合、全コンテンツ区間に含まれる 3つの大音圧区間（第 1大音圧区間〜第 3大音圧区間）に基づいて抽出される 3つの部分シーン (第 1部分シーン〜第 3部分シーン)のうち、対象区間内に存在する 2つの部分シーン (第 1部分シーンおよび第 2部分シーン，図示斜線部）のみを、抽出することとなる。なお、対象区間の決定力も部分シーンの抽出までの処理は、図 1に示したブロック構成図中の部分シーン抽出部 32において実行されるものである。

[0088] ここで、図 10のフローチャートを参照し、ダイジェスト作成部 33による本実施形態のダイジェスト作成処理について説明する。なお、各工程に括弧書きで示した参照番号は、図 5のフローチャートに示した参照番号と同様の処理であることを意味するものである。従って、それらの詳細な説明は適宜省略する。

[0089] 本実施形態にぉ、ても、コンテンツの記録開始に伴って、ダイジェスト作成処理を開始し (S21)、記録終了まで、コンテンツの音圧レベルが、大音閾値 (THb)以上となる大音圧区間を検索する（S22, 23)。

[0090] 記録終了となると（S22 : Yes)、対象区間の区間長 P1を、 Pl =全コンテンツ区間 T

*定数 j8の計算式力も求め、コンテンツの開始点 Dsから区間長 P1の時点までを対象区間として決定する（S24)。そして、対象区間に存在する部分シーン（図 9の例の場合、第 1部分シーン，第 2部分シーン）に対し、それを抽出する基準となった大音圧区間 (第 1大音圧区間，第 2大音圧区間)の区間長 (hll, hl2)に比例した優先度をつけ、抽出する部分シーンの開始点を決定する（S25)。すなわち、図 9の例の場合、 hl2>hllであるため、 [DPs2, DPsl]を決定する。さらに、優先度の高いものから、部分シーンの終了点（DPe)を決定し、ダイジェストに組み込む（S 26)。すなわち、図 9の例の場合、まず [DPe2]を決定し、第 2部分シーンをダイジェストに組み込む。 [0091] さらに、ダイジェストに組み込む度に、抽出した部分シーンの合計（区間長の合計）力ダイジェストの全体長さを超えるまで、 S26, S27を繰り返し、抽出した部分シーンの合計が、ダイジェストの全体長さを超えた場合は（S27 : Yes)、最後にダイジエストに加えた部分シーンを削除する（S28)。さらに、抽出した部分シーンを時系列に従つて並び替えを行い（S29)、処理を終了する。

[0092] 以上のとおり、本実施形態によれば、全コンテンツ区間の中から、部分シーンの抽出対象区間を絞ることができるため、例えばスポーツ番組の試合結果をダイジェストに含めたくないような場合、対象区間を全コンテンツ区間の前半 (全コンテンツ区間の区間長 Tと定数 |8 (0< j8 < 1)とを乗算して得られる時間 =区間長 P1)に絞ることで、より確実にダイジェスト内に試合結果が含まれることを避けることができる。

[0093] なお、上記の例では、対象区間は、コンテンツの開始点から区間長 P1経過した時点までであるものとした力コンテンツの中盤、さらには後半など、任意の区間を対象区間とすることも可能である。また、対象区間は 1区間に限らず、複数の区間を対象区間とすることも可能である。

[0094] また、上記の例では、部分シーンが対象区間に含まれるものを、抽出対象とするものとしたが、仮に部分シーンの一部だけが対象区間に含まれる場合は（言い換えれば部分シーンの一部が対象区間に含まれない場合でも）、その部分シーンの開始点から終了点までを、抽出するようにしても良い。また、逆に部分シーンの全体が対象区間に含まれない場合は、その部分シーンの抽出を行わないようにしても良い。さらに、部分シーンの一部が対象区間に含まれる割合によつて抽出する力否かを決定しても良い。

[0095] さらに、部分シーンではなぐ大音圧区間が対象区間に含まれる否かによって抽出するカゝ否かを決定しても良い。例えば、大音圧区間の全体が対象区間に含まれるものを抽出対象とする場合、図 9に示した例では、第 2大音圧区間（開始点 DHs2,終了点 DHe2)の全体が対象区間に含まれないため、対象区間内に存在する第 1大音圧区間（開始点 DHsl,終了点 DHel)に基づく第 1部分シーン（区間長: tpl,開始点 DPsl,終了点 DPel)のみを抽出することとなる。

[0096] その他、第 1実施形態において記載した種々の変形例を、本実施形態にも適用可能である。

[0097] 次に、図 11および図 12を参照し、本発明の第 3実施形態について説明する。本実施形態は、全コンテンツ区間を複数の小区間に分割し、各小区間から少なくとも 1つの部分シーンを抽出するようにすることを特徴とする。そこで、上記実施形態と異なる点を中心に説明する。

[0098] 図 11は、本実施形態を説明するための一例となる音圧レベル波形を示したものである。本実施形態では、全コンテンツ区間（区間長: T,開始点: Ds,終了点: De)を、 3つの小区間に分割している。この区間数は、任意に設定しても良いが、多すぎると意味が無い。例えばダイジェストの全体長さが 18秒で、且つ部分シーンの長さを 6秒に設定した場合、 10個の区間数に設定してしまうと、結局偏った位置力も部分シーンを抽出してしまうことになるためである。従って、本実施形態では、ダイジェストの全体長さと、部分シーンの長さとに基づいて、適当な区間数を決定するものとする。

[0099] 図 11の例は、例えばダイジェストの全体長さが 18秒で、且つ部分シーンの長さを 6 秒に設定した場合において、 18÷6≥γ (但し、 γ : 1以上の整数）に該当する γの最大値から求めた区間数 3に基づいて分割された場合を示している。なお、同図の例は、大音圧区間の直前のシーンを部分シーンとして抽出する場合 (部分シーンの区間長： tp = ta— tbで求められるとき、 tbの値を 0とした場合，図 2参照）を示している

[0100] 全コンテンツ区間を 3つの小区間に分割した後の部分シーンの抽出は、上記の実施形態と同様に、大音圧区間の区間長の長いものを優先する。すなわち、小区間 1 の場合、 2つの大音圧区間（区間長: hll,区間長: hl2)が含まれているが、区間長の長い大音圧区間（区間長: hl2)に基づく第 2部分シーン (区間長: tp2)を優先して抽出する。また、小区間 2の場合は、 3つの大音圧区間（区間長: hl3,区間長: hl4,区間長: hl5)が含まれているが、区間長の長い大音圧区間（区間長: hl5)に基づく第 5 部分シーン (区間長: tp5)を優先して抽出する。また、小区間 3の場合は、大音圧区間（区間長: hl6)力つしか存在しないため、その区間長に拘わらず、当該大音圧区間（区間長: hl6)に基づく部分シーン (区間長: tp6)を抽出する。

[0101] このように、本実施形態では、小区間を設定しない場合、優先度が低いと考えられる部分シーン（区間長: tp6)であっても、小区間 3の中では、その他の部分シーンは存在しないため、最大優先度となる。つまり、小区間 1の最大優先度の大音圧区間（区間長: hl2)に基づく第 2部分シーン (区間長: tp2)、小区間 2の最大優先度の大音圧区間（区間長: hl5)に基づく第 5部分シーン (区間長: tp5)、小区間 3の最大優先度の大音圧区間（区間長: hl6)に基づく第 6部分シーン (区間長: tp6)の順に、各部分シーンがダイジェストに組み込まれていくこととなる。なお、この小区間の分割（各小区間の決定)から部分シーンの抽出までの処理は、図 1に示したブロック構成図中の部分シーン抽出部 32において実行されるものである。

[0102] ここで、図 12のフローチャートを参照し、ダイジェスト作成部 33による本実施形態のダイジェスト作成処理について説明する。なお、各工程に括弧書きで示した参照番号は、図 5のフローチャートに示した参照番号と同様の処理であることを意味するものであり、それらの詳細な説明は適宜省略する。

[0103] 本実施形態にぉ、ても、コンテンツの記録開始に伴って、ダイジェスト作成処理を開始し (S31)、記録終了まで、コンテンツの音圧レベルが、大音閾値 (THb)以上となる大音圧区間を検索する（S32, 33)。

[0104] コンテンツの記録を終了すると（S32 :Yes)、全コンテンツ区間を一定数（図 11の例では「3」）で除算した時間を小区間として記憶部 50 (図 1参照）に記憶する（S35)。そして、各小区間に存在する部分シーンに対し、それらを抽出する基準となった大音圧区間の区間長に比例した優先度をつけ、抽出する部分シーンの開始点を決定する（S36)。すなわち、図 11の例の場合、小区間 1,小区間 2,小区間 3から 3つの部分シーンの開始点 [DPs2, DPs5, DPs6]を決定する。さらに、各小区間に存在する部分シーンの終了点（DPe)を決定し、ダイジェストに組み込む（S37)。すなわち、図 11の例の場合、 3つの部分シーンの終了点 [DPe2, DPe5, DPe6]を決定し、各部分シーンをダイジェストに組み込む。

[0105] 以上のとおり、本実施形態によれば、全コンテンツ区間を複数の小区間に分割し、各小区間から少なくとも 1つの部分シーンを抽出するため、全コンテンツ区間からバランス良ぐ部分シーンを抽出することができる。すなわち、コンテンツの中の一部に長いハイライトシーンがあるような場合であっても、そのハイライトシーンに基づいて抽出された部分シーンだけを含むようなダイジェストが作成されることがない。

[0106] なお、上記の例では、全コンテンツ区間を複数の小区間に分割するものとしたが、第 2実施形態で示した対象区間 (例えば、コンテンツの開始点力も区間長 P1 (P1 = T* ）経過した時点まで)を、複数の小区間に分割するようにしても良い。この構成によれば、コンテンツの結果がダイジェストに含まれることがなぐしかもコンテンツの結果を含まない対象区間からバランス良ぐ部分シーンを抽出することができる。

[0107] また、全コンテンツ区間を均等に分割して小区間を決定するものとしたが、各小区間の区間長を変えても良い。

[0108] また、複数の小区間の中から、時系列に従って最大優先度の部分シーンを抽出する（図 11の例の場合、小区間 1→小区間 2→小区間 3の順に部分シーンを抽出する）ものとしたが、各小区間の中で最大優先度の大音圧区間の区間長を比較し、その区間長の長いものを優先的にダイジェストに組み込んでも良い。すなわち、図 11の例の場合、 hl2>hl5 >hl6であるから、第 2部分シーン→第 5部分シーン→第 6部分シーンの順に組み込むこととなる。また、このとき抽出した部分シーンが時系列順に組み込まれてヽな、場合は、時系列に従って並び替えても良、。

[0109] また、上記の例では、ダイジェストの全体長さを、部分シーンの長さで除算した値以下となる整数を、区間数としたが、この計算式に限らず、種々の条件を加味した計算式を用いても良い。

[0110] また、上記の例では、部分シーンおよび大音圧区間が対象区間に含まれるものを、各小区間において抽出対象としたが、部分シーンまたは大音圧区間のどちらかが含まれるものを対象としても良いし、区間を跨ぐように部分シーンまたは大音圧区間が存在する場合は、それらを対象外としても良い。

[0111] その他、上記の実施形態において記載した種々の変形例を、本実施形態にも適用可能である。

[0112] 次に、図 13ないし図 15を参照し、本発明の第 4実施形態について説明する。本実施形態は、全コンテンツ区間から、コマーシャルシーンを含む本編外シーンを抽出し、その抽出した本編外シーンの直後の所定区間を、部分シーンとして優先的に抽出することを特徴とする。そこで、上記実施形態と異なる点を中心に説明する。 [0113] 図 13は、本実施形態に係るブロック構成図であり、図 14は、本実施形態を説明するための一例となる音圧レベル波形を示したものである。図 13に示すように、本実施形態に係る録音再生装置 10は、第 1実施形態のブロック構成図と比較すると、制御部 30に本編外シーン抽出部 35を備え、音声解析部 40に小音圧区間検索部 42を備え、さらに記憶部 50に小音圧区間記憶部 55と、本編外シーン記憶部 56とを備えた点で異なる。

[0114] 小音圧区間検索部 42は、コンテンツの中から、音声情報に基づいて算出した音圧レベルが、所定の小音閾値 (THs)以下となる小音圧区間を検索する（図 14参照)。当該所定の小音閾値 (THs)は、閾値設定部 34による設定値に基づくものであり、特に設定が為されていない場合はデフォルト値を用いる。なお、小音圧区間検索部 42 における処理は、図 4に示した大音圧区間の検索処理において、「大音圧区間」を「小音圧区間」に、また「大音閾値以上」を「小音閾値以下」に読み替えた処理に相当する。すなわち、実質的な処理内容は同様であるため、詳細な説明は省略する。

[0115] また、小音圧区間記憶部 55は、小音圧区間検索部 42の検索結果、すなわち各小音圧区間の開始点のアドレスとその区間長とを示すデータを記憶する。

[0116] 本編外シーン抽出部 35は、大音圧区間検索部 41と、小音区間検索部 42との検索結果に基づいて、全コンテンツ区間から、本編外シーンを抽出する。具体的には、小音圧区間記憶部 55に記憶されているデータに基づいて、小音圧区間が所定間隔（例えば 15秒間隔など)で存在する区間を、コマーシャルシーンと判断し、最初の小音圧区間の開始点 (DCs)から最後の小音圧区間の終了点 (DCe)までを本編外シーンとして抽出する（図 14参照)。

[0117] 本編外シーン記憶部 56は、本編外シーン抽出部 35の抽出結果、すなわち各本編外シーンの開始点のアドレスとその区間長とを示すデータを記憶する。なお、本編外シーンとは、コマーシャルシーンの他、天気予報や番糸且コーナーなど、コンテンツの本編ではないと考えられる区間を指す。

[0118] そして、本実施形態に係る部分シーン抽出部 32は、図 14に示すように、本編外シーン抽出部 35により抽出された本編外シーンの直後の所定区間を、重要部分シーン（区間長: tpi,開始点： DPis,終了点： DPie)として抽出する。 [0119] さらに、本実施形態に係るダイジェスト作成部 33は、上記の本編外シーン直後の重要部分シーンの優先度を最大値に設定して、ダイジェスト再生情報を作成する (ダイジェストに組み込む）。これは、例えばコンテンツがアニメの場合など、コマーシャル直後にアニメの題目やテロップが表示されることが多いため、これをダイジェストに含めることで、ユーザがより的確に内容を把握できるようにするためである。なお、 1つのコンテンッ中から、複数の重要部分シーンを抽出した場合は、時系列順に優先度が決定される。すなわち、 0時から 1時までの番組を記録した場合であって、 15分おきにコマーシャルが放送されるような場合は、 0時 15分付近で放送されたコマーシャルの直後のシーンを、最も優先度が高い重要部分シーンとして抽出し、 0時 30分付近で放送されたコマーシャル

の直後のシーンを、次に優先度が高い重要部分シーンとして抽出することとなる。

[0120] ここで、図 15のフローチャートを参照し、ダイジェスト作成部 33による本実施形態のダイジェスト作成処理について説明する。なお、各工程に括弧書きで示した参照番号は、図 5のフローチャートに示した参照番号と同様の処理であることを意味するものであり、それらの詳細な説明は適宜省略する。

[0121] 本実施形態にぉ、ても、コンテンツの記録開始に伴って、ダイジェスト作成処理を開始する（S41)。そして、記録終了となるまで、コンテンツの音圧レベルが大音閾値（ THb)以上となる大音圧区間と、音圧レベルが小音閾値 (THs)以上となる小音圧区間とを検索する（S42, 43)。

[0122] 記録終了となると（S42 : Yes)、小音圧区間の検索結果に基づいて、本編外シーンを抽出する（S44)。また、大音圧区間の検索結果に基づいて、部分シーンを抽出すると共に当該部分シーンに優先度を付け、さらに本編外シーンの検出結果からも重要部分シーンを抽出して、その優先度を最大に設定し、各部分シーンの開始点（DP s, DPis)を優先度に従って決定する（S45)。続いて、優先度の高いものから、部分シーンの終了点（DPe, DPie)を決定し、ダイジェストに組み込む（S46)。すなわち、図 14の例のように重要部分シーンが存在する場合、まず重要部分シーンの開始点 [ DPis]と重要部分シーンの終了点 [DPie]を決定し、重要部分シーンをダイジェストに組み込む。 [0123] さらに、ダイジェストに組み込む度に、抽出した部分シーンの合計（区間長の合計）力ダイジェストの全体長さを超えるまで、 S46, S47を繰り返し、抽出した部分シーン (重要部分シーンも含む）の合計が、ダイジェストの全体長さを超えた場合は（S47 ： Yes)、最後にダイジェストに加えた部分シーンを削除する（S48)。さらに、抽出した部分シーンを時系列に従って並び替えを行い（S49)、処理を終了する。

[0124] 以上のとおり、本実施形態によれば、小音圧区間の検索結果に基づいて、コマ一シャルシーンを含む本編外シーンを抽出し、その直後のシーンを重要部分シーンとして優先的にダイジェストに含めることができる。これにより、ユーザは、ダイジェストの視聴によってコンテンツのあらすじを表すようなナレーションや重要なシーンを確認することができるため、より内容を把握することができる。

[0125] なお、第 1実施形態〜第 3実施形態で示したように、大音圧区間を基準にして抽出した各部分シーンの一部または全体力上記の本編外シーンと重なる場合、その重複したシーンは、各部分シーンから削除することが好ましい。この構成によれば、コマ一シャルシーンなど本編外シーンがダイジェストに含まれることがなぐより適切なダイジェストを作成することができる。

[0126] また、上記の例では、小音圧区間が所定間隔で存在する区間を、本編外シーンとして抽出するものとしたが、過去に提案されている各種コマーシャル検出方法を併用して、本編外シーンを抽出するようにしても良い。すなわち、映像情報に基づくシーンチェンジや、放送モード（2力国語放送である力否力、ステレオ放送である力否かなど )に基づいて検出したコマーシャルシーンを、本編外シーンとして抽出しても良い。

[0127] その他、上記の実施形態にお!、て記載した種々の変形例を、本実施形態にも適用可能である。

[0128] 以上、第 1実施形態〜第 4実施形態において説明したとおり、本発明によれば、ダイジェストに含めるための部分シーンとして、ハイライトシーン（大音圧区間）の前のシーンを抽出することにより、ユーザのコンテンツに対する視聴意欲を損ねないようなダイジエストを作成することができる。さらに、コンテンツの後半部分などを除いた対象区間から部分シーンを抽出することにより、ダイジェストからコンテンツの結果が判ってしまうような事態を避けることができる。さらに、全コンテンツ区間を小区間に分割して、各小区間から部分シーンを抽出することにより、コンテンツ全体からバランス良く抽出された部分シーンを含むダイジェストを作成することができる。さら〖こ、コマーシャルシーン (本編外シーン)直後のシーンを重要部分シーンとして抽出することで、コンテンッの結末は判らなヽが、内容を把握する上では重要と考えられるシーンを含むダイジヱストを作成することができる。

[0129] なお、上記の各実施形態では、映像情報および音声情報の両方を含むコンテンツのダイジェストを作成する場合を例示したが、音声情報し力含まな、コンテンツ (例えば音楽やラジオ番組など）にも本発明は適用可能である。また、逆に音声情報を含まず、映像情報し力含まないコンテンツ (例えば無声映画など）にも本発明は適用可能である。但し、映像情報しか含まないコンテンツの場合は、第 1実施形態の後半部分にて説明した映像情報の画像解析結果、および/またはメタデータに基づいて、ハイライトシーンを検出し、その検出結果に基づいて部分シーンを抽出することとなる。

[0130] また、上記の各実施形態に示した録音再生装置 10における各部、並びに各機能をプログラムとして提供することも可能である。また、そのプログラムを記録媒体（図示省略）に格納して提供することも可能である。記録媒体としては、 CD— ROM、フラッシュ ROM、メモリカード (コンパクトフラッシュ（登録商標）、スマートメディア、メモリースティック等）、コンパクトディスク、光磁気ディスク、デジタルバーサタイルディスク、フレキシブルディスクおよびノヽードディスク等を利用することができる。

[0131] また、上述した実施例によらず、装置構成や処理工程等について、本発明の要旨を逸脱しない範囲で、適宜変更も可能である。また、録音再生装置 10以外にも、ビデォレコーダ、 DVDレコーダ、パーソナルコンピュータ等に本発明のダイジェスト作成機能を搭載可能である。

Claims

請求の範囲

[1] 映像情報と音声情報の少なくともいずれか一方を含むコンテンツを取得するコンテンッ取得手段と、

取得した前記コンテンツの時間軸上における全コンテンツ区間から、前記映像情報と前記音声情報の少なくともいずれか一方に基づいて、ハイライトシーンを含むハイライト区間を検索するハイライト区間検索手段と、

前記全コンテンツ区間力も前記ノ、イライト区間を除いた残区間の中から、前記コンテンッのダイジェストを作成するための要素となる部分シーンを抽出する部分シーン抽出手段と、

抽出した前記部分シーンを用いて、前記ダイジェストを作成するダイジェスト作成手段と、を備えていることを特徴とするダイジェスト作成装置。

[2] 取得した前記コンテンツを記録する記録手段をさらに備え、

前記ハイライト区間検索手段は、前記記録手段による記録と同期して、前記ハイライト区間の検索を行うことを特徴とする請求項 1に記載のダイジェスト作成装置。

[3] 前記ダイジェストを再生するダイジェスト再生手段をさらに備え、

前記ダイジェスト作成手段は、抽出した前記部分シーンの開始点を示すアドレスと当該部分シーンの区間長とを示す区間データ力成るダイジェスト再生情報を作成し、

前記ダイジェスト再生手段は、前記ダイジェスト再生情報と、前記記録手段による前記コンテンツの記録データとに基づ、て、前記ダイジェストを再生することを特徴とする請求項 2に記載のダイジェスト作成装置。

[4] 前記コンテンツには、シーン毎に記録されたメタデータが付帯されており、

前記ハイライト区間検索手段は、前記映像情報と前記音声情報の少なくともいずれか一方と共に前記メタデータに基づいて、前記ハイライト区間を検索することを特徴とする請求項 1に記載のダイジェスト作成装置。

[5] 前記コンテンツは、前記音声情報を含むものであり、

前記ノ、イライト区間検索手段は、前記ハイライト区間として、前記音声情報に基づいて算出した音圧レベルが、所定の大音閾値以上となる大音圧区間を検索し、前記部分シーン抽出手段は、前記ハイライト区間の開始点から所定時間 taだけ (ta > 0)遡った時点を開始点とする前記部分シーンを抽出することを特徴とする請求項 1に記載のダイジェスト作成装置。

[6] 前記所定時間 taは、前記ハイライト区間の区間長 hi (hl> 0)と、定数 α (0< α≤ 1 )とを乗算して得られる時間であることを特徴とする請求項 5に記載のダイジェスト作成装置。

[7] 前記部分シーンの終了点は、前記ハイライト区間の開始点力所定時間 tb (0≤tb < ta)だけ遡った時点であることを特徴とする請求項 5に記載のダイジェスト作成装置

[8] 前記部分シーンの終了点は、前記部分シーンの開始点から、当該部分シーンの区間長に相当する所定時間 tp (tp≤hl * a )だけ経過した時点であることを特徴とする請求項 5に記載のダイジェスト作成装置。

[9] 前記ハイライト区間検索手段により、複数の前記ハイライト区間が検索された場合、前記ダイジェスト作成手段は、各部分シーンを抽出する基準となる各ハイライト区間の区間長に応じて、抽出された部分シーンに優先度を設定し、当該優先度の高い部分シーンから、前記ダイジェストの要素として組み込んでヽくことを特徴とする請求項

5に記載のダイジェスト作成装置。

[10] 前記大音閾値を設定する閾値設定手段をさらに備えていることを特徴とする請求項 5に記載のダイジェスト作成装置。

[11] 前記部分シーン抽出手段により抽出された複数の部分シーンのうち、少なくとも 2つの部分シーンの一部または全体が重なる場合、

前記ダイジェスト作成手段は、重なった 2つ以上の部分シーンを、連続する 1つの部分シーンとして、前記ダイジェストに組み込むことを特徴とする請求項 9に記載のダイジェスト作成装置。

[12] 前記ダイジェスト作成手段は、複数の部分シーンを用いて前記ダイジェストを作成する場合、当該複数の部分シーンを、時系列に従って並び替えることを特徴とする請求項 1に記載のダイジェスト作成装置。

[13] 前記部分シーン抽出手段は、前記全コンテンツ区間内の任意の区間である対象区間の中から、前記部分シーンを抽出することを特徴とする請求項 1に記載のダイジェスト作成装置。

[14] 前記対象区間は、前記コンテンツの開始点から、前記全コンテンツ区間と定数 β ( 0< j8 < 1)とを乗算して得られる時間だけ経過した時点までの区間であることを特徴とする請求項 13に記載のダイジェスト作成装置。

[15] 前記部分シーン抽出手段は、前記全コンテンツ区間または前記対象区間を複数の小区間に分割し、

各小区間から少なくとも 1つの前記部分シーンを抽出することを特徴とする請求項 1 3に記載のダイジェスト作成装置。

[16] コンピュータを、請求項 1ないし 15のいずれ力 1項に記載のダイジェスト作成装置における各手段として機能させるためのプログラム。