JP3923932B2 - 映像要約装置、映像要約方法及びプログラム - Google Patents

映像要約装置、映像要約方法及びプログラム Download PDF

Info

Publication number
JP3923932B2
JP3923932B2 JP2003336212A JP2003336212A JP3923932B2 JP 3923932 B2 JP3923932 B2 JP 3923932B2 JP 2003336212 A JP2003336212 A JP 2003336212A JP 2003336212 A JP2003336212 A JP 2003336212A JP 3923932 B2 JP3923932 B2 JP 3923932B2
Authority
JP
Japan
Prior art keywords
video
event
information
importance
selection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003336212A
Other languages
English (en)
Other versions
JP2005109566A (ja
Inventor
晃司 山本
孝 井田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003336212A priority Critical patent/JP3923932B2/ja
Publication of JP2005109566A publication Critical patent/JP2005109566A/ja
Application granted granted Critical
Publication of JP3923932B2 publication Critical patent/JP3923932B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、映像情報から要約映像情報を作成する映像要約装置、映像要約方法及びプログラムに関する。
近年、ディジタル衛星放送による放送の多チャンネル化等、情報インフラの発展により、多くの映像コンテンツが流通するようになっている。一方で、計算機の処理能力の向上やADSL、FTTHなどのブロードバンド・ネットワークの普及に伴い、映像をパソコンや携帯端末上の記憶装置に録画して視聴したり、ネットワークを通じて配信された映像を視聴したりすることが一般的になっている。そのため、ユーザは今までと同じ時間でより多くのコンテンツを視聴するために自分の興味ある部分だけを視聴したり、パソコンで録画した映像を携帯端末向けに短く要約して、外出先で視聴したりするなど、視聴形態も多様化していくと考えられる。
また、映像コンテンツの製作者側からの視点に立つと、ユーザの視聴環境の多様化は同じ内容のコンテンツであっても、テレビ放送向け、ブロードバンド放送向け、携帯端末向けと視聴環境に応じて、複数のバリエーションを作成する必要が生じ、製作コストが増大する。
そこで、映像の中のイベントをイベント列として記述し、ユーザの嗜好とのマッチングに応じて自動的に要約する装置や方法が提案されている。例えば、イベントごとの重要度を求め、該当するイベントの区間を要約映像として選択する方法(例えば、特許文献1参照)や、要約映像そのものに対する説明を生成する方法(例えば、特許文献2参照)がある。
特許第3176893号公報 特開2001−275058号公報
元映像から、ユーザの興味のあるシーンを集めた要約映像は、コンテンツの内容を知る上で、重要なシーンを必ずしも含むとは限らない。例えば、スポーツの試合において、味方チームの映像を中心にした要約映像を作成する場合、相手チームの得点シーンなどが含まれずに、試合展開が分からなくなる場合がある。
また、試合全体の要約を作成したい場合、全体のシーン構成を考慮して、重要でないシーンもいくらか含めたい場合がある。しかし、先の提案では必ずしもこのようなシーン構成を考慮したコンテンツを生成できる要約方法とはなっていなかった。例えば、試合の後半にばかり重要なシーンがある場合、前半のシーンが全く含まれない要約映像が作成される場合がある。
本発明は、上記事情を考慮してなされたものであり、ユーザの興味のある映像区間に対して、テロップや音声ナレーションなどによる説明を付加した要約映像を作成する映像要約装置、映像要約方法及びプログラムを提供することを目的とする。
本発明に係る映像要約装置は、映像内に含まれるイベントの内容に関する第1の情報に基づいて、各イベントの重要度を算出する算出手段と、前記映像内に含まれるイベントの映像区間に関する第2の情報及び前記重要度並びに重要度の下限を示す第1のしきい値に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択手段と、前記重要度及び前記第1のしきい値とは独立に重要度の下限を示す第2のしきい値に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択手段と、この第2の選択手段により選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成手段と、前記第1の選択手段により選択された前記映像区間を連結した要約映像と、前記第1の生成手段により作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成手段とを備えたことを特徴とする。
また、本発明に係る映像要約装置は、映像内に含まれる各イベントの内容に関する第1の情報に基づいて、各イベントについて、それぞれ、要約映像として用いるイベントの映像区間の選択に用いる第1の重要度と、説明文を作成する対象にするイベントの選択に用いる第2の重要度とを算出する算出手段と、前記映像内に含まれる各イベントの映像区間に関する第2の情報及び前記第1の重要度に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択手段と、前記第2の重要度に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択手段と、この第2の選択手段により選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成手段と、前記第1の選択手段により選択された前記映像区間を連結した要約映像と、前記第1の生成手段により作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成手段とを備え、前記第1の情報は、各イベントの内容を示す文字列を含むものであり、前記算出手段は、各イベントの重要度を算出するにあたって、予め第1の重み値及び第2の重み値がそれぞれ定められた複数のキーワードのうち、当該イベントに係る前記第1の情報に含まれる文字列に合致するキーワードに係る第1の重み値に基づいて、当該イベントの第1の重要度を算出し、当該イベントに係る前記第1の情報に含まれる文字列に合致するキーワードに係る第2の重み値に基づいて、当該イベントの第2の重要度を算出するものであることを特徴とする。
また、本発明に係る映像要約装置は、映像内に含まれる各イベントの内容に関する第1の情報に基づいて、各イベントの重要度を算出する算出手段と、前記映像内に含まれる各イベントの映像区間に関する第2の情報及び前記重要度に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択手段と、前記重要度及び重要度の下限を示すしきい値に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択手段と、この第2の選択手段により選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成手段と、前記第1の選択手段により選択された前記映像区間を連結した要約映像と、前記第1の生成手段により作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成手段とを備え、前記第1の選択手段は、前記重要度の高い順に、そのイベントに係る映像区間を選択するものであるとともに、選択したイベントの映像区間に係る時間の総和が、予め指定された制限時間の範囲内に収まるように、前記映像区間を選択するものであることを特徴とする。
本発明によれば、ユーザの興味のある映像区間に対して、テロップや音声ナレーションなどによる説明を付加した要約映像を作成することができる。
以下、図面を参照しながら本発明の実施形態について説明する。
(第1の実施形態)
図1は、本発明の第1の実施形態に係る映像要約装置の基本構成例を示す図である。
図1に示されるように、本映像要約装置は、重要度算出部106、映像区間選択部107、説明文用イベント選択部108、説明文作成部109、統合部110を備えている。
元映像情報101は、例えばテレビの番組やユーザが撮影した映像など、様々な映像コンテンツがこれに該当する。
本実施形態では、元映像情報101は、デジタルデータとする。デジタルデータの形式は、どのような形式でもよい(例えば、MPEG−1やMPEG−2などの圧縮データ形式を用いるのが一般的である)。もちろん、ソース映像がアナログデータでもよいが、この場合には、予め外部でデジタルデータに変換するか、または、本映像要約装置がアナログ・デジタル変換を備える。
映像コンテンツは、1つでも複数でもかまわなく、タイトルやIDなど映像コンテンツを一意に特定できる情報と、再生を開始する時間またはフレーム番号をと与えれば、任意の映像コンテンツを任意の位置から再生可能である。
映像属性情報102は、映像コンテンツに関する様々な属性情報(メタデータ)である。図2に、属性情報の一例を示す。属性情報には、映像コンテンツ内で起きた事象をイベントとして列挙したイベント列が含まれる。イベントは、人物や物体の名称や動き(サッカーの場合、「○○選手のシュート」など)や、時間的な区切り(「試合開始」、「試合終了」など)などの情報がその発生時間と共に記述される。発生時刻の記述は、シーン情報のように区間の始点・終点を記述する形式でもよいし、イベントが発生した瞬間の時刻を記述する形式でもよい。その他、属性情報には、スポーツの種目、対戦チーム名、日時、場所、出場選手、試合結果など、映像コンテンツ中の特定の時間に関連しない情報も含んでよい。また、ここでは具体例としてスポーツを挙げたが、属性情報はコンテンツに応じて適宜記述することができる。例えば、ドラマや情報番組についても登場人物やトピックのタイトルを用いることで、同様に記述することができる。
要約作成情報103は、要約を作成するときのユーザの嗜好や、要約映像の時間、要約アルゴリズムのパラメータなどを含む情報である。ユーザの嗜好とは、ユーザが優先的に視聴したい部分を求めるためのキーワードなどの情報である。スポーツの試合であれば、好みのチームや好みの選手などの情報がこれに該当する。キーワードは、見たい対象だけ記述してもよいし、見たい対象だけではなく、見たくない対象についての記述をも可能にしてもよい。これらの情報は、直接入力してもよいし、毎回同じような条件を入力する手間を省くために予め内部あるいは外部の記憶装置上に保持しておいてもよい。
説明文作成情報104は、映像属性情報102に含まれるイベントから、説明文を作成するときに用いるテンプレート(雛形)を含む情報である。ここで用いるテンプレートとは、例えば、
「(時間)、(チーム)のチャンス。(選手)の(プレイ)!」
のように、固定された文字列と可変の文字列の組み合わせによって与えられる文字列である。この例では、「(時間)」など()によって示された文字列が可変の文字列を表している。
要約映像情報105は、本映像要約装置によって生成させる要約映像である。要約映像情報は、元映像コンテンツの一部と、生成された文字等の可視的情報や音声等の可聴的情報による説明文(例えばテロップやナレーションなど)を含む。また、元映像コンテンツとは別に用意されたコンテンツ(例えば、タイトル画面など)を含めてもかまわない。また、要約映像情報の形態は、元映像とは別の映像コンテンツとして、それ単体で再生できる情報であってもよいし、元映像コンテンツを参照して再生しながら、文字や音声による説明文を表示・再生するものであってもよい。後者には、SMILなど複数のメディアを同期して表示することのできる記述言語を用いることができる。音声の再生には、例えば、音声合成を用いることができる。
重要度算出部106は、入力された映像属性情報102および要約作成情報103に基づいて、映像属性情報102に含まれるイベントごとにその重要度を算出する。イベントの重要度の算出方法は、当該イベントに含まれる文字列と要約作成情報103に含まれるキーワードとの一致の具合の評価値を求めることによって行う。例えば、重要度をwとし、キーワードの総数をNとして、次に例示する式により重要度wを求めることができる。ただし、次式においてαkは、要約作成情報103に含まれるk番目のキーワードの重み値を示すパラメータである。
w=ΣakM(χ)
ここで、Σはk=1〜Nの範囲を総和の対象とする。
また、χ番目のキーワードが一致する場合には、M(χ)=1とし、
χ番目のキーワードが一致しない場合には、M(χ)=0とする。
なお、キーワードとして見たくない対象についての記述をも可能にする構成においては、M(χ)について、
χ番目のキーワードが一致し、χ番目のキーワードが見たい映像に係るキーワードである場合には、M(χ)=1とし、
χ番目のキーワードが一致し、χ番目のキーワードが見たくない映像に係るキーワードである場合には、M(χ)=−1とし、
χ番目のキーワードが一致しない場合には、M(χ)=0とする。
映像区間選択部107は、算出された重要度に従って、要約映像に含める元映像コンテンツの区間を選択する。
図3に、個々のイベントに対応する区間(開始時間と終了時間)が求まっている場合(本実施形態では映像属性情報102に記述されている場合)の区間選択手順の一例(第1の区間選択方法)を示す。
ステップS11では、イベント列の中から、まだ要約映像に含まれていない映像で、重要度が最大のイベントを検索し、これをイベントiとする。
ステップS12では、既に要約映像に含まれるイベントの合計時間とイベントiの時間とを加算し、これを要約作成情報103で指定される要約映像の時間と比較する。越えない場合は、ステップS13へ進み、このイベントiを、要約映像を構成するイベントの1つとして追加する。そして、ステップS11へ戻り、次のイベントの検索を行う。
しかして、ステップS12において、選択済みイベントの時間とイベントiの時間との合計が、要約映像時間を越える場合には、処理を終了する。
この手順は、指定された時間に合うように、時間をしきい値として要約映像を生成するものであったが、生成される要約映像の時間が重要でないような場合には、例えば、重要度をしきい値とし、しきい値以上の重要度を持つイベントを選択してもよい。
また、しきい値以上の重要度を持つイベントのみを対象として、図3の手順を行う方法も可能である。
その他、イベントの重要度のしきい値や、要約映像の時間のしきい値などを用いた区間選択手順には、種々のバリエーションが可能である。
図4に、区間選択手順の他の例(第2の区間選択方法)を示す。この手順例では個々のイベントを時間に対する重要度の関数として表現して、要約映像の区間を選択する方法である。以下、本手順の概要を説明する(本手順の詳細について例えば特願2002−287861号公報参照)。
ステップS21では、イベントの重要度と重要度関数からイベント重要度曲線を算出する。
イベント重要度関数とは、イベント区間の時間による重要度の変化を表す関数である。関数の式はイベントごとに自由に決めることができる。この関数式を重要度に基づいて変化させ、イベント重要度曲線を求める。
一例としては、イベント重要度関数にイベントの重要度を乗ずる。i番目のイベントの関数式をfi(t)とすると、イベント重要度曲線の式は、
i=(wi+ei)fi(t)
となる。ただし、wiはi番目のイベントの重要度である。また、eiは、補正項であり、wi以外の要因を反映させたいときに用いる。
ステップS22では、図5(a)に例示するように、イベント重要度曲線201と時間重要度曲線202とを加算し、コンテンツ全体の時間ごとの重要度変化を示す重要度曲線203を算出する。
ここで、時間重要度曲線とは、イベントの発生とは独立に、コンテンツ全体の時間による重要度の変化を示す。
時間重要度曲線の式をT(t)とすると、コンテンツ全体の重要度曲線は、
ER(t)=Max(Ei(t))+T(t)
となり、イベントの重要度と時間による重要度の両者の合計となる。ただし、Max(Ei(t))は時間tにおけるEi(t)の最大値である。
なお、上記の代わりに、ER(t)=ΣEi(t)+T(t)としてもよい。ここで、Σ(Ei(t))は全イベントについてのEi(t)の総和である。
ステップS23では、図5(b)に例示するように、重要度曲線がしきい値を超える区間を要約映像に含まれる区間として選択し、映像区間情報を得る。図5(b)のように、しきい値を小さくするほど、選択される映像区間は長時間になる。なお、区間の選択に用いるしきい値は、例えば、直接指定してもよいし、指定された時間に合うようにしきい値を求めて、その値を用いてもよい。
なお、区間選択手順には、上記の第1や第2の区間選択方法以外にも、種々のバリエーションが可能である。
説明文用イベント選択部108は、要約映像に用いる文字や音声による説明文(テロップやナレーションなど)の生成に用いるイベントを、イベント列から選択する。基本的には、要約映像の全部に対してのみ説明文を生成する処理と、要約映像の一部に対してのみ説明文を生成する処理と、要約映像の全部又は一部及び要約映像以外の所定の部分に対して説明文を生成する処理と、要約映像以外の所定の部分に対してのみ説明文を生成する処理が考えられる。これらのイベント選択処理は、映像区間選択部107とは独立して処理してもよいし、映像区間選択部107のデータを利用してもよい。
説明文用イベント選択部108で用いられるアルゴリズムは、基本的には、映像区間選択部107で用いられるアルゴリズムと同様の考えに基づくものでよい。例えば、第1の区間選択方法と同様にイベントごとの重要度をもとに、しきい値以上の重要度を持つイベントを選択する方法(第1のイベント選択方法)や、第2の区間選択方法と同様にコンテンツ全体の重要度曲線を求め、しきい値以上の重要度である区間に含まれるイベントを選択する方法(第2のイベント選択方法)がある。もちろん、その他の方法も可能である。
説明文用イベント選択部108が映像区間選択部107のデータを利用する場合には、一例として、区間選択方法とイベント選択方法との間で、しきい値だけを変更して同じ選択方法を用いるものがある。その際、例えば、映像区間の中でも特に重要な一部イベントに対して、重点的に説明文を生成したい場合は、しきい値をより高く設定し、特に重要なイベントだけが選択されるようにすればよい。また、映像区間に含まれないやや重要度の低いイベントに対しても説明文を生成して、詳細な情報を提供したい場合は、しきい値を低く設定し、より広範なイベントが選択されるようにすればよい。イベント選択に用いるしきい値は1つである必要はなく、文字で表現される説明文や音声で表現される説明文など、用途に応じて複数のしきい値を用いてもよい。
また、映像区間選択部107のデータを利用する他の例としては、先に選択された映像区間に含まれるイベントの中から、説明文作成に用いるイベントを選択する。このときのイベント選択方法は、映像区間の選択方法と同じでもよいし、異なっていてもよい。異なる例としては、第2の区間選択方法で映像区間を選択し、その映像区間に含まれるイベントの中から、第1のイベント選択方法を用いてイベントを選択する。
一方、映像区間選択部107とは独立してイベントを選択する例としては、イベント列から第1の区間選択方法で映像区間を、第2のイベント選択方法で説明文用イベントを選択するなど、異なる選択方法を組み合わせて用いる。また、同じ選択方法の組み合わせであっても、重要度算出部106の重み値などのパラメータが異なる場合が例として挙げられる。
さらに、例えば、文字等の可視的情報で表現される説明文(以下、文字説明文)と音声等の可聴的情報で表現される説明文(以下、音声説明文)とを併用する場合に、1つのイベント選択方法によって選択された個々のイベントについて、文字説明文を生成するか、音声説明文を生成するか、両者を生成するかを、所定の基準(例えば、当該イベントについて重要度が高く映像区間も選択されている場合には両者、重要度は高くないが映像区間が選択されている場合には音声説明文のみ、映像区間が選択されていない場合には文字説明文のみ、といった基準)によって自動的に決定するか、あるいはユーザがイベントごとに直接指示して決定する方法も可能である。このとき、説明文用イベント選択部108は、選択された各イベントについて、上記の決定内容を特定できる情報を、説明文作成部109へ通知するようにする。なお、この決定処理は、説明文作成部109で行っても構わない。
また、文字説明文と音声説明文とを併用する場合に、文字説明文に用いるイベントを選択する処理と、文字説明文に用いるイベントを選択する処理とを、独立して行う方法も可能である。
また、1つのイベント選択方法によって選択された全てのイベントについて、文字説明文と音声説明文の両者を生成しておき、ユーザが、説明文を、文字のみで出力するか、音声のみで出力するか、両者を出力するかを、選択できるようにしてもよい。
説明文作成部109は、説明文用イベント選択部108で選択された説明文用イベントと説明文作成情報104とから、(文字等の可視的情報や音声等の可聴的情報による)説明文を生成する。
前述したように、説明文作成情報は、説明文を生成するためのテンプレートを含む情報である。テンプレートとは、例えば、
「(時間)、(チーム)のチャンス。(選手)の(プレイ)!」
のように、固定された文字列と可変の文字列の組み合わせによって、与えられる文字列である。この例では、「(時間)」など()によって示された文字列が可変の文字列を表している。
可変の文字列には、映像属性情報102や要約作成情報103から、直接的あるいは間接的に得ることができる文字列が入る。このようなテンプレートがイベントの種類などによって複数用意される。例えば、イベント列から、
「時間:前半12分、チーム:チームA、選手:X選手、プレイ:シュート」
の情報が得られた場合に、先に例示したテンプレート、すなわち、
「(時間)、(チーム)のチャンス。(選手)の(プレイ)!」
に当てはめて、
「前半12分、チームAのチャンス。X選手のシュート!」
と、説明文が生成される。
また、2つ以上のイベント列の情報と1つのテンプレートを用いて説明文を生成してもよい。例えば、第1イベントがセンタリングで、第2イベントがシュート、第3イベントがゴールのように、関連するイベントが連続する場合に、これを「(センタリングした選手)が上げたボールを(シュートした選手)がシュート。ゴール!」などと、1つの説明文にまとめることもできる。
イベントの関連性を判断するには、関連イベントとするイベントの種類を列挙した情報を作成し、入力されてくるイベント列との間で比較を行えばよい。例えば、前述の例の場合、「センタリング、シュート、ゴール」とイベントの種類を列挙した情報を作成しておく。イベントの種類以外に時間的に近いイベントのみをまとめるためにイベント発生時刻の間隔などを記述しておいてもよい。
なお、説明文作成部109は、例えば、文字説明文と音声説明文との両方を作成する可能性がある場合には、文字説明文を作成するための部分と、音声説明文を作成するための部分とを兼ね備えるものとする。もちろん、文字説明文のみ作成する場合には、文字説明文を作成するための部分のみ備えればよい。音声説明文のみ作成する場合についても同様である。
統合部110は、映像区間情報と文字テロップや音声ナレーションによる説明文とを統合し、両方の情報を含んだ要約映像情報を作成する。文字の表示や音声の発話のタイミングは、イベントの発生時刻や映像区間に合わせて行う。発生時刻に合わせる場合、発生時刻の前に適当な間隔をおいて表示、発話したり、発話区間の特定の位置(例えば中間点)がイベントの発生時刻となるように表示、発話したりするようにタイミングを調整すればよい。また、映像区間に合わせる場合は、その区間の開始点や終了点から適当な間隔をとって表示、発話すればよい。もちろん、これらの複数の手法を組み合わせて、例えば、文字テロップは映像区間に合わせ、音声ナレーションはイベントの発生時刻に合わせて用いるなどしてもよい。
統合時には、テロップのオーバーレイ表示や、音声合成による音声ナレーションを作成して、要約映像に含めてもよいし、テキストの状態で要約映像情報として記述して、再生装置側で、オーバーレイ表示音声合成を行ってもよい。
なお、上記では、統合部11は、選択された映像区間情報と生成された説明文情報とを単純に重ね合わせて、1つの映像要約情報として出力する例を示したが、映像区間や音量の調整を含むようにしてもよい。
図6に、この場合の統合部110の処理手順例を示す。なお、本処理手順において、ステップS31及びステップS32は、不要であれば、どちらかを省略してもよい。
ステップS31では、映像区間情報を説明文情報の表示(テロップ)、再生(音声ナレーション)のタイミングに合わせて調整する。
例えば、音声ナレーションの発話時間に対して映像区間が短すぎる場合に、音声ナレーションが収まるように映像区間を拡張する。拡張した部分の時間は、他の区間(ナレーションの短い区間など)を短縮することで、吸収してもよいし、そのままにしておいてもよい。なお、発話時間の代わりに文字数や単語数を用いてもよい。
また、例えば、図7の調整前の映像の或る映像区間301に対して、ナレーション303a,303bを挿入したい場合を考える。この場合、イベントの発生時刻の近傍の区間302にはナレーションは入れずに、歓声だけを利用し、その前後にナレーションを挿入するようにしてもよい。図7において、斜線で表されているのがナレーションの時間長である。図7の例では、ナレーション303aは問題ないが、ナレーション303bは挿入先の区間に対して長すぎるため、そのまま挿入すると映像区間301の終端を越えてしまう。そこで、映像区間を301から304のように、後方へずらすことで、両方のナレーションが収まるように調整することができる。
ステップS32では、映像に含まれる音声の音量を調節する。例えば、音声ナレーションを再生する部分の映像の音量を、音声ナレーションが聞き取りやすくなるように小さくしたり、ゴールなどのイベントが発生した部分の歓声などを大きくしたりする。
ステップS33では、調整された映像とテロップやナレーションをまとめた要約映像情報を作成する。
以上のように本実施形態によれば、映像情報の中から、ユーザの入力したキーワードや時間などの条件やユーザの好みに基づいて、ユーザの興味のある映像区間のみを選択し、それにテロップや音声ナレーションを付加した要約映像を作成することができる。また、省略されてしまった重要なシーンを説明文で補うことで、より内容を理解しやすい要約映像を作成することができる。
したがって、本実施形態によれば、ユーザは1つの番組をまるごと再生することなく、自分の興味のある部分だけを含む要約を作成して、再生することが可能である。その際に、テロップや音声ナレーションによる説明を映像に現れない部分を含めて、ユーザの嗜好に合った文章や口調で受けることができる。
(第2の実施形態)
図8は、本発明の第2の実施形態に係る説明文生成装置の基本構成例を示す図である。
図8に示されるように、本説明文生成装置は、遷移制御部406、テンプレート選択部407、説明文生成部408を備えている。
本説明文生成装置は、第1の実施形態の説明文作成部として用いることができる。
イベント情報401は、説明文生成に用いるイベント情報である。このイベント情報は、生成する説明文によって、元映像に付けられた全イベント情報である場合もあるし、選択された一部のイベントに関する情報のみの場合もある。
遷移状態情報402は、説明文生成過程における遷移状態を保持した情報である。
遷移条件情報403は、イベントの発生により、あるノード(状態)から別のノードに遷移するときの遷移条件と遷移先ノードを示す情報である。
説明文用テンプレート情報404は、イベント情報を当てはめて説明文を生成するためのテンプレート(雛形)となる情報である。
説明文情報405は、生成される説明文(文字テロップや音声ナレーションなど)である。
遷移制御部406は、イベント情報を受け取り、遷移条件情報に従って、遷移状態情報の更新を行う。
テンプレート選択部407は、説明文用テンプレート情報から、直前の遷移に対応した説明文テンプレートを選択する。
説明文生成部408は、選択されたテンプレートに対して、イベント情報を当てはめた説明文情報を生成する。
次に、各部の処理を、図9を参照しながら説明する。図9は、イベント発生時の状態遷移の一例を表す。
図9において、現ノード(501)が現在の状態に対応し、イベントの発生により、ノードA(502)やノードB(503)で表される状態に遷移する。具体例を挙げると、スポーツの試合において、現在が同点の状態で、現ノードにあるとする。また、Aチームのリードした状態をノードA、Bチームのリードした状態をノードBとする。得点イベントの発生により、現ノードからAチームのリードした状態(ノードA)あるいはBチームのリードした状態(ノードB)に遷移する。
1つのノードは複数の遷移先ノードを持つことができ、どのノードに遷移するかは遷移条件によって決まる。例えば、遷移条件Aは「Aチームの得点」、遷移条件Bは「Bチームの得点」と定める。もちろん、遷移条件の記述は「Aチームの得点」である必要はなく、「チーム=Aチーム、かつ、行動=得点」のように、イベントの項目ごとのマッチングでもよい。また、意味が同じであれば、単語を羅列するだけでもよいし、XMLなどの記述言語を用いてもよい。
遷移条件は、チームや選手名などのイベントから直接得られる情報や、得点経過や試合時間などの間接的に得られる情報、要約作成条件として与えられた情報、映像データを解析することによって得られる動きベクトルや色などの特徴量、ノードの通過回数や遷移元ノードなどの状態遷移から得られる情報など、様々な情報を用いて記述することができる。
遷移制御部406は、発生したイベントと遷移条件を比較し、遷移状態情報に含まれる現ノード位置を更新する。前述の具体例を用いると、発生したイベントがAチームの得点イベントである場合には、現ノードをノードAに遷移させ、Bチームの得点イベントである場合には、現ノードをノードBに遷移させる。また、本例では当てはまらないが、遷移条件Cのように現ノードが更新されない場合もあり得る。
個々の状態遷移には対応する説明文テンプレートが存在する。ただし、説明文の生成を必要としない場合は、省略してもよい。例えば、遷移条件Aに従ってノードAに遷移するときにはテンプレートAを、遷移条件Bに従ってノードBに遷移するときにはテンプレートBを用いる。異なるノード間の状態遷移に対して、同じテンプレートを用いてもかまわない。前述の具体例の場合、「(時間)、(チーム)のチャンス、(選手名)のシュート。ゴール!」などとなる。ただし、()内はイベントによって決まる変数である。
説明文生成部408では、イベント情報やコンテンツ全体の情報などから、直接的あるいは間接的に得られる情報を前述の説明文テンプレートに当てはめ、説明文情報を生成する。間接的に得られる情報というのは、例えば、映像に対応する時間情報から、試合の時間情報を得る場合などである。前述の具体例の場合、時間:前半30分、チーム:Aチーム、選手名:Xとすると、「前半30分、Aチームのチャンス、Xのシュート。ゴール!」となる。
図10に、スポーツの試合における得点時のナレーション生成に用いる状態遷移ルールの一例を示す。この例では、開始、Aリード、同点A、Bリード、同点Bの5つのノードが存在する。開始ノードが初期の状態である。また、Aリード:チームAがリードしている状態、Bリード:チームBがリードしている状態、同点A:チームAがリードしている状態から同点になった状態、同点B:チームBがリードしている状態から同点になった状態を示す。状態遷移を示す矢印のうち、実線は「チームAの得点」、破線は「チームBの得点」が遷移条件であることを示す。また、「」内の文章はそれぞれの遷移に対応する説明文テンプレートである。なお、Aリード及びBリードより同一遷移条件で2つの遷移が出ているが、これらは、遷移条件としてチーム以外に得点差を考慮したものである。
本手法により、同じ得点イベントであっても、その状況に応じて適切な説明文を選択することができることが分かる。例えば、同点からの得点イベントが発生した場合、開始ノード601からの遷移であるときは先制点であり、テンプレート602を用いる。同点に追いついた後(ノード603)であれば逆転であり、テンプレート604を用いる。同点に追いつかれた後(ノード605)であれば再び勝ち越したことを示す説明文をテンプレート606により、生成できる。
図11に、スポーツの試合における得点時のナレーション生成に用いる状態遷移ルールの他の例を示す。この例ではチームAが好きなユーザ向けに、チームAを主役にした説明文を生成する。例えば、チームBの得点であっても、チームAを主役にし、テンプレート701「逆転された」やテンプレート702「追いつかれた」など、チームAを中心にしたテンプレートを用いる。このように、同じ状態遷移に対して、異なる説明文テンプレートのセットを用意することにより、ユーザの嗜好や用途に応じた説明文を生成することが可能である。
図12に、スポーツの試合における得点時のナレーション生成に用いる状態遷移ルールのさらに他の例を示す。この例では、テンプレート801のように1つの遷移に対して、複数の説明文テンプレートが対応付けられている。これらのテンプレートは遷移条件とは別の説明文条件によって、選択が行われる。説明文条件は、遷移条件と同様にチームや選手名などのイベントから直接得られる情報や、得点経過や試合時間などの間接的に得られる情報、要約作成条件として与えられた情報、映像データを解析することによって得られる動きベクトルや色などの特徴量、ノードの通過回数や遷移元ノードなどの状態遷移から得られる情報など、様々な情報により記述される。
説明文条件を用いることにより、ノード数を削減し、状態遷移図を簡略化することができる。例えば、図12の場合、開始、同点A、同点Bの状態を1つの同点ノードにまとめ、直前が0対0であれば、先制点、相手チームのリードから追いついた同点であれば、逆転というふうに、テンプレートを切り替える。なお、図12中の条件の表記は一例として、if (条件)then「テンプレート」のif−thenルールの表記を用いているが、もちろん、他の表記方法を用いてもかまわない。
図13に、複数の状態遷移ルールを用いる方法の一例を示す。上記では、得点経過の状態遷移を例に状態遷移ルールを説明したが、実際のスポーツの試合では得点以外にも複数の状態遷移が存在する。例えば、野球を例にすると、回やその表裏の遷移があり、1つの回の表あるいは裏は3つのアウトの遷移がある。さらにその下に、打者や投球ごとの細かい階層の遷移が存在する。
これらの状態遷移をすべて1つの状態遷移ルールとして記述することもできるが、非常に煩雑になってしまう。そこで、状態遷移ルールを複数用いる。図13で、状態遷移ルール1(901)と状態遷移ルール2(902)は同じ階層の状態遷移に対応し、同時並行的に処理が行われる。これに対し、状態遷移ルール3(903)は状態遷移ルール1がノード4(904)の状態にある場合に適用される。状態遷移ルール1において、ノード4からの遷移条件が成立すれば、状態遷移ルール3の状態に関わらず、次のノードに遷移する。このとき、ノード4からの遷移条件として、状態遷移ルール3の状態を用いてもかまわない。
図14に、状態遷移ルールを記述するデータ構造の一例を示す。
ノード情報1001は、1つのノードに関する情報を記述する。ノード情報にはそのノードの識別情報を示すノードID1002と遷移先ノードについての情報を記した遷移先情報1003を含む。遷移先情報は遷移先ノードの数に応じて、複数存在してもよい。遷移先情報には、遷移先ノードのノードIDを示す遷移先ノードID1004、遷移先ノードへ遷移するための遷移条件1005、この遷移ときに用いられる説明文テンプレートについて記述する説明文情報1006を含む。遷移先が1つで、必ず遷移する場合など、遷移条件が不要な場合は省略してもよい。説明文情報は説明文テンプレートの数に応じて、複数存在してもよい。個々の説明文情報は、説明文条件1007と説明文テンプレート1008の情報を含み、複数のテンプレートを用いる場合は説明文条件に応じて切り替える。また、説明文情報が1つで、切り替えの必要がない場合の説明文条件は省略してもよい。
図15に、複数の状態遷移ルールを記述するデータ構造の一例を示す。ここでは、図14との相違点についてのみ説明する。
状態遷移ルール1101は、状態遷移ルールについて記述する情報で、状態遷移ルールの識別情報を示すルールID1102とノード情報1103を含む。ノード情報には前述のノードIDや遷移先情報に加えて、そのノードのもとで適用される別の状態遷移ルール1104を保持する。この状態遷移ルールのデータ構造は、状態遷移ルールと同じものである。なお、状態遷移ルールの記述は、図15のように実体を記述してもよいし、他の場所で定義された状態遷移ルールをルールIDにより参照してもよい。特に、同じ状態遷移ルールを複数回使う場合は、1箇所で状態遷移ルールを定義し、それをルールIDで参照すれば効率がよい。このような参照を行わず、ルールIDが不要ならばルールIDを省略してもかまわない。
ところで、複数の状態遷移ルールを用いると、1つのイベント情報の入力に対して、個々の状態遷移ルールに対応した複数の説明文が生成される場合がある。これらの説明文を整理して表示(文字テロップなどの場合)あるいは再生(音声ナレーションなどの場合)するために、個々の説明文をどのように表示あるいは再生するかを示す位置情報を付加してもよい。この位置情報は、表示位置の座標や大きさなどを示す空間的な情報、または、再生時間を示す時間的な情報である。これらの空間的あるいは時間的な位置情報は、状態遷移ルールとともに記述することができる。例えば、1つの状態遷移ルールで共通した位置を用いる場合は、状態遷移ルール1105の要素として、記述すればよい。また、遷移ごとあるいは説明文ごとに位置を変更する場合は、遷移先情報1003や説明文情報1006の要素として記述すればよい。
図16に、時間的な位置情報として、イベントを中心とした相対的な位置を記述する方法の一例を示す。イベントの時刻を中心にし、それよりも前に再生するか、後に再生するかを記述する。図16の斜線部分が説明文(音声ナレーション)の挿入される区間である。また、前あるいは後ろに複数の説明文が存在する場合のために、イベント時刻からの順序を記述する。この順序は連番である必要はない。この前後情報と順序情報を時間的な位置情報として記述しておくことで、1つのイベントに対して、複数の音声ナレーションが生成された場合でも、自然なナレーションとなるように統合することができる。
なお、上記では、前後位置を示す情報(本例では、前又は後)と、イベント時刻からみた順序を示す情報(本例では、1又は2)で、イベントを中心とした相対的な位置を記述する方法の一例を示したが、もちろん、これに限定されるものではない。
例えば、時間的な位置情報を正負の数で表すことも可能である。この場合、例えば、イベント時刻を起点とし、これを0で表し、イベント時刻より前の位置を負の数(絶対値は、上記のイベント時刻からみた順序を示す情報と同じ)、イベント時刻より後の位置を正の数(絶対値は、上記のイベント時刻からみた順序を示す情報と同じ)で表すことができる。この方法によれば、図16の具体例の場合、先の方法による(前,2),(前,1),(後,1),(後,2)は、それぞれ、−2,−1,1,2で表すことができる。
以下、状態遷移による説明文生成の応用例を示す。
図17に、状態遷移をもとに、試合を優勢に進めているチームや劣勢にあるチームなどの優劣情報を得るための基本的な書手順の一例を示す。優劣情報は、チームごとに数値などで表してもよいし、どちらのチームが優勢あるいは劣勢という情報でもよい。この優劣情報は遷移条件や説明文条件などの内部情報として用いてもよいし、ユーザに分かるような情報として用いてもよい。
ステップS41では、状態遷移ルールに基づく遷移状態の現ノード位置の優劣値を全体の優劣値に加算する。
ステップS42では、他に処理対象となる状態遷移ルールが存在するか判定し、存在する場合はステップS41に戻り、その状態遷移ルールに基づく遷移状態の現ノード位置の優劣値を加算する。これを処理対象となる状態遷移ルールがなくなくまで繰り返し、ステップS43へと進む。
ステップS43では全体の優劣値から、優劣情報を得る。
ここで、優劣値は、例えば、優勢チームの優勢度合を0〜1の間の連続的に変化する数値で表現してもよいし、どちらのチームが優勢かだけをあらわしてもよい。後者の場合、0か1の離散的な値をとると考えることができる。
(第3の実施形態)
図18は、本発明の第3の実施形態に係る映像要約装置の基本構成例を示す図である。
図18に示されるように、本映像要約装置は、全体説明作成部1202、重要度算出部1203、映像区間選択部1204、説明文用イベント選択部108、説明文作成部109、統合部110を備えている。
本実施形態は第1又は第2の実施形態の拡張であるため、第1又は第2の実施形態との相違点についてのみ述べる。
要約映像構成情報1201は、生成される要約映像のシーン構成と、それに付帯する情報を記した情報である。要約映像には、試合展開の要約、特定の選手に注目した要約など様々な要約がある。また、本編を視聴するための判断材料にするときには、ゴールシーンや試合結果は知りたくない場合もある。特定の選手に注目するときは、1つの試合の要約ではなく、複数の試合からまとめて要約を作成する場合もある。要約映像構成情報は、このような要約のシーン構成を記したものである。
図19に、要約映像構成情報の一例を示す。図19においては、シーンごとの時間と内容を含んでいる。時間は、そのシーンの長さやその最大値、最小値である。内容は、そのシーンのタイプ(映像、要約映像、合成映像など)に応じて、そのシーンを作成するために必要なパラメータが記述される。映像を抽出するのであれば、その場所や範囲を示すパラメータ、テロップやナレーションを用いるのであれば、そのテンプレートや位置を示すパラメータを記述する。
全体説明作成部1202は、要約映像構成情報に基づき、コンテンツ全体に関わる説明を作成する。作成される説明は、要約映像構成情報に記述されたテロップやナレーション、あるいはそれらを用いた合成映像などである。また、先の例のタイトルシーンのように特定の映像が指定されている場合には、その検索も行う。テロップやナレーションのテンプレートに当てはめるデータは、映像属性情報や映像作成情報から得られるデータを用いる。
重要度算出部1203や映像区間選択部1204は、要約映像構成情報に含まれる要約映像シーンに関するパラメータを受け取り、その内容を満足する要約映像を作成する。具体的には、要約映像を抽出する範囲を要約映像構成情報で指定された範囲に限定したり、作成される要約映像の時間が指定された時間に合致するようにしきい値を設定したりする。また、本編を視聴するための判断材料にするときなど、結果を知りたくない場合には、得点シーンが入らないようにシュート以降の重要度を下げたり、その区間を除いた範囲から要約を作成したりする。
本実施形態によれば、ユーザの嗜好に依存するだけではなく、予め決められたシーン構成を満足する要約映像を作成することができる。
(第4の実施形態)
図20は、本発明の第4の実施形態に係る映像要約装置の基本構成例を示す図である。
図20に示されるように、本映像要約装置は、図18の構成に加えて、要約映像構成情報選択部1304、説明文作成情報選択部1305を備えている。
本実施形態は第3実施形態の拡張であるため、第3実施形態との相違点についてのみ述べる。
ユーザプリファレンス1301とは、ユーザの嗜好に関する情報を記述したものである。
要約映像構成情報データベース1302は、複数の要約映像構成情報を格納したデータベースである。第3の実施形態で述べたように、要約映像構成情報には様々なシーン構成が存在する。これらの様々なバリエーションが本データベース1302に格納されている。
説明文作成情報データベース1303は、様々な説明文テンプレートや状態遷移ルール(状態遷移による説明文生成を行う場合)などの情報を格納したデータベースである。同じ内容を示すテンプレートであっても、口調や方言の違いにより複数のバリエーションがあり得る。
要約映像構成情報選択部1304は、要約映像構成情報データベースから、ユーザプリファレンスに合致する要約映像構成情報を選択する。
説明文作成情報選択部1305は、説明文作成情報データベースから、ユーザプリファレンスに合致する説明文作成情報を選択する。
本実施形態の要約映像装置を用いることにより、ユーザはユーザプリファレンスに自分の好みのシーン構成や説明文の様式を記述しておくことで、キーワードと時間を指定するだけの場合と比べて、より自分の好みに合った要約映像を得ることができる。
なお、以上の各機能は、ソフトウェアとして実現可能である。また、本実施形態は、コンピュータに所定の手段を実行させるための(あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるための)プログラムとして実施することもでき、該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の第1の実施形態に係る映像要約装置の基本構成例を示すブロック図 映像属性の一例を示す図 第1の選択方法の処理手順の一例を示すフローチャート 第2の選択方法の処理手順の一例を示すフローチャート 第2の選択方法について説明するための図 統合部の処理手順の一例を示すフローチャート 映像区間調整の例について説明するための図 本発明の第2の実施形態に係る説明文生成装置の基本構成例を示すブロック図 イベント発生時の状態遷移について説明するための図 状態遷移ルールの一例を示す図 状態遷移ルールの他の例を示す図 状態遷移ルールのさらに他の例を示す図 複数の状態遷移ルールを用いる場合について説明する図 状態遷移ルールのデータ構造の一例を示す図 複数の状態遷移ルールを用いる場合の状態遷移ルールのデータ構造の一例を示す図 複数の説明文を統合する方法について説明するための図 遷移状態から優劣情報を得る基本的な処理手順の一例を示すフローチャート 本発明の第3の実施形態に係る映像要約装置の基本構成例を示すブロック図 要約映像構成情報の一例を示す図 本発明の第4の実施形態に係る映像要約装置の基本構成例を示すブロック図
符号の説明
106…重要度算出部、107…映像区間選択部、108…説明文用イベント選択部、109…説明文作成部、110…統合部、406…遷移制御部、407…テンプレート選択部、408…説明文生成部、1202…全体説明作成部、1203…重要度算出部、1204…映像区間選択部、1304…要約映像構成情報選択部、1305…説明文作成情報選択部

Claims (22)

  1. 映像内に含まれるイベントの内容に関する第1の情報に基づいて、各イベントの重要度を算出する算出手段と、
    前記映像内に含まれるイベントの映像区間に関する第2の情報及び前記重要度並びに重要度の下限を示す第1のしきい値に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択手段と、
    前記重要度及び前記第1のしきい値とは独立に重要度の下限を示す第2のしきい値に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択手段と、
    この第2の選択手段により選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成手段と、
    前記第1の選択手段により選択された前記映像区間を連結した要約映像と、前記第1の生成手段により作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成手段とを備えたことを特徴とする映像要約装置。
  2. 前記第2のしきい値を前記第1のしきい値より低く設定することによって、前記第2の選択手段、前記映像内に含まれるイベントのうち、前記第1の選択手段により選択された前記映像区間に含まれるイベント以外のイベントを少なくとも一つ選択するようにしたことを特徴とする請求項1に記載の映像要約装置。
  3. 前記第2のしきい値を前記第1のしきい値より高く設定することによって、前記第2の選択手段が、前記第1の選択手段により選択された前記映像区間に含まれるイベントのうちの一部のみを選択するようにしたことを特徴とする請求項1に記載の映像要約装置。
  4. 映像内に含まれるイベントの内容に関する第1の情報に基づいて、各イベントについて、それぞれ、要約映像として用いるイベントの映像区間の選択に用いる第1の重要度と、説明文を作成する対象にするイベントの選択に用いる第2の重要度とを算出する算出手段と、
    前記映像内に含まれるイベントの映像区間に関する第2の情報及び前記第1の重要度に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択手段と、
    前記第2の重要度に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択手段と、
    この第2の選択手段により選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成手段と、
    前記第1の選択手段により選択された前記映像区間を連結した要約映像と、前記第1の生成手段により作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成手段とを備え、
    前記第1の情報は、各イベントの内容を示す文字列を含むものであり、
    前記算出手段は、各イベントの重要度を算出するにあたって、予め第1の重み値及び第2の重み値がそれぞれ定められた複数のキーワードのうち、当該イベントに係る前記第1の情報に含まれる文字列に合致するキーワードに係る第1の重み値に基づいて、当該イベントの第1の重要度を算出し、当該イベントに係る前記第1の情報に含まれる文字列に合致するキーワードに係る第2の重み値に基づいて、当該イベントの第2の重要度を算出するものであることを特徴とする映像要約装置。
  5. 映像内に含まれるイベントの内容に関する第1の情報に基づいて、各イベントの重要度を算出する算出手段と、
    前記映像内に含まれるイベントの映像区間に関する第2の情報及び前記重要度に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択手段と、
    前記重要度及び重要度の下限を示すしきい値に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択手段と、
    この第2の選択手段により選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成手段と、
    前記第1の選択手段により選択された前記映像区間を連結した要約映像と、前記第1の生成手段により作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成手段とを備え、
    前記第1の選択手段は、前記重要度の高い順に、そのイベントに係る映像区間を選択するものであるとともに、選択したイベントの映像区間に係る時間の総和が、予め指定された制限時間の範囲内に収まるように、前記映像区間を選択するものであることを特徴とする映像要約装置。
  6. 前記第2の選択手段は、前記第1の選択手段により選択された前記映像区間に含まれるイベントをすべて選択することを特徴とする請求項1、4または5に記載の映像要約装置。
  7. 前記第1の選択手段は、イベントの重要度の高い順に、前記しきい値を満たす範囲でそのイベントに係る映像区間を選択するものであることを特徴とする請求項1または4に記載の映像要約装置。
  8. 前記第2の選択手段は、イベントの重要度の高い順に、前記しきい値を満たす範囲でイベントを選択するものであることを特徴とする請求項1、4または5に記載の映像要約装置。
  9. 前記第1の選択手段、イベントの重要度を時間に対する関数として、前記しきい値以上の重要度である映像区間を選択するものであることを特徴とする請求項1または4に記載の映像要約装置。
  10. 前記第2の選択手段、イベントの重要度を時間に対する関数として、前記しきい値以上の重要度である映像区間に含まれるイベントを選択するものであることを特徴とする請求項1、4または5に記載の映像要約装置。
  11. 前記第1の生成手段は、前記第2の選択手段により選択された関連する複数のイベントを取り纏めて、1つの説明文を生成することを特徴とする請求項1、4または5に記載の映像要約装置。
  12. 前記第2の生成手段は、前記説明文と前記要約映像の映像区間とが同時に再生又は表示される場合に、前記説明文の再生又は表示に要する時間が、前記要約映像の映像区間に係る時間に収まるように、前記要約映像の映像区間を調整することを特徴とする請求項1、4または5に記載の映像要約装置。
  13. 前記第2の生成手段は、前記説明文と前記要約映像の映像区間とが同時に再生又は表示され、かつ、前記説明文と前記要約映像の映像区間とのいずれも音声を伴うものである場合に、前記要約映像の映像区間に伴う音声の音量を、前記説明文に伴う音声の音量より小さくなるように、調整することを特徴とする請求項1、4または5に記載の映像要約装置。
  14. 前記算出手段は、前記第1の情報として与えられたイベントの内容を示す文字列と、ユーザ情報として与えられたユーザの嗜好を示す文字列とを比較した結果に基づいて、前記重要度を算出することを特徴とする請求項1に記載の映像要約装置。
  15. 前記要約映像情報全体に関する説明文及び又は映像を生成する第3の生成手段を更に備え、
    前記要約映像情報に持たせるべきシーン構成に関する情報と各シーンに含めるべき映像及び説明文に関する情報とを含む要約映像構成情報に基づいて、前記映像区間の選択及び前記イベントの選択、前記イベントに関する説明文の生成及び前記要約映像情報全体に関する説明文及び又は映像の生成、並びに前記要約映像情報の生成を行うことを特徴とする請求項1、4または5に記載の映像要約装置。
  16. 複数の前記要約映像構成情報のうちから、ユーザの嗜好に関する情報を記述したユーザプリファレンス情報に合致する要約映像構成情報を選択する手段を更に備え、
    この手段により選択された要約映像構成情報を用いて、前記要約映像情報を生成することを特徴とする請求項1、4または5に記載の映像要約装置。
  17. 映像内に含まれるイベントの内容に関する第1の情報に基づいて、各イベントの重要度を算出する算出ステップと、
    前記映像内に含まれるイベントの映像区間に関する第2の情報及び前記重要度並びに重要度の下限を示す第1のしきい値に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択ステップと、
    前記重要度及び前記第1のしきい値とは独立に重要度の下限を示す第2のしきい値に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択ステップと、
    この第2の選択ステップにより選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成ステップと、
    前記第1の選択ステップにより選択された前記映像区間を連結した要約映像と、前記第1の生成ステップにより作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成ステップとを有することを特徴とする映像要約方法。
  18. 映像内に含まれるイベントの内容に関する第1の情報に基づいて、各イベントについて、それぞれ、要約映像として用いるイベントの映像区間の選択に用いる第1の重要度と、説明文を作成する対象にするイベントの選択に用いる第2の重要度とを算出する算出ステップと、
    前記映像内に含まれるイベントの映像区間に関する第2の情報及び前記第1の重要度に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択ステップと、
    前記第2の重要度に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択ステップと、
    この第2の選択ステップにより選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成ステップと、
    前記第1の選択ステップにより選択された前記映像区間を連結した要約映像と、前記第1の生成ステップにより作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成ステップとを有し、
    前記第1の情報は、各イベントの内容を示す文字列を含むものであり、
    前記算出ステップは、各イベントの重要度を算出するにあたって、予め第1の重み値及び第2の重み値がそれぞれ定められた複数のキーワードのうち、当該イベントに係る前記第1の情報に含まれる文字列に合致するキーワードに係る第1の重み値に基づいて、当該イベントの第1の重要度を算出し、当該イベントに係る前記第1の情報に含まれる文字列に合致するキーワードに係る第2の重み値に基づいて、当該イベントの第2の重要度を算出するものであることを特徴とする映像要約方法。
  19. 映像内に含まれるイベントの内容に関する第1の情報に基づいて、各イベントの重要度を算出する算出ステップと、
    前記映像内に含まれるイベントの映像区間に関する第2の情報及び前記重要度に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択ステップと、
    前記重要度及び重要度の下限を示すしきい値に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択ステップと、
    この第2の選択ステップにより選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成ステップと、
    前記第1の選択ステップにより選択された前記映像区間を連結した要約映像と、前記第1の生成ステップにより作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成ステップとを有し、
    前記第1の選択ステップは、前記重要度の高い順に、そのイベントに係る映像区間を選択するものであるとともに、選択したイベントの映像区間に係る時間の総和が、予め指定された制限時間の範囲内に収まるように、前記映像区間を選択するものであることを特徴とする映像要約方法。
  20. 映像要約装置としてコンピュータを機能させるためのプログラムであって、
    映像内に含まれるイベントの内容に関する第1の情報に基づいて、各イベントの重要度を算出する算出機能と、
    前記映像内に含まれるイベントの映像区間に関する第2の情報及び前記重要度並びに重要度の下限を示す第1のしきい値に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択機能と、
    前記重要度及び前記第1のしきい値とは独立に重要度の下限を示す第2のしきい値に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択機能と、
    この第2の選択機能により選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成機能と、
    前記第1の選択機能により選択された前記映像区間を連結した要約映像と、前記第1の生成機能により作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成機能とをコンピュータに実現させるためのプログラム。
  21. 映像要約装置としてコンピュータを機能させるためのプログラムであって、
    映像内に含まれるイベントの内容に関する第1の情報に基づいて、各イベントについて、それぞれ、要約映像として用いるイベントの映像区間の選択に用いる第1の重要度と、説明文を作成する対象にするイベントの選択に用いる第2の重要度とを算出する算出機能と、
    前記映像内に含まれるイベントの映像区間に関する第2の情報及び前記第1の重要度に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択機能と、
    前記第2の重要度に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択機能と、
    この第2の選択機能により選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成機能と、
    前記第1の選択機能により選択された前記映像区間を連結した要約映像と、前記第1の生成機能により作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成機能とをコンピュータに実現させるためのものであるとともに、
    前記第1の情報は、各イベントの内容を示す文字列を含むものであり、
    前記算出機能は、各イベントの重要度を算出するにあたって、予め第1の重み値及び第2の重み値がそれぞれ定められた複数のキーワードのうち、当該イベントに係る前記第1の情報に含まれる文字列に合致するキーワードに係る第1の重み値に基づいて、当該イベントの第1の重要度を算出し、当該イベントに係る前記第1の情報に含まれる文字列に合致するキーワードに係る第2の重み値に基づいて、当該イベントの第2の重要度を算出するものであることを特徴とするプログラム。
  22. 映像要約装置としてコンピュータを機能させるためのプログラムであって、
    映像内に含まれるイベントの内容に関する第1の情報に基づいて、各イベントの重要度を算出する算出機能と、
    前記映像内に含まれるイベントの映像区間に関する第2の情報及び前記重要度に基づいて、前記映像のうちから、要約映像として用いるイベントの映像区間を選択する第1の選択機能と、
    前記重要度及び重要度の下限を示すしきい値に基づいて、前記映像内に含まれるイベントのうちから、説明文を作成する対象にするイベントを選択する第2の選択機能と、
    この第2の選択機能により選択されたイベントに係る前記第1の情報に基づいて、該イベントに関する説明文を生成する第1の生成機能と、
    前記第1の選択機能により選択された前記映像区間を連結した要約映像と、前記第1の生成機能により作成された前記説明文とを重畳してなる要約映像情報を生成する第2の生成機能とをコンピュータに実現させるためのものであるとともに、
    前記第1の選択機能は、前記重要度の高い順に、そのイベントに係る映像区間を選択するものであるとともに、選択したイベントの映像区間に係る時間の総和が、予め指定された制限時間の範囲内に収まるように、前記映像区間を選択するものであることを特徴とするプログラム。
JP2003336212A 2003-09-26 2003-09-26 映像要約装置、映像要約方法及びプログラム Expired - Fee Related JP3923932B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003336212A JP3923932B2 (ja) 2003-09-26 2003-09-26 映像要約装置、映像要約方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003336212A JP3923932B2 (ja) 2003-09-26 2003-09-26 映像要約装置、映像要約方法及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007011824A Division JP2007193820A (ja) 2007-01-22 2007-01-22 説明文生成装置、説明文生成方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2005109566A JP2005109566A (ja) 2005-04-21
JP3923932B2 true JP3923932B2 (ja) 2007-06-06

Family

ID=34532419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003336212A Expired - Fee Related JP3923932B2 (ja) 2003-09-26 2003-09-26 映像要約装置、映像要約方法及びプログラム

Country Status (1)

Country Link
JP (1) JP3923932B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007080148A (ja) * 2005-09-16 2007-03-29 Sony Corp 表示制御装置および方法、並びにプログラム
JP4439462B2 (ja) * 2005-11-29 2010-03-24 株式会社東芝 情報提示方法、情報提示装置及び情報提示プログラム
WO2007077713A1 (ja) 2006-01-05 2007-07-12 Nec Corporation 映像生成装置、映像生成方法および映像生成プログラム
JP4346613B2 (ja) * 2006-01-11 2009-10-21 株式会社東芝 映像要約装置及び映像要約方法
JP2007208651A (ja) * 2006-02-01 2007-08-16 Sharp Corp コンテンツ視聴装置
JP5010292B2 (ja) 2007-01-18 2012-08-29 株式会社東芝 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法
JP5515890B2 (ja) * 2010-03-15 2014-06-11 オムロン株式会社 画像処理装置、画像処理方法、画像処理システム、制御プログラムおよび記録媒体
KR20160027419A (ko) * 2014-08-29 2016-03-10 삼성전자주식회사 정보에 기반하여 부가기능을 제공하는 방법
CN105493512B (zh) * 2014-12-14 2018-07-06 深圳市大疆创新科技有限公司 一种视频处理方法、视频处理装置及显示装置
EP3167604B1 (en) 2014-12-14 2021-06-30 SZ DJI Technology Co., Ltd. Methods and systems of video processing
JP2018196076A (ja) * 2017-05-22 2018-12-06 株式会社ラムダシステムズ テロップ表示システム、テロップ表示プログラム及びテロップ表示方法
JP6873878B2 (ja) * 2017-09-26 2021-05-19 株式会社日立国際電気 ビデオサーバシステム
JP6707621B1 (ja) 2018-12-28 2020-06-10 株式会社ラムダシステムズ 情報処理装置、情報処理方法および情報処理プログラム
JP6760667B2 (ja) * 2019-02-25 2020-09-23 株式会社ラムダシステムズ 情報処理装置、情報処理方法および情報処理プログラム
US20230353846A1 (en) * 2020-10-08 2023-11-02 Sony Group Corporation Information processing device, information processing method, and program

Also Published As

Publication number Publication date
JP2005109566A (ja) 2005-04-21

Similar Documents

Publication Publication Date Title
JP3923932B2 (ja) 映像要約装置、映像要約方法及びプログラム
US8121462B2 (en) Video edition device and method
JP5010292B2 (ja) 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法
US8006186B2 (en) System and method for media production
US20110161348A1 (en) System and Method for Automatically Creating a Media Compilation
US20070168864A1 (en) Video summarization apparatus and method
JP5488475B2 (ja) トピック遷移解析システム、トピック遷移解析方法およびプログラム
TWI474200B (zh) Scene clip playback system, method and recording medium thereof
Heyer Live from the Met: digital broadcast cinema, medium theory, and opera for the masses
JP2007511154A (ja) 番組推薦システム
JP5706718B2 (ja) 動画合成システム及び方法並びに動画合成プログラム及びその記憶媒体
JP2006287319A (ja) 番組ダイジェスト作成装置および番組ダイジェスト作成プログラム
JP2002335473A (ja) 動画コンテンツの検索情報抽出システム、検索情報抽出方法、検索情報保存システム、動画コンテンツのストリーミング配信方法
JP4925938B2 (ja) ダイジェスト映像情報作成方法、ダイジェスト映像情報作成プログラム、および、映像装置
JP2004126811A (ja) コンテンツ情報編集装置とその編集プログラム
US20060010366A1 (en) Multimedia content generator
JP2010268195A (ja) 動画コンテンツ編集プログラム、サーバ、装置及び方法
JP2008178090A (ja) 映像処理装置
US20050069282A1 (en) Information reproducing method, recording medium on which information reproducing program is computer-readably recorded, and information reproducing apparatus
JP2008059383A (ja) コンテンツ提示装置及びコンピュータプログラム
JP2007193820A (ja) 説明文生成装置、説明文生成方法及びプログラム
JP3926756B2 (ja) 映像要約装置、映像要約方法
WO2021240644A1 (ja) 情報出力プログラム、装置、及び方法
Sexton Excavating Authenticity: Surveying the Indie-Rock Doc
JP4137007B2 (ja) 映像内容説明文生成装置およびコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061121

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070222

LAPS Cancellation because of no payment of annual fees