JP3617757B2 - 動画像表示装置及び方法及び記録媒体 - Google Patents
動画像表示装置及び方法及び記録媒体 Download PDFInfo
- Publication number
- JP3617757B2 JP3617757B2 JP23796997A JP23796997A JP3617757B2 JP 3617757 B2 JP3617757 B2 JP 3617757B2 JP 23796997 A JP23796997 A JP 23796997A JP 23796997 A JP23796997 A JP 23796997A JP 3617757 B2 JP3617757 B2 JP 3617757B2
- Authority
- JP
- Japan
- Prior art keywords
- moving image
- sound
- scene
- representative frame
- image display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Receiver Circuits (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、映像視聴時に所望の場面からのランダムアクセスを行う動画像表示装置及び方法に関し、映像視聴時の臨場感を増大させる動画像表示装置及び方法及び記録媒体に関する。
【0002】
【従来の技術】
衛星放送、ケーブルテレビジョン放送の普及などにより、家庭においても視聴可能な映像チャンネル数は増加の一途をたどっている。また従来のビデオテープやレーザーディスクなどの映像記録媒体に加え、映像音声情報をディジタルデータとして記録再生できるDVDも1996年には製品化され、ごく普通のユーザが大量の映像にアクセスできる環境は充実しつつあるといってよい。
【0003】
その一方で、それら大量の映像の中から目的の映像に効率よくアクセスできる技術の提供は従前のままである。例えばテレビの視聴者は、新聞などに掲載される番組欄を参照してみたい映像(番組)を選択したり、ビデオソフトパッケージを購入しようとする消費者はパッケージに記載されているタイトルや出演者、あらすじなどを参照して希望のビデオを選択する。これらは文字による映像情報のテキスト記述であるが、映像のすべてに対して記述がなされているわけでもなく、そのようにすべてに対して記述をすることは大変な手間となるものであることはいうまでもない。
【0004】
また、映像中のどの部分をみたいか、という要求は当然ユーザ個々に異なるものであるはずで、すべてのユーザに対応可能なテキスト記述を作成することは付加情報量の増大を招き、おもに放送メディアなど供給できる情報量に限界があるソースにおいては実用が難しい。このためテレビ視聴者はニュース番組中の特定の話題だけをみたい場合にも、テレビをつけたままで目的の話題となるのを待たなくてはならなかったり、すでに別の番組で見たニュースを繰り返し見させられたりして、著しく時間の無駄となっている。
【0005】
このように貧弱な映像アクセス環境のままでは、近い将来、ユーザが大量の映像情報にアクセスできる状況が実現したとしても、その情報量をスムーズに享受できるとはいえず、かえって情報量の多さに混乱するユーザが増える懸念もある。
【0006】
また、室内の明るさに適応して画面の明るさをコントロールするテレビ受像器はすでに存在しており、テレビ画面の見易さを向上させるために効果をあげている。
【0007】
一方、映像視聴環境において室内の照明を変化させる装置も存在してはいるが、それらは主に展示会などのパビリオンなどに見られる特殊効果映像シアター向けのシステムであり、装置が大規模である上に、照明自体は映像とは無関係にあらかじめ時間系列でプログラムされたものを実行してコントロールしているに過ぎない。
【0008】
【発明が解決しようとする課題】
本発明は、動画像を場面ごとに分割する場面分割手段と、この場面分割手段によって分割された場面を代表するフレームを選択する代表フレーム選択手段と、前記場面分割手段によって分割された前記場面ごとの音響信号を解析して、音響の種類を判定する音響解析手段と、この音響解析手段によって解析された結果と前記代表フレームとを対応づけて、複数の代表フレームの縮小画面を同時に一覧表示する一覧画面作成手段とを有する動画像表示装置において、前記音響解析手段によって解析された音響の種類が少なくとも発話を含む場合には、一覧画面作成手段は、当該発話を含むことを示す情報を記号化して当該代表フレームと対応づけて表示すると共に、当該代表フレームの縮小画面と対応づけられた発話の冒頭部分のせりふをテキスト表示することを特徴とする。
【0009】
また本発明は、前記動画像表示装置において、前記音響解析手段によって解析された音響の種類が音楽、擬音または効果音を含む場合には、一覧画面作成手段は、当該音楽、擬音または効果音を含むことを示す情報を記号化して当該代表フレームと対応づけて表示することを特徴とする。
【0010】
また本発明の動画像表示方法は、動画像を場面ごとに分割し、分割された場面を代表するフレームを選択し、分割された前記場面ごとの音響信号を解析して音響の種類を判定し、判定された結果と前記代表フレームとを対応づけて、複数の代表フレームの縮小画面を同時に一覧表示する動画像表示方法において、前記解析された音響の種類が少なくとも発話を含む場合には、当該発話を含むことを示す情報を記号化して当該代表フレームと対応づけて表示すると共に、当該代表フレームの縮小画面と対応づけられた発話の冒頭部分のせりふをテキスト表示することを特徴とする。
【0011】
また本発明の動画像を表示するプログラムを記録したコンピュータ読み取り可能な記録媒体は、動画像を場面ごとに分割し、分割された場面を代表するフレームを選択し、分割された前記場面ごとの音響信号を解析して音響の種類を判定し、判定された結果と前記代表フレームとを対応づけて、複数の代表フレームの縮小画面を同時に一覧表示するプログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記解析された音響の種類が少なくとも発話を含む場合には、当該発話を含むことを示す情報を記号化して当該代表フレームと対応づけて表示すると共に、当該代表フレームの縮小画面と対応づけられた発話の冒頭部分のせりふをテキスト表示することを特徴とする。
【0012】
【課題を解決するための手段】
本発明の動画像表示装置は、映像の区切り(ショット)ごとの代表フレームの一覧表示を行う際に、ショット内の音響の挙動を代表フレームに対応づけて文字または記号で表示する。
【0013】
本発明の動画像表示装置は、映像内容を解析し、映像の背景部分の色調に合わせて室内光源を操作し、映像内の明るさまたは色調に室内光のそれが近くなるようにする。
【0014】
【発明の実施の形態】
(実施例1)
本発明の動画像表示装置は、DVDなどランダムアクセス可能な映像記録再生装置と協調動作して、付加的なユーザインタフェースを提供することを想定している。
【0015】
本発明の実施例を図面に基づいて説明する。
図1は本発明の動画像表示装置の表示例を示した概念図である。図1(a)は、動画像をショットごとに分割し、各ショットあたり1枚の代表フレーム(静止画)を並べることによって動画像内容を一覧するユーザインタフェースの表示例である。画面内に代表フレーム101が並んでいる。代表フレームは、カット検出によって場面の変わり目を検知し、カットごとに区切られた区間をショットとして、ショットごとに(たとえばショットの先頭フレームなど)1 枚ずつの静止画像を代表フレームとするのが従来一般的な方法であるが、本発明ではショット分割の手法および代表フレーム選択は限定しない。最も単純な方法として、映像を10秒ごとに機械的に分割し、分割された各ショット内の5秒経過時点の映像を代表フレームとする、などとしてもよい。代表フレームを羅列した場合、数10枚〜数100枚のフレームを持つショットの映像を、たった一枚の静止画で表現しているため、ショット内でどのような動作があったかを知るためには情報が不足している。そこで、ショット内の音響を解析し、記号化して代表フレーム上にスーパーインポーズ(重ね書き)する。
【0016】
図1(b)は、音響解析の結果、バックミュージックが検出された際の表示例である。代表フレーム上には音楽の演奏を示す記号103が表示されている。
図1(c)は擬音または効果音が検出された際の表示例である。図の例では、このショットではコップ106が床に落下し、割れる音が擬音記号104として表示されている。
【0017】
図1(d)は発話が検出された際の表示例である。このショット中での登場人物102のセリフの冒頭部分が吹き出し記号105として表示されている。
以下では、本発明の動画像表示装置が以上の表示を行うための処理手順について、図に基づいて説明する。図2は本発明の動画像表示装置の処理手順を示すフローチャートである。動画像はまず場面分割(S201)によって処理単位であるショットに分けられる。ショット生成については、上述のように必ずしも映像中の場面に即したものでなくてもよく、5秒、10秒といった機械的なものでも構わない。以下の処理はショット単位に行われるものである。ショット内の音響は、音響辞書と比較され(S202)、音楽(S203)、擬音または効果音(S205)、発話(S208)が含まれていたかどうかが解析され、音楽を含む場合には、それを示すアイコンを表示する(S204)。
【0018】
こうした音楽検出方法としては、たとえば南ら「音情報を用いたビデオブラウザ」(電子情報通信学会総合大会A−291、1995年)などに示されている。擬音または効果音が含まれていた場合には、擬音・効果音の種類を辞書と比較することによって判定し、擬音・効果音の種類に応じたアイコンを代表フレーム上に表示する(S207)。ここでいう「種類に応じたアイコン」とは、例えば図1(c)で示したように、コップが割れる音ならば「ガチャン」という文字とともに周囲がギザギザの吹き出しを描く(104)ようなものである。この実現の方法としては、たとえばコップが割れた時の音響スペクトルの変化辞書を作成しておき、入力音響とのマッチングをとることで、着目部分にコップの割れる音が含まれているかどうかを検査するような方法が考えられる。辞書には他の効果音に対する項目も用意しておき、それらすべてと比較を行えば、登録済みの効果音に関しては有無を検出することが可能である(図3)。
【0019】
音声解析の結果、発話が検出された場合には、発話内容を言語理解によってテキスト化し、その冒頭部分を吹き出しとして表示する(S210)。言語理解の方法としては、たとえば本件出願人によって出願済みの特開平5−197389などがある。表示するセリフは、画面の許す限りセリフ全体を表示してもよいし、あらかじめ利用者が設定しておいたキーワードを含む部分の近傍に限定して表示してもよい。また、以上の処理手順においては、音楽、擬音・効果音、発話、という順で処理を行ったが、この順序は任意に変えても処理に影響を与えないことは明らかである。
【0020】
なお、映像中のカメラワーク(ズーム、パンなど)を代表フレーム上の線として視覚化する手法が浜野ら「構造化映像自動要約手法の検討」(電子情報通信学会技術報告IE96−38 )に示されているが、本発明の動画像表示装置では音響を利用し、その種類や内容を表示する点でこれとは明らかに異なる。
【0021】
以上のようにして、カット検出により作成された代表フレームの一覧画面において、ショットの音響内容を記号化して表示することができるので、利用者は、従来静止画に限定されていた代表フレーム映像から、より多くの情報を得ることができるようになる。
【0022】
(実施例2)
本発明の動画像表示装置は、テレビモニタなど従来の動画像表示装置の拡張部分として用いられることを想定している。
【0023】
本発明の実施例を図面に基づいて説明する。図4は本発明の動画像表示装置の構成を示したブロック図である。
以下では映像の原データの形式をMPEG圧縮されたディジタル映像と仮定して説明するが、映像形式はこれに限ったものではない。
【0024】
入力端子401から入力された映像は、通常の表示手順と同様に、MPEGデコーダ402によってモニタテレビなどに表示可能なアナログデータに復号される。復号されたアナログ映像データは映像表示部410によって利用者に表示される。この過程で、動画像は瞬間ごとの静止画像としてフレームバッファ403に蓄積される。フレームバッファ403では数枚の映像を静止画として格納しておくことができる。フレームバッファ403に格納された時間連続な静止画像を用いて、背景分離部404では映像の背景部分とそれ以外の、主に登場人物などが写っている部分に弁別される。
【0025】
この分離方法としては、例えば窪田ら「ハフ変換を用いたカメラパラメータの推定及び動画像からの移動物体の分離」(画像の認識・理解シンポジウムMIRU‘96、講演論文集II−121)などの方法がある。MPEG圧縮された映像データの場合、圧縮時に次のフレームへの画面各部の動きがベクトルとして符号化されているので、この動きベクトルの挙動をオプティカルフローとみなして背景を弁別することもできる。このような背景分離方法については本発明の出願人によってすでに特許出願済みである(特願平8−15643)。本発明では背景分離方法を限定しない。
【0026】
背景分離部404によって識別された背景部分は、領域情報として映像ヒストグラム作成部405に送られる。映像ヒストグラム作成部405では、現在表示中の映像で背景に相当する部分についてのみ、画面の色の特徴をヒストグラムとして計算する。
【0027】
ここで計算されるヒストグラムとは、例えば色相ヒストグラムのことをいう。以下では色相ヒストグラムを用いた場合について、計算方法を説明する。
MPEGの映像データは、人間の目が感度の高い輝度の情報(Y)と、それを補って実際のカラー映像を構成するための色相情報(Cb,Cr)とが別々に記録されている。2つの色相情報は、それぞれ青色成分と赤色成分とを示しており、Cbが大きな正数である画素は青が強く、Crが大きな正数である画素は赤が強い。逆にCbが絶対値の大きな負数である画素は黄が強く、Crが絶対値の大きな負数である場合には緑が強い。CbもCrもゼロである画素は、黒から白へのグレイ階調の色を持つ。このCb,Crを極座標表示に変換すると、(Cb,Cr)=(ρcosθ,ρsinθ)のように、(θ,ρ)の組み合わせで画素値が表現される。動画像中のある瞬間の画像全体について、θの値ごとの画素数を計算すると色相ヒストグラムになる。色相ヒストグラムの計算方法については、例えば青木ら「映像ブラウジングのための類似ショット統合」(情報処理学会研究報告96−HI−67)などにも触れられている。
【0028】
同様にして、室内の色相ヒストグラムも室内光ヒストグラム作成部407によって計算される。室内光ヒストグラム作成部407では、室内光センサ408によって検出された室内画像から、上記の映像ヒストグラム作成部405と同様の手法によって色相ヒストグラムを計算する。これら映像ヒストグラム作成部405によって計算された映像のヒストグラムと室内光ヒストグラム作成部407によって計算された室内光のヒストグラムは比較器407に送られ、両者の差が計算される。
【0029】
図5には、映像のヒストグラムと室内光のヒストグラムの例を示した。図では、映像の色相ヒストグラム502は緑にピークをもち、緑がかった映像が現在表示されていることを示している。それに対して、室内光の色相ヒストグラム501は赤にピークをもち、室内は赤みがかっている。本発明の動画像表示装置が例えば赤、青、緑、黄の4色の光源を装備している場合、映像、室内光のヒストグラム中の緑色成分は映像の方が大きい。したがって、比較器406は、光源409に対して緑色光源の出力を強める指示を送る。
【0030】
同様に、赤色成分は室内光の方が大きいので、光源409に対して赤色光源の出力を弱める指示を送る。このようなフィードバック処理は、2つのヒストグラムの各色成分がもっとも近くなるまで継続するため、映像の色調と室内光の色調が一致するまで、光源はコントロールされる。
【0031】
本実施例では、映像と室内光の比較に色相ヒストグラムを用いたが、以上説明した色相ヒストグラムは輝度情報(Y)を室内光コントロールの根拠に用いていない。したがって、画面全体が真っ白である場合には、各色成分もゼロになるため、光源は出力ゼロ、つまり室内光源は真っ暗な状態になる。このような照明形態を好まない利用者に対しては、ヒストグラムの作成方法をCbとCrによる計算ではなく、画像中および室内光中のR(赤)、G(緑)、B(青)それぞれの成分に対してヒストグラムを作成し、上記同様に、赤、青、緑光源に対してフィードバック・コントロールを行ってもよい。また、色相情報をまったく用いず、明るさだけをコントロールしてもよい。
【0032】
さらに上記の説明では、一度映像の背景を分離してから、背景部分に関してのみ特徴量計算を行ったが、背景部分だけを選択せずに画像全体の特徴量に合致するように室内光をコントロールしてもよい。この場合には図1中の背景分離部404は不要である。
【0033】
このように本発明の動画像表示装置では、画面に映し出されている映像に合致するように室内光をコントロールするので、画面の中だけにとどまっていた映像空間が擬似的に部屋全体に拡張され、利用者はより強い臨場感を得ることが期待できる。
【0034】
なお、本発明はコンピュータに実行させることのできるプログラムとしてフロッピーディスク,ハードディスク、CD−ROM,半導体メモリなどの記録媒体に格納して配布することもできる。
【0035】
例えば、図6のように、ハードディスク装置1006、フロッピーディスク装置1007及び光ディスク装置1008のいずれかの記録媒体に上述した動画像表示方法のプログラムが格納される。そして、このプログラムに従って、入力部1002から入力された動画像に対して、CPU1001で、図2のフローチャートに示した処理が実行され、その処理結果が出力部1003から出力される。
このようにすることにより、通常のパーソナルコンピュータを用いて本発明を実施することができる。
【0036】
【発明の効果】
以上説明したように、本発明の動画像表示装置によれば、利用者は映像全体の構造を把握しながら、所望の映像だけを選択的に見ることが可能になる。
また、本発明の動画像表示装置によれば、従来音声に限られていた臨場感効果を、比較的平易な装置によって、映像を反映した部屋全体の照明として実現することができる。
【図面の簡単な説明】
【図1】本発明の動画像表示装置の表示例を説明する概念図である。
【図2】本発明の動画像表示装置の処理手順を説明するフローチャートの図である。
【図3】本発明の動画像表示装置の処理を説明する概念図である。
【図4】本発明の動画像表示装置に係るブロック図である。
【図5】本発明の動画像表示装置の処理方法を説明する概念図である。
【図6】本発明のプログラムを実行するコンピュータシステムの構成例を示した図である。
【符号の説明】
103…音楽の演奏を示す記号
104…擬音の存在を示す記号
105…発話の存在を示す記号
501…映像背景部分の色相ヒストグラム
502…室内光の色相ヒストグラム
【発明の属する技術分野】
本発明は、映像視聴時に所望の場面からのランダムアクセスを行う動画像表示装置及び方法に関し、映像視聴時の臨場感を増大させる動画像表示装置及び方法及び記録媒体に関する。
【0002】
【従来の技術】
衛星放送、ケーブルテレビジョン放送の普及などにより、家庭においても視聴可能な映像チャンネル数は増加の一途をたどっている。また従来のビデオテープやレーザーディスクなどの映像記録媒体に加え、映像音声情報をディジタルデータとして記録再生できるDVDも1996年には製品化され、ごく普通のユーザが大量の映像にアクセスできる環境は充実しつつあるといってよい。
【0003】
その一方で、それら大量の映像の中から目的の映像に効率よくアクセスできる技術の提供は従前のままである。例えばテレビの視聴者は、新聞などに掲載される番組欄を参照してみたい映像(番組)を選択したり、ビデオソフトパッケージを購入しようとする消費者はパッケージに記載されているタイトルや出演者、あらすじなどを参照して希望のビデオを選択する。これらは文字による映像情報のテキスト記述であるが、映像のすべてに対して記述がなされているわけでもなく、そのようにすべてに対して記述をすることは大変な手間となるものであることはいうまでもない。
【0004】
また、映像中のどの部分をみたいか、という要求は当然ユーザ個々に異なるものであるはずで、すべてのユーザに対応可能なテキスト記述を作成することは付加情報量の増大を招き、おもに放送メディアなど供給できる情報量に限界があるソースにおいては実用が難しい。このためテレビ視聴者はニュース番組中の特定の話題だけをみたい場合にも、テレビをつけたままで目的の話題となるのを待たなくてはならなかったり、すでに別の番組で見たニュースを繰り返し見させられたりして、著しく時間の無駄となっている。
【0005】
このように貧弱な映像アクセス環境のままでは、近い将来、ユーザが大量の映像情報にアクセスできる状況が実現したとしても、その情報量をスムーズに享受できるとはいえず、かえって情報量の多さに混乱するユーザが増える懸念もある。
【0006】
また、室内の明るさに適応して画面の明るさをコントロールするテレビ受像器はすでに存在しており、テレビ画面の見易さを向上させるために効果をあげている。
【0007】
一方、映像視聴環境において室内の照明を変化させる装置も存在してはいるが、それらは主に展示会などのパビリオンなどに見られる特殊効果映像シアター向けのシステムであり、装置が大規模である上に、照明自体は映像とは無関係にあらかじめ時間系列でプログラムされたものを実行してコントロールしているに過ぎない。
【0008】
【発明が解決しようとする課題】
本発明は、動画像を場面ごとに分割する場面分割手段と、この場面分割手段によって分割された場面を代表するフレームを選択する代表フレーム選択手段と、前記場面分割手段によって分割された前記場面ごとの音響信号を解析して、音響の種類を判定する音響解析手段と、この音響解析手段によって解析された結果と前記代表フレームとを対応づけて、複数の代表フレームの縮小画面を同時に一覧表示する一覧画面作成手段とを有する動画像表示装置において、前記音響解析手段によって解析された音響の種類が少なくとも発話を含む場合には、一覧画面作成手段は、当該発話を含むことを示す情報を記号化して当該代表フレームと対応づけて表示すると共に、当該代表フレームの縮小画面と対応づけられた発話の冒頭部分のせりふをテキスト表示することを特徴とする。
【0009】
また本発明は、前記動画像表示装置において、前記音響解析手段によって解析された音響の種類が音楽、擬音または効果音を含む場合には、一覧画面作成手段は、当該音楽、擬音または効果音を含むことを示す情報を記号化して当該代表フレームと対応づけて表示することを特徴とする。
【0010】
また本発明の動画像表示方法は、動画像を場面ごとに分割し、分割された場面を代表するフレームを選択し、分割された前記場面ごとの音響信号を解析して音響の種類を判定し、判定された結果と前記代表フレームとを対応づけて、複数の代表フレームの縮小画面を同時に一覧表示する動画像表示方法において、前記解析された音響の種類が少なくとも発話を含む場合には、当該発話を含むことを示す情報を記号化して当該代表フレームと対応づけて表示すると共に、当該代表フレームの縮小画面と対応づけられた発話の冒頭部分のせりふをテキスト表示することを特徴とする。
【0011】
また本発明の動画像を表示するプログラムを記録したコンピュータ読み取り可能な記録媒体は、動画像を場面ごとに分割し、分割された場面を代表するフレームを選択し、分割された前記場面ごとの音響信号を解析して音響の種類を判定し、判定された結果と前記代表フレームとを対応づけて、複数の代表フレームの縮小画面を同時に一覧表示するプログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記解析された音響の種類が少なくとも発話を含む場合には、当該発話を含むことを示す情報を記号化して当該代表フレームと対応づけて表示すると共に、当該代表フレームの縮小画面と対応づけられた発話の冒頭部分のせりふをテキスト表示することを特徴とする。
【0012】
【課題を解決するための手段】
本発明の動画像表示装置は、映像の区切り(ショット)ごとの代表フレームの一覧表示を行う際に、ショット内の音響の挙動を代表フレームに対応づけて文字または記号で表示する。
【0013】
本発明の動画像表示装置は、映像内容を解析し、映像の背景部分の色調に合わせて室内光源を操作し、映像内の明るさまたは色調に室内光のそれが近くなるようにする。
【0014】
【発明の実施の形態】
(実施例1)
本発明の動画像表示装置は、DVDなどランダムアクセス可能な映像記録再生装置と協調動作して、付加的なユーザインタフェースを提供することを想定している。
【0015】
本発明の実施例を図面に基づいて説明する。
図1は本発明の動画像表示装置の表示例を示した概念図である。図1(a)は、動画像をショットごとに分割し、各ショットあたり1枚の代表フレーム(静止画)を並べることによって動画像内容を一覧するユーザインタフェースの表示例である。画面内に代表フレーム101が並んでいる。代表フレームは、カット検出によって場面の変わり目を検知し、カットごとに区切られた区間をショットとして、ショットごとに(たとえばショットの先頭フレームなど)1 枚ずつの静止画像を代表フレームとするのが従来一般的な方法であるが、本発明ではショット分割の手法および代表フレーム選択は限定しない。最も単純な方法として、映像を10秒ごとに機械的に分割し、分割された各ショット内の5秒経過時点の映像を代表フレームとする、などとしてもよい。代表フレームを羅列した場合、数10枚〜数100枚のフレームを持つショットの映像を、たった一枚の静止画で表現しているため、ショット内でどのような動作があったかを知るためには情報が不足している。そこで、ショット内の音響を解析し、記号化して代表フレーム上にスーパーインポーズ(重ね書き)する。
【0016】
図1(b)は、音響解析の結果、バックミュージックが検出された際の表示例である。代表フレーム上には音楽の演奏を示す記号103が表示されている。
図1(c)は擬音または効果音が検出された際の表示例である。図の例では、このショットではコップ106が床に落下し、割れる音が擬音記号104として表示されている。
【0017】
図1(d)は発話が検出された際の表示例である。このショット中での登場人物102のセリフの冒頭部分が吹き出し記号105として表示されている。
以下では、本発明の動画像表示装置が以上の表示を行うための処理手順について、図に基づいて説明する。図2は本発明の動画像表示装置の処理手順を示すフローチャートである。動画像はまず場面分割(S201)によって処理単位であるショットに分けられる。ショット生成については、上述のように必ずしも映像中の場面に即したものでなくてもよく、5秒、10秒といった機械的なものでも構わない。以下の処理はショット単位に行われるものである。ショット内の音響は、音響辞書と比較され(S202)、音楽(S203)、擬音または効果音(S205)、発話(S208)が含まれていたかどうかが解析され、音楽を含む場合には、それを示すアイコンを表示する(S204)。
【0018】
こうした音楽検出方法としては、たとえば南ら「音情報を用いたビデオブラウザ」(電子情報通信学会総合大会A−291、1995年)などに示されている。擬音または効果音が含まれていた場合には、擬音・効果音の種類を辞書と比較することによって判定し、擬音・効果音の種類に応じたアイコンを代表フレーム上に表示する(S207)。ここでいう「種類に応じたアイコン」とは、例えば図1(c)で示したように、コップが割れる音ならば「ガチャン」という文字とともに周囲がギザギザの吹き出しを描く(104)ようなものである。この実現の方法としては、たとえばコップが割れた時の音響スペクトルの変化辞書を作成しておき、入力音響とのマッチングをとることで、着目部分にコップの割れる音が含まれているかどうかを検査するような方法が考えられる。辞書には他の効果音に対する項目も用意しておき、それらすべてと比較を行えば、登録済みの効果音に関しては有無を検出することが可能である(図3)。
【0019】
音声解析の結果、発話が検出された場合には、発話内容を言語理解によってテキスト化し、その冒頭部分を吹き出しとして表示する(S210)。言語理解の方法としては、たとえば本件出願人によって出願済みの特開平5−197389などがある。表示するセリフは、画面の許す限りセリフ全体を表示してもよいし、あらかじめ利用者が設定しておいたキーワードを含む部分の近傍に限定して表示してもよい。また、以上の処理手順においては、音楽、擬音・効果音、発話、という順で処理を行ったが、この順序は任意に変えても処理に影響を与えないことは明らかである。
【0020】
なお、映像中のカメラワーク(ズーム、パンなど)を代表フレーム上の線として視覚化する手法が浜野ら「構造化映像自動要約手法の検討」(電子情報通信学会技術報告IE96−38 )に示されているが、本発明の動画像表示装置では音響を利用し、その種類や内容を表示する点でこれとは明らかに異なる。
【0021】
以上のようにして、カット検出により作成された代表フレームの一覧画面において、ショットの音響内容を記号化して表示することができるので、利用者は、従来静止画に限定されていた代表フレーム映像から、より多くの情報を得ることができるようになる。
【0022】
(実施例2)
本発明の動画像表示装置は、テレビモニタなど従来の動画像表示装置の拡張部分として用いられることを想定している。
【0023】
本発明の実施例を図面に基づいて説明する。図4は本発明の動画像表示装置の構成を示したブロック図である。
以下では映像の原データの形式をMPEG圧縮されたディジタル映像と仮定して説明するが、映像形式はこれに限ったものではない。
【0024】
入力端子401から入力された映像は、通常の表示手順と同様に、MPEGデコーダ402によってモニタテレビなどに表示可能なアナログデータに復号される。復号されたアナログ映像データは映像表示部410によって利用者に表示される。この過程で、動画像は瞬間ごとの静止画像としてフレームバッファ403に蓄積される。フレームバッファ403では数枚の映像を静止画として格納しておくことができる。フレームバッファ403に格納された時間連続な静止画像を用いて、背景分離部404では映像の背景部分とそれ以外の、主に登場人物などが写っている部分に弁別される。
【0025】
この分離方法としては、例えば窪田ら「ハフ変換を用いたカメラパラメータの推定及び動画像からの移動物体の分離」(画像の認識・理解シンポジウムMIRU‘96、講演論文集II−121)などの方法がある。MPEG圧縮された映像データの場合、圧縮時に次のフレームへの画面各部の動きがベクトルとして符号化されているので、この動きベクトルの挙動をオプティカルフローとみなして背景を弁別することもできる。このような背景分離方法については本発明の出願人によってすでに特許出願済みである(特願平8−15643)。本発明では背景分離方法を限定しない。
【0026】
背景分離部404によって識別された背景部分は、領域情報として映像ヒストグラム作成部405に送られる。映像ヒストグラム作成部405では、現在表示中の映像で背景に相当する部分についてのみ、画面の色の特徴をヒストグラムとして計算する。
【0027】
ここで計算されるヒストグラムとは、例えば色相ヒストグラムのことをいう。以下では色相ヒストグラムを用いた場合について、計算方法を説明する。
MPEGの映像データは、人間の目が感度の高い輝度の情報(Y)と、それを補って実際のカラー映像を構成するための色相情報(Cb,Cr)とが別々に記録されている。2つの色相情報は、それぞれ青色成分と赤色成分とを示しており、Cbが大きな正数である画素は青が強く、Crが大きな正数である画素は赤が強い。逆にCbが絶対値の大きな負数である画素は黄が強く、Crが絶対値の大きな負数である場合には緑が強い。CbもCrもゼロである画素は、黒から白へのグレイ階調の色を持つ。このCb,Crを極座標表示に変換すると、(Cb,Cr)=(ρcosθ,ρsinθ)のように、(θ,ρ)の組み合わせで画素値が表現される。動画像中のある瞬間の画像全体について、θの値ごとの画素数を計算すると色相ヒストグラムになる。色相ヒストグラムの計算方法については、例えば青木ら「映像ブラウジングのための類似ショット統合」(情報処理学会研究報告96−HI−67)などにも触れられている。
【0028】
同様にして、室内の色相ヒストグラムも室内光ヒストグラム作成部407によって計算される。室内光ヒストグラム作成部407では、室内光センサ408によって検出された室内画像から、上記の映像ヒストグラム作成部405と同様の手法によって色相ヒストグラムを計算する。これら映像ヒストグラム作成部405によって計算された映像のヒストグラムと室内光ヒストグラム作成部407によって計算された室内光のヒストグラムは比較器407に送られ、両者の差が計算される。
【0029】
図5には、映像のヒストグラムと室内光のヒストグラムの例を示した。図では、映像の色相ヒストグラム502は緑にピークをもち、緑がかった映像が現在表示されていることを示している。それに対して、室内光の色相ヒストグラム501は赤にピークをもち、室内は赤みがかっている。本発明の動画像表示装置が例えば赤、青、緑、黄の4色の光源を装備している場合、映像、室内光のヒストグラム中の緑色成分は映像の方が大きい。したがって、比較器406は、光源409に対して緑色光源の出力を強める指示を送る。
【0030】
同様に、赤色成分は室内光の方が大きいので、光源409に対して赤色光源の出力を弱める指示を送る。このようなフィードバック処理は、2つのヒストグラムの各色成分がもっとも近くなるまで継続するため、映像の色調と室内光の色調が一致するまで、光源はコントロールされる。
【0031】
本実施例では、映像と室内光の比較に色相ヒストグラムを用いたが、以上説明した色相ヒストグラムは輝度情報(Y)を室内光コントロールの根拠に用いていない。したがって、画面全体が真っ白である場合には、各色成分もゼロになるため、光源は出力ゼロ、つまり室内光源は真っ暗な状態になる。このような照明形態を好まない利用者に対しては、ヒストグラムの作成方法をCbとCrによる計算ではなく、画像中および室内光中のR(赤)、G(緑)、B(青)それぞれの成分に対してヒストグラムを作成し、上記同様に、赤、青、緑光源に対してフィードバック・コントロールを行ってもよい。また、色相情報をまったく用いず、明るさだけをコントロールしてもよい。
【0032】
さらに上記の説明では、一度映像の背景を分離してから、背景部分に関してのみ特徴量計算を行ったが、背景部分だけを選択せずに画像全体の特徴量に合致するように室内光をコントロールしてもよい。この場合には図1中の背景分離部404は不要である。
【0033】
このように本発明の動画像表示装置では、画面に映し出されている映像に合致するように室内光をコントロールするので、画面の中だけにとどまっていた映像空間が擬似的に部屋全体に拡張され、利用者はより強い臨場感を得ることが期待できる。
【0034】
なお、本発明はコンピュータに実行させることのできるプログラムとしてフロッピーディスク,ハードディスク、CD−ROM,半導体メモリなどの記録媒体に格納して配布することもできる。
【0035】
例えば、図6のように、ハードディスク装置1006、フロッピーディスク装置1007及び光ディスク装置1008のいずれかの記録媒体に上述した動画像表示方法のプログラムが格納される。そして、このプログラムに従って、入力部1002から入力された動画像に対して、CPU1001で、図2のフローチャートに示した処理が実行され、その処理結果が出力部1003から出力される。
このようにすることにより、通常のパーソナルコンピュータを用いて本発明を実施することができる。
【0036】
【発明の効果】
以上説明したように、本発明の動画像表示装置によれば、利用者は映像全体の構造を把握しながら、所望の映像だけを選択的に見ることが可能になる。
また、本発明の動画像表示装置によれば、従来音声に限られていた臨場感効果を、比較的平易な装置によって、映像を反映した部屋全体の照明として実現することができる。
【図面の簡単な説明】
【図1】本発明の動画像表示装置の表示例を説明する概念図である。
【図2】本発明の動画像表示装置の処理手順を説明するフローチャートの図である。
【図3】本発明の動画像表示装置の処理を説明する概念図である。
【図4】本発明の動画像表示装置に係るブロック図である。
【図5】本発明の動画像表示装置の処理方法を説明する概念図である。
【図6】本発明のプログラムを実行するコンピュータシステムの構成例を示した図である。
【符号の説明】
103…音楽の演奏を示す記号
104…擬音の存在を示す記号
105…発話の存在を示す記号
501…映像背景部分の色相ヒストグラム
502…室内光の色相ヒストグラム
Claims (5)
- 動画像を場面ごとに分割する場面分割手段と、この場面分割手段によって分割された場面を代表するフレームを選択する代表フレーム選択手段と、前記場面分割手段によって分割された前記場面ごとの音響信号を解析して、音響の種類を判定する音響解析手段と、この音響解析手段によって解析された結果と前記代表フレームとを対応づけて、複数の代表フレームの縮小画面を同時に一覧表示する一覧画面作成手段とを有する動画像表示装置において、前記音響解析手段によって解析された音響の種類が少なくとも発話を含む場合には、一覧画面作成手段は、発話を含むことを示す情報を記号化して当該代表フレームの縮小画面と対応づけて表示すると共に、当該代表フレームの縮小画面と対応づけられた発話の冒頭部分のせりふをテキスト表示することを特徴とする動画像表示装置。
- 前記音響解析手段によって解析された音響の種類が音楽、擬音または効果音を含む場合には、一覧画面作成手段は、当該音楽、擬音または効果音を含むことを示す情報を記号化して当該代表フレームと対応づけて表示することを特徴とする請求項1記載の動画像表示装置。
- 前記一覧画面作成手段によって一覧表示された代表フレームが指示されることによって、前記代表フレームが代表する場面から動画像再生を行うことを特徴とする請求項1又は2記載の動画像表示装置。
- 動画像を場面ごとに分割し、分割された場面を代表するフレームを選択し、分割された前記場面ごとの音響信号を解析して音響の種類を判定し、判定された結果と前記代表フレームとを対応づけて、複数の代表フレームの縮小画面を同時に一覧表示する動画像表示方法において、前記解析された音響の種類が少なくとも発話を含む場合には、当該発話を含むことを示す情報を記号化して当該代表フレームと対応づけて表示すると共に、当該代表フレームの縮小画面と対応づけられた発話の冒頭部分のせりふをテキスト表示することを特徴とする動画像表示方法。
- 動画像を場面ごとに分割し、分割された場面を代表するフレームを選択し、分割された前記場面ごとの音響信号を解析して音響の種類を判定し、判定された結果と前記代表フレームとを対応づけて、複数の代表フレームの縮小画面を同時に一覧表示するプログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記解析された音響の種類が少なくとも発話を含む場合には、当該発話を含むことを示す情報を記号化して当該代表フレームと対応づけて表示すると共に、当該代表フレームの縮小画面と対応づけられた発話の冒頭部分のせりふをテキスト表示することを特徴とするプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23796997A JP3617757B2 (ja) | 1997-09-03 | 1997-09-03 | 動画像表示装置及び方法及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23796997A JP3617757B2 (ja) | 1997-09-03 | 1997-09-03 | 動画像表示装置及び方法及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1188798A JPH1188798A (ja) | 1999-03-30 |
JP3617757B2 true JP3617757B2 (ja) | 2005-02-09 |
Family
ID=17023159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23796997A Expired - Fee Related JP3617757B2 (ja) | 1997-09-03 | 1997-09-03 | 動画像表示装置及び方法及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3617757B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100469979C (zh) | 1999-03-30 | 2009-03-18 | 日立建机株式会社 | 建筑机械的操作装置 |
KR20000024126A (ko) * | 2000-01-24 | 2000-05-06 | 이재섭 | 네트워크를 통한 영상제공방법 및 영상제공시스템 |
JP4431923B2 (ja) | 2000-07-13 | 2010-03-17 | ソニー株式会社 | 映像信号記録再生装置および方法、並びに記録媒体 |
KR20010113584A (ko) * | 2001-11-08 | 2001-12-28 | (주)시스튜디오 | 컴퓨터에 의한 만화 애니메이션 구현방법 및 만화애니메이션 실행데이터를 기록한 컴퓨터로 읽을 수 있는기록매체 |
CN108896279B (zh) * | 2018-06-07 | 2019-08-09 | 北京空间机电研究所 | 一种超敏捷动中成像空间相机积分时间自主匹配测试系统 |
-
1997
- 1997-09-03 JP JP23796997A patent/JP3617757B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1188798A (ja) | 1999-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5539313B2 (ja) | テレビジョン受像機および方法 | |
US8935169B2 (en) | Electronic apparatus and display process | |
JP3823333B2 (ja) | 動画像の変化点検出方法、動画像の変化点検出装置、動画像の変化点検出システム | |
US6246402B1 (en) | Reproduction control data generating apparatus and method of same | |
KR101114102B1 (ko) | 영상 재생 장치, 영상 재생 방법 및 그 방법을 컴퓨터에 실행시키기 위한 프로그램 | |
US20070003221A1 (en) | Reproducing device, reproducing method, reproducing program and recording medium | |
US20090091586A1 (en) | Image display method, image display program, and image display apparatus | |
US20030099464A1 (en) | Optical recording medium and apparatus and method to play the optical recording medium | |
US8009232B2 (en) | Display control device, and associated method of identifying content | |
KR20150127070A (ko) | 비디오를 위한 픽토리얼 요약 | |
JP2000350156A (ja) | 動画像情報の記憶方法及びこれを記録した記録媒体 | |
KR20090089878A (ko) | 개요 및 리포트를 이미 포함하는 시청각 도큐먼트의 새로운 개요를 생성하기 위한 방법 및 상기 방법을 구현할 수 있는 수신기 | |
JP2000350165A (ja) | 動画像記録再生装置 | |
JP2014209707A (ja) | 映像再生装置および映像再生方法 | |
JP3617757B2 (ja) | 動画像表示装置及び方法及び記録媒体 | |
JP2006033841A (ja) | デジタル再生のための画面探索方法及び画面探索装置 | |
JP2007149095A (ja) | 動画像の変化点検出方法及び装置 | |
US8627400B2 (en) | Moving image reproducing apparatus and control method of moving image reproducing apparatus | |
US20180139493A1 (en) | Method for setting the level of definition of the images of a multimedia programme | |
JP3838775B2 (ja) | マルチメディア処理装置、記録媒体 | |
KR20050078894A (ko) | 캡션 표시 방법 및 장치 | |
JP2005167456A (ja) | Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置 | |
JP4631826B2 (ja) | ハイライト抽出装置 | |
US11908340B2 (en) | Magnification enhancement of video for visually impaired viewers | |
US20230300421A1 (en) | User interface responsive to background video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041104 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071119 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081119 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091119 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101119 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |