JP3670581B2

JP3670581B2 - 映像音声配信装置及び映像音声ファイル解析方法

Info

Publication number: JP3670581B2
Application number: JP2000395724A
Authority: JP
Inventors: 達也是津; 剛永井; 徹今井
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2000-12-26
Filing date: 2000-12-26
Publication date: 2005-07-13
Anticipated expiration: 2020-12-26
Also published as: JP2002199370A

Description

【０００１】
【発明の属する技術分野】
本発明は、記録した映像音声の配信を行う映像音声配信装置及び映像音声ファイル解析方法に関する。
【０００２】
【従来の技術】
近年、ユーザの要求に応じて映像音声をディジタル信号として配信する装置が開発されている。例えば、インターネットに接続して映像音声を受信し再生を行うことができる映像音声受信装置（あるいは計算機を映像音声受信装置として機能させるためのソフトウェア）が開発され、受信装置から送信される要求に基づいて映像音声ストリームを配信する装置が開発されている。
【０００３】
また、ＭＰＥＧ−４など低ビットレートの映像音声符号化技術の開発に伴い、映像音声配信装置には、多数の受信装置からそれぞれ独立に要求される映像音声の配信を処理する能力が必要とされている。
【０００４】
映像音声配信装置においては、配信する映像音声ストリームを、ＭＰＥＧ形式などのディジタル信号として符号化し、あらかじめハードディスク等の記録媒体に保存しておく。受信装置が映像音声の送信を要求すると、映像音声の先頭もしくは受信装置が指定した時刻から映像音声ストリームを送信する。
【０００５】
映像音声データの送信方式として、映像音声をパケット化して順番に送出する方式が存在する。例えば、ＲＴＰなどの通信プロトコルを用いて、映像音声ストリームを一定時間ごとの映像音声を収めたパケットに区切り、再生時刻等の情報を付加して送信する。送信においてパケットの欠落やデータの誤りが起こっても再送を行わないことにより、再生処理を対話的かつ実時間に行うことを重視することができる。
【０００６】
この方式は特に記録媒体に保存されていない生中継等の映像音声の配信に用いられてきたが、記録媒体にあらかじめ保存された映像音声ストリームの配信に適用することも可能である。
【０００７】
【発明が解決しようとする課題】
従来の技術においては、映像音声配信装置が映像音声の送信要求を受けると、まず映像音声ファイルの解析を行ってから映像音声ストリームの送出を行う。この結果、解析処理を行う時間が映像音声の送信要求からパケットの送出までにかかる時間に加わり、受信装置への応答時間が延びるという問題があった。
【０００８】
複数の受信装置からそれぞれ独立の映像音声の送信要求を受け付ける映像音声配信装置においては、同一の映像音声ファイルに対し異なる送信要求がくることが一般的である。そのため、送信要求に対して個別に対処する必要がある。このような状況において、前述のように映像音声ファイルの解析処理を送信要求ごとに行うと配信装置の処理能力に負担がかかる。
【０００９】
映像音声データをパケット化するためには、映像音声ファイルのどの部分が映像音声の送信すべき時刻に対応するかを知る必要がある。これらの情報は、半導体メモリなど高速にアクセスできる主記憶にあることが望ましい。しかし、従来の方式は、容量の限られた主記憶においてこのような情報を有効に保存する方法を欠いていた。特に送信要求を処理する手段ごとにこれらの情報を持つと、同一のデータが装置の複数の主記憶領域に存在することになり、主記憶の使用効率が低下するという問題点があった。
【００１０】
本発明は、上記事情を考慮してなされたもので、映像音声に対する送信要求から応答までの時間を短縮し、かつ、映像音声配信装置の主記憶の使用量を抑えることのできる映像音声配信装置及び映像音声ファイル解析方法を提供することを目的とする。
【００１１】
【課題を解決するための手段】
本発明は、外部の要求元から受信した映像音声ファイルの送信要求に応じて、該当する映像音声フレームを含むパケットを生成して該要求元に送信する映像音声配信装置であって、フレームごとに分割された映像及び音声からなるストリーム並びにストリームの各フレーム及び当該ファイル全体に関するメタ情報を含む映像音声ファイルを保存するための第１の保存手段と、前記パケットを生成する際に、前記送信要求に該当する映像音声フレームを前記第１の保存手段から取得する取得手段と、前記第１の保存手段に保存された前記映像音声ファイルのフレームに関する解析情報及び前記映像音声ファイル全体に関する解析情報を前記取得手段に応答するために、必要に応じて前記映像音声ファイルを解析するための解析手段と、前記解析手段により作成された前記解析情報の全部または一部を保存するための第２の保存手段とを備え、前記解析手段により作成された前記解析情報を前記第２の保存手段に保存する場合に、前記映像音声ファイル全体に関する解析情報はその内容をすべて保存しておくとともに、前記映像音声ファイルのフレームに関する解析情報は少なくとも所定の一部のフレームについて保存しておき、前記解析手段は、前記取得手段から前記解析情報を要求された場合に、該当する解析情報が前記第２の保存手段に保存されているならば、該保存されている情報を応答し、保存されていないならば、前記第１の保存手段に保存された前記映像音声ファイルを解析して作成した解析情報を応答することを特徴とする。
【００１２】
これによって、映像音声の送信要求を受けてから映像音声を送信するまでの応答時間を短縮することが可能である。また、映像音声ファイルの解析結果を複数の送信要求で共有することにより、映像音声配信装置の主記憶の使用量を抑えることが可能である。
【００１３】
好ましくは、前記解析手段は、前記映像音声ファイルのフレームに関する解析情報を保存する記録領域を前記第２の保存手段に確保できない場合は、削除対象とするフレームを選択して該フレームに関連する解析情報を前記第２の保存手段から削除するようにしてもよい。
【００１４】
このように、フレームに関する情報を保存する記録領域を確保できない場合は、フレームを選択して関連する情報を削除することにより、映像音声ファイルの解析結果を保存する映像音声配信装置の主記憶の使用量を抑え効率的に使用することが可能である。
【００１５】
好ましくは、前記解析手段は、前記第１の保存手段に保存されている映像音声ファイルの内容に変更があった場合には、前記第２の保存手段に保存されている当該映像音声ファイルに関連する解析情報を削除し、直ちにまたは変更後にはじめて送信要求を受けたときに更新するようにしてもよい。
【００１６】
このように、前記解析手段は、映像音声ファイルに変更があった場合に、第２の保存手段に保存された当該映像音声ファイルに関する情報を更新するので、取得手段は取得する映像音声ストリームの内容に一貫性を保つことが可能である。
【００１７】
好ましくは、前記第２の保存手段に前記映像音声ファイルのフレームに関する解析情報を保存するにあたっては、該映像音声ファイルのフレームのうち、他のフレームを復号することなく再生可能なフレームについては該映像音声ファイルにおける該フレームの記録位置及び該フレームのビット数による長さを保存し、他のフレームの復号を必要とするフレームについては該映像音声ファイルにおける該フレームの記録位置は保存せず該フレームのビット数による長さを保存するようにしてもよい。
【００１８】
このように、解析手段は、映像音声ファイルに記録されているフレームに関する情報を、フレームの記録位置及びサイズからなる表現形式に変換し、映像音声ファイルにおける記録位置の保存を省略することにより、第２の保存手段の主記憶の使用量を抑えることが可能である。
【００１９】
また、本発明は、フレームごとに分割された映像及び音声からなるストリーム並びにストリームの各フレーム及び当該ファイル全体に関するメタ情報を含む映像音声ファイルを保存するための第１の保存手段と、外部の要求元から受信した映像音声ファイルの送信要求に応じて、該当する映像音声フレームを該第１の保存手段から取得し、該映像音声フレームを含むパケットを生成して該要求元に送信するための処理手段と、前記第１の保存手段に保存された前記映像音声ファイルのフレームに関する解析情報及び前記映像音声ファイル全体に関する解析情報を前記処理手段に応答するために、必要に応じて前記映像音声ファイルを解析するための解析手段と、前記解析手段により作成された前記解析情報の全部または一部を保存するための第２の保存手段とを備えた映像音声配信装置における映像音声ファイル解析方法であって、前記解析手段は、前記処理手段から前記解析情報を要求された場合に、該当する解析情報が前記第２の保存手段に保存されているならば、該保存されている情報を応答し、保存されていないならば、前記第１の保存手段に保存された前記映像音声ファイルを解析して作成した解析情報を応答し、該当する解析情報が前記第２の保存手段に保存されていないために前記解析情報を作成した場合には、作成した前記解析情報のうち、前記映像音声ファイル全体に関する解析情報はその内容をすべて保存しておくとともに、前記映像音声ファイルのフレームに関する解析情報は少なくとも所定の一部のフレームについて保存しておくことを特徴とする。
【００２０】
なお、装置に係る本発明は方法に係る発明としても成立し、方法に係る本発明は装置に係る発明としても成立する。
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手順を実行させるための（あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための）プログラムとしても成立し、該プログラムを記録したコンピュータ読取り可能な記録媒体としても成立する。
【００２１】
本発明によれば、映像音声に対する複数の独立な送信要求に対して、映像音声ファイルの解析を共通化して必要に応じて行い、解析結果を共有することによって、映像音声の送信要求からこれに対する応答までの時間を短縮し、映像音声配信装置の主記憶の使用量を抑えることが可能になる。
【００２２】
【発明の実施の形態】
以下、図面を参照しながら発明の実施の形態を説明する。
【００２３】
図１は、本発明の一実施形態に係る映像音声配信装置の構成例を示すブロック図である。図１に示されるように、この映像音声配信装置１０は、映像音声送信要求入力部１、一つまたは複数の映像音声パケット生成部２、映像音声パケット出力部３、映像音声ファイル保存部４、映像音声データ取得部５、映像音声ファイル解析部６、映像音声ファイル解析結果保存部７を有する。図１では、映像音声パケット生成部は、２ａ，２ｂの二つが存在する場合（あるいは二つが起動された場合）を例示している。
【００２４】
なお、図１において２０は映像音声受信装置である。また、図１において、映像音声配信装置と映像音声受信装置との間のネットワーク（例えば、インターネット、ＬＡＮ等）は記述を省略している。また、図１では、映像音声受信装置を１台のみ示しているが、映像音声受信装置が複数台存在してよい（それらが各々独立して要求を出して構わない）。
【００２５】
映像音声送信要求入力部１は、映像音声受信装置２０から映像音声ファイルの送信要求を受信する。映像音声送信要求入力部１は、イーサネットアダプタなどの通信用ハードウェアと、プロセッサとメモリ等の部品からなるハードウェア及びその上で実行されるソフトウェアによって構成される。このソフトウェアは、ＲＴＳＰ（ｒｅａｌｔｉｍｅｓｔｒｅａｍｉｎｇｐｒｏｔｏｃｏｌ）などの通信プロトコルに従った要求を処理して映像音声受信装置２０に応答し、映像音声パケット生成部２に対して映像音声の送信を指示する。
【００２６】
映像音声送信要求入力部１を構成するハードウェアのうち、プロセッサとメモリなどソフトウェアを実行するための装置は、映像音声配信装置の他の構成要素と共用することが可能である。
【００２７】
映像音声パケット生成部２は、映像音声送信要求入力部１が受信した要求に従い、ＭＰＥＧ−４形式等で符号化された映像音声を映像音声データ取得部５から順次取得して映像音声パケットを生成し、映像音声パケット出力部３に出力する。前述のように、映像音声配信装置は、複数の映像音声パケット生成部を備える（あるいは起動する）ことが可能である。映像音声データは、ＲＴＰ（ｔｈｅｒｅａｌ−ｔｉｍｅｔｒａｎｓｐｏｒｔｐｒｏｔｏｃｏｌ）などの通信プロトコルに従ってパケット化する。映像音声パケット生成部２は、ソフトウェアとして実現し、各送信要求をそれぞれ別のプロセスまたはスレッドにおいて処理することが可能である。
【００２８】
映像音声パケット出力部３は、映像音声パケット生成部２が生成した映像音声パケットを、ＲＴＰ等の通信プロトコルに従って映像音声ファイルの送信を要求した受信装置２０に送信する。映像音声パケット出力部３は、映像音声送信要求入力部１と同様に、通信用ハードウェアとソフトウェアで構成される。通信用ハードウェアは、映像音声送信要求入力部１と共用することが可能である。
【００２９】
映像音声ファイル保存部４は、ＭＰＥＧ−４形式などで符号化された映像音声を、ＭＰ４など所定のファイル形式に変換したものを映像音声ファイルとして記録媒体に保存する。映像音声データ取得部５又は映像音声ファイル解析部６の要求に応じて、映像音声ファイルの指定された部分の内容を返す。映像音声ファイル保存部４は、ハードディスクやＤＶＤ−ＲＯＭ等の記録媒体及び読み出し装置から構成される。また、転送速度や応答時間を向上するためにキャッシュ機構を併用してもよい。
【００３０】
映像音声データ取得部５は、映像音声パケット生成部２の要求に応じて、映像音声ファイルのデータを返す。映像音声ファイル解析部６から映像音声の時間帯に対応する映像音声ファイル中のストリームの記録位置を取得し、それに基づいて映像音声ファイルのデータを映像音声ファイル保存部４から取得する。映像音声データ取得部５は、ハードウェア及びソフトウェアとして実現される。
【００３１】
映像音声ファイル解析部６は、映像音声ファイル保存部４に保存された映像音声ファイルの内容を解析する。ＭＰ４等の規格に従った映像音声ファイルは、映像音声ストリームのメタ情報として、映像音声のフレームに関する情報と、その他映像音声ファイル全体に関する情報を含む。映像音声ファイル解析部６は、これらを解析して、映像音声ファイル解析結果保存部７に保存する。映像音声ファイル解析部６は、ハードウェア及びソフトウェアとして実現される。
【００３２】
映像音声ファイル解析結果保存部７は、半導体メモリなど高速にランダムアクセス可能な記録媒体を用いて、映像音声ファイルの解析結果を保存する。
【００３３】
以下、本実施形態の映像音声配信装置を使用して映像音声配信を行う場合について説明する。
【００３４】
以下では、映像音声の符号化方式としてＭＰＥＧ−４を用い、映像音声ファイルの形式としてはＭＰＥＧ−４規格の一部であるＭＰ４ファイル形式を用いる場合を例にとって説明をするが、もちろん、本発明は他の方式で符号化される映像音声及び映像音声ファイルについても同様に適用可能である。
【００３５】
図２及び図３は、映像音声ファイル解析結果保存部７に記録される、映像音声ファイルの解析結果の構成例を示したものである。
【００３６】
図２は、映像音声配信装置に保存されている映像音声ファイルの一覧と、各映像音声ファイルの解析結果が映像音声ファイル解析結果保存部７に保存されているかどうかを示す。また、解析済みのファイルについては、ファイルが所定の形式に従っていて正しく再生できるかどうかを示す。図２の例では、映像音声ファイルｆ１とｆ２は後述のように解析されており、ｆ３は未解析であり、ｆ４は解析の結果、ファイルが破損しているために再生できないことが分かっている。
【００３７】
この方式以外にも、映像音声ファイル解析結果保存部７においては、映像音声ファイルの解析結果が保存されている映像音声ファイル名だけを管理し、映像音声ファイルの有無は、映像音声受信装置２０によって送信が要求された時点で調べることもできる。
【００３８】
図３は、映像音声ファイル全体に関する解析結果を示す。解析結果として映像音声ストリームの時間長と各フレームの情報を解析するためのデータを映像音声ファイル解析結果保存部７に保存する。これ以外に、映像音声ファイルのその他の属性や、映像音声ファイルに関する説明などを保存してもよい。
【００３９】
フレームを解析するためには、フレームの再生時刻、サイズ、同期が取れるかどうか、データの記録位置などの情報が映像音声ファイルのどの部分に保存されているかを知る必要がある。また、これらは映像音声ファイルによってはすべてのフレームで共通の値を取る場合がある。
【００４０】
ＭＰ４ファイルにおいては、フレームに関する情報が情報の種類ごとにまとめて保存されているので、それらの情報のＭＰ４ファイルにおける記録位置を映像音声ファイル解析結果保存部７に保存しておくことによって、フレーム情報の解析を行うことができる。また、フレームの再生時刻の代わりに再生時間が保存されているので、再生時間から再生時刻を求める必要がある。
【００４１】
図４は、可変ビットレートの映像ストリーム及び音声ストリームを含む、映像音声ファイルのフレームに関する情報の一例である。
【００４２】
図４（ａ）の上段に示す映像音声ファイルｆ１には、映像ストリーム、音声ストリーム、両ストリームに関するメタ情報が順に記録されている。図４（ａ）の上段の映像ストリームには例えば中段に示すように各フレームが記録され、音声ストリームには例えば下段に示すように各フレームが記録されている。
【００４３】
図４（ｂ）は、映像音声ファイル解析結果保存部７に記録された、映像音声ファイルｆ１の各フレームに関する情報を示す。図４（ｂ）の情報において、「フレーム番号」の項目は、映像ストリームの先頭を１番としてフレームの再生順に割り当てた番号である。「再生時刻」の項目は、ストリームの先頭を０秒としたフレームの再生時刻であり、映像ストリームにおいては次のフレームの再生時刻までフレームを表示することを意味する（最終フレームの場合は、ストリーム全体の再生時間の終端まで表示する）。音声ストリームにおいては、再生時刻から音声を出力することを示す。「同期」の項目は、他のフレームを再生することなく再生できるフレームであるかどうかを示し、ＭＰＥＧ−４映像ストリームにおいてはＩｆｒａｍｅであることを示す。
【００４４】
「オフセット」の項目と「サイズ」の項目は、映像音声ファイル上でそのフレームのデータが格納された記録位置の“先頭”と“サイズ”をそれぞれバイト単位で記述したものである。説明のため図においては、具体的な値の代わりに、ｏｆｆｓｅｔ（オフセット）またはｓｉｚｅ（サイズ）、フレーム番号、ｖ（映像）またはａ（音声）からなる変数名で示す。なお、フレーム情報に欠落や異常がある場合は、これらの情報の代わりに、フレームを再生できないことを記述することができる。
【００４５】
図４の例においては、映像ストリームの３３番以降及び音声ストリームの５３番以降のフレームに関する情報は解析されていないので、「同期」、「オフセット」、「サイズ」の各項目が不明となっている。「再生時刻」の項目は、ＭＰ４ファイルのようにフレームの再生時間が映像音声ファイルに保存されている場合には、解析されている最後のフレームの再生時刻と再生時間の和からその次のフレームの再生時刻を求めることができる。フレームの再生時間の代わりに再生時刻が映像音声ファイルに保存されている場合は、解析されていないフレームの再生時刻は求めることができない。
【００４６】
ＭＰ４ファイル形式においては、データが連続するサンプル（フレームに相当）をチャンクと定義し、データの記録位置はサンプルごとではなくチャンクごとに記録されている。図４（ａ）のように連続領域に保存されているストリームに関しては、チャンクの先頭にあるフレームのオフセットは保存されているが、それ以外のフレームのオフセットは保存されていない可能性がある。オフセットが保存されていないフレームのオフセットは、前のフレームのオフセットと前のフレームのサイズとの和によって順次求めることができる。なお、各図において、演算によって求まったオフセットの値を括弧（）で囲んで示すものとする。
【００４７】
すべてのフレームについてオフセットが記録されている映像音声ファイル形式では、一つ先のフレームのオフセットからサイズを求めたいフレームのオフセットの値を引くことによって、フレームのサイズを求めることができる。
【００４８】
先に述べたようにサイズからオフセットを求めることも可能なので、映像音声ファイルの解析結果としてオフセットとサイズのどちらか一方だけを保存すれば十分である。サイズの表現に要するビット数はオフセットの表現に要するビット数よりも一般に少ないため、サイズを記録する方がオフセットを記録するよりもデータを格納するために必要な主記憶領域を削減することができる。
【００４９】
フレームを順次再生している場合は、直前に再生したフレームのオフセットが求まっているので、直前に再生したフレームのサイズを足すことによって今回再生するフレームのオフセットを求めることができる。映像音声の早送りや巻き戻しなどによってフレームを不連続に再生する場合には、オフセットが求まっている再生時刻が前で最も近いフレームから、オフセットを求めるフレームまでの各フレームのサイズをすべて足せばよい。
【００５０】
映像音声ファイル解析結果保存部７にオフセットが保存されているフレームが少ない場合には、サイズを足すフレームの数が多くなり、この処理は時間がかかる。特にフレーム情報が保存されていない場合には、映像音声ファイルを取得して解析する必要があり、その処理時間がオフセットを求める処理時間に加わる。
【００５１】
そのため、演算によって求めたオフセットの一部を映像音声ファイル解析結果保存部７に保存することによって、オフセットの計算を高速化することができる。オフセットを保存するフレームとしては、例えば同期可能なフレームのみを選ぶことができる。なお、各図においては、演算によって求まったオフセットのうち映像音声ファイル解析結果保存部７に保存するものを括弧［］で囲んで示すものとする。
【００５２】
このように、映像音声ファイル解析結果保存部７にはフレームのオフセットを保存しないことが可能であり、フレーム情報を保存するための映像音声ファイル解析結果保存部７の主記憶領域を削減することができる。
【００５３】
図５は、可変ビットレートの映像ストリームと固定ビットレートの音声ストリームを含む、映像音声ファイルの各フレームに関する情報の一例である。
【００５４】
図５（ａ）の上段に示す映像音声ファイルｆ２には、映像／音声ストリーム、両ストリームに関するメタ情報が順に記録されている。図５（ａ）の上段の映像／音声ストリームには例えば下段に示すように映像ストリームと音声ストリームはそれぞれ一定時間ごとに一まとまりのストリームとして記録されている。
【００５５】
図５（ｂ）は、映像音声ファイル解析結果保存部７に記録された、映像音声ファイルｆ２の各フレームに関する情報を示すものであり、基本的には図４（ｂ）と同様のフォーマットである。
【００５６】
図５の例においては、映像ストリームの６０番フレームのサイズは異常な値が設定されている。このように、映像音声ファイルの解析時に、個々のフレームについて異常を発見した場合には、再生を行わないことができ、以降のフレームの送信及び映像音声受信装置２０における再生が可能な場合には、続行することができる。
【００５７】
図５（ｂ）において、音声ストリームは、各フレームの再生時間とサイズがすべて同じで、すべてのフレームで同期を取ることが可能である。そのため、次に示す式を用いて、フレーム番号から再生時刻を求めることができる。また、逆に、再生時刻からフレーム番号を求めることもできる。なお、最初のフレーム番号を１としている。
再生時刻＝（フレーム番号−最初のフレームの番号）×１フレームあたりの再生時間つまり、各フレームの再生時刻を映像音声ファイル解析結果保存部７に保存する必要はない。
【００５８】
映像音声ファイルにおいてフレームのデータが前のフレームと不連続に記録されている場合には、フレームのオフセットを指定する必要がある。前のフレームと連続している場合には図４の例と同様に、オフセットは以前のフレームのオフセットとサイズから求めることが可能である。
【００５９】
図５の例では、映像ストリームの６１番フレームと音声ストリームの１０１番フレームは、前のフレームと連続した位置に記録されていないので、映像音声ファイルに記録されたフレームのオフセットを取得する必要がある。
【００６０】
次に、本実施形態の映像音声配信装置において映像音声ファイルの送信を行う処理手順について図６及び図７を参照しながら説明する。
【００６１】
ステップＳ１１において、映像音声送信要求入力部１は、映像音声受信装置２０から映像音声ファイルの処理要求を受け付ける。例えば、送信要求及び応答をＲＴＳＰに基づいて行う場合、ＲＴＳＰ要求を受け付けるソフトウェアを常時実行する。
【００６２】
映像音声ファイルに対する新規の送信要求を受け付けるとステップＳ１２に進み、映像音声送信要求入力部１は、映像音声パケット生成部２を起動して映像音声の送信の準備を指示する。映像音声送信要求入力部１は、ステップＳ１３からこの送信要求に対する送信指示を受信し、同時にステップＳ１１において新たな送信要求の開始を受け付ける。
【００６３】
ステップＳ１３において、映像音声受信装置２０から送信を要求された映像音声ファイルに対する送信指示を受け取った場合は、ステップＳ１４，Ｓ１５，Ｓ１６に進み、送信指示に応じた処理を行う。「再生指示」の場合は、ステップＳ１８に進み、映像音声パケット生成部２に対して送信の開始を指示し、ステップＳ１３に戻る。「一時停止指示」の場合は、ステップＳ１９に進み、映像音声パケット生成部２に対して送信の一時停止を指示し、ステップＳ１３に戻る。その他の指示の場合は、指示の内容に応じて適切な処理を行い、ステップＳ１３に戻る。
【００６４】
「終了指示」の場合は、ステップＳ１７に進み、映像音声パケット生成部２に対して映像音声パケットの生成を停止するよう指示する。映像音声パケット生成部２がプロセスやスレッドであれば、処理を終了してリソースを開放するか、別の送信要求が来るまで待機させる。そして、映像音声送信要求入力部１は、送信要求を受けた映像音声ファイルに関する送信指示の受信を終了する。
【００６５】
次に、本実施形態の映像音声配信装置の映像音声パケット生成部２の処理手順について図８及び図９を参照しながら説明する。
【００６６】
最初に、ステップＳ３１において、送信を指示された映像音声ファイルに対する送信の準備を行う。このとき、映像音声ファイル解析部６において映像音声ファイルの解析を行うことにより、後に再生指示を受信してから送信を開始するまでの応答時間を短縮することができる。
【００６７】
ステップＳ３２において、映像音声ファイルへの操作指示を受信した場合は、ステップＳ４１，Ｓ４２，Ｓ４３に進み、送信指示に応じた処理を行う。再生が指示された場合は、ステップＳ４４において再生を開始し、ステップＳ３４に移る。再生の一時停止が指示された場合は、ステップＳ４５において再生を一時停止し、ステップＳ３２に戻って次の指示を待つ。再生終了が指示された場合は、送信処理を終了する。その他の指示の場合は、適切な処理を行い、ステップＳ３２に戻る。
【００６８】
ステップＳ３２において映像音声ファイルへの操作指示を受信しなかった場合に、ステップＳ３３において映像音声パケット生成部２が再生中の状態にないときは、ステップＳ３２に戻って操作指示を待つ。
【００６９】
ステップＳ３２において映像音声ファイルへの操作指示を受信しなかった場合に、ステップＳ３３において映像音声パケット生成部２が再生中の状態にあるときは、ステップＳ３４，Ｓ３５，Ｓ３６，Ｓ３７，Ｓ３８の一連の処理を順に実行する。
【００７０】
この一連の処理では、映像音声ファイルの内容を一定時間の映像ストリームごとに順次取得し、パケット化して送信を行う。
【００７１】
ここでは、映像音声ファイルの最初の送信において、先頭から０．１秒間をパケット化して送信する場合を例にとりながら説明する。
【００７２】
まず、ステップＳ３４において、映像音声パケット生成部２は、映像音声データ取得部５に対し、映像音声ファイルの先頭から０．１秒間の内容の取得を指示する。
【００７３】
ステップＳ３５において、映像音声データ取得部５は、映像音声ファイル解析部６に対して、指定された時間に対するデータが映像音声ファイルのどの部分に保存されているかを問い合わせる。ここでは、映像音声ファイル解析部６は、映像ストリーム及び音声ストリームのそれぞれについて、先頭から０．１秒に相当するデータが保存されている範囲を解析して返す。この映像音声ファイル解析部６が行う処理については後述する。
【００７４】
ステップＳ３６において、映像音声データ取得部５は、映像音声ファイル解析部６に指定された範囲の映像音声ファイルのデータを、映像音声ファイル保存部４から取得する。
【００７５】
ステップＳ３７において、映像音声パケット生成部２は、このデータをもとにＲＴＰプロトコルなど所定のプロトコルに基づいてパケットを生成し、映像音声パケット出力部３から映像音声受信装置２０に対して送信させる。映像音声パケット出力部３は、映像音声受信装置２０にパケットを送信する。
【００７６】
そして、ステップＳ３８において、映像音声パケット生成部２は、内部の時刻を更新し、ステップＳ３２に戻る。引き続き再生中の状態であれば繰り返しステップＳ３４以降を実行し、先に送信した映像音声データの次の時間に相当するパケットを生成して送信する。
【００７７】
次に、本実施形態の映像音声配信装置の映像音声ファイル解析部６及び映像音声ファイル解析結果保存部７の処理手順について図１０及び図１１を参照しながら説明する。
【００７８】
ここでは、映像音声ファイル解析結果保存部７には、映像音声ファイルの解析結果が未だ何も格納されていない状態で、映像音声ファイルｆ１の映像音声ストリームを先頭から０．１秒間送信する場合を例にとりながら説明する。
【００７９】
この映像音声ファイルｆ１は、図２、図３及び図４で説明したものと同一のもので、映像ストリームは毎秒３０フレームの可変ビットレート、音声は毎秒５０フレームの可変ビットレートとする。
【００８０】
さて、映像音声受信装置２０から映像音声ファイルｆ１に対する送信要求を受けると、前述したようにして、ステップＳ３５において、映像音声ファイル解析部６は、映像音声データ取得部５から問い合わせを受ける。
【００８１】
この場合、まず、ステップＳ５１において、映像音声ファイル解析部６は、映像音声データ取得部５に要求された映像音声ファイルｆ１に関するデータの解析結果が、映像音声ファイル解析結果保存部７に保存されているかどうか調べる。
【００８２】
保存されていない場合（例えば、以前に映像音声ファイルｆ１を送信したことがない場合、送信したことはあるがすでに解析結果が削除されている場合、など）には、ステップＳ５２に進み、映像音声ファイル保存部４から映像音声ファイルｆ１を読み、内容を解析して、ステップＳ５３に進む。映像音声ファイル全体に関する情報は、例えば図３で示す形式で、映像音声ファイル解析結果保存部７に記録される。なお、映像音声ファイルｆ１の解析は、映像音声ファイルｆ１の送信の再生を要求された時点で行うことも、送信要求が来る前にあらかじめ行うことも可能である。
【００８３】
ステップＳ５１において映像音声ファイル全体に関するデータが映像音声ファイル解析結果保存部７にある場合は、ステップＳ５５に進み、映像音声データ取得部４に要求された時間帯に含まれるすべてのフレームの情報があるかどうか調べる。映像音声ファイル解析部６は、映像音声ファイル解析結果保存部７に記録された図３及び図４に示す形式の情報を参照する。
【００８４】
ステップＳ５５において要求された時間帯に含まれるフレームの情報の全部または一部がないと判断された場合には、ステップＳ５３において、当該解析結果が保存されていないフレームの情報を求めるために、映像音声ファイルｆ１を映像音声ファイル保存部４から読み出して解析する。そして、ステップＳ５４において、映像音声ファイル解析結果保存部７に解析結果を保存する主記憶領域があれば、ステップＳ５７において、その解析結果を映像音声ファイル解析結果保存部７に図１２で示すように格納する。この情報より映像音声の先頭から０．１秒間の映像データが映像音声ファイルｆ１のどの位置に格納されているかが分かる。
【００８５】
ステップＳ５１において映像音声ファイルｆ１に関するデータの解析結果がないと判断されてステップＳ５２において解析が行われた場合にも、ステップＳ５３に移り、上記の解析及び格納を行う。
【００８６】
なお、ステップＳ５４において、映像音声ファイル解析結果保存部７に解析結果を保存する主記憶領域がない場合については、後述する。
【００８７】
さて、ステップＳ５５において要求された時間帯に含まれるフレームの情報の全部があると判断され、またはステップＳ５３，Ｓ５７の解析及び格納が完了すると（本例では映像音声ファイル解析結果保存部７には映像音声ファイルの解析結果が未だ何も格納されていないものとしているので、後者に該当する）、ステップＳ５６において、映像音声ファイル解析部６は、図１２に示すデータを参照して映像音声データ取得部５に情報を返す。本例の場合、映像ストリームは、映像音声ファイルｆ１のｏｆｆｓｅｔ１ｖバイト目からｓｉｚｅ１ｖ＋ｓｉｚｅ２ｖ＋ｓｉｚｅ３ｖバイトを取得し、音声ストリームは映像音声ファイルｆ１のｏｆｆｓｅｔ１ａバイト目からｓｉｚｅ１ａ＋ｓｉｚｅ２ａ＋ｓｉｚｅ３ａ＋ｓｉｚｅ４ａ＋ｓｉｚｅ５ａバイトを取得するよう、映像音声データ取得部４に返す。
【００８８】
続いて、本例において、映像音声ファイルｆ１の映像音声ストリームを、先頭から０．１秒後のところから０．２秒後のところまでの内容について送信するものとする。この場合、前回の先頭から０．１秒間の送信の際に映像音声ファイル全体の解析が行われ、その結果が映像音声ファイル解析結果保存部７に保存されているので、ステップＳ５２の解析をする必要はない。ただし、要求された時間帯に含まれるフレームの情報は未だない。したがって、ステップＳ５１，Ｓ５５，Ｓ５３，Ｓ５７を実行して、０．１秒後から０．２秒後までの解析を行い、映像音声ファイル解析結果保存部７に図１３に示す情報が記録される。また、この時間帯のフレームに関するオフセットの情報は映像音声ファイルに記録されていないので、映像音声データの取得位置は前回取得したデータの次の位置からとなる。つまり、
ｏｆｆｓｅｔ４ｖ＝ｏｆｆｓｅｔ１ｖ＋ｓｉｚｅ１ｖ＋ｓｉｚｅ２ｖ＋ｓｉｚｅ３ｖ、
ｏｆｆｓｅｔ６ａ＝ｏｆｆｓｅｔ１ａ＋ｓｉｚｅ１ａ＋ｓｉｚｅ２ａ＋ｓｉｚｅ３ａ＋ｓｉｚｅ４ａ＋ｓｉｚｅ５ａである。
【００８９】
その結果、映像音声データ取得部４に、映像ストリームは映像音声ファイルｆ１のｏｆｆｓｅｔ４ｖバイト目からｓｉｚｅ４ｖ＋ｓｉｚｅ５ｖ＋ｓｉｚｅ６ｖバイトを取得し、音声ストリームは、ｏｆｆｓｅｔ６ａバイト目からｓｉｚｅ６ａ＋ｓｉｚｅ７ａ＋ｓｉｚｅ８ａ＋ｓｉｚｅ９ａ＋ｓｉｚｅ１０ａバイトを取得するよう返す。
【００９０】
ここでは、映像音声ファイルｆ１のフレーム情報を要求に応じて逐次解析した。しかし、映像音声の再生において、現在送信したフレームの後続のフレームは、次に再生される確率が他のフレームよりも高いと考えられる。そこで、フレームの解析は、要求されたフレームよりも先まで行うことができる。これによって、映像音声ファイルを逐次解析するよりも映像音声ファイル保存部４へのアクセス回数を減らし、負荷を軽減することができる。
【００９１】
次に、現在の映像音声の送信先とは異なる映像音声受信装置２０が、現在送信中の映像音声ファイルと同一の映像音声ファイルｆ１に対して送信要求を出した場合を考える。
【００９２】
ステップＳ５１において、先に解析映像音声ファイルｆ１の全体に関する結果は映像音声ファイル解析結果保存部７に保存されているので、映像音声ファイルｆ１の解析は行う必要がない。つまり、映像音声ファイルｆ１の解析を行う時間が短縮でき、映像音声ファイル保存部４を映像音声ファイルｆ１から読むための負荷を軽減することができる。
【００９３】
パケットを生成する際に必要なフレーム情報の解析結果も、映像音声ファイル解析結果保存部７に保存されている。そのため、映像音声ファイルｆ１のフレーム情報の解析を行うことなく、映像音声データの記録範囲を取得することができる。
【００９４】
このように、映像音声ファイルｆ１の送信要求に対する応答時間を短縮することができる。また、このように、映像音声ファイルｆ１の解析結果を他の送信要求と共有するので、映像音声ファイル解析結果保存部７の主記憶の使用量を抑えることができる。
【００９５】
なお、映像音声ファイル保存部４がデータキャッシュを備えている場合、映像音声ストリームを記録媒体から読み出す処理を軽減することが可能である。
【００９６】
次に、映像音声受信装置２０が映像音声再生の早送りを指示した場合を考える。例えば、先頭から５．１秒先の位置から再生する場合を考える。
【００９７】
映像音声ファイル解析部６は、映像音声ファイルｆ１のメタ情報を解析し、５．１秒目に相当するフレームの番号を検索する。ＭＰ４ファイル形式においては、フレームの再生時刻ではなく再生時間が記録されているので、先頭からすべてのフレームの再生時間を足してフレーム時刻を求めればよい。
【００９８】
その結果、図１４で示すように、映像ストリームにおいて映像音声受信装置２０が指定した時刻は、１５４番フレームであることを検出する。このフレームは単独では再生することができず、単独で再生できるフレーム（Ｉｆｒａｍｅ）の再生を必要とする。映像音声ファイル解析部６は、１５１番フレームから再生する必要があることを検出する。そこで、映像音声ファイル解析部６は、１５１番以降のフレームのデータを取得するよう情報を返す。同様に、音声ストリームも解析の結果、指定した時刻は２５６番フレームであるが単独で再生することができないので、前にある２５１番フレームからデータを取得するよう情報を返す。映像音声データ取得部４は、この情報に基づいて取得した映像音声データ及びその再生時間を映像音声パケット生成部２に返す。
【００９９】
次に、図１４の状態において、さらに別の映像音声受信装置２０から、別の映像音声ファイルｆ２に対する送信要求がきた場合を考える。
【０１００】
この映像音声ファイルｆ２は、図２、図３及び図５で説明したものと同一のもので、映像ストリームは毎秒３０フレームの可変ビットレート、音声は毎秒５０フレームの固定ビットレートとする。
【０１０１】
ここでは、映像音声ファイルｆ１を要求された場合と同様に、ステップＳ５２で解析が行われ、ステップＳ５７で解析結果が図１５で示すように映像音声ファイル解析結果保存部７に記録される。
【０１０２】
この場合は、音声ストリームはフレームの再生時間が固定されているので、再生時刻から直ちにフレーム番号を求めることができる。また、フレームのサイズが固定されているので、データが連続する領域に記録されている場合は、連続領域の先頭のオフセットとフレーム番号から直ちにフレームのオフセットを求めることができる。
【０１０３】
以下では、図１０のステップＳ５３の解析結果を映像音声ファイル解析結果保存部７に格納する際に、ステップＳ５４において、映像音声ファイル解析結果保存部７に解析結果を保存する主記憶領域がない場合について説明する。
【０１０４】
この場合には、図１１のステップＳ６１において、映像音声ファイル解析結果保存部７から情報を削除するフレームを選択し、ステップＳ６２において、映像音声ファイル解析結果保存部７から選択したフレームの情報を削除し、ステップＳ６３においてある映像音声ファイルのすべてのフレームに関する情報が削除されていればステップＳ６４においてその映像音声ファイル全体に関する情報を削除した後に、図１０のステップＳ５７において、ステップＳ５３の解析結果を映像音声ファイル解析結果保存部７に格納する。
【０１０５】
ここで、映像音声ファイルｆ１及びｆ２の再生が進行し、新たにフレーム情報の解析結果を保存するための、映像音声ファイル解析結果保存部７に割り当てられた主記憶が不足した場合を例にとってより詳しく説明する。
【０１０６】
上記のように、主記憶が不足した場合は、記録されている情報を削除しなければならない。削除する情報を選ぶ方針として、最も以前にアクセスされたフレームに関する情報を選ぶことができる。この方針に従うと、これまで示した具体例の場合には、映像音声ファイルｆ１のフレーム１が最も好ましく、以下、フレーム２、フレーム３の順になる。例えば、１秒間のフレーム情報を選び、映像ストリームのフレーム１から３０までと、音声ストリームのフレーム１から５０までの情報を削除することができる。
【０１０７】
他の方針として、フレームのオフセットをフレームのサイズから計算によって求めて保存している場合、オフセットを求めたフレームの一部を優先的に残し、それ以外のフレーム情報を先に削除する方法もある。
【０１０８】
例えば、映像ストリームにおいて同期可能なフレームが０．５秒おきに出現する場合、先頭の１番フレームと０．５秒目の１６番フレームを残し、他のフレームすなわち２番から１５番と１７番から３０番フレームを削除する。同様に、音声ストリームについても、映像ストリームで残した１番及び１６番フレームとそれぞれ同一時刻にある１番フレームと２６番フレームが同期可能であればその情報を残し、同期可能でなければ他の同期可能なフレームの情報を残す。
【０１０９】
この結果、映像音声ファイルｆ１に関するフレームの解析情報は、図１６で示すようになる。
【０１１０】
このように、映像音声ファイル解析結果保存部７の主記憶領域を効率的に利用することができる。
【０１１１】
映像音声ファイルのフレーム情報を削除した結果、フレーム情報がすべて無くなった場合は、映像音声ファイル全体の情報を削除することができる。例えば、映像音声ファイルｆ１に対するすべての映像音声配信装置からの送信要求が停止され、映像音声ファイルｆ２に対する送信が引き続き行われた結果、映像音声ファイルｆ１に関するフレーム情報がすべて削除されたとする。この場合は、図３で示す形式の映像音声ファイルｆ１全体に関する情報を、映像音声ファイル解析結果保存部７から削除することができる。
【０１１２】
なお、ある映像音声ファイルが更新された場合は、そのファイルに関する映像音声ファイルの解析結果はすべて消去し、必要に応じて再び解析すればよい（例えば、その後にはじめて送信要求されたときに解析を行ってその結果を保存する方法や、直ちに解析を行ってその結果を保存する方法などがある）。これによって、映像音声ファイルの内容に関する一貫性を、映像音声ファイル保存装置４、映像音声ファイル解析結果保存部７及び映像音声パケット生成部２の間で保つことができる。
【０１１３】
以上説明してきたように、本実施形態によれば、映像音声の送信要求から送信を開始するまでの応答時間を短縮し、映像音声配信装置の主記憶の使用量を抑えることが可能である。
【０１１４】
なお、前述したように、以上の各機能は、ソフトウェアとして実現可能である。
また、本実施形態は、コンピュータに所定の手段を実行させるための（あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるための）プログラムとして実施することもでき、該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。
【０１１５】
なお、この発明の実施の形態で例示した構成は一例であって、それ以外の構成を排除する趣旨のものではなく、例示した構成の一部を他のもので置き換えたり、例示した構成の一部を省いたり、例示した構成に別の機能あるいは要素を付加したり、それらを組み合わせたりすることなどによって得られる別の構成も可能である。また、例示した構成と論理的に等価な別の構成、例示した構成と論理的に等価な部分を含む別の構成、例示した構成の要部と論理的に等価な別の構成なども可能である。また、例示した構成と同一もしくは類似の目的を達成する別の構成、例示した構成と同一もしくは類似の効果を奏する別の構成なども可能である。
また、この発明の実施の形態で例示した各種構成部分についての各種バリエーションは、適宜組み合わせて実施することが可能である。
また、この発明の実施の形態は、個別装置としての発明、関連を持つ２以上の装置についての発明、システム全体としての発明、個別装置内部の構成部分についての発明、またはそれらに対応する方法の発明等、種々の観点、段階、概念またはカテゴリに係る発明を包含・内在するものである。
従って、この発明の実施の形態に開示した内容からは、例示した構成に限定されることなく発明を抽出することができるものである。
【０１１６】
本発明は、上述した実施の形態に限定されるものではなく、その技術的範囲において種々変形して実施することができる。
【０１１７】
【発明の効果】
本発明によれば、映像音声に対する複数の独立な送信要求に対して、映像音声ファイルの解析を共通化して必要に応じて行い、解析結果を共有するので、映像音声の送信要求に対する応答時間を短縮し、映像音声配信装置の主記憶の使用量を抑えることが可能になる。
【図面の簡単な説明】
【図１】本発明の一実施形態に係る映像音声配信装置の構成例を示す図
【図２】同実施形態に係る映像音声ファイル解析結果保存部に記録された情報の一例を示す図
【図３】同実施形態に係る映像音声ファイル解析結果保存部に記録された情報の一例を示す図
【図４】同実施形態に係る映像音声ファイル保存部に記録された映像音声ファイルの構造の一例及び映像音声ファイル解析結果保存部に記録された情報の一例を示す図
【図５】同実施形態に係る映像音声ファイル保存部に記録された映像音声ファイルの構造の一例及び映像音声ファイル解析結果保存部に記録された情報の一例を示す図
【図６】同実施形態における映像音声送信要求入力部の処理の一例を示すフローチャート
【図７】同実施形態における映像音声送信要求入力部の処理の一例を示すフローチャート
【図８】同実施形態における映像音声パケットの生成処理の一例を示すフローチャート
【図９】同実施形態における映像音声パケットの生成処理の一例を示すフローチャート
【図１０】同実施形態における映像音声ファイル解析部の処理の一例を示すフローチャート
【図１１】同実施形態における映像音声ファイル解析部の処理の一例を示すフローチャート
【図１２】同実施形態に係る映像音声ファイル解析結果保存部に記録された情報の一例を示す図
【図１３】同実施形態に係る映像音声ファイル解析結果保存部に記録された情報の一例を示す図
【図１４】同実施形態に係る映像音声ファイル解析結果保存部に記録された情報の一例を示す図
【図１５】同実施形態に係る映像音声ファイル解析結果保存部に記録された情報の一例を示す図
【図１６】同実施形態に係る映像音声ファイル解析結果保存部に記録された情報の一例を示す図
【符号の説明】
１…映像音声送信要求入力部
２，２ａ，２ｂ…映像音声パケット生成部
３…映像音声パケット出力部
４…映像音声ファイル保存部
５…映像音声データ取得部
６…映像音声ファイル解析部
７…映像音声ファイル解析結果保存部
１０…映像音声配信装置
２０…映像音声受信装置

Claims

外部の要求元から受信した映像音声ファイルの送信要求に応じて、該当する映像音声フレームを含むパケットを生成して該要求元に送信する映像音声配信装置であって、
フレームごとに分割された映像及び音声からなるストリーム並びにストリームの各フレーム及び当該ファイル全体に関するメタ情報を含む映像音声ファイルを保存するための第１の保存手段と、
前記パケットを生成する際に、前記送信要求に該当する映像音声フレームを前記第１の保存手段から取得する取得手段と、
前記第１の保存手段に保存された前記映像音声ファイルのフレームに関する解析情報及び前記映像音声ファイル全体に関する解析情報を前記取得手段に応答するために、必要に応じて前記映像音声ファイルを解析するための解析手段と、
前記解析手段により作成された前記解析情報の全部または一部を保存するための第２の保存手段とを備え、
前記解析手段により作成された前記解析情報を前記第２の保存手段に保存する場合に、前記映像音声ファイル全体に関する解析情報はその内容をすべて保存しておくとともに、前記映像音声ファイルのフレームに関する解析情報は少なくとも所定の一部のフレームについて保存しておき、
前記解析手段は、前記取得手段から前記解析情報を要求された場合に、該当する解析情報が前記第２の保存手段に保存されているならば、該保存されている情報を応答し、保存されていないならば、前記第１の保存手段に保存された前記映像音声ファイルを解析して作成した解析情報を応答することを特徴とする映像音声配信装置。
前記解析手段は、前記映像音声ファイルのフレームに関する解析情報を保存する記録領域を前記第２の保存手段に確保できない場合は、削除対象とするフレームを選択して該フレームに関連する解析情報を前記第２の保存手段から削除することを特徴とする請求項１に記載の映像音声配信装置。
前記解析手段は、前記第１の保存手段に保存されている映像音声ファイルの内容に変更があった場合には、前記第２の保存手段に保存されている当該映像音声ファイルに関連する解析情報を削除し、直ちにまたは変更後にはじめて送信要求を受けたときに更新することを特徴とする請求項１に記載の映像音声配信装置。
前記第２の保存手段に前記映像音声ファイルのフレームに関する解析情報を保存するにあたっては、該映像音声ファイルのフレームのうち、他のフレームを復号することなく再生可能なフレームについては該映像音声ファイルにおける該フレームの記録位置及び該フレームのビット数による長さを保存し、他のフレームの復号を必要とするフレームについては該映像音声ファイルにおける該フレームの記録位置は保存せず該フレームのビット数による長さを保存することを特徴とする請求項１に記載の映像音声配信装置。
フレームごとに分割された映像及び音声からなるストリーム並びにストリームの各フレーム及び当該ファイル全体に関するメタ情報を含む映像音声ファイルを保存するための第１の保存手段と、外部の要求元から受信した映像音声ファイルの送信要求に応じて、該当する映像音声フレームを該第１の保存手段から取得し、該映像音声フレームを含むパケットを生成して該要求元に送信するための処理手段と、前記第１の保存手段に保存された前記映像音声ファイルのフレームに関する解析情報及び前記映像音声ファイル全体に関する解析情報を前記処理手段に応答するために、必要に応じて前記映像音声ファイルを解析するための解析手段と、前記解析手段により作成された前記解析情報の全部または一部を保存するための第２の保存手段とを備えた映像音声配信装置における映像音声ファイル解析方法であって、
前記解析手段は、
前記処理手段から前記解析情報を要求された場合に、該当する解析情報が前記第２の保存手段に保存されているならば、該保存されている情報を応答し、保存されていないならば、前記第１の保存手段に保存された前記映像音声ファイルを解析して作成した解析情報を応答し、
該当する解析情報が前記第２の保存手段に保存されていないために前記解析情報を作成した場合には、作成した前記解析情報のうち、前記映像音声ファイル全体に関する解析情報はその内容をすべて保存しておくとともに、前記映像音声ファイルのフレームに関する解析情報は少なくとも所定の一部のフレームについて保存しておくことを特徴とする映像音声ファイル解析方法。
外部の要求元から受信した映像音声ファイルの送信要求に応じて、該当する映像音声フレームを含むパケットを生成して該要求元に送信する映像音声配信装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読取り可能な記録媒体であって、
フレームごとに分割された映像及び音声からなるストリーム並びにストリームの各フレーム及び当該ファイル全体に関するメタ情報を含む映像音声ファイルを保存するための第１の保存機能と、
前記パケットを生成する際に、前記送信要求に該当する映像音声フレームを前記第１の保存機能から取得する取得機能と、
前記第１の保存機能に保存された前記映像音声ファイルのフレームに関する解析情報及び前記映像音声ファイル全体に関する解析情報を前記取得機能に応答するために、必要に応じて前記映像音声ファイルを解析するための解析機能と、
前記解析機能により作成された前記解析情報の全部または一部を保存するための第２の保存機能とを含むとともに、
前記解析機能により作成された前記解析情報を前記第２の保存機能に保存する場合に、前記映像音声ファイル全体に関する解析情報はその内容をすべて保存しておくとともに、前記映像音声ファイルのフレームに関する解析情報は少なくとも所定の一部のフレームについて保存しておくように機能させ、
前記解析機能が前記取得機能から前記解析情報を要求された場合に、該当する解析情報が前記第２の保存機能に保存されているならば、該保存されている情報を前記解析機能から前記取得機能へ応答し、保存されていないならば、前記第１の保存機能に保存された前記映像音声ファイルを解析して作成した解析情報を前記解析機能から前記取得機能へ応答するように機能させるためのプログラムを記録したコンピュータ読取り可能な記録媒体。