JP3671842B2 - 符号圧縮化/データ変換装置及び符号圧縮化/データ変換方法 - Google Patents

符号圧縮化/データ変換装置及び符号圧縮化/データ変換方法 Download PDF

Info

Publication number
JP3671842B2
JP3671842B2 JP2000402099A JP2000402099A JP3671842B2 JP 3671842 B2 JP3671842 B2 JP 3671842B2 JP 2000402099 A JP2000402099 A JP 2000402099A JP 2000402099 A JP2000402099 A JP 2000402099A JP 3671842 B2 JP3671842 B2 JP 3671842B2
Authority
JP
Japan
Prior art keywords
code
compression
audio
control means
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000402099A
Other languages
English (en)
Other versions
JP2002204451A (ja
Inventor
裕明 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000402099A priority Critical patent/JP3671842B2/ja
Publication of JP2002204451A publication Critical patent/JP2002204451A/ja
Application granted granted Critical
Publication of JP3671842B2 publication Critical patent/JP3671842B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Signal Processing For Recording (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像・音声符号圧縮化技術に係り、特にアプリケーションが処理しなくても、システムの負荷が上がったときに画像・画像・音声符号圧縮化を自動的に容易に一時停止し、システムの負荷が下がったときに当該画像・音声符号圧縮化を再開するシステムを構築でき、負荷が下がると直ちに符号圧縮化を再開できる符号圧縮化/データ変換装置及び符号圧縮化/データ変換方法に関する。
【0002】
【従来の技術】
従来、画像をデジタル化して、CD−ROMやハードディスクなどの記録媒体に記録する場合、そのデータ量は巨大なものとなるため、通常は符号圧縮化して記録される。このような符号圧縮化方法には、各種の符号圧縮化方式があり、特に、画像の空間周波数が低周波に集中する性質を利用して圧縮を行うDCT(Discrete Cosine Transform)をベースとした符号化方式が比較的多く使用されている。当該符号化方式は、JPEG(Joint Photographic Expert Group)や、MPEG(Moving Pictures Expert Group)1またはMPEG2などの国際標準の符号化方式として採用されている。
【0003】
以下に、MPEGの場合の従来の圧縮動作について説明する。
【0004】
図4は、画像圧縮を行うビデオ符号変換制御手段10の構成図である。図4の画像圧縮では原画像をMPEGで符号圧縮化可能な色信号の形式(YUV形式)に変換するYUV変換手段11と、前/後フレームと現フレームの画像の動きをブロック(MPEGでは16画素×16画素)の領域毎に検索する動き検索手段12と、ブロックの画像を空間周波数に変換するDCT手段13と量子化を行う量子化手段14と、量子化から元に戻す逆量子化を行う逆量子化手段17と、周波数変換から元に戻す逆DCT手段16と、ブロック単位で画像の動きを補償して新たな参照フレームを生成する動き補償手段15と、可変長符号化を行う可変長符号化手段18から構成されている。
【0005】
画像圧縮は図4に示すように原画像をYUV変換手段11でYUVデータに変換して、各ピクチャ種別に応じた圧縮を行う。
【0006】
Iピクチャの場合はYUVデータをブロックに分割してブロック毎にDCT手段13により空間周波数に変換して量子化手段14により量子化して可変長符号化手段18により可変長符号化して圧縮符号を出力する。また、量子化したブロックを逆量子化手段17で逆量子化して逆DCT手段16で逆周波数変換して参照フレームを作成する。
【0007】
Pピクチャの場合はYUVデータをブロックに分割してブロック毎に動き検索手段12で参照フレームとして格納されている前フレームのブロックの中で相関が最も高いブロックを求めて、相関が最も高い前フレームのブロックとの差分をDCT手段13により空間周波数に変換して量子化手段14により量子化して可変長符号化手段18により可変長符号化して圧縮符号を出力する。また、量子化したブロックを逆量子化手段17で逆量子化して逆DCT手段16で逆周波数変換して動き補償手段15で動き補償したブロックと加算して参照フレームを作成する。
【0008】
Bピクチャの場合はYUVデータをブロックに分割してブロック毎に動き検索手段12で参照フレームとして格納されている前/後フレームのブロックの中で相関が最も高いブロックを求めて、相関が最も高い前/後フレームのブロックとの差分をDCT手段13により空間周波数に変換して量子化手段14により量子化して可変長符号化手段18により可変長符号化して圧縮符号を出力する。Bピクチャの場合は参照フレームは作成する必要がない。
【0009】
図5は音声圧縮を行うオーディオ符号変換制御手段20の構成図である。音声圧縮は原音から1AUU分の原音データを切り出す原音切り出し手段21と、1AAU単位で周波数帯域写像処理を行う32の周波数帯域写像を生成する周波数帯域写像手段22と、線形量子化及び符号化を行う量子化符号化手段23と、符号化されたデータに付加情報を加えて1AAU分の圧縮データを作成するフレーム形成手段24と、心理聴覚処理を行う心理聴覚処理手段25で構成されている。
【0010】
音声圧縮は図5に示すように原音を原音切り出し手段21で1AAU分(MPEGオーディオレイヤ2の場合は1152サンプル)切り出して、AAU単位で圧縮する。周波数帯域写像手段22は入力信号をサブバンド分析フィルタで32帯域のサブバンド信号に分解して、各サブバンド信号に対してスケールファクタを計算して、ダイナミックレンジをそろえる。心理聴覚処理手段25は入力信号を高速フーリエ変換して、その結果を使って心理聴覚のマスキングを計算して、各サブバンドに対するビット割り当てを計算する。量子化符号化手段23は決定したビット割り当てに従って量子化、符号化を行う。フレーム形成手段24は量子化符号化したサブバンド信号にヘッダや補助情報を追加して、ビットストリームに整形して、圧縮符号として出力する。
【0011】
図6は、ビデオ符号とオーディオ符号を多重化する画像・音声符号変換制御手段30の構造を示した図である。図6を参照すると、システム符号化全体の制御を行う画像・音声符号変換制御手段30は、オーディオ符号をパック化するオーディオパック生成手段31と、ビデオ符号をパック化するビデオパック生成手段32と、ビットレートを調整するためにデコーダでは読み飛ばされるパディングパックを生成するパディングパック生成手段33と、パケットヘッダに挿入するタイムスタンプを生成するタイムスタンプ生成手段34から構成される。
【0012】
システム符号化の処理では、図6に示すように、画像・音声符号変換制御手段30でビデオ符号とオーディオ符号を受け取り、ビデオパック生成手段32とオーディオパック生成手段31を制御して、システム符号として出力する。
【0013】
ビデオパック生成手段32は、ビデオ符号からパケット分のデータを切り出して、パケットヘッダ及びパックヘッダを付加する。また、オーディオパック生成手段31は、オーディオ符号からパケット分のデータを切り出して、パケットヘッダ及びパックヘッダを付加する。
【0014】
この時にビデオの場合であって、パケットのデータにフレームの先頭が含まれているときには、タイムスタンプ生成手段34で生成したPTSやDTSを挿入する。オーディオの場合であって、パケットのデータにAAUの先頭が含まれているときには、タイムスタンプ生成手段34で生成したPTSを挿入する。また、パディングパック生成手段33は、システムビットレートが平均するようにパディングパックを挿入する。
【0015】
このように画像と音声をリアルタイムで圧縮するときには、画像と音声の符号量の差が大きくなった場合に少ない方の符号を補間して、画像と音声の同期を取る必要がある。このような従来技術としては、例えば、特開平10−42295号公報に記載のものがある(第1従来技術)。
【0016】
上記第1従来技術では、実際の圧縮を行わずに前後のフレームと同一であることを示す符号を生成することで、ビデオ符号を補間して同期を取っている。
【0017】
また、他の従来技術としては、例えば、特開平10−164556号公報に記載のもの(第2従来技術)、特開2000−206994号公報に記載のもの(第3従来技術)がある。
【0018】
上記第2従来技術及び上記第3従来技術では、無音の符号を挿入することで、オーディオ符号を補間して同期を取っている。
【0019】
さらに他の従来技術としては、例えば、特開2000−78531号公報に記載のもの(第4従来技術)がある。
【0020】
上記第4従来技術では、無音に相当するダミーオーディオデータを挿入することで、オーディオ符号を補間して同期を取っている。
【0021】
【発明が解決しようとする課題】
しかしながら、上記従来技術では、ビデオ圧縮(ビデオ符号圧縮化)またはオーディオ圧縮(オーディオ符号圧縮化)のどちらかが連続して符号を生成できることを前提としている。このために、複数のプログラムが動作できるシステム上でソフトウェアによるリアルタイム圧縮を行っている場合、他のプログラムが動作して圧縮を継続できない程の重い負荷がかかったときは画像と音声の同期を取ることができなくなり、圧縮を停止しなければならなくなるという問題点があった。
【0022】
また、負荷が下がってから符号圧縮化を再開するときは、キャプチャデバイスの初期化や符号圧縮化のためのメモリ獲得・ファイルオープンを行う必要があるので、その処理時間分だけ符号圧縮化の再開が遅れるという問題点もあった。
【0023】
本発明は斯かる問題点を鑑みてなされたものであり、その目的とするところは、アプリケーションが処理しなくても、システムの負荷が上がったときに画像・音声符号圧縮化を自動的に容易に一時停止し、システムの負荷が下がったときに当該画像・音声符号圧縮化を再開するシステムを構築でき、負荷が下がると直ちに符号圧縮化を再開できる符号圧縮化/データ変換装置及び符号圧縮化/データ変換方法を提供する点にある。
【0024】
【課題を解決するための手段】
この発明の請求項1に記載の発明の要旨は、複数のプログラムが動作できるシステム上で画像と音声、もしくはそれらのどちらかを符号圧縮化あるいはデータ変換し、リアルタイムに記録もしくは配信する符号圧縮化/データ変換装置であって、システム上で動作する所定のアプリケーションから供給された画像をビデオキャプチャバッファに格納し、音声をオーディオキャプチャバッファに格納するとともに、アプリケーションからの要求に応じて、画像および音声に対する符号圧縮化もしくはデータ変換動作を制御するインタフェース制御手段と、インタフェース制御手段による制御に従って画像および音声に対する符号圧縮化もしくはデータ変換動作を行う符号圧縮化手段とを備え、インタフェース制御手段は、ビデオキャプチャバッファへの画像の格納およびオーディオキャプチャバッファへの音声の格納ができない場合には、符号圧縮化手段による画像および音声に対する符号圧縮化を一時停止させ、その後一定時間経過後、またはシステムの負荷が低下したとき、符号圧縮化手段による画像および音声に対する符号圧縮化もしくはデータ変換動作を再開させ、符号圧縮化手段は、データ変換動作を再開させる際、一時停止時点までに符号圧縮化された画像が、符号圧縮化された音声よりも時間軸上進んでいる場合には、画像の符号圧縮化の開始を音声の符号圧縮化より遅らせ、符号圧縮化された音声が、符号圧縮化された画像よりも時間軸上進んでいる場合には、音声の符号圧縮化の開始を画像の符号圧縮化より遅らせることを特徴とする符号圧縮化/データ変換装置に存する。
また、この発明の請求項2に記載の発明の要旨は、インタフェース制御手段は、ビデオキャプチャバッファへの画像の格納および音声のオーディオキャプチャバッファへの格納の少なくともいずれか一方が不可能となった場合、符号圧縮化手段に対して、画像および音声に対する符号圧縮化を一時停止させ、アプリケーションに対して要求に対する所定の応答を返すことを特徴とする請求項1に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項3に記載の発明の要旨は、インタフェース制御手段は、システムの負荷が低下したとき、画像に関して現在までに符号圧縮化されたフレームの数をフレームレートで除算することによって第1の時間量を算出し、音声に関して現在までに符号圧縮化されたサンプルの数をサンプリング周波数で除算することによって第2の時間量を算出し、第1の時間量と第2の時間量との差を算出し、差と現在のキャプチャフレーム番号とから画像の符号圧縮化の再開フレーム番号を算出し、差と現在のキャプチャサンプル数とから音声の符号圧縮化の再開サンプル番号を算出することを特徴とする請求項1に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項4に記載の発明の要旨は、インタフェース制御手段は、アプリケーションからの要求により、符号圧縮化手段による画像および音声に対する符号圧縮化もしくはデータ変換動作を制御し、アプリケーションが直接符号圧縮化もしくはデータ変換処理に関与しなくてよいように、符号圧縮化もしくはデータ変換動作を集約して制御し、システムの負荷が上がり、ビデオキャプチャバッファへの画像の格納および音声のオーディオキャプチャバッファへの格納が不可能となった場合、符号圧縮化手段による画像および音声に対する符号圧縮化を一時停止させ、システムの負荷が低下したとき、符号圧縮化手段による画像および音声に対する符号圧縮化もしくはデータ変換動作を再開させ、アプリケーションからの制御を必要としないように構成されていることを特徴とする請求項1乃至3のいずれか一項に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項5に記載の発明の要旨は、符号圧縮化手段は、画像に対して符号圧縮化を行うビデオ符号変換制御手段と、音声に対して符号圧縮化を行うオーディオ符号変換制御手段と、符号圧縮化された画像および音声に対して所定のシステム符号化を行う画像・音声符号変換制御手段とを有し、インタフェース制御手段は、アプリケーションからの要求に従って符号圧縮化手段を制御し、符号圧縮化もしくはデータ変換またはキャプチャした画像を一時的に格納するビデオキャプチャバッファと、ビデオ符号変換制御手段によって生成されたビデオ符号を一時的に格納するビデオ符号バッファと、符号圧縮化もしくはデータ変換またはキャプチャしたオーディオデータを一時的に格納するオーディオキャプチャバッファと、オーディオ符号変換制御手段によって生成されたオーディオ符号を一時的に格納するオーディオ符号バッファと、画像・音声符号変換制御手段によって生成されたシステム符号を一時的に格納するシステムバッファを有し、インターフェース制御手段は、符号圧縮化もしくはデータ変換またはキャプチャした原画像をビデオ符号変換制御手段に渡す原画像受け渡し制御手段と、符号圧縮化もしくはデータ変換またはキャプチャした原音声をオーディオ符号変換制御手段に渡す原音声受け渡し制御手段と、符号圧縮化の一時停止と再開を行う一時停止・再開制御手段を有し、アプリケーションは、符号圧縮化もしくはデータ変換またはキャプチャした原画像と原音声を受け取って、インターフェース制御手段に渡して、インターフェース制御手段に渡されたシステム符号をシステム符号ファイルに書き込み、インターフェース制御手段は、符号圧縮化もしくはデータ変換またはキャプチャした原画像をビデオキャプチャバッファに格納し、符号圧縮化もしくはデータ変換またはキャプチャした原音声をオーディオキャプチャバッファに格納し、ビデオ符号変換制御手段とオーディオ符号変換制御手段と画像・音声符号変換制御手段を制御し、生成されたビデオ符号はビデオ符号バッファに格納され、生成されたオーディオ符号はオーディオ符号バッファに格納され、生成されたシステム符号はシステムバッファに格納され、システム符号をアプリケーションに渡すことを特徴とする請求項4に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項6に記載の発明の要旨は、アプリケーションは、ビデオ符号のビデオキャプチャデバイスとオーディオ符号のオーディオキャプチャデバイスを初期化する第1工程を実行し、符号圧縮化手段に開始要求を出して必要なメモリを獲得させる第2工程を実行し、MPEG符号を記録するファイルをオープンする第3工程を実行し、ビデオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがあるかどうかを判断する第4工程を実行し、ビデオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがある場合は原画像受け渡し制御手段を呼び出す第5工程を実行し、ビデオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがない場合はオーディオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがあるかどうかを判断する第6工程を実行し、オーディオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがある場合は原音声受け渡し制御手段を呼び出す第7工程を実行し、オーディオのキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがない場合はシステム符号があるかどうかを判断する第8工程を実行し、オーディオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがある場合はシステム符号をファイルに書き込む第9工程を実行するとともに、オーディオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがない場合は符号圧縮化もしくはデータ変換またはキャプチャが終了したかどうかを判断する第10工程を実行し、符号圧縮化もしくはデータ変換またはキャプチャが終了していない場合は第4工程に戻り、符号圧縮化もしくはデータ変換またはキャプチャが終了した場合はファイルをクローズする第11工程を実行するとともに、符号圧縮化手段に終了要求を出して獲得したメモリを解放させる第12工程を実行することを特徴とする請求項5に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項7に記載の発明の要旨は、原画像受け渡し制御手段は、キャプチャフレーム番号を加算する第21工程を実行するとともに、一時停止かどうかを判断する第22工程を実行し、一時停止でない場合はビデオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能かどうかを判断する第26工程に進み、一時停止である場合は再開かどうかを判断する第23工程を実行するとともに、再開でない場合は所定応答をアプリケーションに返す第25工程に進み、再開である場合はキャプチャフレーム番号が再開フレーム番号以上であるかどうかを判断する第24工程を実行するとともに、キャプチャフレーム番号が再開フレーム番号以上でない場合は所定応答をアプリケーションに返す第25工程を実行して処理を終了し、キャプチャフレーム番号が再開フレーム番号以上である場合はビデオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能かどうかを判断する第26工程を実行するとともに、キャプチャフレーム番号が再開フレーム番号以上でない場合は一時停止・再開制御手段を起動する第29工程に進み、ビデオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能である場合は符号圧縮化もしくはデータ変換またはキャプチャした原画像をビデオキャプチャバッファに格納する第27工程を実行するとともに、ビデオ符号変換制御手段に符号圧縮化もしくはデータ変換またはキャプチャしたデータがあることを知らせる第28工程を実行し、第29工程に進んだ場合は一時停止・再開制御手段を起動することを特徴とする請求項5に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項8に記載の発明の要旨は、原音声受け渡し制御手段は、キャプチャサンプル番号を加算する第31工程を実行するとともに、一時停止かどうかを判断する第32工程を実行し、一時停止でない場合はオーディオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能かどうかを判断する第36工程に進み、一時停止である場合は再開かどうかを判断する第33工程を実行するとともに、再開でない場合は所定応答をアプリケーションに返す第35工程に進み、再開である場合はキャプチャサンプル番号が再開サンプル番号以上であるかどうかを判断する第34工程を実行するとともに、キャプチャサンプル番号が再開サンプル番号以上でない場合は所定応答をアプリケーションに返す第35工程を実行して処理を終了し、キャプチャサンプル番号が再開サンプル番号以上である場合はオーディオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能かどうかを判断する第36工程を実行するとともに、オーディオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能でない場合は一時停止・再開制御手段を起動する第39工程に進み、オーディオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能である場合は符号圧縮化もしくはデータ変換またはキャプチャした原画像をオーディオキャプチャバッファに格納する第37工程を実行するとともに、ビデオ符号変換制御手段に符号圧縮化もしくはデータ変換またはキャプチャしたデータがあることを知らせる第38工程を実行し、第39工程に進んだ場合は一時停止・再開制御手段を起動することを特徴とする請求項5に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項9に記載の発明の要旨は、ビデオ符号変換制御手段は、ビデオキャプチャバッファに格納されたデータがあるかどうかを判断する第41工程を実行し、ビデオキャプチャバッファから原画像を取り出す第42工程を実行し、現在までに圧縮した圧縮フレーム数を加算する第43工程を実行し、原画像をビデオ圧縮する第44工程を実行し、生成したビデオ符号をビデオ符号バッファに格納する第45工程を実行し、その後に、インターフェース制御手段から一時停止の要求があるかどうかを判断する第46工程を実行し、インターフェース制御手段から一時停止の要求がない場合は第41工程に戻り、インターフェース制御手段から一時停止の要求がある場合はインターフェース制御手段から再開の要求があるかどうかを判断する第47工程を実行するとともに、インターフェース制御手段から再開の要求がない場合は第47工程の先頭に戻り、インターフェース制御手段から再開の要求がある場合は圧縮終了かどうかを判断する第48工程を実行するとともに、再開の要求がない場合は第41工程に戻り、インターフェース制御手段から再開の要求がある場合は処理を終了することを特徴とする請求項5に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項10に記載の発明の要旨は、オーディオ符号変換制御手段は、オーディオキャプチャバッファに格納されたデータがあるかどうかを判断する第51工程を実行し、オーディオキャプチャバッファから原画像を取り出す第52工程を実行し、現在までに圧縮した圧縮サンプル数を加算する第53工程を実行し、原音声をオーディオ圧縮する第54工程を実行し、生成したオーディオ符号をオーディオ符号バッファに格納する第55工程を実行し、その後に、インターフェース制御手段から一時停止の要求があるかどうかを判断する第56工程を実行するとともに、インターフェース制御手段から一時停止の要求がない場合は第51工程に戻り、インターフェース制御手段から一時停止の要求がある場合はインターフェース制御手段から再開の要求があるかどうかを判断する第57工程を実行するとともに、インターフェース制御手段から再開の要求がない場合は第57工程の先頭に戻り、インターフェース制御手段から再開の要求がある場合は圧縮終了かどうかを判断する第58工程を実行し、圧縮終了でない場合は第51工程に戻り、圧縮終了である場合は処理を終了することを特徴とする請求項5に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項11に記載の発明の要旨は、一時停止・再開制御手段は、ビデオ圧縮を一時停止する第61工程を実行し、オーディオ圧縮を一時停止する第62工程を実行し、負荷が低下したかどうかを判断する第63工程を実行し、負荷が低下していない場合は第63工程に戻り、負荷が低下している場合は現在までにビデオ符号変換制御手段が圧縮した圧縮フレーム数から第1の時間量を計算する第64工程を実行し、その後に、現在までにオーディオ符号変換制御手段が圧縮した圧縮サンプル数から第2の時間量を計算する第65工程を実行し、その後に、圧縮フレーム数と圧縮サンプル数から第1の時間量と第2の時間量の差を計算する第66工程を実行し、その後に、第1の時間量と第2の時間量の差と現在のキャプチャフレーム番号からビデオ圧縮(ビデオ符号圧縮化)の再開フレーム番号を計算する第67工程を実行し、その後に、第1の時間量と第2の時間量の差と現在のキャプチャサンプル数からオーディオ圧縮(オーディオ符号圧縮化)の再開サンプル番号を計算する第68工程を実行し、その後に、ビデオキャプチャバッファに格納された原画像を全て破棄する第69工程を実行し、ビデオ圧縮(ビデオ符号圧縮化)を再開する第70工程を実行し、オーディオキャプチャバッファに格納された原音声を全て破棄する第71工程を実行し、オーディオ圧縮(オーディオ符号圧縮化)を再開する第72工程を実行することを特徴とする請求項5に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項12に記載の発明の要旨は、インターフェース制御手段は、ビデオキャプチャバッファへの画像の格納またはオーディオキャプチャバッファへの音声の格納が不可能となったとき、ビデオ符号変換制御手段とオーディオ符号変換制御手段を一時停止して、アプリケーションから渡されるビデオとオーディオのキャプチャデータを圧縮しないで、所定応答をアプリケーションに返し、ビデオ符号とオーディオ符号の時間量の差が少なくなるようにビデオ圧縮(ビデオ符号圧縮化)とオーディオ圧縮(オーディオ符号圧縮化)の再開時刻を変えて、リアルタイム符号圧縮化を再開することを特徴とする請求項6乃至11のいずれか一項に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項13に記載の発明の要旨は、インターフェース制御手段は、ビデオキャプチャバッファへの画像の格納またはオーディオキャプチャバッファへの音声の格納が不可能となったとき、ビデオ符号変換制御手段とオーディオ符号変換制御手段を一時停止して、アプリケーションから渡される原画像と原音声を処理しないで、所定応答を返し、その後に、生成したビデオ符号とオーディオ符号の時間量の差を調べて、ビデオ符号の方が多い場合は差が少なくなるようにオーディオ圧縮(オーディオ符号圧縮化)の再開時刻を早め、ビデオ符号の方が少ない場合は差が少なくなるようにオーディオ圧縮(オーディオ符号圧縮化)の再開時刻を遅くすることを特徴とする請求項12に記載の符号圧縮化/データ変換装置に存する。
また、この発明の請求項14に記載の発明の要旨は、複数のプログラムが動作できるシステム上で画像と音声を符号圧縮化してリアルタイムで蓄積媒体に記録する符号圧縮化/データ変換方法であって、前記システム上で動作する所定のアプリケーションから供給された前記画像をビデオキャプチャバッファに格納し、前記音声をオーディオキャプチャバッファに格納するとともに、前記アプリケーションからの要求に応じて、前記画像および前記音声に対する符号圧縮化もしくはデータ変換動作を制御するインタフェース制御工程と、前記インタフェース制御工程における制御に従って前記画像および前記音声に対する符号圧縮化もしくはデータ変換動作を行う符号圧縮化工程と、ビデオキャプチャバッファへの画像の格納が不可能となったとき、符号圧縮化もしくはデータ変換またはキャプチャした画像データを圧縮しないでアプリケーションに所定応答を返す工程と、オーディオキャプチャバッファへの音声の格納が不可能となったとき、符号圧縮化もしくはデータ変換またはキャプチャした音声データを圧縮しないでアプリケーションに所定応答を返す工程と、システムの負荷が低下したとき、画像に関して現在までに符号圧縮化されたフレームの数をフレームレートで除算することによって第1の時間量を算出し、音声に関して現在までに符号圧縮化されたサンプルの数をサンプリング周波数で除算することによって第2の時間量を算出し、第1の時間量と第2の時間量との差を算出し、差と現在のキャプチャフレーム番号とから画像の符号圧縮化の再開フレーム番号を算出し、差と現在のキャプチャサンプル数とから音声の符号圧縮化の再開サンプル番号を算出し、ビデオ圧縮(ビデオ符号圧縮化)とオーディオ圧縮を再開する工程と、アプリケーションが直接圧縮処理に関与しなくてもよいように、画像圧縮処理を集約して処理するインターフェース制御工程を有し、前記インタフェース制御工程においては、他のプログラムの実行によりシステムの負荷が上がり、前記ビデオキャプチャバッファへの前記画像の格納および前記音声の前記オーディオキャプチャバッファへの格納の少なくともいずれか一方が不可能となった場合、前記画像および前記音声に対する前記符号圧縮化を一時停止させ、前記システムの負荷が低下したとき、前記画像および前記音声に対する前記符号圧縮化もしくはデータ変換動作を再開させ、前記符号圧縮化工程においては、前記データ変換動作を再開させる際、前記一時停止時点までに符号圧縮化された画像が、符号圧縮化された音声よりも時間軸上進んでいる場合には、画像の符号圧縮化の開始を音声の符号圧縮化より遅らせ、符号圧縮化された音声が、符号圧縮化された画像よりも時間軸上進んでいる場合には、音声の符号圧縮化の開始を画像の符号圧縮化より遅らせることを特徴とする符号圧縮化/データ変換方法に存する。
【0025】
【発明の実施の形態】
本発明は、複数のプログラムが動作できるシステム上で画像と音声を符号圧縮化してリアルタイムで蓄積媒体に記録する符号圧縮化/データ変換装置において、他のプログラムの実行によりシステムの負荷が上がり、リアルタイム圧縮が継続できなくなったときに、アプリケーション側は何も処理しなくても、自動的にリアルタイム圧縮を一時停止して、その後で自動的にAV同期を取ってリアルタイム符号圧縮化を再開できる構成を提供するものである。
【0026】
(第1の実施の形態)
以下、本発明の第1の実施の形態を図面に基づいて詳細に説明する。図7を用いて後述するように、アプリケーション41が直接圧縮処理に関与しなくてもよいようにインターフェース制御手段42が画像圧縮処理を集約して処理する。
【0027】
また、インターフェース制御手段42はビデオ圧縮(ビデオ符号圧縮化)またはオーディオ圧縮(オーディオ符号圧縮化)が継続できなくなるとビデオ符号変換制御手段10とオーディオ符号変換制御手段20を一時停止して、アプリケーション41から渡されるビデオとオーディオのキャプチャデータを圧縮しないで、所定応答をアプリケーション41に返す。次に、ビデオ符号とオーディオ符号の時間量の差が少なくなるようにビデオ圧縮(ビデオ符号圧縮化)とオーディオ圧縮(オーディオ符号圧縮化)の再開時刻を変えて、リアルタイム符号圧縮化を再開する。以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、本実施の形態では、MPEG(Moving Picture Experts
Group)圧縮方式の場合について図を参照して説明する。
【0028】
図1は、MPEGビデオに準拠した符号フォーマットの構成図である。図1を参照すると、本実施の形態では、ビデオデータは1個以上のビデオシーケンス(Video Sequence)から構成されていて、ビデオシーケンスエンドコードで終了する。
【0029】
上記ビデオシーケンスは、ビデオシーケンスヘッダ(Video Sequence Header)と、1個以上のGOP(Group Of Picture)から構成される。GOPは1個以上のピクチャから構成され、1つのピクチャが1枚の画像を示している。ピクチャの先頭にはピクチャ種別等の情報を含んだピクチャヘッダが置かれる。
【0030】
上記ピクチャには、フレーム内符号のみから構成されるIピクチャと、前方向のみのフレーム間符号から構成されるPピクチャと、前後の双方向のフレーム間符号から構成されるBピクチャの3種類がある。このようなピクチャは、任意の領域に分割された複数のスライスから構成される。
【0031】
上記スライスは、左から右へ、または上から下への順序で並んだ複数のマクロブロックから構成される。当該マクロブロックは、大別してフレーム内符号であるイントラブロックと前方向や双方向のフレーム間符号であるインターブロックの2種類がある。
【0032】
上記Iピクチャは、イントラブロックのみで構成されるが、PピクチャやBピクチャはインターブロックのみでなくイントラブロックも含む場合がある。
【0033】
また、上記マクロブロックは、16×16ドットのブロックをさらに8×8ドットのブロックに分割した輝度成分(Y1,Y2,Y3,Y4)と輝度成分に一致する領域の8×8ドットのブロックの色差成分(Cb,Cr)の6個のブロックから構成される。当該8×8ドットのブロックが符号化の最小単位となる。
【0034】
図2は、MPEGオーディオに準拠した符号フォーマットの構成図である。図2を参照すると、本実施の形態では、オーディオデータは1個のオーディオシーケンスから構成されて、オーディオシーケンスは1個以上のAAU(Audio
Access Unit:オーディオ復号単位)から構成される。
【0035】
また、上記1個のAAUは、同期ワード、ビットレート、サンプリング周波数等の情報を含んだAAUヘッダと圧縮されたオーディオ符号から構成される。1個のAAUが符号化の最小単位となる。
【0036】
図3は、MPEGシステムに準拠したビデオ符号・オーディオ符号の多重化フォーマットの構成図である。図3を参照すると、本実施の形態では、ビデオ符号・オーディオ符号は1個のシステムストリームから構成されて、システムストリームは複数のパックから構成される。
【0037】
上記パックはパックヘッダとシステムヘッダと1個以上のパケットから構成される。また、システムヘッダはビットレート等の情報が格納されていて、2番目以降のパックには付けても、付けなくてもよい。パケットにはビデオパケットとオーディオパケットがある。
【0038】
このうちビデオパケットは、パケットヘッダとビデオ符号から構成される。このビデオパケット内のビデオ符号のみを取り出して連続すると、一連のビデオシーケンスが構成される。
【0039】
また、上記ビデオパケットのパケットヘッダは、パケット開始コードと、パケット長(このパケット長の直後に続くパケットデータの全バイト数)を示すコードと、再生出力の時刻を示すPTS(Presentation Time Stamp)と、復号の時刻を示すDTS(Decoding Time Stamp)等から構成される。
【0040】
上記ビデオ符号ではIピクチャやPピクチャがBピクチャよりも前に符号化されるので、復号する順番と再生する順番が異なることがある。このため、時刻を示すコードも再生時と復号時の2種類が用意されていて、復号の時刻と再生の時刻が異なる場合はPTSとDTSの両方が出力される。復号の時刻と再生の時刻が同じ場合はPTSのみが出力される。
【0041】
また、上記オーディオパケットはパケットヘッダとオーディオ符号から構成される。このようなオーディオパケット内のオーディオ符号のみを取り出して連続することで、一連のオーディオシーケンスが構成される。
【0042】
また、上記オーディオパケットのパケットヘッダは、パケット開始コードとパケット長を示すコードと再生出力の時刻を示すPTS(Presentation Time Stamp)等から構成される。オーディオ符号では復号の順番と再生の順番が同じなのでPTSのみが出力される。
【0043】
上記ビデオパケットのPTSとオーディオパケットのPTSが一致している場合は、その符号が同時に再生されることになる。
【0044】
以下、画像と音声をリアルタイムでMPEG圧縮中に圧縮を一時停止してAV同期を取って再開する場合の圧縮動作について説明する。図7は、本発明の第1の実施の形態に係る符号圧縮化/データ変換装置100を説明するための機能ブロック図である。
【0045】
図7を参照すると、本実施の形態の符号圧縮化/データ変換装置100は、ユーザが操作するアプリケーション41と、アプリケーション41からの要求に従って圧縮動作を制御するインターフェース制御手段42と、図4で後述するビデオ圧縮(ビデオ符号圧縮化)を制御するビデオ符号変換制御手段10と、図5で後述するオーディオ圧縮(オーディオ符号圧縮化)を制御するオーディオ符号変換制御手段20と、図6で後述するシステム符号化を制御する画像・音声符号変換制御手段30と、符号圧縮化もしくはデータ変換またはキャプチャしたビデオデータを一時的に格納するビデオキャプチャバッファ43と、生成したビデオ符号を一時的に格納するビデオ符号バッファ44と、符号圧縮化もしくはデータ変換またはキャプチャしたオーディオデータを一時的に格納するオーディオキャプチャバッファ46と、生成したオーディオ符号を一時的に格納するオーディオ符号バッファ47と、システム符号を一時的に格納するシステムバッファ45を中心にして構成されている。
【0046】
インターフェース制御手段42には、符号圧縮化もしくはデータ変換またはキャプチャした原画像をビデオ符号変換制御手段10に渡す原画像受け渡し制御手段48と、符号圧縮化もしくはデータ変換またはキャプチャした原音声をオーディオ符号変換制御手段20に渡す原音声受け渡し制御手段49と、符号圧縮化の一時停止と再開を行う一時停止・再開制御手段50が含まれる。
【0047】
アプリケーション41は、符号圧縮化もしくはデータ変換またはキャプチャした原画像と原音声を受け取って、インターフェース制御手段42に渡して、インターフェース制御手段42に渡されたシステム符号をシステム符号ファイルに書き込む。
【0048】
インターフェース制御手段42は、符号圧縮化もしくはデータ変換またはキャプチャした原画像をビデオキャプチャバッファ43に格納し、符号圧縮化もしくはデータ変換またはキャプチャした原音声をオーディオキャプチャバッファ46に格納し、ビデオ符号変換制御手段10とオーディオ符号変換制御手段20と画像・音声符号変換制御手段30を制御し、生成された符号をビデオ符号バッファ44やオーディオ符号バッファ47やシステムバッファ45に格納して、アプリケーション41に符号を渡す。
【0049】
インターフェース制御手段42は、ビデオ圧縮(ビデオ符号圧縮化)またはオーディオ圧縮(オーディオ符号圧縮化)が継続できなくなった際に、ビデオ符号変換制御手段10とオーディオ符号変換制御手段20を一時停止して、アプリケーション41から渡される原画像と原音声を処理しないで、所定応答を返す。その後に、生成したビデオ符号とオーディオ符号の時間量の差を調べて、ビデオ符号の方が多い場合は差が少なくなるようにオーディオ圧縮(オーディオ符号圧縮化)の再開時刻を早くする。ビデオ符号の方が少ない場合は差が少なくなるようにオーディオ圧縮(オーディオ符号圧縮化)の再開時刻を遅くする。
【0050】
本実施の形態では、このようにインターフェース制御手段42が符号圧縮化の一時停止と再開を処理しているので、アプリケーション41は何も処理する必要がないといった効果を奏する。
【0051】
なお、図7に示す符号圧縮化/データ変換装置100ではアプリケーション41が原画像と原音声の受け取り及び生成された符号のファイル書き込みを行っているが、これに特に限定されることなく、インターフェース制御手段42がこの2つの処理を行ってもよい。
【0052】
次に、符号圧縮化/データ変換装置100の動作(符号圧縮化/データ変換方法)について説明する。
【0053】
図8は、アプリケーション41が処理するキャプチャ符号圧縮化の一処理を説明するためのフローチャートである。図8を参照すると、本実施の形態のキャプチャ圧縮では、ビデオとオーディオのキャプチャデバイスを初期化し(ステップS1)、符号圧縮化制御(ビデオ符号変換制御手段10、オーディオ符号変換制御手段20)に開始要求を出して必要なメモリを獲得させ(ステップS2)、MPEG符号を記録するファイルをオープンし(ステップS3)、ビデオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがあるかどうかを判断し(ステップS4)、そうでない場合(ステップS4のN)はステップS6に進む。そうである場合(ステップS4のY)は原画像受け渡し制御手段48を呼び出す(ステップS5)。
【0054】
その後に、オーディオのキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがあるかどうかを判断し(ステップS6)、そうでない場合(ステップS6のN)はステップS8に進む。そうである場合(ステップS6のY)は原音声受け渡し制御手段49を呼び出す(ステップS7)。
【0055】
その後に、圧縮符号があるかどうかを判断して(ステップS8)、そうでない場合(ステップS8のN)はステップS10に進む。そうである場合(ステップS8のY)は圧縮符号をファイルに書き込み(ステップS9)、キャプチャが終了したかどうかを判断し(ステップS10)、そうでない場合(ステップS10のN)はステップS4に戻る。そうである場合(ステップS10のY)はファイルをクローズし(ステップS11)、符号圧縮化制御(ビデオ符号変換制御手段10、オーディオ符号変換制御手段20)に終了要求を出して獲得したメモリを解放させる(ステップS12)。
【0056】
図9は、原画像受け渡し制御手段48の一処理を説明するためのフローチャートである。図9を参照すると、本実施の形態の原画像受け渡し制御手段48はキャプチャフレーム番号を加算し(ステップS21)、一時停止かどうかを判断し(ステップS22)、そうでない場合(ステップS22のN)はステップS26に進む。
【0057】
そうである場合(ステップS22のY)は再開かどうかを判断し(ステップS23)、そうでない場合(ステップS23のN)はステップS25に進む。
【0058】
そうである場合(ステップS23のY)はキャプチャフレーム番号が再開フレーム番号以上であるかどうかを判断し(ステップS24)、そうでない場合(ステップS24のN)は所定応答をアプリケーション41に返して(ステップS25)、終了する。
【0059】
そうである場合(ステップS24のY)はビデオキャプチャバッファ43に符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能かどうかを判断して(ステップS26)、そうでない場合(ステップS26のN)はステップS29に進む。
【0060】
そうである場合(ステップS26のY)は符号圧縮化もしくはデータ変換またはキャプチャした原画像をビデオキャプチャバッファ43に格納し(ステップS27)、ビデオ符号変換制御手段10に符号圧縮化もしくはデータ変換またはキャプチャしたデータがあることを知らせる(ステップS28)。
【0061】
また、ステップS29に進んだ場合は一時停止・再開制御手段50を起動する。これはマルチタスクで動作するので、一時停止・再開制御手段50の終了を待たずに終了する。
【0062】
このように、本実施の形態では、一時停止中でもビデオのキャプチャ動作を止める必要がないので、直ちに再開できるといった効果を奏する。
【0063】
図10は、原音声受け渡し制御手段49の一処理を説明するためのフローチャートである。図10を参照すると、本実施の形態の原音声受け渡し制御手段49は、キャプチャサンプル番号を加算し(ステップS31)、一時停止かどうかを判断して(ステップS32)、そうでない場合(ステップS32のN)はステップS36に進む。
【0064】
そうである場合(ステップS32のY)は再開かどうかを判断し(ステップS33)、そうでない場合(ステップS33のN)はステップS35に進む。
【0065】
そうである場合(ステップS33のY)はキャプチャサンプル番号が再開サンプル番号以上であるかどうかを判断し(ステップS34)、そうでない場合(ステップS34のN)は所定応答をアプリケーション41に返し(ステップS35)、終了する。
【0066】
そうである場合(ステップS34のY)はオーディオキャプチャバッファ46 に符号圧縮化もしくはデータ変換またはキャプチャした原音声が格納可能かどう かを判断し(ステップS36)、そうでない場合(ステップS36のN)はステ ップS39に進む。
【0067】
そうである場合(ステップS36のY)は符号圧縮化もしくはデータ変換またはキャプチャした原音声をオーディオキャプチャバッファ46に格納し(ステッ プS37)、オーディオ符号変換制御手段20に符号圧縮化もしくはデータ変換 またはキャプチャしたデータがあることを知らせる(ステップS38)。
【0068】
また、ステップS39に進んだ場合は一時停止・再開制御手段50を起動する。これはマルチタスクで動作するので、一時停止・再開制御手段50の終了を待たずに終了する。
【0069】
このように、本実施の形態では、一時停止中でもオーディオのキャプチャ動作を止める必要がないので、直ちに再開できるといった効果を奏する。
【0070】
なお、図9や図10に示す処理では、キャプチャバッファにデータを格納できなくなったら一時停止を始めているが、これに特に限定されることなく、前フレームと同一と見なす符号を挿入してもリアルタイムで圧縮できなくなった時に一時停止を始めてもよい。
【0071】
図11は、ビデオ符号変換制御手段10の一処理を説明するためのフローチャートである。図11を参照すると、本実施の形態のビデオ符号変換制御手段10は、ビデオキャプチャバッファ43に格納されたデータがあるかどうかを判断し(ステップS41)、ない場合(ステップS41のN)はステップS41の先頭に戻る。ある場合(ステップS41のY)はビデオキャプチャバッファ43から原画像を取り出し(ステップS42)、圧縮フレーム数を加算し(ステップS43)、原画像をビデオ圧縮(ビデオ符号圧縮化)し(ステップS44)、生成したビデオ符号をビデオ符号バッファ44に格納する(ステップS45)。
【0072】
その後に、インターフェース制御手段42から一時停止の要求があるかどうかを判断し(ステップS46)、そうでない場合(ステップS46のN)はステップS41に戻る。
【0073】
そうである場合(ステップS46のY)はインターフェース制御手段42から再開の要求があるかどうかを判断し(ステップS47)、そうでない場合(ステップS47のN)はステップS47の先頭に戻る。
【0074】
そうである場合(ステップS47のY)は圧縮終了かどうかを判断し(ステップS48)、そうでない場合(ステップS48のN)はステップS41に戻る。そうである場合(ステップS48のY)は処理を終了する。
【0075】
このように、本実施の形態では、インターフェース制御手段42からの要求によりビデオ符号変換制御手段10内で一時停止・再開を行うので、アプリケーション41は一時停止・再開の処理を行う必要がない。また、キャプチャデバイスの初期化、メモリの獲得、ファイルのオープンがされたままで一時停止するので、直ちに再開できるといった効果を奏する。
【0076】
図12は、オーディオ符号変換制御手段20の一処理を説明するためのフロー チャートである。図12を参照すると、本実施の形態のオーディオ符号変換制御 手段20は、オーディオキャプチャバッファ46に格納されたデータがあるかど うかを判断し(ステップS51)、オーディオキャプチャバッファ46から原音声を取り出し(ステップS52)、圧縮サンプル数を加算し(ステップS53)、原音声をオーディオ圧縮(オーディオ符号圧縮化)し(ステップS54)、生 成したオーディオ符号をオーディオ符号バッファ47に格納する(ステップS5 5)。
【0077】
その後に、インターフェース制御手段42から一時停止の要求があるかどうかを判断し(ステップS56)、そうでない場合(ステップS56のN)はステップS51に戻る。
【0078】
そうである場合(ステップS56のY)はインターフェース制御手段42から再開の要求があるかどうかを判断し(ステップS57)、そうでない場合(ステップS57のN)はステップS57の先頭に戻る。
【0079】
そうである場合(ステップS57のY)は圧縮終了かどうかを判断し(ステップS58)、そうでない場合(ステップS58のN)はステップS51に戻る。そうである場合(ステップS58のY)は処理を終了する。
【0080】
このように、本実施の形態では、インターフェース制御手段42からの要求によりオーディオ符号変換制御手段20内で一時停止・再開を行うので、アプリケーション41は一時停止・再開の処理を行う必要がない。また、キャプチャデバイスの初期化、メモリの獲得、ファイルのオープンがされたままで一時停止するので、直ちに再開できるといった効果を奏する。
【0081】
図13は、一時停止・再開制御手段50の一処理を説明するためのフローチャートである。図13を参照すると、本実施の形態の一時停止・再開制御手段50は、ビデオ圧縮(ビデオ符号圧縮化)を一時停止し(ステップS61)、オーディオ圧縮(オーディオ符号圧縮化)を一時停止し(ステップS62)、負荷が低下したかどうかを判断し(ステップS63)、そうでない場合(ステップS63のN)はステップS63に戻る。そうである場合(ステップS63のY)は現在までの圧縮フレーム数から時間量を計算する(ステップS64)。
【0082】
例えば、圧縮フレーム数が1200フレームで、フレームレートが29.97fpsの場合は以下の計算となる。
1200/29.97=40.040秒
【0083】
その後に、現在までの圧縮サンプル数から時間量を計算する(ステップS65)。
【0084】
例えば、圧縮サンプル数が1786000サンプルで、サンプリング周波数が44.1KHzの場合は以下の計算となる。
1786000/44100=40.498秒
【0085】
その後に、圧縮フレーム数と圧縮サンプル数から時間量の差を計算する(ステップS66)。
【0086】
上記の例では以下の計算となる。
40.498−40.040=0.458秒
【0087】
その後に、時間量の差と現在のキャプチャフレーム番号からビデオ圧縮(ビデオ符号圧縮化)の再開フレーム番号を計算する(ステップS67)。
【0088】
例えば、現在のキャプチャフレーム番号が1229フレームの場合は以下の計算となる。
1229+α×29.97
=1229+2.997
=1231.997
四捨五入して1232フレームとなる(αは装置毎に最適な値、例では0.1)。
【0089】
その後に、時間量の差と現在のキャプチャサンプル数からオーディオ圧縮(オーディオ符号圧縮化)の再開サンプル番号を計算する(ステップS68)。
【0090】
例えば、現在のキャプチャサンプル数が1808438の場合は以下の計算となる。
1808438+0.458×44100+α×44100
=1808438+202197.8+4410
=1833045.8
四捨五入して1833046サンプルとなる(αは装置毎に最適な値、例では0.1)。
【0091】
その後に、ビデオキャプチャバッファ43に格納された原画像を全て破棄し(ステップS69)、ビデオ圧縮(ビデオ符号圧縮化)を再開し(ステップS70)、オーディオキャプチャバッファ46に格納された原音声を全て破棄し(ステップS71)、オーディオ圧縮(オーディオ符号圧縮化)を再開する(ステップS72)。
【0092】
上記計算例ではビデオ符号がオーディオ符号よりも少ないので、ビデオ圧縮(ビデオ符号圧縮化)の再開時刻をオーディオ圧縮(オーディオ符号圧縮化)の再開時刻よりも早くしているが、ビデオ符号がオーディオ符号よりも多い場合はビデオ圧縮(ビデオ符号圧縮化)の再開時刻をオーディオ圧縮(オーディオ符号圧縮化)の再開時刻よりも遅くする。
【0093】
このように、本実施の形態では、再開時刻をずらしてビデオ符号とオーディオ符号の時間量の差を減らすので、ビデオとオーディオの同期を取って符号圧縮化を再開できるといった効果を奏する。
【0094】
なお、図13に示す処理では、負荷が下がるのを待ってから再開時刻の計算を行っているが、これに特に限定されることなく、一定時間待ってから再開時刻の計算を行ってもよい。また、図13に示す処理では、再開時刻をずらすことのみで同期を取っているが、これに特に限定されることなく、符号圧縮化制御に渡された原画像と原音声の時間量の差が大きい場合はビデオ符号に前フレームと同一と見なす符号を挿入したり、オーディオ符号に無音を挿入したりして、その差を縮めてから再開時刻をずらして同期を取ってもよい。また、ビデオ符号はフレーム単位で、オーディオ符号はAAU単位で多い方の符号を切り捨てて、その差を縮めてから再開時刻をずらして同期を取ってもよい。また、図13に示す処理では、圧縮フレーム数と圧縮サンプル数から時間量の差を計算しているが、これに特に限定されることなく、生成したビデオ符号とオーディオ符号の符号量とビットレートから時間量の差を計算したり、生成したシステム符号のビデオパケットとオーディオパケットのタイムスタンプから時間量の差を計算してもよい。
【0095】
図14は、図13で生成されたビデオ符号とオーディオ符号の一処理を説明する図である。図13で説明したように、一時停止直後では、ビデオ符号はフレーム数が1200フレームで29.97fpsなので、時間量は40.040秒となり、オーディオ符号はサンプル数が1786000サンプルでサンプリング周波数が44.1KHzなので、時間量は40.498秒となり、ビデオ符号とオーディオ符号の時間量の差は0.458秒となる。
【0096】
また、図13で説明したように、ビデオの再開フレーム番号が1232フレームで、オーディオの再開サンプル番号が1833046サンプルとなるので、先行するビデオ符号の時間量は以下の計算となる。
(1833046/44100)−(1232/29.97)
=41.565−41.107
=0.458秒
【0097】
このように、一時停止直後のビデオ符号とオーディオ符号の時間量の差は0.458秒なので、その差は0.458−0.458=0秒となり、オーディオ圧縮(オーディオ符号圧縮化)が再開した時点で差が無くなるので、ビデオとオーディオの同期が取れる。
【0098】
以上説明したように本実施の形態によれば、以下に掲げる効果を奏する。まず第1の効果は、アプリケーション41が処理しなくても、システムの負荷が上がったときに画像・音声符号圧縮化を自動的に容易に一時停止し、システムの負荷が下がったときに当該画像・音声符号圧縮化を再開するシステムを構築できることである。その理由は、符号圧縮化制御装置(不図示)に画像・音声の符号圧縮化の制御を集約して、アプリケーション41が直接圧縮処理に関与しなくてもよいように構成したからである。
【0099】
そして第2の効果は、負荷が下がると直ちに符号圧縮化を再開できることである。その理由は、キャプチャ動作を止めずに圧縮を一時停止しているので、処理時間のかかるキャプチャデバイスの初期化や符号圧縮化のためのメモリ獲得・ファイルオープンを行わずに符号圧縮化を再開できるからである。
【00100】
(第2の実施の形態)
以下、本発明の第2の実施の形態を図面に基づいて詳細に説明する。なお、上記実施の形態において既に記述したものと同一の部分については、同一符号を付し、重複した説明は省略する。
【00101】
図15は、画像サイズを変換するビデオ符号変換(画像符号変換の1形態)を実行する第2の実施の形態の機能ブロック図である。なお、本実施の形態のビデオ符号変換では、説明を簡単にするためにIピクチャのみのビデオ符号(画像符号の1形態)を変換する構成を示す。
【00102】
図15を参照すると、本実施の形態のビデオ符号変換制御手段10は、ビデオ符号を復号する復号化手段151と、逆量子化を行う逆量子化手段152と、ビデオ符号を空間周波数から元(時間空間)に戻す逆DCT手段153と、画像サイズを変換する画像サイズ変換手段154と、ビデオ符号を時間空間から空間周波数に変換するDCT手段155と、量子化を行う量子化手段156と、可変長符号化を行う可変長符号化手段157を中心にして構成されている。
【00103】
本実施の形態のビデオ符号変換制御手段10が実行するビデオ符号変換では、ビデオ符号を画像データに戻してから画像サイズを変えて新たなビデオ符号に圧縮する。また、ビデオ符号を復号化手段151で復号して、逆量子化手段152で逆量子化して、逆DCT手段153で画像データに戻す。次に画像データの画像サイズを画像サイズ変換手段154で変換して、DCT手段155により空間周波数に変換して、量子化手段156により量子化して、可変長符号化手段157により可変長符号化して新たなビデオ符号を出力する。
【00104】
(第3の実施の形態)
以下、本発明の第3の実施の形態を図面に基づいて詳細に説明する。なお、上記実施の形態において既に記述したものと同一の部分については、同一符号を付し、重複した説明は省略する。図16は、オーディオ符号変換(音声符号変換の1形態)を実行する第3の実施の形態の機能ブロック図である。
【00105】
図16を参照すると、本実施の形態のオーディオ符号変換制御手段20は、オーディオ符号変換はオーディオ符号(音声符号の1形態)を分解するフレーム分解手段161と、復号化及び逆量子化を行う再構成手段162と、逆写像を行う逆写像手段163と、音声の周波数を変換する音声周波数変換手段164と、32の周波数帯域写像を生成する周波数帯域写像手段165と、線形量子化及び符号化を行う量子化符号化手段166と、符号化されたデータに付加情報を加えて圧縮データを作成するフレーム形成手段167と、心理聴覚処理を行う心理聴覚処理手段168を中心にして構成されている。
【00106】
本実施の形態のオーディオ符号変換制御手段20が実行するオーディオ符号変換では、オーディオ符号を音声データに戻してから周波数を変換して新たなオーディオ符号に圧縮する。また、オーディオ符号をフレーム分解手段161で分解して、再構成手段162で復号化及び逆量子化を行い、逆写像手段163で逆写像を行い、音声データに戻す。次に音声周波数変換手段164で音声の周波数を変換して、周波数帯域写像手段165で音声を32帯域のサブバンド信号に分解して、各サブバンド信号に対してスケール・ファクタを計算し、ダイナミックレンジを揃え、心理聴覚処理手段168で音声を高速フーリエ変換し、その結果を使って心理聴覚のマスキングを計算し、各サブバンドに対するビット割り当てを計算し、量子化符号化手段166で決定したビット割り当てに従って量子化、符号化を行い、フレーム形成手段167で量子化符号化したサブバンド信号にヘッダや補助情報を追加し、ビットストリームに整形することで、新たなオーディオ符号として出力する。
【00107】
(第4の実施の形態)
以下、本発明の第4の実施の形態を図面に基づいて詳細に説明する。なお、上記実施の形態において既に記述したものと同一の部分については、同一符号を付し、重複した説明は省略する。図17は、符号圧縮を伴わない変換制御を実行する第4の実施の形態の機能ブロック図である。
【00108】
図17を参照すると、本実施の形態の画像・音声符号変換制御手段30は、ビデオ符号またはオーディオ符号の解析を行う符号解析処理手段171と間引き処理手段172を中心にして構成されている。
【00109】
本実施の形態の画像・音声符号変換制御手段30が実行する符号変換では、ビデオ符号またはオーディオ符号を復号することなくそのデータ内部情報を符号解析処理手段171にて解析して、データ(画像の場合は色、フレーム、画素など、また音声の場合はサンプリング周波数、1サンプル当たりのビット数、チャンネル数など)の間引き処理を間引き処理手段172にて行い、所望の低ビットレートへ変換した新たなビデオ符号またはオーディオ符号を出力する。
【00110】
なお、上記実施の形態では、キャプチャされたデータのみを対象として説明を行ったが、これに特に限定されることなく、デジタル放送等で使用されるデータ(特に、デジタル圧縮化済みのデータ)にも同様に適用でき、圧縮化済みデータのトランスコード化にも適用できる。当該デジタル放送等で使用されるデータ(特に、デジタル圧縮化済みのデータ)に適用する場合は、キャプチャの処理を符号圧縮化あるいはデータ変換の処理と読み変えればよい。また、本発明が上記実施の形態に限定されず、本発明の技術思想の範囲内において、上記実施の形態は適宜変更され得ることは明らかである。また上記構成部材の数、位置、形状等は上記実施の形態に限定されず、本発明を実施する上で好適な数、位置、形状等にすることができる。また、各図において、同一構成要素には同一符号を付している。
【00111】
【発明の効果】
本発明は以上のように構成されているので、以下に掲げる効果を奏する。まず第1の効果は、アプリケーションが処理しなくても、システムの負荷が上がったときに画像・音声符号圧縮化を自動的に容易に一時停止し、システムの負荷が下がったときに当該画像・音声符号圧縮化を再開するシステムを構築できることである。その理由は、符号圧縮化制御装置(不図示)に画像・音声の符号圧縮化の制御を集約して、アプリケーションが直接圧縮処理に関与しなくてもよいように構成したからである。
【00112】
そして第2の効果は、負荷が下がると直ちに符号圧縮化を再開できることである。その理由は、キャプチャ動作を止めずに圧縮を一時停止しているので、処理時間のかかるキャプチャデバイスの初期化や符号圧縮化のためのメモリ獲得・ファイルオープンを行わずに符号圧縮化を再開できるからである。
【図面の簡単な説明】
【図1】MPEGビデオに準拠した符号フォーマットの構成図である。
【図2】MPEGオーディオに準拠した符号フォーマットの構成図である。
【図3】MPEGシステムに準拠したビデオ符号・オーディオ符号の多重化フォーマットの構成図である。
【図4】画像圧縮を行うビデオ符号変換制御手段の構成図である。
【図5】音声圧縮を行うオーディオ符号変換制御手段の構成図である。
【図6】ビデオ符号とオーディオ符号を多重化する画像・音声符号変換制御手段の構造を示した図である。
【図7】本発明の第1の実施の形態に係る符号圧縮化/データ変換装置を説明するための機能ブロック図である。
【図8】アプリケーションが処理するキャプチャ符号圧縮化の一処理を説明するためのフローチャートである。
【図9】原画像受け渡し制御手段の一処理を説明するためのフローチャートである。
【図10】原音声受け渡し制御手段の一処理を説明するためのフローチャートである。
【図11】ビデオ符号変換制御手段の一処理を説明するためのフローチャートである。
【図12】オーディオ符号変換制御手段の一処理を説明するためのフローチャートである。
【図13】一時停止・再開制御手段の一処理を説明するためのフローチャートである。
【図14】図13で生成されたビデオ符号とオーディオ符号の一処理を説明する図である。
【図15】画像サイズを変換するビデオ符号変換を実行する第2の実施の形態の機能ブロック図である。
【図16】オーディオ符号変換を実行する第3の実施の形態の機能ブロック図である。
【図17】符号圧縮を伴わない変換制御を実行する第4の実施の形態の機能ブロック図である。
【符号の説明】
10…ビデオ符号変換制御手段
20…オーディオ符号変換制御手段
30…画像・音声符号変換制御手段
41…アプリケーション
42…インターフェース制御手段
43…ビデオキャプチャバッファ
44…ビデオ符号バッファ
45…システムバッファ
46…オーディオキャプチャバッファ
47…オーディオ符号バッファ
48…原画像受け渡し制御手段
49…原音声受け渡し制御手段
50…一時停止・再開制御手段
100…符号圧縮化/データ変換装置
151…復号化手段
152…逆量子化手段
153…逆DCT手段
154…画像サイズ変換手段
155…DCT手段
156…量子化手段
157…可変長符号化手段
161…フレーム分解手段
162…再構成手段
163…逆写像手段
164…音声周波数変換手段
165…周波数帯域写像手段
166…量子化符号化手段
167…フレーム形成手段
168…心理聴覚処理手段
171…符号解析処理手段
172…間引き処理手段

Claims (14)

  1. 複数のプログラムが動作できるシステム上で画像と音声、もしくはそれらのどちらかを符号圧縮化あるいはデータ変換し、リアルタイムに記録もしくは配信する符号圧縮化/データ変換装置であって、
    前記システム上で動作する所定のアプリケーションから供給された前記画像をビデオキャプチャバッファに格納し、前記音声をオーディオキャプチャバッファに格納するとともに、前記アプリケーションからの要求に応じて、前記画像および前記音声に対する符号圧縮化もしくはデータ変換動作を制御するインタフェース制御手段と、
    前記インタフェース制御手段による制御に従って前記画像および前記音声に対する符号圧縮化もしくはデータ変換動作を行う符号圧縮化手段と
    を備え、
    前記インタフェース制御手段は、前記ビデオキャプチャバッファへの前記画像の格納および前記オーディオキャプチャバッファへの前記音声の格納ができない場合には、前記符号圧縮化手段による前記画像および前記音声に対する前記符号圧縮化を一時停止させ、その後一定時間経過後、または前記システムの負荷が低下したとき、前記符号圧縮化手段による前記画像および前記音声に対する前記符号圧縮化もしくはデータ変換動作を再開させ
    前記符号圧縮化手段は、前記データ変換動作を再開させる際、前記一時停止時点までに
    符号圧縮化された画像が、符号圧縮化された音声よりも時間軸上進んでいる場合には、画
    像の符号圧縮化の開始を音声の符号圧縮化より遅らせ、符号圧縮化された音声が、符号圧
    縮化された画像よりも時間軸上進んでいる場合には、音声の符号圧縮化の開始を画像の符
    号圧縮化より遅らせる
    ことを特徴とする符号圧縮化/データ変換装置。
  2. 前記インタフェース制御手段は、前記ビデオキャプチャバッファへの前記画像の格納および前記音声の前記オーディオキャプチャバッファへの格納の少なくともいずれか一方が不可能となった場合、前記符号圧縮化手段に対して、前記画像および前記音声に対する前記符号圧縮化を一時停止させ、前記アプリケーションに対して前記要求に対する所定の応答を返す
    ことを特徴とする請求項1に記載の符号圧縮化/データ変換装置。
  3. 前記インタフェース制御手段は、前記システムの負荷が低下したとき、前記画像に関して現在までに符号圧縮化されたフレームの数をフレームレートで除算することによって第1の時間量を算出し、前記音声に関して現在までに符号圧縮化されたサンプルの数をサンプリング周波数で除算することによって第2の時間量を算出し、前記第1の時間量と前記第2の時間量との差を算出し、前記差と現在のキャプチャフレーム番号とから前記画像の符号圧縮化の再開フレーム番号を算出し、前記差と現在のキャプチャサンプル数とから前記音声の符号圧縮化の再開サンプル番号を算出する
    ことを特徴とする請求項1に記載の符号圧縮化/データ変換装置。
  4. 前記インタフェース制御手段は、前記アプリケーションからの前記要求により、前記符号圧縮化手段による前記画像および前記音声に対する前記符号圧縮化もしくはデータ変換動作を制御し、前記アプリケーションが直接符号圧縮化もしくはデータ変換処理に関与しなくてよいように、前記符号圧縮化もしくはデータ変換動作を集約して制御し、前記システムの負荷が上がり、前記ビデオキャプチャバッファへの前記画像の格納および前記音声の前記オーディオキャプチャバッファへの格納が不可能となった場合、前記符号圧縮化手段による前記画像および前記音声に対する前記符号圧縮化を一時停止させ、前記システムの負荷が低下したとき、前記符号圧縮化手段による前記画像および前記音声に対する前記符号圧縮化もしくはデータ変換動作を再開させ、前記アプリケーションからの制御を必要としないように構成されている
    ことを特徴とする請求項1乃至3のいずれか一項に記載の符号圧縮化/データ変換装置。
  5. 前記符号圧縮化手段は、前記画像に対して符号圧縮化を行うビデオ符号変換制御手段と、前記音声に対して符号圧縮化を行うオーディオ符号変換制御手段と、
    前記符号圧縮化された前記画像および前記音声に対して所定のシステム符号化を行う画像・音声符号変換制御手段とを有し、
    前記インタフェース制御手段は、前記アプリケーションからの要求に従って前記符号圧縮化手段を制御し、
    符号圧縮化もしくはデータ変換またはキャプチャした前記画像を一時的に格納するビデオキャプチャバッファと、
    前記ビデオ符号変換制御手段によって生成されたビデオ符号を一時的に格納するビデオ符号バッファと、
    前記符号圧縮化もしくはデータ変換またはキャプチャしたオーディオデータを一時的に格納するオーディオキャプチャバッファと、
    前記オーディオ符号変換制御手段によって生成されたオーディオ符号を一時的に格納するオーディオ符号バッファと、
    前記画像・音声符号変換制御手段によって生成されたシステム符号を一時的に格納するシステムバッファを有し、
    前記インターフェース制御手段は、
    符号圧縮化もしくはデータ変換またはキャプチャした原画像を前記ビデオ符号変換制御手段に渡す原画像受け渡し制御手段と、
    符号圧縮化もしくはデータ変換またはキャプチャした原音声を前記オーディオ符号変換制御手段に渡す原音声受け渡し制御手段と、
    符号圧縮化の一時停止と再開を行う一時停止・再開制御手段を有し、
    前記アプリケーションは、符号圧縮化もしくはデータ変換またはキャプチャした原画像と原音声を受け取って、前記インターフェース制御手段に渡して、前記インターフェース制御手段に渡されたシステム符号をシステム符号ファイルに書き込み、
    前記インターフェース制御手段は、符号圧縮化もしくはデータ変換またはキャプチャした原画像を前記ビデオキャプチャバッファに格納し、符号圧縮化もしくはデータ変換またはキャプチャした原音声を前記オーディオキャプチャバッファに格納し、前記ビデオ符号変換制御手段と前記オーディオ符号変換制御手段と前記画像・音声符号変換制御手段を制御し、生成された前記ビデオ符号は前記ビデオ符号バッファに格納され、生成された前記オーディオ符号は前記オーディオ符号バッファに格納され、生成された前記システム符号は前記システムバッファに格納され、前記システム符号を前記アプリケーションに渡す
    ことを特徴とする請求項4に記載の符号圧縮化/データ変換装置。
  6. 前記アプリケーションは、
    前記ビデオ符号のビデオキャプチャデバイスと前記オーディオ符号のオーディオキャプチャデバイスを初期化する第1工程を実行し、前記符号圧縮化手段に開始要求を出して必要なメモリを獲得させる第2工程を実行し、
    MPEG符号を記録するファイルをオープンする第3工程を実行し、
    前記ビデオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがあるかどうかを判断する第4工程を実行し、
    前記ビデオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがある場合は前記原画像受け渡し制御手段を呼び出す第5工程を実行し、
    前記ビデオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがない場合は前記オーディオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがあるかどうかを判断する第6工程を実行し、
    前記オーディオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがある場合は前記原音声受け渡し制御手段を呼び出す第7工程を実行し、
    前記オーディオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがない場合は前記システム符号があるかどうかを判断する第8工程を実行し

    前記オーディオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがある場合は前記システム符号を前記ファイルに書き込む第9工程を実行するとともに、前記オーディオキャプチャデバイスから符号圧縮化もしくはデータ変換またはキャプチャしたデータがない場合は符号圧縮化もしくはデータ変換またはキャプチャが終了したかどうかを判断する第10工程を実行し、
    前記符号圧縮化もしくはデータ変換またはキャプチャが終了していない場合は前記第4工程に戻り、
    前記符号圧縮化もしくはデータ変換またはキャプチャが終了した場合は前記ファイルをクローズする第11工程を実行するとともに、前記符号圧縮化手段に終了要求を出して獲得した前記メモリを解放させる第12工程を実行する
    ことを特徴とする請求項5に記載の符号圧縮化/データ変換装置。
  7. 前記原画像受け渡し制御手段は、
    キャプチャフレーム番号を加算する第21工程を実行するとともに、一時停止かどうかを判断する第22工程を実行し、前記一時停止でない場合は前記ビデオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能かどうかを判断する第26工程に進み、
    前記一時停止である場合は再開かどうかを判断する第23工程を実行するとともに、前記再開でない場合は所定応答を前記アプリケーションに返す第25工程に進み、
    前記再開である場合はキャプチャフレーム番号が再開フレーム番号以上であるかどうかを判断する第24工程を実行するとともに、前記キャプチャフレーム番号が再開フレーム番号以上でない場合は所定応答を前記アプリケーションに返す第25工程を実行して処理を終了し、
    前記キャプチャフレーム番号が再開フレーム番号以上である場合は前記ビデオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能かどうかを判断する第26工程を実行するとともに、前記キャプチャフレーム番号が再開フレーム番号以上でない場合は前記一時停止・再開制御手段を起動する第29工程に進み、
    前記ビデオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能である場合は符号圧縮化もしくはデータ変換またはキャプチャした原画像を前記ビデオキャプチャバッファに格納する第27工程を実行するとともに、前記ビデオ符号変換制御手段に符号圧縮化もしくはデータ変換またはキャプチャしたデータがあることを知らせる第28工程を実行し、
    第29工程に進んだ場合は前記一時停止・再開制御手段を起動する
    ことを特徴とする請求項5に記載の符号圧縮化/データ変換装置。
  8. 前記原音声受け渡し制御手段は、
    キャプチャサンプル番号を加算する第31工程を実行するとともに、一時停止かどうかを判断する第32工程を実行し、前記一時停止でない場合は前記オーディオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能かどうかを判断する第36工程に進み、
    前記一時停止である場合は再開かどうかを判断する第33工程を実行するとともに、前記再開でない場合は所定応答を前記アプリケーションに返す第35工程に進み、
    前記再開である場合はキャプチャサンプル番号が再開サンプル番号以上であるかどうかを判断する第34工程を実行するとともに、前記キャプチャサンプル番号が再開サンプル番号以上でない場合は所定応答を前記アプリケーションに返す第35工程を実行して処理を終了し、
    前記キャプチャサンプル番号が再開サンプル番号以上である場合は前記オーディオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能かどうかを判断する第36工程を実行するとともに、前記オーディオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能でない場合は前記一時停止・再開制御手段を起動する第39工程に進み、
    前記オーディオキャプチャバッファに符号圧縮化もしくはデータ変換またはキャプチャした原画像が格納可能である場合は符号圧縮化もしくはデータ変換またはキャプチャした原画像を前記オーディオキャプチャバッファに格納する第37工程を実行するとともに、前記ビデオ符号変換制御手段に符号圧縮化もしくはデータ変換またはキャプチャしたデータがあることを知らせる第38工程を実行し、
    前記第39工程に進んだ場合は前記一時停止・再開制御手段を起動する
    ことを特徴とする請求項5に記載の符号圧縮化/データ変換装置。
  9. 前記ビデオ符号変換制御手段は、
    前記ビデオキャプチャバッファに格納されたデータがあるかどうかを判断する第41工程を実行し、前記ビデオキャプチャバッファから原画像を取り出す第42工程を実行し、現在までに圧縮した圧縮フレーム数を加算する第43工程を実行し、原画像をビデオ圧縮する第44工程を実行し、生成したビデオ符号を前記ビデオ符号バッファに格納する第45工程を実行し、
    その後に、前記インターフェース制御手段から一時停止の要求があるかどうかを判断する第46工程を実行し、前記インターフェース制御手段から一時停止の要求がない場合は前記第41工程に戻り、
    前記インターフェース制御手段から一時停止の要求がある場合は前記インターフェース制御手段から再開の要求があるかどうかを判断する第47工程を実行するとともに、前記インターフェース制御手段から再開の要求がない場合は前記第47工程の先頭に戻り、
    前記インターフェース制御手段から再開の要求がある場合は圧縮終了かどうかを判断する第48工程を実行するとともに、前記再開の要求がない場合は前記第41工程に戻り、前記インターフェース制御手段から再開の要求がある場合は処理を終了する
    ことを特徴とする請求項5に記載の符号圧縮化/データ変換装置。
  10. 前記オーディオ符号変換制御手段は、
    前記オーディオキャプチャバッファに格納されたデータがあるかどうかを判断する第51工程を実行し、前記オーディオキャプチャバッファから原画像を取り出す第52工程を実行し、現在までに圧縮した圧縮サンプル数を加算する第53工程を実行し、原音声をオーディオ圧縮する第54工程を実行し、生成したオーディオ符号を前記オーディオ符号バッファに格納する第55工程を実行し、
    その後に、前記インターフェース制御手段から一時停止の要求があるかどうかを判断する第56工程を実行するとともに、前記インターフェース制御手段から一時停止の要求がない場合は前記第51工程に戻り、
    前記インターフェース制御手段から一時停止の要求がある場合は前記インターフェース制御手段から再開の要求があるかどうかを判断する第57工程を実行するとともに、前記インターフェース制御手段から再開の要求がない場合は前記第57工程の先頭に戻り、
    前記インターフェース制御手段から再開の要求がある場合は圧縮終了かどうかを判断する第58工程を実行し、前記圧縮終了でない場合は前記第51工程に戻り、前記圧縮終了である場合は処理を終了する
    ことを特徴とする請求項5に記載の符号圧縮化/データ変換装置。
  11. 前記一時停止・再開制御手段は、
    ビデオ圧縮を一時停止する第61工程を実行し、オーディオ圧縮を一時停止する第62工程を実行し、負荷が低下したかどうかを判断する第63工程を実行し、前記負荷が低下していない場合は前記第63工程に戻り、前記負荷が低下している場合は現在までに前記ビデオ符号変換制御手段が圧縮した圧縮フレーム数から前記第1の時間量を計算する第64工程を実行し、
    その後に、現在までに前記オーディオ符号変換制御手段が圧縮した圧縮サンプル数から前記第2の時間量を計算する第65工程を実行し、
    その後に、前記圧縮フレーム数と前記圧縮サンプル数から前記第1の時間量と前記第2の時間量の差を計算する第66工程を実行し、
    その後に、前記第1の時間量と前記第2の時間量の差と現在のキャプチャフレーム番号からビデオ圧縮(ビデオ符号圧縮化)の再開フレーム番号を計算する第67工程を実行し、
    その後に、前記第1の時間量と前記第2の時間量の差と現在のキャプチャサンプル数からオーディオ圧縮(オーディオ符号圧縮化)の再開サンプル番号を計算する第68工程を実行し、
    その後に、前記ビデオキャプチャバッファに格納された原画像を全て破棄する第69工程を実行し、ビデオ圧縮(ビデオ符号圧縮化)を再開する第70工程を実行し、前記オーディオキャプチャバッファに格納された原音声を全て破棄する第71工程を実行し、オーディオ圧縮(オーディオ符号圧縮化)を再開する第72工程を実行する
    ことを特徴とする請求項5に記載の符号圧縮化/データ変換装置。
  12. 前記インターフェース制御手段は、前記ビデオキャプチャバッファへの前記画像の格納または前記オーディオキャプチャバッファへの前記音声の格納が不可能となったとき、前記ビデオ符号変換制御手段と前記オーディオ符号変換制御手段を一時停止して、前記アプリケーションから渡されるビデオとオーディオのキャプチャデータを圧縮しないで、所定応答を前記アプリケーションに返し、ビデオ符号とオーディオ符号の時間量の差が少なくなるようにビデオ圧縮(ビデオ符号圧縮化)とオーディオ圧縮(オーディオ符号圧縮化)の再開時刻を変えて、リアルタイム符号圧縮化を再開する
    ことを特徴とする請求項6乃至11のいずれか一項に記載の符号圧縮化/データ変換装置。
  13. 前記インターフェース制御手段は、前記ビデオキャプチャバッファへの前記画像の格納または前記オーディオキャプチャバッファへの前記音声の格納が不可能となったとき、前記ビデオ符号変換制御手段と前記オーディオ符号変換制御手段を一時停止して、前記アプリケーションから渡される原画像と原音声を処理しないで、所定応答を返し、
    その後に、生成したビデオ符号とオーディオ符号の時間量の差を調べて、前記ビデオ符号の方が多い場合は差が少なくなるようにオーディオ圧縮(オーディオ符号圧縮化)の再開時刻を早め、前記ビデオ符号の方が少ない場合は差が少なくなるようにオーディオ圧縮(オーディオ符号圧縮化)の再開時刻を遅くする
    ことを特徴とする請求項12に記載の符号圧縮化/データ変換装置。
  14. 複数のプログラムが動作できるシステム上で画像と音声を符号圧縮化してリアルタイムで蓄積媒体に記録する符号圧縮化/データ変換方法であって、
    前記システム上で動作する所定のアプリケーションから供給された前記画像をビデオキャプチャバッファに格納し、前記音声をオーディオキャプチャバッファに格納するとともに、前記アプリケーションからの要求に応じて、前記画像および前記音声に対する符号圧縮化もしくはデータ変換動作を制御するインタフェース制御工程と、
    前記インタフェース制御工程における制御に従って前記画像および前記音声に対する符号圧縮化もしくはデータ変換動作を行う符号圧縮化工程と、
    ビデオキャプチャバッファへの前記画像の格納が不可能となったとき、符号圧縮化もしくはデータ変換またはキャプチャした画像データを圧縮しないでアプリケーションに所定応答を返す工程と、
    オーディオキャプチャバッファへの前記音声の格納が不可能となったとき、符号圧縮化もしくはデータ変換またはキャプチャした音声データを圧縮しないでアプリケーションに所定応答を返す工程と、
    前記システムの負荷が低下したとき、前記画像に関して現在までに符号圧縮化されたフレームの数をフレームレートで除算することによって第1の時間量を算出し、前記音声に関して現在までに符号圧縮化されたサンプルの数をサンプリング周波数で除算することによって第2の時間量を算出し、前記第1の時間量と前記第2の時間量との差を算出し、前記差と現在のキャプチャフレーム番号とから前記画像の符号圧縮化の再開フレーム番号を算出し、前記差と現在のキャプチャサンプル数とから前記音声の符号圧縮化の再開サンプル番号を算出し、ビデオ圧縮(ビデオ符号圧縮化)とオーディオ圧縮を再開する工程と、
    前記アプリケーションが直接圧縮処理に関与しなくてもよいように、画像圧縮処理を集約して処理するインターフェース制御工程を有し、
    前記インタフェース制御工程においては、他のプログラムの実行によりシステムの負荷が上がり、前記ビデオキャプチャバッファへの前記画像の格納および前記音声の前記オーディオキャプチャバッファへの格納の少なくともいずれか一方が不可能となった場合、前記画像および前記音声に対する前記符号圧縮化を一時停止させ、前記システムの負荷が低下したとき、前記画像および前記音声に対する前記符号圧縮化もしくはデータ変換動作を再開させ
    前記符号圧縮化工程においては、前記データ変換動作を再開させる際、前記一時停止時点までに符号圧縮化された画像が、符号圧縮化された音声よりも時間軸上進んでいる場合には、画像の符号圧縮化の開始を音声の符号圧縮化より遅らせ、符号圧縮化された音声が、符号圧縮化された画像よりも時間軸上進んでいる場合には、音声の符号圧縮化の開始を画像の符号圧縮化より遅らせる
    ことを特徴とする符号圧縮化/データ変換方法。
JP2000402099A 2000-12-28 2000-12-28 符号圧縮化/データ変換装置及び符号圧縮化/データ変換方法 Expired - Fee Related JP3671842B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000402099A JP3671842B2 (ja) 2000-12-28 2000-12-28 符号圧縮化/データ変換装置及び符号圧縮化/データ変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000402099A JP3671842B2 (ja) 2000-12-28 2000-12-28 符号圧縮化/データ変換装置及び符号圧縮化/データ変換方法

Publications (2)

Publication Number Publication Date
JP2002204451A JP2002204451A (ja) 2002-07-19
JP3671842B2 true JP3671842B2 (ja) 2005-07-13

Family

ID=18866444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000402099A Expired - Fee Related JP3671842B2 (ja) 2000-12-28 2000-12-28 符号圧縮化/データ変換装置及び符号圧縮化/データ変換方法

Country Status (1)

Country Link
JP (1) JP3671842B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4609209B2 (ja) * 2005-07-07 2011-01-12 株式会社デンソー 車載ナビゲーション装置
EP2012539A4 (en) 2006-03-27 2011-05-11 Nec Corp SYSTEM, METHOD AND PROGRAM FOR STORING MOBILE IMAGES
JP4943761B2 (ja) * 2006-07-25 2012-05-30 ソフトバンクモバイル株式会社 著作権管理方法及び通信端末装置
JP4944056B2 (ja) * 2008-03-24 2012-05-30 Necパーソナルコンピュータ株式会社 Av圧縮装置およびプログラム

Also Published As

Publication number Publication date
JP2002204451A (ja) 2002-07-19

Similar Documents

Publication Publication Date Title
US8260122B2 (en) MPEG picture data recording apparatus, MPEG picture data recording method, MPEG picture data recording medium, MPEG picture data generating apparatus, MPEG picture data reproducing apparatus, and MPEG picture data reproducing method
JP4515465B2 (ja) 動画撮影装置および動画撮影方法、記録媒体に記録された映像信号を再生する動画再生装置および動画再生方法
JP2003199045A (ja) 情報記録信号の生成方法、情報信号の再生方法、情報信号の伝送方法、情報記録信号生成装置、情報信号再生装置、情報信号伝送装置、情報信号記録媒体、及び情報信号伝送用プログラム
WO2006027880A1 (ja) 記録装置および方法、再生装置および方法、記録媒体、並びにプログラム
JP3578069B2 (ja) 長時間用画像・音声圧縮装置及びその方法
JP3671842B2 (ja) 符号圧縮化/データ変換装置及び符号圧縮化/データ変換方法
JP2000078531A (ja) オ―ディオデ―タ編集方法、編集システム
JP3748234B2 (ja) Mpegデータ記録方法
JPH08116532A (ja) 画像復号化方式および装置
JP2003052040A (ja) Mpegデータ再生装置
JP2000023090A (ja) 圧縮動画像編集装置および記憶媒体
JP3496714B2 (ja) 多重化装置、及び多重化方法
JP3166572B2 (ja) 動画像音声圧縮装置
JP3748243B2 (ja) Mpegデータ記録装置
JP3748240B2 (ja) Mpegデータ記録方法
JP3748241B2 (ja) Mpegデータ記録方法
JP3748242B2 (ja) Mpegデータ記録方法
JP3748245B2 (ja) Mpegデータ記録装置
JP3748244B2 (ja) Mpegデータ記録装置
JP2007325304A (ja) Mpegデータ記録再生方法
JP4192861B2 (ja) Mpeg画像データ記録装置及びmpeg画像データ記録方法
JP2008005520A (ja) Mpegデータ記録再生装置
JPH1093958A (ja) 動画像音声圧縮システム
JPH1093959A (ja) 動画像音声圧縮システム
JP2008005521A (ja) Mpegデータ記録再生方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050411

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080428

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090428

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100428

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110428

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120428

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120428

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120428

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120428

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120428

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120428

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130428

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130428

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees