JPH1175171A - マルチメディアデータ符号化多重化方法、マルチメディアデータ符号化多重化装置、およびマルチメディアデータ符号化多重化プログラム記録媒体 - Google Patents

マルチメディアデータ符号化多重化方法、マルチメディアデータ符号化多重化装置、およびマルチメディアデータ符号化多重化プログラム記録媒体

Info

Publication number
JPH1175171A
JPH1175171A JP9308682A JP30868297A JPH1175171A JP H1175171 A JPH1175171 A JP H1175171A JP 9308682 A JP9308682 A JP 9308682A JP 30868297 A JP30868297 A JP 30868297A JP H1175171 A JPH1175171 A JP H1175171A
Authority
JP
Japan
Prior art keywords
information
video
encoded
audio
multimedia
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9308682A
Other languages
English (en)
Inventor
Aki Yoneda
亜旗 米田
Takao Matsumoto
孝夫 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP9308682A priority Critical patent/JPH1175171A/ja
Publication of JPH1175171A publication Critical patent/JPH1175171A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams

Abstract

(57)【要約】 【課題】 映像・音声双方の符号化をマルチタスクオペ
レーティングシステム上で動作するソフトウエアプログ
ラムとして実現し、指定した任意の単位で同期した映像
音声符号化多重化情報を得られるようにする。 【解決手段】 符号化映像情報と符号化音声情報を、映
像バッファリング手段108と音声バッファリング手段
104とに一時的に蓄積し、符号化映像情報に基づいて
作成され、共に一時蓄積された映像ブロックレート情報
を用いて、映像音声同期手段110が時間情報を作成
し、これに従って、符号化映像読み出し手段115と符
号化音声読み出し手段113とが、一時的に蓄積された
符号化音声情報と符号化映像情報とを読み出すことで、
符号化するタイミングと多重化タイミングを分離する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はマルチメディアデー
タ符号化多重化方法、マルチメディアデータ符号化多重
化装置、およびマルチメディアデータ符号化多重化プロ
グラム記録媒体に関し、特にオペレーティングシステム
を有するコンピュータシステムにより、映像、及び音声
を含むマルチメディアデータがデジタル化され、符号化
され、時分割多重化されたマルチメディアデータ符号化
多重化情報を得るマルチメディアデータ符号化多重化方
法、マルチメディアデータ符号化多重化装置、及びマル
チメディアデータ符号化多重化プログラム記録媒体に関
する。
【0002】
【従来の技術】近年のデジタル技術の発達により、従来
ではアナログの形でしか扱えなかった、マルチメディア
データ、すなわちビデオ映像のように映像と音声とを含
んでいる情報であっても、デジタル化、圧縮符号化、お
よび多重化の処理を行うことによりデジタル情報を得
て、これを記録、伝送などに用いることができるように
なってきた。かかる処理によって得られる符号化マルチ
メディアデータ多重化情報、例えば映像音声多重化情報
は、システムストリームなどと呼ばれ、通常、デジタル
化され符号化、及び圧縮化された映像情報の部分と、デ
ジタル化され符号化、及び圧縮化された音声情報の部分
とが、ある単位で交互にならべられた一次元の配列とな
っている。
【0003】図27に、かかる映像音声符号化多重化情
報の一例を示す。図中、2101は映像シーケンスヘッ
ダで、この後に符号化された映像情報が続くことを示
す。2102は符号化映像情報で、符号化(圧縮化)さ
れた映像情報であり、これを逆符号化(伸長化)する
と、ある再生時間を持つ映像となる。2103は音声シ
ーケンスヘッダで、この後に符号化された音声情報が続
くことを示す。2104は符号化音声情報で、符号化
(圧縮化)された音声情報であり、これを逆符号化(伸
長化)すると、ある再生時間を持つ音声となる。このよ
うな符号化映像音声多重化情報は、「時分割多重化され
た情報」とも呼ばれ、かかる情報を得るための処理を符
号化処理及び多重化処理という。
【0004】このような符号化映像音声多重化情報を再
生するための装置は、再生時の映像と音声の同期のため
に、同時に再生しなければならない映像情報と音声情報
をいったんバッファに蓄積し、両者が揃ったところで、
両者を逆符号化し、再生するのが普通である。したがっ
て、再生装置の内部バッファの量が有限であることか
ら、図27の符号化映像情報2102、及び符号化音声
情報2104は、再生装置のバッファの大きさの許す範
囲の量で交互に並べられていなければならない。すなわ
ち、再生装置の内部バッファが0.1秒分しか無いので
あれば、符号化映像情報2102、及び符号化音声情報
2104は、少なくとも再生時間が0.1秒以下の単位
で交互に並べられていなければならない。また、再生装
置の構成によっては、交互に並べられた映像と音声が、
それぞれ再生時間がちょうど同時間になるような量で並
べられなければならないという場合もある。
【0005】映像および音声を符号化し、上記したよう
な符号化映像音声多重化情報を出力する装置の従来技術
による例を、図を用いて説明する。図26は、従来技術
による音声付き映像符号化多重化装置の構成を示す図で
ある。図示するように、この装置は、映像音声入力手段
2001、音声キャプチャ手段2002、音声符号化手
段2003、符号化音声格納手段2004、映像キャプ
チャ手段2005、映像符号化手段2006、符号化映
像格納手段2007、およびファイル管理手段2008
を備えたものである。
【0006】同図において、2001はビデオカメラ等
で実現される映像音声入力手段であり、映像・音声を取
り込み、アナログ音声情報とアナログ映像情報とに分け
て出力するものである。2002は音声キャプチャ手段
であり、映像音声入力手段2001から出力されたアナ
ログ音声情報を入力し、離散的なデジタルデータからな
るデジタル音声情報として出力するものである。200
3は音声符号化手段であり、音声キャプチャ手段200
2より出力されたデジタル音声情報を入力し、冗長な情
報を除いて符号化することで圧縮し、符号化音声情報と
して、単位時間ごとに出力するものである。本例では、
上記単位時間を0.1秒とする。2004は符号化音声
格納手段であり、音声符号化手段2003より符号化音
声情報が出力された時、上記情報に音声シーケンスヘッ
ダを付加し、ファイル管理手段2008に出力するもの
である。2005は映像キャプチャ手段であり、映像音
声入力手段2001から出力されたアナログ映像情報を
入力し、離散的なデジタルデータからなり、単位時間毎
の静止画像を表す複数の静止画像情報からなるデジタル
映像情報として出力するものである。2006は映像符
号化手段であり、映像キャプチャ手段2005より出力
されたデジタル映像情報を入力し、冗長な情報を除いて
符号化することで圧縮し、符号化映像情報として出力す
るものである。本例では、符号化映像情報は、個々の静
止画像の単位で出力するとする。静止画像は30分の1
秒ごとに存在するとするので、符号化映像情報が出力さ
れる単位時間は、30分の1秒である。2007は符号
化映像格納手段であり、映像符号化手段2006より符
号化映像情報が出力された時、上記情報に映像シーケン
スヘッダを付加し、ファイル管理手段2008に出力す
るものである。2008はファイル管理手段であり、入
力された情報を保存用記憶装置上のファイルに書き加え
ていくものである。
【0007】ここでは、従来の技術による映像音声符号
化多重化装置によって得られる、符号化映像音声多重化
情報は、図27に示すようなものであり、後の再生時の
ために、先述のような、交互に並べられた映像と音声
が、それぞれ再生時間がちょうど同時間になるような量
で並べられたものであり、また、それぞれの再生時間が
0.1秒以下であるものとする。
【0008】図28は、従来の技術による映像音声符号
化多重化装置を、情報の流れを主体に説明するための図
である。図中2001は図26の映像音声入力手段とし
て用いられるビデオカメラであり、他の符号は図26と
同じである。従来の技術による映像音声符号化多重化装
置の動作を以下に図28を用いて説明する。
【0009】まず、ビデオカメラ2001が映像・音声
をとりこみ、アナログ音声情報とアナログ映像情報とに
分けて出力する。そして、音声キャプチャ手段2002
は、ビデオカメラ2001より出力されたアナログ音声
情報を入力し、デジタル音声情報として出力する。一
方、映像キャプチャ手段2005は、ビデオカメラ20
01より出力されたアナログ映像情報を入力し、デジタ
ル映像情報として出力する。
【0010】映像符号化手段2006は、映像キャプチ
ャ手段2005より出力されたデジタル映像情報を入力
し、符号化して圧縮して、一枚の静止画像の符号化映像
情報として出力し、符号化映像格納手段2007は、こ
の符号化映像情報の先頭に映像シーケンスヘッダを付与
して、出力する。ファイル管理手段2008は、符号化
映像格納手段2007が出力するシーケンスヘッダ付き
の符号化映像情報を、保存用記録装置のファイルに格納
する。
【0011】従来の技術による映像音声符号化多重化装
置は、上記の映像符号化手段2006による符号化か
ら、ファイル管理手段2008によるファイルへの格納
までの動作を3回繰り返す。符号化映像情報は30分の
1秒の単位で出力されるので、3回繰り返したところで
経過時間は0.1秒(10分の1秒)である。
【0012】ここで、音声符号化手段2003は、先に
音声キャプチャ手段2002から出力されたデジタル音
声情報を入力し、符号化して圧縮して、0.1秒分の符
号化音声情報として出力し、符号化音声格納手段200
4は、この符号化音声情報の先頭に音声シーケンスヘッ
ダを付与して、出力する。ファイル管理手段2008
は、符号化音声格納手段2004が出力するシーケンス
ヘッダ付きの符号化音声情報を、ファイルに格納する。
【0013】ビデオカメラ2001からの映像・音声の
入力が続く間は、上記の処理が適宜繰り返され、これに
より、図27に示すような、符号化映像情報、及び符号
化音声情報がそれぞれ0.1秒である符号化映像音声多
重化情報として、保存用記憶装置に格納するなど、記録
・伝送を行うことができる。
【0014】
【発明が解決しようとする課題】従来技術による映像音
声符号化多重化装置は、前述の具体例で説明したよう
に、音声及び映像の符号化に際しては、それぞれの符号
化手段が完全に独立して動作し、それぞれいつも一定の
タイミングで、符号化情報を出力するものであった。す
なわち、前述の具体例によれば、映像符号化手段は常に
30分の1秒に一回符号化映像情報を出力し、音声符号
化手段は常に10分の1秒に一回符号化音声情報を出力
していた。
【0015】すなわち、特に映像と音声の同期のための
特別な手段を用いなくても、出力される符号化情報を順
にファイルに付加していくだけで、映像と音声が同一の
再生時間(この場合10分の1秒)の単位で交互に並べ
られた符号化映像音声多重化情報が得られた。このこと
を実現するため、従来技術では、音声、映像の符号化手
段としては、それぞれ独立して動作する専用ハードウエ
アを用いる必要があった。従って、専用ハードウエアを
用いず、汎用CPUを用いたマルチタスクオペレーティ
ングシステム上で動作するソフトウエアプログラムとし
て音声、映像の符号化手段を実現することは、上記のよ
うな従来技術の単純な応用によっては、きわめて困難な
こととなる。
【0016】なぜなら、マルチタスクオペレーティング
システム上では、複数のプログラム(タスク)が並列し
て動作している際に、各プログラムが実行されるタイミ
ングについては、オペレーティングシステムが行うスケ
ジューリングや、デバイスドライバ等が発生させる割り
込み等によって決定されるものであり、映像符号化手
段、及び音声符号化手段からの要求に応じて均等に割り
当てられる保証はなく、上記のような一定の動作を常に
望むことはできない。
【0017】例えば、音声キャプチャ手段と映像キャプ
チャ手段とを構成するデバイスドライバに対して、音声
キャプチャ手段が発生させる割り込みに対する優先度
が、映像キャプチャ手段が発生させる割り込みに対する
優先度よりも勝るものとなっていた場合には、ある期間
において音声符号化処理が映像符号化処理より優先的に
実行されることもあり得ることとなる。
【0018】図29は、かかる問題点を説明するための
図であり、上述のようなシステムにおいて、従来の技術
による映像音声符号化多重化装置を実現した場合に、処
理の結果得られる符号化多重化情報の一例を示すもので
ある。同図においては、映像と音声とのビットレート、
すなわち単位時間当たりの量は常に同じであるものとし
て、両者の再生時間の割合を示すものである。同図のA
区間においては、音声に対する符号化処理が優先的に行
われ、音声情報の再生時間の方が多いものとなっている
のに比べ、B区間においては、A区間における処理を埋
め合わせるべく、映像符号化処理が行われたために映像
情報の再生時間が多いものとなっている。同図に示す多
重化情報では、全体として映像と音声との多重化が不均
衡なものとなってしまっているため、映像・音声双方に
対しての再生バッファを、相当に余裕のある量だけ有す
る再生装置でなければ処理が困難なものとなり、映像・
音声とぎれのような現象をひきおこす原因となり得るも
のとなる。
【0019】さらに、マルチタスクオペレーティングシ
ステム上では、両符号化手段以外にもさまざまなプログ
ラムが常駐され動作しているので、かりに、映像及び音
声の符号化手段への割り当てを均等に行えるように計ら
ったとしても、なお、問題は残る。例えば、上記の例の
ように、音声符号化手段が常に10分の1秒分の符号化
音声情報を出力することを期待されているとき、符号化
手段以外のプログラムがCPUの動作時間を長期に渡り
消費してしまい、音声符号化手段にCPUの動作時間が
渡された時には、前回動作した時間から1秒の時間がた
ってしまったとする。この場合、音切れを防ぐために1
秒分のデジタル音声情報をバッファリングしたとして
も、出力される符号化音声情報は、1秒分の固まりとな
ってしまい、これを上記の従来例に示した構成で符号化
映像音声多重化情報にすると、0.1秒の単位で映像と
音声が交互に並べられていなければならないところに、
1秒分の音声が並んでしまうことになる。このことは、
例えば、符号化映像音声多重化情報の再生装置のバッフ
ァが0.1秒分しかなかった時、バッファがあふれて映
像と音声とが途切れるといったような、致命的な結果を
生む。
【0020】図30はこのような問題点を説明するため
の図であり、上述のようなシステムにおいて、従来の技
術による映像音声符号化多重化装置を実現した場合に、
処理の結果得られる符号化多重化情報の一例を示すもの
である。同図のA区間に示されるように、符号化音声情
報と符号化映像情報とが、十分に短い時間間隔で処理さ
れた区間を示す。ところが、B区間では当該区間の始め
に他のプログラム等、すなわち映像・音声符号化処理以
外のプロセスが実行されていたために、映像・音声の符
号化情報の時間間隔が大きなものとなってしまってお
り、上述のような問題の原因となる多重化情報となって
しまっていることを示す。
【0021】また、マルチタスクオペレーティングシス
テム上に、符号化手段以外にプログラムが常駐していな
い時であっても、問題が発生する可能性がある。一般的
に、CPUの動作が別のプログラム(タスク)に切り替
わる時には、なんらかのタスク切り替えのための作業が
必要となる。この作業時間の占める割合は、タスク切り
替えが頻繁に行われれば行われるほど増大し、トータル
での性能低下を招く。したがって、映像と音声とを細か
く交互に並べた符号化映像音声多重化情報を得ようとす
ると、従来例の構成では、音声符号化手段と映像符号化
手段とを頻繁にタスク切り替えしなければならず、タス
ク切り替えの作業時間により性能低下を招き、結果的に
タスク切り替えの時間までに符号化処理が間に合わず、
映像や音途切れの原因となる可能性がある。
【0022】本発明は、上記の問題に鑑みてなされたも
のであり、映像と音声の両者の符号化をマルチタスクオ
ペレーティングシステム上で動作するソフトウエアプロ
グラムとして実現し、かつ、任意の単位で符号化映像情
報と符号化音声情報とが交互に並べられた符号化映像音
声多重化情報を得ることのできる映像音声符号化多重化
方法を提供することを目的とする。
【0023】また、本発明は、映像と音声の両者の符号
化手段をマルチタスクオペレーティングシステム上で動
作するソフトウエアプログラムとして実現し、かつ、任
意の単位で符号化映像情報と符号化音声情報とが交互に
並べられた符号化映像音声多重化情報を得ることのでき
る映像音声符号化多重化装置を提供することを目的とす
る。
【0024】また、本発明は、マルチタスクオペレーテ
ィングシステムを有するコンピュータシステムにおい
て、映像と音声の両者の符号化をソフトウエアプログラ
ムによって行い、かつ、任意の単位で符号化映像情報と
符号化音声情報とが交互に並べられた符号化映像音声多
重化情報を得ることのできる映像音声符号化多重化プロ
グラムの記録媒体を提供することを目的とする。
【0025】
【課題を解決するための手段】上記目的を達成するため
に、請求項1にかかるマルチメディアデータ符号化多重
化方法は、デジタル化された映像、及びデジタル化され
た音声を含むデジタルマルチメディアデータが、符号化
され、時分割多重化されたマルチメディアデータ符号化
多重化情報を得るマルチメディアデータ符号化多重化方
法において、上記デジタル化された、デジタルマルチメ
ディアデータを符号化して、その再生時間がTであり、
その量がVである符号化マルチメディア情報を生成し、
上記再生時間T、および上記量Vに基づいてブロックレ
ート情報を生成するマルチメディアデータ符号化ステッ
プと、上記マルチメディアデータ符号化ステップにおい
て生成された上記符号化マルチメディア情報と、上記ブ
ロックレート情報とを、一時蓄積用記憶手段に一時蓄積
する符号化マルチメディア情報バッファリングステップ
と、上記一時蓄積されたブロックレート情報を用いて取
得される、上記時分割多重化における時間間隔を示す同
期間隔時間情報に対応する量の、上記一時蓄積された符
号化マルチメディア情報を読み出す符号化マルチメディ
ア情報読み出しステップと、上記符号化マルチメディア
読み出しステップにおいて読み出された符号化マルチメ
ディア情報に対して、多重化処理を行ってマルチメディ
アデータ符号化多重化情報を生成する符号化マルチメデ
ィア情報同期ステップとを含むものである。
【0026】また、請求項2にかかるマルチメディアデ
ータ符号化多重化方法は、請求項1の方法において、上
記符号化マルチメディア情報バッファリングステップで
は、上記一時蓄積用記憶手段をリングバッファとして上
記一時蓄積するものであり、上記符号化マルチメディア
情報読み出しステップでは、上記一時蓄積用記憶手段を
リングバッファとして上記読み出しを行い、上記読み出
した符号化マルチメディア情報を削除するものである。
【0027】また、請求項3にかかるマルチメディアデ
ータ符号化多重化方法は、請求項1または2の方法にお
いて、上記符号化マルチメディア情報同期ステップで
は、上記ブロックレート情報に含まれる、上記再生時間
Tを、上記同期間隔時間情報とし、これを上記符号化マ
ルチメディア情報読み出しステップに出力するものであ
る。
【0028】また、請求項4にかかるマルチメディアデ
ータ符号化多重化方法は、請求項1ないし3のいずれか
の方法において、上記マルチメディアデータ符号化ステ
ップでは、上記ブロックレート情報として、上記符号化
マルチメディア情報の単位時間相当量を表す符号化マル
チメディア情報単位時間量を生成するものであり、上記
符号化マルチメディア情報読み出し手段は、上記符号化
マルチメディア情報単位時間量に基づいて、上記読み出
す量を決定するものである。
【0029】また、請求項5にかかるマルチメディアデ
ータ符号化多重化方法は、デジタル化された映像、及び
デジタル化された音声を含むデジタルマルチメディアデ
ータが、符号化され、時分割多重化されたマルチメディ
アデータ符号化多重化情報を得るマルチメディアデータ
符号化多重化方法において、上記デジタル化された、デ
ジタルマルチメディアデータを符号化して、その再生時
間がTであり、その量がVである符号化マルチメディア
情報を生成するマルチメディアデータ符号化ステップ
と、設定された単位再生時間に対応する符号化マルチメ
ディア情報の量を示す符号化マルチメディア情報単位量
を用いて、上記マルチメディアデータ符号化ステップに
おいて生成された符号化マルチメディア情報に対して、
上記符号化マルチメディア情報単位量ごとに分割して一
時蓄積用記憶手段に一時蓄積する符号化マルチメディア
情報バッファリングステップと、上記一時蓄積された符
号化マルチメディア情報を読み出して、マルチメディア
データ符号化多重化情報を生成する符号化マルチメディ
ア情報同期ステップとを含むものである。
【0030】また、請求項6にかかるマルチメディアデ
ータ符号化多重化方法は、請求項5の方法において、上
記マルチメディアデータ符号化ステップは、映像がデジ
タル化された、複数の静止画像情報からなる原映像情報
を符号化処理し、再生時間がTvであり、量がVvであ
る符号化映像情報を生成する映像符号化ステップと、音
声がデジタル化された原音声情報を符号化処理し、再生
時間がTaであり、量がVaである符号化音声情報を生
成する音声符号化ステップとを含むものであり、上記マ
ルチメディアバッファリングステップは、上記再生時間
Tvに基づいて定められる再生時刻情報と、上記符号化
マルチメディア単位量の上記符号化映像情報とを、上記
一時蓄積用記憶手段上にすでに一時蓄積された符号化音
声情報同士の間隙部位が存在すれば当該間隙部位に、上
記間隙部位が存在しなければ直前に一時蓄積された符号
化音声情報に後続し、符号化音声情報の上記単位量分に
相当するだけ間隙をおいた部位に一時蓄積する映像バッ
ファリングステップと、上記再生時間Taに基づいて定
められる再生時刻情報と、上記符号化マルチメディア単
位量の上記符号化音声情報とを、上記一時蓄積用記憶手
段上にすでに一時蓄積された符号化映像情報同士の間隙
部位が存在すれば当該間隙部位に、上記間隙部位が存在
しなければ直前に一時蓄積された符号化映像情報に後続
し、符号化映像情報の上記単位量分に相当するだけ間隙
をおいた部位に一時蓄積する音声バッファリングステッ
プとを含むものであり、上記符号化マルチメディア同期
ステップでは、上記一時蓄積用記憶手段において、上記
符号化映像情報、および上記符号化音声情報が間隙なく
一時蓄積された部分を読み出すものである。
【0031】また、請求項7にかかるマルチメディアデ
ータ符号化多重化方法は、請求項5または6の方法にお
いて、上記符号化マルチメディア情報バッファリングス
テップでは、上記一時蓄積用記憶手段をリングバッファ
として上記一時蓄積するものであり、上記符号化マルチ
メディア情報読み出しステップでは、上記一時蓄積用記
憶手段をリングバッファとして上記読み出しを行い、上
記読み出した符号化マルチメディアデータを削除するも
のである。
【0032】また、請求項8にかかるマルチメディアデ
ータ符号化多重化方法は、請求項5ないし7のいずれか
の方法において、上記一時蓄積用記憶手段上で、ある再
生時刻に再生すべき符号化音声情報を蓄積した位置であ
る音声蓄積位置と、当該再生時刻において再生すべき符
号化映像情報を蓄積した映像蓄積位置との差を蓄積位置
誤差として検出する蓄積位置誤差検出処理と、上記誤差
検出処理によって検出した蓄積位置誤差を補正する蓄積
位置誤差補正処理とを、定められた時間間隔をおいて行
う蓄積位置誤差補正ステップをさらに備えたものであ
る。
【0033】また、請求項9にかかるマルチメディアデ
ータ符号化多重化方法は、請求項8の方法において、上
記蓄積位置誤差補正ステップの上記蓄積位置誤差補正処
理では、上記一時蓄積用記憶手段において、所定の符号
化マルチメディア情報を蓄積することにより行うもので
ある。
【0034】また、請求項10にかかるマルチメディア
データ符号化多重化方法は、請求項8の方法において、
上記蓄積位置誤差補正ステップの上記蓄積位置誤差補正
処理では、上記一時蓄積用記憶手段を一時的に拡大す
る、追加蓄積位置を設定することにより行うものであ
る。
【0035】また、請求項11にかかるマルチメディア
データ符号化多重化方法は、請求項1ないし10のいず
れかの方法において、上記符号化マルチメディア情報バ
ッファリングステップにおいて、一時蓄積した符号化マ
ルチメディア情報の量が一定量を超えた場合に、上記一
時蓄積した符号化マルチメディアデータ量に基づいて、
ダミー情報挿入時間を算出し、上記符号化マルチメディ
ア情報バッファリングステップと、後述するダミー情報
挿入ステップとに出力する途切れ防止ステップと、上記
ダミー情報挿入時間が入力された場合、上記ダミー情報
挿入時間に相当する量の符号化マルチメディア情報を生
成し、上記符号化マルチメディア情報バッファリングス
テップにおいて一時蓄積されるように出力するダミー情
報挿入ステップとをさらに備え、上記符号化マルチメデ
ィア情報バッファリングステップでは、上記ダミー情報
挿入時間が入力された場合、上記マルチメディアデータ
符号化ステップにおいて生成される上記符号化マルチメ
ディア情報を、上記ダミー情報挿入時間に相当する量だ
け、一時蓄積せずに廃棄するものである。
【0036】また、請求項12にかかるマルチメディア
データ符号化多重化方法は、請求項1ないし11のいず
れかの方法において、上記符号化マルチメディア情報バ
ッファリングステップにおいて、一時蓄積した符号化マ
ルチメディア情報の量が一定量を超えた場合に、上記一
時蓄積した符号化マルチメディアデータ量に基づいて、
ダミー情報挿入時間を算出し、上記符号化マルチメディ
アデータ符号化ステップと、後述するダミー情報挿入ス
テップとに出力する途切れ防止ステップと、上記ダミー
情報挿入時間が入力された場合、上記ダミー情報挿入時
間に相当する符号化マルチメディア情報を、上記符号化
マルチメディアバッファリングステップにおいて一時蓄
積されるように出力するダミー情報挿入ステップとをさ
らに備え、上記マルチメディアデータ符号化ステップで
は、上記ダミー情報挿入時間が入力された場合、当該ダ
ミー情報挿入時間に相当する量のデジタルマルチメディ
アデータを符号化せずに廃棄するものである。
【0037】また、請求項13にかかるマルチメディア
データ符号化多重化方法は、請求項11の方法におい
て、上記マルチメディアデータ符号化ステップでは、上
記デジタルマルチメディアデータに対して、単独で復号
処理をすることができる独立符号化情報と、他の符号化
マルチメディア情報を参照することにより復号処理をす
ることができる差分符号化情報とを生成する符号化処理
を行い、上記独立符号化情報と、上記差分符号化情報と
からなる上記符号化マルチメディア情報を生成するもの
であり、上記符号化マルチメディア情報バッファリング
ステップでは、上記ダミー情報挿入時間に相当する量の
符号化マルチメディア情報を一時蓄積せずに廃棄した
後、後続の上記差分符号化情報を、上記独立符号化情報
に変換して一時蓄積するものである。
【0038】また、請求項14にかかるマルチメディア
データ符号化多重化方法は、請求項12の方法におい
て、上記マルチメディアデータ符号化ステップでは、上
記デジタルマルチメディアデータに対して、単独で復号
処理をすることができる独立符号化情報と、他の符号化
マルチメディア情報を参照することにより復号処理をす
ることができる差分符号化情報とを生成する符号化処理
を行い、上記独立符号化情報と、上記差分符号化情報と
からなる上記符号化マルチメディア情報を生成するもの
であり、上記途切れ防止ステップでは、上記一時蓄積量
に基づいて決定されるダミー情報挿入時間を算出した
後、上記マルチメディアデータ符号化ステップにおい
て、符号化せずに廃棄されるデジタルマルチメディアデ
ータに後続する、上記差分符号化情報とされるべきデジ
タルマルチメディアデータの符号化処理に相当する時間
である挿入修正時間を算出し、上記ダミー情報挿入時間
に対して、上記挿入修正時間の加算処理による修正を行
うものである。
【0039】また、請求項15にかかるマルチメディア
データ符号化多重化方法は、請求項1ないし14のいず
れかの方法において、当該符号化多重化処理を実行する
装置自体の性能を判定し、上記判定の結果に従って、上
記符号化マルチメディア情報バッファリング手段の用い
る一時蓄積用記憶手段手段の量を決定する、バッファ量
決定ステップをさらに備えたものである。
【0040】また、請求項16にかかるマルチメディア
データ符号化多重化装置は、デジタル化された映像、及
びデジタル化された音声を含むデジタルマルチメディア
データが、符号化され、時分割多重化されたマルチメデ
ィアデータ符号化多重化情報を得るマルチメディアデー
タ符号化多重化装置において、情報を記憶するものであ
り、情報の一時的な蓄積に用いられる一時蓄積用記憶手
段と、上記デジタル化された、デジタルマルチメディア
データを符号化して、その再生時間がTであり、その量
がVである符号化マルチメディア情報を生成し、上記再
生時間T、および上記量Vに基づいてブロックレート情
報を生成するマルチメディアデータ符号化手段と、上記
マルチメディアデータ符号化手段において生成された上
記符号化マルチメディア情報と、上記ブロックレート情
報とを、上記一時蓄積用記憶手段に一時蓄積する符号化
マルチメディア情報バッファリング手段と、上記一時蓄
積されたブロックレート情報を用いて取得される、上記
時分割多重化における時間間隔を示す同期間隔時間情報
に対応する量の、上記一時蓄積された符号化マルチメデ
ィア情報を読み出す符号化マルチメディア情報読み出し
手段と、上記符号化マルチメディア読み出し手段におい
て読み出された符号化マルチメディア情報に対して、上
記ブロックレート情報に基づいて取得される上記再生時
刻情報を付与し、多重化処理を行ってマルチメディアデ
ータ符号化多重化情報を生成する符号化マルチメディア
情報同期手段とを備えたものである。
【0041】また、請求項17にかかるマルチメディア
データ符号化多重化装置は、デジタル化された映像、及
びデジタル化された音声を含むデジタルマルチメディア
データが、符号化され、時分割多重化されたマルチメデ
ィアデータ符号化多重化情報を得るマルチメディアデー
タ符号化多重化装置において、情報を記憶するものであ
り、情報の一時的な蓄積に用いられる一時蓄積用記憶手
段と、上記デジタル化された、デジタルマルチメディア
データを符号化して、その再生時間がTであり、その量
がVである符号化マルチメディア情報を生成するマルチ
メディアデータ符号化手段と、設定された単位再生時間
に対応する符号化マルチメディア情報の量を示す符号化
マルチメディア情報単位量を用いて、上記マルチメディ
アデータ符号化手段において生成された符号化マルチメ
ディア情報に対して、上記符号化マルチメディア情報単
位量ごとに分割して一時蓄積用記憶手段に一時蓄積する
符号化マルチメディア情報バッファリング手段と、上記
一時蓄積された符号化マルチメディア情報を読み出し
て、マルチメディアデータ符号化多重化情報を生成する
符号化マルチメディア情報同期手段とを備えたものであ
る。
【0042】また、請求項18にかかるマルチメディア
データ符号化多重化プログラム記録媒体は、デジタル化
された映像、及びデジタル化された音声を含むデジタル
マルチメディアデータが、符号化され、時分割多重化さ
れたマルチメディアデータ符号化多重化情報を得るマル
チメディアデータ符号化多重化プログラムを記録したプ
ログラム記録媒体において、上記デジタル化された、デ
ジタルマルチメディアデータを符号化して、その再生時
間がTであり、その量がVである符号化マルチメディア
情報を生成し、上記再生時間T、および上記量Vに基づ
いてブロックレート情報を生成するマルチメディアデー
タ符号化ステップと、上記マルチメディアデータ符号化
ステップにおいて生成された上記符号化マルチメディア
情報と、上記ブロックレート情報とを、一時蓄積用記憶
手段に一時蓄積する符号化マルチメディア情報バッファ
リングステップと、上記一時蓄積されたブロックレート
情報を用いて取得される、上記時分割多重化における時
間間隔を示す同期間隔時間情報に対応する量の、上記一
時蓄積された符号化マルチメディア情報を読み出す符号
化マルチメディア情報読み出しステップと、上記符号化
マルチメディア読み出しステップにおいて読み出された
符号化マルチメディア情報に対して、上記ブロックレー
ト情報に基づいて取得される上記再生時刻情報を付与
し、多重化処理を行ってマルチメディアデータ符号化多
重化情報を生成する符号化マルチメディア情報同期ステ
ップとを含むマルチメディアデータ符号化多重化プログ
ラムを記録したものである。
【0043】また、請求項19にかかるマルチメディア
データ符号化多重化プログラム記録媒体は、デジタル化
された映像、及びデジタル化された音声を含むデジタル
マルチメディアデータが、符号化され、時分割多重化さ
れたマルチメディアデータ符号化多重化情報を得るマル
チメディアデータ符号化多重化プログラムを記録したプ
ログラム記録媒体において、上記デジタル化された、デ
ジタルマルチメディアデータを符号化して、その再生時
間がTであり、その量がVである符号化マルチメディア
情報を生成するマルチメディアデータ符号化ステップ
と、設定された単位再生時間に対応する符号化マルチメ
ディア情報の量を示す符号化マルチメディア情報単位量
を用いて、上記マルチメディアデータ符号化ステップに
おいて生成された符号化マルチメディア情報に対して、
上記符号化マルチメディア情報単位量ごとに分割して一
時蓄積用記憶手段に一時蓄積する符号化マルチメディア
情報バッファリングステップと、上記一時蓄積された符
号化マルチメディア情報を読み出して、マルチメディア
データ符号化多重化情報を生成する符号化マルチメディ
ア情報同期ステップとを含む上記マルチメディアデータ
符号化多重化プログラムを記録したものである。
【0044】
【発明の実施の形態】
実施の形態1.本発明の実施の形態1による映像音声符
号化多重化装置は、映像、及び音声の符号化情報をバッ
ファに蓄え、一定量に達したとき取り出して符号化映像
音声多重化情報を得るものである。図1は、本発明の実
施の形態1による映像音声符号化多重化装置の構成を示
すブロック図である。図示するように、本実施の形態1
による符号化多重化装置は、映像音声入力手段101、
音声キャプチャ手段102、音声符号化手段103、音
声バッファリング手段104、映像キャプチャ手段10
6、映像符号化手段107、映像バッファリング手段1
08、映像音声同期手段110、ファイル管理手段11
2、符号化音声読み出し手段113、及び符号化映像読
み出し手段115を備えたものである。
【0045】同図において、映像音声入力手段101
は、例えばビデオカメラにおいて実現され、映像・音声
を取り込み、アナログ音声情報S150とアナログ映像
情報S160とに分けて出力するものである。音声キャ
プチャ手段102は、映像音声入力手段101から出力
されたアナログ音声情報S150を入力し、離散的なデ
ジタルデータである原音声情報S151として出力す
る。映像キャプチャ手段106は、映像音声入力手段1
01から出力されたアナログ映像情報S160を入力
し、離散的なデジタルデータからなり、あらかじめ定義
された解像度を持つ単位時間毎の複数の静止画像情報か
らなるデジタルの原映像情報S161として出力する。
音声キャプチャ手段102,及び映像キャプチャ手段1
06は、一般的なパーソナルコンピュータシステムにお
いて、ビデオキャプチャボードとして実現される。
【0046】音声符号化手段103は、音声キャプチャ
手段102より出力された原音声情報S151を入力
し、冗長な情報を除いて符号化することで圧縮し、符号
化音声情報S152を出力する。映像符号化手段107
は、映像キャプチャ手段106より出力された原映像情
報S161を入力し、冗長な情報を除いて符号化するこ
とで圧縮し、符号化映像情報S162を出力する。映像
符号化手段107は、また、符号化映像情報S162の
大きさと再生時間とを示す情報である映像ブロックレー
ト情報S203を作成して、これを符号化映像情報S1
62とともに出力する。本実施の形態においては、音声
符号化手段103は、入力される原音声情報S151に
よらず、常に一定のビットレート(単位時間あたりの情
報量)192Kbit/sec(Kbps) において、符号化音声情報S
152を出力するものとする。一方、映像符号化手段1
07は、入力される原映像情報S161により、たえず
異なったビットレートで符号化映像情報S162を出力
するものであって、音声符号化手段のように、決まった
ビットレートで出力するものではないこととする。
【0047】音声バッファリング手段104は、音声符
号化手段103が出力した符号化音声情報S152を、
内部に持つ音声バッファに一時的に蓄積する。映像バッ
ファリング手段108は、映像符号化手段107が出力
した符号化映像情報S162を、内部に持つ映像バッフ
ァに一時的に蓄積する。音声バッファ、および映像バッ
ファとしては、半導体メモリ等の高速な記憶装置によっ
て実現される。かかる一時的蓄積に用いられるバッファ
としてはFIFO(First-In-First-Out)構造をとること、す
なわち、先入れ先出しの処理を行い得るものであること
が望ましいものであり、かかるFIFO構造は、具体的に
は、リングバッファ等のアルゴリズムに従うことによっ
て実現することが可能である。ただし、必ずしもリング
バッファ等の特定の手法を必要とするものではない。
【0048】音声バッファリング手段104は、音声バ
ッファに蓄積された符号化音声情報の量を符号化音声バ
ッファ量S105として保持し、音声バッファに対して
の符号化音声情報の蓄積、または音声バッファからの符
号化音声情報の読み出し、削除があった場合には、この
符号化音声バッファ量S105の更新を行う。映像バッ
ファリング手段107はまた、映像符号化手段107か
ら出力された映像ブロックレート情報S203を符号化
映像情報S162とともに一時蓄積する。
【0049】符号化音声読み出し手段113は、後述す
る映像音声同期手段110が出力する音声時間情報S1
14に基づいて、音声バッファリング手段104が一時
蓄積した符号化音声情報を読み出して、この読み出した
符号化音声情報S153を映像音声同期手段110に出
力する。符号化映像読み出し手段115は、後述する映
像音声同期手段110が出力する映像時間情報S116
に基づいて、映像バッファリング手段108が一時蓄積
した符号化映像情報を読み出して、この読み出した符号
化映像情報S163を映像音声同期手段110に出力す
る。本実施の形態では、符号化音声情報は常に同一のビ
ットレート(単位時間あたりの情報量)で音声符号化手
段103から出力されるものとするので、符号化音声読
み出し手段113は、音声時間情報114に対して、19
2Kbit を乗算した量だけの符号化音声情報S153を、
音声バッファリング手段104から読み出す。また、符
号化映像読み出し手段115は、映像時間情報S116
と同一の再生時間に相当する量の符号化映像情報S16
3を映像バッファリング手段108から読み出すもので
あり、この再生時間相当量を判断するためには、映像符
号化手段107が作成した映像ブロックレート情報を用
いるものである。
【0050】映像音声同期手段110は、符号化映像読
み出し手段115、及び符号化音声読み出し手段113
が読み出した符号化映像情報S163、及び符号化音声
情報S152に対して、それぞれにシーケンスヘッダを
付与し、交互に並べて出力するものであり、その作業の
ための内部バッファ111を持つ。内部バッファ111
としては、音声・映像用のバッファと同様に高速な記憶
装置が用いられる。ファイル管理手段112は、一般的
なオペレーティングシステムではファイルシステムとし
て存在するものであり、保存用記憶装置(一般的にはハ
ードディスク)上のファイルを管理するものであって、
映像音声同期手段110より出力された情報S171
を、保存用記憶装置内のファイルに格納する。
【0051】図2は、本実施の形態1による映像音声符
号化多重化装置による、映像・音声処理の際の動作を説
明するための図である。また、図3は映像バッファリン
グ手段108における一時蓄積を説明するための図であ
る。同図において、S162は映像符号化手段107に
よって符号化処理された符号化映像情報である。映像符
号化手段107は、上述のように映像ブロックレート情
報S203を作成し、これを符号化映像情報S162と
ともに、映像バッファリング手段108に出力し、映像
バッファリング手段108はこれらを映像バッファに蓄
積する。映像ブロックレート情報S203は、符号化映
像情報のサイズを表す符号化映像量S201と、再生し
た時の再生時間である符号化映像時間情報S202とを
含んだものである。そして、このうち符号化映像時間情
報S202は、映像と音声との多重化における多重化単
位(時間間隔)を示す同期間隔時間情報として用いられ
るものである。
【0052】このように構成された本実施の形態1によ
る映像音声符号化多重化装置による映像・音声処理の動
作を、図2に沿って、図1、および図3を参照しなが
ら、以下に説明する。まず、図2においてビデオカメラ
101が映像・音声をとりこみ、アナログ音声情報S1
50とアナログ映像情報S160とに分けて出力する。
そして、音声キャプチャ手段102は、アナログ音声情
報S150を入力してデジタル化し、デジタルの原音声
情報S151を出力する。音声符号化手段103は、原
音声情報S151を符号化処理し、符号化音声情報S1
52を出力する。ここで経過時間は0.05秒であったもの
とし、9.6Kbit の符号化音声情報が出力される。音声バ
ッファリング手段103は、この符号化音声情報を蓄積
し、符号化音声バッファ量S105を更新して、上記の
値9.6Kbit とし、これを保持する。
【0053】一方、映像キャプチャ手段106は、アナ
ログ映像情報S160を入力してデジタル化し、デジタ
ルの原映像情報S161を出力する。映像符号化手段1
07は、原映像情報S161を符号化処理し、符号化映
像情報S162を出力する。ここで経過時間は0.1 秒で
あったものとし、150Kbit の符号化映像情報が出力され
る。映像符号化手段107はこの符号化処理の結果に基
づいて、符号化映像情報のサイズを表す符号化映像量
と、再生した時の再生時間である符号化映像時間情報と
からなる映像ブロックレート情報S203を作成し、こ
れを符号化映像情報S162とともに出力する。
【0054】映像バッファリング手段108は、映像ブ
ロックレート情報S203と、符号化映像情報S162
とを映像バッファに蓄積する。この際、映像ブロックレ
ート情報S203の持つ符号化映像時間情報S202に
ついては、後段の処理に用いるために、同期間隔時間情
報S109として保持するものである。そして、映像音
声同期手段110は、映像バッファリング手段108の
保持する同期間隔時間情報S109を取得して、この値
を音声時間情報S114として、符号化音声読み出し手
段113に出力する。同様に、映像音声同期手段110
は、同期間隔時間情報S109に基づく映像時間情報S
116を、符号化映像読み出し手段115にも出力す
る。この場合には、いずれも「0.1 秒」を示す音声時間
情報S114、および映像時間情報S116が出力され
ることとなる。
【0055】符号化音声読み出し手段113は、「0.1
秒」を示す音声時間情報S114を入力され、0.1 秒に
相当する19.2Kbitの符号化音声情報を読み出すべきこと
を知り、音声バッファリング手段104の保持する符号
化音声バッファ量S105を参照して、これと比較す
る。ここでは符号化音声バッファ量S105は、上記の
ように9.6Kbit となっていて、読み出すべき量に満たな
いため、符号化音声読み出し手段113は、符号化音声
情報を読み出さない。
【0056】一方、符号化映像読み出し手段115は、
「0.1 秒」を示す映像時間情報S116を入力され、0.
1 秒に相当する符号化映像情報を読み出すべきことを知
り、映像バッファリング手段108の保持する映像ブロ
ックレート情報S203を参照する。そして、符号化映
像読み出し手段115は、映像バッファリング手段10
8の映像バッファに蓄積された符号化映像情報が、0.1
秒分であり、その量は150Kbit であることを知り、150K
bit 分の符号化映像情報S163を読み出し、当該読み
出した分の符号化映像情報S162と、映像ブロックレ
ート情報S203とを映像バッファリング手段108の
映像バッファより削除する。符号化映像読み出し手段1
15は、読み出した符号化映像情報S163を映像音声
同期手段110に出力し、映像音声同期手段110は、
符号化映像情報S163を内部バッファ111に格納す
る。
【0057】ここで、映像符号化処理が実行される。映
像符号化手段107は、原映像情報S161を符号化処
理し、符号化映像情報S162を出力する。ここで経過
時間は0.2 秒であったものとし、200Kbit の符号化映像
情報が出力されたとする。映像符号化手段107はこの
符号化処理の結果に基づいて、符号化映像情報のサイズ
を表す符号化映像量と、再生した時の再生時間である符
号化映像時間情報とからなる映像ブロックレート情報S
203を作成し、これを符号化映像情報S162ととも
に出力する。映像バッファリング手段108は、映像ブ
ロックレート情報S203と、符号化映像情報S162
とを映像バッファに蓄積する。やはり、映像ブロックレ
ート情報S203の持つ符号化映像時間情報S202に
ついては、同期間隔時間情報S109として保持する。
【0058】一方、音声符号化も実行され、音声符号化
手段103は、原音声情報S151を符号化処理し、符
号化音声情報S152を出力する。ここで経過時間は0.
35秒であったものとし、67.2Kbitの符号化音声情報が出
力される。音声バッファリング手段103は、この符号
化音声情報を蓄積し、符号化音声バッファ量S105を
76.8Kbitに更新して、これを保持する。
【0059】符号化音声読み出し手段113は、「0.1
秒」を示す音声時間情報S114を入力されており、0.
1 秒に相当する19.2Kbitの符号化音声情報を読み出すべ
きである。ここで、音声バッファリング手段104の保
持する符号化音声バッファ量S105を参照すると、上
記のように76.8Kbitとなっていて、読み出すべき量を超
えているため、符号化音声読み出し手段113は、19.2
Kbitの符号化音声情報S153を読み出し、当該読み出
した分の符号化音声情報S152を音声バッファリング
手段104の音声バッファから削除する。音声バッファ
リング手段104は、音声バッファからの削除があった
ので、符号化音声バッファ量S105を57.6Kbitに更新
して、これを保持する。
【0060】符号化音声読み出し手段113は、読み出
した符号化音声情報S153を映像音声同期手段110
に出力し、映像音声同期手段110は、符号化音声情報
S153を内部バッファ111に格納する。この際、映
像音声同期手段110は、符号化音声情報S153を前
回入力された符号化映像情報と並べて、映像音声符号化
多重化情報S170を作成し、これをファイル管理手段
112に出力する。ファイル管理手段112は、映像音
声符号化多重化情報S170をファイルとして格納し、
またはファイルに追加格納する。図2に示す場合におい
ては、追加される映像音声符号化多重化情報S170
は、同期間隔時間情報S109に対応する量S1の符号
化映像情報と、同じく同期間隔時間情報S109に対応
する量S2の符号化音声情報とから構成されたものとな
っている。
【0061】このように、本実施の形態1の映像音声符
号化多重化装置によれば、原映像情報S161に対する
符号化処理をして符号化映像情報S162を生成すると
ともに、当該符号化映像情報S162の大きさと再生時
間とを示す情報である映像ブロックレート情報S203
を作成して、これを符号化映像情報S162とともに出
力する映像符号化手段107と、これらを一時蓄積する
映像バッファリング手段108と、符号化音声情報を一
時蓄積する音声バッファリング手段104と、映像ブロ
ックレート情報S203に含まれる時間情報を用いて、
多重化処理に用いる同期間隔時間情報S109とし、ま
た、映像時間情報S116、および音声時間情報S11
4として出力する音声同期手段110と、上記映像時間
情報S116に対応する量だけ符号化映像情報を読み出
す符号化映像読み出し手段115と、上記音声時間情報
S114に対応する量だけ符号化音声情報を読み出す符
号化音声読み出し手段113とを備えたことで、符号化
された情報を一旦バッファに貯え、映像と音声が交互に
出力できる量に達してから、両者を読み出し、並べ替え
を行った後、映像音声符号化多重化情報として、出力す
る。このため、音声と映像の符号化処理が常に均等にな
らなくても、映像と音声を同じ再生時間の単位で多重化
することができる。しかも、本実施の形態1では、符号
化映像情報とともに、映像ブロックレート情報も一時的
に蓄積し、それを用いて多重化を行うため、符号化映像
情報が固定ビットレートでなく、原映像情報やその他の
要因で単位時間あたり量が変わる変動ビットレートであ
っても、正確な映像と音声の多重化を行うことができ
る。
【0062】なお、本実施の形態1では、映像音声符号
化多重化情報は記憶装置に保存するものとしたが、これ
は、ネットワークを介して外部に送信することもでき、
同様の効果が得られるので、転送量が動的に変わるネッ
トワークにデータを送信する際のレート制御などにも、
本発明は特に有効である。
【0063】また、本実施の形態1によれば、符号化映
像情報が変動ビットレートとして出力され、符号化音声
情報は固定ビットレートで出力されるとしたが、このよ
うな形態に限定されるものではない。符号化音声情報が
変動ビットレートで出力されても、映像と同じように音
声ブロックレート情報を符号化音声情報と共に出力する
ことで、正確な映像と音声の多重化が行える。この場
合、映像と同じように、同期間隔時間情報として、音声
ブロックレート情報に含まれる時間情報( 符号化音声時
間情報) を用いてもよい。
【0064】また、本実施の形態1によれば、同期間隔
時間情報として、映像ブロックレート情報に含まれる符
号化映像時間情報を用いるものとしたが、あらかじめ決
められた値を同期間隔時間情報として用いるものとする
ことも可能である。この場合には、該同期間隔時間情報
に近い値となるだけの符号化映像時間情報を用いること
として、該符号化映像時間情報と対応するだけの符号化
映像情報を読み出し、多重化に用いるものとすることが
できる。例えば、同期間隔時間情報が0.5 秒で、符号化
映像時間情報が0.3 秒のブロックと、符号化映像時間情
報が0.2 秒のブロックとがあった場合は、0.3 秒のブロ
ックに相当する符号化映像情報と、0. 2秒のブロックに
相当する符号化映像情報とを、同時に読み出せば良く、
本実施の形態1に示したような映像音声符号化多重化情
報を得ることができる。
【0065】実施の形態2.本発明の実施の形態2によ
る映像音声符号化多重化装置は、実施の形態1と同様に
バッファに蓄えた符号化情報を、一定量に達したとき取
り出して多重化情報を得るものである。図4は、本発明
の実施の形態2による映像音声符号化多重化装置の構成
を示すブロック図である。図示するように、本実施の形
態2による符号化多重化装置は、映像音声入力手段10
1、音声キャプチャ手段102、音声符号化手段10
3、音声バッファリング手段104、映像キャプチャ手
段106、映像バッファリング手段108、映像音声同
期手段110、ファイル管理手段112、符号化音声読
み出し手段113、映像符号化手段301、及び符号化
映像読み出し手段302を備えたものである。
【0066】図において、映像符号化手段301は、実
施の形態1における映像符号化手段107と同様に原映
像情報S161に対して符号化処理を行い、符号化映像
情報S162を生成するとともに、後述するように、当
該符号化映像情報S162についての、単位時間当たり
の量を示す符号化映像単位時間量S401(図5、およ
び図6に示す)を作成して、これを映像バッファリング
手段108に出力する。映像バッファリング手段108
は、符号化映像情報S162と、符号化映像単位時間量
S401とを蓄積する。符号化映像読み出し手段302
は、実施の形態1と同様に、入力される映像時間情報S
114に対応する量だけの符号化映像情報を読み出し、
また削除を行うものであるが、上記の読み出すべき量の
符号化映像情報の量を調査する際に、符号化映像単位時
間量S401を用いるものである。映像音声同期手段1
10は、あらかじめ設定された値を有する同期間隔時間
情報S303を用いて、映像時間情報S114、および
音声時間情報S116として出力する。ここでは、同期
間隔時間情報S303は、0.1 秒に設定されているもの
とする。
【0067】映像音声入力手段101、音声キャプチャ
手段102、音声符号化手段103、音声バッファリン
グ手段104、映像キャプチャ手段106、ファイル管
理手段112、および符号化音声読み出し手段113に
ついては実施の形態1と同様であり、説明を省略する。
また、実施の形態1と同様に、符号化音声情報S152
は、固定ビットレート192Kbps で音声符号化手段103
から出力されるものであり、符号化映像情報S162に
ついては、変動ビットレートで出力されるものとする。
【0068】図5は、本実施の形態2による映像音声符
号化多重化装置による、映像・音声処理の際の動作を説
明するための図である。また、図6は映像バッファリン
グ手段108における一時蓄積を説明するための図であ
る。同図において、S162a、およびS162bは、
映像符号化手段301によって符号化処理された符号化
映像情報である。映像符号化手段301は、上述のよう
に符号化映像単位時間量S401を作成し、これを符号
化映像情報S162a、およびbとともに、映像バッフ
ァリング手段108に出力し、映像バッファリング手段
108はこれらを映像バッファに蓄積する。図示するよ
うに、本実施の形態2においては、一つ以上の符号化映
像単位時間量S401が一時蓄積され得るものである。
同図に示すように、S401が示す量「150Kbit 」およ
び「200Kbit 」という情報は、蓄積された符号化映像情
報S162の最初の単位時間分(0.1 秒分)であるS1
62aの量は150Kbit であること、そして次の単位時間
分(0.1 秒分)であるS162bの量は200Kbit である
ことを意味している。すなわち、符号化映像単位時間量
S401は、映像符号化手段301が出力した符号化映
像情報S162を、その有する再生時間が単位時間(0.
1 秒)となるように分割するものとし(この例ではS1
62→S162aとS162b)、当該分割したそれぞ
れの符号化映像情報(S162aとS162b)の量を
示す情報として作成される。
【0069】このように構成された本実施の形態2によ
る映像音声符号化多重化装置による映像・音声処理の動
作を、図5に沿って、図4、および図6を参照しなが
ら、以下に説明する。まず、図5においてビデオカメラ
101が映像・音声をとりこみ、アナログ音声情報S1
50とアナログ映像情報S160とに分けて出力する。
そして、音声キャプチャ手段102は、アナログ音声情
報S150を入力してデジタル化し、デジタルの原音声
情報S151を出力する。音声符号化手段103は、原
音声情報S151を符号化処理し、符号化音声情報S1
52を出力する。ここで経過時間は0.05秒であったもの
とし、9.6Kbit の符号化音声情報が出力される。音声バ
ッファリング手段103は、この符号化音声情報を蓄積
し、符号化音声バッファ量S105を更新して、上記の
値9.6Kbit とし、これを保持する。
【0070】一方、映像キャプチャ手段106は、アナ
ログ映像情報S160を入力してデジタル化し、デジタ
ルの原映像情報S161を出力する。ここで、他のプロ
グラムの実行があり、映像符号化処理が行われず、原映
像情報S161の出力が続く、という期間が0.2 秒間あ
ったものとする。その後映像符号化処理が実行されると
き、映像符号化手段301は0.2 秒分の原映像情報S1
61を符号化処理して符号化映像情報S162を生成
し、これを映像バッファリング部108に出力する。経
過時間0.2 秒のうち最初の0.1 秒には150Kbit の、次の
0.1 秒には100Kbit の符号化映像情報が出力されたもの
として、映像符号化手段301は、「150Kbit 」、およ
び「200Kbit 」を示す符号化映像単位時間量S401を
作成し、これらをやはり映像バッファリング手段108
に出力する。映像バッファリング手段108は、映像符
号化手段301の出力した符号化映像情報S162と、
符号化映像単位時間量S401とを蓄積する。この場合
の蓄積の状態は、先に説明した図6に示すようなものと
なる。
【0071】映像音声同期手段110は、あらかじめ設
定された値「0.1 秒」を有する同期間隔時間情報S30
3を用いて、この値を音声時間情報S114として、符
号化音声読み出し手段113に、また映像時間情報S1
16として、符号化映像読み出し手段115に、それぞ
れ出力する。
【0072】符号化音声読み出し手段113は、「0.1
秒」を示す音声時間情報S114を入力され、0.1 秒に
相当する19.2Kbitの符号化音声情報を読み出すべきこと
を知り、音声バッファリング手段104の保持する符号
化音声バッファ量S105を参照して、これと比較す
る。ここでは符号化音声バッファ量S105は、上記の
ように9.6Kbit となっていて、読み出すべき量に満たな
いため、符号化音声読み出し手段113は、符号化音声
情報を読み出さない。
【0073】一方、符号化映像読み出し手段115は、
「0.1 秒」を示す映像時間情報S116を入力され、0.
1 秒に相当する符号化映像情報を読み出すべきことを知
り、映像バッファリング手段108の保持する符号化映
像単位時間量S401を参照する。そして、符号化映像
読み出し手段115は、映像バッファリング手段108
の映像バッファに蓄積された最初の0.1 秒分の符号化映
像情報の量は150Kbitであることを知り、150Kbit 分の
符号化映像情報を読み出してS163として映像音声同
期手段110に出力し、当該読み出した分の符号化映像
情報S162aと、S162aに対応する、「150Kbit
」を示す符号化映像単位時間量S401とを映像バッ
ファリング手段108の映像バッファより削除する。映
像音声同期手段110は、符号化映像情報S163を内
部バッファ111に格納する。
【0074】ここで、音声符号化が実行され、音声符号
化手段103は、原音声情報S151を符号化処理し、
符号化音声情報S152を出力する。ここで経過時間は
0.15秒であったものとし、28.8Kbitの符号化音声情報が
出力される。音声バッファリング手段104は、この符
号化音声情報を蓄積し、符号化音声バッファ量S105
を38.4Kbitに更新して、これを保持する。
【0075】符号化音声読み出し手段113は、「0.1
秒」を示す音声時間情報S114を入力されており、0.
1 秒に相当する19.2Kbitの符号化音声情報を読み出すべ
きである。ここで、音声バッファリング手段104の保
持する符号化音声バッファ量S105を参照すると、上
記のように38.4Kbitとなっていて、読み出すべき量を超
えているため、符号化音声読み出し手段113は、19.2
Kbitの符号化音声情報S153を読み出し、当該読み出
した分の符号化音声情報S152を音声バッファリング
手段104の音声バッファから削除する。音声バッファ
リング手段104は、音声バッファからの削除があった
ので、符号化音声バッファ量S105を19.2Kbitに更新
して、これを保持する。
【0076】符号化音声読み出し手段113は、読み出
した符号化音声情報S153を映像音声同期手段110
に出力し、映像音声同期手段110は、符号化音声情報
S153を内部バッファ111に格納する。この際、映
像音声同期手段110は、符号化音声情報S153を前
回入力された符号化映像情報と並べて、映像音声符号化
多重化情報S170を作成し、これをファイル管理手段
112に出力する。ファイル管理手段112は、映像音
声符号化多重化情報S170をファイルとして格納し、
またはファイルに追加格納する。図5に示す場合におい
ては、追加される映像音声符号化多重化情報S170
は、同期間隔時間情報S303に対応する量S1の符号
化映像情報と、同じく同期間隔時間情報S303に対応
する量S2の符号化音声情報とから構成されたものとな
っている。
【0077】映像音声同期手段110は、再び、同期間
隔時間情報S303の値である「0.1 秒」を示す音声時
間情報S114、および映像時間情報S116を符号化
音声読み出し手段113、および符号化映像読み出し手
段302に出力する。符号化音声読み出し手段113
は、「0.1 秒」を示す音声時間情報S114を入力され
て、先と同様に19.2Kbitの符号化音声情報S153を読
み出し、音声バッファからの削除と、符号化音声バッフ
ァ量S105の更新を行う。符号化音声情報S153が
映像音声同期手段110に出力されると、映像音声多重
情報S170の作成と、ファイル管理手段112への出
力、そしてファイル管理手段112による追加格納とが
先と同様に行われる。
【0078】このように、本実施の形態2の映像音声符
号化多重化装置によれば、原映像情報S161に対する
符号化処理をして符号化映像情報S162を生成すると
ともに、当該符号化映像情報S162の単位時間当たり
の量を示す情報である符号化映像単位時間量S401を
作成して、これを符号化映像情報S162とともに出力
する映像符号化手段301と、これらを一時蓄積する映
像バッファリング手段108と、符号化音声情報を一時
蓄積する音声バッファリング手段104と、あらかじめ
設定された同期間隔時間情報S109の値を用いて、映
像時間情報S116、および音声時間情報S114とし
て出力する音声同期手段110と、上記符号化映像単位
時間量S401を用いて、上記映像時間情報S116に
対応する量だけ符号化映像情報を読み出す符号化映像読
み出し手段115と、上記音声時間情報S114に対応
する量だけ符号化音声情報を読み出す符号化音声読み出
し手段113とを備えたことで、単位時間に相当する符
号化映像情報の量を示す符号化映像単位時間量を用いる
ことで、映像符号化手段が出力する符号化映像情報の量
によらず、上記単位時間に基づいた間隔において、音声
と映像との多重化が行える。すなわち、音声と映像の符
号化処理が常に均等にならなくても映像と音声を同じ再
生時間の単位で多重化することができるという実施の形
態1による多重化装置による効果に加えて、一回に出力
される符号化情報の単位が大きいものになっても、あら
かじめ設定された任意の単位で、音声と映像の多重化が
行えるという格別の効果が得られる。これにより他のプ
ログラムの動作等の理由により符号化手段の動作のタイ
ミングが間隔の開いたものとなった場合、例えば、映像
符号化手段301、および音声符号化手段103が動作
を1秒ごとに行ったとした場合においても、映像音声同
期手段は、0.1 秒単位に映像と音声が交互に並べられた
映像音声符号化多重化情報を出力することが可能とな
る。しかも、本実施の形態2では、符号化映像単位時間
量を用いることで、単位時間あたりに相当する量を調べ
て多重化するため、符号化映像情報が固定ビットレート
でなく、原映像情報やその他の要因で単位時間あたり量
が変わる変動ビットレートであっても、正確な映像と音
声の多重化を行うことができる。
【0079】なお、実施の形態1と同様に本実施の形態
2でも、符号化映像情報が変動ビットレートとして出力
され、符号化音声情報は固定ビットレートで出力される
としたが、このような形態に限定されるものではない。
符号化音声情報が変動ビットレートで出力されても、映
像と同じように符号化音声単位時間量を符号化音声情報
と共に出力することで、正確な映像と音声の多重化が行
える。
【0080】また、本実施の形態2によれば、同期間隔
時間情報と、符号化映像単位時間量の単位時間とを、同
じ時間(0.1秒) であるとしたが、これは異なる時間とし
ても構わない。この場合には、該同期間隔時間情報に近
い値となるだけの符号化映像時間情報を用いることとし
て、該符号化映像時間情報と対応するだけの符号化映像
情報を読み出して、多重化するものとすることができ
る。例えば、同期間隔時間情報が0.5 秒であり、符号化
映像単位時間量の単位時間が0.1 秒だった場合には、5
個分の符号化映像単位時間量の合計が示す量だけ、符号
化映像情報を同時に読み出せば良く、本実施の形態2に
示したような映像音声符号化多重化情報を得ることがで
きる。
【0081】実施の形態3.本発明の実施の形態3によ
る映像音声符号化多重化装置は、符号化情報の廃棄、お
よびダミー情報の挿入を行うことにより、バッファあふ
れの防止と多重化処理における同期とを実現するもので
ある。図7は、本発明の実施の形態3による映像音声符
号化多重化装置の構成を示すブロック図である。図示す
るように、本実施の形態3による符号化多重化装置は、
映像音声入力手段101、音声キャプチャ手段102、
音声符号化手段103、音声バッファリング手段10
4、映像キャプチャ手段106、映像符号化手段10
7、映像音声同期手段110、ファイル管理手段11
2、符号化音声読み出し手段113、符号化映像読み出
し手段115、符号化音声蓄積時間出力手段501、符
号化映像蓄積時間出力手段502、音声途切れ防止手段
503、ダミー映像挿入手段505、および映像バッフ
ァリング手段506を備えたものであり、実施の形態1
による映像音声符号化多重化装置に対して、符号化音声
蓄積時間出力手段501、符号化映像蓄積時間出力手段
502、音声途切れ防止手段503、およびダミー映像
挿入手段505を追加したものにほぼ相当する構成とな
っている。また、実施の形態1と同様に、符号化音声情
報S152は、固定ビットレート192Kbps で音声符号化
手段103から出力されるものであり、符号化映像情報
S162については、変動ビットレートで出力されるも
のとする。
【0082】符号化音声蓄積時間出力手段501は、音
声バッファリング手段104の音声バッファに蓄積され
た全符号化音声情報に相当する原音声情報の再生時間を
求めて、これを出力する。上記のように、符号化音声情
報S152は、固定ビットレート192Kbps で出力される
ことから、符号化音声蓄積時間出力手段501は、音声
バッファリング手段104の音声バッファにおける蓄積
量を示す符号化音声バッファ量S105(図8に示す)
を用いて、固定ビットレートの値192Kbps を除算処理
し、得られた値を出力するものである。
【0083】符号化映像蓄積時間出力手段502は、映
像バッファリング手段108の映像バッファに蓄積され
た全符号化映像情報に相当する原映像情報の再生時間を
求めて、これを出力する。本実施の形態3においても、
実施の形態1と同様に、映像符号化手段107は、符号
化映像情報S162の大きさと再生時間とを示す情報で
ある映像ブロックレート情報S203を作成して、これ
を符号化映像情報S162とともに出力するものである
ので、符号化映像蓄積時間出力手段502は、蓄積され
たすべての映像ブロックレート情報S203に含まれる
符号化映像時間情報S202の和を取得し、これを出力
するものである。
【0084】音声途切れ防止手段503は、音声バッフ
ァリング手段104の音声バッファに蓄積される符号化
音声情報の量を監視し、一定量以上になった時に、ダミ
ー映像挿入時間S504を生成して、これを後述するダ
ミー映像挿入手段505と、映像バッファリング手段5
06とに出力するものである。本実施の形態3において
は、上記一定量として音声の3秒分に相当する576Kbit
であるものとする。また、音声途切れ防止手段503に
おけるダミー映像挿入時間S504の取得にあたって
は、符号化音声蓄積時間出力手段501が出力する時間
(符号化音声蓄積時間)をT1、符号化映像蓄積時間出
力手段502が出力する時間(符号化映像蓄積時間)を
T2とし、T1からT2を減じて得られる時間T3とし
て算出されるものである。
【0085】ダミー映像挿入手段505は、ダミー映像
挿入時間S504が入力されたとき、ダミー符号化映像
情報を作成して、映像バッファリング手段108に出力
するものである。また、該ダミー符号化映像情報に添付
する映像ブロックレート情報をも作成して出力するが、
この際映像ブロックレート情報S203に含まれる符号
化映像時間情報S202については、ダミー映像挿入時
間S504を用いて、該ダミー映像挿入時間S504と
同一の値となるよう作成するものである。また本実施の
形態3では、ダミー符号化映像を、ダミー映像挿入時間
S504に相当する再生時間を有し、「前回の静止画像
と同じ」を示す符号である符号化映像情報として作成す
るものとする。
【0086】映像バッファリング手段506は、ダミー
映像挿入時間S504が入力されたとき、該ダミー映像
挿入時間に相当するだけの符号化映像情報を蓄積せずに
廃棄する。映像音声入力手段101、音声キャプチャ手
段102、音声符号化手段103、音声バッファリング
手段104、映像キャプチャ手段106、ファイル管理
手段112、符号化音声読み出し手段113、および符
号化映像読み出し手段115については実施の形態1と
同様であり、説明を省略する。
【0087】図8は、本実施の形態1による映像音声符
号化多重化装置による、映像・音声処理の際の動作を説
明するための図である。以下に、本実施の形態3による
映像音声符号化多重化装置による映像・音声処理の動作
を、図8に沿って、図7を参照しながら説明する。ま
ず、図8においてビデオカメラ101が映像・音声をと
りこみ、アナログ音声情報S150とアナログ映像情報
S160とに分けて出力する。そして、音声キャプチャ
手段102は、アナログ音声情報S150を入力してデ
ジタル化し、デジタルの原音声情報S151を出力す
る。音声符号化手段103は、原音声情報S151を符
号化処理し、符号化音声情報S152を出力する。ここ
で経過時間は0.05秒であったものとし、9.6Kbit の符号
化音声情報が出力される。音声バッファリング手段10
4は、この符号化音声情報を蓄積し、符号化音声バッフ
ァ量S105を更新して、上記の値9.6Kbit とし、これ
を保持する。
【0088】一方、映像キャプチャ手段106は、アナ
ログ映像情報S160を入力してデジタル化し、デジタ
ルの原映像情報S161を出力する。映像符号化手段1
07は、原映像情報S161を符号化処理し、符号化映
像情報S162を出力する。ここで経過時間は0.1 秒で
あったものとし、150Kbit の符号化映像情報が出力され
る。映像符号化手段107はこの符号化処理の結果に基
づいて、符号化映像情報のサイズを表す符号化映像量
と、再生した時の再生時間である符号化映像時間情報と
からなる映像ブロックレート情報S203を作成し、こ
れを符号化映像情報S162とともに出力する。
【0089】映像バッファリング手段506は、映像ブ
ロックレート情報S203と、符号化映像情報S162
とを映像バッファに蓄積する。この際、映像ブロックレ
ート情報S203の持つ符号化映像時間情報S202に
ついては、後段の処理に用いるために、同期間隔時間情
報S109として保持するものである。そして、映像音
声同期手段110は、映像バッファリング手段506の
保持する同期間隔時間情報S109を取得して、この値
を音声時間情報S114として、符号化音声読み出し手
段113に出力する。同様に、映像音声同期手段110
は、同期間隔時間情報S109に基づく映像時間情報S
116を、符号化映像読み出し手段115にも出力す
る。この場合には、いずれも「0.1 秒」を示す音声時間
情報S114、および映像時間情報S116が出力され
ることとなる。
【0090】符号化音声読み出し手段113は、「0.1
秒」を示す音声時間情報S114を入力され、0.1 秒に
相当する19.2Kbitの符号化音声情報を読み出すべきこと
を知り、音声バッファリング手段104の保持する符号
化音声バッファ量S105を参照して、これと比較す
る。ここでは符号化音声バッファ量S105は、上記の
ように9.6Kbit となっていて、読み出すべき量に満たな
いため、符号化音声読み出し手段113は、符号化音声
情報を読み出さない。
【0091】一方、符号化映像読み出し手段115は、
「0.1 秒」を示す映像時間情報S116を入力され、0.
1 秒に相当する符号化映像情報を読み出すべきことを知
り、映像バッファリング手段108の保持する映像ブロ
ックレート情報S203を参照する。そして、符号化映
像読み出し手段115は、映像バッファリング手段10
8の映像バッファに蓄積された符号化映像情報が、0.1
秒分であり、その量は150Kbit であることを知り、150K
bit 分の符号化映像情報S163を読み出し、当該読み
出した分の符号化映像情報S162と、映像ブロックレ
ート情報S203とを映像バッファリング手段108の
映像バッファより削除する。符号化映像読み出し手段1
15は、読み出した符号化映像情報S163を映像音声
同期手段110に出力し、映像音声同期手段110は、
符号化映像情報S163を内部バッファ111に格納す
る。
【0092】ここで、映像符号化処理が実行される。映
像符号化手段107は、原映像情報S161を符号化処
理し、符号化映像情報S162を出力する。ここで経過
時間は0.2 秒であったものとし、200Kbit の符号化映像
情報が出力されたとする。映像符号化手段107はこの
符号化処理の結果に基づいて、符号化映像情報のサイズ
を表す符号化映像量と、再生した時の再生時間である符
号化映像時間情報とからなる映像ブロックレート情報S
203を作成し、これを符号化映像情報S162ととも
に出力する。映像バッファリング手段506は、映像ブ
ロックレート情報S203と、符号化映像情報S162
とを映像バッファに蓄積する。やはり、映像ブロックレ
ート情報S203の持つ符号化映像時間情報S202に
ついては、同期間隔時間情報S109として保持する。
【0093】ここで、他のプログラムの実行があり、音
声符号化処理が行われず、原音声情報S151の出力が
続く、という期間が4秒間あったものとする。その後音
声符号化処理が実行されるとき、音声符号化手段103
は4秒分の原音声情報S151を符号化処理して、768K
bit の符号化音声情報S152を生成し、これを音声バ
ッファリング手段104に出力する。音声バッファリン
グ手段104は、符号化音声情報S152を蓄積し、符
号化音声バッファ量S105は777.6Kbit に更新され
る。
【0094】符号化音声読み出し手段113は、「0.1
秒」を示す音声時間情報S114を入力されており、0.
1 秒に相当する19.2Kbitの符号化音声情報を読み出すべ
きである。ここで、音声バッファリング手段104の保
持する符号化音声バッファ量S105を参照すると、上
記のように777.6Kbit となっていて、読み出すべき量を
超えているため、符号化音声読み出し手段113は、1
9.2Kbitの符号化音声情報S153を読み出し、当該読
み出した分の符号化音声情報S152を音声バッファリ
ング手段104の音声バッファから削除する。音声バッ
ファリング手段104は、音声バッファからの削除があ
ったので、符号化音声バッファ量S105を758.4Kbit
に更新して、これを保持する。
【0095】符号化音声読み出し手段113は、読み出
した符号化音声情報S153を映像音声同期手段110
に出力し、映像音声同期手段110は、符号化音声情報
S153を内部バッファ111に格納する。この際、映
像音声同期手段110は、符号化音声情報S153を前
回入力された符号化映像情報と並べて、映像音声符号化
多重化情報S170を作成し、これをファイル管理手段
112に出力する。
【0096】上記のように、符号化音声バッファ量S1
05は758.4Kbit になっており、前述の一定の量である
576Kbit を超えているものである。そこで、音声途切れ
防止手段503は、符号化音声蓄積時間出力手段501
の出力T1と、符号化映像蓄積時間出力手段の出力T2
とを取得する。ここで、符号化音声蓄積時間出力手段5
01の出力T1については、符号化音声バッファ量S1
05を固定ビットレート192Kbps によって除算して、3.
95秒となるものである。一方、符号化映像蓄積時間出力
手段の出力T2については、蓄積されている映像ブロッ
クレート情報S203に含まれる符号化映像時間情報S
202から、0.2 秒となる。そこで、音声途切れ防止手
段503は、T3=T1ーT2なるT3として、3.75秒
という値を得ることとなる。音声途切れ防止手段503
は値がT3であるダミー映像挿入時間S504を、ダミ
ー映像挿入手段505と、映像バッファリング手段50
6とに出力する。
【0097】ダミー映像挿入手段505は、ダミー映像
挿入時間S504を入力したので、ダミー映像挿入時間
S504に相当する再生時間を有し、「前回の静止画像
と同じ」を示す符号である符号化映像情報であるダミー
符号化映像を作成し、これを映像バッファリング手段5
06に出力する。これに伴いダミー映像挿入手段505
は、ダミー映像挿入時間S504と同一の値を有する符
号化映像時間情報を含んだ映像ブロックレート情報を作
成し、ダミー符号化映像とともに映像バッファリング手
段506に出力する。ダミー映像挿入手段505から出
力されたダミー映像符号化情報と、これに伴う映像ブロ
ックレート情報とが、映像バッファにおいて蓄積され
る。
【0098】ここで、映像音声同期手段110が取得す
る同期間隔時間情報S109は、先の「0.2 秒」を示す
符号化映像時間情報に基づくものであるので、映像音声
同期手段110は、「0.2 秒」を示す音声時間情報S1
14、および映像時間情報S116を符号化音声読み出
し手段113、および符号化映像読み出し手段115に
それぞれ出力する。符号化音声読み出し手段113、お
よび符号化映像読み出し手段115は、0.2 秒分の符号
化音声情報S153、および符号化映像情報S163が
読み出して、映像音声同期手段110に出力し、映像音
声同期手段110では、映像音声符号化多重化情報S1
70が作成される。また、音声バッファ、映像バッファ
における削除と、符号化音声バッファ量S105の更新
とが実行される。
【0099】次に映像音声同期手段110が取得する同
期間隔時間情報S109は、ダミー映像符号化情報に伴
う、符号化映像時間情報に基づくものとなる。従って、
ダミー映像符号化情報に相当する「3.75秒」を示す同期
間隔時間情報S109が取得されることとなる。映像音
声同期手段110は、「3.75秒」を示す音声時間情報S
114、および映像時間情報S116を符号化音声読み
出し手段113、および符号化映像読み出し手段115
にそれぞれ出力する。符号化音声読み出し手段113は
S114に応じて、3.75秒に相当する符号化音声情報S
153を読み出して、映像音声同期手段110に出力す
る。一方符号化映像読み出し手段115は、3.75秒分の
符号化音声情報S153、すなわち蓄積されたダミー符
号化映像情報を読み出して、映像音声同期手段110に
出力し、映像音声同期手段110では、映像音声符号化
多重化情報S170が作成される。
【0100】そして、本実施の形態3における映像バッ
ファリング手段506は、ダミー映像挿入時間S504
を入力した後は、映像符号化手段107から出力される
符号化映像情報S162に対して、ダミー映像挿入時間
S504に相当する量だけ、蓄積せずに廃棄する。
【0101】このように、本実施の形態3の映像音声符
号化多重化装置によれば、実施の形態1による映像音声
符号化多重化装置に対して、音声バッファに蓄積された
全符号化音声情報に相当する原音声情報の再生時間を求
めて出力する符号化音声蓄積時間出力手段501と、映
像バッファに蓄積された全符号化映像情報に相当する原
映像情報の再生時間を求めて出力する符号化映像蓄積時
間出力手段502と、ダミー映像挿入時間を求めて、符
号化映像情報の処理を制御する音声途切れ防止手段50
3と、ダミー符号化映像情報を作成するダミー映像挿入
手段505とを追加する構成とし、映像バッファリング
手段506は、ダミー映像挿入時間を入力されたとき、
相当する時間だけ符号化映像情報を蓄積せずに廃棄する
ものとしたことで、音声バッファリング手段104内部
の音声バッファに符号化音声情報が蓄積されすぎ、バッ
ファがあふれるおそれが生じた際には、音声バッファに
蓄積された音声と同様の再生時間となるようにダミーの
符号化映像情報を映像バッファリング手段506に出力
し、両者の蓄積量を( 再生時間上) 同一にして、映像音
声同期手段110に映像音声の符号化情報を読み出させ
る。このため、ダミーの符号化映像情報を再生する時間
だけ、映像は止まってしまうが、符号化音声情報がバッ
ファからあふれ、映像と音声との同期がとれなくなる等
の事態を回避することが可能となる。
【0102】加えて、本実施の形態3に示したバッファ
あふれを回避する構成については、映像や音声がとぎれ
る可能性があるものの、バッファの大きさによらず、音
声と映像との同期を保証することができる。すなわち、
比較的小さなバッファでも、音声と映像とが同期した映
像音声符号化多重化情報を得ることができる。このこと
は、必要なメモリの量を低減できるという効果が得られ
る。加えて、本発明をテレビ電話、テレビ会議等の、イ
ンタラクティブ性を重視するシステムに応用した際に
は、バッファの量が小さいため、符号化のための遅延を
小さくでき、コミュニケーションの円滑化が図れるとい
う効果も得られる。
【0103】なお、本実施の形態3ではダミー符号化映
像情報として「前回の静止画像と同じ」という符号を用
いるものとしたが、これには限定されず、他の符号を用
いるものとしてもよい。例えば、ダミー符号化映像情報
を再生することにより、システムの負荷増大のため音切
れが発生する可能性がある旨を使用者に警告するメッセ
ージが表示されるよう設定するものとする等の応用が可
能である。
【0104】また、本実施の形態3では、ダミーの符号
化映像情報を出力した後、映像バッファリング手段50
6が、入力されたダミー映像挿入時間S504に相当す
る時間の分だけ、符号化映像情報を蓄積せず廃棄するこ
ととしたが、これ以外の構成もとることができる。例え
ば、映像符号化手段107が、ダミー映像挿入時間S5
04を入力されるものとし、当該ダミー映像挿入時間S
504に相当する分だけ、原映像情報を符号化せず廃棄
し、したがって符号化映像情報をダミー映像挿入時間の
分だけ出力しないという構成とすることも可能である。
かかる設定とすることで、符号化処理の中断によって負
荷を減少し、その分の計算機資源を他の計算に用いるこ
とができるという利点がある。
【0105】さらに、本実施の形態3では符号化音声情
報のバッファあふれを回避する構成としているものであ
る。これは、一般に音声の途切れの方が再生時に与える
影響が大きいことを考慮したものであるが、かかる構成
に限られるものではなく、これを符号化映像情報のバッ
ファあふれを回避するように構成するという応用も容易
に可能である。その場合、映像バッファリング手段は、
符号化映像情報があふれそうになった時に、その再生時
間に相当するダミーの符号化音声情報を音声バッファリ
ング手段に対して出力する。ダミーの符号化音声情報
は、無音状態をあらわす符号でもよいし、使用者に映像
切れが発生する可能性があることを警告するメッセージ
でもよい。そして、音声バッファあふれと、映像バッフ
ァあふれの双方を回避すべく、この両方を兼ね備えた構
成をとることも可能である。
【0106】また、本実施の形態3では、実施の形態1
において示した、映像ブロックレート情報を用いて同期
のとれた映像音声符号化多重化情報を作成する多重化装
置において、音声バッファあふれを回避する構成とした
が、実施の形態2において示した、符号化映像単位時間
量を用いる構成において、音声バッファあふれを回避す
るものとする応用も可能である。そして、映像バッファ
あふれ、または映像・音声双方のバッファあふれを回避
するものについても同様である。
【0107】さらに、本実施の形態3では、符号化音声
情報は固定ビットレートで出力されるとしたが、当然な
がら、音声ブロックレート情報や、符号化音声単位時間
量を用いることにより、音声も変動ビットレートで出力
されるものとして、映像音声符号化多重化装置を構成す
ることが可能である。
【0108】実施の形態4.本発明の実施の形態4によ
る映像音声符号化多重化装置は、ダミー情報の挿入によ
るバッファあふれの防止と多重化処理における同期との
実現を、フレーム間符号化を伴う処理において行うもの
である。図9、および図10は、フレーム間符号化を伴
う処理におけるダミー符号化映像情報挿入による問題点
を説明するための図である。一般に、符号化映像情報と
は、MPEG(motion picture expert group) 規格などで規
定された圧縮符号化方式等を用いて符号化されたものを
いい、実施の形態1〜3に示した映像音声符号化多重化
装置においても、かかる規格に適合した符号化多重化情
報が得られるものである。
【0109】映像を対象とする場合は、映像がデジタル
化された、一連の静止画像(フレーム画像)からなる映
像データである原映像情報に対して、圧縮符号化処理を
行うものであり、この処理については、1フレーム(1
画面相当)の静止画像について、その空間的相関関係
(フレーム内の相関関係)に基づいて、冗長性を除いて
圧縮を行うフレーム内符号化と、時間的に近接する、例
えば連続するフレームの静止画像について、その時間的
相関関係(フレーム間の相関関係)に基づいて冗長性を
除いて圧縮を行うフレーム間符号化とがある。
【0110】従来の技術による映像符号化装置では、基
本的にフレーム内符号化を行うものであるが、フレーム
間符号化をも行うことで、高圧縮率の符号化データが得
られる。もっとも、フレーム間符号化を行うためには、
符号化の逆処理である復号化処理や、動き検出・動き補
償処理により、予測画像を生成し、この予測画像と符号
化対象画像との差分を取得するものであるので、これら
の処理を必要とする分、装置にとっての処理負担の増大
を招くこととはなる。フレーム間符号化を行う場合の予
測画像の生成については、直前に処理したデータに基づ
いて予測を行う順方向予測、直後に処理されるデータに
基づいて予測を行う逆方向予測、および順方向、または
逆方向予測を行う双方向予測のいずれかがなされる。フ
レーム内符号化を「I」(intra frame coding)、順方向
予測符号化を「P」(predictivecoding) 、双方向予測
符号化(逆方向を含む)を「B」(bidirectionally pre
dictive coding) と表記する。
【0111】図9は、フレーム内符号化と、順方向予測
符号化とを組み合わせて処理する場合を示している。順
方向予測符号化では、動画像の時間的な冗長性を利用し
て、一つ前の静止画像の符号化情報との差分のみを今回
の符号化情報とすることを実行する。同図において、I
と表示してあるものは、一つのフレーム画像においてフ
レーム内符号化が行われたものであって、他の符号化情
報に依存せず、独立して復号化ができる、独立符号化映
像情報であることを表す。Pと表示してあるものは、直
前に処理されたフレーム画像を用いて、順方向予測符号
化が行われたものであって、図示するような参照関係に
より、一つ前の符号化情報との差分のみを符号化してあ
り、復号化に際しては一つ前の符号化情報が必要となる
差分符号化映像情報であることを表す。同図に示すよう
に、フレーム内符号化と、順方向予測符号化とを組み合
わせて処理することで得られた符号化情報では、いくつ
かの独立符号化情報と、数多くの差分符号化情報とが配
列された形で構成されるものとなる。
【0112】図10は、このような処理がなされる場合
において、実施の形態3で示したダミー符号化映像情報
挿入をそのまま応用した場合の問題点を説明するための
図である。実施の形態3に示した映像音声符号化多重化
装置において、図9に示すような符号化映像情報が出力
される予定であったときに、音声バッファにおいてバッ
ファあふれが発生しそうになり、図10のA区間がダミ
ー映像に置き換えられたとする。この場合、図のF1で
示した符号化情報は、F0の符号化情報がダミー映像と
なってしまったため、差分を参照する符号化情報を失
い、復号化できなくなってしまう。F1が復号化できな
いと、F1を参照するF2も復号化できず、したがって
F3も復号化できない。よって、この符号化映像情報を
復号化する際、この部分で復号化処理が止まってしまう
という問題が発生する。
【0113】本実施の形態4による映像音声符号化多重
化装置は、上記の問題点を解決し得るものである。本実
施の形態4の映像音声符号化多重化装置は、図7に示す
実施の形態3に示したものと同じ構成であるが、映像バ
ッファリング手段506が、ダミー映像挿入時間S50
4を入力された際の動作が実施の形態3とは異なるもの
となる。図11は、本実施の形態4における映像バッフ
ァリング手段506の動作を説明するための図である。
【0114】同図において、801は、映像バッファリ
ング手段506に入力された符号化映像情報の構成を、
802は、映像バッファリング手段506の映像バッフ
ァに、実際に蓄積された符号化映像情報の構成を示して
いる。図中のIやPの記号は、図9〜10と同一の意味
である。また、図中のDは、挿入されるダミー符号化映
像情報である。ダミー符号化映像情報は実施の形態3と
同様に「前回の静止画像と同じ」という符号であり、こ
れは独立して復号化することができる独立符号化情報で
ある。
【0115】本実施の形態4による映像音声符号化多重
化装置の、映像・音声処理の際の動作は、ダミー映像挿
入時間S504を入力された際の映像バッファリング手
段506の動作を除いて、実施の形態3と同様のものと
なるので、かかる場合における映像バッファリング手段
506の動作のみを以下に説明する。
【0116】図11に示すW時点に至るまで、X 区間の
符号化映像情報が入力され、このX区間の符号化映像情
報については、映像バッファリング手段によって、その
まま内部の映像バッファに格納される。
【0117】W時点以降、ダミー映像挿入手段505よ
り出力されたA区間のダミー符号化映像情報が映像バッ
ファリング手段506に入力され、映像バッファに蓄積
される。実施の形態3の場合と同様に、符号化映像情報
801に含まれる、A区間に相当する符号化映像情報
は、映像バッファリング手段506によって、映像バッ
ファに蓄積されることなく廃棄される。
【0118】この後の動作は、実施の形態3とは異なる
ものとなり、廃棄を行った後の符号化映像情報につい
て、本実施の形態4における映像バッファリング手段5
06は以下のような判定と処理とを実行する。すなわ
ち、廃棄の後に入力された符号化映像情報に対して、復
号化に際しては一つ前の符号化情報が必要となる差分符
号化映像情報(P符号)であるか、他の符号化情報に依
存せず、独立して復号化ができる、独立符号化映像情報
(I符号)であるかの判定を行い、P符号であれば蓄積
せずに廃棄して、ダミー符号化映像情報をその代わりに
蓄積する。一方I符号であれば、そのまま蓄積し、以後
はかかる判定処理を行わない。
【0119】図11において、A区間終了後に入力され
た符号化映像情報F1に対して、映像バッファリング手
段506は、上記の判定を実行し、P符号であるのでこ
れを廃棄して、「前回の静止画像と同じ」という符号で
あるダミー符号化映像情報(D符号)を蓄積する。すな
わち、P符号をD符号に変換して蓄積する。符号化映像
情報F2、およびF3についてもF1と同様に扱われ、
D符号化が蓄積されることとなる。続いて、符号化映像
情報F4が入力され、判定が実行されたとき、F4はI
符号であるのでこのまま蓄積され、この後に入力される
F5以降の符号化映像情報に対しては、判定が行われる
ことなくそのまま蓄積される。
【0120】実施の形態3の場合、映像バッファリング
手段506は図10に示すように、ダミー映像挿入時間
S504に相当するA区間の符号化映像情報S162を
単純に廃棄するものであった。従って、同図を用いて説
明したように復号処理に際しての問題点が生ずるもので
あったが、本実施の形態4では、映像バッファリング手
段506の映像バッファに蓄積された符号化映像情報8
02が、映像音声符号化多重化情報に用いられることと
なり、符号化映像情報802では、参照されるべきI符
号がないP符号については、D符号に変換することによ
って、かかる問題点を回避し得るものとなっている。す
なわち、本実施の形態4においては、実施の形態3に比
べて、映像が停止する(応用例によれば警告が表示され
る)時間が長くはなるものの、復号処理が停止する事態
には至らない。
【0121】このように、本実施の形態4による映像音
声符号化多重化装置によれば、実施の形態3と同じ構成
において、映像バッファリング手段506が、ダミー符
号化映像情報の挿入後に入力される符号化映像情報に対
して、独立符号化映像情報であるか、差分符号化映像情
報であるかの判定を行い、参照関係を必要とする差分符
号化映像情報である場合には、これをダミー符号化映像
情報に変換して蓄積するものとしたことで、符号化映像
情報の参照関係に矛盾をきたさぬようにして、復号処理
時における再生トラブルを防止することが可能となる。
従って、実施の形態3に示したバッファあふれの防止
が、より広範囲の符号化処理に対して、好適に実施でき
るという効果が得られる。
【0122】また、本実施の形態4では、映像符号化手
段107が出力した符号化映像情報S162における参
照関係を映像バッファリング手段506がチェックする
こととなるので、映像符号化手段107においては、ダ
ミー符号化映像情報が挿入されるか否かにかかわらず、
通常の符号化動作を続けることとして差し支えないもの
となる。実施の形態3において説明したように、ダミー
映像挿入時間を映像符号化手段に出力し、映像符号化手
段が符号化を停止するという構成とすることで、パフォ
ーマンス向上を図ることが可能であるが、かかる場合に
は、映像符号化手段がダミー映像挿入時間を解釈し、こ
れに対応した処理を行い得るものであることが必要であ
る。これに対して、本実施の形態4によるならば、ダミ
ー符号化映像情報挿入について考慮せずに、通常の符号
化動作を行う映像符号化手段を用いて、符号化映像情報
の参照関係に破綻を来すことなく、実施の形態3に示し
たバッファあふれの回避を好適に実行できるものとな
る。これは、映像符号化手段107としては、内部の動
作を外部から変更することができない市販されているソ
フトウエアモジュールや、ハードウエアなどを用いて
も、上述した効果を達成することができるということと
なる。
【0123】なお、本実施の形態では、参照することが
できなくなった差分符号化情報をダミーの符号にするも
のとしたが、これに限られるものではなく、参照関係を
必要としない独立符号化情報であるならば、どのような
ものでも適用することができる。例えば、音声があふれ
そうなことを示す画像を再生画面として持つ独立符号化
情報などを用いることもでき、同様の効果が得られる。
【0124】実施の形態5.本発明の実施の形態5によ
る映像音声符号化多重化装置は、実施の形態4と同様
に、ダミー情報の挿入によるバッファあふれの防止と多
重化処理における同期との実現を、フレーム間符号化を
伴う処理において行うものである。図12は、本実施の
形態5による映像音声符号化多重化装置の構成を示すブ
ロック図である。同図において、音声途切れ防止手段5
03は、図7に示す実施の形態3と同じ機能を有するも
のであるが、実施の形態3ではダミー映像挿入時間S5
04を映像バッファリング手段506に出力していたの
に対して、本実施の形態5では映像符号化手段507に
出力するものである。
【0125】映像符号化手段507は、ダミー映像挿入
時間S504を入力されたとき、当該ダミー映像挿入時
間S504に相当する時間の分だけ、入力される原映像
情報S161に対して符号化処理を実行せずに、原映像
情報を廃棄し、従ってダミー映像挿入時間S504に相
当する分の符号化映像情報S162を出力しないもので
ある。また、本実施の形態4において映像符号化手段5
07は、原映像情報のフレームごとに、定められた符号
化パターンに従って、フレーム内符号化と順方向予測符
号化とを実行するものとする。
【0126】以上の点を除いて、本実施の形態5による
映像音声符号化多重化装置は、実施の形態3による装置
と同様の構成である。また、図13は、本実施の形態5
における、音声途切れ防止手段503と、映像符号化手
段507との動作を説明するための図である。同図にお
いて、901は映像符号化手段507が実行する予定で
あった符号化処理における符号化パターンを示してい
る。また、902は、映像符号化手段507から映像バ
ッファリング手段506に出力され、映像バッファにお
いて蓄積される符号化映像情報を示している。図中の
I、P、およびDは実施の形態4と同様である。
【0127】本実施の形態5による、映像音声符号化多
重化装置の、映像・音声処理の際の動作について、以下
に図12、および図13を参照して説明する。通常時、
すなわち、音声バッファあふれのおそれのない状態にお
いては、実施の形態3と同様に、映像音声入力手段(ビ
デオカメラ)101による映像・音声の入力から、ファ
イル管理手段112による映像音声符号化多重化情報S
170の処理までが実行される。この場合、映像符号化
手段507では、図13に示す時点Wまで予定通りのパ
ターンに従って符号化処理を行う。
【0128】W時点において、音声バッファリング手段
104の音声バッファにおいて、蓄積量が一定量を超え
たものとする。音声途切れ防止手段503は実施の形態
3と同様に動作して、T3を求める。実施の形態3の場
合、このT3を用いてダミー挿入時間S504としたも
のであるが、本実施の形態5では、本来のダミー挿入時
間である時間T3でなく、音声途切れ防止手段503に
よる以下のような判定処理で求められるダミー挿入時間
S504を用いるものである。
【0129】まず、音声途切れ防止手段503は、ダミ
ー符号化映像情報挿入開始の時点から、本来のダミー挿
入時間である時間T3だけ経過した時点において再生さ
れるべき符号化映像情報を特定して、当該符号化映像情
報が復号し得るものであるか否かを判定する。この判定
は、当該符号化映像情報に対して、符号化処理によって
I符号が得られるか、P符号が得られるかを符号化パタ
ーンの予定に従って調べることで実行される。当該符号
化映像情報が復号し得るものであれば、判定処理は終了
するが、復号し得ないものであれば、後続の符号化映像
情報に対して同様の判定を行い、これを繰り返すことに
よって、最初の復号し得る符号化映像情報を特定して、
その再生タイミングを取得する。かかる再生タイミング
を取得したならば、音声途切れ防止手段503は、ダミ
ー符号化映像情報挿入開始の時点から、当該再生タイミ
ングが示す時点までの時間を、ダミー挿入時間S504
として、これを出力する。
【0130】図13に示す例では、まずW時点における
符号化映像情報の再生タイミングであるタイミングP1
を求め、該求めたP1に対して、本来のダミー挿入時間
に相当する時間T3を加算することによりタイミングP
2(ダミー挿入時間経過時点に相当)を求め、タイミン
グP2に相当する符号化映像情報であるF1を特定し
て、上記判定を行う。図示するようにF1に対しては、
P符号を得る順方向予測符号化処理が予定されており、
P符号、すなわち差分符号化映像情報であるF1は参照
関係を必要とし、F0がないと復号化ができないもので
あるが、F0はタイミングP1とタイミングP2との間
に相当する再生タイミングを有する符号化映像情報であ
り、符号化されない予定のものとなっているため、F1
は復号し得ないという判定結果が得られる。
【0131】音声途切れ防止手段503は、後続の符号
化映像情報に対して判定処理を行い、復号し得る符号化
映像情報として、F2を特定し、その再生タイミングで
あるP3を取得する。そして、P3−P2なる時間を演
算によって求め、該求めた時間を時間T3に加算するこ
とで、時間T4が得られる。この時間T4を、ダミー映
像符号化情報挿入開始より、符号化映像情報F2の再生
タイミングが示す時点までの時間、すなわちダミー挿入
時間S504として用いるものである。
【0132】音声途切れ防止手段503は、ダミー映像
挿入時間S504を、ダミー映像挿入手段505と、映
像符号化手段507とに出力する。ダミー映像挿入時間
S504を入力された映像符号化手段507において
は、ダミー挿入時間S504に相当する分だけ符号化を
休止する。一方、ダミー映像挿入手段505は実施の形
態3と同様の動作を行う。図13において、時点Wから
T4の時間だけは映像符号化処理が行われず、該当する
分のダミー符号化映像情報が映像バッファに蓄積される
こととなる。その後、F2以降はX区間と同様に予定通
りの符号化処理が実行される。
【0133】このように、本実施の形態5による映像音
声符号化多重化装置によれば、実施の形態3と同じ構成
において、音声途切れ防止手段503が、参照関係の破
綻の有無についての判定処理の実行により修正したダミ
ー映像挿入時間S504を求め、これをダミー映像挿入
手段505と、映像符号化手段507とに出力し、映像
符号化手段507ではダミー映像挿入時間S504に対
応する時間だけ、映像符号化処理を停止するものとした
ことで、実施の形態4と同様に、符号化映像情報の参照
関係に矛盾をきたさぬようにして、復号処理時における
再生トラブルを防止することが可能となる。従って、本
実施の形態5においても、実施の形態3に示したバッフ
ァあふれの防止が、より広範囲の符号化処理に対して、
好適に実施できるという効果が得られる。
【0134】また、本実施の形態5では、ダミー映像挿
入時間の間、映像符号化手段はその動作を停止するの
で、符号化による計算機資源を他の( 例えば音声符号化
手段)プロセスに譲ることができ、他のプロセスの進捗
状況が好転するといった格別の効果を持つ。
【0135】そして、実施の形態4において説明したと
同様に、本実施の形態5においても、映像符号化手段と
しては、ダミー映像が挿入されたことは考慮せず符号化
処理を行うことができるので、内部の動作を変更できな
い、例えば市販の映像符号化手段を用いて本実施の形態
5による装置を実現することが可能である。
【0136】なお、本実施の形態5では、ダミー映像挿
入時間S504を入力した映像符号化手段507は、自
らその符号化動作を中止するものとして説明したが、こ
のことは、実際には、符号化動作を行う映像符号化モジ
ュールをコールするルーチンが、ダミー映像挿入時間の
間、そのコールを休止するといった方法によって実行す
ることができる。
【0137】実施の形態6.本発明の実施の形態6によ
る映像音声符号化多重化装置は、映像、及び音声の符号
化情報を用いてバッファにおいて、多重化情報とするも
のである。図14は、本発明の実施の形態6による映像
音声符号化多重化装置の構成を示すブロック図である。
図示するように、本実施の形態6による符号化多重化装
置は、映像音声入力手段101、音声キャプチャ手段1
02、音声符号化手段103、映像キャプチャ手段10
6、映像符号化手段107、ファイル管理手段112、
音声バッファリング手段701、映像バッファリング手
段702、映像音声バッファ703、および映像音声同
期手段704を備えたものである。
【0138】同図において、音声バッファリング手段7
01は、音声符号化手段103が出力した符号化音声情
報を一時的に蓄積するものである。実施の形態1におけ
る音声バッファリング手段と異なり、内部にバッファは
持たず、後述する映像音声バッファ703に一時蓄積を
行う。映像バッファリング手段702は、映像符号化手
段107が出力した符号化映像情報を一時的に蓄積する
ものである。実施の形態1における映像バッファリング
手段と異なり、内部にバッファは持たず、後述する映像
音声バッファ703に一時蓄積を行う。映像音声バッフ
ァ703は、半導体メモリ等の高速な記憶装置によって
実現され、符号化音声情報、及び符号化映像情報が一時
的に蓄積される。映像音声同期手段704は、上記映像
音声バッファ703のうち、符号化映像情報と符号化音
声情報とが隙間なく格納された部分を読み出し、これを
出力するものである。
【0139】映像音声入力手段101、音声キャプチャ
手段102、音声符号化手段103、映像キャプチャ手
段106、映像符号化手段107、およびファイル管理
手段112については実施の形態1と同様であり、説明
を省略する。
【0140】図15は、本実施の形態6の音声符号化多
重化装置による、符号化、及び多重化の処理の一例を示
すフローチャート図である。図16は本実施の形態6の
音声符号化多重化装置における、情報の流れを示す図で
ある。図16に示すように、映像音声バッファ703に
ついては、符号化音声情報が格納されるブロックと、符
号化映像情報が格納されるブロックとが、実施の形態1
における同期間隔時間情報に対応した再生時間Tmの単
位(すなわち、S1とS2の単位)で、あらかじめ交互に並
べられているものである。本実施の形態6では、上記の
時間Tmを0.1秒、符号化映像情報のビットレート
(単位時間あたりの量)を1500Kbit/sec、符号化音声情
報のビットレートを192Kbit/sec とする。したがって、
S1は150Kbit 、S2は19.2Kbitとなる。さらにここでは、
映像シーケンスヘッダと音声シーケンスヘッダも、符号
化映像情報が格納されるブロックの前と、符号化音声情
報が格納されるブロックの前とに、あらかじめ書き込ま
れているものとする。
【0141】音声バッファリング手段701は符号化音
声情報を映像音声バッファ703に蓄積する際に、デー
タの蓄積された映像蓄積用ブロックに挟まれた、空の音
声蓄積用ブロックがあれば、そのような音声蓄積用ブロ
ックに前の方から蓄積し、ないならば空の音声蓄積用ブ
ロックに前の方から蓄積する。映像バッファリング手段
702による蓄積も同様である。
【0142】また、映像音声バッファ703は、実施の
形態1で説明したのと同様に、FIFO(First-In-First-Ou
t)構造をとること、すなわち、先入れ先出しの処理を行
い得るものであることが望ましいものであり、かかるFI
FO構造は、具体的には、リングバッファ等のアルゴリズ
ムに従うことによって実現することが可能である。すな
わち、符号化音声情報も符号化映像情報も順に先頭から
後尾へ向かって格納された後、格納が終わったものから
先頭から後尾へ向かって順に読み出され、読み出された
ブロックは空のブロックとなるように、読み出しと書き
込みとが実行される。情報の格納が後尾まで達した場合
は、すでに読み出され空となった先頭のブロックに戻っ
てまた新しい情報の格納を行う。ただし、必ずしもリン
グバッファ等の特定の手法を必要とするものではない。
【0143】このように構成された映像音声符号化多重
化装置の動作を、図15のフローに従って、図14、お
よび図16を参照しながら、以下に説明する。図15の
ステップ1において、ビデオカメラ101(図16)か
らの映像・音声の入力があるとき、ステップ2以下が実
行される。ステップ2では、ビデオカメラ101が映像
・音声をとりこみ、アナログ音声情報S150とアナロ
グ映像情報S160とに分けて出力し、映像キャプチャ
手段106は、ビデオカメラ101より出力されたアナ
ログ映像情報S160を入力し、デジタル化して原映像
情報S161を出力する。そして、映像符号化手段10
7は、原映像情報S161を符号化し、符号化映像情報
S162として出力する。静止画像2枚分にあたる0.
066秒分の100Kbit を出力したとする。
【0144】ステップ3において、映像バッファリング
手段702は、ステップ2で出力された100Kbit の符号
化映像情報S162を、映像音声バッファ703の映像
蓄積用のブロックに蓄積する。映像蓄積用ブロックの大
きさは、S1、すなわち150Kbit なので、この符号化映像
情報は、第1の映像蓄積用ブロックの途中まで格納され
ることとなる。
【0145】ステップ4では、映像音声同期手段704
によって、映像音声バッファ703において映像ブロッ
ク、音声ブロックともに満たされている部分があるか否
かが判定されるが、ここではいずれのブロックも満たさ
れてはいないので、ステップ6に移行し、音声キャプチ
ャ手段102は、ビデオカメラ101より出力されたア
ナログ音声情報S150を入力し、デジタル化して原音
声情報S151を出力する。そして、音声符号化手段1
03は、原音声情報S151を符号化し、符号化音声情
報S152として出力する。ここでの経過時間が0.1
秒だったので、19.2Kbitの符号化音声情報S152を出
力する。
【0146】続いてステップ7で、音声バッファリング
手段701は、ステップ6で出力された19.2Kbitの符号
化音声情報S152を、映像音声バッファ703の音声
蓄積用のブロックに蓄積する。この量は音声蓄積用ブロ
ックの大きさであるS2なので、この情報は、第1の音声
蓄積用ブロックがちょうど一杯になるまで蓄積されるこ
ととなる。
【0147】ここで、他のプロセスにCPU処理の時間
をとられ、その後、ステップ8ではステップ4と同様の
判定が行われる。ここでは符号化映像ブロックが満たさ
れていないので、ステップ2が実行され、映像符号化手
段107に制御が移った時、ステップ3から1秒の時間
が経過していたとする。ステップ2では、映像符号化手
段107は、1秒分の符号化映像情報S162、1500Kb
itを出力する。
【0148】そして、ステップ3において、映像バッフ
ァリング手段702は、ステップ2で出力された1500Kb
itの符号化映像情報S163を、映像音声バッファ70
3の映像蓄積用ブロックに蓄積する。この符号化映像情
報S163は、まず第1の映像蓄積用ブロックを満た
し、それから第2以降の複数の映像蓄積用ブロックに分
けて格納されることとなる。
【0149】次のステップ4の判定では、第1の映像蓄
積用ブロックと第1の音声蓄積用ブロックとが共に満た
されたので、ステップ5が実行される。ステップ5にお
いて、映像音声同期手段704は、第1の映像蓄積用ブ
ロックと第1の音声蓄積用ブロックとをシーケンスヘッ
ダと共に読み出し、これをファイル管理手段112に出
力する。また、映像音声バッファ703における、読み
出されたブロックは空のブロックとする。ファイル管理
手段112は、映像音声同期手段704より出力された
映像音声符号化多重化情報S170を、ファイルに追加
格納する。
【0150】次のステップ4の判定では、音声蓄積用ブ
ロックが満たされていないため、それ以上のバッファか
らの読み出し(ステップ5の実行)は行われず、ステッ
プ6に移行し、ここで音声符号化手段103に制御が移
る。先のステップ7より1.2秒分の時間経過があった
ので、音声符号化手段103は、1.2秒分の230.4Kbi
t の符号化音声情報S152を出力する。そして、ステ
ップ7において、音声バッファリング手段701は、ス
テップ6で出力された230.4Kbit の符号化音声情報S1
53を、映像音声バッファ703の音声蓄積用ブロック
に蓄積する。この情報は、第2以降の複数の音声蓄積用
ブロックに分けて格納される。
【0151】ステップ8の判定では、直前のステップ7
までの段階で、第2から第10までの映像蓄積用ブロッ
クと第2から第10までの音声蓄積用ブロックが共に満
たされているので、ステップ9が実行され映像音声同期
手段704は、第2から第10までの映像と音声の蓄積
用ブロックをシーケンスヘッダと共に順次読み出し、こ
れを出力する。また、映像音声バッファ703におけ
る、読み出されたブロックは空のブロックとする。そし
て、ファイル管理手段112は、出力された映像音声符
号化多重化情報S170をファイルに追加する。以上の
ような課程はステップ1の判定において、映像音声の入
力があるとされる間、繰り返される。
【0152】このように本実施の形態6による映像音声
符号化多重化装置では、映像バッファリング手段702
と、音声バッファリング手段701とによって、符号化
された映像と音声の情報を一旦バッファに貯えるとき、
映像と音声とに共通の、あらかじめ決められた単位で交
互に並べられたバッファである、映像音声バッファ70
3を用いる。このため、映像と音声の両者が映像音声符
号化多重化情報S170として出力できる量に達した時
には、もうすでに映像と音声の並び替えが完了している
ので、映像音声同期手段704は、そのままバッファの
内容を読み出し、出力すればよい。このため、蓄積用ブ
ロックに符号化情報を格納した段階で同期化処理が完了
するという構成となり、実施の形態1による装置のよう
にブロックレート情報を蓄積し、管理する必要のあるも
のではない。さらに、映像と音声の並び替えのためのバ
ッファが不要なので、メモリの必要量も少なくてよい。
【0153】なお、図15のフローチャートについて
は、映像符号化→バッファ量判定→音声符号化→バッフ
ァ量判定というアルゴリズムを採用しているが、これは
一例であって、映像符号化と音声符号化とを任意の順で
行った後に、バッファ量判定を行うアルゴリズムに従う
ことも可能であるし、これらのような固定的な処理手順
とせず、映像・音声それぞれの符号化、バッファ量判
定、及び読み出しから格納までを別個の動作として並行
的に行うことも可能であり、必ずしも同図のフローチャ
ートの流れに従って動作する必要があるものではない。
【0154】また、本実施の形態6においては、映像・
音声ともに符号化情報が固定ビットレートで出力される
ものとして説明したが、変動ビットレートである場合に
も対応可能である。この場合、例えば映像バッファリン
グ手段においては、一時蓄積を行う際の符号化音声情報
の出力ビットレートを記憶するものとして、符号化映像
情報を映像音声バッファに蓄積する際には、当該記憶し
たビットレートに基づいて、符号化音声情報の一時蓄積
に必要な領域の大きさを取得し、その分だけ間隙をおい
て符号化映像情報を一時蓄積する、というような設定と
することで対応することが可能である。
【0155】ただし、映像・音声とも固定ビットレート
である場合には、本実施の形態6に示したように、大き
さ、および位置の定められた蓄積用ブロックをあらかじ
め配置して、該ブロックに符号化情報を蓄積する構成を
採用することで、迅速に映像音声符号化多重化情報を得
られるという効果が特に顕著なものとなる。
【0156】実施の形態7.本発明の実施の形態7によ
る映像音声符号化多重化装置は、符号化音声情報、及び
符号化映像情報を一時蓄積する量を抑制して、保存用記
憶装置に格納するものである。図17は、本発明の実施
の形態7による映像音声符号化多重化装置の構成図であ
る。図示するように、本実施の形態7による符号化多重
化装置は、映像音声入力手段101、音声キャプチャ手
段102、音声符号化手段103、映像キャプチャ手段
106、映像符号化手段107、音声バッファリング手
段801、映像バッファリング手段802、およびファ
イル管理手段803を備えたものであって、実施の形態
6による装置とは、映像音声バッファ(図14の70
3)、および映像音声同期手段(同図704)を備えな
い点が異なる。
【0157】同図において、音声バッファリング手段8
01は、内部に音声バッファを有し、そのバッファが一
杯になると、その内容を保存用記憶装置に書き込むよう
に、ファイル管理手段803に出力するものである。映
像バッファリング手段802は、音声バッファリング手
段801と同様に、内部に、バッファを有し、そのバッ
ファが一杯になると、その内容を保存用記憶装置に書き
込むように、ファイル管理手段803に出力するもので
ある。音声バッファリング手段801の音声バッファ、
及び映像バッファリング手段802の映像バッファと
も、その大きさは、ファイル管理手段803が管理する
保存用記憶装置について、規定された最小の書き込み単
位の大きさと同じ大きさであるものとする。ファイル管
理手段803は、音声バッファリング手段801、及び
映像バッファリング手段802が書き込み位置を指定し
て出力する符号化情報を保存用記憶装置に格納する。
【0158】映像音声入力手段101、音声キャプチャ
手段102、音声符号化手段103、映像キャプチャ手
段106、および映像符号化手段107については実施
の形態1と同様であり、説明を省略する。
【0159】図18は本実施の形態7の音声符号化多重
化装置による、符号化、及び多重化の処理の一例を示す
フローチャート図である。図19は本実施の形態1の音
声符号化多重化装置における、情報の流れを示す図であ
る。図19に示すように、音声バッファリング手段80
1と映像バッファリング手段802の両者とも、保存用
記憶装置へ情報を書き込む際、保存用記憶装置上で、映
像と音声が交互に並ぶよう、再生時間Tmの単位(すな
わち、情報の量としてはS1とS2の単位)で、他方が格納
される部分を飛ばして記録するよう、記録位置を指定す
るものである。保存用記憶装置として、一般的なハード
ディスク等を用いるのであれば、通常、その最小の書き
込み単位はセクタの大きさになるので、音声バッファリ
ング手段801、及び映像バッファリング手段802と
も、セクタの大きさだけの内部バッファをもち、セクタ
単位で書き込み指定を行うことになる。ここでは、セク
タの大きさを5008bit(626byte)、符号化映像情報のビッ
トレートを1500Kbit/sec、符号化音声情報のビットレー
トを200Kbit/sec 、再生時間Tmを0.1秒とし、さら
に、各セクタの先頭に映像、及び音声を示す8bitのシー
ケンスヘッダをつけるものとする。従って、再生時間T
に対応する符号化映像情報の量は150Kbitで、セクタ30
個分、符号化音声情報の量は20Kbitで、セクタ4個分で
ある。ファイル管理手段803は、音声バッファリング
手段801、及び映像バッファリング手段802の指示
に従って、情報をセクタ単位に書き込むものとする。
【0160】このように構成された本実施の形態7によ
る映像音声符号化多重化装置の動作を、図18のフロー
に従って、図17および図19を参照しながら、以下に
説明する。
【0161】図18のステップ1において、ビデオカメ
ラ101からの映像・音声の入力があるとき、ステップ
2以下が実行される。ステップ2では、ビデオカメラ1
01が映像・音声をとりこみ、アナログ音声情報S15
0とアナログ映像情報S160とに分けて出力し、映像
キャプチャ手段106は、ビデオカメラ101より出力
されたアナログ映像情報S160を入力し、デジタル化
して原映像情報S161を出力する。そして、映像符号
化手段107は、原映像情報S161を符号化し、符号
化映像情報S162として出力する。静止画像2枚分に
あたる0.066秒分の100Kbit を出力したとする。
【0162】ステップ3では、映像バッファリング手段
802は、上記100Kbit の符号化映像情報S163を、
保存用記憶装置にシーケンスヘッダと一緒に書き込むよ
うにとの指示を付して、ファイル管理手段803に出力
し、この符号化映像情報S163は、保存用記憶装置の
ある位置よりセクタ20個にわたって格納される。
【0163】ステップ4では、音声キャプチャ手段10
2は、ビデオカメラ101より出力されたアナログ音声
情報S150を入力し、デジタル化して原音声情報S1
51を出力する。そして、音声符号化手段103は、原
音声情報S151を符号化し、符号化音声情報S152
として出力する。ここでの経過時間が0.1秒だったの
で、20Kbitの符号化音声情報S152を出力する。
【0164】続いてステップ5では、音声バッファリン
グ手段801は、上記20Kbitの符号化音声情報S163
を、保存用記憶装置にシーケンスヘッダと一緒に書き込
むようにとの指示を付して、ファイル管理手段803に
出力し、この符号化音声情報S163は、ステップ3で
書き込んだ先頭の位置から30セクタ離れたセクタより、
セクタ4個に格納される。
【0165】ここで、他のプロセスにCPU時間をとら
れたものとし、その後に実行されるステップ1の判定に
おいて、終了でないとされて、ステップ2が実行され、
映像符号化手段107に制御が移った時、先のステップ
3から1秒の時間が経過していたとする。ステップ2
で、映像符号化手段107は、1秒分の符号化映像情報
S162、1500Kbitを出力する。
【0166】そして、ステップ3で映像バッファリング
手段802は、ステップ2で出力された1500Kbitの符号
化映像情報を、保存用記憶装置に格納するように、ファ
イル管理手段803に出力する。符号化映像情報S16
3は、先のステップ3で書き込んだセクタに続けて300
セクタ分格納される。その際、映像バッファリング手段
802からファイル管理手段803には、30セクタごと
に、音声用の4セクタ分の隙間をいれつつ格納するよう
指示がなされる。ファイル管理手段803によって、こ
の指示に従った格納が行われる。
【0167】ステップ4に移行して、音声符号化手段1
03に制御が移った時、先のステップ5より1.2秒分
の時間経過があったとして、音声符号化手段103は、
1.2秒分、240Kbit の符号化音声情報S152を出力
する。続くステップ5において、音声バッファリング手
段801は、ステップ4で出力された240Kbit の符号化
音声情報を保存用記憶装置に格納するように、ファイル
管理手段803に出力する。符号化音声情報S153
は、先のステップ5で書き込んだ、最後のセクタから30
セクタ離れた所から、48セクタにわたって格納するよう
に、また、その際4セクタごとに、映像用の30セクタ分
の隙間をいれつつ格納するように、指示がつけられる。
ファイル管理手段803は、指示に従って符号化音声情
報S153を格納する。以上がステップ1で映像音声の
入力がない、すなわち終了したと判定されるまで繰り返
される。
【0168】上述のように本実施例の映像音声符号化多
重化装置では、容量の小さな内部バッファを持つ音声バ
ッファリング手段801と、映像バッファリング手段8
02とを備え、符号化された映像と音声の情報をなるべ
くバッファにためず、保存用記憶装置に格納するもので
ある。そして、符号化映像情報の格納であれば、符号化
音声情報のための、符号化音声情報の格納であれば、符
号化映像情報のための隙間をあけつつ、格納するように
指示をして、ファイル管理手段803に符号化情報を渡
し、ファイル管理手段803は、この指示に従って符号
化情報を保存用記憶装置に格納する。このため、実施の
形態1、及び2で示した効果に加え、一時的に情報を貯
えるバッファを小さくできる上に、符号化情報のコピー
も1度ですむため、動作が迅速であるという効果も得ら
れる。
【0169】なお、ここでは、最終的に蓄積しようとす
る記憶装置を、一般的な、ハードディスクとして説明を
行ったが、例えば、取り外し可能のメモリカード等を最
終的な記憶装置とした場合は、この例で考慮したセクタ
の大きさなどにとらわれる必要がなく、バッファをさら
に小さくすることが可能である。なお、図18のフロー
チャートについては、必ずしもこの手順で処理を行う必
要がない点は実施の形態6と同様である。
【0170】実施の形態8.本発明の実施の形態8によ
る映像音声符号化多重化装置は、実施の形態6の装置
を、リングバッファを用いて実現しようとする際に起こ
り得る問題点を回避するものである。
【0171】実施の形態6において説明したように、映
像音声符号化多重化装置における一時蓄積においては、
半導体メモリ等が用いられるものであって、一般に限定
された容量において、効率的にFIFO構造を実現する
ことが望まれるものであって、リングバッファの手法に
よってメモリを用いることが一般的である。図20は、
リングバッファの手法を説明するための図である。上述
のように、一時蓄積を行うバッファとしては、限定され
た容量のメモリが用いられるものとするが、メモリはそ
の蓄積部位を位置的に示すアドレスによって管理される
ものである。図示するように、アドレスaから、アドレ
スa+nまでのアドレスを有するメモリをバッファとし
て用いることとする。この際に、該メモリの蓄積部位に
ついて、アドレス番号の増加する方向に蓄積と、取り出
しとを行うものとし、かつ、アドレスa+nの次のアド
レスはアドレスaであるものとして扱うことで、図示す
るように、見かけ上エンドレスにメモリを用いることが
可能となる。このようにして用いることで、限られた容
量を効率的に使用して、FIFO構造を実現することが
できる。
【0172】図21は、実施の形態6による映像音声符
号化多重化装置において、映像音声バッファ(図16の
703)として、リングバッファ手法によって管理する
メモリを用いて実現する際に起こり得る問題点を説明す
るための図である。同図の701は、映像音声バッファ
における音声蓄積ブロックと、映像蓄積ブロックの構成
をあらわしている。説明のため、ここでは、符号化音声
情報のビットレートは384Kbps 、符号化映像情報のビッ
トレートは524Kbps であるものとし、音声蓄積ブロック
と映像蓄積ブロックとは、符号化多重化情報の再生処理
を実行するシステムの制約により、どれも同一の大きさ
であるように作成するものとし、音声と映像のビットレ
ートの差は、音声、および映像のブロックの個数によ
り、吸収されるものとする。すなわち、この例では、映
像と音声のビットレートの比が524:384 、すなわちおよ
そ1.36:1であることから、1個ないし2個の映像ブロッ
クに対して、1個の音声ブロックが並ぶ構成の多重化情
報が作成されることになる。
【0173】この構成をあらわしたのが701である。
同図では、映像音声バッファが無限の大きさを持つもの
であるように表現しているが、現実には使用できるメモ
リは限られているので、同図702に示すように、70
1の一部(A区間)を切り出し、これをリングバッファ
として、繰り返し用いることが実行される。ここで、本
来なら同図701のB区間における、音声蓄積ブロック
と映像蓄積ブロックとの並びが実現されなければならな
いところを、A区間を切り出してこれをリングバッファ
として繰り返し用いるために、ブロックの構成に狂いが
生じ、音声と映像のブロックがずれてくることが起こり
得る。すなわち、同図の702ではリングバッファとし
て用いる一時記憶手段(メモリ)における映像と音声の
ビットレートの比は、1.4:1 であるので、本来の1.36:1
よりわずかに映像蓄積ブロックが多く、このためにずれ
が発生する。このずれを示したのが、702におけるT1
V,T1A,T2V,T2A...TnV,TnA である。TnV とTnA は、時刻
Tnに再生すべき映像の位置と、音声の位置とを、それぞ
れあらわしている。702に示すような、TnV とTnA と
の位置のずれは、リングバッファを繰り返し用いる毎に
増大していく。このような映像音声符号化多重化情報を
再生すると、再生装置のバッファがこのTnV とTnA の位
置のずれを吸収できなくなり、映像と音声の同期がとれ
なくなってしまう事態につながる。
【0174】このような問題を解消するには、映像音声
バッファにおける映像および音声蓄積ブロックの構成
を、リングバッファを再利用する直前に計算しなおし、
映像および音声蓄積ブロックの位置を正しいものに置き
換えればよい。しかし、そのような計算を行うと、実施
の形態6の装置の特徴である、あらかじめブロックの位
置を計算しておき、多重化が始まった後は、定められた
位置に符号化情報を格納するのみの動作を行うことで、
高速に多重化が為されるという効果が、計算による処理
負担の増大のために、損なわれることとなってしまう。
【0175】もちろん、映像音声バッファにおいて、映
像と音声のビットレートの正確な比が実現されていれ
ば、問題はない。しかし、現実にそれを実現するのは困
難が伴い、性能を犠牲にする結果を生む。たとえば、上
述のように、再生処理系の制限により、映像蓄積ブロッ
クと音声蓄積ブロックとが、すべて同じ大きさでなけれ
ばならない場合がある。また、コンピュータシステムに
よっては、映像および音声蓄積ブロックが、処理のため
に効率のよい境界(ワードバウンダリや、ハードディス
クのセクタの倍数の単位など)に、揃えられていること
を要求する場合もある。これらの制限にも対応して、か
つ、有限なメモリ空間において、映像と音声のビットレ
ートの正確な比を、ビットレートのすべての比におい
て、常に実現することは、困難である。本実施の形態8
による映像音声符号化多重化装置では、補正処理を行う
ことによって、かかる蓄積位置のずれの問題を防止し得
るものである。
【0176】図22は、本実施の形態8による映像音声
符号化多重化装置の構成を示すブロック図である。図示
するように、本実施の形態8による映像音声符号化多重
化装置は、実施の形態6による装置に、蓄積ブロック誤
差補正手段901を追加した構成となっている。蓄積ブ
ロック誤差補正手段901は、時間間隔をおいて間欠的
に動作するものであって、ある再生時刻において再生す
べき符号化音声情報を蓄積した音声蓄積ブロックを検出
し、また、当該再生時刻において再生すべき符号化映像
情報を蓄積した映像蓄積ブロックを検出して、映像音声
バッファ902における上記音声蓄積ブロックと上記映
像蓄積ブロックとの配置位置の差を蓄積ブロック誤差と
して検出する誤差検出処理と、該検出した誤差の分を、
映像蓄積ブロックに、または音声蓄積ブロックに対し
て、ダミーのデータを挿入することにより、補正する補
正処理とを行うものである。補正処理において挿入する
ダミーのデータは、映像音声符号化多重化情報を復号化
し再生する復号器にとって、なんの意味も持たないデー
タを用いるものである。又映像音声バッファ902にお
いては、リングバッファ動作が実行されるものとする。
映像音声入力手段101、音声キャプチャ手段102、
音声符号化手段103、映像キャプチャ手段106、映
像符号化手段107、およびファイル管理手段112に
ついては実施の形態1と同様であり、音声バッファリン
グ手段701、および映像バッファリング手段702に
ついては実施の形態6と同様であるので、説明を省略す
る。
【0177】図23は、本実施の形態8による映像音声
符号化多重化装置における、映像・音声処理の際の動作
を説明するための図である。同図に示すように、映像音
声バッファ902については、符号化音声情報が格納さ
れるブロックと、符号化映像情報が格納されるブロック
とが、実施の形態1における同期間隔時間情報に対応し
た再生時間Tの単位(すなわち、S1とS2の単位)で、あ
らかじめ交互に並べられているものである。本実施の形
態8では、符号化音声情報のビットレートは384Kbps 、
符号化映像情報のビットレートは524Kbps であるものと
し、音声蓄積ブロックと映像蓄積ブロックとは、符号化
多重化情報の再生処理を実行するシステムの制約によ
り、どれも同一の大きさであるように作成するものと
し、音声と映像のビットレートの差が、音声、および映
像のブロックの個数により、吸収されるようにS1、お
よびS2が設定されるものとする。すなわち、この例で
は、映像と音声のビットレートの比が524:384 、すなわ
ちおよそ1.36:1であることから、1個ないし2個の映像
ブロックに対して、1個の音声ブロックが並ぶ構成の多
重化情報が作成されることになる。
【0178】映像音声バッファ902については、前述
のように限られた容量において、リングバッファ動作を
するものとしているので、ブロックの個数はビットレー
ト比に正確に対応するものではなく、1.36:1ではなく、
1.4:1 となってしまっているので、リングバッファ動作
の繰り返しにより、上記のような問題が起こることとな
り、同一時刻における映像蓄積ブロックが、音声蓄積ブ
ロックより後方に位置するようになるというずれが生じ
る。そこで、本実施の形態8では、蓄積ブロック誤差補
正手段901が、設定された時間間隔で起動されて機能
し、映像蓄積ブロックにダミーデータを挿入して、映像
蓄積ブロックが音声蓄積ブロックの後方に位置するよう
になっていたものを、音声蓄積ブロックに追いつくよう
にすることで、映像と音声の同期を維持するものであ
る。
【0179】実施の形態6と同様に、映像シーケンスヘ
ッダと音声シーケンスヘッダも、符号化映像情報が格納
されるブロックの前と、符号化音声情報が格納されるブ
ロックの前とに、あらかじめ書き込まれているものとす
る。また、音声バッファリング手段701は符号化音声
情報を映像音声バッファ902に蓄積する際に、データ
の蓄積された映像蓄積用ブロックに挟まれた、空の音声
蓄積用ブロックがあれば、そのような音声蓄積用ブロッ
クに前の方から蓄積し、ないならば空の音声蓄積用ブロ
ックに前の方から蓄積する。映像バッファリング手段7
02による蓄積も同様である。さらに、映像音声同期手
段704によって読み出された符号化情報が蓄積されて
いたブロックは、空のブロックとされる点も実施の形態
6と同様である。
【0180】このように構成された映像音声符号化多重
化装置の動作を、図23に従って、図22を参照しなが
ら、以下に説明する。図23において、ビデオカメラ1
01が映像・音声をとりこみ、アナログ音声情報S15
0とアナログ映像情報S160とに分けて出力し、映像
キャプチャ手段106は、ビデオカメラ101より出力
されたアナログ映像情報S160を入力し、デジタル化
して原映像情報S161を出力する。そして、映像符号
化手段107は、原映像情報S161を符号化し、符号
化映像情報S162として出力する。映像バッファリン
グ手段702は、符号化映像情報S162を、映像音声
バッファ703の映像蓄積用のブロックに、先頭から分
割して蓄積する。映像バッファリング手段702は、蓄
積を行って一杯になったブロックについては「蓄積あ
り」の状態とする。
【0181】一方、音声キャプチャ手段102は、ビデ
オカメラ101より出力されたアナログ音声情報S15
0を入力し、デジタル化して原音声情報S151を出力
する。そして、音声符号化手段103は、原音声情報S
151を符号化し、符号化音声情報S152として出力
する。音声バッファリング手段701は、符号化音声情
報S152を、映像音声バッファ703の音声蓄積用の
ブロックに、先頭から分割して蓄積する。音声バッファ
リング手段701は、蓄積を行って一杯になったブロッ
クについては「蓄積あり」の状態とする。
【0182】映像音声同期手段704は、映像音声バッ
ファ902において、「蓄積あり」の状態となっている
映像蓄積ブロックと音声蓄積ブロックとが連続している
部分について、該連続部分を読み出して、映像音声符号
化多重化情報S170としてファイル管理手段112に
出力する。また、映像音声同期手段110は、読み出し
た部分のブロックを「蓄積可」の状態とする。
【0183】ビデオカメラ101による映像・音声のと
りこみから、音声符号化手段103による符号化音声情
報S152の出力、および映像符号化手段107による
符号化映像情報S162の出力までは同様に行われる。
そして、音声バッファリング手段701、および映像バ
ッファリング手段702は、映像音声バッファ902に
おける、「蓄積可」の状態のブロックに符号化情報の蓄
積を行う。前述のようにリングバッファ動作が行われる
ことから、映像音声バッファの先頭部から最後尾部に向
けて蓄積が行われ、最後尾部に達したなら再び先頭部に
蓄積が行われることが繰り返される。映像音声同期手段
704による読み出しも、やはり先頭部から最後尾部に
向けて実行され、最後尾部に達したなら再び先頭部から
読み出され、読み出されたブロックは「蓄積可」の状態
とされることで、リングバッファ動作が維持される。
【0184】そして、本実施の形態8では、設定された
時間が経過した後に、蓄積ブロック誤差補正手段901
が機能する。蓄積ブロック誤差補正手段901は、映像
音声バッファ902において、最後に蓄積された符号化
映像情報の再生時刻を、当該符号化映像情報が内包する
フレーム情報に基づいて算出し、再生時刻T1を取得す
る。次にT1と同一の再生時刻を有する符号化音声情報
が蓄積された音声蓄積ブロックを、符号化音声情報のビ
ットレートに基づいて求める。最後に蓄積された映像蓄
積ブロックの位置と、上記求めた音声蓄積ブロックとの
位置の差である蓄積ブロック誤差が、1個のブロックの
大きさ以上であった場合には、補正処理を実行する。補
正処理は、当該最後に蓄積された映像蓄積ブロックに後
続する映像蓄積ブロックに対するダミーデータS180
の蓄積と、該ブロックを「蓄積あり」の状態とすること
により、なされる。映像・音声のとりこみが継続する間
は、以上の動作が繰り返し実行され、得られた映像音声
符号化多重化情報は、ファイル管理手段112によって
ファイルに格納される。
【0185】このように本実施の形態8の映像音声符号
化多重化装置によれば、実施の形態6の装置に蓄積ブロ
ック誤差補正手段901を追加する構成としたことで、
符号化された情報を、あらかじめ決められた単位で交互
に並べられたバッファに蓄積し、蓄積ブロック誤差補正
手段901が、定期的に映像と音声の同一の再生時刻を
持つ符号化情報の位置をチェックし、ずれが生じていた
ならば、ダミーデータの挿入によってこれを補正する処
理を行うので、実施の形態6と同様に、同期した多重化
情報を得ることを、少ないメモリを用いて、迅速に実行
でき、しかもリングバッファ手法を用いることによって
効率的なメモリ管理によるバッファの使用をしつつ、計
算のために処理負担を大きく増大することなしに、リン
グバッファ動作による同期のずれを回避することを可能
とする。
【0186】なお、本実施の形態8において、蓄積ブロ
ック誤差補正手段901は、蓄積ブロック誤差を検出す
る誤差検出処理として、まず、一番最後に蓄積された符
号化映像情報の再生時刻を検出し、それと同一の再生時
刻を持つ符号化音声情報の蓄積位置を検出する、という
処理をするものとしたが、このようなやり方に限定され
るものではなく、たとえば、符号化音声情報の再生時刻
を求めた上で、次に符号化映像情報の蓄積位置を求めて
もよい。また、再生時刻を検出するのに、符号化映像情
報に関しては、内包するフレーム情報を利用し、符号化
音声情報に関しては、あらかじめ規定されたビットレー
トを用いるものとしたが、これ以外にも、たとえば符号
化映像情報もあらかじめ規定されたビットレートを用い
て再生時刻を検出しても良いし、符号化音声情報も、も
しタイムスタンプ等の付加情報があるのなら、このよう
な情報を用いて再生時刻を検出してもよい。
【0187】上記のように、タイムスタンプ等を用いて
再生時刻を検出するならば、映像符号化手段107、お
よび音声符号化手段103が、あらかじめ規定されたビ
ットレートを守れず、ビットレート誤差を含んだ符号化
情報を出力したとしても、タイムスタンプ等により再生
時刻が検出できるので、本実施の形態8に示したものと
同一の構成において、ビットレート誤差を蓄積ブロック
誤差として検出し、これを補正することができるとい
う、副次的な効果も有する。
【0188】また、本実施の形態8において、蓄積ブロ
ック誤差補正手段901は、定期的に起動されて蓄積ブ
ロック誤差の検出を行った際、それが映像および蓄積ブ
ロックの一つ以上の大きさがあったら即補正を行うもの
としたが、これは、ある閾値を設けて、その閾値を超え
る蓄積ブロック誤差があった場合のみ、補正を行うこと
としも良い。復号器におけるバッファがあふれない程度
の閾値を設ければ、前記の目的を達成し、かつ、符号化
映像音声復号情報のいたるところで補正を行うのではな
く、まとめて補正を行うことができる。
【0189】さらに、本実施の形態8において、蓄積ブ
ロック誤差補正手段901は、蓄積された符号化情報の
再生時刻から蓄積ブロック誤差を検出するものとした
が、別の構成をとることもできる。たとえば、あらかじ
め一時記憶手段が潜在的に持つ誤差(本実施の形態8に
示した例でいえば、1.36:1のビットレート比にならなけ
ればならないところが、1.4:1 のビットレート比になっ
ている、という誤差)がわかっているのであるから、毎
回蓄積ブロック誤差を検出することなく、あらかじめわ
かっている誤差を、適宜ダミーデータを挿入することで
補正してもよい。ただしこの場合、前述の、ビットレー
ト誤差までも補正できるという副次的な効果は得られな
くなるが、蓄積ブロック誤差補正手段の構成が単純なも
のでも良いこととなるという効果が得られる。
【0190】実施の形態9.本発明の実施の形態9によ
る映像音声符号化多重化装置は、実施の形態8と同様
に、実施の形態6の装置を、リングバッファを用いて実
現しようとする際に起こり得る問題点を回避するもので
ある。
【0191】本実施の形態9による映像音声符号化装置
の構成は、図22に示す実施の形態8による装置と同様
であり、蓄積ブロック誤差補正手段901の機能のみが
異なるものである。図24は、本実施の形態9による映
像音声符号化多重化装置における、映像・音声処理の際
の動作を説明するための図である。同図において、蓄積
ブロック誤差補正手段901は、時間間隔をおいて間欠
的に動作するものであって、ある再生時刻において再生
すべき符号化音声情報を蓄積した音声蓄積ブロックを検
出し、また、当該再生時刻において再生すべき符号化映
像情報を蓄積した映像蓄積ブロックを検出して、映像音
声バッファ902における上記音声蓄積ブロックと上記
映像蓄積ブロックとの配置位置の差を蓄積ブロック誤差
として検出する誤差検出処理と、該検出した誤差の分
を、映像音声バッファとして用いる一時蓄積手段(メモ
リ)において、誤差補正用追加ブロックとして、映像蓄
積ブロック、または音声蓄積ブロックを追加し、当該追
加したブロックの使用がなされた後に、これを削除する
ことにより補正する補正処理とを行うものである。
【0192】このように構成された、本実施の形態9に
よる映像音声符号化多重化装置における、映像・音声処
理の動作は、蓄積ブロック誤差補正手段901の動作以
外は実施の形態8と同様であるので、蓄積ブロック誤差
補正手段901の動作のみを以下に説明する。
【0193】本実施の形態9においても、設定された時
間が経過した後に、蓄積ブロック誤差補正手段901が
機能する。そして、実施の形態8と同様に検出処理が行
われ、誤差の大きさによって補正処理の実行の有無が決
定される。補正処理が行われる場合、本実施の形態9に
おいては、以下のような処理がされるものである。蓄積
ブロック誤差補正手段901は、映像音声バッファ90
2に対して、その最後尾部に、誤差補正用追加ブロック
S180を追加する。追加した時点において、当該ブロ
ックは「蓄積可」の状態である。蓄積ブロック誤差補正
手段901は、誤差補正用追加ブロックS180に対す
る蓄積の状況を監視する。
【0194】映像音声バッファ902に対してのリング
バッファ動作が続行され、誤差補正用追加ブロックに対
しての蓄積と読み出しとが実行されたとする。蓄積ブロ
ック誤差補正手段901は、誤差補正用追加ブロックS
180の状態が、「蓄積可」から「蓄積あり」に変更さ
れ、再び「蓄積可」に変更されたことによって、このこ
とを知る。そこで、蓄積ブロック誤差補正手段901
は、誤差補正用追加ブロックS180を削除する。映像
・音声のとりこみが継続する間は、以上の動作が繰り返
し実行され、得られた映像音声符号化多重化情報は、フ
ァイル管理手段112によってファイルに格納される。
【0195】このように本実施の形態9の映像音声符号
化多重化装置によれば、実施の形態6の装置に蓄積ブロ
ック誤差補正手段901を追加する構成としたことで、
符号化された情報を、あらかじめ決められた単位で交互
に並べられたバッファに蓄積し、蓄積ブロック誤差補正
手段901が、定期的に映像と音声の同一の再生時刻を
持つ符号化情報の位置をチェックし、ずれが生じていた
ならば、蓄積用ブロックの一時的な追加によってこれを
補正する処理を行うので、実施の形態6と同様に、同期
した多重化情報を得ることを、少ないメモリを用いて、
迅速に実行でき、しかもリングバッファ手法を用いるこ
とによって効率的なメモリ管理によるバッファの使用を
しつつ、計算のために処理負担を大きく増大することな
しに、リングバッファ動作による同期のずれを回避する
ことを可能とする。
【0196】なお、本実施の形態9においては、蓄積ブ
ロック誤差補正手段901は、誤差補正用追加ブロック
S180を、映像音声バッファ902の最後に追加する
ものとしたが、先頭部に追加することも可能であり、同
様の効果を得られる。
【0197】さらに、本実施の形態9において、実施の
形態8と同様に、符号化情報の再生時刻を検出するため
に他の方法を用いること、蓄積ブロック誤差の補正をあ
る閾値を超えた場合にのみ行うこと、または蓄積ブロッ
ク誤差を毎回求めることなく、あらかじめわかっている
誤差を補正することなどの応用をすることが可能であ
る。
【0198】また、実施の形態8、および9において
は、説明のため符号化音声情報、符号化映像情報ともブ
ロック単位で蓄積されるものとしたが、実施の形態6に
示したようにブロックの途中まで蓄積されるものとする
場合にも、応用し得るものである。この場合、補正処理
が行われる場合には、途中まで蓄積したブロックについ
ては、その蓄積内容をコピーすることで蓄積位置を移動
するものとして対応することが可能である。
【0199】なお、本発明の実施の形態6から実施の形
態9に示した映像音声符号化多重化装置において、実施
の形態3から実施の形態5に示したバッファあふれ回避
を実行するものとすることも可能である。例えば実施の
形態6〜9に示した装置において、実施の形態3に示し
た、符号化音声蓄積時間出力手段、および符号化映像蓄
積時間出力手段を追加し、これらは映像音声バッファを
監視するものとし、さらに音声途切れ防止手段とダミー
映像挿入手段とを追加することで、実施の形態3と同様
に、音声バッファのあふれを防止することが可能とな
る。
【0200】実施の形態10.本発明の実施の形態10
による映像音声符号化多重化装置は、当該装置における
処理性能に応じて、用いるバッファの量を決定するもの
である。
【0201】図25は、本発明の実施の形態10による
映像音声符号化多重化装置の構成図である。図におい
て、1001はバッファ量決定手段であり、動作するコ
ンピュータシステムの性能を判定し、その判定結果に従
い映像バッファリング手段108、および音声バッファ
リング手段104が用いるバッファの量を決定するもの
である。本実施の形態10の装置では、まず暫定的に大
きなバッファを取得した後に、テスト的に映像と音声の
符号化と同期を行い、その際に使用したバッファの最大
値を最適なバッファ量とするものである。音声バッファ
リング手段104、および映像バッファリング手段10
8は、最大符号化音声バッファ量、および最大符号化映
像バッファ量を記憶する機能を有し、内部に有する音声
バッファ、および映像バッファに蓄積された符号化音声
情報S152、および符号化映像情報S162の蓄積量
を監視して、最大符号化音声バッファ量、および最大符
号化映像バッファ量を更新する。
【0202】映像音声入力手段101、音声キャプチャ
手段102、音声符号化手段103、映像キャプチャ手
段106、映像符号化手段107、映像音声同期手段1
10、ファイル管理手段112、符号化音声読み出し手
段113、および符号化映像読み出し手段115につい
ては、実施の形態1と同じであるので、説明は省略す
る。また、本実施の形態10の場合にも、符号化映像情
報と符号化音声情報のビットレートは、実施の形態1と
同じであるとする。
【0203】このように構成された映像音声符号化多重
化装置の動作を以下に説明する。処理に先立って、まず
バッファ量決定手段1001は、映像バッファリング手
段108が用いる映像バッファ、及び音声バッファリン
グ手段104が用いる音声バッファの量について、暫定
的に、十分であると考えられる大きい目の量を決定し、
両者のメモリ領域をオペレーティングシステムに要求す
ることで取得する。そして、バッファ量決定のためのテ
スト処理が実行される。
【0204】音声入力手段(ビデオカメラ)101によ
る映像・音声のとりこみから、ファイル管理手段112
による、映像音声符号化多重化情報のファイルへの格納
までは、実施の形態1と同様に実行される。その課程に
おいて、音声バッファリング手段104、および映像バ
ッファリング手段108は、内部に有する音声バッフ
ァ、および映像バッファに蓄積された符号化音声情報S
152、および符号化映像情報S162の蓄積量を監視
して、最大符号化音声バッファ量、および最大符号化映
像バッファ量を記憶し、また更新する。
【0205】あらかじめ定められた時間が経過するま
で、処理を繰り返す。その過程で、蓄積された符号化映
像情報と符号化音声情報の最大値が、それぞれ最大符号
化映像バッファ量と最大符号化音声バッファ量として記
録されることとなる。あらかじめ定められた時間が経過
したとき、符号化処理は中断される。バッファ量決定手
段1001は、この時点で求められた最大符号化映像バ
ッファ量と、最大符号化音声バッファ量とを音声バッフ
ァリング手段104、および映像バッファリング手段1
08から取得し、これらに対して、あらかじめ定めれら
た予備の量を余裕量として足した値を最適なバッファ量
と決定して、暫定的に取得した映像と音声のバッファの
サイズを補正する。
【0206】最適なバッファの量が取得できたところ
で、符号化処理を再開する。これ以後の符号化多重化処
理については、実施の形態1において説明したものと同
様となるので説明を省略する。
【0207】このように本実施の形態10による映像音
声符号化多重化装置では、まず、バッファ量決定手段1
001が、映像と音声のバッファの量を暫定的に決定
し、そのバッファを用いてテスト的に符号化処理を行
う。その際、実際に使用されたバッファの最大量を記録
し、その量を用いて最適な映像と音声のバッファの量を
決定する。映像バッファ、及び音声バッファへの符号化
情報の蓄積量については、映像と音声の符号化処理の時
間間隔が大きくなったり、両者の処理に偏りがある場合
等に、どちらかが大きなものとなる。均等に、かつ頻繁
に映像と音声の符号化処理が行われれば、いずれについ
てもあまり蓄積されることはなく、したがってバッファ
の量も小さなサイズとできるが、オペレーティングシス
テム上の負荷の増大等により映像と音声の符号化処理が
滞るようになると、同期化のためのバッファは大きいも
のとする必要が生じる。バッファのサイズを大きくする
とこの意味での余裕はあるが、使用しない分のメモリを
確保しておくことは、システム全体として、不経済なこ
ととなり、全体の性能低下につながる。そこで、本実施
の形態10による装置では、まず、大き目のバッファを
取得した状態でテスト的に符号化処理を行い、そのシス
テムで本当に必要な同期化のためのバッファのサイズを
見極め、それを用いてバッファのサイズを補正してい
る。このため、不必要に大きなバッファを使用すること
なく、符号化処理を行える。
【0208】なお、本実施の形態10の例では、最適な
バッファサイズを求めるのに、まず十分に大きいバッフ
ァを取得し、その上で符号化処理を行って最適なバッフ
ァサイズを求め、不必要なバッファを廃棄するとしてい
たが、本発明はこのような方法に限定されるものではな
い。逆に小さいバッファで符号化処理を行い、あふれた
ところで一旦符号化処理を中断して、バッファサイズを
少し大きくし、その上でさらに符号化処理を行うという
動作を、バッファからあふれなくなるまで続けて、最適
なバッファサイズを求めるという方法もとることができ
る。
【0209】また、本実施の形態10の例では、テスト
的に符号化処理を行う際、通常と同じようにビデオカメ
ラより映像音声を入力するとしたが、テストを行うこと
が目的であるから、あらかじめテスト用のデジタル原音
声情報とデジタル原映像情報を貯えておき、それを音声
符号化手段と映像符号化手段に直接入力するという方法
をとっても良い。
【0210】さらに、本実施の形態10の例では、テス
トを行って最適なバッファ量を検出するとしているが、
テストを行わないで、例えば動作するCPUの型番や、
動作するオペレーティングシステムの型番等、または同
時に動作しているプロセスの数や種類等を調べて、ある
程度動作環境の能力の予測をし、その予測を利用して、
バッファサイズを決定してもよい。また、動作環境の能
力を、使用者に質問して得ても良い。
【0211】また、テストによってバッファ量を決定
し、ずっとその量で運用するということでなく、一定時
間ごとに、あるいはシステム立ち上げ後に上記テストを
行ってバッファ量の見直しを図るという運用形態をとる
ことも可能であり、システムの状況の変化に応じた設定
を行うことができる。
【0212】さらに、本実施の形態10の例では、実施
の形態1に示したと同様の、音声と映像の別々のバッフ
ァを用いる形態をとるものとしたが、実施の形態6に示
したと同様の、音声と映像の共有バッファを用いる形態
についても応用が可能であり、同様の効果が得られる。
【0213】本発明の実施の形態1〜10においては、
いずれもビデオカメラよりアナログの映像音声を入力
し、各キャプチャ手段によって、デジタル化した原映像
情報、及び原音声情報を得るものとしているが、デジタ
ルカメラ等の、デジタル入力できる周辺機器を用いた場
合、あるいは、デジタル化した映像・音声を記録装置や
通信経路より入力して用いる場合、これらのデジタル情
報を、各実施の形態で説明した原映像情報、及び原音声
情報として、符号化の段階より実行することも可能であ
り、映像音声符号化多重化について同様の効果が得られ
る。
【0214】また、いずれの実施の形態についても、映
像音声符号化多重化情報は、同装置において、記録保存
して利用するのみでなく、通信経路や記録媒体によって
他の装置で保存、あるいは利用することも可能である。
【0215】さらに、いずれの実施の形態についても、
このような映像音声符号化多重化処理を行う映像音声符
号化多重化プログラムを記録媒体に記録し、該記録した
プログラムをパーソナルコンピュータ、ワークステーシ
ョン等のコンピュータシステムにおいて実行すること
で、映像音声符号化多重化装置を実現することが可能で
ある。かかる記録媒体としては、フロッピーディスク、
CD−ROM、光ディスク、磁気テープ等を用いること
ができるものであり、プログラムを記録し得るものであ
れば使用可能である。
【0216】
【発明の効果】請求項1のマルチメディアデータ符号化
多重化方法によれば、デジタル化された映像、及びデジ
タル化された音声を含むデジタルマルチメディアデータ
が、符号化され、時分割多重化されたマルチメディアデ
ータ符号化多重化情報を得るマルチメディアデータ符号
化多重化方法において、上記デジタル化された、デジタ
ルマルチメディアデータを符号化して、その再生時間が
Tであり、その量がVである符号化マルチメディア情報
を生成し、上記再生時間T、および上記量Vに基づいて
ブロックレート情報を生成するマルチメディアデータ符
号化ステップと、上記マルチメディアデータ符号化ステ
ップにおいて生成された上記符号化マルチメディア情報
と、上記ブロックレート情報とを、一時蓄積用記憶手段
に一時蓄積する符号化マルチメディア情報バッファリン
グステップと、上記一時蓄積されたブロックレート情報
を用いて取得される、上記時分割多重化における時間間
隔を示す同期間隔時間情報に対応する量の、上記一時蓄
積された符号化マルチメディア情報を読み出す符号化マ
ルチメディア情報読み出しステップと、上記符号化マル
チメディア読み出しステップにおいて読み出された符号
化マルチメディア情報に対して、多重化処理を行ってマ
ルチメディアデータ符号化多重化情報を生成する符号化
マルチメディア情報同期ステップとを含むものであっ
て、デジタルマルチメディアデータを符号化処理して、
ブロックレート情報を付与して一時蓄積し、上記ブロッ
クレート情報を用いて所定の量ずつ読み出して多重化処
理することで、符号化処理と多重化処理とのタイミング
を分離して実行するので、符号化処理が均等、かつ頻繁
に実行されない場合にも、マルチメディアデータを構成
する映像、および音声について同期のとれたマルチメデ
ィアデータ符号化多重化情報を得ることが可能となる。
【0217】請求項2のマルチメディアデータ符号化多
重化方法によれば、請求項1の方法において、上記符号
化マルチメディア情報バッファリングステップでは、上
記一時蓄積用記憶手段をリングバッファとして上記一時
蓄積するものであり、上記符号化マルチメディア情報読
み出しステップでは、上記一時蓄積用記憶手段をリング
バッファとして上記読み出しを行い、上記読み出した符
号化マルチメディア情報を削除するものであって、リン
グバッファの手法によって符号化情報を一時蓄積するの
で、一時蓄積用記憶手段として用いられるメモリ等を効
率的に使用することが可能となる。
【0218】請求項3のマルチメディアデータ符号化多
重化方法によれば、請求項1または2の方法において、
上記符号化マルチメディア情報同期ステップでは、上記
ブロックレート情報に含まれる、上記再生時間Tを、上
記同期間隔時間情報とし、これを上記符号化マルチメデ
ィア情報読み出しステップに出力するものとしたこと
で、上記の効果が得られる。
【0219】請求項4のマルチメディアデータ符号化多
重化方法によれば、請求項1ないし3のいずれかの方法
において、上記マルチメディアデータ符号化ステップで
は、上記ブロックレート情報として、上記符号化マルチ
メディア情報の単位時間相当量を表す符号化マルチメデ
ィア情報単位時間量を生成するものであり、上記符号化
マルチメディア情報読み出し手段は、上記符号化マルチ
メディア情報単位時間量に基づいて、上記読み出す量を
決定するものであって、符号化マルチメディア情報を上
記単位時間単位で読み出して多重化処理するので、符号
化処理によって出力される符号化情報の量によらず、上
記単位時間を単位とする同期のとれたマルチメディア符
号化多重化情報が得られる。
【0220】請求項5のマルチメディアデータ符号化多
重化方法によれば、デジタル化された映像、及びデジタ
ル化された音声を含むデジタルマルチメディアデータ
が、符号化され、時分割多重化されたマルチメディアデ
ータ符号化多重化情報を得るマルチメディアデータ符号
化多重化方法において、上記デジタル化された、デジタ
ルマルチメディアデータを符号化して、その再生時間が
Tであり、その量がVである符号化マルチメディア情報
を生成するマルチメディアデータ符号化ステップと、設
定された単位再生時間に対応する符号化マルチメディア
情報の量を示す符号化マルチメディア情報単位量を用い
て、上記マルチメディアデータ符号化ステップにおいて
生成された符号化マルチメディア情報に対して、上記符
号化マルチメディア情報単位量ごとに分割して一時蓄積
用記憶手段に一時蓄積する符号化マルチメディア情報バ
ッファリングステップと、上記一時蓄積された符号化マ
ルチメディア情報を読み出して、マルチメディアデータ
符号化多重化情報を生成する符号化マルチメディア情報
同期ステップとを含むものであって、単位量ごとに、並
べられた形式で一時蓄積された符号化マルチメディア情
報を読み出して、マルチメディアデータ符号化多重化情
報を得るので、符号化処理が均等に、かつ頻繁に実行さ
れない場合にも、同期のとれたマルチメディアデータ符
号化多重化情報を得ることを、並び替えのためのバッフ
ァを必要とせず、また、情報をコピーする動作を発生さ
せることなく、少ないメモリで、しかも迅速に実現す
る。
【0221】請求項6のマルチメディアデータ符号化多
重化方法によれば、請求項5の方法において、上記マル
チメディアデータ符号化ステップは、映像がデジタル化
された、複数の静止画像情報からなる原映像情報を符号
化処理し、再生時間がTvであり、量がVvである符号
化映像情報を生成する映像符号化ステップと、音声がデ
ジタル化された原音声情報を符号化処理し、再生時間が
Taであり、量がVaである符号化音声情報を生成する
音声符号化ステップとを含むものであり、上記マルチメ
ディアバッファリングステップは、上記再生時間Tvに
基づいて定められる再生時刻情報と、上記符号化マルチ
メディア単位量の上記符号化映像情報とを、上記一時蓄
積用記憶手段上にすでに一時蓄積された符号化音声情報
同士の間隙部位が存在すれば当該間隙部位に、上記間隙
部位が存在しなければ直前に一時蓄積された符号化音声
情報に後続し、符号化音声情報の上記単位量分に相当す
るだけ間隙をおいた部位に一時蓄積する映像バッファリ
ングステップと、上記再生時間Taに基づいて定められ
る再生時刻情報と、上記符号化マルチメディア単位量の
上記符号化音声情報とを、上記一時蓄積用記憶手段上に
すでに一時蓄積された符号化映像情報同士の間隙部位が
存在すれば当該間隙部位に、上記間隙部位が存在しなけ
れば直前に一時蓄積された符号化映像情報に後続し、符
号化映像情報の上記単位量分に相当するだけ間隙をおい
た部位に一時蓄積する音声バッファリングステップとを
含むものであり、上記符号化マルチメディア同期ステッ
プでは、上記一時蓄積用記憶手段において、上記符号化
映像情報、および上記符号化音声情報が間隙なく一時蓄
積された部分を読み出すものであって、映像・音声が単
位量ごとに、並べられた形式で一時蓄積された符号化マ
ルチメディア情報を読み出して、マルチメディアデータ
符号化多重化情報を得るものとしたことで、上記の効果
が得られる。
【0222】請求項7のマルチメディアデータ符号化多
重化方法によれば、請求項5または6の方法において、
上記符号化マルチメディア情報バッファリングステップ
では、上記一時蓄積用記憶手段をリングバッファとして
上記一時蓄積するものであり、上記符号化マルチメディ
ア情報読み出しステップでは、上記一時蓄積用記憶手段
をリングバッファとして上記読み出しを行い、上記読み
出した符号化マルチメディアデータを削除するものであ
って、リングバッファの手法によって符号化情報を一時
蓄積するので、一時蓄積用記憶手段として用いられるメ
モリ等を効率的に使用することが可能となる。
【0223】請求項8のマルチメディアデータ符号化多
重化方法によれば、請求項5ないし7のいずれかの方法
において、上記一時蓄積用記憶手段上で、ある再生時刻
に再生すべき符号化音声情報を蓄積した位置である音声
蓄積位置と、当該再生時刻において再生すべき符号化映
像情報を蓄積した映像蓄積位置との差を蓄積位置誤差と
して検出する蓄積位置誤差検出処理と、上記誤差検出処
理によって検出した蓄積位置誤差を補正する蓄積位置誤
差補正処理とを、定められた時間間隔をおいて行う蓄積
位置誤差補正ステップをさらに備えたものであって、一
時蓄積用記憶手段をリングバッファとして繰り返し用い
ることによって生じる、誤差を修正するので、計算のた
めに処理負担を大きく増大して、リングバッファ手法に
よる効率的な処理を損なうことなしに、リングバッファ
動作による同期のずれを回避することを可能とする。
【0224】請求項9のマルチメディアデータ符号化多
重化方法によれば、請求項8の方法において、上記蓄積
位置誤差補正ステップの上記蓄積位置誤差補正処理で
は、上記一時蓄積用記憶手段において、所定の符号化マ
ルチメディア情報を蓄積することにより行うものであっ
て、データ挿入により修正を行うことで、上記の効果が
得られる。
【0225】請求項10のマルチメディアデータ符号化
多重化方法によれば、請求項8の方法において、上記蓄
積位置誤差補正ステップの上記蓄積位置誤差補正処理で
は、上記一時蓄積用記憶手段を一時的に拡大する、追加
蓄積位置を設定することにより行うものであって、一時
的に拡大した蓄積位置の使用によりデータ挿入と同様の
修正を行うことで、上記の効果が得られる。
【0226】請求項11のマルチメディアデータ符号化
多重化方法によれば、請求項1ないし10のいずれかの
方法において、上記符号化マルチメディア情報バッファ
リングステップにおいて、一時蓄積した符号化マルチメ
ディア情報の量が一定量を超えた場合に、上記一時蓄積
した符号化マルチメディアデータ量に基づいて、ダミー
情報挿入時間を算出し、上記符号化マルチメディア情報
バッファリングステップと、後述するダミー情報挿入ス
テップとに出力する途切れ防止ステップと、上記ダミー
情報挿入時間が入力された場合、上記ダミー情報挿入時
間に相当する量の符号化マルチメディア情報を生成し、
上記符号化マルチメディア情報バッファリングステップ
において一時蓄積されるように出力するダミー情報挿入
ステップとをさらに備え、上記符号化マルチメディア情
報バッファリングステップでは、上記ダミー情報挿入時
間が入力された場合、上記マルチメディアデータ符号化
ステップにおいて生成される上記符号化マルチメディア
情報を、上記ダミー情報挿入時間に相当する量だけ、一
時蓄積せずに廃棄するものであって、一時蓄積における
蓄積量が増大した場合に、符号化情報を一時蓄積せずに
廃棄し、代替となるダミー情報を挿入して同期を確保す
るので、符号化情報がバッファからあふれ、映像と音声
との同期がとれなくなる等の事態を回避できるのに加え
て、バッファ容量の抑制によるメモリの使用量の低減も
図ることが可能となる。
【0227】請求項12のマルチメディアデータ符号化
多重化方法によれば、請求項1ないし11のいずれかの
方法において、上記符号化マルチメディア情報バッファ
リングステップにおいて、一時蓄積した符号化マルチメ
ディア情報の量が一定量を超えた場合に、上記一時蓄積
した符号化マルチメディアデータ量に基づいて、ダミー
情報挿入時間を算出し、上記符号化マルチメディアデー
タ符号化ステップと、後述するダミー情報挿入ステップ
とに出力する途切れ防止ステップと、上記ダミー情報挿
入時間が入力された場合、上記ダミー情報挿入時間に相
当する符号化マルチメディア情報を、上記符号化マルチ
メディアバッファリングステップにおいて一時蓄積され
るように出力するダミー情報挿入ステップとをさらに備
え、上記マルチメディアデータ符号化ステップでは、上
記ダミー情報挿入時間が入力された場合、当該ダミー情
報挿入時間に相当する量のデジタルマルチメディアデー
タを符号化せずに廃棄するものであって、一時蓄積にお
ける蓄積量が増大した場合に、デジタル情報を符号化せ
ずに廃棄し、代替となるダミー情報を挿入して同期を確
保するので、符号化情報がバッファからあふれ、映像と
音声との同期がとれなくなる等の事態を回避できるのに
加えて、符号化処理を停止するため、装置資源を他の用
途に用いることにより活用を図ることができる。
【0228】請求項13のマルチメディアデータ符号化
多重化方法によれば、請求項11の方法において、上記
マルチメディアデータ符号化ステップでは、上記デジタ
ルマルチメディアデータに対して、単独で復号処理をす
ることができる独立符号化情報と、他の符号化マルチメ
ディア情報を参照することにより復号処理をすることが
できる差分符号化情報とを生成する符号化処理を行い、
上記独立符号化情報と、上記差分符号化情報とからなる
上記符号化マルチメディア情報を生成するものであり、
上記符号化マルチメディア情報バッファリングステップ
では、上記ダミー情報挿入時間に相当する量の符号化マ
ルチメディア情報を一時蓄積せずに廃棄した後、後続の
上記差分符号化情報を、上記独立符号化情報に変換して
一時蓄積するものであって、ダミー情報による代替処理
によって、復号処理が行い得なくなる差分符号化情報を
変換によって復号処理可能なものとするので、代替処理
による復号処理時のトラブルを防止することが可能とな
る。
【0229】請求項14のマルチメディアデータ符号化
多重化方法によれば、請求項12の方法において、上記
マルチメディアデータ符号化ステップでは、上記デジタ
ルマルチメディアデータに対して、単独で復号処理をす
ることができる独立符号化情報と、他の符号化マルチメ
ディア情報を参照することにより復号処理をすることが
できる差分符号化情報とを生成する符号化処理を行い、
上記独立符号化情報と、上記差分符号化情報とからなる
上記符号化マルチメディア情報を生成するものであり、
上記途切れ防止ステップでは、上記一時蓄積量に基づい
て決定されるダミー情報挿入時間を算出した後、上記マ
ルチメディアデータ符号化ステップにおいて、符号化せ
ずに廃棄されるデジタルマルチメディアデータに後続す
る、上記差分符号化情報とされるべきデジタルマルチメ
ディアデータの符号化処理に相当する時間である挿入修
正時間を算出し、上記ダミー情報挿入時間に対して、上
記挿入修正時間の加算処理による修正を行うものであっ
て、ダミー情報による代替処理によって、復号処理が行
い得なくなる差分符号化情報とされることになるデジタ
ルマルチメディアデータをダミー情報で代替するので、
代替処理による復号処理時のトラブルを防止することが
可能となる。
【0230】請求項15のマルチメディアデータ符号化
多重化方法によれば、請求項1ないし14のいずれかの
方法において、当該符号化多重化処理を実行する装置自
体の性能を判定し、上記判定の結果に従って、上記符号
化マルチメディア情報バッファリング手段の用いる一時
蓄積用記憶手段の量を決定する、バッファ量決定ステッ
プをさらに備えたものであって、当該装置の処理性能に
応じたバッファ量を決定するので、適切な量の一時蓄積
用記憶手段を用いることによって、コンピュータシステ
ム等の全体としての装置資源の活用を図ることが可能と
なる。
【0231】請求項16のマルチメディアデータ符号化
多重化装置によれば、デジタル化された映像、及びデジ
タル化された音声を含むデジタルマルチメディアデータ
が、符号化され、時分割多重化されたマルチメディアデ
ータ符号化多重化情報を得るマルチメディアデータ符号
化多重化装置において、情報を記憶するものであり、情
報の一時的な蓄積に用いられる一時蓄積用記憶手段と、
上記デジタル化された、デジタルマルチメディアデータ
を符号化して、その再生時間がTであり、その量がVで
ある符号化マルチメディア情報を生成し、上記再生時間
T、および上記量Vに基づいてブロックレート情報を生
成するマルチメディアデータ符号化手段と、上記マルチ
メディアデータ符号化手段において生成された上記符号
化マルチメディア情報と、上記ブロックレート情報と
を、上記一時蓄積用記憶手段に一時蓄積する符号化マル
チメディア情報バッファリング手段と、上記一時蓄積さ
れたブロックレート情報を用いて取得される、上記時分
割多重化における時間間隔を示す同期間隔時間情報に対
応する量の、上記一時蓄積された符号化マルチメディア
情報を読み出す符号化マルチメディア情報読み出し手段
と、上記符号化マルチメディア読み出し手段において読
み出された符号化マルチメディア情報に対して、上記ブ
ロックレート情報に基づいて取得される上記再生時刻情
報を付与し、多重化処理を行ってマルチメディアデータ
符号化多重化情報を生成する符号化マルチメディア情報
同期手段とを備えたものであって、デジタルマルチメデ
ィアデータを符号化処理して、ブロックレート情報を付
与して一時蓄積し、上記ブロックレート情報を用いて所
定の量ずつ読み出して多重化処理することで、符号化処
理と多重化処理とのタイミングを分離して実行するの
で、符号化処理が均等、かつ頻繁に実行されない場合に
も、マルチメディアデータを構成する映像、および音声
について同期のとれたマルチメディアデータ符号化多重
化情報を得ることが可能となる。
【0232】請求項17のマルチメディアデータ符号化
多重化装置によれば、デジタル化された映像、及びデジ
タル化された音声を含むデジタルマルチメディアデータ
が、符号化され、時分割多重化されたマルチメディアデ
ータ符号化多重化情報を得るマルチメディアデータ符号
化多重化装置において、情報を記憶するものであり、情
報の一時的な蓄積に用いられる一時蓄積用記憶手段と、
上記デジタル化された、デジタルマルチメディアデータ
を符号化して、その再生時間がTであり、その量がVで
ある符号化マルチメディア情報を生成するマルチメディ
アデータ符号化手段と、設定された単位再生時間に対応
する符号化マルチメディア情報の量を示す符号化マルチ
メディア情報単位量を用いて、上記マルチメディアデー
タ符号化手段において生成された符号化マルチメディア
情報に対して、上記符号化マルチメディア情報単位量ご
とに分割して一時蓄積用記憶手段に一時蓄積する符号化
マルチメディア情報バッファリング手段と、上記一時蓄
積された符号化マルチメディア情報を読み出して、マル
チメディアデータ符号化多重化情報を生成する符号化マ
ルチメディア情報同期手段とを備えたものであって、単
位量ごとに、並べられた形式で一時蓄積された符号化マ
ルチメディア情報を読み出して、マルチメディアデータ
符号化多重化情報を得るので、符号化処理が均等に、か
つ頻繁に実行されない場合にも、同期のとれたマルチメ
ディアデータ符号化多重化情報を得ることを、並び替え
のためのバッファを必要とせず、また、情報をコピーす
る動作を発生させることなく、少ないメモリで、しかも
迅速に実現する。
【0233】請求項18のマルチメディアデータ符号化
多重化プログラム記録媒体によれば、デジタル化された
映像、及びデジタル化された音声を含むデジタルマルチ
メディアデータが、符号化され、時分割多重化されたマ
ルチメディアデータ符号化多重化情報を得るマルチメデ
ィアデータ符号化多重化プログラムを記録したプログラ
ム記録媒体において、上記デジタル化された、デジタル
マルチメディアデータを符号化して、その再生時間がT
であり、その量がVである符号化マルチメディア情報を
生成し、上記再生時間T、および上記量Vに基づいてブ
ロックレート情報を生成するマルチメディアデータ符号
化ステップと、上記マルチメディアデータ符号化ステッ
プにおいて生成された上記符号化マルチメディア情報
と、上記ブロックレート情報とを、一時蓄積用記憶手段
に一時蓄積する符号化マルチメディア情報バッファリン
グステップと、上記一時蓄積されたブロックレート情報
を用いて取得される、上記時分割多重化における時間間
隔を示す同期間隔時間情報に対応する量の、上記一時蓄
積された符号化マルチメディア情報を読み出す符号化マ
ルチメディア情報読み出しステップと、上記符号化マル
チメディア読み出しステップにおいて読み出された符号
化マルチメディア情報に対して、上記ブロックレート情
報に基づいて取得される上記再生時刻情報を付与し、多
重化処理を行ってマルチメディアデータ符号化多重化情
報を生成する符号化マルチメディア情報同期ステップと
を含むマルチメディアデータ符号化多重化プログラムを
記録したものであって、コンピュータシステムにおいて
当該プログラムを実行することで、デジタルマルチメデ
ィアデータを符号化処理して、ブロックレート情報を付
与して一時蓄積し、上記ブロックレート情報を用いて所
定の量ずつ読み出して多重化処理することで、符号化処
理と多重化処理とのタイミングを分離して実行するの
で、マルチタスクオペレーティングシステム下等で実行
され、符号化処理が均等、かつ頻繁に実行されない場合
にも、マルチメディアデータを構成する映像、および音
声について同期のとれたマルチメディアデータ符号化多
重化情報を得ることが可能となる。
【0234】請求項19のマルチメディアデータ符号化
多重化プログラム記録媒体によれば、デジタル化された
映像、及びデジタル化された音声を含むデジタルマルチ
メディアデータが、符号化され、時分割多重化されたマ
ルチメディアデータ符号化多重化情報を得るマルチメデ
ィアデータ符号化多重化プログラムを記録したプログラ
ム記録媒体において、上記デジタル化された、デジタル
マルチメディアデータを符号化して、その再生時間がT
であり、その量がVである符号化マルチメディア情報を
生成するマルチメディアデータ符号化ステップと、設定
された単位再生時間に対応する符号化マルチメディア情
報の量を示す符号化マルチメディア情報単位量を用い
て、上記マルチメディアデータ符号化ステップにおいて
生成された符号化マルチメディア情報に対して、上記符
号化マルチメディア情報単位量ごとに分割して一時蓄積
用記憶手段に一時蓄積する符号化マルチメディア情報バ
ッファリングステップと、上記一時蓄積された符号化マ
ルチメディア情報を読み出して、マルチメディアデータ
符号化多重化情報を生成する符号化マルチメディア情報
同期ステップとを含む上記マルチメディアデータ符号化
多重化プログラムを記録したものであって、コンピュー
タシステムにおいて当該プログラムを実行することで、
単位量ごとに、並べられた形式で一時蓄積された符号化
マルチメディア情報を読み出して、マルチメディアデー
タ符号化多重化情報を得るので、マルチタスクオペレー
ティングシステム下等で実行され、符号化処理が均等
に、かつ頻繁に実行されない場合にも、同期のとれたマ
ルチメディアデータ符号化多重化情報を得ることを、並
び替えのためのバッファを必要とせず、また、情報をコ
ピーする動作を発生させることなく、少ないメモリで、
しかも迅速に実現する。
【図面の簡単な説明】
【図1】本発明の実施の形態1による映像音声符号化多
重化装置の構成を示すブロック図である。
【図2】同実施の形態の装置における動作を説明するた
めの図である。
【図3】同実施の形態の装置における一時蓄積の状態を
示す図である。
【図4】本発明の実施の形態2による映像音声符号化多
重化装置の構成を示すブロック図である。
【図5】同実施の形態の装置における動作を説明するた
めの図である。
【図6】同実施の形態の装置における一時蓄積の状態を
示す図である。
【図7】本発明の実施の形態3による映像音声符号化多
重化装置の構成を示すブロック図である。
【図8】同実施の形態の装置における動作を説明するた
めの図である。
【図9】予測符号化処理における参照関係を説明するた
めの図である。
【図10】実施の形態3において、予測符号化処理を実
行する場合の問題点を説明するための図である。
【図11】本発明の実施の形態4による映像音声符号化
多重化装置における処理を説明するための図である。
【図12】本発明の実施の形態5による映像音声符号化
多重化装置の構成を示すブロック図である。
【図13】同実施の形態の装置における処理を説明する
ための図である。
【図14】本発明の実施の形態6による映像音声符号化
多重化装置の構成を示すブロック図である。
【図15】同実施の形態の装置における処理の一例を示
すフローチャート図である。
【図16】同実施の形態の装置における動作を説明する
ための図である。
【図17】本発明の実施の形態7による映像音声符号化
多重化装置の構成を示すブロック図である。
【図18】同実施の形態の装置における処理の一例を示
すフローチャート図である。
【図19】同実施の形態の装置における動作を説明する
ための図である。
【図20】リングバッファ手法を説明するための図であ
る。
【図21】実施の形態6において、リングバッファ手法
を用いる場合の問題点を説明するための図である。
【図22】本発明の実施の形態8による映像音声符号化
多重化装置の構成を示すブロック図である。
【図23】同実施の形態の装置における動作を説明する
ための図である。
【図24】本発明の実施の形態9による映像音声符号化
多重化装置の動作を説明するための図である。
【図25】本発明の実施の形態10による映像音声符号
化多重化装置の構成を示すブロック図である。
【図26】従来の技術による映像音声符号化多重化装置
の構成を示すブロック図である。
【図27】符号化映像音声符号化多重化情報を説明する
ための図である。
【図28】従来の技術による映像音声符号化多重化装置
の動作を説明するための図である。
【図29】従来の技術による映像音声符号化多重化処理
における、第1の問題点を説明するための図である。
【図30】従来の技術による映像音声符号化多重化処理
における、第2の問題点を説明するための図である。
【符号の説明】
101,2001 映像音声入力手段(ビデオカメ
ラ) 102,2002 音声キャプチャ手段 103,2003 音声符号化手段 104,701,801 音声バッファリング手段 106,2005 映像キャプチャ手段 107,301,507,2006 映像符号化手段 108,506,702,802 映像バッファリン
グ手段 110,704 映像音声同期手段 111 内部バッファ 703,902 映像音声バッファ 112,803,2008 ファイル管理手段 1001 バッファ量決定手段
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04N 5/907 H04N 7/13 Z 7/24

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 デジタル化された映像、及びデジタル化
    された音声を含むデジタルマルチメディアデータが、符
    号化され、時分割多重化されたマルチメディアデータ符
    号化多重化情報を得るマルチメディアデータ符号化多重
    化方法において、 上記デジタル化された、デジタルマルチメディアデータ
    を符号化して、その再生時間がTであり、その量がVで
    ある符号化マルチメディア情報を生成し、上記再生時間
    T、および上記量Vに基づいてブロックレート情報を生
    成するマルチメディアデータ符号化ステップと、 上記マルチメディアデータ符号化ステップにおいて生成
    された上記符号化マルチメディア情報と、上記ブロック
    レート情報とを、一時蓄積用記憶手段に一時蓄積する符
    号化マルチメディア情報バッファリングステップと、 上記一時蓄積されたブロックレート情報を用いて取得さ
    れる、上記時分割多重化における時間間隔を示す同期間
    隔時間情報に対応する量の、上記一時蓄積された符号化
    マルチメディア情報を読み出す符号化マルチメディア情
    報読み出しステップと、 上記符号化マルチメディア読み出しステップにおいて読
    み出された符号化マルチメディア情報に対して、多重化
    処理を行ってマルチメディアデータ符号化多重化情報を
    生成する符号化マルチメディア情報同期ステップとを含
    むことを特徴とするマルチメディアデータ符号化多重化
    方法。
  2. 【請求項2】 請求項1に記載のマルチメディアデータ
    符号化多重化方法において、 上記符号化マルチメディア情報バッファリングステップ
    では、上記一時蓄積用記憶手段をリングバッファとして
    上記一時蓄積するものであり、 上記符号化マルチメディア情報読み出しステップでは、
    上記一時蓄積用記憶手段をリングバッファとして上記読
    み出しを行い、上記読み出した符号化マルチメディア情
    報を削除するものであることを特徴とするマルチメディ
    アデータ符号化多重化方法。
  3. 【請求項3】 請求項1または2に記載のマルチメディ
    アデータ符号化多重化方法において、 上記符号化マルチメディア情報同期ステップでは、 上記ブロックレート情報に含まれる、上記再生時間T
    を、上記同期間隔時間情報とし、これを上記符号化マル
    チメディア情報読み出しステップに出力するものである
    ことを特徴とするマルチメディアデータ符号化多重化方
    法。
  4. 【請求項4】 請求項1ないし3のいずれかに記載のマ
    ルチメディアデータ符号化多重化方法において、 上記マルチメディアデータ符号化ステップでは、 上記ブロックレート情報として、上記符号化マルチメデ
    ィア情報の単位時間相当量を表す符号化マルチメディア
    情報単位時間量を生成するものであり、 上記符号化マルチメディア情報読み出しステップでは、
    上記符号化マルチメディア情報単位時間量に基づいて、
    上記読み出す量を決定するものであることを特徴とする
    マルチメディアデータ符号化多重化方法。
  5. 【請求項5】 デジタル化された映像、及びデジタル化
    された音声を含むデジタルマルチメディアデータが、符
    号化され、時分割多重化されたマルチメディアデータ符
    号化多重化情報を得るマルチメディアデータ符号化多重
    化方法において、 上記デジタル化された、デジタルマルチメディアデータ
    を符号化して、その再生時間がTであり、その量がVで
    ある符号化マルチメディア情報を生成するマルチメディ
    アデータ符号化ステップと、 設定された単位再生時間に対応する符号化マルチメディ
    ア情報の量を示す符号化マルチメディア情報単位量を用
    いて、上記マルチメディアデータ符号化ステップにおい
    て生成された符号化マルチメディア情報に対して、上記
    符号化マルチメディア情報単位量ごとに分割して一時蓄
    積用記憶手段に一時蓄積する符号化マルチメディア情報
    バッファリングステップと、 上記一時蓄積された符号化マルチメディア情報を読み出
    して、マルチメディアデータ符号化多重化情報を生成す
    る符号化マルチメディア情報同期ステップとを含むこと
    を特徴とするマルチメディアデータ符号化多重化方法。
  6. 【請求項6】 請求項5に記載のマルチメディアデータ
    符号化多重化方法において、 上記マルチメディアデータ符号化ステップは、 映像がデジタル化された、複数の静止画像情報からなる
    原映像情報を符号化処理し、再生時間がTvであり、量
    がVvである符号化映像情報を生成する映像符号化ステ
    ップと、 音声がデジタル化された原音声情報を符号化処理し、再
    生時間がTaであり、量がVaである符号化音声情報を
    生成する音声符号化ステップとを含むものであり、 上記マルチメディアバッファリングステップは、 上記再生時間Tvに基づいて定められる再生時刻情報
    と、上記符号化マルチメディア単位量の上記符号化映像
    情報とを、上記一時蓄積用記憶手段上にすでに一時蓄積
    された符号化音声情報同士の間隙部位が存在すれば当該
    間隙部位に、上記間隙部位が存在しなければ直前に一時
    蓄積された符号化音声情報に後続し、符号化音声情報の
    上記単位量分に相当するだけ間隙をおいた部位に一時蓄
    積する映像バッファリングステップと、 上記再生時間Taに基づいて定められる再生時刻情報
    と、上記符号化マルチメディア単位量の上記符号化音声
    情報とを、上記一時蓄積用記憶手段上にすでに一時蓄積
    された符号化映像情報同士の間隙部位が存在すれば当該
    間隙部位に、上記間隙部位が存在しなければ直前に一時
    蓄積された符号化映像情報に後続し、符号化映像情報の
    上記単位量分に相当するだけ間隙をおいた部位に一時蓄
    積する音声バッファリングステップとを含むものであ
    り、 上記符号化マルチメディア情報同期ステップでは、上記
    一時蓄積用記憶手段において、上記符号化映像情報、お
    よび上記符号化音声情報が間隙なく一時蓄積された部分
    を読み出すものであることを特徴とするマルチメディア
    データ符号化多重化方法。
  7. 【請求項7】 請求項5または6に記載のマルチメディ
    アデータ符号化多重化方法において、 上記符号化マルチメディア情報バッファリングステップ
    では、上記一時蓄積用記憶手段をリングバッファとして
    上記一時蓄積するものであり、 上記符号化マルチメディア情報同期ステップでは、上記
    一時蓄積用記憶手段をリングバッファとして上記読み出
    しを行い、上記読み出した符号化マルチメディアデータ
    を削除するものであることを特徴とするマルチメディア
    データ符号化多重化方法。
  8. 【請求項8】 請求項5ないし7のいずれかに記載のマ
    ルチメディアデータ符号化多重化方法において、 上記一時蓄積用記憶手段上で、ある再生時刻に再生すべ
    き符号化音声情報を蓄積した位置である音声蓄積位置
    と、当該再生時刻において再生すべき符号化映像情報を
    蓄積した映像蓄積位置との差を蓄積位置誤差として検出
    する蓄積位置誤差検出処理と、 上記誤差検出処理によって検出した蓄積位置誤差を補正
    する蓄積位置誤差補正処理とを、定められた時間間隔を
    おいて行う蓄積位置誤差補正ステップをさらに備えたこ
    とを特徴とするマルチメディアデータ符号化多重化方
    法。
  9. 【請求項9】 請求項8に記載のマルチメディアデータ
    符号化多重化方法において、 上記蓄積位置誤差補正ステップの上記蓄積位置誤差補正
    処理では、上記一時蓄積用記憶手段において、所定の符
    号化マルチメディア情報を蓄積することにより行うもの
    であることを特徴とするマルチメディアデータ符号化多
    重化方法。
  10. 【請求項10】 請求項8に記載のマルチメディアデー
    タ符号化多重化方法において、 上記蓄積位置誤差補正ステップの上記蓄積位置誤差補正
    処理では、上記一時蓄積用記憶手段を一時的に拡大す
    る、追加蓄積位置を設定することにより行うものである
    ことを特徴とするマルチメディアデータ符号化多重化方
    法。
  11. 【請求項11】 請求項1ないし10のいずれかに記載
    のマルチメディアデータ符号化多重化方法において、 上記符号化マルチメディア情報バッファリングステップ
    において、一時蓄積した符号化マルチメディア情報の量
    が一定量を超えた場合に、上記一時蓄積した符号化マル
    チメディアデータ量に基づいて、ダミー情報挿入時間を
    算出し、上記符号化マルチメディア情報バッファリング
    ステップと、後述するダミー情報挿入ステップとに出力
    する途切れ防止ステップと、 上記ダミー情報挿入時間が入力された場合、上記ダミー
    情報挿入時間に相当する量の符号化マルチメディア情報
    を生成し、上記符号化マルチメディア情報バッファリン
    グステップにおいて一時蓄積されるように出力するダミ
    ー情報挿入ステップとをさらに備え、 上記符号化マルチメディア情報バッファリングステップ
    では、上記ダミー情報挿入時間が入力された場合、上記
    マルチメディアデータ符号化ステップにおいて生成され
    る上記符号化マルチメディア情報を、上記ダミー情報挿
    入時間に相当する量だけ、一時蓄積せずに廃棄するもの
    であることを特徴とするマルチメディアデータ符号化多
    重化方法。
  12. 【請求項12】 請求項1ないし11のいずれかに記載
    のマルチメディアデータ符号化多重化方法において、 上記符号化マルチメディア情報バッファリングステップ
    において、一時蓄積した符号化マルチメディア情報の量
    が一定量を超えた場合に、上記一時蓄積した符号化マル
    チメディアデータ量に基づいて、ダミー情報挿入時間を
    算出し、上記符号化マルチメディアデータ符号化ステッ
    プと、後述するダミー情報挿入ステップとに出力する途
    切れ防止ステップと、 上記ダミー情報挿入時間が入力された場合、上記ダミー
    情報挿入時間に相当する符号化マルチメディア情報を、
    上記符号化マルチメディアバッファリングステップにお
    いて一時蓄積されるように出力するダミー情報挿入ステ
    ップとをさらに備え、 上記マルチメディアデータ符号化ステップでは、上記ダ
    ミー情報挿入時間が入力された場合、当該ダミー情報挿
    入時間に相当する量のデジタルマルチメディアデータを
    符号化せずに廃棄するものであることを特徴とするマル
    チメディアデータ符号化多重化方法。
  13. 【請求項13】 請求項11に記載のマルチメディアデ
    ータ符号化多重化方法において、 上記マルチメディアデータ符号化ステップでは、上記デ
    ジタルマルチメディアデータに対して、単独で復号処理
    をすることができる独立符号化情報と、他の符号化マル
    チメディア情報を参照することにより復号処理をするこ
    とができる差分符号化情報とを生成する符号化処理を行
    い、上記独立符号化情報と、上記差分符号化情報とから
    なる上記符号化マルチメディア情報を生成するものであ
    り、 上記符号化マルチメディア情報バッファリングステップ
    では、上記ダミー情報挿入時間に相当する量の符号化マ
    ルチメディア情報を一時蓄積せずに廃棄した後、後続の
    上記差分符号化情報を、上記独立符号化情報に変換して
    一時蓄積するものであることを特徴とするマルチメディ
    アデータ符号化多重化方法。
  14. 【請求項14】 請求項12に記載のマルチメディアデ
    ータ符号化多重化方法において、 上記マルチメディアデータ符号化ステップでは、上記デ
    ジタルマルチメディアデータに対して、単独で復号処理
    をすることができる独立符号化情報と、他の符号化マル
    チメディア情報を参照することにより復号処理をするこ
    とができる差分符号化情報とを生成する符号化処理を行
    い、上記独立符号化情報と、上記差分符号化情報とから
    なる上記符号化マルチメディア情報を生成するものであ
    り、 上記途切れ防止ステップでは、上記一時蓄積量に基づい
    て決定されるダミー情報挿入時間を算出した後、上記マ
    ルチメディアデータ符号化ステップにおいて、符号化せ
    ずに廃棄されるデジタルマルチメディアデータに後続す
    る、上記差分符号化情報とされるべきデジタルマルチメ
    ディアデータの符号化処理に相当する時間である挿入修
    正時間を算出し、上記ダミー情報挿入時間に対して、上
    記挿入修正時間の加算処理による修正を行うものである
    ことを特徴とするマルチメディアデータ符号化多重化方
    法。
  15. 【請求項15】 請求項1ないし14のいずれかに記載
    のマルチメディアデータ符号化多重化方法において、 当該符号化多重化処理を実行する装置自体の性能を判定
    し、上記判定の結果に従って、上記符号化マルチメディ
    ア情報バッファリング手段の用いる一時蓄積用記憶手段
    の量を決定する、バッファ量決定ステップをさらに備え
    たことを特徴とするマルチメディアデータ符号化多重化
    方法。
  16. 【請求項16】 デジタル化された映像、及びデジタル
    化された音声を含むデジタルマルチメディアデータが、
    符号化され、時分割多重化されたマルチメディアデータ
    符号化多重化情報を得るマルチメディアデータ符号化多
    重化装置において、 情報を記憶するものであり、情報の一時的な蓄積に用い
    られる一時蓄積用記憶手段と、 上記デジタル化された、デジタルマルチメディアデータ
    を符号化して、その再生時間がTであり、その量がVで
    ある符号化マルチメディア情報を生成し、上記再生時間
    T、および上記量Vに基づいてブロックレート情報を生
    成するマルチメディアデータ符号化手段と、 上記マルチメディアデータ符号化手段において生成され
    た上記符号化マルチメディア情報と、上記ブロックレー
    ト情報とを、上記一時蓄積用記憶手段に一時蓄積する符
    号化マルチメディア情報バッファリング手段と、 上記一時蓄積されたブロックレート情報を用いて取得さ
    れる、上記時分割多重化における時間間隔を示す同期間
    隔時間情報に対応する量の、上記一時蓄積された符号化
    マルチメディア情報を読み出す符号化マルチメディア情
    報読み出し手段と、 上記符号化マルチメディア読み出し手段において読み出
    された符号化マルチメディア情報に対して、上記ブロッ
    クレート情報に基づいて取得される再生時刻情報を付与
    し、多重化処理を行ってマルチメディアデータ符号化多
    重化情報を生成する符号化マルチメディア情報同期手段
    とを備えたことを特徴とするマルチメディアデータ符号
    化多重化装置。
  17. 【請求項17】 デジタル化された映像、及びデジタル
    化された音声を含むデジタルマルチメディアデータが、
    符号化され、時分割多重化されたマルチメディアデータ
    符号化多重化情報を得るマルチメディアデータ符号化多
    重化装置において、 情報を記憶するものであり、情報の一時的な蓄積に用い
    られる一時蓄積用記憶手段と、 上記デジタル化された、デジタルマルチメディアデータ
    を符号化して、その再生時間がTであり、その量がVで
    ある符号化マルチメディア情報を生成するマルチメディ
    アデータ符号化手段と、 設定された単位再生時間に対応する符号化マルチメディ
    ア情報の量を示す符号化マルチメディア情報単位量を用
    いて、上記マルチメディアデータ符号化手段において生
    成された符号化マルチメディア情報に対して、上記符号
    化マルチメディア情報単位量ごとに分割して一時蓄積用
    記憶手段に一時蓄積する符号化マルチメディア情報バッ
    ファリング手段と、 上記一時蓄積された符号化マルチメディア情報を読み出
    して、マルチメディアデータ符号化多重化情報を生成す
    る符号化マルチメディア情報同期手段とを備えたことを
    特徴とするマルチメディアデータ符号化多重化装置。
  18. 【請求項18】 デジタル化された映像、及びデジタル
    化された音声を含むデジタルマルチメディアデータが、
    符号化され、時分割多重化されたマルチメディアデータ
    符号化多重化情報を得るマルチメディアデータ符号化多
    重化プログラムを記録したプログラム記録媒体におい
    て、 上記デジタル化された、デジタルマルチメディアデータ
    を符号化して、その再生時間がTであり、その量がVで
    ある符号化マルチメディア情報を生成し、上記再生時間
    T、および上記量Vに基づいてブロックレート情報を生
    成するマルチメディアデータ符号化ステップと、 上記マルチメディアデータ符号化ステップにおいて生成
    された上記符号化マルチメディア情報と、上記ブロック
    レート情報とを、一時蓄積用記憶手段に一時蓄積する符
    号化マルチメディア情報バッファリングステップと、 上記一時蓄積されたブロックレート情報を用いて取得さ
    れる、上記時分割多重化における時間間隔を示す同期間
    隔時間情報に対応する量の、上記一時蓄積された符号化
    マルチメディア情報を読み出す符号化マルチメディア情
    報読み出しステップと、 上記符号化マルチメディア読み出しステップにおいて読
    み出された符号化マルチメディア情報に対して、上記ブ
    ロックレート情報に基づいて取得される再生時刻情報を
    付与し、多重化処理を行ってマルチメディアデータ符号
    化多重化情報を生成する符号化マルチメディア情報同期
    ステップとを含むマルチメディアデータ符号化多重化プ
    ログラムを記録したことを特徴とするマルチメディアデ
    ータ符号化多重化プログラム記録媒体。
  19. 【請求項19】 デジタル化された映像、及びデジタル
    化された音声を含むデジタルマルチメディアデータが、
    符号化され、時分割多重化されたマルチメディアデータ
    符号化多重化情報を得るマルチメディアデータ符号化多
    重化プログラムを記録したプログラム記録媒体におい
    て、 上記デジタル化された、デジタルマルチメディアデータ
    を符号化して、その再生時間がTであり、その量がVで
    ある符号化マルチメディア情報を生成するマルチメディ
    アデータ符号化ステップと、 設定された単位再生時間に対応する符号化マルチメディ
    ア情報の量を示す符号化マルチメディア情報単位量を用
    いて、上記マルチメディアデータ符号化ステップにおい
    て生成された符号化マルチメディア情報に対して、上記
    符号化マルチメディア情報単位量ごとに分割して一時蓄
    積用記憶手段に一時蓄積する符号化マルチメディア情報
    バッファリングステップと、 上記一時蓄積された符号化マルチメディア情報を読み出
    して、マルチメディアデータ符号化多重化情報を生成す
    る符号化マルチメディア情報同期ステップとを含むマル
    チメディアデータ符号化多重化プログラムを記録したこ
    とを特徴とするマルチメディアデータ符号化多重化プロ
    グラム記録媒体。
JP9308682A 1996-11-11 1997-11-11 マルチメディアデータ符号化多重化方法、マルチメディアデータ符号化多重化装置、およびマルチメディアデータ符号化多重化プログラム記録媒体 Pending JPH1175171A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9308682A JPH1175171A (ja) 1996-11-11 1997-11-11 マルチメディアデータ符号化多重化方法、マルチメディアデータ符号化多重化装置、およびマルチメディアデータ符号化多重化プログラム記録媒体

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP8-298970 1996-11-11
JP29897096 1996-11-11
JP8-302582 1996-11-14
JP30258296 1996-11-14
JP9-162255 1997-06-19
JP16225597 1997-06-19
JP9308682A JPH1175171A (ja) 1996-11-11 1997-11-11 マルチメディアデータ符号化多重化方法、マルチメディアデータ符号化多重化装置、およびマルチメディアデータ符号化多重化プログラム記録媒体

Publications (1)

Publication Number Publication Date
JPH1175171A true JPH1175171A (ja) 1999-03-16

Family

ID=27473791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9308682A Pending JPH1175171A (ja) 1996-11-11 1997-11-11 マルチメディアデータ符号化多重化方法、マルチメディアデータ符号化多重化装置、およびマルチメディアデータ符号化多重化プログラム記録媒体

Country Status (1)

Country Link
JP (1) JPH1175171A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006140984A (ja) * 2004-10-15 2006-06-01 Kddi Corp 特定メディアデータの破棄を制御する送信装置及び送信プログラム
JP2009232187A (ja) * 2008-03-24 2009-10-08 Nec Personal Products Co Ltd Av圧縮装置およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006140984A (ja) * 2004-10-15 2006-06-01 Kddi Corp 特定メディアデータの破棄を制御する送信装置及び送信プログラム
JP2009232187A (ja) * 2008-03-24 2009-10-08 Nec Personal Products Co Ltd Av圧縮装置およびプログラム

Similar Documents

Publication Publication Date Title
KR100266196B1 (ko) 멀티미디어 데이터 부호화 다중화 방법 및 그 장치와, 멀티미디어 데이터 부호화 다중화 프로그램 기록 매체
JP3739609B2 (ja) マルチメディアの再生システムにおけるディジタルのビデオおよびオーディオの再生の適応型同期化のための方法および装置
JP4519082B2 (ja) 情報処理方法、動画サムネイル表示方法、復号化装置、および情報処理装置
JP2004040794A (ja) ディジタルデータレート変更および方向性再生変更の処理の方法およびシステム
US20060012709A1 (en) Method of generating video reproduction synchronizing signal, program for generating video reproduction synchronizing signal, timing control apparatus, method of synchronously reproducing video and audio, program for synchronously reproducing video and audio, and apparatus for synchronously reproducing video and audio
JPH08505024A (ja) ビデオおよびオーディオ信号処理システムにおける補助情報のための合理的入力バッファの回路配列
JP2006520986A (ja) ストリームバッファチャネル用のcpiデータ
US8798162B2 (en) Encoding method, decoding method, encoder, and decoder
JP3802521B2 (ja) 符号化装置、符号化制御方法及び符号化制御プログラム
JP3438223B2 (ja) 多重化装置および多重化方法、並びに伝送装置および伝送方法
KR100490403B1 (ko) 오디오 스트림의 버퍼링 제어 방법 및 그 장치
KR100629093B1 (ko) 디코딩 장치 및 디코딩 방법
JPWO2004071085A1 (ja) コード変換方法及びその装置
US7061982B2 (en) Long-hour video/audio compression device and method thereof
JP2009004897A (ja) 動画像符号化装置
JPH1175171A (ja) マルチメディアデータ符号化多重化方法、マルチメディアデータ符号化多重化装置、およびマルチメディアデータ符号化多重化プログラム記録媒体
US20100274918A1 (en) Stream data multiplexing device and multiplexing method
JP2006066995A (ja) 画像再生装置及びその制御方法及びプログラム及び記憶媒体
JP4153817B2 (ja) データ符号化方法およびデータ符号化装置
JP2008177874A (ja) 記録装置、記録方法、プログラム、及び記憶媒体
JP2002218458A (ja) 映像再生装置
JPWO2017033764A1 (ja) 記録装置、および記録方法、並びにプログラム
US20090110364A1 (en) Reproduction apparatus and reproduction method
KR0129805B1 (ko) 다이제스트 기능을 갖는 디지탈 신호처리시스템
CN113490047A (zh) 一种Android音视频播放方法