JP3539615B2 - 符号化装置、編集装置及び符号化多重化装置並びにそれらの方法 - Google Patents
符号化装置、編集装置及び符号化多重化装置並びにそれらの方法 Download PDFInfo
- Publication number
- JP3539615B2 JP3539615B2 JP05712598A JP5712598A JP3539615B2 JP 3539615 B2 JP3539615 B2 JP 3539615B2 JP 05712598 A JP05712598 A JP 05712598A JP 5712598 A JP5712598 A JP 5712598A JP 3539615 B2 JP3539615 B2 JP 3539615B2
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- coding
- audio
- editing
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【目次】
以下の順序で本発明を説明する。
【0002】
発明の属する技術分野
従来の技術
発明が解決しようとする課題(図15〜図18)
課題を解決するための手段
発明の実施の形態
(1)第1の実施の形態(図1〜図9)
(2)第2の実施の形態(図10〜図12)
(3)他の実施の形態(図13〜図14)
発明の効果
【0003】
【発明の属する技術分野】
本発明は符号化装置、編集装置及び符号化多重化装置並びにそれらの方法に関し、例えばデイジタル信号の編集に適用して好適なものである。
【0004】
【従来の技術】
従来、画像や音声の信号は、A/D(Analog/Digital)変換してデイジタル符号化したデイジタル信号で扱われることが増えている。デイジタル化方法の代表的なものとして、MPEG(Moving Picture Experts Group)と呼ばれる方式があり、かかるMPEG方式では、音声をフレームと呼ばれる所定の単位に分割し、このフレーム毎に圧縮符号化処理を行いオーデイオストリームを生成する。
【0005】
符号化された音声を編集する場合、一旦ベースバンド信号に復号して編集した後再び符号化することは、音質の劣化を招くとともに編集装置の構成が複雑になるため、符号化されたオーデイオストリームの状態で編集処理を行う事が考えられる。
【0006】
【発明が解決しようとする課題】
現在デイジタルテレビ放送等で使用されている、ISO(International Organization for Standards、国際標準化機構)11172−3で標準化されたいわゆるMPEG1 Layer2方式で符号化されたオーデイオストリームの場合、全てのフレームは前後のフレームに依存することなく復号することができるため、全てのフレームにおいて編集を行うことができる。
【0007】
これに対し、ISO13818−7で標準化されたいわゆるMPEG2 AAC(Advanced Audio Coding )方式のような、予測符号化を用いた、あるフレームの復号処理が前後のフレームに依存する符号化方法の場合、編集を行うことにより編集の切替え点のフレームを復号した音声に歪みが生じることがある。
【0008】
図15において10は全体としてオーデイオ編集装置を示し、外部よりオーデイオストリームD1A及びD1Bが供給されていると同時に、ストリームサーバ15よりオーデイオストリームD15A及びD15Bが供給されている。オーデイオストリームD1A、D1B、D15A及びD15BはそれぞれMPEG2
AAC方式により符号化された音声データである。
【0009】
切替器11Aは、オーデイオストリームD1A及びD15Aのいずれか一方を選択し、オーデイオストリームD11Aとして切替器12に送出する。切替器11Bも同様に、オーデイオストリームD1B及びD15Bのいずれか一方を選択し、オーデイオストリームD11Bとして切替器12に送出する。
【0010】
切替器12は、オーデイオストリームD11A及びオーデイオストリームD11Bを任意の時点で切り換えることにより、編集後のオーデイオストリームD12を生成し外部に送出する。
【0011】
図16は、オーデイオ編集装置10におけるオーデイオストリームの編集状態を示し、図16(A)に示すオーデイオストリームD11AのフレームA3と、図16(B)に示すオーデイオストリームD11BのフレームB4とを接続することにより、図16(C)に示すオーデイオストリームD12を生成している。フレームA3のように編集点の直前となることのできるフレームを編集終了可能点フレームと呼び、フレームB4のように編集点の直後となることのできるフレームを編集開始可能点フレームと呼ぶ。
【0012】
符号化時においてはフレームA3の後にフレームA4が続いていたが、編集を行つたことにより後のフレームがB4に変更されている。オーデイオストリームD11Aを符号化した符号化部は、編集によつてフレームA3の後にどのようなフレームが接続されるのか分からないため、編集終了可能点フレームA3を後ろに続くフレームに依存せずに復号できるように符号化しなければならない。同様に符号化時においてはフレームB4の前にフレームB3が続いていたが、編集を行つたことにより前のフレームがA3に変更されている。オーデイオストリームD11Bを符号化した符号化部は、編集によつてフレームB4の前にどのようなフレームが接続されるのか分からないため、編集開始可能点フレームB4を前に続くフレームに依存せずに復号できるように符号化しなければならないという問題がある。
【0013】
以上はオーデイオストリームを単独で編集する場合について述べたが、例えばテレビジョン番組の編集のように、対応するオーデイオストリームとビデオストリームを同時に編集することが多い。
【0014】
図17において、20は全体としてオーデイオ・ビデオ編集装置を示し、外部よりトランスポートストリームD2A及びD2Bが供給されていると同時に、ストリームサーバ15よりトランスポートストリームD16A及びD16Bが供給されている。トランスポートストリームD2A、D2B、D16A及びD16Bは、それぞれMPEG2方式により符号化されたビデオストリーム及びMPEG2 AAC方式により符号化されたオーデイオストリームが多重化されたものである。
【0015】
切替器21AはトランスポートストリームD2A及びD16Aのいずれか一方を選択し、トランスポートストリームD21Aとして分離部24Aに送出する。分離部24AはトランスポートストリームD21Aに多重化されているビデオストリーム及びオーデイオストリームを分離し、それぞれをビデオストリームD24A及びオーデイオストリームD25Aとしてビデオ切替器27及びオーデイオ切替器28に送出する。
【0016】
同様に、切替器21BはトランスポートストリームD2B及びD16Bのいずれか一方を選択し、トランスポートストリームD21Bとして分離部24Bに送出する。分離部24BはトランスポートストリームD21Bに多重化されているビデオストリーム及びオーデイオストリームを分離し、それぞれをビデオストリームD24B及びオーデイオストリームD25Bとしてビデオ切替器27及びオーデイオ切替器28に送出する。
【0017】
ビデオ切替器27は、ビデオストリームD24A及びビデオストリームD24Bを切り換えることにより、編集後のビデオストリームD27を生成し外部に送出する。またオーデイオ切替器28は、オーデイオストリームD25A及びオーデイオストリームD25Bを切り換えることにより、編集後のオーデイオストリームD28を生成し外部に送出する。
【0018】
ここで、一般的にオーデイオ切替器27及びビデオ切替器28は同期して切替を行う。例えば、オーデイオストリームD24AとビデオストリームD24A、及びオーデイオストリームD24BとビデオストリームD24Bはそれぞれテレビジヨン番組の音声と映像として対応しており、ビデオストリームD24Aのある時点でビデオストリームD24Bに切り替えると同時に、オーデイオストリームD25AをオーデイオストリームD25Bに切り替える。
【0019】
このように音声と映像を同期して編集する場合、オーデイオストリームにオーデイオギヤツプと呼ばれる無音区間が発生するという問題がある。
【0020】
図18(A)において、ビデオストリームD24Aの編集終了可能点ピクチヤPoaと、ビデオストリームD24Bの編集開始可能点ピクチヤPibとをつなぎあわせることにより、ビデオストリームD27を生成している。このとき同時に、オーデイオストリームD25AとオーデイオストリームD25Bをつなぎあわせることにより、オーデイオストリームD28を生成している。
【0021】
ここで、編集終了可能点ピクチヤPoaと当該編集終了可能点ピクチヤPoaに最も近い編集終了可能点フレームFoaとは、Gaで示される時間差を有している。同様に、編集開始可能点ピクチヤPibと当該編集開始可能点ピクチヤPibに最も近い編集開始可能点フレームFibとは、Gbで示される時間差を有している。そしてオーデイオストリームD32において、時間差Gaと時間差Gbの合計がオーデイオギヤツプとなる。
【0022】
図18(A)においては、時間差Ga及び時間差Gbはそれぞれ1フレーム分以下であるが、場合によつては図18(B)に示すように、時間差Ga及び時間差Gbはそれぞれ数フレーム分になることもあり、このような場合オーデイオギヤツプが長くなつてしまうという問題がある。
【0023】
本発明は以上の点を考慮してなされたもので、編集作業による歪みやオーデイオギヤツプの少ない符号化装置、編集装置及び符号化多重化装置並びにそれらの方法を提案しようとするものである。
【0024】
【課題を解決するための手段】
かかる課題を解決するため本発明においては、音声信号の符号化において、編集終了可能符号化単位を符号化する場合、後ろに続く符号化単位との干渉の少ない符号化重み付けパターンを用いるとともに、編集開始可能符号化単位を符号化する場合、前に続く符号化単位との干渉の少ない符号化重み付けパターンを用いるようにすることにより、編集作業による歪みを少なくする。
【0025】
また音声信号の符号化において、編集開始可能符号化単位を符号化する場合、予測器の使用を停止するとともに予測器の状態変数を初期化することにより、編集作業による歪みを少なくする。
【0026】
また音声信号の符号化において、編集終了可能音声符号化単位を、編集終了可能映像符号化単位の表示終了の直前に表示を終了する符号化単位とし、編集開始可能音声符号化単位を、編集開始可能映像符号化単位の表示開始の直後に表示を開始する符号化単位とすることにより、オーデイオギヤツプを最小限とする。
【0027】
【発明の実施の形態】
以下図面について、本発明の一実施の形態を詳述する。
【0028】
(1)第1の実施の形態
図1において、50Aは全体として符号化多重化装置を示し、外部より映像信号S1A及び音声信号S2Aが供給されている。ビデオ符号化部51は、映像信号S1AをMPEG2(Moving Picture Experts Group)方式により符号化し、ビデオストリームD51として送出する。また、オーデイオ符号化部60は、音声信号S2AをMPEG2 AAC(Advanced Audio Coding )方式(以下、AAC方式と呼ぶ)により符号化し、オーデイオストリームD60として送出する。多重化部56はビデオストリームD51及びオーデイオストリームD60をMPEG2方式により多重化し、トランスポートストリームD50Aとして送出する。
【0029】
このときシステムコントローラ53は、編集位置指示信号D5に応じて、編集可能点指示信号D54を、ビデオ符号化部51及びオーデイオ符号化部60に送出する。編集位置指示信号D5は、符号化多重化装置50Aを操作するオペレータにより、シーンの切れ目等の編集位置としたいタイミングで入力される。
【0030】
ビデオ符号化部51は、編集可能点指示信号D54に応じて、ビデオストリームD51に編集終了可能点ピクチヤ及び編集開始可能点ピクチヤを設定する。すなわち図2において、編集可能点指示信号D54が示す編集位置をEとすると、編集位置Eの直前のピクチヤを編集終了可能点ピクチヤPoとし、編集位置Eの直後のピクチヤを編集開始可能点ピクチヤPiとする。そして編集終了可能点ピクチヤPoの予測符号化方式を、前方向予測符号化を用いたPピクチヤ又はイントラ符号化を用いたIピクチヤとして符号化し、編集開始可能点ピクチヤPiの予測符号化方式を、イントラ符号化を用いたIピクチヤとして符号化する。そして、かかる編集終了可能点ピクチヤ及び編集開始可能点ピクチヤの設定結果をビデオ編集可能点設定信号D52としてシステムコントローラ53に送出する。
【0031】
オーデイオ符号化部60は、編集可能点指示信号D54に応じて、オーデイオストリームD60に編集終了可能点フレーム及び編集開始可能点フレームを設定し、かかる編集終了可能点フレーム及び編集開始可能点フレームの設定結果を、オーデイオ編集可能点設定信号D59としてシステムコントローラ53に送出する。すなわち図2において、編集可能点指示信号D54が示す編集位置をEとすると、編集位置Eの直前のフレームを編集終了可能点フレームFoとし、編集位置Eの直後のフレームを編集開始可能点フレームFiとすることにより、オーデイオギヤツプGa及びGbをそれぞれ1フレーム以下とし、オーデイオギヤツプの長さを最小限になるようにする。システムコントローラ53は、ビデオ編集可能点設定信号D52及びオーデイオ編集可能点設定信号D59に応じて、編集可能点信号D53を多重化部56に送出する。
【0032】
ここでオーデイオ符号化部60は、編集終了可能点フレームFo及び編集開始可能点Fiの変換窓形状を規定するとともに、編集開始可能点フレームFiについて予測符号化を停止する。
【0033】
まず、変換窓形状について説明する。図3は、AAC方式における、符号化部に入力されるオーデイオデータのサンプル値をフレーム毎に処理する際の重み付けパターンである変換窓の形状を示している。AAC方式においては、4種の変換窓形状を選択して使用することができ、フレーム単位で変換窓形状の選択を変えることが可能である。
【0034】
図3(A)に示すオンリーロングシークエンスS1では、2フレーム分のサンプルに相当する2048サンプルの入力区間に対してMDCT処理を行うことにより、1024本のスペクトル係数を得る。また図3(B)に示すエイトシヨートシークエンスS2では、一つのシヨートウインドウが128本のスペクトル係数への変換に対応しており、8個のシヨートウインドウを時間的にオーバーラツプさせながら8回のMDCTを行うことにより1024本のスペクトル係数を得る。図3(C)に示すロングスタートシークエンスS3及び図3(D)に示すロングストツプシークエンスS4は、オンリーロングシークエンスS1とエイトシヨートシークエンスS2との切り替え区間に用いられる。
【0035】
図3(E)は、隣り合うフレームの変換窓の干渉いわゆるオーバーラツプを示す。フレームF(n-1) 及びフレームF(n) の変換窓はどちらもオンリーロングシークエンスS1が選択されている。フレームF(n-1) の変換窓W(n-1) 及びフレームF(n) の変換窓W(n) はフレームF(n) においてオーバーラツプしており、フレームF(n) の入力オーデイオサンプルはフレームF(n-1) 及びフレームF(n) の双方の符号化処理対象となる。
【0036】
すなわち、フレームF(n) に相当する区間の復号においては、フレームF(n-1) のオーデイオストリームに符号化されていたスペクトル係数をIMDCT処理したサンプル値のうちフレームF(n) に相当するオーデイオサンプルと、フレームF(n) のオーデイオストリームに符号化されていたスペクトル係数をIMDCT処理したサンプル値のうちフレームF(n) に相当するオーデイオサンプルとを、それぞれの変換窓形状に応じた重み付けを行つた後加算することにより、フレームF(n) を復号する。
【0037】
このように復号処理においては、あるフレームとその直前のフレームとが影響し合うため、編集を行うことにより、復号された音声に歪みが生じる場合がある。
【0038】
図4(A)は、オーデイオストリームD60AとオーデイオストリームD60Bとを編集点Eで接続し、編集後のオーデイオストリームD60Cを生成した状態を示す。ここで、オーデイオストリームD60Aの編集終了可能点フレームFa(n−1)の変換窓Wa(n−1)はロングスタートシークエンスS3を使用しており、オーデイオストリームD60Bの編集開始可能点フレームFb(n)の変換窓Wb(n)はエイトシヨートシークエンスS2を使用している。
【0039】
オーデイオストリームD60Cにおいて、フレームFc(n)で変換窓Wa(n−1)と変換窓Wb(n)がオーバーラツプする。変換窓Wa(n−1)は、フレームFc(n)に相当する区間の前半分程度しか含まず、変換窓Wb(n)は、フレームFc(n)に相当する区間の後半分程度しか含まない。このため、変換窓Wa(n−1)と変換窓Wb(n)とが重なるオーバーラツプ区間Loはごく短い区間となる。従つてオーデイオストリームD60Cを復号化した場合、本来全く異なる音声のフレームであるフレームFc(n−1)とフレームFc(n)とがオーバーラツプして復号される時間は短く、歪みはほとんど発生しない。
【0040】
これに対し、図4(B)ではオーデイオストリームD60Aの編集終了可能点フレームFa(n−1)の変換窓Wa(n−1)はオンリーロングシークエンスS1を使用しており、オーデイオストリームD60Bの編集開始可能点フレームFb(n)の変換窓Wb(n)はエイトシヨートシークエンスS2を使用している。
【0041】
変換窓Wa(n−1)は、フレームFc(n)に相当する区間のほぼ全体を含んでいる。このため、変換窓Wa(n−1)と変換窓Wb(n)とが重なるオーバーラツプ区間LoはフレームFc(n)のほぼ全長となる。従つてオーデイオストリームD60Cを復号化した場合、本来全く異なる音声のフレームであるフレームFc(n−1)とフレームFc(n)とがオーバーラツプして復号される時間が長くなり、歪みが生じてしまう。
【0042】
かかる歪みの発生を防止するため、編集終了可能点フレーム及び編集開始可能点フレームの変換窓を、オーバーラツプの少ない形状にする必要がある。
【0043】
次に、編集開始可能点フレームにおける予測符号化の停止について説明する。AAC方式においてはオプシヨンとしてスペクトル係数に対する予測符号化処理が規定されている。かかる予測符号化処理を行うことにより、発生符号量を削減し得る。かかる予測処理は行つても行わなくても良い。しかし、編集開始可能点フレームについて予測符号化を用いた場合、編集後において復号した音声に歪みが発生してしまう。
【0044】
図5において60は全体としてオーデイオ符号化部を示し、フイルタバンク61は、音声信号S2Aを所定のフレームに分割した後、各フレームに対しMDCT(Modified Discrete Cosine Transform)処理を行うことにより周波数領域の1024本のスペクトル係数として符号化し、これをスペクトル係数データD61として予測制御器62に送出する。以降の処理は、全てフレーム単位で行われる。実際には予測制御器62以降のブロツクはスペクトル係数の本数分存在しており、複数のスペクトル係数をそれぞれ平行して処理するが、ここでは1系統のブロツクのみを説明する。
【0045】
オーデイオ符号化部60において予測処理を行わない場合、予測制御器62はスペクトル係数データD61をそのまま演算データD62として量子化部63に送出する。量子化部63は、演算データD62に対し量子化処理を行い、量子化データD63としてハフマン符号化部64に送出する。ハフマン符号化部64は量子化データD63に対しハフマン符号による可変長符号化処理を行い、符号化データD64として送出する。
【0046】
一方、オーデイオ符号化部60において予測処理を行う場合、予測制御器62はスペクトル係数データD61について、予測器67より供給される予測スペクトル係数データD67を用いて減算処理して差分データを算出し、これを演算データD62として量子化部63に送出する。
【0047】
量子化部63は、演算データD62に対し量子化処理を行い、量子化データD63としてハフマン符号化部64及び逆量子化部65に送出する。
【0048】
ハフマン符号化部64は、量子化データD63に対しハフマン符号による可変長符号化処理を行い、オーデイオストリームD64として送出する。
【0049】
逆量子化部65は、量子化データD63に対し逆量子化処理を行い、演算データD65として予測制御器66に送出する。予測制御器66は、演算データD65(差分データ)と予測器67から供給される予測スペクトル係数データD67とを加算することによりスペクトル係数データを再生し、これを再生スペクトル係数データD66として予測器67に送出する。
【0050】
予測器67は、再生スペクトル係数データD66を基に予測スペクトル係数データD67を算出する。すなわち、予測制御器62に供給されているスペクトル係数データD61のフレームをF(n) とすると、予測器67はフレームF(n-1) までの再生スペクトル係数データD66を基に、再生スペクトル係数データD66の変移状態を示す値である状態変数Pを算出する。そして当該状態変数Pに基づいてフレームF(n) のスペクトル係数データの値を予測することにより予測スペクトル係数データD67を得る。
【0051】
このようにして得た予測スペクトル係数データD67と、スペクトル係数データD61との差分を算出し、この差分値を量子化及び可変長符号化処理することにより、符号化処理による発生符号量を削減し得る。
【0052】
ところで、かかる予測符号化処理を用いて符号化したオーデイオストリームを復号化するためには、符号化部が有する予測器の状態変数Pと、復号化部が有する予測器の状態変数Pとが同一でなければならない。
【0053】
図6は全体としてオーデイオ復号化部90を示し、オーデイオ符号化部60により符号化処理されたオーデイオストリームD64が供給されている。ハフマン復号化部91はオーデイオストリームD64に対しハフマン符号による可変長復号化処理を行い、量子化データD91として逆量子化部92に送出する。逆量子化部92は、量子化データD91に対し逆量子化処理を行い、演算データD92として予測制御器93に送出する。
【0054】
オーデイオ符号化部60による符号化処理において予測符号化が行われていない場合、予測制御器93は演算データD92をそのままスペクトル係数データD93としてフイルタバンク94に送出する。フイルタバンク94はスペクトル係数データD93に対しIMDCT(Inverse Modified Discrete Cosine Transform)処理を行い復号化し、音声信号S94として送出する。
【0055】
一方、オーデイオ符号化部60による符号化処理において予測符号化が行われていた場合、予測制御器93は演算データD92(差分データ)について、予測器95より供給される予測スペクトル係数データD95を加算することによりスペクトル係数データを生成し、これをスペクトル係数データD93としてフイルタバンク94及び予測器95に送出する。
【0056】
フイルタバンク94はスペクトル係数データD93に対しIMDCT処理を行い復号化し、音声信号S94として送出する。
【0057】
予測器95は、スペクトル係数データD93を基に予測スペクトル係数データD95を算出する。すなわち、予測制御器93に供給されている演算データD92のフレームをF(n) とすると、予測器95はフレームF(n-1) までのスペクトル係数データD93を基に状態変数Pを算出する。そして当該状態変数Pに基づいてフレームF(n) のスペクトル係数データの値を予測することにより予測スペクトル係数データD95を得る。このようにして得た予測スペクトル係数データD95と、演算データD92を加算することにより、差分値からスペクトル係数データD93を生成する。
【0058】
ここで、予測符号化を用いて符号化されたオーデイオストリームを編集した場合、編集点の前後において、異なる状態変数Pを用いて予測符号化された2つのオーデイオストリームが接続されることになる。このため編集点以降において、符号化部が有する予測器の状態変数Pと復号化部が有する予測器の状態変数Pとの間に相違が生じる。この状態変数Pの相違により、当該状態変数Pを用いて算出される予測スペクトル係数データD67とD95の間に相違が生じ、この結果スペクトル係数データD93に誤差が生じる。スペクトル係数データD93の誤差は、再生される音声の歪みとして現れる。かかる誤差は状態変数Pに蓄積されていき、スペクトル係数データD93の誤差も増大していく。
【0059】
かかる歪みの発生を防止するため、編集開始可能点フレームについて予測器の使用を停止し予測符号化を行わないようにするとともに、予測器をリセツトし、当該予測器が有する状態変数Pを初期値にリセツトする必要がある。
【0060】
AAC方式では、エイトシヨートシークエンスS2を使用したフレームの符号化及び復号化においては全ての予測器を使用しないとともに全ての予測器の状態変数をリセツトしなければならないことが規定されている。このためオーデイオ符号化部60は、編集終了可能点フレームの変換窓形状をエイトシヨートシークエンスS2又はロングスタートシークエンスS3とするとともに、編集開始可能点フレームの変換窓形状をエイトシヨートシークエンスS2とすることにより、編集点における歪みの発生を防止する。
【0061】
図7はオーデイオ符号化部60における符号化処理を示す。ステツプSP1で処理を開始し、ステツプSP2において、符号化するフレームであるフレームNが編集開始可能点フレームかどうかを判定する。すなわちステツプSP2において肯定結果が得られると、このことはフレームNが編集開始可能点フレームとして指定されていることを示しており、処理はステツプSP7に進む。ステツプSP7において、エイトシヨートシークエンスS2を用いてフレームNの符号化を行い、ステツプSP5に進む。
【0062】
これに対し、ステツプSP2において否定結果が得られると、このことはフレームNが編集開始可能点フレームとして指定されていないことを示しており、処理はステツプSP3に進む。
【0063】
ステツプSP3において、フレームNが編集終了可能点フレームかどうかを判定する。すなわちステツプSP3において肯定結果が得られると、このことはフレームNが編集終了可能点フレームとして指定されていることを示しており、処理はステツプSP6に進む。ステツプSP6において、エイトシヨートシークエンスS2またはロングスタートシークエンスS3を用いてフレームNの符号化を行い、ステツプSP5に進む。
【0064】
これに対し、ステツプSP3において否定結果が得られると、このことはフレームNが編集終了可能点フレームとして指定されていないことを示しており、処理はステツプSP4に進む。ステツプSP4において、任意の変換窓を用いてフレームNの符号化を行い、ステツプSP5に進む。
【0065】
ステツプSP5において、処理フレームを次のフレームに進め、ステツプSP2に戻る。以上の処理を各フレームについて行うことにより、編集点における歪みの無い符号化を行い得る。
【0066】
ところで編集作業を行うためには、編集終了可能点及び編集開始可能点がトランスポートストリームのどこにあるかという情報が必要である。このため多重化部56は編集可能点信号D53に応じて、編集可能点の位置情報をトランスポートストリームD50Aに符号化する。
【0067】
MPEG2方式においては、TS(Transport Stream)パケツトと呼ばれる188バイト長のパケツト毎にデータを多重化する。図8はMPEG2方式によるデータの多重化を示し、オーデイオストリームD60は、まずPES(Packetized Elementary Stream)パケツトと呼ばれる固定長のパケツトに分割され、このPESパケツトの連続したストリームであるオーデイオPES D68となる。このとき、各PESパケツトの先頭にはPESヘツダとよばれるデータ領域が付加される。さらにPESパケツトはTS(Transport Stream)パケツトと呼ばれる188バイト長のパケツトに分割される。このとき、各TSパケツトの先頭にはTSパケツトヘツダとよばれるデータ領域が付加される。そしてTSパケツトは他のデータによるTSパケツトと多重化され、トランスポートストリームD50Aとなる。
【0068】
TSパケツトヘツダ内のアダプテーシヨンフイールドと呼ばれるデータ領域には、スプライスカウントダウンと呼ばれる領域が規定されている。このスプライスカウントダウン領域を用いて、編集可能点の位置情報をトランスポートストリームD50Aに記入する。
【0069】
すなわち図8に示すように、編集終了可能点フレームFoを分割してなるTSパケツトを、最も編集点Eに近いTSパケツトからTo(n)、To(n−1)とすると、TSパケツトTo(n)のスプライスカウントダウンSCDの値を0とし、TSパケツトTo(n−1)のスプライスカウントダウンSCDの値を1とする。また、編集開始可能点フレームFiを分割してなるTSパケツトを、最も編集点Eに近いTSパケツトからTi(n)、Ti(n+1)とすると、TSパケツトTi(n)のスプライスカウントダウンSCDの値を1とし、TSパケツトTi(n+1)のスプライスカウントダウンSCDの値を2とする。
【0070】
かくして、トランスポートストリームD50Aに編集可能点の位置情報が記入される。編集装置はトランスポートストリームのスプライスカウントダウンSCDの値を参照して編集可能点を検出し、かかる編集可能点でトランスポートストリームの切り替えを行うことにより、歪みの少ない編集をおこなうことができる。
【0071】
図9において、100は全体としてオーデイオ・ビデオ編集装置を示し、符号化多重化装置50AからトランスポートストリームD50Aが供給されているとともに、当該符号化多重化装置50Aと同一構成でなる符号化多重化装置50Bから、トランスポートストリームD50Bが供給されている。またストリームサーバ40から、トランスポートストリームD40A及びトランスポートストリームD40Bが供給されている。トランスポートストリームD40A及びトランスポートストリームD40Bは、予め符号化多重化装置50A及び符号化多重化装置50Bから送出されたトランスポートストリームD50A及びトランスポートストリームD50Bが、ストリームサーバ40に蓄えられたものである。
【0072】
選択器70Aは、トランスポートストリームD50A及びトランスポートストリームD40Aのいずれか一方を選択し、これをトランスポートストリームD70Aとして分離部75Aに供給する。分離部75Aは、トランスポートストリームD70Aに多重化されたビデオストリーム及びオーデイオストリームを分離し、それぞれをビデオストリームD75A及びオーデイオストリームD76Aとしてビデオ切替器78及びオーデイオ切替器79に送出する。
【0073】
同様に選択器70Bは、トランスポートストリームD50B及びトランスポートストリームD40Bのいずれか一方を選択し、これをトランスポートストリームD70Bとして分離部75Bに供給する。分離部75Bは、トランスポートストリームD70Bに多重化されたビデオストリーム及びオーデイオストリームを分離し、それぞれをビデオストリームD75B及びオーデイオストリームD76Bとしてビデオ切替器78及びオーデイオ切替器79に送出する。
【0074】
ここでシステムコントローラ82は、トランスポートストリームD70A及びトランスポートストリームD70BのスプライスカウントダウンSCDの値を、編集位置情報D77A及びD77Bとしてそれぞれ分離部75A及び75Bより常に得ている。またシステムコントローラ82には、オーデイオ・ビデオ編集装置100を操作するオペレータにより、編集位置指示信号D81が入力される。システムコントローラ82は、編集位置情報D77A、D77B及び編集位置指示信号D81を基に歪みの発生することの無い編集終了可能点及び編集開始可能点を検出し、かかる編集終了可能点及び編集開始可能点において、ビデオ切替信号D82をビデオ切替器78に送出するとともに、オーデイオ切替信号D83をオーデイオ切替器79に送出する。
【0075】
ビデオ切替器78は、ビデオ切替信号D82に応じてビデオストリームD75A及びビデオストリームD75Bを切り替え、ビデオストリームD78として送出する。またオーデイオ切替器79は、オーデイオ切替信号D83に応じてオーデイオストリームD76A及びオーデイオストリームD76Bを切り替え、オーデイオストリームD79として送出する。
【0076】
多重化部80は、ビデオストリームD78及びオーデイオストリームD79をMPEG2方式により多重化し、トランスポートストリームD80として送出する。またストリームサーバ40は、ビデオストリームD78、オーデイオストリームD79及びトランスポートストリームD80を蓄積する。
【0077】
以上の構成において、符号化多重化装置50Aに供給された映像信号S1Aは、図1に示されるようにビデオ符号化部51において符号化処理を受け、ビデオストリームD51として多重化部56に送出される。また、音声信号S2Aはオーデイオ符号化部60において符号化処理を受け、オーデイオストリームD60として多重化部56に送出される。
【0078】
ここでビデオ符号化部51は、システムコントローラ53から供給される編集可能点指示信号D54に応じて、ビデオストリームD51に編集終了可能点ピクチヤPo及び編集開始可能点ピクチヤPiを設定する。またオーデイオ符号化部60は、システムコントローラ53から供給される編集可能点指示信号D54に応じて、オーデイオストリームD60に編集終了可能点フレームFo及び編集開始可能点フレームFiを設定する。このとき、編集終了可能点ピクチヤPoの表示終了の直前に表示を終了するフレームを編集終了可能フレームFoとし、編集開始可能点ピクチヤPiの表示開始の直後に表示を開始するフレームを編集開始可能フレームFiとするとともに、編集終了可能フレームFoの変換窓をロングスタートシークエンスまたはエイトシヨートシークエンスとし、編集開始可能フレームFiの変換窓をエイトシヨートシークエンスとする。
【0079】
多重化部56は、ビデオストリームD51及びオーデイオストリームD60を多重化し、トランスポートストリームD50Aとして送出する。このとき多重化部56は、システムコントローラD53から供給される編集可能点信号D53に応じて、トランスポートストリームD50Aに編集可能点の位置情報を記入する。
【0080】
図9に戻りオーデイオ・ビデオ編集装置100において、トランスポートストリームD50A及びストリームサーバ40から供給されたトランスポートストリームD40Aは切替器70Aにおいて選択され、トランスポートストリームD70Aとして分離部75Aに供給される。トランスポートストリームD70Aは分離部75Aにおいて、ビデオストリームD75A及びオーデイオストリームD76Aとして、それぞれビデオ切替器78及びオーデイオ切替器79に供給される。同様にトランスポートストリームD50B及びストリームサーバ40から供給されたトランスポートストリームD40Bは切替器70Bにおいて選択され、トランスポートストリームD70Bとして分離部75Bに供給される。トランスポートストリームD70Bは分離部75Bにおいて、ビデオストリームD75B及びオーデイオストリームD76Bとして、それぞれビデオ切替器78及びオーデイオ切替器79に供給される。
【0081】
システムコントローラ82は、トランスポートストリームD70A及びトランスポートストリームD70Bの編集可能点の位置情報を編集位置情報D77A及びD77Bとして得ており、かかる編集位置情報D77A及びD77Bに応じてビデオ切替信号D82及びオーデイオ切替信号D83を送出する。ビデオ切替器78は、システムコントローラ82から供給されるビデオ切替信号D82に応じてビデオストリームD75A及びビデオストリームD75Bを切り替え、ビデオストリームD78として送出する。またオーデイオ切替器78は、システムコントローラ82から供給されるオーデイオ切替信号D83に応じてオーデイオストリームD76A及びオーデイオストリームD76Bを切り替え、オーデイオストリームD79として送出する。
【0082】
以上の構成によれば、音声信号の符号化において、編集終了可能点フレームの変換窓をエイトシヨートシークエンス又はロングスタートシークエンスとするとともに、編集開始可能点フレームの変換窓をエイトシヨートシークエンスとすることにより、編集点におけるオーバーラツプを少なくし、編集作業による歪みを減少し得る。
【0083】
また音声信号の符号化において、編集開始可能点フレームの変換窓を編集開始可能点フレームの変換窓をエイトシヨートシークエンスとすることにより、予測器の使用を停止するとともに予測器の状態変数を初期化し、編集作業による歪みを減少し得る。
【0084】
また音声信号の符号化において、編集終了可能点フレームを編集終了可能点ピクチヤの表示終了の直前に表示を終了するフレームとし、編集開始可能点フレームを編集開始可能点ピクチヤの表示開始の直後に表示を開始するフレームとすることにより、オーデイオギヤツプを最小限にし得る。
【0085】
(2)第2の実施の形態
図10において、110Aは全体として符号化装置を示し、外部より音声信号S2Aが供給されている。オーデイオ符号化部112は、音声信号S2AをAAC方式により符号化し、オーデイオストリームD110Aとして送出する。
【0086】
このときシステムコントローラ111は、編集位置指示信号D5に応じて、編集可能点指示信号D111を、オーデイオ符号化部112に送出する。編集位置指示信号D5は、符号化装置110Aを操作するオペレータにより、音声の切れ目等の編集位置としたいタイミングで入力される。オーデイオ符号化部110Aは、編集可能点指示信号D111に応じて、オーデイオストリームD110Aに編集終了可能点フレーム及び編集開始可能点フレームを設定する。
【0087】
すなわち図11(A)に示すように、編集可能点指示信号D111が示す編集位置をEとすると、編集位置Eの直前のフレームを編集終了可能点フレームFoとし、当該編集終了可能点フレームFoの変換窓形状をエイトシヨートシークエンスS2又はロングスタートシークエンスS3とする。また編集位置Eの直後のフレームを編集開始可能点フレームFiとし、当該編集開始可能点フレームFiの変換窓形状をエイトシヨートシークエンスS2とすることにより、編集点における歪みの発生を防止する。
【0088】
同時にオーデイオ符号化部112は、編集可能点の位置情報を、オーデイオストリームD110A内のデータストリームバイトと呼ばれる領域に記入する。データストリームバイトは、MPEG2方式によりユーザが任意に使用できる領域として規定されている。
【0089】
図11(A)は、データストリームバイト内に編集可能点の位置情報としてカウントダウン値CDという値を設定した場合を示し、編集終了可能点フレームFoのカウントダウン値CDの値を0とし、編集終了可能点フレームFo以前のフレームのカウントダウン値CDの値を1、2……とする。また編集開始可能点フレームFiのカウントダウン値CDの値を−1とし、編集開始可能点フレームFi以降のフレームのカウントダウン値CDの値を−2、−3……とする。かかるカウントダウン値CDを参照することにより、編集可能点の位置を知ることができる。
【0090】
かくして、オーデイオストリームD110Aに編集可能点の位置情報が記入される。編集装置はオーデイオストリームD110Aのカウントダウン値CDを参照して編集可能点を検出し、かかる編集点でオーデイオストリームの切り替えを行うことにより、歪みの少ない編集を行うことができる。
【0091】
図12において、200は全体としてオーデイオ編集装置を示し、符号化装置110AからオーデイオストリームD110Aが供給されているとともに、当該符号化装置110Aと同一構成でなる符号化装置110Bから、オーデイオストリームD110Bが供給されている。またストリームサーバ40から、オーデイオストリームD140A及びオーデイオストリームD140Bが供給されている。オーデイオストリームD140A及びオーデイオストリームD140Bは、予め符号化装置110A及び符号化装置110Bから送出されたオーデイオストリームD110A及びオーデイオストリームD110Bが、ストリームサーバ40に蓄えられたものである。
【0092】
選択器170Aは、オーデイオストリームD110A及びオーデイオストリームD140Aのいずれか一方を選択し、これをオーデイオストリームD170Aとして検出部175Aを介してオーデイオ切替器178に供給する。同様に選択器170Bは、オーデイオストリームD110B及びオーデイオストリームD140Bのいずれか一方を選択し、これをオーデイオストリームD170Bとして検出部175Bを介してオーデイオ切替器178に供給する。
【0093】
ここでシステムコントローラ182は、オーデイオストリームD170A及びオーデイオストリームD170Aのカウントダウン値CDの値を、それぞれ編集位置情報D177A及びD177Bとしてそれぞれ検出部175A及び175Bより常に得ている。またシステムコントローラ182には、オーデイオ編集装置200を操作するオペレータにより、編集位置指示信号D181が入力される。システムコントローラ182は、編集位置情報D177A、D177B及び編集位置指示信号D181を基に歪みの発生することの無い編集終了可能点及び編集開始可能点を検出し、かかる編集終了可能点及び編集開始可能点において、オーデイオ切替信号D183をオーデイオ切替器178に送出する。
【0094】
オーデイオ切替器178は、オーデイオ切替信号D183に応じてオーデイオストリームD170A及びオーデイオストリームD170Bを切り替え、オーデイオストリームD200として送出する。
【0095】
以上の構成において、符号化装置110Aに供給された音声信号S2Aはオーデイオ符号化部112において符号化処理を受け、オーデイオストリームD110Aとして送出される。
【0096】
ここでオーデイオ符号化部112は、システムコントローラ111から供給される編集可能点指示信号D111に応じて、オーデイオストリームD110Aに編集終了可能点フレームFo及び編集開始可能点フレームFiを設定する。このとき、編集終了可能フレームFoの変換窓をロングスタートシークエンスまたはエイトシヨートシークエンスとし、編集開始可能フレームFiの変換窓をエイトシヨートシークエンスとする。
【0097】
またオーデイオ符号化部112は、システムコントローラ111から供給される編集可能点信号D111に応じて、オーデイオストリームD110Aに編集可能点の位置情報を記入する。
【0098】
オーデイオ編集装置200において、オーデイオストリームD110A及びストリームサーバ140から供給されたオーデイオストリームD140Aは切替器170Aにおいて選択され、オーデイオストリームD170Aとして検出部175Aを介して切替器178に送出される。同様にオーデイオストリームD110B及びストリームサーバ140から供給されたオーデイオストリームD140Bは切替器170Bにおいて選択され、オーデイオストリームD170Bとして検出部175Bを介して切替器178に送出される。
【0099】
システムコントローラ182は、オーデイオストリームD170A及びD170Bの編集可能点の位置情報を編集位置情報D177A及びD177Bとして得ており、かかる編集位置情報D177A及びD177Bに応じてオーデイオ切替信号D182を送出する。オーデイオ切替器178は、システムコントローラ182から供給されるオーデイオ切替信号D182に応じてオーデイオストリームD170A及びオーデイオストリームD170Bを切り替え、オーデイオストリームD200として送出する。
【0100】
以上の構成によれば、音声信号の符号化において、編集終了可能点フレームの変換窓をエイトシヨートシークエンス又はロングスタートシークエンスとするとともに、編集開始可能点フレームの変換窓をエイトシヨートシークエンスとすることにより、編集点におけるオーバーラツプを少なくし、編集作業による歪みを減少し得る。
【0101】
また音声信号の符号化において、編集開始可能点フレームを符号化する場合、編集開始可能点フレームの変換窓をエイトシヨートシークエンスとすることにより予測器の使用を停止するとともに予測器の状態変数を初期化し、編集作業による歪みを減少し得る。
【0102】
(3)他の実施の形態
なお上述の第1の実施の形態及び第2の実施の形態においては、編集開始可能点フレームの変換窓をエイトシヨートシークエンスとして符号化することにより、編集開始可能点フレームにおいて予測器の使用停止及び予測器のリセツトを行うようにしたが、本発明においてはこれに限らず、編集開始可能点フレーム以降において予測器の一部づつを順にリセツトしていき、当該リセツトされた予測器のみを使用して符号化していく、段階リセツトを行うようにしても良い。この場合、編集開始可能点フレームの変換窓を任意の形状とすることができる。
【0103】
図13は段階リセツトの概念を示し、P0〜P4の合計5個の予測器が存在しており、各予測器はそれぞれ対応するスペクトル係数について予測符号化を行う。予測器のリセツトは1フレームに1個行われる。
【0104】
編集開始可能点フレームFoのフレーム番号をNとすると、まずフレームNにおいて予測器P0のリセツトが行われる。当該フレームNでは全ての予測器は使用できない。次のフレームN+1において予測器P1のリセツトが行われる。このとき、予測器P0はすでにリセツトされているため使用可能である。さらにフレームN+2において、予測器P2のリセツトが行われる。フレームN+2では、予測器P0及び予測器P1がリセツトされているため使用可能である。以降のフレームにおいてもリセツトされていない予測器を順次リセツトしていくことにより、フレームN+6では全ての予測器が使用可能となる。
【0105】
AAC方式においては、リセツトグループ及びスケールフアクターバンドと呼ばれる規格がある。これは予測器をリセツトグループと呼ばれるグループに分け、当該リセツトグループ毎にリセツトを行うとともに、予測器をスケールフアクターバンドと呼ばれるグループに分け、当該スケールフアクターバンド毎に予測器の使用を行うものである。
【0106】
図14(A)はリセツトグループを示し、予測器を1〜30のグループに分けたものである。1つのフレームでは1つのリセツトグループのみリセツトすることが許されている。リセツトを行うリセツトグループの番号は、オーデイオストリーム内に記入される。また図14(B)はスケールフアクターバンドを示し、予測器をスケールフアクターバンドと呼ばれるグループに分け、あるスケールフアクターバンドに含まれる全ての予測器がリセツトされた状態でのみ、当該スケールフアクターバンドに含まれる予測器を使用可能とするものである。
【0107】
図14(C)はリセツトグループ及びスケールフアクターバンドを用いたリセツトを示し、編集終了可能点フレームFoのフレーム番号をNとすると、まずフレームNにおいて、リセツトグループ1のリセツトが行われる。以降のフレームにおいて、順次リセツトグループ2以降のリセツトが行われて行く。そしてフレームN+3において、まずスケールフアクターバンド0に含まれる予測器が全てリセツトされ、当該スケールフアクターバンド0に含まれる予測器は次のフレームより使用可能となる。以降、リセツトが進むにつれ使用可能な予測器は増加して行く。
【0108】
このように予測器をリセツトグループに分け、編集終了可能点フレーム以降において予測器を当該リセツトグループ毎にリセツトを行うようにすることにより、編集開始可能点フレームの変換窓を任意の形状とすることができる。この場合の構成は、第1の実施の形態及び第2の実施の形態と同一で良い。
【0109】
さらに上述の第1の実施の形態及び第2の実施の形態においては、編集開始可能点フレームの変換窓をエイトシヨートシークエンスとして符号化することにより、編集開始可能点フレームにおいて全予測器の使用停止及び全予測器のリセツトを行うようにしたが、本発明においてはこれに限らず、編集開始可能点フレームにおいて強制的に予測器の全てをリセツトするようにしても良い。この場合の構成も、第1の実施の形態及び第2の実施の形態と同一で良い。
【0110】
【発明の効果】
上述のように本発明によれば、音声信号の符号化において、編集終了可能符号化単位を後ろに続く符号化単位との干渉の少ない符号化重み付けパターンを用いて符号化するとともに、編集開始可能符号化単位を前に続く符号化単位との干渉の少ない符号化重み付けパターンを用いて符号化することにより、編集作業により発生する歪みを減少し得る。
【0111】
また本発明によれば、音声信号の符号化において、編集開始可能符号化単位のを符号化する場合に予測器の使用を停止するとともに予測器を初期化することにより、編集作業により発生する歪みを減少し得る。
【0112】
また本発明によれば、音声信号の符号化において、編集終了可能音声符号化単位を、編集終了可能映像符号化単位の表示終了の直前に表示を終了する音声符号化単位とし、編集開始可能音声符号化単位を、編集開始可能映像符号化単位の表示開始の直後に表示を開始する音声符号化単位とすることにより、オーデイオギヤツプを最小にし得る。
【図面の簡単な説明】
【図1】第1の実施の形態による符号化多重化装置を示すブロツク図である。
【図2】編集可能点の設定の説明に供する略線図である。
【図3】変換窓の形状の説明に供する略線図である。
【図4】オーバーラツプによる歪みの説明に供する略線図である。
【図5】オーデイオ符号化部を示すブロツク図である。
【図6】オーデイオ復号化部を示すブロツク図である。
【図7】符号化処理の説明に供するフローチヤートである。
【図8】MPEG2方式によるデータ多重化を示す略線図である。
【図9】第1の実施の形態によるオーデイオ・ビデオ編集装置を示すブロツク図である。
【図10】第2の実施の形態による符号化装置を示すブロツク図である。
【図11】編集可能点の記入を示す略線図である。
【図12】第2の実施の形態によるオーデイオ編集装置を示すブロツク図である。
【図13】予測器のリセツトを示す図表である。
【図14】スケールフアクターバンドの説明に供する図表である。
【図15】オーデイオ編集装置を示すブロツク図である。
【図16】オーデイオストリームの説明に供する略線図である。
【図17】オーデイオ・ビデオ編集装置を示すブロツク図である。
【図18】オーデイオギヤツプを示す略線図である。
【符号の説明】
10、200……オーデイオ編集装置、11A、11B、12、21A、21B、70A、70B、170A、170B……切替器、15、40、140……ストリームサーバ、20……オーデイオ・ビデオ編集装置、24A、24B……分離部、27、78……ビデオ切替器、28、79、178……オーデイオ切替器、51……ビデオ符号化部、53、82、111、182……システムコントローラ、56、80……多重化部、60、112……オーデイオ符号化部、200……オーデイオ編集装置。
Claims (11)
- 外部から入力された編集位置指示信号に基づいて、編集可能点指示信号を出力する制御手段と、
外部から入力された音声信号を所定長の符号化単位に分割し、当該符号化単位それぞれに符号化重み付けパターンをかけた後符号化して符号化音声信号を生成する音声符号化手段と
を具え、
上記音声符号化手段は、上記編集可能点指示信号によつて示される編集位置直前の上記符号化単位を、編集終了可能符号化単位としてその後に続く上記符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化するとともに、上記編集位置直後の上記符号化単位を、編集開始可能符号化単位としてその前に続く上記符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化する
ことを特徴とする符号化装置。 - 上記音声符号化手段は、上記編集終了可能符号化単位及び上記編集開始可能符号化単位の位置情報を、上記符号化音声信号に記入する
ことを特徴とする請求項1に記載の符号化装置。 - 上記音声符号化手段は、
上記編集開始可能符号化単位を符号化するとき、予測動作を停止するとともに当該音声符号化手段が有する状態変数を初期化する
ことを特徴とする請求項1に記載の符号化装置。 - 外部から入力された映像信号をピクチヤ毎に符号化して符号化映像信号を生成する映像符号化手段と、
上記符号化音声信号及び上記符号化映像信号を多重化する多重化手段と
を具え、
上記編集位置は上記ピクチヤの境界でなり、
上記映像符号化手段は、上記編集位置の直前の上記ピクチヤを編集終了可能ピクチヤとしてイントラ符号化又は前方向予測符号化するとともに、上記編集位置の直後の上記ピクチヤを編集開始可能ピクチヤとしてイントラ符号化する
ことを特徴とする請求項1に記載の符号化装置。 - 上記映像符号化手段は、上記編集終了可能ピクチヤ及び上記編集開始可能ピクチヤの位置情報を上記符号化映像信号に記入する
ことを特徴とする請求項4に記載の符号化装置。 - 外部から入力された編集位置指示信号に基づいて、編集可能点指示信号を出力する制御ステツプと、
外部から入力された音声信号を所定長の符号化単位に分割し、当該符号化単位それぞれに符号化重み付けパターンをかけた後符号化して符号化音声信号を生成する音声符号化ステツプと
を具え、
上記音声符号化ステツプは、上記編集可能点指示信号によつて示される編集位置の直前の上記符号化単位を、編集終了可能符号化単位としてその後に続く上記符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化するとともに、上記編集位置の直後の上記符号化単位を、編集開始可能符号化単位としてその前に続く上記音声符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化する
ことを特徴とする符号化方法。 - 外部から入力される、音声信号を所定長の符号化単位に分割した後当該符号化単位それぞれに符号化重み付けパターンをかけて符号化してなる複数本の符号化音声信号を、切り替えて接続することにより編集処理を行い、編集符号化信号として出力する編集装置において、
第1の上記符号化音声信号における、その後に続く上記符号化単位との干渉の 少ない上記符号化重み付けパターンを用いて符号化された上記符号化単位でなる編集終了可能符号化単位の位置と、第2の上記符号化音声信号における、その前に続く上記符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化された上記符号化単位でなる編集開始可能符号化単位の位置とを検出し、当該検出結果に基づいて切替信号を送出する検出手段と、
上記切替信号に基づいて上記第1及び第2の符号化音声信号を切り替え、上記編集終了可能符号化単位までの上記第1の符号化音声信号と、上記編集開始可能符号化単位からの上記第2の符号化音声信号とを接続して上記編集符号化信号を生成する切替手段と
を具えることを特徴とする編集装置。 - 上記符号化音声信号には、上記編集終了可能符号化単位及び上記編集開始可能符号化単位の位置情報が記入されており、
上記検出手段は、上記符号化音声信号から取得した上記編集終了可能符号化単位及び上記編集開始可能符号化単位の上記位置情報に基づいて上記切替信号を生成する
ことを特徴とする請求項7に記載の編集装置。 - 外部から入力される、音声信号を所定長の符号化単位に分割した後当該符号化単位それぞれに符号化重み付けパターンをかけて符号化してなる複数本の符号化音声信号を、切り替えて接続することにより編集処理を行い、編集符号化信号として出力する編集方法において、
第1の上記符号化音声信号における、その後に続く上記符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化された上記符号化単位でなる編集終了可能符号化単位の位置と、第2の上記符号化音声信号における、その前に続く上記符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化された上記符号化単位でなる編集開始可能符号化単位の位置とを検出し、当該検出結果に基づいて切替信号を送出する検出ステツプと、
上記切替信号に基づいて上記第1及び第2の符号化音声信号を切り替え、上記 編集終了可能符号化単位までの上記第1の符号化音声信号と、上記編集開始可能符号化単位からの上記第2の符号化音声信号とを接続して上記編集符号化信号を生成する切替ステツプと
を具えることを特徴とする編集方法。 - 外部から入力された編集位置指示信号に基づいて、編集可能点指示信号を出力する制御手段と、
外部から入力された音声信号を所定長の符号化単位に分割し、当該符号化単位それぞれに符号化重み付けパターンをかけた後符号化して符号化音声信号を生成する音声符号化手段と、
外部から入力された映像信号をピクチヤ毎に符号化して符号化映像信号を生成する映像符号化手段と、
上記符号化音声信号及び上記符号化映像信号を多重化する多重化手段と
を具え、
上記音声符号化手段は、上記編集可能点指示信号によつて示される編集位置直前の上記符号化単位を、編集終了可能符号化単位としてその後に続く上記符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化するとともに、上記編集位置直後の上記符号化単位を、編集開始可能符号化単位としてその前に続く上記符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化する
ことを特徴とする符号化多重化装置。 - 外部から入力された編集位置指示信号に基づいて、編集可能点指示信号を出力する制御ステツプと、
外部から入力された音声信号を所定長の符号化単位に分割し、当該符号化単位それぞれに符号化重み付けパターンをかけた後符号化して符号化音声信号を生成する音声符号化ステツプと、
外部から入力された映像信号をピクチヤ毎に符号化して符号化映像信号を生成する映像符号化ステツプと、
上記符号化音声信号及び上記符号化映像信号を多重化する多重化ステツプと
を具え、
上記音声符号化ステツプは、上記編集可能点指示信号によつて示される編集位置直前の上記符号化単位を、編集終了可能符号化単位としてその後に続く上記符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化するとともに、上記編集位置直後の上記符号化単位を、編集開始可能符号化単位としてその前に続く上記符号化単位との干渉の少ない上記符号化重み付けパターンを用いて符号化する
ことを特徴とする符号化多重化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05712598A JP3539615B2 (ja) | 1998-03-09 | 1998-03-09 | 符号化装置、編集装置及び符号化多重化装置並びにそれらの方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP05712598A JP3539615B2 (ja) | 1998-03-09 | 1998-03-09 | 符号化装置、編集装置及び符号化多重化装置並びにそれらの方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11259096A JPH11259096A (ja) | 1999-09-24 |
JP3539615B2 true JP3539615B2 (ja) | 2004-07-07 |
Family
ID=13046852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP05712598A Expired - Fee Related JP3539615B2 (ja) | 1998-03-09 | 1998-03-09 | 符号化装置、編集装置及び符号化多重化装置並びにそれらの方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3539615B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000276196A (ja) * | 1999-03-29 | 2000-10-06 | Victor Co Of Japan Ltd | オーディオ符号化ストリーム復号化方法 |
US6438518B1 (en) * | 1999-10-28 | 2002-08-20 | Qualcomm Incorporated | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions |
JP3806770B2 (ja) * | 2000-03-17 | 2006-08-09 | 松下電器産業株式会社 | 窓処理装置および窓処理方法 |
JP4411499B2 (ja) * | 2000-06-14 | 2010-02-10 | ソニー株式会社 | 情報処理装置および情報処理方法、並びに記録媒体 |
JP4867076B2 (ja) * | 2001-03-28 | 2012-02-01 | 日本電気株式会社 | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 |
JP4359499B2 (ja) * | 2001-06-08 | 2009-11-04 | アイピージー エレクトロニクス 503 リミテッド | オーディオ信号の編集 |
JP4552802B2 (ja) | 2005-08-10 | 2010-09-29 | ソニー株式会社 | 記録装置、記録方法、記録方法のプログラム及び記録方法のプログラムを記録した記録媒体 |
EP2996269A1 (en) | 2014-09-09 | 2016-03-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio splicing concept |
-
1998
- 1998-03-09 JP JP05712598A patent/JP3539615B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11259096A (ja) | 1999-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6339760B1 (en) | Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data | |
JP4150083B2 (ja) | 符号化ストリーム生成装置及び方法、ならびに編集システム及び方法 | |
JP5032314B2 (ja) | オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置 | |
WO1996031981A1 (fr) | Procede et systeme de mise en forme de signaux video comprimes, et decodeur | |
JPH10145798A (ja) | デジタル符号化信号処理方式 | |
JPH11275576A (ja) | 画像伝送方法,画像処理方法,画像処理装置,及びデ―タ記憶媒体 | |
JP2002501702A (ja) | ビデオ及び音声信号処理 | |
JP3539615B2 (ja) | 符号化装置、編集装置及び符号化多重化装置並びにそれらの方法 | |
JP2000165802A (ja) | ストリーム編集装置と編集方法 | |
JP3191583B2 (ja) | 情報復号化装置 | |
JP4096915B2 (ja) | デジタル情報再生装置及び方法 | |
JP2000078531A (ja) | オ―ディオデ―タ編集方法、編集システム | |
WO2003036967A1 (fr) | Appareil et procede de traitement de signaux video, programme et moyen d'enregistrement | |
JP3748234B2 (ja) | Mpegデータ記録方法 | |
KR100900607B1 (ko) | 멀티미디어 데이터 복호장치 | |
JP2002010203A (ja) | マルチメディアデータ編集装置 | |
JP3588153B2 (ja) | データ編集方法及び編集装置 | |
JP3427505B2 (ja) | 画像符号化方法と編集装置 | |
JP3792770B2 (ja) | 記録再生装置 | |
JP3166572B2 (ja) | 動画像音声圧縮装置 | |
JP2002135774A (ja) | 圧縮映像情報の伝送装置 | |
JP2001211420A (ja) | ディスク記録媒体における圧縮符号化ストリームの編集方法および編集装置 | |
JP2937180B2 (ja) | 映像符号化方法およびこの映像符号化方法による符号データが格納された記録媒体 | |
JP2005051633A (ja) | 編集装置、ビットレート制御方法及びビットレート制御プログラム | |
JP4523606B2 (ja) | 動画像記録方法および動画像記録装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040318 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080402 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090402 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100402 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100402 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110402 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |