JP3792250B2 - 多チャンネルのデジタル信号を送信及び/又は記憶する方法 - Google Patents
多チャンネルのデジタル信号を送信及び/又は記憶する方法 Download PDFInfo
- Publication number
- JP3792250B2 JP3792250B2 JP51056794A JP51056794A JP3792250B2 JP 3792250 B2 JP3792250 B2 JP 3792250B2 JP 51056794 A JP51056794 A JP 51056794A JP 51056794 A JP51056794 A JP 51056794A JP 3792250 B2 JP3792250 B2 JP 3792250B2
- Authority
- JP
- Japan
- Prior art keywords
- spectral
- segment
- channels
- data
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/2368—Multiplexing of audio and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
- H04N21/4341—Demultiplexing of audio and video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/06—Systems for the simultaneous transmission of one television signal, i.e. both picture and sound, by more than one carrier
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00992—Circuits for stereophonic or quadraphonic recording or reproducing
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Radar Systems Or Details Thereof (AREA)
- Time-Division Multiplex Systems (AREA)
- Stereo-Broadcasting Methods (AREA)
- Complex Calculations (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Television Systems (AREA)
Description
本発明は、請求の範囲第1項の前提部による多チャンネルのデジタル信号を送信及び/又は記憶する方法に関する。
背景技術
デジタル信号、特にオーディオ信号が、周波数コード化されて送信される方法は、例えば、PCT公報WO88/01811及びWO89/08357から公知である。
1チャンネル及び2チャンネル送信の場合、標準化委員会である国際標準化機構(ISO)の動画エキスパートグループ(MPEG)は、オーディオ信号のコード化及び送信されるビットストリームのための規格ISO 11172-3を設定した。
該符号化法においては、最小の品質ロスで人間の聴覚の性質を利用しながら、送信されるべきデータの量を低減可能にする心理音響モデルが用いられている。
本明細書中でより一層明らかにされない全ての用語の説明については、前記公報及び前記規格が明示的に参照される。
更なるに国際規格の開発においては、中でも、多チャンネル送信におけるデータの低減の作業が目下行われている。科学出版物"MUSICAM-Surround: A Universal Multi-Channel Coding System Compatible with ISO 11172-3", 93rd AES convention, 1992, San Franciscoによると、5チャンネルまでの送信法が提案されている。例えば、2つのステレオチャンネルと1つの中心チャンネル及び2つの側部チャンネル(3/2ステレオ)、あるいは2つのステレオチャンネル及び3つのコメンタリチャンネルが送信可能である。
さらに、空間的知覚に関しては、重要でないステレオ信号の各部がただ1チャンネルだけで送信されると云う点で、更なるデータ整理が達成されている。さらに、モノチャンネルから対応するラウドスピーカに伝達される信号の強度の尺度を表す尺度係数が送信される。この方法により、より低いオーディオ享受を伴う人工物(artefacts)が特に低周波数範囲で生成される。
さらに、符号化のための各チャンネル用のいわゆるチャンネル内マスキング閾値を決定するのではなく、チャンネル内マスキング効果を考慮に入れながら、むしろ全てのチャンネル用の共通の閾値を与えることにより、送信されるデータ量を低減することが提案されている。しかし、共通のマスキング閾値を用いると、ラウドスピーカの近くで、干渉性符号化ノイズが知覚されうると云う結果を招く。
言語信号の周波数スペクトルの部分に対応する幾つかの数値を発生させ、次いでそれらを符号化する言語信号符号化装置は、EP 0 176 243 A2から公知である。符号化された値は、次に、そのエネルギーの等価物に応じてビットコンバータにより変換され、発生されられたビットに変換された値の数は、一定のままであるが、変化するビット割り当てを有する値の選択は、可変である。
発明の開示
本発明の目的は、送信されるべきデータ量をさらに低減し、送信される信号の主観的に感知されうる外乱を招かないことを可能にする、多チャンネルのデジタル信号を送信及び/又は記憶する方法を提供することである。
本発明によれば、異なるチャンネルの信号は、まずスペクトル値に変換される。次に、異なるチャンネルの対応するセグメントのスペクトル値を用いて、どのチャンネルにおいて、類似のスペクトル部分が発生するかが決定される。
異なるチャンネルからのセグメントを結合する場合に、接続コーディングにより生じる干渉は、可聴閾値以下であるか人工物(artefacts)が発生するかが調べられる。もし、人工物(artefacts)が予期されないのならば、結合が許可される。このようにして、K個の入力チャンネルは、スペクトルデータチャンネル(送信スペクトルチャンネル)上にセグメントでイメージングされる。
“スペクトルデータチャンネル”という用語は、符号化されたオーディオ信号を時間領域の信号スペクトルの全領域又は部分に変換して戻すために必要とされる各補助信号を含む全てのスペクトル符号化オーディオデータと解されるべきである。
元の入力チャンネルが異なっていれば異なっているほど、一層異なったスペクトルデータチャンネルが、信号情報を送信するために使用されなければならない。もし、極端な場合、あるセグメントにおける全てのチャンネルが実質上同じであれば、単一のスペクトルデータチャンネルで十分であるかも知れない、特にスペクトルの上側の部分に付いては。スペクトルセグメントの振幅は、各尺度係数により制御することが可能である。
必要なスペクトルデータチャンネルのNTSCの数(送信スペクトルチャンネル数)は、可変であり、入力即ち出力チャンネルより少ないか多くて同数Kであってよい。
復号器内でNTSCスペクトルデータチャンネルからのK個の出力チャンネルの結合を制御することができるためには、情報データ(SEGMENT_DATA)のリストが(低減された)信号データに加えて送信される。このリストは、出力チャンネルのスペクトル値が、スペクトルデータチャンネルの側からどのようにして結合されるかを記述するものである。
本発明の有利な態様及び更なる展開は、従属項に記載されている。
出力チャンネルのセグメントを再構成するのに必要な制御コマンドは、結合されて情報ブロック(SEGMENT_INFO)になる。このブロックには、セグメントの長さ(SEG_LENGTH)、スペクトルデータチャンネルの選択(TSC_SELECT)、そして尺度係数(scf)のためのフィールドが含まれている。特殊なスペクトルデータチャンネル(TSC_NUM)の符号化されたスペクトルデータ(TSC_DATA)は、再構成マトリックスを決定する各尺度係数(sfc)を用いて、復号器中で復号される。
出力信号のセグメントを再構成する情報は、並べられてリスト(SEGMENT_LIST)を構成する。
個別の出力チャンネルのセグメントのリストは、全体リスト(SEGMENT_DATA)を構成する。かくして、左チャンネル(LEFT_CHANNEL)、右チャンネル(RIGHT_CHANNEL)、中心チャンネル(CENTER_CHANNEL)及び更なるチャンネルのリストが全体リストに列挙される。
本発明の有利な態様によれば、各チャンネルは、マルチチャンネル音を形成する。例えば、3/2立体音の5チャンネルが送信される。2つのステレオチャンネルに加えて、中心チャンネル、左サイドチャンネル(LS_CHANNEL)及び右サイドチャンネル(RS_CHANNEL)が送信される。送信されるチャンネルは、逆変換ににより、3/2立体音の5つの対応するラウドスピーカにあわせて、時間領域へ変換される。
従来の2つのステレオチャンネルに加えて、幾つかのさらなるコメンタリチャンネル(commentary channels)が送信される。これらのチャンネルにおいては、例えば、HDTV(高品位テレビ)において、オーディオ信号は異なる言語で送信可能である。視聴者は、その場合のテレビ映像用に所望の言語を選ぶことができる。言語は、該2つのステレオチャンネルにダイナミックに付加される。
スペクトルデータチャンネルの送信は、規格ISO11172−3と互換の方法により行われる。この規格の3つの層の全ては、スペクトルデータチャンネルの送信の基礎を形成することができる。
符号化中、共通の尺度係数により調整されたスペクトル値のグループは、かくして尺度係数帯域に属し、もしこの尺度係数帯域がどの情報ブロック(SEGMENT_INFO)でも必要とされなければ、送信されない。この場合、各スペクトル値は、出力チャンネルを再構成するのに必要とされない。もし、ISO規格の固定された縮尺帯部分が利用されれば有利である。
未使用の尺度係数帯域の信号化は、暗黙に行われており、それによると、この信号化に合わせてさらに送信すべき情報はないと云うことを意味する。
送信されるべきチャンネルの線形の結合も、本発明の方法により形成可能である。これにより、スペクトル値が各個別のチャンネルにおいて互いに強く類似していればデータ量の更なる低減をもたらされる。出力チャンネルの信号は、この場合、再構成されたスペクトル値の線形の結合により形成される。
全てのチャンネルから符号化されたデータを送信するのに必要なビット速度は、384kbit/sを超過することはない。このようにして、ISO規格の層=の最大ビット速度に対する要求が満たされる。
本発明の必須の利点は、送信されるデータ量の明確の低減が、音質における可聴の損失なしに、少数の仮想スペクトルチャンネル上での入力チャンネルのイメージングにより達成される。このようにして、特に高い空間的解像度で、オーディオ信号が送信される。このことは、多くの聴衆が入った大きな室内において特に有利である。
さらに、各個別のユーザにとって、所望の情報を選択できる幾つかのチャンネルが利用可能になる。例えば、テレビの番組用に、同時に数カ国語でオーディオチャンネルを送信でき、視聴者は、所望のものを選択することができる。
上記方法を実現する技術的により複雑な方法ステップは、送信されるビットストリームを提供する符号器において行われる。復号器は、到着するビットストリームの情報を単に順次処理するのみであり、符号器よりもかなり単純な構成になっている。したがって、本発明は、数個の符号器においてはより高度の複雑さを必要とするが、ユーザ用により多数必要とされる復号器は、複雑さが増大することはまずない。
発明を実施する最良の形態
本発明は、下記において、好適な態様を用いて一層明らかにされる。
好適な態様は、国際標準化機構の動画エキスパートグループ(MPEG)の規格ISO 11172-3に基づいている。この規格を、以後MPEG−1と呼ぶ。その概念は、全体の発明性を有する観念を限定する意図なく、規格の層=に限定するものである。規格MPEG−1/層=におけるように、プログラム言語Cと類似の数学的演算がが用いられる。
フィルタバンクの助けにより、時間領域からの5個の入力チャンネルの信号が、周波数領域においてサブ帯域(Sb)でイメージングされ、入力信号は、より少なくサンプル化されたスペクトル値に分解される。
心理音響学において公知の規則性を利用して、可聴閾値以上にある人工物(artefacts)を生じることなく、異なるチャンネルのどのセグメントを結合することができるかに付いて演算がなされる。
入力チャンネルの周波数値は、個別に又はリニアな結合として量子化され、符号化される。これは、量子化から来るエラーが可聴閾値以下にあるという条件で発生する。
次に、送信されるビットストリームを結合させる。それには、スペクトルデータチャンネルの量子化され、符号化された周波数値ならびに補助情報が含まれている。これらは、尺度係数、ビット割り当て、テーブルの情報、及び現在のブロックで用いられている他のパラメータからなり、リストは、スペクトルデータチャンネルの復号化された周波数値がどのようにして他の出力チャンネルを再構成するために結合されるかを示している。
これらのリストは、補助情報として、MPEG1により、ビットストリームに添付される。
この延長(MPEG2_extension_data)は、下記のように表示される。
信号化バイト(signalling_byte)という用語は、幾つのそしてどの入力即ち出力チャンネルが用いられるかを示す。それは、モノチャンネル、ステレオチャンネル、中心チャンネル、又は補助チャンネル、などが送信されるかどうかを示す。
NTSCは、必要とされるスペクトルデータチャンネルの数を示す。
SEGMENT_DATAは、出力チャンネルの再構成用のリストを記述し、個別のチャンネル(SEGMENT_LIST)の再構成用のリストを含む。
機能used_sb_mapは、共通の尺度係数により調整されたスペクトルデータチャンネルのスペクトル値を含む尺度係数帯域が使用されているかどうかを示す。もし、その様な尺度係数帯域がどの情報ブロック(SEGMENT_INFO)によっても使用されていなければ、対応するスペクトル値は送信されない。
特殊なチャンネル(SEGMENT_LIST)の再構成用のリストには、セグメント長さ(SEG_LENGTH)、尺度係数のサイズ(scalefac_size)、尺度係数(scf)及びスペクトルデータチャンネルの選択(TSC_SELECT)についての情報が含まれている。
好ましい態様においては、値14及び15は、再構成されたスペクトル値の線形の結合を形成するのにとっておかれる。その様な場合は、SEG_LENGTH==15が付加され、SEG_LENGTH==14が減算される。
スペクトルデータチャンネルからのデータ用のビットストリームは、MPEG-1/層=の場合の主要データのビットストリームに対応している:
Claims (11)
- K個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び/または記憶する方法であって、
各デジタルオーディオ信号のサンプリングをブロックごとに時間領域から周波数領域に変換してそれぞれスペクトル値を得る変換ステップと、
前記スペクトル値を符号化する符号化ステップと、
符号化されたスペクトル値を組み立てることで、K個の別の出力データとして復号化自在、かつ時間領域に再変換可能な伝送及び/または記憶用のビットストリームを形成する組立てステップとからなり、
前記符号化ステップは、スペクトルセグメントの数の各スペクトルセグメントに応じた可変数の仮想のスペクトルデータチャンネル(TSC)を形成するステップを含み、
仮想のスペクトルデータチャンネルの数は、K個の別々の入力チャンネルにおけるスペクトルセグメントごとのブロックにおけるスペクトル情報を使用することで多くてK個に等しい仮想のチャンネル数に決定されるとともに、
接続コーディングによる干渉が可聴閾値以下であるか、若しくは人工物が発生しないスペクトル部分で類似する異なる入力チャンネルのスペクトル的に対応するセグメントのスペクトル値を活用することで決定され、
各セグメントのために形成された仮想のスペクトルデータチャンネル(TSC)の数が、より大きく、K個の入力チャンネルのオーディオ信号と異なるように、同様のスペクトル値をまとめられ、そして単一の仮想のスペクトルデータチャンネル(TSC)にまとめられたスペクトル値がおかれ、
前記組立てステップでは、それぞれのセグメントに対する仮想のスペクトルデータチャンネルの数(NTSC)と、仮想のスペクトルデータチャンネルの構造における情報(SEGMENT_DATA)が前記ビットストリームに含まれて組み立てられ、
構造における前記情報(SEGMENT_DATA)には、各出力チャンネルに対してはそれぞれの出力チャンネルを再構成するためのセグメントリスト(SEGMENT_LIST)と、出力チャンネルのそれぞれのセグメントを再構成するための情報ブロック(SEGMENT_INFO)を含み、
前記情報ブロックには、セグメント長さ(SEG_LENGTH)のためのフィールド、
希望のスペクトルデータチャンネル(TSC_SELECT)の選択フィールド、
およびデコーダにおいてスペクトルデータチャンネル(TSC_DATA)のコード化されたスペクトル値の再構成振幅を決定する1セットのスケールファクター(scf)のフィールドを含み、
その結果、デコーダにおいて、ビットストリームの変換の後K個の出力チャンネルが、スペクトルデータチャンネル(TSC)から前記スペクトルデータチャンネルの構造における前記情報(SEGMENT_DATA)に基づいて組み立てられること、
を特徴とするK個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び/または記憶する方法。 - 入力と出力チャンネルがそれぞれマルチチャンネル音を形成すること、
を特徴とする請求項1に記載のK個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び/または記憶する方法。 - 入力と出力チャンネルがそれぞれステレオペアおよび更なるコメントチャンネルを形成すること、
を特徴とする請求項1に記載のK個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び/または記憶する方法。 - 仮想のスペクトルデータチャンネル(TSC)がコード化され、そして国際標準化、動画と関連オーディオのコード化、組織の規格ISO11172−3に適合する方法で変換されること、
を特徴とする請求項1乃至3のいずれかに記載のK個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び/または記憶する方法。 - スペクトル値をコーディングするとき、共通の尺度係数により調整されたスペクトル値のグループが結合されるとともに、そしてそこではいかなる情報ブロック(SEGMENT_INFO)においても使われない尺度係数帯域に属するスペクトル値は送信されないで、コーディングが行われること、
を特徴とする請求項1乃至4のいずれかに記載のK個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び/または記憶する方法。 - 不使用の尺度係数帯域の信号化が暗黙に行われていること、
を特徴とする請求項5に記載のK個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び/または記憶する方法。 - 入力チャンネルのコーディングと仮想のスペクトルデータチャンネル(TSC)の入力チャンネルのマッピングが、出力チャンネルを再構成するために異なったスペクトルデータチャンネルから再構成されたスペクトル値の線形の結合が形成されるように発生すること、
を特徴とする請求項1乃至6のいずれかに記載のK個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び/または記憶する方法。 - 全てのチャンネルのコード化されたデータを変換するためのビットレートが384キロビット/秒を超えないこと、
を特徴とする請求項1乃至7のいずれかに記載のK個の別な入力チャンネルを有するデジタルオーディオ信号を伝送及び/または記憶する方法。 - K個の別々の入力チャンネルを有するデジタルオーディオ信号を伝送及び/または記憶するエンコーダであって、
各デジタルオーディオ信号のサンプリングをブロックごとに時間領域から周波数領域に変換してそれぞれスペクトル値を得る変換手段と、
前記スペクトル値を符号化する符号化手段と、
符号化されたスペクトル値を組み立てることで、K個の別の出力データとして復号化自在、かつ時間領域に再変換可能な伝送および/または記憶用のビットストリームを形成する組立て手段と、
を備え、
スペクトルセグメントの数の各スペクトルセグメントに応じた可変数の仮想のスペクトルデータチャンネル(TSC)を形成するための符号化が作用する手段を含み、
仮想のスペクトルデータチャンネルの数は、K個の別々の入力チャンネルにおけるスペクトルセグメントごとのブロックにおけるスペクトル情報で使用することで多くてK個に等しいチャンネル数に決定されるとともに、
接続コーディングによる干渉が可聴閾値以下であるか、若しくは人工物が発生しないスペクトル部分で類似する異なる入力チャンネルのスペクトル的に対応するセグメントのスペクトル値を活用することで決定され、
各セグメントのために形成された仮想のスペクトルデータチャンネル(TSC)の数が、より大きく、K個の入力チャンネルのオーディオ信号と異なるように、同様のスペクトル値をまとめられ、そして単一の仮想のスペクトルデータチャンネル(TSC)にまとめられたスペクトル値がおかれ、
前記組立て手段では、それぞれのセグメントに対する仮想のスペクトルデータチャンネル数(NTSC)と、仮想のスペクトルデータチャンネルの構造における情報(SEGMENT_DATA)が前記ビットストリームに含まれて組み立てられ、
構造における前記情報(SEGMENT_DATA)には、各出力チャンネルに対してはそれぞれの出力チャンネルを再構成するためのセグメントリスト(SEGMENT_LIST)と、出力チャンネルのそれぞれのセグメントを再構成するための情報ブロック(SEGMENT_INFO)を含み、
前記情報ブロックには、セグメント長さ(SEG_LENGTH)のためのフィールド、
希望のスペクトルデータチャンネル(TSC_SELECT)の選択フィールド、
およびデコーダにおいてスペクトルデータチャンネル(TSC_DATA)のコード化されたスペクトル値の再構成振幅を決定する1セットのスケールファクター(scf)のフィールドを含み、
その結果、デコーダにおいて、ビットストリームの変換の後K個の出力チャンネルが、スペクトルデータチャンネル(TSC)から前記スペクトルデータチャンネルの構造における前記情報(SEGMENT_DATA)に基づいて組み立てられること、
を特徴とするエンコーダ。 - ビットストリームを復号化する方法であって、
下記の方法で符号化されたビットストリームの変換後、K個の出力チャンネルを、変換された仮想のスペクトルデータチャンネル(TSC)からスペクトルデータチャンネルの構成の情報(SEGMENT_DATA)を使ってセグメント毎に組み立てて、再構成する符号化の方法。
各デジタルオーディオ信号のサンプリングをブロックごとに時間領域から周波数領域に変換してそれぞれスペクトル値を得る変換ステップと、
前記スペクトル値を符号化する符号化ステップと、
符号化されたスペクトル値を組み立てることで、ビットストリームを形成する組立てステップとからなり、
前記符号化ステップは、スペクトルセグメントの数の各スペクトルセグメントに応じた可変数の仮想のスペクトルデータチャンネル(TSC)を形成するステップを含み、
仮想のスペクトルデータチャンネルの数は、K個の別々の入力チャンネルにおけるスペクトルセグメントごとのブロックにおけるスペクトル情報を使用することで多くてK個に等しい仮想のチャンネル数に決定されるとともに、
接続コーディングによる干渉が可聴閾値以下であるか、若しくは人工物が発生しないスペクトル部分で類似する異なる入力チャンネルのスペクトル的に対応するセグメントのスペクトル値を活用することで決定され、
各セグメントのために形成された仮想のスペクトルデータチャンネル(TSC)の数が、より大きく、K個の入力チャンネルのオーディオ信号と異なるように、同様のスペクトル値をまとめられ、そして単一の仮想のスペクトルデータチャンネル(TSC)にまとめられたスペクトル値がおかれ、
前記組立てステップでは、それぞれのセグメントに対する仮想のスペクトルデータチャンネル数(NTSC)と、仮想のスペクトルデータチャンネルの構造における情報(SEGMENT_DATA)が前記ビットストリームに含まれて組み立てられ、
構造における前記情報(SEGMENT_DATA)には、各出力チャンネルに対してはそれぞれの出力チャンネルを再構成するためのセグメントリスト(SEGMENT_LIST)と、出力チャンネルのそれぞれのセグメントを再構成するための情報ブロック(SEGMENT_INFO)を含み、
前記情報ブロックには、セグメント長さ(SEG_LENGTH)のためのフィールド、希望のスペクトルデータチャンネル(TSC_SELECT)の選択フィールド、およびデコーダにおいてスペクトルデータチャンネル(TSC_DATA)のコード化されたスペクトル値の再構成振幅を決定する1セットのスケールファクター(scf)のフィールドを含む。 - ビットストリームを復号化するデコーダであり、
下記の方法で符号化されたビットストリームの変換後、K個の出力チャンネルを、変換されたスペクトルデータチャンネル(TSC)からスペクトルデータチャンネルの構成の情報(SEGMENT_DATA)を使ってセグメント毎に組み立てて、再構成するデコーダ。
各デジタルオーディオ信号のサンプリングをブロックごとに時間領域から周波数領域に変換してそれぞれスペクトル値を得る変換ステップと、
前記スペクトル値を符号化する符号化ステップと、
符号化されたスペクトル値を組み立てることで、ビットストリームを形成する組立てステップとからなり、
前記符号化ステップは、スペクトルセグメントの数の各スペクトルセグメントに応じた可変数の仮想のスペクトルデータチャンネル(TSC)を形成するステップを含み、
仮想のスペクトルデータチャンネルの数は、K個の別々の入力チャンネルにおけるスペクトルセグメントごとのブロックにおけるスペクトル情報を使用することで多くてK個に等しい仮想のチャンネル数に決定されるとともに、
接続コーディングによる干渉が可聴閾値以下であるか、若しくは人工物が発生しないスペクトル部分で類似する異なる入力チャンネルのスペクトル的に対応するセグメントのスペクトル値を活用することで決定され、
各セグメントのために形成された仮想のスペクトルデータチャンネルの数(TSC)が、より大きく、K個の入力チャンネルのオーディオ信号と異なるように、同様のスペクトル値をまとめられ、そして単一の仮想のスペクトルデータチャンネル(TSC)にまとめられたスペクトル値がおかれ、
前記組立てステップでは、それぞれのセグメントに対する仮想のスペクトルデータチャンネルの数(NTSC)と、仮想のスペクトルデータチャンネルの構造における情報(SEGMENT_DATA)が前記ビットストリームに含まれて組み立てられ、
構造における前記情報には、各出力チャンネルに対してはそれぞれの出力チャンネルを再構成するためのセグメントリスト(SEGMENT_LIST)と、出力チャンネルのそれぞれのセグメントを再構成するための情報ブロック(SEGMENT_INFO)を含み、
前記情報ブロックには、セグメント長さ(SEG_LENGTH)のためのフィールド、希望のスペクトルデータチャンネル(TSC_SELECT)の選択フィールド、およびデコーダにおいてスペクトルデータチャンネル(TSC_DATA)のコード化されたスペクトル値の再構成振幅を決定する1セットのスケールファクター(scf)のフィールドを含む。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE4236989A DE4236989C2 (de) | 1992-11-02 | 1992-11-02 | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
DE4236989.4 | 1992-11-02 | ||
PCT/DE1993/001047 WO1994010758A1 (de) | 1992-11-02 | 1993-11-02 | Verfahren zur übertragung und/oder speicherung digitaler signale mehrerer kanäle |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08505739A JPH08505739A (ja) | 1996-06-18 |
JP3792250B2 true JP3792250B2 (ja) | 2006-07-05 |
Family
ID=6471927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP51056794A Expired - Lifetime JP3792250B2 (ja) | 1992-11-02 | 1993-11-02 | 多チャンネルのデジタル信号を送信及び/又は記憶する方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US5706309A (ja) |
EP (1) | EP0667063B2 (ja) |
JP (1) | JP3792250B2 (ja) |
KR (1) | KR100311604B1 (ja) |
AT (1) | ATE143544T1 (ja) |
AU (1) | AU678407B2 (ja) |
CA (1) | CA2148447C (ja) |
DE (2) | DE4236989C2 (ja) |
NO (1) | NO309629B1 (ja) |
RU (1) | RU2129336C1 (ja) |
WO (1) | WO1994010758A1 (ja) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3986084B2 (ja) | 1995-12-07 | 2007-10-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ディジタル・バーサタイル・ディスク装置および多チャネル再生装置間で非pcmビットストリームを符号化し、伝送し、復号化する方法および装置 |
DE19613643A1 (de) * | 1996-04-04 | 1997-10-09 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines mit einer niedrigen Abtastrate digitalisierten Audiosignals |
DE19628292B4 (de) * | 1996-07-12 | 2007-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten |
DE19638546A1 (de) * | 1996-09-20 | 1998-03-26 | Thomson Brandt Gmbh | Verfahren und Schaltungsanordnung zur Kodierung oder Dekodierung von Audiosignalen |
DE19957466A1 (de) * | 1999-11-24 | 2001-05-31 | Deutsche Telekom Ag | Verfahren zur Verteilung von Kino-Programmen |
US6654827B2 (en) | 2000-12-29 | 2003-11-25 | Hewlett-Packard Development Company, L.P. | Portable computer system with an operating system-independent digital data player |
US7289567B2 (en) * | 2001-04-30 | 2007-10-30 | Motorola, Inc. | Apparatus and method for transmitting and receiving data using partial chase combining |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
WO2006008697A1 (en) * | 2004-07-14 | 2006-01-26 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
DE102004042819A1 (de) * | 2004-09-03 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals |
DE102004043521A1 (de) * | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
SE0402649D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods of creating orthogonal signals |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
KR101215868B1 (ko) * | 2004-11-30 | 2012-12-31 | 에이저 시스템즈 엘엘시 | 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치 |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
JP5017121B2 (ja) * | 2004-11-30 | 2012-09-05 | アギア システムズ インコーポレーテッド | 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化 |
DE102005010057A1 (de) * | 2005-03-04 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
WO2006126843A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US8626503B2 (en) * | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
KR100857106B1 (ko) | 2005-09-14 | 2008-09-08 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
US7760886B2 (en) * | 2005-12-20 | 2010-07-20 | Fraunhofer-Gesellschaft zur Foerderung der Angewandten Forscheng e.V. | Apparatus and method for synthesizing three output channels using two input channels |
JP5147727B2 (ja) | 2006-01-19 | 2013-02-20 | エルジー エレクトロニクス インコーポレイティド | 信号デコーディング方法及び装置 |
TWI469133B (zh) | 2006-01-19 | 2015-01-11 | Lg Electronics Inc | 媒體訊號處理方法及裝置 |
KR20080110920A (ko) | 2006-02-07 | 2008-12-19 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
TWI447707B (zh) | 2006-02-23 | 2014-08-01 | Lg Electronics Inc | 音頻訊號之處理方法及其裝置 |
CN101406073B (zh) | 2006-03-28 | 2013-01-09 | 弗劳恩霍夫应用研究促进协会 | 用于多声道音频重构中的信号成形的增强的方法 |
CN101484936B (zh) | 2006-03-29 | 2012-02-15 | 皇家飞利浦电子股份有限公司 | 音频解码 |
US7965848B2 (en) | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
EP1999745B1 (en) | 2006-03-30 | 2016-08-31 | LG Electronics Inc. | Apparatuses and methods for processing an audio signal |
ATE527833T1 (de) | 2006-05-04 | 2011-10-15 | Lg Electronics Inc | Verbesserung von stereo-audiosignalen mittels neuabmischung |
US20080235006A1 (en) | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
CN1937609B (zh) * | 2006-08-29 | 2010-10-06 | 华为技术有限公司 | 流媒体平台支持多音轨内容的方法、系统及流媒体服务器 |
JP5232791B2 (ja) | 2006-10-12 | 2013-07-10 | エルジー エレクトロニクス インコーポレイティド | ミックス信号処理装置及びその方法 |
US8908873B2 (en) | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US9015051B2 (en) | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
US8290167B2 (en) | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
CA2710560C (en) * | 2008-01-01 | 2015-10-27 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
CN101911733A (zh) * | 2008-01-01 | 2010-12-08 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
CN112151046B (zh) * | 2020-09-25 | 2024-06-18 | 北京百瑞互联技术股份有限公司 | Lc3编码器自适应调节多声道传输码率的方法、装置及介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4170719A (en) * | 1978-06-14 | 1979-10-09 | Bell Telephone Laboratories, Incorporated | Speech transmission system |
GB8421498D0 (en) * | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
DE3629434C2 (de) * | 1986-08-29 | 1994-07-28 | Karlheinz Dipl Ing Brandenburg | Digitales Codierverfahren |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
DE3805946A1 (de) * | 1988-02-25 | 1989-09-07 | Fraunhofer Ges Forschung | Vorrichtung zur ermittlung von charakteristischen parametern aus den eingangs- und ausgangssignalen eines systems fuer die audiosignalverarbeitung |
CA2332407C (en) * | 1989-01-27 | 2002-03-05 | Dolby Laboratories Licensing Corporation | Method for defining coding information |
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
US5274740A (en) * | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
US5371544A (en) * | 1992-02-07 | 1994-12-06 | At&T Corp. | Geometric vector quantization |
-
1992
- 1992-11-02 DE DE4236989A patent/DE4236989C2/de not_active Revoked
-
1993
- 1993-11-02 US US08/428,235 patent/US5706309A/en not_active Expired - Lifetime
- 1993-11-02 AT AT93923455T patent/ATE143544T1/de active
- 1993-11-02 RU RU95112670A patent/RU2129336C1/ru active
- 1993-11-02 JP JP51056794A patent/JP3792250B2/ja not_active Expired - Lifetime
- 1993-11-02 WO PCT/DE1993/001047 patent/WO1994010758A1/de active IP Right Grant
- 1993-11-02 DE DE59304003T patent/DE59304003D1/de not_active Expired - Lifetime
- 1993-11-02 EP EP93923455A patent/EP0667063B2/de not_active Expired - Lifetime
- 1993-11-02 KR KR1019950701732A patent/KR100311604B1/ko not_active IP Right Cessation
- 1993-11-02 AU AU53332/94A patent/AU678407B2/en not_active Expired
- 1993-11-02 CA CA002148447A patent/CA2148447C/en not_active Expired - Lifetime
-
1995
- 1995-04-24 NO NO951549A patent/NO309629B1/no not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US5706309A (en) | 1998-01-06 |
JPH08505739A (ja) | 1996-06-18 |
NO309629B1 (no) | 2001-02-26 |
AU678407B2 (en) | 1997-05-29 |
RU2129336C1 (ru) | 1999-04-20 |
EP0667063B1 (de) | 1996-09-25 |
WO1994010758A1 (de) | 1994-05-11 |
EP0667063A1 (de) | 1995-08-16 |
DE4236989A1 (de) | 1994-05-05 |
EP0667063B2 (de) | 2005-04-13 |
CA2148447A1 (en) | 1994-05-11 |
KR950704862A (ko) | 1995-11-20 |
DE59304003D1 (de) | 1996-10-31 |
NO951549L (no) | 1995-04-24 |
KR100311604B1 (ko) | 2001-12-17 |
NO951549D0 (no) | 1995-04-24 |
ATE143544T1 (de) | 1996-10-15 |
AU5333294A (en) | 1994-05-24 |
CA2148447C (en) | 2004-07-06 |
DE4236989C2 (de) | 1994-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3792250B2 (ja) | 多チャンネルのデジタル信号を送信及び/又は記憶する方法 | |
US5682461A (en) | Method of transmitting or storing digitalized, multi-channel audio signals | |
KR100299528B1 (ko) | 인텐서티-스테레오 프로세스와 예측 프로세스를 이용한 오디오신호의 부호화/복호화 장치 및 그 방법 | |
KR100717598B1 (ko) | 파라미트릭 멀티채널 코딩 시스템에서의 주파수 기반오디오 채널 코딩 | |
RU2197776C2 (ru) | Способ и устройство масштабируемого кодирования-декодирования стереофонического звукового сигнала (варианты) | |
Noll | MPEG digital audio coding | |
RU2185024C2 (ru) | Способ и устройство масштабированного кодирования и декодирования звука | |
JP3190046B2 (ja) | 可聴周波信号を符号化する方法および装置 | |
RU2392671C2 (ru) | Способы и устройства для кодирования и декодирования стереосигнала | |
JP3352406B2 (ja) | オーディオ信号の符号化及び復号方法及び装置 | |
CA2327281C (en) | Low bit-rate spatial coding method and system | |
US5638451A (en) | Transmission and storage of multi-channel audio-signals when using bit rate-reducing coding methods | |
Herre et al. | MPEG-4 high-efficiency AAC coding [standards in a nutshell] | |
JPH10105193A (ja) | 音声符号化伝送方式 | |
JPH0865169A (ja) | 符号化方法及び装置、復号化装置、並びに記録媒体 | |
JPH08501666A (ja) | 数個の相互依存チャンネルのデジタル信号の送信及び/又は記憶時のデータ整理方法 | |
KR100636145B1 (ko) | 확장된 고해상도 오디오 신호 부호화 및 복호화 장치 | |
Ten Kate et al. | Matrixing of bit rate reduced audio signals | |
KR960012477B1 (ko) | 인지 정보량을 이용한 적응적 스테레오 디지탈 오디오 부호화 및 복호화장치 | |
KR960003454B1 (ko) | 적응적 스테레오 디지탈 오디오 부호화장치 | |
KR20230035373A (ko) | 오디오 인코딩 방법, 오디오 디코딩 방법, 관련 장치, 및 컴퓨터 판독가능 저장 매체 | |
KR100224582B1 (ko) | Mpeg-2 오디오의 에러 검출 장치 및 방법 | |
Teh et al. | An improved stereophonic coding scheme compatible to the ISO/MPEG audio coding algorithm | |
JPH10336038A (ja) | オーディオ信号の符号化方法 | |
JPH07170193A (ja) | マルチチャネル・オーディオ符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20040226 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20040412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040609 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20041005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050316 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050331 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060405 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100414 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110414 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120414 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120414 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130414 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130414 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140414 Year of fee payment: 8 |
|
EXPY | Cancellation because of completion of term |