TWI312983B - Audio coding apparatus and audio decoding apparatus - Google Patents
Audio coding apparatus and audio decoding apparatus Download PDFInfo
- Publication number
- TWI312983B TWI312983B TW095109091A TW95109091A TWI312983B TW I312983 B TWI312983 B TW I312983B TW 095109091 A TW095109091 A TW 095109091A TW 95109091 A TW95109091 A TW 95109091A TW I312983 B TWI312983 B TW I312983B
- Authority
- TW
- Taiwan
- Prior art keywords
- frequency
- frequency conversion
- shift
- encoding
- sound
- Prior art date
Links
- 238000006243 chemical reaction Methods 0.000 claims description 114
- 239000013598 vector Substances 0.000 claims description 39
- 230000005236 sound signal Effects 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 23
- 238000013139 quantization Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000003908 quality control method Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- DNTFEAHNXKUSKQ-RFZPGFLSSA-N (1r,2r)-2-aminocyclopentane-1-sulfonic acid Chemical compound N[C@@H]1CCC[C@H]1S(O)(=O)=O DNTFEAHNXKUSKQ-RFZPGFLSSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47L—DOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
- A47L9/00—Details or accessories of suction cleaners, e.g. mechanical means for controlling the suction or for effecting pulsating action; Storing devices specially adapted to suction cleaners or parts thereof; Carrying-vehicles specially adapted for suction cleaners
- A47L9/02—Nozzles
- A47L9/06—Nozzles with fixed, e.g. adjustably fixed brushes or the like
- A47L9/068—Nozzles combined with a different cleaning side, e.g. duplex nozzles or dual purpose nozzles
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mechanical Engineering (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
1312983 九、發明說明:
•V 【發明所屬之技術領域】 . 本發明係關於對聲音信號執行編碼之裝置及對已編碼 化之聲音信號執行解碼之裝置。 【先前技術】 近年來,隨著藉網際網路進行之音樂傳播、記錄聲音 之各種記錄媒體之數位化的進展,壓縮聲音信號之資料量 之聲音編碼技術遂成爲不可或缺者。這樣子的聲音編碼技 # 術,有如日本專利公開公報特開平7-46 1 3 7號上所揭示者 ,其係揭示基於人類之聽覺特性之聲音編碼技術。此先進 技術係將聲音信號分割成多數之次頻帶(sub band)(頻帶) ,對每個次頻帶,決定基於最大値(標度値(scale値))和聽 覺心裡上之臨界頻帶之容許噪音位準(noise level )N,決定 各個次頻帶上必要之S/N比,然後,從S/N比算出量子化 之位元數,從而進行編碼。 不過,這樣的聲音編碼技術,必須要很多之計算步驟 ^ ,才能算出量子化位元數,因此,運算量龐大,進而有無 法以高速進行處理之問題。 本發明的課題係爲提昇基於人類的聽覺特性之聲音處 理的處理效率。 【發明內容】 本發明有關之聲音編碼裝置的特徵,係具備:對_人 之聲音信號,施予頻率轉換之頻率轉換手段;將前述頻率 轉換手段得出之頻率轉換係數之頻帶,愈低頻愈窄,愈高 1312983 . 頻愈寬的方式加以分割之頻帶分割手段;對前述頻帶分割 手段分割出之每個頻帶,從藉前述頻率轉換手段得出之頻 率轉換係數中’找尋絕對値爲最大之値的找尋手段;算出 使藉前述找尋手段在每個分割頻帶上得出之頻率轉換係數 之最大値低於在各個分割頻帶上事先設定之量子化位元數 那樣之移位位元數之移位數算出手段;對藉前述頻率轉換 手段得出之頻率轉換係數之値,施予藉前述移位數算出手 段所算出之移位位元數部份之移位處理之移位處理手段; ® 及對被前述移位處理手段施予移位處理之頻率轉換係數進 行編碼之編碼手段。 又’本發明的聲音解碼裝置之特徵,係具備:將含有 被編碼的各分割頻帶的移位位元數和被編碼的頻率轉換係 數之編碼信號加以解碼之解碼手段,前述分割頻帶係爲將 輸入之聲音信號’藉頻率轉換得出之頻率轉換係數的頻帶 ’依頻率愈低頻帶愈窄,頻率愈高頻帶愈寬那樣分割者; 對以解碼手段加以解碼之頻率轉換係數資料,進行僅移位 ® 與編碼時的相反方向,被解碼後之移位位元數部份之移位 處理手段;及對在移位處理手段上被施予移位處理之資料 ,進行頻率逆轉換而將其轉換成時間軸,從而輸出播放信 號之頻率逆轉換手段。 【實施方式】 (實施發明用之最佳形態) (第1實施形態) 第1圖係表示第1實施形態有關的聲音編碼裝置1 〇〇 -6 - 1312983 V 之組成。聲音編碼裝置1 ο 0係由頻率轉換部1、頻帶分割 部2、最大値找尋部3、移位數算出部4、移位處理部5及 編碼部6所組成。 頻率轉換部1係對輸入之聲音信號執行頻率轉換$ ’ 輸出到頻帶分割部2。聲音信號之頻率轉換,係採用 MDCT(Modified Discrete Cosine Transform:變形離 4 餘 轉換)方式。設輸入之聲音信號爲{Xn|n = 〇,…,Μ-1)時 MDCT係數(頻率轉換係數)丨Xk= | k = 〇,…,Μ/2-1}係如下述 Φ 式(1)那樣被定義。 (數1) a香” 。借〔早)«4| ⑴ 這裡’ hn係爲窗函數,係如下式(2)那樣被定義。 (數2)
(2)
頻帶分割部2係將自頻率轉換部〗輸入之頻率轉換係數之 頻帶’配合人類的聽覺特性而加以分割。具體言之,如第 2圖、第3圖所示,將頻率轉換係數依頻率愈低(低頻帶) 愈窄、愈高(高頻帶)愈寬那樣進行分割。例如,聲音信號 之採樣頻率者係爲16kHZ之情形,則分割的程度(sIash)係 爲 187.5Hz' 4 3 7.5 Hz、6 8 7.5 Hz、9 3 7.5 Hz ' 13 12.5Hz 1687.5Hz、2312.5Hz、325 0Hz、4625Hz' 6500Hz 等 U 個 頻帶。 -7- 1312983 , 最大値找尋部3係對被頻帶分割部2分割之每個頻帶 ,從被含於頻帶中之頻率轉換係數的絕對値中,找出最大 値。 移位數算出部4係算出使在最大値找尋部3上得出之 分割頻帶內之頻率轉換係數之最大値低於在各分割頻帶上 事先設定之量子化位元數以下那樣之移位位元數(以下,稱 爲移位位元數)。在各分割頻帶上事先設定之量子化位元數 最好是根據人類的聽覺特性,頻率愈低愈多、頻率愈高愈 • 少,如第4圖所示,從低頻帶到高頻帶係分配8〜5位元之 程度。例如,某頻帶上之最大値係爲"1〇1〇 ΙΟΠ (2進位)" ,且該頻帶上事先設定之量子化位元數係爲6位元之情形 ,則移位位元數係爲2位元》 移位處理部5係對每個分割頻帶,將該頻帶中全部頻 率轉換係數之値,僅移位藉移位數算出部4算出之移位位 元數。另外,解碼時,因需要將頻率轉換係數回復到原來 之位元數,故須將表示每個分割頻帶之移位位元數之資料 # ,做爲編碼信號之一部分而輸出。 編碼部6係將在移位處理部5上被處理之資料,以既 定之編碼方式執行編碼,進而輸出編碼資料。這裡,編碼 方式能採用赫夫曼(Huffman)編碼、向量(vector)量子化等 ,各種編碼方式。 第2圖係表示第1實施形態有關之聲音解碼裝置1 0 1 之組成。聲音解碼裝置〗〇〗係爲對被聲音編碼裝置1 〇〇編 碼之信號執行解碼之裝置,如第2圖所示,係由解碼部7 1312983 、 、移位處理部8 '頻率逆轉換部9所組成。 解碼部7係對含有被編碼之每個分割頻帶之移位位元 數和被編碼之頻率轉換係數之編碼信號進行解碼,然後輸 出到移位處理部8。 移位處理部8係對被解碼部7解碼之頻率轉換係數之 資料,僅移位,與編碼時者相反方向,在每個頻帶上執行 編碼時移位之位元數份,然後輸出到頻率逆轉換部9。 頻率逆轉換部9係對在移位處理部8上被施予移位處 ® 理之資料,進行頻率逆轉換(例如,逆MDCT)以轉換成時間 軸,然後做爲再生信號而輸出。 下文將說明第1實施形態之動作。 首先,參照第5圖之流程圖,說明聲音編碼裝置1 00 執行之聲音編碼處理。 首先,對輸入之聲音信號施予頻率轉換(步驟S1),將 藉頻率轉換得出之頻率轉換係數,配合人類聽覺的特性, 愈低頻帶愈窄、愈高頻帶愈寬那樣進行頻帶分割(步驟S2) ^ 。其次,對各分割頻帶,找尋頻率轉換係數之絕對値的最 大値(步驟S3)。算出使各頻帶上之最大値低於各頻帶上事 先設定之量子化位元數那樣之移位位元數(步驟S4)。 接著,依每個分割頻帶,對頻帶中之全部的頻率轉換 係數’施予僅移位在步驟S4上算出之移位位元數份之移位 處理(步驟S 5 ),然後,對移位處理後之資料,以既定之編 碼方式進行編碼(步驟S 6),接著結束本聲音編碼處理。 在編碼信號上,依被分割之頻帶的順序附加移位位元 1312983 數這種資料’然後被記憶於聲音編碼裝置1 Ο Ο ,或者輸出到其它的裝置。 接著,將參照第6圖之流程圖,說明在g 1 0 1上對被前述聲音編碼裝置作成之聲音編碼 解碼之聲音解碼處理。 首先’對輸入之編碼信號進行解碼(步驟 對被解碼之頻率轉換係數資料,依每個頻帶, 時者相反方向’僅移位在編·碼時被移位之位方 • 處理(步驟T2)。然後,對被施予移位處理之, 轉換(步驟T3),接著,結束本聲音解碼處理。 如上述那樣,依本第1實施形態,藉配名 特性,將聲音信號進行頻帶分割,並進行頻_ 移位處理,使其最大値低於各頻帶上事先設笼 元數,藉此,能提昇聲音編碼之處理速度。 (第2實施形態) 以下將參照第7圖〜第1 0圖,說明本發曰J 籲形態。 第7圖係表示第2實施形態有關之聲音I 之組成。聲音編碼裝置2 0 0係由直流(D i r e c t 部1 Ο,訊框形成部1 1、位準調整部1 2、頻率 頻帶分割部1 4、最大値找尋部1 5 '移位數算 位處理部17、音質控制部18、向量量子化部19 編碼部2 0所組成。 聲音編碼裝置200之組成要素之中,頻率 內之記憶體 〖音解碼裝置 丨信號,進行 Τ1)。接著, 進行與編碼 h數份之移位 ί料進行頻率 ί人類之聽覺 S轉換係數之 [之量子化位 弓之第2實施 晶碼裝置2 0 〇 current)去除 轉換部1 3、 出部1 6、移 、熵(entropy) 轉換部1 3、 -10- 1312983 , 頻帶分割部14、最大値找尋部1 5、移位數算出部1 6、移 位處理部1 7係分別具有與第1實施形態之聲音編碼裝置 1 〇〇之頻率轉換部1、頻帶分割部2、最大値找尋部3、移 位數算出部4、移位處理部5相同的功能,因此省略其等 功能之說明。 ®流去除部10係除去輸入之聲音信號之直流成份後 ’將其輸出到訊框形成部〗丨。除去聲音信號之直流成份係 医1直流成份幾乎與音質無關之故。去除直流成份係能藉, • 例如’高通濾波器(high-pass filter)進行。高通濾波器有例 如下述式(3)所示者。 (數3) (3) //(z) = 0.464-0.927厂1 +0.464厂2 ~~ϊ^\.90βζ-' +0.9112-2 訊框形成部1 1係將來自直流去除部1 〇之信號分割成 屬於編碼(壓縮)的處理單位之定長框,然後將其輸出到位 準調整部12。這裡,一個框之長度係含有一個以上之資料
塊(block)。1 個資料塊係執行一次 MDCT(Modified Discrete
Cosine Transform:變形離散餘弦轉換)之單位。具有MDCT 次數份之長度。M D C T之抽頭長度理想的是5〗2抽頭。 位準調整部12係依每個訊框對輸入之聲音信號執行 位準調整(振幅調整)’然後將位準被調整之信號輸出到頻 率轉換部1 3。所謂位準調整,係指將含於1個訊框中之信 號的振幅之最大値歸納在指定之位元(以下,稱爲壓制目標 位元)數。聲音信號被壓制到1 〇位元程度係能想像得到。 -11- 1312983 位準調整,例如設1個訊框中的信號之最大振幅爲nb i t, 壓制目標位元數爲N,則藉將訊框中的信號全部移位到滿 足式(4)之 shift_bit 數份之 LSB(Least Significant Bit:最 少位位元)側即可達成。 (數4) shift—bit {Λ (η < Ν) (η > Ν) (4)
另外,解碼時因須將振幅被壓制到壓制目標位元以下 之信號回復原來的値,故須將表示Shift_bit之信號做爲編 碼信號的一部分而輸出。 被調整位準後之信號,係與第1實施形態的聲音編碼裝 置1 00之處理相同地,經頻率轉換部1 3進行頻率轉換後,在 頻帶分割部14上,將藉頻率轉換處理得出之頻率轉換係數 ,配合人類的聽覺特性進行頻帶分割,接著,於最大値找 尋部1 5上,對每個分割頻帶,找尋頻率轉換係數之絕對値 的最大値,然後,在移位數算出部1 6上算出使各個分割頻 • 帶上之頻率轉換係數的最大値低於在各個分割頻帶上事先 設定之量子化位元數之移位位元數。接著,在移位處理部 1 7上,就每個分割頻帶,對頻帶中之全部的頻率轉換係數 ,依在移位數算出部1 6上算出之移位位元數份進行移位。 音質控制部1 8係藉頻率轉換係數之資料的削除,俾進 行雖碼量多一點但可提高播放音之音質,或稍微犧牲播放 音的音質,以抑制碼量之音質控制。亦即,爲了獲得既定 之音質,事先決定在頻率轉換係數中有幾個頻帶份之係數 -12- 1312983
•V v 要編碼’移位處理後之頻率轉換係數的資料數若是比事先 決定之資料數(編碼對象的頻帶數)多之情形,則將過多的 頻帶份之頻率轉換係數去除,而將剩下之頻帶的頻率轉換 係數輸出到向量量子化部1 9。去除的處理有,例如,從能 量小的頻帶的頻率轉換係數開始去除之方法。 具體的例,舉1個資料塊的MDCT係數爲1 6頻帶,其 中要編碼之對象頻帶爲10頻帶之情形來說明。16頻帶之 MDCT 係數係爲 10、-5、80、657、-324、-2、986、324、 鲁 - 8 3 2、27、-3 1、89、2、-1、9、1之情形則去除能量小之 第 2、6' 13、14、15、16 號之頻帶的 MDCT 係數(-5、-2 、2、-1、9、1),剩下的10頻帶份的MDCT係數即成爲編 碼對象。另外,當解碼時,因須使被去除之頻帶的資料回 復,故表示第幾號的頻帶有被編碼之信號也須做爲編碼信 號的一部分而輸出。 向量量子化部 19具有貯存表示多數之聲音樣式 (pattern)的向量之 VQ(Vector Quantization:向量量子化) Φ 表’比較從音質控制部18輸入之編碼對象的頻率轉換係數 (向量)Fj和貯存於VQ表內之各個代表向量’將表示最類似 之代表向量之索引(i n d e X)做爲碼而輸出到熵編碼部2 0。 例如,設向量長度爲N之編碼對象的向量爲{ s | j = 1, …,N },貯存於V Q表內之k個代表向量爲{ V i I i = 1,…,k }、 Vi = {Vij丨j = i,…,Ν},將使編碼對象之向量與貯存在VQ表內 之第i號之代表向量之各要素V ^的差値e ··成爲最小那樣 的i(索引)做爲輸出之碼。差値ei的算出或係如下式(5)。 -13- 1312983 、 (數 5) Α=Σ(ϋ)2 (5) >ι 代表向量的數k和向量長Ν係要考量向量量子化所要 之處理時間,V Q資料表之容量等而決定。例如,能考慮作 成向量長爲3、代表向量數爲128、向量長爲4、代表向量 數爲2 5 6等之隨意組合。又,藉對每個編碼對象之頻帶, 準備不同之VQ表,能提昇播放聲音之品質。 W 熵編碼部20係對從向量量子化部19輸入之資料施予 熵編碼,並做爲編碼信號而輸出。所謂熘編碼係指利用信 號的統計上的性質,出現頻度多之碼分配的長度短,出現 頻度少之碼分配的長度長,藉此,將整體之碼長度變短之 編碼方式,有藉霍夫曼(Huffman)編碼 '算術編碼、幅度編 碼器(Range coder)所執行之編碼等。 第8圖係表示第2實施形態有關之聲音解碼裝置20 1 。聲音解碼裝置201係爲將被聲音編碼裝置200編碼之信 ® 號予以解碼之裝置,由熵編碼部3 0、逆向量量子化部3 1 '移位處理部3 2、頻率逆轉換部3 2、位準再生部3 4、訊 框合成部35所組成。在聲音解碼裝置201之組成要素當中 ,移位處理部3 2、頻率逆轉換部3 3因分別具有與第1實 施形態的聲音解碼裝置1 0 1之移位處理部8、頻率逆轉換 部9相同的功能,故省略其等功能之說明。 熵解碼部3 0係對經熵編碼後之輸入信號進行解碼,並 將解碼後之信號輸出到逆向量量子化部3 1。 -14- 1312983 逆向量量子化部31具有貯存表示多數聲音樣式之代 表向量之V Q表,抽出對應於從熵解碼部3 0輸入之信號 (索引)之代表向量。這時,目前之頻率轉換係數的頻帶數 若是比原來(頻率轉換時)之頻率轉換係數之頻帶數少之情 形,逆向量量子化部3 1則將既定値插入不足份之頻帶,將 補齊之全部頻帶之頻率轉換係數輸出到移位處理部3 2。插 入不足份之頻帶的資料値係插入比輸入之信號頻帶之能量 之値較小的値(例如,0)。 • 位準再生部3 4係對從頻率逆轉換部3 3輸入之信號執 行位準調準,俾回復到原來的位準,然後輸出到訊框合成 部35。 訊框合成部3 5將屬於編碼及解碼之處理單位之訊框 予以合成,然後將合成後之信號做爲播放信號而輸出。 其次,將說明第2實施形態之動作。 首先,參照第9圖之流程圖,說明在聲音編碼裝置2〇〇 上執行之聲音編碼處理。 ® 首先,去除輸入之聲音信號的直流成份(步驟S10),肖 直流成份去除後之聲音信號分割成一定之訊框(步驟Sll) 。然後,對每個訊框,調整輸入之聲音信號的位準(振幅) (步驟S12),接著對位準調整後之聲音信號,執行MD(:t (步驟S 1 3 )。 其次,將藉MDCT得出之MDCT係數(頻.率轉換係數) ’配合人類之聽覺特性,進行頻帶分割(步驟S 1 4)。接赛;, 對每個分割頻帶,找尋MDCT係數之絕對値的最大値(步驟 -15- 1312983 . S 1 5 ) ’算出使各個分割頻帶上之頻率轉換係數的最大値低 於各頻帶上事先設定之量子化位元數那樣之移位位元數 (步驟S 1 6 )。 接著,依每個分割頻帶,對各個頻帶中之全部的M D C T 係數,執行僅移位在步驟S 1 6上算出之移位位元數份之移 位處理(步驟S17)。接著,目前之MDCT係數之頻帶數若是 比事先指定之頻帶數(編碼對象之頻帶數)多之情形,則將 過多的頻帶予以去除(步驟S18)。 ® 然後,對編碼對象的頻帶之M D C Τ係數,執行向量量 子化(步驟S〗9),對經向量量子化後之信號施予熵編碼(步 驟S20),接著即結束聲音編碼處理。 下面,將參照第10圖之流程圖,說明在聲音解碼裝置 201上執行之聲音解碼處理。 首先,對被施行熵編碼之編碼信號進行解碼(步驟Τ1 0) ’對解碼後之信號執行逆向量量子化(步驟Τ11)。這裡,目 前之MDCT係數之頻帶數若是比原來的MDCT係數的頻帶 ® 數少之情形,則將既定値(例如,0)插入不足份之頻帶上。 其次,對全部頻帶補齊之MDCT係數,依每個頻帶, 在與編碼時移位方向相反之方向上,執行在編碼時移位之 位元數份之移位處理(步驟T 1 2),對被執行移位處理之資料 ’執行逆M D C T (步驟T 1 3 ) »接著,對被執行逆M D C T後之 信號進行位準調整,俾回復原來的位準(步驟Τ 1 4),然後合 成係爲編碼及解碼之處理單位之訊框,接著結束本聲音解 碼處理。 -16- 1312983 如上述,依第2實施形態,藉將事先指定之頻帶數份 之頻率轉換係數做爲編碼對象,能達成更高速之編碼處理 〇 另外,上述之各實施形態之記述內容係能在不逾越本 發明之主旨的範圍內,適宜地變更。 例如,上述之各實施形態係揭示M D C T之頻率轉換之 情形,但也可使用 DFT(Discrete Fourier Transform:離散 傅立葉轉換)等之其它的頻率轉換。 【圖式簡單說明】 第1圖係爲表示本發明之第1實施形態有關之聲音編 碼裝置的組成之方塊圖。 第2圖係爲表示本發明之第1實施形態有關之聲音解 碼裝置的組成之方塊圖。 第3圖係爲用於說明頻率轉換係數之頻帶分割之圖。 第4圖係爲用於說明量子化位元數和移位位元數之圖 〇 第5圖係爲表示在第〗實施形態之聲音編碼裝置上執 行之聲音編碼處理之流程圖。 第6圖係爲表示在第丨實施形態之聲音解碼裝置上執 行之聲音解碼處理之流程圖。 第7圖係爲表示本發明之第2實施形態有關之聲音編 碼裝置的組成的方塊圖。 第8圖係爲表示本發明之第2實施形態有關之聲音解 碼裝置的組成的方塊圖。 -17- 1312983 第9圖係爲表示在第2實施形態之編碼裝置上執行之 聲音編碼處理的流程圖。 第1 〇圖係爲表示在第2實施形態之編碼裝置上執行之 聲音解碼處理的流程圖。 【主要元件符號說明】
1 頻 率 轉 換 部 2 頻 帶 分 割 部 3 最 大 値 找 尋 部 4 移 位 數 算 出 部 5, 8 移 位 處 理 部 6 編 碼 部 7 解 碼 部 9 its 頻 率 逆 轉 換 部 10 直 流 去 除 部 11 訊 框 形 成 部 18 音 質 控 制 部 19 向 量 量 子 化 部 20 熵 編 碼 部 30 熵 解 碼 部 3 1 逆 向 量 量 子 化部 34 位 準 再 生 部 35 訊 框 合 成 部 -18-
Claims (1)
1312983 « 十、申請專利範圍: 1 . 一種聲音編碼裝置,其特徵爲具備: 對輸入之聲音信號,執行頻率轉換之頻率轉換手段; 將前述頻率轉換手段得出之頻率轉換係數之頻帶, 以頻率愈低則愈窄,愈高則愈寬的方式加以分割之頻帶 分割手段; 依被前述頻帶分割手段分割出之每個頻帶,找尋在 前述頻率轉換手段上得出之頻率轉換係數中絕對値爲最 Φ 大之値的找尋手段; 算出移位位元數,使藉前述找尋手段得出在每個分 割頻帶上之頻率轉換係數之最大値,係低於在各個分割 頻帶上事先設定之量子化位元數之移位數算出手段; 對在前述頻率轉換手段得出之頻率轉換係數之値, 進行藉前述移位數算出手段算出之移位位元數份之移位 處理之移位處理手段;及 對被前述移位處理手段執行移位處理後之頻率轉換 Φ 係數進行編碼之編碼手段。 2 .如申請專利範圍第1項之聲音解碼裝置,其中前述編碼 手段具備= 對被執行前述移位處理之頻率轉換係數資料,進行 向量量子化之向量量子化手段;及 對被執行前述向量量子化之資料,施予熵編碼之熵 編碼手段。 3.如申請專利範圍第2項之聲音編碼裝置,其中具備: 去除輸入之聲音信號的直流成份之去除手段; -19- 1312983 將被前述去除手段去除直流成份之聲音信號分割成 定長之訊框之訊框分割手段; 對藉前述訊框分割手段得出之每個訊框,根據含於 框內之聲音信號之振幅的最大値,來調整聲音信號之振 幅,並將被執行振幅調整之聲音信號輸出到前述頻率轉 換手段之振幅調整手段。 4 ·如申請專利範圍第3項之聲音編碼裝置,其中具備藉前 述頻率轉換得出之頻率轉換係數若是比事先指定之數更 多的情形,則去除過多部份之頻率轉換係數之頻帶數去 除手段。 5 ·如申請專利範圍第4項之聲音編碼裝置,其中前述頻率 轉換手段係使用變形離散餘弦轉換之頻率轉換方式。 6.—種聲音解碼裝置,其特徵爲包括: 對包含被編碼之各分割頻帶的移位位元數和被編碼 之頻率轉換係數之編碼信號加以解碼之解碼部,前述分 割頻帶係爲輸入之聲音信號經頻率轉換得出之頻率轉換 係數之頻帶,依頻率愈低則愈窄’頻率愈高則愈寬的方 式而被分割者; 對在解碼部上被解碼之頻率轉換係數資料,在與編 碼時相反之方向,僅執行已解碼之移位位元數部份之移 位的移位處理部;及 對在移位處理部上被執行移位處理之資料,進行頻 率轉換以轉換成時間軸,接著做爲播放信號而輸出之頻 率逆轉換部。 -20- 1312983 * . 7 · —種聲音編碼方法,其特徵爲包括: 對輸入之聲音信號,執行頻率轉換之頻率轉換步驟; 將藉前述頻率轉換步驟得出之頻率轉換係數之頻帶 ’依愈低頻愈窄,愈高頻愈寬的方式進行分割之頻帶分 割步驟; 對藉前述頻帶分割步驟得出之各個頻帶,找尋在前 述頻率轉換步驟上得出之頻率轉換係數中絕對値係爲最 大値的找尋步驟; ® 算出移位位元數,使藉前述找尋步驟,在每個頻帶 上得出之頻率轉換係數之最大値,係低於在各個分割頻 帶上事先設定之量子化位元數之移位數算出步驟; 對在前述頻率轉換步驟上得出之頻率轉換係數之値 ,執行藉前述移位數算出步驟算出之移位位元數部份之 移位處理之移位處理步驟;及 對在前述移位處理步驟上被執行移位處理之頻率轉 換係數’進行編碼之編碼步驟。 ® 8.如申請專利範圍第7項之聲音編碼方法,其中前述編碼 步驟包括: 對被執行前述移位處理之頻率轉換係數資料,進行 向量量子化之向量量子化步驟;及 對被執行向量量子化之資料’進行熵編碼之熵編碼 步驟。 9 .如申請專利範圍第8項之聲音編碼方法,其中包括: 去除輸入之聲音信號的直流成份之去除步驟; -21- 1312983 t 將在前述去除步驟上,直流成份被去除之聲音信號 分割成定長之訊框之訊框分割步驟;及 對在前述訊框分割步驟上得出之每個訊框’根據含 於框內之聲音信號之振幅的最大値,來調整聲音信號的 振幅,接著將被施予振幅調整之聲音信號移交到前記頻 率轉換步驟之振幅調整步驟。 I 0 .如申請專利範圍第9項之聲音編碼方法,其中另包括頻 帶數去除步驟,在前述頻率轉換步驟上得出之頻率轉換 Φ 係數的數,若是比事先指定之數更多的情形’則去除過 多部份之頻率轉換係數。 II .如申請專利範圍第1 〇項之聲音編碼方法’其中前述頻率 轉換步驟係採用變形離散餘弦轉換之頻率轉換方式。 1 2 . —種聲音解碼方法,其特徵爲包括: 對含有被編碼之各個分割頻帶的移位位元數和被編 碼之頻率轉換係數之編碼信號,進行解碼之解碼步驟, 前述分割頻率係爲輸入聲音信號經頻率轉換得出之之頻 # 率轉換係數的頻帶,被分割成愈低頻愈窄,愈高頻愈寬 者; 對在前述解碼步驟上被解碼之頻率轉換係數資料, 在與編碼時之相反方向,進行僅移位被解碼之移位位元 數部份之移位處理步驟;及 對在移位處理步驟上被執行移位處理之資料,執行 頻率轉換,以轉換成時間軸,接著做爲播放信號而輸出 之頻率逆轉換步驟。 -22-
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005079464A JP4800645B2 (ja) | 2005-03-18 | 2005-03-18 | 音声符号化装置、及び音声符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200703236A TW200703236A (en) | 2007-01-16 |
TWI312983B true TWI312983B (en) | 2009-08-01 |
Family
ID=37011487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW095109091A TWI312983B (en) | 2005-03-18 | 2006-03-17 | Audio coding apparatus and audio decoding apparatus |
Country Status (5)
Country | Link |
---|---|
US (1) | US20060212290A1 (zh) |
JP (1) | JP4800645B2 (zh) |
KR (1) | KR100840439B1 (zh) |
CN (1) | CN1866355B (zh) |
TW (1) | TWI312983B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8959016B2 (en) | 2002-09-27 | 2015-02-17 | The Nielsen Company (Us), Llc | Activating functions in processing devices using start codes embedded in audio |
US9711153B2 (en) | 2002-09-27 | 2017-07-18 | The Nielsen Company (Us), Llc | Activating functions in processing devices using encoded audio and detecting audio signatures |
JP4396683B2 (ja) | 2006-10-02 | 2010-01-13 | カシオ計算機株式会社 | 音声符号化装置、音声符号化方法、及び、プログラム |
US20090132238A1 (en) * | 2007-11-02 | 2009-05-21 | Sudhakar B | Efficient method for reusing scale factors to improve the efficiency of an audio encoder |
US8121830B2 (en) * | 2008-10-24 | 2012-02-21 | The Nielsen Company (Us), Llc | Methods and apparatus to extract data encoded in media content |
US8359205B2 (en) | 2008-10-24 | 2013-01-22 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US9667365B2 (en) | 2008-10-24 | 2017-05-30 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8508357B2 (en) | 2008-11-26 | 2013-08-13 | The Nielsen Company (Us), Llc | Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking |
KR101644883B1 (ko) * | 2009-04-15 | 2016-08-02 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
CA3008502C (en) | 2009-05-01 | 2020-11-10 | The Nielsen Company (Us), Llc | Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content |
KR101052301B1 (ko) * | 2009-07-21 | 2011-07-27 | 세종대학교산학협력단 | 음성신호 양자화 장치 및 방법 |
CN102959872A (zh) * | 2010-07-05 | 2013-03-06 | 日本电信电话株式会社 | 编码方法、解码方法、装置、程序及记录介质 |
ES2536902T3 (es) * | 2010-07-05 | 2015-05-29 | Nippon Telegraph And Telephone Corporation | Método codificador, método decodificador, dispositivo codificador, dispositivo decodificador, programa y medio de grabación |
JP5888356B2 (ja) * | 2014-03-05 | 2016-03-22 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1197619A (en) * | 1982-12-24 | 1985-12-03 | Kazunori Ozawa | Voice encoding systems |
US5752225A (en) * | 1989-01-27 | 1998-05-12 | Dolby Laboratories Licensing Corporation | Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands |
JP3185413B2 (ja) * | 1992-11-25 | 2001-07-09 | ソニー株式会社 | 直交変換演算並びに逆直交変換演算方法及びその装置、ディジタル信号符号化及び/又は復号化装置 |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
TW321810B (zh) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP3283413B2 (ja) * | 1995-11-30 | 2002-05-20 | 株式会社日立製作所 | 符号化復号方法、符号化装置および復号装置 |
US6151442A (en) * | 1996-07-08 | 2000-11-21 | Victor Company Of Japan, Ltd. | Signal compressing apparatus |
JP3681488B2 (ja) * | 1996-11-19 | 2005-08-10 | 三井・デュポンポリケミカル株式会社 | エチレン共重合体組成物及びそれを用いた易開封性シール材料 |
US7110941B2 (en) * | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
JP3748261B2 (ja) * | 2003-06-17 | 2006-02-22 | 沖電気工業株式会社 | Adpcm方式復号器 |
KR100557113B1 (ko) * | 2003-07-05 | 2006-03-03 | 삼성전자주식회사 | 다수의 대역들을 이용한 대역별 음성신호 판정장치 및 방법 |
US20050010396A1 (en) * | 2003-07-08 | 2005-01-13 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
-
2005
- 2005-03-18 JP JP2005079464A patent/JP4800645B2/ja active Active
-
2006
- 2006-03-16 US US11/378,655 patent/US20060212290A1/en not_active Abandoned
- 2006-03-16 CN CN200610093719XA patent/CN1866355B/zh active Active
- 2006-03-17 KR KR1020060024645A patent/KR100840439B1/ko active IP Right Grant
- 2006-03-17 TW TW095109091A patent/TWI312983B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US20060212290A1 (en) | 2006-09-21 |
JP4800645B2 (ja) | 2011-10-26 |
KR100840439B1 (ko) | 2008-06-20 |
JP2006259517A (ja) | 2006-09-28 |
CN1866355B (zh) | 2010-05-12 |
KR20060101335A (ko) | 2006-09-22 |
CN1866355A (zh) | 2006-11-22 |
TW200703236A (en) | 2007-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI312983B (en) | Audio coding apparatus and audio decoding apparatus | |
JP5048697B2 (ja) | 符号化装置、復号化装置、符号化方法、復号化方法、プログラムおよび記録媒体 | |
JP3926726B2 (ja) | 符号化装置および復号化装置 | |
JP3579047B2 (ja) | オーディオ復号装置と復号方法およびプログラム | |
KR102055022B1 (ko) | 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램 | |
KR101576318B1 (ko) | 스펙트럼 평활화 장치, 부호화 장치, 복호 장치, 통신 단말 장치, 기지국 장치 및 스펙트럼 평활화 방법 | |
JP2022185105A (ja) | Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置 | |
JP4548348B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP3881946B2 (ja) | 音響符号化装置及び音響符号化方法 | |
JP2005242363A (ja) | 無損失オーディオ符号化/復号化方法および装置 | |
US20110307248A1 (en) | Encoder, decoder, and method therefor | |
JP2010538317A (ja) | ノイズ補充の方法及び装置 | |
KR101143792B1 (ko) | 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법 | |
JP3186007B2 (ja) | 変換符号化方法、復号化方法 | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
JP4308229B2 (ja) | 符号化装置および復号化装置 | |
JP5606457B2 (ja) | 符号化装置および符号化方法 | |
US10734005B2 (en) | Method of encoding, method of decoding, encoder, and decoder of an audio signal using transformation of frequencies of sinusoids | |
JP4721355B2 (ja) | 符号化データの符号化則変換方法および装置 | |
JP6713424B2 (ja) | 音声復号装置、音声復号方法、プログラム、および記録媒体 | |
JPH11109994A (ja) | 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体 | |
US9854379B2 (en) | Personal audio studio system | |
JP3504485B2 (ja) | 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |