TWI333643B - Apparatus and method for encoding and decoding signal - Google Patents

Apparatus and method for encoding and decoding signal Download PDF

Info

Publication number
TWI333643B
TWI333643B TW096102003A TW96102003A TWI333643B TW I333643 B TWI333643 B TW I333643B TW 096102003 A TW096102003 A TW 096102003A TW 96102003 A TW96102003 A TW 96102003A TW I333643 B TWI333643 B TW I333643B
Authority
TW
Taiwan
Prior art keywords
signal
decoding
unit
encoding
module
Prior art date
Application number
TW096102003A
Other languages
English (en)
Other versions
TW200746051A (en
Inventor
Hyen O Oh
Hyo Jin Kim
Yang Won Jung
Seung Jong Choi
Dong Geum Lee
Hong Goo Kang
Jae Seong Lee
Original Assignee
Lg Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lg Electronics Inc filed Critical Lg Electronics Inc
Publication of TW200746051A publication Critical patent/TW200746051A/zh
Application granted granted Critical
Publication of TWI333643B publication Critical patent/TWI333643B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

1333643 九、發明說明: 【發明所屬之技術領域】 本發明涉及一種將信號編碼與解碼之I置鱼 =種根據信號特徵以最優位元率將信號編碼與 【先前技術】 驾知音頻編碼可在48kbps或更高的古a _ * 音頻信號,但對處理語音信號效輪低j下提供高品質 編碼器能夠在12kbps或更低的低位元率 ^,習知語音 號,但對於多變音頻信號的編碼效率較低。有效也編碼語音信 【發明内容】 本發明的目的是提供一種可以最 _ (如語音和音頻錢)進行編碼和解碼’、、不同特性的信 法。 、 號 置及編碼和解碼的方 本發明的技術特徵在於,本菸 人位元流中取出複數經編碼信^和經編、f碼方法’包括從輸 採用複數解碼方法中的哪—方、;Γ· f δ唬的劃分資訊,確定 採用該經讀定的解碼方倾一經編媽信號進行解碼,並 資訊將解碼信號合成。…碼域進行解碼’之後依據劃分 本發明的再-技術特徵在 一位元拆包模組,其可從 本f月扣供一種解碼裝置,包括 編碼信號的劃分資訊;一“出複數經編碼信號和經 單元中的哪-個解竭單3其可確定複數個解碼 號;-解碼模組,可利用二用編碼信號中的每-信 號;和-合成模組,可根 (t判疋的解碼#元解碼經編碼信 據W刀貧訊將已解碼信號合成。 6 1333643 % 將ί::以號本碼方法’包括 信號的特徵將:類 本發明的另一技術特徵在於,本發明提供一 ’將輸人信號錢為複數分聽料=^括 ==碼方法將分割信號編碼更位==利 ,、τ以生成-基於經編碼分齡號的位元流。 m且 【實施方式】 詳=合本發明社量實施顺參__本發明進行更 - Hi根據本發明一實施例的一編碼裝置的方塊圖。來昭第 圖該、·扁蜗震置包含一分類模組卿, 一位7L打包模組300。 )棋、、且200,以及 第碼⑽複數個編碼單元,亦即從第一編碼單元 到第m編碼早元22〇 ’但其分別執行不同編碼方法。 各將一輸入信號劃分為複數個被分割信號,並將 豆由楚刀。〈5#u/刀配給第一編碼單元210至第坩編碼單元220。 工C單元210至第m編碼單元220中的某些編碼單元可 此被刀配給兩個或更多被分割信號,或者根本沒有分配給信號。 定ΐίίί纟'"⑽可為各倾分聽號分配—缝量位元或痛 疋传編碼的被分割信號的順序。 仰該編 =模組200對每個被分割信號作編碼,亦即利用第一編碼 至第m編碼單元中有對應至被分割信號的編碼單元來對其 進仃編碼。該分類模組100分析各個被分割信號的特徵並根據該 7 1333643 分析結果從第一編碼單元至第m編碼單元中選擇一能夠最有效 地編碼各個被分割信號的編碼單元。 月b夠袁有效地編碼被分割信號的編碼單元可被視為能夠實現 最高的壓縮效率。 处例如,被分割信號可容易地被模型化,這如同一係數和一餘數 月b夠被at音編媽器有效地編碼一樣,然而有時被分割信號卻不容 易地被模型化,這如同一係數和一餘數能夠被音頻編碼器有效地 編碼'-樣。 曰如果通過模型化被分難號獲得的—餘數與該被分割信號能 賊賴值,繼被分聽號被視為可容易被模 在時間軸上展示了高冗餘(redundancy)的被分割信號,由於苴 性預測方法(目前信號是基於先前的信號被預測)被很 化’使得該被分割信號可由—語音編性預測 編碼方法進行最有效地編碼。 該位元打包模、组3〇〇根據該編碼模、组2〇〇提供的經編碼的被分 此號及關於該經編碼的被分割信號的附加編喝f訊產生一位 =法歸元平*法或位元料算術編 償=物細細峨峨包含於一待 ^參照3二圖i該分類模組励可包含複數個分類單元:第-分
Hi類單元,°其中從第—分類單元 4入抒㈣。2輸人減劃分為複數個被分割信號,轉換 該輸入μ的域’取出錄人錢的特徵,根制輸人信號= 8 m編 ίϊί該輸人信號分配給第—編碼單至第 第一分類單元110至第n分類單元12 气,其對該輸入信號執行一預處理操作 效編碼的錢。該聽理料將該輸人信_分 2^如i—係數分量和—信號分量,並且可在其他&類單 疋執行其操作前對該輸入信號執行預處理操作。 、 根據該輸人信號的特徵、外部環素以及目標位 被選擇性地預處理,並且只有由該輸人信號得到的』 個被5割信號中的某些信號可被選擇性地預處理。 根據心理聲賴型模組4GG提供的該輸人信號的感知特徵資 訊,該分類模組1〇〇 m亥輸入信舰行分類。該《知特徵資訊的 採樣包含一掩蔽閾值、一信號掩蔽率(SMR)、以及感知熵 (perceptual entropy)。 換5之,根據δ亥輸入仏號的該感知特徵資訊(例如掩蔽閾值或 ,號掩蔽率),該分類模組100可將該輸入信號劃分為複數個被分 剎k號或將各個被分割信號分配給第一編碼單元21 〇至第m編碼 單元220中的一個或多個編碼單元。 此外’該分類模組100可接收資訊(如該輸入信號的音調、過 零率(ZCR )和線性預測係數)以及先前的訊號框(丘咖。的分類資 訊,並可根據所接收的資訊對該輸入信號進行分類。 參照第一圖,由該編碼模組200輸出的編碼結果資訊可回饋給 該分類模組1〇〇。 σ 一旦該輸入信號被該分類模組100劃分為複數個被分割信 號’並且由第一編碼單元210至第m編碼單元220中的編碼單元 判定該被分割彳§5虎以多少位元數重、以及以什麼順序進行編碼, 則根據該判定的結果對該被分割信號編妈。實際用於編碼各個被 1333643 分割信號的位元數量可不必與在分類模組100中分配的位元數量 相同。 說明實際使用的位元數量與已分配的位元數量差別的資訊可 被回饋給該分類模組100 ’從而使該分類模組100可為其他被分 割信號增加位元數量。如果實際使用的位元數量大於已分配的位 元數量,該分類模組100可減少分配給其他被分割信號的位元數 量。
實際對被分割信號進行編碼的編碼單元不必相同於由該分類 模組100分配給該被分割信號的編碼單元。在這種情況下,資訊 將回饋給該分類模組1〇〇,而指出兩個編碼單元是不同的,亦即 實際對被分割信號作編碼的編碼單元,是不同於由該分類模組 100所分配的編碼單元(分配給該被分割信號的)。接著,該分類 ,組100將該被分割信號分配給實際對其編碼的編碼單元,而不 疋之剷分配給該被分割信號的那個編碼單元。 2分類模組100可根據回饋給它的編碼結果資訊,再次將該輸 ίϊϋϊ,複數個被分割信號。在這種情況下,該分類模組100 *同結制被分割錢(來自絲獲得的被分
作= 轉的編補作與實際執行的編碼操 使兮區別的資訊可回饋給該分麵組⑽,從而 使邊刀類模組聽可再次確定與編碼操作相關的資訊。 塊圖第中所,該分類模、组100的一實施例的方 處理輸人錢執行-預 理第—分類單元1 ig可包含複數錄行不同預處 的特徵、夕卜部預處理器112 °根據輸入信號 衣境因素以及目標位元率,該第—分類單元⑽可 1333643 至第η預處理器112中之-預處理器, 镇-顆心:订預處理。此外’該第一分類單元11G可利用 ίΐ‘處理^至第11預處理器112對該輸人信號執行兩個或 的=七:=第-= 器113和-餘數取出器114。 係數取出 113對—輸人錢進行分析並從該輸入信號中 出-餘係、數1該餘數取出器114從該輸人信號中取 、,、中〇餘數的冗餘部分由該係數取出器被從中去掉。 π ί預可對該輸入信魏行線性預測編碼操作。在這種情 從傅χίϊΐΐ器113通過對該輸入信號執行線性預測分析而 虎中取出一線性預測係數,且該餘數取出器114利用 113提供的線性預測係數從該輸人信號中取出一餘 數。5亥去除冗餘的餘數可與白雜訊具有姻的形式。 下面將詳細描述本發明一實施例的一種線性預測分析方法。 性侧錢可包含先雜人信號的線 χ{η) = ^ α3χ{η - j) 户1 …⑴ ^其^ ^表示線性預測順序’屮到吟表示通過最小化一輸入信 估4彳5號之間的均方誤差得到的線性預測係數。 一用於線性預測分析的傳遞函數户(Ζ)可用等式(2)表示。 11 .(2)1333643 k
尸⑻W 參照第三圖,該預處理器可利用另一種線性預測分析法,即捲 曲線性預測編碼(WLPC)法可從一輸入信號中取出—線性預測 係數。該WLPC法可通過替換具有一用於單位延遲γ的傳遞/函 數J⑻的全通濾波器而實現。該傳遞函數j(z)可由等式(3 )表^ . Λ(ζ) ζ~ι-λ …(3) 其中,A表示一全通係數。通過改變該全通係數a, 變待分析信號的精度。舉例而言,如果—待分析 = -特,段’例如’如果-待分析信號是—高度集; 的音頻,那麼雜分析信號可麵設i該全通 古二 編碼,從而使低頻段信號的精度得以提高。 ’、 冋户 f WLPC方法中’被分析的低頻信號比高頻信 精度。因此,該WLPC方法可實崎賴㈣ j 且能夠更好麵型化㈣錢。 ^謂生犯,並 該全通係數A可根據一輸入信號的特徵、外 =====成 Ϊ化:二通以^ 數的值的細可由絲的全齡數值確g被確4目前全通係 一掩蔽閾值(即替代一原始信號)可被作 12 丄 測可利用-餘數 =仿。線性_係數的預 析可麵行不止線性預測分 =二圖,該第—分類單元⑽可包含—來 執仃上述線性預測分析第一 。 J ()和
的第二預處理器(圖Φ丰-山f預處理為111 ’ 一執行WLPC 境因素和目標位元|3據,入信號的特徵、外部環 111和第二預處理器中 110可從該第-預處理器 預測分析。 、 或決疋不對該輸入信號執行線性 處理通=系數Λ的值為0 ’則該第二預處理器可盘該第一預 同。在這種情況,該第 包::預 法並::據;r伽的值選擇-種線性二= 在訊號框ΐ元“=類%元n〇可執行線性預測分析或 種。早令k擇的線性預測分析方法和wlpc方法中的一 選性預測分析的資訊以及指示在訊號框單元中 於-待發送==法和霞方法中的哪種的資訊可包含 數,5户莫、组300從該第一分類單元100接收一線性預測係 数扣不疋否執行線性預測編碼的資訊,以及確定實 性,編碼器的資訊。隨後,該位元打包模組細將; 的資訊插入一待發送的位元流中。 。用於*將一輸入信號編碼為一具有幾乎與該原始輸入信號無法 區別的,音品質的信號的位元數量可由計算該輸入信號的感知 滴來確定。 第四圖為根據本發明一實施例用於計算感知熵的裝置的方塊 圖。參照第四圖,該裝置包含一濾波器組115,一線性預測單元 13 1333643 116,一心理聲學模型單元117,一第一位元計算單元118,以及 一第二位元計算單元119。 輸入信號的感知熵PE可利用等式(4)計算: PE =——I max 2π log: X{eJW) T(e,w) (bit / sample) …⑷ 其中表示該原始輸入信號的能量級別,力表示一掩蔽 鲁 閾值。 在涉及使用全通濾波器的WLPC方法中,輸入信號的感知熵 可利用該輸入信號的一餘數的能量與該餘數的掩蔽閾值之比計 算。更特別地’利用該WLPC方法的編碼裝置可利用等式(5) 計算一輸入信號的感知熵PE :
PE 〇,l〇g: R(eiw) dw (bit / sample) …(5) 其中,及(y_w)表示該輸入信號的一餘數的能量,r,(yw)表示該 餘數的掩蔽閾值。 該掩蔽閾值厂(/〇可由等式(6)表示: T\ejw) = T{eJW)/\H{ejw)^ ⑹ 其中,71#)表示原始信號的掩蔽閾值,//(,)表示用於WLPC 的傳遞函數。該心理聲學模型單元117可利用一在一比例因數頻 帶域中的掩蔽閾值和該傳遞函數丑Vw)計算該掩蔽閾值 1333643 要性可被判定’且根據該判定結果對給各個被分割信號的位元率 ,行調整。特別地’一被分割信號的重要性可被定義為固定值或 是根據各個訊號框的輸入信號的特徵而改變的非固定值。 如果語音和音頻信號混合在輸入信號中,該信號劃分單元121 可根據話音信號的特徵和音頻信號的特徵將該輸入信號劃分為 一個5吾音信號和一個音頻信號。 該判定單元122可判定該編碼模組2〇〇中第一編碼單元21〇 至第m編碼單元220中哪個編碼單元能夠最有效地對各個被分 信號進行編踢。 、,i =1]定單元122將被分割信號分類為一定數量的組(例如,該 ,定單το 122可將被分割信號劃分為]^個類),並通過將1^個類 ^的各,類與第一編碼單元2丨〇至第m編碼單元2 2 〇中之一編碼 早^進行匹配’以判定使用該編碼模組200中第-編碼單元21〇 至弟m編喝單元22〇中哪個編碼單元對各被分割信號進行編石馬。 H寺別地,給定包含該第一編碼單元2丨〇至第m編碼單元2如 二1碼模組2°。,該判定單元122可將被分割信號分類為第- 類,使其可分別由該第一編碼單元210至第m編碼單 7L 220進行高效編碼。 ’早 古,此夠由該第一編碼單元21〇至第m編碼單元22〇進杆 ===信號的特徵可被預先判定,並且該第 據此判定結果進行定義。其後,該判定單元122可= 第-iii ’並根據料結果將各個被分割信號分類至j 特徵。、中之一’其中相應的被分割信號共用有相同的 - 第=的例子包含—濁音語音類、—清音語音類、 以 及-濁㈣音麵…转調音頻類、 1333643 參照由該^理聲學模型模組400提供的闕於這些被分割信號 的感知特徵資訊(例如掩蔽閾值、SMR或感知級別),該判定單元 122可判疋使用该第一編瑪單元至第m編碼單元no中的哪 個編碼單元對各被分割信號進行編碼。 參照關於這些被分割信號的感知特徵資訊,該判定單元 可判定用於編碼這些被分割信號的位元數量或判定以什麼順序 對這些被分割信號進行編碼。 由該狀單元122執行欺所獲得的資訊(例如,指示使用 編踢單元21〇至第m編碼單元22。中的哪個編碼單元和用 夕>位7〇數量對各被分割信號進行編碼,以及用什麼順 被分割信麵行編碼的資訊),其可包含於—待發送元流中二 第六圖為第五圖中所示信號劃分單元121的一實施 1:參照第六圖’一信號劃分單元包含一細123及」 你。。亥二123可將—輸人#號劃分為複數個被分信號。該人 =态124可將具有相似特徵的被分割信號合 ς 此,該合併器m可包含-合成遽波器組。巧早域。對 在而!’ 割11 123可將一輸入信號劃分為256個頻帶。 ㈣输侧购輪併器m 巧第七圖,該合併器124可將複數個相鄰的被 芯早-的合併信號。此時,該合併器124可根據 ,數個相鄰的被分割信號合併為一單一信 巧則將 鄰的被分割信號的特徵。 而無須考慮這些相 —另一種情況,參照第八圖,該合併器124 ^數個被分割信號合併為一單一信號,而益徵的 魂是否相鄰。此時’該合併器可將複數個;由相同 編碼的被分割信號合併為一單一合併信號。 ^九圖為第五圖中所示信麵分單元另—實施例的方塊圖。參 照第九圖’-信賴分單元包含—第—分懸125,—第二分割 器126 ’以及第三分割器127。 ^別地,雜賴分單元121可分級地劃分—輸人信號。舉例 =s ’該輸人錢可由該第—分割賴分為兩個被分割信號,而 2個被分割信號中的—個可由該第二分㈣丨2 6再劃分為三個 =割信號,並且這三個被分繼號中的—個可由該第三分割器 被分#Ht號。以這種方式,該輸人信號總共 難號。該信號劃分單元m可將該輸入信 唬劃为為後數個具有不同帶寬的頻帶。 伯if ί、騎示的實施例中,—輸人錢依照三級層次被劃分, if 。換言之,—輸人信號可依照2級或4級 或更夕級層次被劃分為複數個被分割信號。 該信號劃分單元121中的第—八釗哭η 中之一可將令麵;㈣割請 分輸入信號由信號劃分單元⑵劃分為複數被 音長度躺财是紅L語 次曰頻域树可具有雜止特徵,例如,在過渡期。 率號並提高這類非靜止信號的編碼效 :輸==明=;裝;遞函數分析 『帶過濾法,將-輸入信號劃分為ί:個 藉由聽將—輸人信_分為概顧分贿紅方法將詳 20 1333643 細描述於下面。 在EMD方法中,一輸入信號可被分解為一個更多固有模態函 • 數(IMF)。_必須滿足以下條件:極值的數量與零交叉的^量 必須相等或是至多相差-個;並且局部極大值和局部極小值所定 義包絡線(envelope)的平均值為〇。 固有模態函數IMF表示一種類似於簡單調和函數的簡單的振 - 式,從而使_輸人錢糊EMD方法獲得有效的分解成為 可月b。 ® 更特別地,為了從一輸入信號冲)中取出一固有模態函數 IMF’上包絡線可經由連接該輸入信號^⑺的局部最大值利用三次 =插=法確定的所有局部極值而產生,且下包絡線可經由^接 〜輸入信號冲)的局部最小值利用三次樣條插值法確定的所 :輸入信號雜所有值可能介於該上包絡線與該 其後,該上包絡線和下包絡線的平均值可被計算。隨 =過從輸入##“⑺中減去該平均值計算出第 六ι(〇,如等式(10)所示: 里 冲),),⑽ =果該^ -分量喻不騎上述ΙΜρ 作_被_到_足=
Cl⑺減去後可獲 /-旦獲得了該第-IMP ClW,將該第一 得一餘數〜⑺’如等式(11)所示: 21 .(11). 1333643 號二^作可利用該餘;T為新的輪入信 疋而獲得第二IMF G(0和一餘數。 單:數值或者是 數,則上述IMF $咸法或根本值的單週期函 ί 的絲,該輸人剛柯由複數個從 和最終餘數〜(〇之和表示,如等式(12 )所示: Μ ...(12) <’) = £cw(,) + &w m=〇 料缝之和。 最終餘數〜(0可反映該輸 第十巴為利用EMD方法分解一斤始輸入作辨雜;^ μ丄 =⑽r圖,在-取^;:: 期中,從原_取出操作的後 目前餘數&之間的標準 SD = IΣ t=o V-i) (Q~^(〇l ^i(fe-n (^) ..(13). u可被視 為^^準差SD小於參考值’例如〇_3 ’則目前餘數h 22 ..(14) 爾伯其特中變表示暫態振幅,表示暫態相位,以及邱表示希 量和作-為虛 =:=號:輸入信號爾換為-由-實分 財目簡義,_獲得為時 g 將詳細描述第四圖中所示判定單元⑵如何進行心甘 Ρ-輸入h號分解所得的複數個被分疋 由, 數個編碼單元中的哪個編碼單元進行編碼。 #b疋由複 個ΐίίη122可欺H躺神—音親碼財的哪 可ί域更ΐ效地編碼。換言之,該判定單元m 碼的被分割信號,也可決定用第-至第二馬; 信號。胃頻柄裔編碼’能夠由音頻編碼器高效編碼的被分割 心I。面細描_判定單元122如何狀語音編碼器和音頻 、,扁碼盗中㈣個可以更有效麟—被分魏舰行編碼。、 该判定單元122可檢測-被分割信號的變化,並在 :rti值時確定該被分割信號由-語音編碼== 比由曰頻編碼器編碼更有效。 另一種情況是,該欺單元122可檢測包含於—被分割信號中 23 1333643 聰敎於預定參考值時確定^ g頻、,扁碼㈣行編碼可比由—語音鱗器編碼更 日召第第+十-一圖圖為-第^圖所示七判定單元122的一實施例的方塊圖。灸 圖’一判疋早凡包含—語音編碼/解竭單元500、—第1 濾波器組510、一第二濾波器組52〇、一判定單 理聲學模型單元540。 3〇、以及一心 如第十-®所示判定單元可判定語音編碼器和音頻 的哪-個能触有效地對各個被分聽號進行編碼。、’、、為中 參照第十一圖’一輸入信號由該語音編碼/解碼單元· 編碼號_語音編碼/解碼單元_解^,彳^ ’ 原始輸入“號。該語音編碼/解碼單元5〇〇可包含一 ^出 〒頻(AMR-WB)語音編碼器/解碼器,且該自適 ^祖··)語音編碼器/解碼器可具有碼激勵線性 輸入信號可在被輸入到該語音編碼/解碼單元5〇〇 復出碼/解瑪單元5。。輸出的信號可被上採樣,從而ί §亥輸入#號可被該第一濾波器組51〇進行頻率轉換。 由該語音編碼/解碼單元500輸出的信號被該第二 520轉換為時域信號。該第一濾波器組 ^ 。冱 TSo一ct其中的信號執行餘賴換,例如修正 由m波器組51〇輸出的該原始輸入信號的 弟二渡波器組520輪出的恢復的輸入信號的 ^定;元530。根據輸入其中的頻率分量,g 疋早兀530可判定語音編碼器和音顆編碼器中的哪—個可更^ 24 1333643 地對該輸入信號編碼。 等ίΓιΓ)地i 人其中的頻率分量,該敬單元530可利用 頻率分量的感知滴作·以判定語音編碼器ί 曰頻、.扁碼”中的哪-個可更有效地對該輸人錢編碼。u
Jhighii) = _Σ NU) where NU)
=< 0 f i〇g2 2 nintf £1/)^ Λ + 1 、 V V ^ J J ,Ο o,x(J)^ 〇 數 結束頻率指標 ί旦中化的雜,)表示該解分量的指標,^ ,二及々m V"個返回與其變數最接近的整數值的函 胳i=)細/刀別表示比例因數頻帶的開始頻率指標和 該判,單元53〇利用等式(ls〕可計算出計算原始輸入 以的輸入信號的頻率分量的感知熵r並: ㈣頻編碼財的哪—個可更有效 輸入仏虎的頻率分1的感知熵,則該判定單元53()可 信號由音頻編碼器進行編碼比語音編碼器編碼更有效。 面’如果恢復的輸人信號的解分量的感知熵小料 的頻率分量的感知熵,則該判定單元53〇 拎乂广二: 音編碼器進行編碼比音頻編碼器編碼更有效輪人 第十二圖為第—圖中所示第—編碼單元2ι 220其中之一的實施例的方塊圖。第十二圖所示‘單 25 1333643 語音編碼器。 ’ 其包含—練_分析單元 單元《η早》m搜索單編、,對_ 該線性預測分析單元600利 行線性預測分析。如=獲r= 線性預測分析單元-心 係數。對線性預測 轉換為二。該量化單元640對該^==_預測係數 的力:權語音信號域對開環基音ii行預:?其後利個辦虎框 開環基音設置一諧振峰雜訊整形_ ^ 該預估的 ^形_^振峰雜 回應。該脈衝響應可用於產生二目標以用慮 該 iSSSiSSSB: 26 1333643 基音週期和基音渡波器的増益。為了簡化閉環搜索, 該激勵仏说可由一線性預測合成濾波器產生。 固定碼本結構基於交又單脈_顺計鍵立。—碼本向量包 固弋置’其中64個脈衝分別位於這64個位置且劃分為4 二軌fit16個位置。狀數量的脈衝可根據傳輸速 轨道上。由於碼本索引指示轨道位置 ίϊίϊ 因無需存儲碼本,且激勵信號可僅利用碼本索 5丨而屋生。 π如if: ㈣音編碼1可在—_域撕上述編碼過 =外’如果輸入信號由第一圖中所示分類模組1〇〇利用線性 預測編碼方法編碼,該線性預測分析單元600為可選的。 _ 明不限於針二圖巾所示的語音編碼[換言之, 發㈣碼語音㈣㈣變語音編碼 中所示第—編碼單元加至第m編碼單元 為-音㈣侧方翻。料三騎示編碼單元可 學模 碼單^ 该濾波器組700將輸入信號轉換為頻域信 可對輸入信號執行餘弦變換,例如,修正離^弦=== 該心理聲學模型單元710計算輪入俨缺沾抵— 蔽率S勝該量化單元72〇利用由該心^學模 化』化失真最小 第十三圖所示音賴碼器可在頻_執行上述編碼過程。 27 1333643 ,η被分割信號,並判定使用複數個編碼單元23〇、2 繊單元糊,谢贿_各 、參照第十四圖,編碼單元23〇、、25〇、綱和27 =別對該第-至第η被分割信號進行編碼。此外,如果該f 號被劃分為複數個頻帶信號’這些頻帶信號可以 ^ : 到最高頻帶信號的順序被編碼。 -頻帶L嬈 胸1^1皮=信號被依序編碼時,前一信號的編碼錯誤可被用於 ί=ϊί;ί;ί=編不同的編碼方法對 縮^刀北破進订編碼’從而防止信號失真並提㈣寬的可伸 碼===分割信號編碼,解 信號之間向編碼單元=5在:二 ^元'輸出的錯誤對第二被分割信號進行編== 被为割信號的編碼錯誤情況下被編碼。因此 的 的編碼並提高聲音品質。 负』此貫現無玦碼 第十四圖所示的編碼裝置可通過反向執行 帽示編碼裝置所執行的操作恢復來自輸^四圖 第十五圖為本發明一實施例的解碼裝 圖,該解辦置轉—低姑馳 810、一解碼模組820、以及-合成模組83〇。解瑪-判疋模組 該位元拆包模組800自一輸入位元流中取屮— 碼的信號以及解碼該經編碼信號所需的附I資^氧夕個絰編 該解碼模組820包含複數個執行不同解 元821至第瓜解碼單元奶。丁州解碼方法的第-解媽單 29 1333643 該解碼器判定模組810判定第一解碼¥元821 〇〇 元822中的哪個解碼單元,可最有效地對這些麫 m解碼單 解碼。該解碼器判定模組8 i 〇可利用與第一圖中 j彳^虎進行 類似的方法,來判定該第一解碼單元奶至帛功下J類!f組100 中的單元,可最有_碰、_ = 碼。換言之,該解碼器判定模㈣10基於各個ϋ虎進订解 判定第-解碼單元821至第㈣碼單元822中 可最有效地對這些經編碼的信號進行解碼。理相 碼單兀’ 器判定模組_能夠基於自該輸入位元流中取出該解碼 =訊’以及表示用於解瑪該經編碼信號二單 == 生該1ί編S 附加資訊識別出用於產 定單元可為=二;編= 第Π1解碼單元822中選擇一語音自成第-解碼早兀821至 或者,該解碼器判定單元 碼-經編碼信號的解碼單元,並; 30 1333643 兀821至第m解碼單元822中選擇一解碼★元對應於該被識 解碼单元。 1判定單元_可從鞠加資讀得_經編碼信 號,並自該第-解碼單元防至第m解碼單元a2中選擇 該經編碼信號具有相同特徵的信舰行解碼的 - ^該輸入位元流中取出的各經編碼信號由該第 組㈣合成,彳碼。轉碼的信號被合成模 如 議關分資糊 r可細解卿 提:的這些經解瑪的信镜進行合ί:= =轉換或疋對这些經解碼信號中的一些或全部信號進行其他^ 號以f中之-可對合成的信 操作的逆過程。可從該輸人位元流中轉的=理 操作的資訊和用於執行後處理操作的編疋否執饤後處理 參照第十六圖’該第一合成單元83 人、《„一 之-(特別是,-第二合成單元833) 二:成單70 832其中 器834至第n後處理器835。該^ ϋ複數個第一後處理 碼的信號合成為-個單―錄,且該 31 1333643 ^理器835其中之-對該經由合成獲得的單一信號執行後處理操 ,該輸入位元流中可包含指示由該第一後處理器83 哪個後處理器對經合成獲得^ 該第一合成單元831至第n合成單元832其中之一 中取出的線性預難數可對該經合成獲得的該匕, 唬執行線性預測編碼,從而恢復出原始信號。 ^早t ,發明可被加程式化而在一電腦上執行,並可被儲 =取記錄媒體中。其中電腦可讀取記錄媒體包 用= 可為-電腦系統讀取之資料的儲存單元類型,=以儲存 、隨機存取記憶體(_、光碟唯讀記°^己=體 軟碟及光學資料儲存私為代表,且其亦 路傳輸)的單元。電腦可讀取記錄媒體相對 散;=行 摘妹柄射林發批蝴技術 [產業利用性] 如上所述,本發明之編碼/解碼方法及 數筆媒體資料的多媒體播放H或多媒體編^ ^廣,於複製複 理及傳輸多媒體資料的時間。 、〜、、'、,精以縮短處 本發明已被描述如上, 且該等變體械被視為在本發種變體出現’ =熟習_技術者齡閱本,該等 屬於下述申請專利範_範_。仟之讀♦當被視為 32 【圖式簡單說明】 第一圖為根據本發明-實施例的1臂置的方塊圖; 第二圖為第-圖中所示的分類模組的—實施例的方塊圖; ,三圖為第二圖中所示的預處理器單元的—實施例的方塊圖; 的f 本剌—實施儀—·計算輸人信號感知滴 =五圖為第®中所不的分麵另實施綱方塊圖; 第六圖為第五圖中所示的信號劃分單元的—實施例的方塊圖; 被^實麵—合併複數個 圖 第九圖為紅圖中所_信_分單元的另-實施例的方塊 咖㈣膚劃分為 第卜圖為第五圖中所示的判定單元的另—實施例的方塊圖; ★ ®為第目巾所示的編《馬單元的另-實施例的方塊圖; ^十四圖為根據本發明另-實施例的-編碼裝置的方塊圖; 第十五圖為根據本發明另一實施例的一解碼裝置的方塊圖; 第十”圖為第十五圖巾所示的合成單元的—實施例的方塊圖。 【主要元件符號說明】 1 ......與自主性機器人互動之裝置 2 ......自主性機器人 100…分類模組 33 1333643 200......編碼模組 300......位元打包模組 400.. ....心理聲學模型模組 111〜112..預處理器 110〜120..分類單元 210〜220、230、240、250、260、270...編碼單元 113.. ....係數取出器 114.. ....餘數取出器 115 ......濾波器組
116 ......線性預測單元 117……心理聲學模型單元 118.. ....第一位元計算單元 119……第二位元計算單元 121.. ....信號劃分單元
122.. ....判定單元 123……分割器 124……合併器 125……第一分割器 126……第二分割器 127……第三分割器 500......語音編碼/解碼單元 510……第一濾波器組 520……第二濾波器組 530……判定單元 540.. ....心理聲學模型單元 600.. ....線性預測分析單元 610……基音預估單元 620......瑪本搜索單元 630......線譜對單元 34 1333643 640......量化單元 700......濾波器組 710.. ....心理聲學模型單元 720......量化單元 800......位元拆包模組 810.. ....解碼器判定模組 820......解碼模組 830.. ....合成模組 821〜822...解碼單元 831〜832、833...合成單元 834〜835...後處理器
35

Claims (1)

  1. 十、申請專利範圍: 1 · 一種用於解碼信號之方法,包括·· 接收包括音頻錢和語音賴至少射之—驗號,與識別 解蝎模式以解碼該信號的解瑪單元資訊;以及 根據所述解解元資纖騎應的解碼模式,解碼所述信 ”中所述解碼模式包括言吾音解碼模式和音頻解碼模式;以及 鲁 其中所述語音解碼模式使用線性預測編碼(LPC)係數,而 音頻解碼模式使用濾波器組。 2·依據申凊專利範圍第J項所述的用於解碼信號之方法,其 中所述語音解石馬模式在每一訊號框中使用Lpc係數。 3.依據申請專利範圍第j項所述的用於解碼信號之方法, 其中所述信號包括複數頻帶信號。 4·依據申請專利範圍第3項所述的用於解碼信號之方法, φ 其中所述頻帶是可變的。 5.依據申請專利範圍第1項所述_於解喝信號之方法, 其中所述語音解碼模式在時域内解碼信號,所述音頻解碼模式在 頻域内解碼信號。 6, 依射請專利範圍第丨項所述的用於解碼信號之方法, 其中在所述接收之前,該解碼模式根據每—信號的變化量以及每 一信號的音調而確定。 7. -種用於解碼信號之裝置,包括: 36 1333643 月?日修正替換頁 ,位元拆包餘,取岭括音頻健和語音斯^77 -的信號’與識麟碼模如解碼該錢的解碼單元資訊; /解碼器判定模組’根據所述解碼單元資訊,判定解碼模 式;>乂及 ’馬模組,根據所述解碼單元資訊依據對應的解碼模式, 解碼所述信號·’ 其中所述解碼模組包括-語音解碼器,依據一語音解碼模式 解碼該信號’以及-音頻解碼器’依據—音頻解碼模式解碼該信 號;以及 其中所述語音解碼器使用LPC係數’而音頻解碼器使用遽波 器組。 8.根财請專概圍第7項所述_於解碼信號之裝置, 其中所述居音解碼模組在每一訊號框中使用Lj>c係數。 9·根據申請專利範圍第7項所述的用於解碼信號之裴置, 其中所述語音解碼模組在時_解碼錢,音頻解碼模組在頻域 内解碼信號。 10.根據申請專利範圍第7項所述的用於解碼信號之裝 置,其中所述解碼模組包括—語音解碼器和—音頻解碼器,若該 信號較綠翻化,職解補_賴錢由語音解碼器進行 解碼,若該信號不易被模型化,則該解碼模組續定該信號由音頻 解碼器進行解碼。 37 1-333643
    11. 一種用於編碼信號之方法,包括: 接收包括音頻信號和語音信號至少其中之—的—輪入信號; 依據該輸人信號的概,確定該輸人錢的編碼方法;以及 根據該輸人信號的該編碼方法,產生識別解碼模式以解碼該 信號的解碼單元資訊; 其中所述解碼單元資訊包括使用Lpc餘的語音解碼模 式’以及使用^理聲學模型錢波敎的音頻解碼模式。 I2·依據t請專利範圍第u項所韻用於編瑪信號之方 法’其中根魏輸人信號的變化量和該輸人信號的音調,確定該 輸入信號的該編碼方法。 13· —種用於編碼信號之裝置,包括·· -分麵組’依據輸人信號的特徵,奴輸人信號的編碼方 法;以及 一編碼模組,包括: 一語音編碼器,使用LPC分析,編碼該輸入信號. 一音頻編碼器,使用心理聲學模型與濾波器組,編碼該 輸入信號;以及 其中該編碼模組,根據該輸入信號的編碼方法, 度王1¾別解 碼模式以解碼該信號的解碼單元資訊, 一位元打包模組,產生一位元流’包括所述編碼模組的輪出。 14.依據申請專利範圍第13項所述的用於編碼信號之裝 38 1333643
    1 置,其中所述分類模組根據該輸入信號的受化量 音調,確定該輸入信號的編碼方法。 月?日修正替 和該輸入信號的 15. -種電腦可讀記錄媒介,其具有用以執行所述申請專利 範圍第1項至第6項中任-項解碼方法或是申請專利範圍第月_ 和第12項中任一項編碼方法的程式。
    39
TW096102003A 2006-01-18 2007-01-18 Apparatus and method for encoding and decoding signal TWI333643B (en)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US75962206P 2006-01-18 2006-01-18
US79778206P 2006-05-03 2006-05-03
US81792606P 2006-06-29 2006-06-29
US84451006P 2006-09-13 2006-09-13
US84821706P 2006-09-29 2006-09-29
US86082206P 2006-11-24 2006-11-24

Publications (2)

Publication Number Publication Date
TW200746051A TW200746051A (en) 2007-12-16
TWI333643B true TWI333643B (en) 2010-11-21

Family

ID=38287837

Family Applications (3)

Application Number Title Priority Date Filing Date
TW096102004A TWI318397B (en) 2006-01-18 2007-01-18 Apparatus and method for encoding and decoding signal
TW096102002A TW200737738A (en) 2006-01-18 2007-01-18 Apparatus and method for encoding and decoding signal
TW096102003A TWI333643B (en) 2006-01-18 2007-01-18 Apparatus and method for encoding and decoding signal

Family Applications Before (2)

Application Number Title Priority Date Filing Date
TW096102004A TWI318397B (en) 2006-01-18 2007-01-18 Apparatus and method for encoding and decoding signal
TW096102002A TW200737738A (en) 2006-01-18 2007-01-18 Apparatus and method for encoding and decoding signal

Country Status (10)

Country Link
US (3) US20090222261A1 (zh)
EP (3) EP1989702A4 (zh)
JP (3) JP2009524100A (zh)
KR (3) KR20080097178A (zh)
AU (1) AU2007206167B8 (zh)
BR (1) BRPI0707135A2 (zh)
CA (1) CA2636493A1 (zh)
MX (1) MX2008009088A (zh)
TW (3) TWI318397B (zh)
WO (3) WO2007083931A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
TWI488177B (zh) * 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 使用頻譜域雜訊整形之基於線性預測的編碼方案
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
TWI768674B (zh) * 2021-01-22 2022-06-21 宏碁股份有限公司 諧振峰強化的語音編碼裝置及語音編碼方法

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007003187A1 (de) * 2007-01-22 2008-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines zu sendenden Signals oder eines decodierten Signals
US7908103B2 (en) * 2007-05-21 2011-03-15 Nilanjan Senroy System and methods for determining masking signals for applying empirical mode decomposition (EMD) and for demodulating intrinsic mode functions obtained from application of EMD
GB2454208A (en) * 2007-10-31 2009-05-06 Cambridge Silicon Radio Ltd Compression using a perceptual model and a signal-to-mask ratio (SMR) parameter tuned based on target bitrate and previously encoded data
CN101868821B (zh) 2007-11-21 2015-09-23 Lg电子株式会社 用于处理信号的方法和装置
EP2258111A4 (en) * 2008-03-28 2014-01-22 Thomson Licensing APPARATUS AND METHOD FOR DECODING SIGNALS
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
KR101261677B1 (ko) * 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
CN102177426B (zh) * 2008-10-08 2014-11-05 弗兰霍菲尔运输应用研究公司 多分辨率切换音频编码/解码方案
CN101763856B (zh) 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码系统
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
JP5358270B2 (ja) * 2009-04-28 2013-12-04 パナソニック株式会社 デジタル信号再生装置及びデジタル信号圧縮装置
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
ES2797525T3 (es) * 2009-10-15 2020-12-02 Voiceage Corp Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
WO2012000882A1 (en) 2010-07-02 2012-01-05 Dolby International Ab Selective bass post filter
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US8660848B1 (en) * 2010-08-20 2014-02-25 Worcester Polytechnic Institute Methods and systems for detection from and analysis of physical signals
US20120095729A1 (en) * 2010-10-14 2012-04-19 Electronics And Telecommunications Research Institute Known information compression apparatus and method for separating sound source
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
PL2676264T3 (pl) 2011-02-14 2015-06-30 Fraunhofer Ges Forschung Koder audio estymujący szum tła podczas faz aktywnych
TWI492615B (zh) * 2011-05-23 2015-07-11 Nat Univ Chung Hsing 改良向量量化編碼還原影像品質與快速編碼簿訓練方法、壓縮方法、解壓縮方法及其程式產品
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
EP2724340B1 (en) * 2011-07-07 2019-05-15 Nuance Communications, Inc. Single channel suppression of impulsive interferences in noisy speech signals
CN104040624B (zh) * 2011-11-03 2017-03-01 沃伊斯亚吉公司 改善低速率码激励线性预测解码器的非语音内容
KR20130093783A (ko) * 2011-12-30 2013-08-23 한국전자통신연구원 오디오 객체 전송 장치 및 방법
BR112013026452B1 (pt) * 2012-01-20 2021-02-17 Fraunhofer-Gellschaft Zur Förderung Der Angewandten Forschung E.V. aparelho e método para codificação e decodificação de áudio empregando substituição sinusoidal
GB201201230D0 (en) * 2012-01-25 2012-03-07 Univ Delft Tech Adaptive multi-dimensional data decomposition
CN105469805B (zh) 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
EP2830062B1 (en) * 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
CN110706715B (zh) * 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
CN103839551A (zh) * 2012-11-22 2014-06-04 鸿富锦精密工业(深圳)有限公司 音频处理系统与音频处理方法
CN104112451B (zh) * 2013-04-18 2017-07-28 华为技术有限公司 一种选择编码模式的方法及装置
CN106448688B (zh) 2014-07-28 2019-11-05 华为技术有限公司 音频编码方法及相关装置
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
US20170201356A1 (en) * 2016-01-08 2017-07-13 Rohde & Schwarz Gmbh & Co. Kg Method and apparatus for expanding a message coverage
CN107316649B (zh) * 2017-05-15 2020-11-20 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法及装置
BR112020004909A2 (pt) * 2017-09-20 2020-09-15 Voiceage Corporation método e dispositivo para distribuir, de forma eficiente, um bit-budget em um codec celp
EP3723372A4 (en) * 2018-09-05 2021-03-31 LG Electronics Inc. VIDEO SIGNAL CODING / DECODING PROCESS AND ASSOCIATED EQUIPMENT
US20220232255A1 (en) * 2019-05-30 2022-07-21 Sharp Kabushiki Kaisha Image decoding apparatus
EP3751567B1 (en) * 2019-06-10 2022-01-26 Axis AB A method, a computer program, an encoder and a monitoring device
KR20210003507A (ko) 2019-07-02 2021-01-12 한국전자통신연구원 오디오 코딩을 위한 잔차 신호 처리 방법 및 오디오 처리 장치
CN110489606B (zh) * 2019-07-31 2023-06-06 云南师范大学 一种分组Hilbert编码和解码方法
CN112155523B (zh) * 2020-09-27 2022-09-16 太原理工大学 一种基于模态能量主成分比量化的脉搏信号特征提取与分类方法
EP4327324A1 (en) 2021-07-08 2024-02-28 Boomcloud 360, Inc. Colorless generation of elevation perceptual cues using all-pass filter networks

Family Cites Families (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US714559A (en) * 1902-06-10 1902-11-25 John Byrne Railway-tie.
US5235623A (en) * 1989-11-14 1993-08-10 Nec Corporation Adaptive transform coding by selecting optimum block lengths according to variatons between successive blocks
FR2674710B1 (fr) * 1991-03-27 1994-11-04 France Telecom Procede et systeme de traitement des preechos d'un signal audio-numerique code par transformee frequentielle.
JPH05158495A (ja) * 1991-05-07 1993-06-25 Fujitsu Ltd 音声符号化伝送装置
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
KR100287494B1 (ko) * 1993-06-30 2001-04-16 이데이 노부유끼 디지탈신호의부호화방법및장치,복호화방법및장치와부호화시킨신호의기록매체
JP3277677B2 (ja) * 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5751903A (en) * 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
JP3977426B2 (ja) * 1996-04-18 2007-09-19 ノキア コーポレイション ビデオデータ用エンコーダ及びデコーダ
US5881053A (en) * 1996-09-13 1999-03-09 Qualcomm Incorporated Method for a wireless communications channel
JP3849210B2 (ja) * 1996-09-24 2006-11-22 ヤマハ株式会社 音声符号化復号方式
US6148282A (en) * 1997-01-02 2000-11-14 Texas Instruments Incorporated Multimodal code-excited linear prediction (CELP) coder and method using peakiness measure
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
CN1145925C (zh) * 1997-07-11 2004-04-14 皇家菲利浦电子有限公司 具有改进语音编码器和解码器的发射机
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
EP0907258B1 (en) * 1997-10-03 2007-01-03 Matsushita Electric Industrial Co., Ltd. Audio signal compression, speech signal compression and speech recognition
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6493385B1 (en) * 1997-10-23 2002-12-10 Mitsubishi Denki Kabushiki Kaisha Image encoding method, image encoder, image decoding method, and image decoder
US6418147B1 (en) * 1998-01-21 2002-07-09 Globalstar Lp Multiple vocoder mobile satellite telephone system
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
JP4618823B2 (ja) * 1998-10-22 2011-01-26 ソニー株式会社 信号符号化装置及び方法
US6300888B1 (en) * 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
US6278972B1 (en) * 1999-01-04 2001-08-21 Qualcomm Incorporated System and method for segmentation and recognition of speech signals
US6278982B1 (en) * 1999-04-21 2001-08-21 Lava Trading Inc. Securities trading system for consolidation of trading on multiple ECNS and electronic exchanges
US6549147B1 (en) * 1999-05-21 2003-04-15 Nippon Telegraph And Telephone Corporation Methods, apparatuses and recorded medium for reversible encoding and decoding
JP4438127B2 (ja) * 1999-06-18 2010-03-24 ソニー株式会社 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
KR20010080476A (ko) * 1999-09-20 2001-08-22 요트.게.아. 롤페즈 오디오 신호를 정정하기 위한 처리 회로, 수신기, 통신시스템, 이동 장치 및 이에 관련된 방법
US7054809B1 (en) * 1999-09-22 2006-05-30 Mindspeed Technologies, Inc. Rate selection method for selectable mode vocoder
US6697776B1 (en) * 2000-07-31 2004-02-24 Mindspeed Technologies, Inc. Dynamic signal detector system and method
US6373411B1 (en) * 2000-08-31 2002-04-16 Agere Systems Guardian Corp. Method and apparatus for performing variable-size vector entropy coding
US6760698B2 (en) * 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
JP3557164B2 (ja) * 2000-09-18 2004-08-25 日本電信電話株式会社 オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US6862558B2 (en) * 2001-02-14 2005-03-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Empirical mode decomposition for analyzing acoustical signals
US6996522B2 (en) * 2001-03-13 2006-02-07 Industrial Technology Research Institute Celp-Based speech coding for fine grain scalability by altering sub-frame pitch-pulse
ES2266481T3 (es) * 2001-04-18 2007-03-01 Koninklijke Philips Electronics N.V. Codificacion de audio con encriptacion parcial.
US6820054B2 (en) * 2001-05-07 2004-11-16 Intel Corporation Audio signal processing for speech communication
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
KR100434275B1 (ko) * 2001-07-23 2004-06-05 엘지전자 주식회사 패킷 변환 장치 및 그를 이용한 패킷 변환 방법
KR100460109B1 (ko) * 2001-09-19 2004-12-03 엘지전자 주식회사 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
US6785645B2 (en) * 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
EP1466320B1 (en) * 2001-11-30 2007-02-07 Koninklijke Philips Electronics N.V. Signal coding
TW564400B (en) * 2001-12-25 2003-12-01 Univ Nat Cheng Kung Speech coding/decoding method and speech coder/decoder
US6647366B2 (en) * 2001-12-28 2003-11-11 Microsoft Corporation Rate control strategies for speech and music coding
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
WO2004008437A2 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US7970606B2 (en) * 2002-11-13 2011-06-28 Digital Voice Systems, Inc. Interoperable vocoder
KR100604032B1 (ko) * 2003-01-08 2006-07-24 엘지전자 주식회사 복수 코덱을 지원하는 장치와 방법
KR100621076B1 (ko) * 2003-05-02 2006-09-08 삼성전자주식회사 마이크로폰 어레이 방법 및 시스템 및 이를 이용한 음성인식 방법 및 장치
WO2004107318A1 (en) * 2003-05-27 2004-12-09 Koninklijke Philips Electronics N.V. Audio coding
US20050159942A1 (en) * 2004-01-15 2005-07-21 Manoj Singhal Classification of speech and music using linear predictive coding coefficients
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
FI118834B (fi) * 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
JP5032977B2 (ja) * 2004-04-05 2012-09-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネル・エンコーダ
WO2005099243A1 (ja) * 2004-04-09 2005-10-20 Nec Corporation 音声通信方法及び装置
GB0408856D0 (en) * 2004-04-21 2004-05-26 Nokia Corp Signal encoding
CA2566368A1 (en) * 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
US7739120B2 (en) * 2004-05-17 2010-06-15 Nokia Corporation Selection of coding models for encoding an audio signal
ATE371926T1 (de) * 2004-05-17 2007-09-15 Nokia Corp Audiocodierung mit verschiedenen codierungsmodellen
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US7873515B2 (en) * 2004-11-23 2011-01-18 Stmicroelectronics Asia Pacific Pte. Ltd. System and method for error reconstruction of streaming audio information
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US7196641B2 (en) * 2005-04-26 2007-03-27 Gen Dow Huang System and method for audio data compression and decompression using discrete wavelet transform (DWT)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
TWI488177B (zh) * 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 使用頻譜域雜訊整形之基於線性預測的編碼方案
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
TWI768674B (zh) * 2021-01-22 2022-06-21 宏碁股份有限公司 諧振峰強化的語音編碼裝置及語音編碼方法

Also Published As

Publication number Publication date
AU2007206167B2 (en) 2010-06-10
EP1984911A4 (en) 2012-03-14
WO2007083931A1 (en) 2007-07-26
EP1989703A1 (en) 2008-11-12
KR20080101873A (ko) 2008-11-21
EP1989702A4 (en) 2012-03-14
TWI318397B (en) 2009-12-11
KR20080101872A (ko) 2008-11-21
EP1989703A4 (en) 2012-03-14
US20090281812A1 (en) 2009-11-12
EP1984911A1 (en) 2008-10-29
EP1989702A1 (en) 2008-11-12
AU2007206167A1 (en) 2007-07-26
US20090222261A1 (en) 2009-09-03
JP2009524100A (ja) 2009-06-25
MX2008009088A (es) 2009-01-27
WO2007083933A1 (en) 2007-07-26
US20110057818A1 (en) 2011-03-10
KR20080097178A (ko) 2008-11-04
WO2007083934A1 (en) 2007-07-26
CA2636493A1 (en) 2007-07-26
JP2009524099A (ja) 2009-06-25
TW200737738A (en) 2007-10-01
JP2009524101A (ja) 2009-06-25
BRPI0707135A2 (pt) 2011-04-19
TW200746051A (en) 2007-12-16
AU2007206167B8 (en) 2010-06-24
TW200746052A (en) 2007-12-16

Similar Documents

Publication Publication Date Title
TWI333643B (en) Apparatus and method for encoding and decoding signal
EP2519945B1 (en) Embedded speech and audio coding using a switchable model core
JPH0353300A (ja) 音声符号化装置
EP2625688B1 (en) Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac)
CN104123946A (zh) 用于在与语音信号相关联的包中包含识别符的系统及方法
JPH08123495A (ja) 広帯域音声復元装置
TW463143B (en) Low-bit rate speech encoding method
JPH11327597A (ja) 音声符号化装置及び音声復号化装置
JP2008502022A (ja) オーディオ符号化
JP4008607B2 (ja) 音声符号化/復号化方法
WO2003098603A1 (en) Method and device for code conversion between audio encoding/decoding methods and storage medium thereof
WO2002071394A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
CN104584123B (zh) 解码方法、以及解码装置
EP2087485B1 (en) Multicodebook source -dependent coding and decoding
JP3297749B2 (ja) 符号化方法
JP2615548B2 (ja) 高能率音声符号化方式とその装置
CN101496097A (zh) 用于在与语音信号相关联的包中包含识别符的系统及方法
JPH09127985A (ja) 信号符号化方法及び装置
JPH09127987A (ja) 信号符号化方法及び装置
WO2004040552A1 (ja) トランスコーダ及び符号変換方法
JP3296411B2 (ja) 音声符号化方法および復号化方法
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
KR20120060033A (ko) 분할된 음성 프레임의 디코딩을 위한 음성 디코더 및 그 방법
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3560964B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees