TW200833157A - Method, system, apparatus and computer program product for stereo coding - Google Patents
Method, system, apparatus and computer program product for stereo coding Download PDFInfo
- Publication number
- TW200833157A TW200833157A TW096143530A TW96143530A TW200833157A TW 200833157 A TW200833157 A TW 200833157A TW 096143530 A TW096143530 A TW 096143530A TW 96143530 A TW96143530 A TW 96143530A TW 200833157 A TW200833157 A TW 200833157A
- Authority
- TW
- Taiwan
- Prior art keywords
- threshold
- input signals
- signals
- right input
- energy
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004590 computer program Methods 0.000 title claims abstract description 19
- 230000000873 masking effect Effects 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000004048 modification Effects 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 8
- 230000002146 bilateral effect Effects 0.000 claims 1
- 238000009795 derivation Methods 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 9
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 7
- 206010021403 Illusion Diseases 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 101150103782 thrL gene Proteins 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
200833157 九、發明說明: 【發明所屬之技術領域】 -般來說,本發明之示範具體實施例係關於』 系統,具體…係用於改良-立體聲訊號之編, 【先前技術】 在一聲頻編碼系統中’―輸入時間域聲頻言 縮,從而顯著減少表示該訊號所需要之位元速率 況下’編碼後訊號之位元速率使其能夠滿足傳輪4 束條件或者使所編碼檔案之大小降至最低。前者为 即時通信及串流服務,而在本地料聲頻内容或^ 頻品質下载時,越來越廣泛地應用後者。 通常,該聲頻編碼器致力於以任意即定位元_ 知失真降至最低。但是’位元速率越低1了滿月 元速率及零感知失真而對編碼器提…、 %贝 < 挑戰性也走 一編碼情景係在保持該感知失直 j破聽到之愔分 碼後之檔案大小降至最低。 J ^ 在兩種情況下,均需要應用 v a ‘瑪模剞及來 使終端使用者經歷達到最隹。通當, 、 〆丄旦*比 任意蝙碼系録 效能係由最差情況訊號(即難以被 L 蜗碼之訊號)由 碼)效能決定。決定任意編碼系 〜裳體效能的$ 是編碼速度,以及為獲得即定位元 ’ 疋年所需要之售 所能實現之聲頻品質位準。對於商鞏 门系應用,尤1邊 動應用,編碼速度及記憶體要求通 ^ φ物次著重要角 在獲得較低位元速率而不會影 7 _感知失真之1 頻編碼 條件。 號被壓 理想情 道之约 常用於 以尚聲 率將感 目標位 強。另 下將編 術,以 之整體 之(編 一因素 源或者 對於行 色。 試中, 5 200833157 應當研究及完全利用新的聲頻編碼方法。目前在最新技術 之聲頻編碼中已經廣泛使用的該等方法之一係立體聲訊號 之高效編碼。感知聲頻編碼器在頻率域對輸入訊號進行編 碼,此係因為在頻率域可以最佳的描述人類聽覺特性。該 等頻譜取樣通常係根據頻帶進行量化,該量化器藉由提高 或降低相應量化器步長尺寸來調整量化雜訊之形狀,直至 、 其低於聽覺遮蔽臨限值為止。 _ 一方面,所引入之感知失真是人耳也不能聽到的。另 • 一方面,此限制了最低之可能位元率。由文獻可知,藉由 t間兩側立體聲編碼(Mid-Side,M/S )及強烈立體聲 (Intensity Stereo,IS )編碼可以最佳描述及實施立體聲之 編碼。在中間兩侧立體聲編碼中,左、右(L/R )輸入通 道被轉換為和訊號及差訊號。請參閱j· D· Johnston及A. J. Ferreira的《和差立體聲轉換編碼》,icasSP-92會議記錄, 1992, pp.569-5 72 (下文稱為,,j〇hnston"),其全部内容以引 用的方式併入本文中)。具體來說,中間通道係左、右通道 之平均值,而側通道係兩通道之差除以2。然後選擇通道 組合(即,L/R對M/S ),其為實現零感知失真所需要之位 元數目最少。為為最大編碼效率,這轉換以頻率及時間相 關方式完成。Μ/S立體聲編碼對於高品質、高位元速率立 體聲響編碼尤為有用。 在嘗試獲得較低立體聲位元速率時,IS立體體編碼已 經被與Μ/S編碼結合使用。在is編碼中,該頻率譜之一 部分僅以單通道模式編碼,該立體聲影像係藉由為左、右 6 200833157 帽輸不同縮放因數而重新構建的。(請參閱美國專利第 5,539,829號,其題目為“使用某一合成訊號之子頻帶編碼 數位傳輸系統” ’其於丨996年7月被頒予美國飛利浦公司 (下文稱為《‘‘829號㈣” 〇及美國專利第5屬,618 號’其題目為“使用某合成訊號之子頻帶編碼數位傳輸系 統”,其於1997年2月被頒予美國飛利浦公司箍^ “ ‘618號專利”。),該等每一專利之全部内容以引用: 方式併入本文中)。但是,吾人習知IS立體聲對於低頻率 之效能極差,從而限制了其可使用位元速率範圍。 在低位元速率時(例如’低於i.Sbps),由於缺少可用 位元,所以Μ/S立體聲編碼之使用通常不能保留完整之* 間影像。從一通道向另-通道之頻譜浪漏(也稱為串音: 經常發生。此類降級對於輸出品質有顯著影響。當空間影 像在左、右通道之間不是均句分散時,該降級的影響尤為 嚴重。 因此,需要能夠在-位元速率範圍内改進編瑪。 【發明内容】 一般來說,本發明之示範具體實施例藉由提供一種在 任意既定位元速率實現高立體聲響品質等技術,提供了相 對於習知先前技術之改良。㈣來m,根據示範具體實施 例’當使用中間(Ms )立體聲編瑪(即將左右(L/R)輸 入訊號轉換為中間及兩側(M/S),且在該等兩訊號對之間 進行選擇),在L/R及Μ/S訊號之間進行選擇之前,在根 據該等左、右輸入訊號之間的能量差別做出此判斷之前, 7 200833157 可以進行-修改,以遮蔽臨限值。當該等兩 量位準之P弓七丄 号兩輸入訊號之能 干炙間存在較大差別時,此表示該 感知上比另一诵# φ L ^ ^ 等輪入通道之一在 碼過程中,LV從π 伐應畲被包含在該編 乂獲知最佳可能品質。結果, 一 施例,旦右私, 根據示範具體實 被向上贶之遮蔽臨限值可以 祓门上放大,表示允許存在較大量 到之人Α\ 矾而不會產生可聽 為坪为。較大數量之可允許雜訊 應輸入铺f 遇降低了編碼該相 應輸入通道所需要之位元數目,從而 號詖撰is: & 风巧了該L/R輸入訊 唬破k擇而不是其相應的M/s訊號 等輪入、释的可能性。當該 °號之一在感知方面優於其他通 通道串音之掩s 峰址 、呼,為了限制該 擴展’該等L/R輸入訊號係輪 通常表示為非常煩人的人為部分。此外㈣串音 施例中’在L/R訊號與M/s訊號之間做 丁耗’、體實 JU ^ ^ '4. 出選擇之後,在量 ^等破選擇訊號之前,可以對最終 妗,IV A “ 敬臨限值進一步修 在所期望位元速率及量化器之可 _ 建-較佳匹配。此方法藉由向其他通遒护r 70數目之間創 訊,而提高了在感知上更重要之輸入通、厂更多可允許雜 化器將要爾全 、道之品質。當該量 化器將要用盡位元時,對於感知上次 鈿畎吾仆. 文<輪入訊道會產生 粗略里化,留下更重要之位元用於 ^ ^ 主要通道。 根據一態樣,提供一立體聲編碼方 鲁谂加由 击。在一示範具體 松…:广方法可包含:⑴接收一左輪入訊號及-右 輸=遗,(2)根據各別左輸入訊號及右輪入訊號求出左、 右遮蔽臨限值;以及(3)至少部分根攮盥女 Π刀很蘇與各另左、右輸入 訊號相關之能4之間㈣係,對料左或左遮蔽臨限值之 8
200833157 至少一個進行修改。 在一示範具體實施例中,該方法可進一步包含確定 各別右、右輸入訊號相關聯之能量。與該左輸入訊號或 輸入訊號之一相關聯之通道包含一最大能量,而與該等 他輸入訊號相關聯之通道將包含一最小能量。然後可以 少部分根據該最大能量與該最小能量之比而確定一縮 值。可以將此縮放值與一預定臨限值相比對,當該縮放 越出該預定臨限值時,該方法可更包含修改與包含該最 通道之輸入訊號相關聯的遮蔽臨限值。 根據此示範具體實施例,修改該遮蔽臨限值之步驟 以包含將所求得之遮蔽臨限值乘以一臨限值縮放因數, 縮放因數等於一預定值或該所確定縮放值中之較小值。 在另一示範具體實施例中,該方法可更包含至少部 根據該等左輸入訊號及右輸入訊號確定一中間訊號及一 訊號。在一示範具體實施例中,此可能涉及對該等左輸 訊號及右輸入訊號求平均以確定該中間訊號,且求得該 左、右輸入訊號之間的差值,且將該差值除以 2,以確 該側訊號。於是,該方法可更包含至少部分根據該等左 右遮蔽臨限值,在該等左、右輸入訊號及該等中間、側 入訊號之間進行選擇。在一示範具體實施例中,修改該 遮蔽臨限值或該右遮蔽臨限值之頻率可以在該等兩訊號 之間進行選擇之前執行。在該等兩訊號對之間進行選擇 步驟可包含:至少部分根據該等左、右遮蔽臨限值確定 該等左、右輸入訊號相關聯之一第一合併感知熵;至少 與 右 其 至 放 值 小 可 該 分 側 入 等 定 輸 左 對 之 與 部 9
200833157 分根據該中間及側遮蔽臨限值確定與該等中間及 關聯之一第二合併感知熵;及比對該等第一、第 知熵,以確定哪一個較低。 在再一示範具體實施例中,該方法還可包含 左、右輸入訊號被選擇時,進一步修改至少該等 蔽臨限值至少之一,或者在該等中間及側訊號被 進一步修改該等中間或侧遮蔽臨限值至少之一。 以至少部分根據該等相應遮蔽臨限值而對該等所 行量化。 根據另一態樣,提供一種用於立體聲編碼之 一示範具體實施例中,該設備可包含一編碼器, 用於(1 )接收一左輸入訊號及一右輸入訊號;(: 別左輸入訊號及右輸入訊號求出左、右遮蔽臨限 (3 )至少部分根據與各另左、右輸入訊號相關之 的關係,對該等左或左遮蔽臨限值之至少一個進 根據再一態樣,提供一種設備,其被配置用 體聲編碼。在一示範具體實施例中,該設備可包 接收一左輸入訊號及一右輸入訊號之構件;(2 ) 左輸入訊號及右輸入訊號求出左、右遮蔽臨限值 以及(3 )至少部分根據與各另左、右輸入訊號相 之間的關係,對該等左或左遮蔽臨限值之至少一 改之構件。 根據再一態樣,提供一種用於立體聲編碼之 產品。該電腦程式產品包含至少一電腦可讀儲存 側訊號相 二合併感 :在該等 左、右遮 選擇時, 然後,可 選訊號進 設備。在 其被配置 :)根據各 值;以及 能量之間 ί亍修改。 於執行立 含:(1 ) 根據各別 之構件; 關之能量 個進行修 電腦程式 媒體,其 10
200833157 中儲存有電腦可讀程式碼部分。一示範具體實施 可讀程式碼部分包含:(1 ) 一第一可執行部分, 一左輸入訊號及一右輸入訊號;(2) —第二可執 用於根據各別左輸入訊號及右輸入訊號求出左、 限值;以及(3 ) —第三可執行部分,用於至少部 各另左、右輸入訊號相關之通道,對該等左或左 值之至少一個進行修改。 【實施方式】 下文將參考隨附圖式,更完整地描述本發明 體實施例,其中示出了本發明之部分而非全部 例。事實上,本發明之示範具體實施例可以採用 方式實施,而不應理解為被限制於本文所列方式 等具體實施例係為使本揭示案滿足所適用之法律 同元件符號始終指代相同元件。 概述 一般來說,本發明之示範具體實施例提供了 執行中間兩側(M/S )立體聲編碼之改進技術, 任意位元速率(包含低位元速率)提供改良之立f 根據示範具體實施例,向該編碼過程中添加一附 藉此步驟,在該等訊號對之間進行選擇之前修改 在確定何時使用該中間兩側訊號而不是該等左、 號時,會使用此參數。具體而言,可根據該等兩 之能量之間的關係,修改與該左輸入訊號或該右 相關聯之遮蔽臨限值。舉例而言,當該等左、右 例之電腦 用於接收 行部分, 右遮蔽臨 分根據與 遮蔽臨限 之示範具 具體實施 許多不同 ,提供此 要求。相 一種用於 其能夠以 t聲品質。 加步驟, 一參數, 右輸入訊 輸入訊號 輸入訊 輸入訊號 11 200833157
之最大能量與該等兩訊號之最小能量之比越出一預定臨限 值時,可以縮放與一輸入訊號相關的遮蔽臨限值,該輸入 訊號係具有該等兩訊號之較小能量(即最小能量)之輸入 訊號。此縮放之結果係:當該等輸入訊號之一在感知上比 另一訊號更重要時,該L/R訊號被選擇,而不是其相應之 Μ/S訊號被選擇。由於當該等兩輸入通道之間的通道位準 存在很大差別時,L/R輸入訊號係較佳的,所以此方法係 有益的。此外,根據一示範具體實施例,一旦在該等訊號 對之間進行了選擇,則可進一步修改該等被選訊號之遮蔽 臨限值,同樣係基於該等左、右輸入訊號之能量之間的關 係。此進一步修改改進了所期望位元速率與用於量化之可 用位元數目之間的匹配。具體而言,此具體實施例藉由向 其他通道指派更多可允許雜訊,而提高了在感知上更重要 之輸入通道之品質。當該量化器將要用盡位元時,對於感 知上次要之輸入訊道會產生粗略量化,留下更重要之位元 用於編碼該主要通道。 整體系統及推廣Μ/S立體聲編碼器 現在參考第1圖,其提供一根據本發明之示範具體實 施例‘之整體聲頻編碼及解碼系統的基本方塊圖。如圖所 示,該整體系統可包含一編碼器102 (即,一高階聲頻編 碼(AAC )編碼器,或一具有頻帶複製之增強AAC編碼器 (eAAC+),其被配置用於接收一聲頻訊號101,該編碼器 1 02用於藉由例如下文所述之方式編碼訊號,且經由一通 信通道1 03向一解碼器1 04傳輸編碼後之聲頻訊號。 12
200833157 特定言之,如第2圖所示,其中提供了根據本發明 一示範具體實施例之編碼器1 02之一更詳盡說明,該編 器102可包含左、右時間頻率對映器2〇1L及201R,其 配置用於在時間域各別接收左、右輸入訊號,且使用例 一傅利葉轉換將此等訊號轉換至頻率域。該編碼器1 〇2 更包含一構件,例如一臨限值產生處理元件202,用於 生左、右、中間及兩側遮蔽臨限值thrL、thrR、thrM及thr 所產生之遮蔽臨限值確定了可以被引入每一頻帶而不會 生可聽到之人為部分的允許雜訊,其係基於由該編碼 1 02所接收之左、或聲頻輸入訊號,以及心理聲學模型 所用模型之細節及實施超出了本發明示範具體實施例之 圍,但例如可基於E· Zwicker、H· Fasti之“生理聲學 事實及模型” (Springer-Verlag,,1990年)第4章中所 之模型或者 ISO/IEC JTC1/SC29/WG11 (MPEG-2 AAC), 於移動圖片及相關聲頻之一般編碼、高階聲頻編碼、國 標準 13818-7, ISO/IEC,1997 年。 此外,該編碼器1 〇 2可以包含一構件,例如一轉換 選擇處理元件203’用於將該等左、右輸入訊號轉換為 間及兩側訊號,且用於選擇將要使用哪一訊號組合。具 而言,如上所述’該中間訊號可以藉由平均該等左、右 入訊號來產生,而該兩側訊號可以藉由取得該等兩訊號 差且除以2而產生。一旦產生了該等中間及兩側訊號, 以判斷哪些訊號(即L/R或M/S )要求該最低位元速率 產生該最大編碼增益。如以所詳盡討論,本發明之示範 之 碼 被 如 可 產 s ° 產 器 〇 範 、. 述 用 際 及 中 體 輸 之 可 或 具 13 200833157 體實施例藉由根據該等左、右輸入訊號之能量差來修改由 202所產生之遮蔽臨限值之一,從而改進此判斷過程。藉 由修改該等遮蔽臨限值,在該等兩輸入通道之一在感知上 相對於另一通道占有優勢,則選擇L/R訊號而不是其相應 之Μ/S訊號。 編碼器1 02可更包含一量化器204,其被配置用於量 化該等被選訊號(即該等L/R訊號或Μ/S訊號),以獲得 所期望之位元速率,可更包含一位元串流多工器205,其 被配置用於根據該量化器204之輸出創建一位元串流。熟 習此項技術者將會意識到,該編碼器丨〇2之上述元件之任 一者可包含各種構件,用於根據本發明之示範具體實施例 執行一或多個上述功能,包含在本文中特別示出及描述之 功能。但是應理解,該等一或多個元件可包含替代元件, 用於執行一或多個類似功能,其不會背離本發明之精神及 範圍。如此,該編碼器! 02之該等元件可以包含完全硬體 組件、完全軟體組件,或者硬體、軟體組件之任意組合。 例如,該臨限值產生處理元件202及/或該轉換及選擇處理 元件203可實施於一共用或不同處理元件中,例如,一處 理器、專用積體電路(ASIC )或類似元件。 參考第1圖,在接收到所編碼之訊號時,該解碼器1 〇4 於疋可被配置用於解碼所接收之訊號,以輸出最終之解碼 聲頻訊號101,。如熟習此項技術者所知,任意數目之電子 裝置(例如,行動電話、個人數位助理(P D A )、個人電腦 (PC)等等)可包含上述編碼器102及解竭器1〇4。以實 14
200833157 例說明之,現在參考第3圖’其說明了 一種可包含上 碼器102或解碼器之電子裝置。如上所述,該電 置可以為一行動台1〇’具體而言’係一行動電話。但 當理解,所示出及下文所述之行動台僅說明一種獲益 發明之電子裝置,因此不應被用於限制本發明之範圍 管示出了該行動台10之幾種具體實施例’且將在下文 為實體進行說明,但其他類型之行動台,例如PDA、 器、攜帶型電腦、以及其他類型之電子裝置(包含行 無線裝置及固定、有線裝置)均可很容易地採用本發 具體實施例。 該行動台包含各種構件,用於執行根據本發明之 具體實施例之一或多種功能,包含本文更特定示出及 之功能。但是應理解,該行動台可包含替代構件件, 執行一或多個類似功能,其不會背離本發明之精神 圍。更特定言之’例如,如第3圖所示,除了一天H 之外,該行動台10包含一像輸器304、一接收器306 如處理裝置3 0 8之構件’例如一處理器、控制器或類 件,其用於各別向傳輸器3〇4及接收器3〇6提供訊號 收訊號。此等訊號包含根據該適用行動系統之空氣介 發訊資訊,以及使用者語音及/或使用者產生資料。在 點,該行動台能夠使用一或多種空氣介面標準、通信拓 調變類型及存取類型進行操作。更特定言之,該行動 夠根據眾多第二代(2G)、2.5代及/或第三代(3G) 協定或類似協定之任-者㈣^此外,例#,該行動 述編 子裝 是應 於本 。儘 中作 吟口 動、 明之 示範 描述 用於 及範 ,312 及諸 似構 及接 面的 這一 各定、 台能 通信 台可 15 200833157 以能夠根據許多不同無線聯綱技術之任一者操作,該等技 術包含藍芽、IEEE 802.11 WLAN(或 Wi-Fi® )、IEEE 802.16 WiMAX、超寬頻帶(UWB ),及類似技術。 吾人應可理解,該處理裝置3 08,例如一處理器、控 制器或其他計算裝置,包含實施該行動台之視訊、聲頻及 邏輯功能所需要之電路,且能夠執行程式,用於實施本文 所討論之功能。舉例而言,該處理裝置可以包含各種構件, 如一數位訊號處理器裝置、一微處理器裝置及各種類比轉 數位轉換器、數位轉類比轉換器,及其他支援電路。根據 此等裝置之各別功能,將該行動裝置之控制及訊號處理功 能指派於此等裝置之間。因此,該處理裝置3 08還包含在 調變及傳輸之前進行捲積編碼及交錯訊息及資料之功能。 此處’該處理裝置3 〇8可包含用於執行一或多個軟體應用 程式之功能’該等軟體應用程式可以被儲存於記憶體中。 舉例而言,該控制器可以執行一連接程式,例如,一習知 、綱頁渗j覽器。該連接程式於是可允許該行動台傳輸及接收 綱頁内容’例如根據HTTP及/或無線應用協定(WAP )。 在一示範具體實施例(未示出)中,該處理元件308 可包含以上參考第1圖及第2圖所討論之編碼器1 02及/ 或解碼器104 °或者,該編碼器102及/或解碼器104可以 疋被通t輕接至該處理元件3 〇 8之分離組件。 該仃動台還可以包含諸如一使用者介面之構件,例 如 習知耳機或揚聲器310、一麥克風314、一顯示器 3 1 6所有此等構件均被耦接至該控制器3 0 8。該使用者輸 16 200833157 入介面(允許该行動裝置接 一 较收貝枓)可以包含任意數目允 許該行動裝置接收資料之梦署 之裝置,例如一小鍵盤3 1 8、一館 摸顯示器(未承出)、一表古η,, ^ 啊 (木 麥克風314,或其他輪入裝置❶ 包含一小鐽盤之具體實施例中,兮般 。π γ,該小鍵盤可以包含一習知 數字(0-9 )及相關鍵(#、* ), )夂具他用於%作該行動台 之鍵,且可以包含全套字元备宝細 予兀數予鍵或一組可被啟動以提供 全套字元數字鍵之鍵。儘#去+山 # — 4 ’、 禾不出,該打動台可包含一電 池,例如一振動電池組,用於盔
用於馮刼作該订動台所需要之各 種電路供電,還可以視情況提供作為可摘測輪出之機械振 動0 該行動町以還可以包含諸如記憶體之構件,其例如包 含-用戶識別模組(SIM) 32〇、_可移動用戶識別模組 (R-UIM )(未示出)或類似構件,其通常儲存與一行動用 戶相關之資訊元件。除了 SIM之外,該行動裝置可包含其 他記·憶體。有關這一點,該行動台可包含揮發性記憶體 322,以及其他非揮發性記憶體324,其可以是嵌入式及/ 或可被移除。舉例而言,其他非揮發性記憶體可以是嵌入 式或可移除多媒體兄憶體卡(MMC )、可靠數位(SD)記憶 體卡、記憶體棒、電可抹除可程式化唯讀記憶體、快閃記 憶體、硬碟及類似§己憶體。該記憶體可以儲存任意數量之 資訊及資料,其可被該行動裝置用於實施該行動台之功 月b。例如’該5己憶體可以儲存一識別符,例如一國際行動 設備識別(IMEI)碼、國際行動用戶識別(IMSI)碼、行 動裝置積體服務數位網路(MSISDN )碼或類似識別符, 17 200833157 其可以惟一識別該行動裝置。該記憶體也可以錯存内容。 該記憶體,例如可以儲存一應用程式之電腦程式碼或其他 電腦程式。舉例而言,在本發明之一具體實施例中,該記 憶體可以儲存電腦程式碼,用於執行下文參考第4圖所討 論改進中間兩侧立體聲編碼之步驟。 本發明之示範具體實施例之方法、系統、設備及電腦 程式產品主要結合行動通信應用程式描述。但是應理解, 本發明之具體實施例的方法、系統、設備及電腦程式產品 也可以結合各種其他應用被利用,既可以在行動通信行業 中,也可以行動通信行業之外。例如,本發明之示範具體 實施例之方法、系統、設備及電腦程式產品可以結合有線 及/或無線網路(例如網際網路)應用程式被利用。 中間兩側立體聲編碼之方法 現在參考第4圖,將描述根據本發明之示範具體實施 例之執行M/S立體聲編碼之方法。如圖中所示,該過程在 操作401處開始,其中該左、右時間域輸入訊號心及a 由編碼器102接收。在操作402處,所接收訊號心及i?, 可以被轉換為頻率域訊號1/和Λ/,例如各別由該左、右 時間頻率對映器2〇lL及201R根據公式i轉換:
Lf = F(Lt);及 (j )
Rf^FXRj) 其中F()表示時間至頻率之轉換。 I掉作403處,可以產生中間及兩側頻率域 訊號M/及s , /» ’’例如藉由轉換及選擇處理元件203根據以 18 200833157 下公式產生: 0/ + ;及 (2 )
Sf^ (Lf ~ Rf)/2 根據一示範具體實施例’長度為M之*e i表示 對其執行M/S立體聲編碼之頻帶的界限。理想情況下,此 長度還係遵循人類聽覺系統之關鍵頻帶之界限。
在操作404中’Z/、i?/、A//及5/各自之遮蔽臨限值ί/^η、 及紿以可以根據一心理聲學模型由該頻譜輸入 訊號推導得出’如該臨限值產生處理元件202所表示。如 上文所討論,此模型之細節及實施為熟習此項技術者所習 知。在一示範具體實施例中,可以為該等左、右、中間及/ 或兩侧訊號推導得出公用遮蔽臨限值。或者,對於該等訊 號之每一者或其任意組合,該等遮蔽臨限值可以不同。 根據習知Μ/s立體聲編碼系統,下一步驟係根據既定 訊號之感知熵(即根據目前訊號所需要最小位元數目之估 計,以實現零感知失真)在L/R輸入訊號及Μ/S輸入訊號 之間進行選擇。但是,在低位元速率時,由於用於編碼0/1 及δ/2之可用位元數目很低(即量化後訊號),所以該選 擇及後續量化不能有效地執行。因此,根據本發明之示範 具體實施例,為了顯著改進在所有位元速率之立體聲品 質,在L/R訊號及Μ/S訊鱿之間做出選擇之前,可以由該 轉換及選擇處理元件2〇3,根據該等左、右已接收輸入訊 號之間的能量差別對所推導之遮蔽臨限值進行修改。(操作 405 ) ° 19 200833157 特定言之,令EL及ER各別表示該等左、右輸入訊號 之訊框能量。 ( 3 ) 式中,j代表縮放因子頻帶之索引。 然後可以根據下式對該等輸入遮蔽臨限值之一進行修 改: .
若scale > 2,則執行公式(6 ) ; ( 4 ) 否則,不進行任何操作 式中 务氤3 丨 (5 ) 式中,;?revSca/e在開始時被起始化為零,表示前一訊 號之縮放值,其中MAX及MIN各別代表特定參數之最大 值及最小值。 此外, (6a) 若五厶> £及,貝1J A ; 否則,B 式中 A: thrj0) - thrR(f)' thrScak^ (6b) B:伽敵 =thri(iy thrSmk j S i < Μ 式中,i表示頻譜組之索引,M代表S/60//M/之長度, 或者頻帶之界限(如上所示),且 翻腳fe)| ( 6〇) 20 200833157 換吕之’該等左、右輸入訊號之能量被比對。如果該 等兩能量之比大於一既定臨限值,則具有該等兩能量之較 小者之通道的遮蔽臨限值被縮放。具體而言,可以看出, 根據一不範具體實施例,一 3分貝能量差可以觸發對該等 遮蔽臨限值之一進行修改,以更好地判斷是否應當為該頻 帶啟動M/S(即,是否應當使用Μ/S訊號來代替L/R訊號)。
返回第4圖,在操作4〇6中,最終判斷是否用M/s訊 號替代該L/R訊號。上文曾簡單指出,該判斷是根據該等 各個訊號之感知熵(PE )做出的。感知熵之計算使用所推 導得出之遮蔽臨限值,在前面之操作4〇4中可能對其進行 了修改,也可能未修改。具體而言,對於每一頻譜組所需 要之位元數目估計(即PE)可以計算如下: rmmd
其中’如上文所指示,i及j各別係頻譜組及縮放因數 頻π之索引,:^·代表頻帶j之遮蔽臨限值,k係頻帶j之 寬度,Xj係頻帶j之頻譜值。 於疋選擇給出最小位元數目之訊號組態進行量化,例 如由里化器204進行。此選擇係根據一頻帶完成,每一頻 f被指派一發訊位元,由接收端用於偵測所傳送訊號是否 為中間及兩側訊號而不是左右通道訊號。此資訊於是最終 可被用於將M/S訊號轉換為L/R通道訊號。 該選擇可被執行如下: 21 200833157
〇£i<M
式中 PEm^ /=Θ /=Θ (9)
式中,fLen代表第i個頻帶之長度,且可根據下式 計算: 真綱=#雜神+ 1)-#€Ρ^· (10) 該等訊號可以被量化·· sfiQffmi{i+1% ^Flagiii)^& fl 1 Mj (^b〇0€t{i\^ sjb€^mt{i Φΐ|^ ❹tMrwim otfmrwim
) 對於0Si<M,重複公式11。
換言之,對於每一頻帶,為該等左、右輸入訊號之組 合及中間、兩側訊號之組合計算該感知熵。當該等中間及 兩側訊號之感知熵小於該等左、右訊號之感知熵時(即, 為了獲得零感知失真,該等中間及兩側訊號之目前訊框所 需要之最小位元數目少於該等左、右訊號之目前訊框之最 小位元數目時),則選擇該等中間及兩側訊號進行量化。對 於每一頻帶重複此過程。注意,該感知熵係該等遮蔽臨限 22 200833157 值之函數,其係在操作404中推導復& 守评出,名:¾:此 在操作405中對其進行了修改。 隹杲二 一在選擇了用於量化之訊號之後,在_4。7 -不範具體實施例’可以再次修改該等遮蔽臨限 所期望位疋速率及量化器之可用數目之間創建 配。具體來說,該修改可執行如下: C, Ε1λ > otherwise^ db—mthing. c 含伽)m 奶伽Smk,
D:fhrUM(r)^thtui.f(φQ<i<M 儀rSmie = MN_,smk) 換§之,如果每取樣之位元數目小於1.5, 次比對該等左、右輸入訊號之能量位準。當該左 置較大時’則可以根據一縮放因數修改右訊號或 之遮蔽臨限值(即在前面操作4〇6中所選擇之訊 右訊號之能量較大時,則可以修改該左訊號或中 遮蔽臨限值。另一方面,如果每一取樣之位元數 1 *5 C即等於或大於1 · 5 ),則可以不對該等遮蔽臨 修改。對於該輸入訊號之每一頻帶重複此過程。 最後,在操作408中,可以由量化器204對 訊號進行量化,以滿足所需要之位元速率,且在 中’由一位元串流多工器205將該量化後訊號轉 元串流。 情況下, 中,根據 值,以在 一最佳匹 bps<\3 otherwim
(12) 則可以再 訊號之能 兩側訊號 號)。當該 間訊號之 目不小於 限值進行 該等所選 操作409 換為一位 23 200833157 結論· 根據上述討論,本發明之千 乃《不祀具體實施例可以改進在 低位元速率時之立體聲影傻會搂 丄 ^1冢重構。當空間影像在左、右輸 入訊號之間不是均勻分散眸,仏% 欢時,此改進尤為明顯。利用本發 明之示範具體實施例,可以读小、s 4 J从减 > 通道之間的串音,從而改 進整體空間影像品質。此外,柄祕一 卜根據示範具體實施例,當該 立體聲内容均勻分散在該等左、+ 左 右通道之間時,能夠保持 該訊號之品質,從而相對於習知紐a $知解決方案不存在效能損失。 如上所述且如熟習此項枯淋 項技術者所理解,本發明之具體 實施例可以被配置為一方法、系 糸統或設備。相應的,本發 明之具體實施例可以包含各鍤播爲 合檀構件,包含全部硬體、全部 軟體或者軟體及硬體之任专址人 ll q▲口。此外,本發明之具體實 施例可以採用一電腦可讀儲在拔碰 貝爾存媒體上之電腦程式產品形 式’在該儲存媒體中已經實施了電腦可讀程式指令(例如, 電腦㈣μ tn之電腦可讀儲存媒體可被利用,包含 硬碟、唯讀光碟、光學儲存梦·々 仔裝置或磁儲存裝置。 前面已經參考各方法、讯供 •又備(即系統)及電腦程式產 品之方塊框及流程圖說明描祕个丄 儿a描述了本發明之示範具體實施 例。應理解,該等方塊圖及流寇 汉,瓜程圖說明中之每一方塊,以 及該等方塊圖及流程圖中久古檢 τ谷方塊之組合可各別由包含電腦 程式^日令之構件實施。此等雷腦兹 寻電职程式指令可以被加載至一 通用電腦、專用電腦或其他可兹彳 、他可程式資料處理設備,以產生 一機器,使得執行於該電腦男盆 电服及其他可程式資料處理設備上 之指令創建一構件,用於眚尬兮广& 於實施該(等)流程圖方塊中所指 24 200833157 等電腦程式指令也可以被儲存於一電腦可讀記憶 可引V-電腦或其他可程式化資料處理設備,其以 方式工作,使得健存於該電腦可讀記憶體之指令產 品,其包含電腦可讀指令,用於實施在肖(等)流 塊中所指定之功能。該等電腦程式指令也可以被加 電腦或其他可程式化資料處理設備中,以在該電腦 可程式化叹備上執行一系列操作步驟,以產生一由 施之過程,使執行於該電腦或其他可程式化設備上 提供步驟’用於實施該(等)流程圖方塊中指定之
定之功 此 體,其 一特定 生一製 程圖方 載於一 或其他 電腦實 之指令 功能。 相應地’方塊圖及流程圖說明之方塊支援構件之組 合’用於執行指定功能;支援步驟之組合,用於執行特定 功能,以及用於執行功能之程式指令構件。還應理解,該 等方塊圖及流程圖說明之每一方塊及該等方塊圖及流程圖 說明之方塊組合可以由基於專用硬體之電腦系統實施,該 電腦系統執行特定功能或步驟,或者專用硬體及電腦指令 之組合。 熟習此項技術者會瞭解本文所列本發明之許多修改及 其他具體實施例,本發明之此等示範具體實施例具有上述 說明及相關圖式中所給出之教導的益處。因此,應當理解 本發明之具體實施例不應侷限於所揭示之特定具體實施 例,更改及其他具體實施例也應包含在隨附申請專利範圍 之内。儘管本文採用了特定術語,但其使用僅係一般及描 25 200833157 述意義,而無意進行限制。 【圖式簡單說明】 前面已經用一般術語描述了本發明之示範具體實施 例,對引用了隨附圖式,該等圖式不一定係按比例繪出, 其中: 第1圖係一編碼及解碼系統之方塊圖,該系統將獲益 於本發明之示範具體實施例; 第2圖係根據本發明之示範具體實施例之一編碼器之
第3圖係一行動台之示範方塊圖,該行動台能夠根據 本發明之一示範具體實施例操作;以及 第4圖係一流程圖,其說明了可用於提供根據本發明 之示範具體實施例之改良中間兩側立體聲編碼之操作。 【主要元件符號說明】
10 行 動 台 101 聲 頻 訊 號 ior 解 碼 聲 頻 訊 號 102 編 碼 器 103 通 信 通 道 104 解 碼 器 210L 左 時 間 頻 率 對 映 器 201R 右 時 間 頻 率 對 映 器 202 臨 限 值 產 生 處 理 元 件 203 轉 換 及 選 擇 處 理 元 件 26 200833157
204 量 化 器 205 位 元 串 流 多 工 器 304 傳 輸 器 306 接 收 器 308 處 理 裝 置 310 耳 機 或 揚 聲 器 312 天 線 314 麥 克 風 316 顯 示 器 318 小 鍵 盤 320 用 戶 識 別 模 組 322 揮 發 性 記 憶 體 324 非揮 發 性 記 憶 體
Claims (1)
- 200833157 十、申請專利範圍: 1· 一種立體聲編碼之方法,該方法包含·· 接收一左輸入訊號及一右輸入訊號; 推導與各別左、右輸入訊號相關聯之左、右遮蔽臨限 值;以及 至少部分根據與各別左、右輸入訊號相關聯之能量之 間的關係,修改該等左或右遮蔽臨限值至少之一者。2.如申請專利範圍第1項所述之方法,更包含: 確定與各別左、右輸入訊號相關聯之能量,其中與該 左或右輸入訊號之一者相關聯之能量包含一最大能量,與 該左或右輸入訊號之另一者相關聯之能量包含一最小能 量; 至少部分根據該最大能量與該最小能量之比而確定一 縮放值; 將該縮放值與一預定臨限值進行比對;以及 如果該縮放值超出該預定臨限值,則修改與包含該最 小能量之輸入訊號相關聯的遮蔽臨限值。 3.如申請專利範圍第2項所述之方法,其中修改該遮蔽臨 限值之步驟包含將所求得之遮蔽臨限值乘以一臨限值縮放 因數(threshold scale),該縮放因數等於一預定值或該所 確定縮放值t之較小值。 28 200833157 4.如申請專利範圍第1項所述之方法,更包含: 至少部分根據該等左、右輪入訊號確定一中間或一兩 側訊號;以及 至少部分根據該等左、右遮蔽臨限值,在該等左、右 輸入訊號及該等中間、兩側訊號之間進行選擇。 5·如申請專利範圍第4項所述之方法,其中在該等左、右 輸入訊號及該等中間與兩側訊號之間做出選擇之前,對該 左或右遮蔽臨限值進行修改。 6·如申請專利範圍第4項或第5項所述之方法,其中在該等 左、右輸入訊號及該等中間及兩側訊號之間進行選擇之步 驟包含: 確定與該等左、右輸入訊號相關聯之一第一合併感知 滴(entropy ),該第一合併感知熵至少部分係基於該等左、 右遮蔽臨限值; 確定與該等中間及兩側訊號相關聯之一第二合併感知 熵,該第二合併感知熵至少部分係基於該等中間及兩側遮 蔽臨限值;以及 比對該等第一、第二合併感知熵,以確定哪一個較低。 7.如申請專利範圍第4項或 中間訊號之步驟包含對該等 中確定該兩側訊號之步驟包 第5項所述之方法,其中確定該 左、右輪入訊號求平均,且其 s取該等左、右輸入訊號之差 29200833157 值,且將該差值除以2。 8·如申請專利範圍第4項或第5項所述之方法,更包含: 其中該等左、右輸入訊號被選擇時,更修改該左或 遮蔽臨限值至少之一者; 其中該等中間及兩側訊號被選擇時,更修改一中間 一兩側遮蔽臨限值至少之一者;以及 部分至少根據該等相應遮蔽臨限值量化該等被選 號0 9. 一種用於立體聲編碼之設備,該設備包含: 一編碼器,其被配置用於: 接收左、右輸入訊號; 推導與各別左、右輸入訊號相關聯之左、右遮 臨限值;以及 至少部分根據與各別左、右輸入訊號相關聯之 量之間的關係,修改該等左或右遮蔽臨限值至少之 者0 10.如申請專利範圍第9項所述之設備,其中該編碼器更 配置用於: 確定與各別左、右輸入訊號相關聯之能量,其中與 左或右輸入訊號之一者相關聯之能量包含一最大能量, 該左或右輸入訊號之另一者相關聯之能量包含一最小 右 或 訊 蔽 能 被 該 與 能 30 200833157 量; 至少部分根據該最大能量與該最小能量之比而確定一 縮放值; 將該縮放值與一預定臨限值比對;以及 如果該縮放值超出該預定臨限值,則修改與包含該最 小能量之輸入訊號相關聯的遮蔽臨限值。11 ·如申請專利範圍第1 0項所述之設備,其中為了修改該遮 蔽臨限值,該編碼器更被配置用於將所求得之遮蔽臨限值 乘以一臨限值縮放因數,該縮放因數等於一預定值或該所 確定縮放值中之較小值。 12.如申請專利範圍第9項所述之設備,其中該編碼器更包 含一轉換及選擇處理元件,其被配置用於: 至少部分根據該等左、右輸入訊號確定一中間或一兩 側訊號;以及 至少部分根據該等左、右遮蔽臨限值,在該等左、右 輸入訊號及該等中間、兩側訊號之間進行選擇。 13.如申請專利範圍第12項所述之設備,其中該編碼器更被 配置用於:在該等左、右輸入訊號及該等中間與兩側訊號 之間做出選擇之前,對該左或右遮蔽臨限值進行修改。 14.如申請專利範圍第12項所述之設備,其中該編碼器更被 31 200833157 配置用於: 其中該等左、右輸入訊號被選擇時,更修改該左或右 遮蔽臨限值至少之一者;以及 其中該等中間及兩側訊號被選擇時,更修改一中間或 一兩侧遮蔽臨限值至少之一者。15.如申請專利範圍第14項之設備,其中該編碼器更包含: 一量化器,其被配置用於部分至少根據該等相應遮蔽 臨限值量化該等被選訊號。 1 6· —種被配置用於執行立體聲編碼之設備,該設備包含: 接收構件,其用於接收一左輸入訊號及一右輸入訊號; 推導構件,其推導與各別左、右輸入訊號相關聯之左、 右遮蔽臨限值;以及 修改構件,其至少部分根據與各別左、右輸入訊號相 關聯之能量之間的關係,修改該等左或右遮蔽臨限值至少 之一者 17·如申請專利範圍第16項所述之設備,更包含: 確定能量構件,其係確定與各別左、右輸入訊號相關 聯之能量,其中與該左或右輸入訊號之一者相關聯之能量 包含一最大能量,與該左或右輸入訊號之另一者相關聯之 能量包含一最小能量; 確定縮放值構件,其係至少部分根據該最大能量與該 32 200833157 最小能量之比而確定_縮放值; 比對構件,其係將該縮放值與一預定臨限值進行比 對;以及 修改遮蔽臨限值構件,其係如果該縮放值超出該預定 臨限值’則修改與包含該最小能量之輸入訊號相關聯的遮 蔽臨限值。1 8 ·如申請專利範圍第〗7項所述之設備,其中用於修改該遮 蔽臨限值之構件包含之乘構件,其係將所求得之遮蔽臨限 值乘以一臨限值縮放因數,該縮放因數等於一預定值或該 所確定縮放值中之較小值。 19·如申請專·利範圍第16項所述之設備,更包含: 確定中間或兩側訊號構件’其係至少部分根據該等 左、右輸入訊號確定一中間或一兩側訊號;以及 選擇構件,其係至少部分根據該等左、右遮蔽臨限值’ 在該等左、右輸入訊號及該等中間、兩側訊號之間進行選 择〇 2〇·如申請專利範圍第19項所述之設備,其中用於修改該左 或右遮蔽臨限值之構件包含修改左或右遮蔽臨限值構件, 其係用於在該等左、右輸入訊號及該中間及兩侧訊號之間 進行選擇之前修改該左或右遮蔽臨限值。 33 200833157 21·如申請專利範圍第19項或第20項所述之設備,其中在該 等左、右輸入訊號及該等中間及兩側訊號之間進行選擇之 構件更包含: 確定第一合併感知熵構件,其係確定與該等左、右輸 入訊號相關聯之一第一合併感知熵,該第一合併感知熵至 少部分係基於該等左、右遮蔽臨限值;確定第二合併感知熵構件,其係確定與該等中間及兩 侧訊號相關聯之一第二合併感知熵,該第二合併感知熵至 少部分係基於該等中間及兩側遮蔽臨限值;以及 比對第一及第二合併感知熵構件,其係比對該等第 一、第二合併感知熵,以確定哪一個較低。 22·如申明專利範圍第19項或第20項所述之設備,更包含·· 一 修改左或右遮蔽臨限值構件至少之一者的構件,其中 § 右輸入訊號被選擇時,用於更修改該左或右遮蔽 臨限值至少之一者; 紙 W叫免帆路限值至少之一者的 中間或 該等中間及兩偏 ^ . t 側訊唬被選擇時,用於更更修改 兩側遮蔽臨限佶 限值至少之—者;以及 篁化構件,甘 化該等被選訊號:、係部分至少根據該等相應遮蔽臨限值量 23·—種用於 產品包含至ϊ 聲編碼之電腦程式產品,其中該電腦程式 電腦可讀儲存媒體,該媒體上已經儲存了 34 200833157 電腦可讀程式碼部分,該電腦可讀程式螞部分包含: 一第一可執行部分,用於接收一左輪入訊號及一右輸 入訊號; 一第二可執行部分,用於推導與各別左、右輸入訊號 相關聯之左、右遮蔽臨限值;以及一第三可執行部分,用於至少部分根據與各別左、右 輸入訊號相關聯之能量之間的關係’修改該等左或右遮蔽 臨限值至少之一者。 24·如申請專利範圍第23項所述之電腦程式產品,更包含: 一第四可執行部分,用於確定與各別左、右輸入訊號 相關聯之能量,其中與該左或右輸入訊號之一者相關聯之 月匕蕙包含一最大能量,與該左或右輸入訊號之另一者相關 聯之能量包含一最小能量; "^第五可執行部分,用於至少部分根據該最大能量與 該最小能量之比而確定一縮放值; 一第六可執行部分,用於將該縮放值與一預定臨限值 進行比對;以及 一第七可執行部分,用於如果該縮放值超出該預定臨 限#娃: & - ’修改與包含該最小能量之輸入訊號相關聯的遮蔽 臨限值。 2_5·如申請專利範圍第24項所述之電腦程式產品,其中該第 〜可執行部分被配置用於將該推導遮蔽臨限值乘以一臨限 35 200833157 值縮放值,該臨限值等於一預定值或所確定縮放值中之 小值。 26.如申請專利範圍第23項所述之電腦程式產品,更包令 一第四可執行部分,用於至少部分根據該等左、右 入訊號確定一中間或一兩側訊號;以及 一第五可執行部分,用於至少部分根據該等左、右 蔽臨限值,在該等左、右輸入訊號及該等中間、兩側訊 之間進行選擇。 27.如申請專利範圍第26項所述之電腦程式產品,其中該 三可執行部分被配置用於:在該第五可執行部分在該 左、右輸入訊號及該等中間與兩側訊號之間做出選擇 前,對該左或右遮蔽臨限值進行修改。 2 8.如申請專利範圍第26項或第27項所述之電腦程式 品,其中該第五可執行部分被配置用於: 確定與該等左、右輸入訊號相關聯之一第一合併感 熵,該第一合併感知熵至少部分係基於該等左、右遮蔽 限值; 確定與該等中間及兩側訊號相關聯之一第二合併感 熵,該第二合併感知熵至少部分係基於該等中間及兩側 蔽臨限值;以及 比對該等第一、第二合併感知熵,以確定哪一個較啦 較輸 遮 號 第 等 之 產 知 臨 知 遮 36200833157 29.如申請專利範圍第26項或第27項所述之電腦 品,更包含: 一第六可執行部分,用於當該等左、右輸入訊 擇時,更修改該左或右遮蔽臨限值至少之一者; 一第七可執行部分,用於在該等中間及兩側訊 擇時修改一中間或一兩側遮蔽臨限值至少之一者; 第八可執行部分,用於至少部分根據該相應遮蔽臨 化該等所選訊號。 程式產 號被選 號被選 以及一 限值量 37
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US11/633,133 US8041042B2 (en) | 2006-11-30 | 2006-11-30 | Method, system, apparatus and computer program product for stereo coding |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW200833157A true TW200833157A (en) | 2008-08-01 |
Family
ID=39166956
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW096143530A TW200833157A (en) | 2006-11-30 | 2007-11-16 | Method, system, apparatus and computer program product for stereo coding |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US8041042B2 (zh) |
| EP (1) | EP2087484B1 (zh) |
| CN (1) | CN101548315B (zh) |
| AT (1) | ATE517411T1 (zh) |
| TW (1) | TW200833157A (zh) |
| WO (1) | WO2008065487A1 (zh) |
Families Citing this family (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8260070B1 (en) * | 2006-10-03 | 2012-09-04 | Adobe Systems Incorporated | Method and system to generate a compressed image utilizing custom probability tables |
| KR20090122142A (ko) * | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
| CN101533641B (zh) * | 2009-04-20 | 2011-07-20 | 华为技术有限公司 | 对多声道信号的声道延迟参数进行修正的方法和装置 |
| US20100331048A1 (en) * | 2009-06-25 | 2010-12-30 | Qualcomm Incorporated | M-s stereo reproduction at a device |
| US9530419B2 (en) | 2011-05-04 | 2016-12-27 | Nokia Technologies Oy | Encoding of stereophonic signals |
| WO2013156814A1 (en) * | 2012-04-18 | 2013-10-24 | Nokia Corporation | Stereo audio signal encoder |
| GB2540175A (en) * | 2015-07-08 | 2017-01-11 | Nokia Technologies Oy | Spatial audio processing apparatus |
| EP3405950B1 (en) * | 2016-01-22 | 2022-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Stereo audio coding with ild-based normalisation prior to mid/side decision |
| US20180064042A1 (en) * | 2016-09-07 | 2018-03-08 | Rodney Sidloski | Plant nursery and storage system for use in the growth of field-ready plants |
| CN117292695A (zh) | 2017-08-10 | 2023-12-26 | 华为技术有限公司 | 时域立体声参数的编码方法和相关产品 |
| US10777177B1 (en) | 2019-09-30 | 2020-09-15 | Spotify Ab | Systems and methods for embedding data in media content |
| KR20230066056A (ko) * | 2020-09-09 | 2023-05-12 | 보이세지 코포레이션 | 사운드 코덱에 있어서 비상관 스테레오 콘텐츠의 분류, 크로스-토크 검출 및 스테레오 모드 선택을 위한 방법 및 디바이스 |
| WO2023153228A1 (ja) * | 2022-02-08 | 2023-08-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、及び、符号化方法 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2002015C (en) | 1988-12-30 | 1994-12-27 | Joseph Lindley Ii Hall | Perceptual coding of audio signals |
| NL9000338A (nl) | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
| US5539829A (en) | 1989-06-02 | 1996-07-23 | U.S. Philips Corporation | Subband coded digital transmission system using some composite signals |
| US5285498A (en) | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
| US5488665A (en) | 1993-11-23 | 1996-01-30 | At&T Corp. | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels |
| US5625745A (en) * | 1995-01-31 | 1997-04-29 | Lucent Technologies Inc. | Noise imaging protection for multi-channel audio signals |
| KR100261254B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
-
2006
- 2006-11-30 US US11/633,133 patent/US8041042B2/en not_active Expired - Fee Related
-
2007
- 2007-11-07 CN CN2007800433932A patent/CN101548315B/zh not_active Expired - Fee Related
- 2007-11-07 AT AT07848862T patent/ATE517411T1/de not_active IP Right Cessation
- 2007-11-07 EP EP07848862A patent/EP2087484B1/en not_active Not-in-force
- 2007-11-07 WO PCT/IB2007/003399 patent/WO2008065487A1/en not_active Ceased
- 2007-11-16 TW TW096143530A patent/TW200833157A/zh unknown
Also Published As
| Publication number | Publication date |
|---|---|
| WO2008065487A8 (en) | 2008-09-12 |
| US8041042B2 (en) | 2011-10-18 |
| ATE517411T1 (de) | 2011-08-15 |
| WO2008065487A1 (en) | 2008-06-05 |
| CN101548315A (zh) | 2009-09-30 |
| EP2087484B1 (en) | 2011-07-20 |
| CN101548315B (zh) | 2012-02-08 |
| EP2087484A1 (en) | 2009-08-12 |
| US20080130903A1 (en) | 2008-06-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TW200833157A (en) | Method, system, apparatus and computer program product for stereo coding | |
| CN112119457B (zh) | 可截断的预测编码 | |
| US10607629B2 (en) | Methods and apparatus for decoding based on speech enhancement metadata | |
| KR100981699B1 (ko) | 오디오 코딩 | |
| US11170791B2 (en) | Systems and methods for implementing efficient cross-fading between compressed audio streams | |
| JP6474874B2 (ja) | ハーモニックオーディオ信号の帯域幅拡張 | |
| TW200818122A (en) | Concept for combining multiple parametrically coded audio sources | |
| JP2017126073A (ja) | 無損失符号化装置 | |
| JP2018128684A (ja) | 無損失符号化装置及び無損失復号化装置 | |
| EP4008000A1 (en) | Encoding and decoding ivas bitstreams | |
| JP2022506581A (ja) | 空間メタデータを符号化するための装置、方法およびコンピュータプログラム | |
| EP1801782A1 (en) | Scalable encoding apparatus and scalable encoding method | |
| KR20070061847A (ko) | 스케일러블 부호화 장치, 스케일러블 복호 장치 및 이들의방법 | |
| WO2006080358A1 (ja) | 音声符号化装置および音声符号化方法 | |
| EP4158623B1 (en) | Improved main-associated audio experience with efficient ducking gain application | |
| HK40071164A (zh) | Ivas比特流的编码和解码 |