TW434529B - In the united states patent and trademark office application for united states patent - Google Patents

In the united states patent and trademark office application for united states patent Download PDF

Info

Publication number
TW434529B
TW434529B TW087117091A TW87117091A TW434529B TW 434529 B TW434529 B TW 434529B TW 087117091 A TW087117091 A TW 087117091A TW 87117091 A TW87117091 A TW 87117091A TW 434529 B TW434529 B TW 434529B
Authority
TW
Taiwan
Prior art keywords
signal
aforementioned
length
data segment
samples
Prior art date
Application number
TW087117091A
Other languages
English (en)
Inventor
Louis Dunn Fielder
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Application granted granted Critical
Publication of TW434529B publication Critical patent/TW434529B/zh

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Communication Control (AREA)
  • Radar Systems Or Details Thereof (AREA)

Description

,Α3Α52 9· α? I------ Β7 η 部 it ;>ΐ iV 合 a =fl 印 ί-! 五、發明説明(!) [發明之相關領域] 本發明係有關於以資訊框方式排列音頻資訊流之音頻 仏號處理。特別是,本發明是關於改善音頻資訊流的聲音品 質,其中該音頻資訊流是接合以框為基礎之音頻資訊流所形 成。[技藝背景] 基本上編輯聲音或影像資料的程序是接合(splicmg) 兩段資料在-起。-種簡單編辑的範例是切斷及接合動畫底 片的程序。被接合的碰資料可能源自不同的來源,例如音 頻資訊的不同頻道,或者可能源自相同的來源。在任一種的 情況,接合通常在可能或可能無法認知的聲音或影像資料中 造成中斷。 音頻編碣 資料段處理 數位聲音的發展使用已傾向使編辑音頻資料沒有產生 可聽見的偽造聲音(audible artifaets)更困難。這在某種程度 上已發生’因為數位聲音經常在數&樣本,資料段中被處理 或編碼,該數位樣本必需當做一資料段⑽⑻處理。許多以 感知度或精神聽覺,為基礎的音頻編碼纽了濾波器組 _erbanks)或轉換信號樣本資料段成為編碼的副頻信號樣 本資料段n或轉換係數必須被综合姑或反轉換為恢 復原始信料《料段。—個處理的錢信狀編辑必須 在資料段邊界執行;否則,被餘?的部份資料段所表示 音資訊是不能被適當地恢復 < …资」 之聲 --.-------^------IT------.^ « · (誚先閱讀背而之注意事項再栌急本頁) r *
43452 9ϊ3 Α7 _______ Β7___ 五、發明説明(2 ) . 遍及在此方面討論的剩餘部份,諸如“編碼’’(coding)與 “編碼器’’(coder)的詞係指各種用於信號處理的方法與裝 置,以k其他如“編碼的’’(encoded)的詞係指前述處理的結 果。這些巧之中沒有一個意味著任何特別形成的處理,諸如 那些減少信號中不當的或重複的資訊。例如,編碼包括了產 生表示信號的脈衝碼調變(Pulse Code Modulation, PCM)樣本 及根據一些規格排列資訊為樣式或格式。在此揭露使用的 ‘‘資料段’’(block)與“框”(frame)的詞係指一組資訊或一間段 資訊,這或許不同於其他方面使用這些詞,諸如在ANSI S4.40-1992標準中,有時所知悉的AES-3/EBU數位聲音標 準。在此使用的如“濾波器’’(filter)與“濾波器組’’(filterbank) 的詞基本上包括任何型式的遞迴濾波,諸如正交反射濾波器 (Quadrature Mirror Filtors, QMF)與轉換,及‘‘濾波的資 訊’’(filtered information)係指應用前述濾波器的結果。特別提 及遽波器组是以轉換(transforms)來實施。 以使用重疊資粁段結構處理與編譯程式資料的編碼系 统來編輯會有些額外的限制。因為編碼資料段的重疊特徵, 所以即使是編碼的樣本或係數之完整資料段亦無法適當恢 復原始信號。 此限制可清楚地由一般使用的重疊資料段轉換,修改的 離散餘弦轉換(DCT),來加以說明,該轉換在一九八七年五 月ICASSP會議論文集第2161至2164頁由Princen, Johnson 及Bradley提出的“使用以時域偽造消除為基礎之濾波器组 設計的副頻 / 轉換編碼 ”(Subb.and/Transform Coding Using 木紙乐尺度適州中K 1¾家行:呤((,NS ) Λ4%格(210X297公费)' " ' ----------^------1T------# (#先閱讀賞面之主意事項再"-^本頁) 4.5 2 9¾ A7 B7 % 五、發明説明(3 ) .
Filter Bank Designs Based on Time Domain Aliasing
Cancellation)論文中有所說明。這轉換是一種奇數疊層臨界 \ 取樣的蕈“邊頻分析整合系統的持域等效,且在此係指奇數 疊層時域偽造消除(Oddly-Stacked Time-Domain Aliasing Cancellation, O-TDAC)。前向轉換應用在彼此以一半的資料 段長度重疊之樣本資料段並且取轉換係數切分為兩部份以 達到臨界取樣;然而,被切分而遺失的資訊造成在恢復信號 的時域偽造。整合程序能消除此偽造部份,係藉由應用反轉 換到轉換係數資料段以產生整合樣本的資料段、應用適當形 狀的整合窗框函數(synthesis window function)到整合樣本的 資料段,以及重疊並加上窗框的資料段。例如,若TDAC編 碼系統產生一序列的資料段B,七2,則在資料段B!的後半部 與資料段B2的前半部中偽造資料(aliasing artifacts)將彼此消 除。 假如TDAC編碼系統的兩個編碼的資訊流在資料段邊 界被接合,則產生的資料段序列將不會彼此消除偽造資料。 例如,假設一編碼的資訊流被切割,係以資訊流在介於兩資 料段VB2之間的資料段邊界結束;以及另一編碼的資訊流 切割,係以該資訊流在介於兩資料段~八2之間的資料段邊 界開始。若兩編料資料紐合,係料料段&立即接於 資料段A2之前,則資料段81的後半部與資料段〜的前半段 中偽造資料通常將不會彼此抵消。 先前技藝的方法與裝置不气变略問題不然就是提供了 —!^意_㈣式。—種料方I:!減少無法消除之偽造資 梅尺度 —.—U-----裝------訂------線 (誚先閱讀背面之注意事項再本頁) #ϊ-"部屮决^^^兌-1·消贽 At^ilcrv A7 五、發明説明(4 ) -- 料的可聽度,係以從每一編碼的音頻流恢復或解碼出原始聲 曰的方式、同時淡出及淡入一音頻流到其它音頻流的方式, 與再編碼所產生淡出及淡入的音頻流為一新的編碼音頻流 的方式。不幸地,解碼/再編碼程序退化產生的信號,該程 序導致一個無法吸引人的代價,且因為同時淡出及淡入不能 取消,所以直接地在接合的任一邊資訊流不能獨立的恢復原 始信號。 頻率干擾 接合編輯造成另一個問題是先前技藝蓋無法定址。此問 題與像知覺編碼的分頻知覺編碼技術(Split-Band Perceptuai Codmg Techniques)益不易處理。知覺分頻編碼應濾波器組到 一輪入信號以產生副頻信號或具有頻寬的轉換係數群,前述 頻寬是與人類聽覺的臨界頻寬同量。理想地,每一副頻信號 或轉換係數群以剛奸足夠的位元被量化或被編碼,使產生量 化的噪音無法聽見藉此在原始信號中的噪音被頻率成份所 遮蔽。編碼性能實際受濾波器組的頻頻率響應特徵所影響, 該濾波器组應用在輪入信號產生副頻信號或轉換係數。通 常’藉由在濾波器截止頻率換成較寬的濾波器帶通頻率中增 加頻率的衣減來最佳化這些特徵。例如,參見美國專利第 5,109,417 號。 接合編輯傾向在一頻率的範圍之内產生有效的偽造頻 率成份或、'頻率干擾"(Spectral Splatter),前述範圍通常減 波器帶通頻率或而於帶通頻率與截止頻率之間的轉換區域 之内’而不是有關於濾波器截止頻率之内;因此,設計來最 佳化一般編碼性能的濾波器組無法在接合編輯處提供顏率 本紙张尺度珅视格(2丨0 x 297公费} ^ 囉: --:--------^------1T-------.^-1 ·r (諳先閱讀背面之ii,意事項再#1C本頁) 糊2 9鱷 A7 ____________ B7 五、發明説明(5 ) ~ ^ _ 干擾的足夠衰減。這些偽造部份通常會聽得見因為他們經常 是太大的以致於無法被原始信號所遮蔽。 I I /衣 I (I -1Τ (請先閱讀背面之注意事項再填寫本I ) 音頻與視頻編碼 框同步 即使有較大的限制在處理音頻與視頻資訊的編輯應用 上’但至少有兩個理由,其一是視頻櫃長度一般不等於音頻 資料段長度。第二個理由僅關於一些像NTSC的視頻標準該 標準有一視頻框率是音頻取樣率的整數倍。以下的討論所有 例子假設每秒48K樣本數的音頻取樣率。大部份專業的設傷 使用此率。相似考量應用於其他取樣率如每秒44. ικ樣本 數,一般係使用於消費者設備中。 許多視頻與音頻編碼標準的框及資料段的長度分別顯 示於表一與表二。在表中MPEG II與MPEG III的項係指 ISO/IEC 13813-3標準中國際標準組織的動畫專家群指定的 MPED-2 LAYER II 與 MPEG-2 LAYER III 編碼技術。而 AC-3 攔位的項係指DOLBY LABORATORIES,INC.所發展及A-52 標準中先進電視系統委員會所指定之編碼技術。對於48K HzPCM的 '"資料段長度〃是鄰接樣本之間的時間間隔。 視頻標準 框長度 DTV(30Hz) 一 33. 333 msec NTSC 33.367 msec PAL 40 msec FILM 41. 667 msec 表一視頻 _____画弋' 本紙張尺度述國家標準(CNS ) Λ4规格(2 i 0 公楚) 4 3452
五、發明説明 20.8msec 24 msec 24 msec 32 msec 視頻標準 資料段長度 PCM MPEG II MPEG III AC-3 表二音頻框 在視頻與音頻資訊聯繫在一起的應用中,音頻資料段與 視頻框很少被同步。而於音/頻視頻同步發生之間的時間間 隔顯示於表三中。例如,表格顯示每秒24個框數(晝面數), 動畫影片在每3秒期間剛好一次MPEG音頻資料段邊界將被 同步’而在每4秒期間剛好一次AC-3音頻資料段將被同步。 音頻標準 DTV(30HZ) NTSC PAL FILM PCM MPEG II MPEG III AC-3 33.333msec 600msec 600msec 800msec 166.833msec 40msec 24.024sec 120msec 24.024sec 120msec 32.032msec 160msec 41.667msec 3 sec 3 sec 4 sec 表三介於音頻/視頻同步之間的時間間隔 介於同步發生之間的間隔顯示於表四,前述同步係表示 音頻賢料段到視頻框的數目,例如,介於AC-3資料段與PAL 框之間5個音頻資料段與4個視頻框延展的間隔之内同步剛 好發生一次。值得注意地,NTSC視頻的5個框需要同步 PCM音頻的8008個樣本。這關係的重要性以下將會討論。 ---------裝------ΪΤ------線 (#先閱请背面之ii意事項再4寫本頁) 音頻梯準 PCM MPEG II mpeg III AC-3 DTV(30HZ) NTSC 1600:1 8008:5 25:18 1001:720 25:18 1001:72b 25:24 1001:7¾.
PAL FILM 192:1 5:3 5:3 5:3 200:1 125:72 125:72 125:96
''V 經淖部中少#.卑而只Η消f合竹社印Ϊ+ 1 -¾ d 6 2. 9 ® a7 _____B7_ 五、發明説明(7 ) , 表四介於音頻/視頻同步之間的框數 當秀頻與音頻資訊被聯繫在一起,一般編輯發生在視頻 框邊界。從表三與表四顯示的資訊,可以瞭解到這種編辑在 音頻框邊界很少發生。例如,對NTSC視頻與AC-3音頻, 在視頻邊界上的編輯亦發生在音頻資料邊界上的機率僅 1/960或大約0.1%。當然,此方式中接合的任一邊界兩個編 輯必需被同步,否則一些音頻資訊將會遺失;因此幾乎可以 確定對於兩個隨機的編輯NTSC/AC-3資訊的接合將在除了 音頻資料段邊界上發生且將產生遣失音頻資訊的一個或兩 個資料段。因為AC-3使用TDAC轉換,然而,即使在没有 資訊的資料段遺失的情況對於上述討論的理由將產生無法 消除的偽造失真(Aliasing Distortion) 0 此問題類似於上述討論的音頻資料段處理問題。先前技 藝的方法與裝置不是忽視了視頻/音頻框問題就是提供相似 的不滿意解決方式,即藉由視頻資訊分離音頻資訊、解碼已 編碼的音頻資訊、編輯恢復的音頻資訊及再編碼與再聯繫音 頻資訊與視頻資訊等方式執行音頻的“後置處理 Processing) 0 資料同步 上述提及在每秒48K樣本數NTSC視頻的5個框需要同 步PCM音頻的8008個樣本,換句話說,NTSC視頻框不能 分割音頻資訊成為整數的樣本。每一 NTSC框符合1601.6 樣本。類似地’ NTSC框不能分割編碼的音頻資訊為整數樣 本或係數的資料段。這可藉由排列音頻樣本為重覆序列的音 頻框來適應,例如分別包含16Q2 ,、1601、1602、1601、 '4 \ CNS ) ( 210 X2^# ) (請先閱諳背而之;i意事項本頁,> -裝· ,ιτ 線 434529^ A7 B7 五、發明説明 與1602樣本;然而,這強加了較大的限制在編輯應用,因 為編輯必需僅在5個框序列的開始處被執行,在此係指—個 “超級框1’’(Superframe)。不幸地,許多應用中,視頻資訊與 跟視頻聯繫的音頻資訊兩者都沒表達超級框邊界的任柯指 不 十 消 f: 合 竹 社 印 兔1 在一超級框之内各種長度音頻資料段對許多編碼應用 引起另一間題。如上所述,許多編碼應用在資料段中處理編 碼資訊。除非信號表達了同步信號的一些形式,不然解碼器 無法知悉對每一超級框邊界在那裏或編輯是否移去部份的 超級框。換勺話說,解碼器無法知道每一音頻框或資料段的 邊界在那裏。減少在資料段邊界中的不確定性小到像一個樣 本是有可能;然而,當資料段中處理音頻資訊,—個樣本誤 差足以阻止被恢復之音頻資訊的恢復。 [發明說明] 本發明的目的是改善以音頻資訊流所表示的聲音品 質,前述音頻資訊流係接合雨個或多個以音框為基礎的音頻 資訊流。 根據本發明一種態樣所教示的技術,對信號處理的方法 或裝置接收一包舍一序列的框的輪入信號,每一框包含信號 樣本的起始資料段、一個或多個中間資料段結束資料段,前 述信號樣本表示音頻資訊;藉起始資料段應用濾波器組產生 第一遽波信號’藉中間資料段應用第二濾波器組產生第二德 波信號’藉結束資料段應用第三濾波器組產生第三濾波信 號’其中第一與第二濾波器组的長度不相等且第二與第三遽 波器組的長度不相等;以組令第,一、第二及第三濾波信號為 各別的輪出信號框產生一輸也信號。 本.Α ί 長 >、1¾ ;t]<j 1¾ N 家標今(Tns ) 格(㈣秘势) r.f先閱讀背而之ii意事項本頁j .裴· Τ -5 線 A7 B7 五、發明説明(9 ) ' 根據本發明的另一種態樣所教示的技術,對信號處理的 方法或裝置接收包含一序列的框的輪入信號,每一框包含信 號樣本的起始料段、一個或多個中間資料段及结束資料段, 前述信號樣本表示音頻資訊;藉起始資料段應用第一濾波組 產生第一濾波信號資料段,藉中間資料段應用第二濾波器組 產生第二濾波信號資料段,藉結束資料段應用第三濾波器組 產生第三濾波信號資料段,其中第二濾波器組產生具有偽造 資料的第二濾波信號資料段,第一濾波器組產生具有偽造資 料的第一濾波信號資料段,該偽造資料消除在各別的第二濾 波信號資料段中的偽造資料但實際上並無其他偽造資料,及 第三濾波器組產生具有偽造資料的第三濾波信號資料段,該 偽造資料消除在各別的第二濾波信號資料段中的偽造資料 但實際上並無其他偽造資料,以及組合第一、第二及第三濾 波信號成為各別的輸出信號框以產生輸出信號。 根據本發明尚有另一種態樣所教示的技術,對信號處理 的方法或裝置接收一包舍第一、第二及第三濾波信號框的輪 入信號;對於各別的框,藉第一濾波信號應用第一整合濾波 器組產生信號樣本的起始資料段,藉第二濾波信號應用第二 整合濾波器組產生信號樣本的一個或多個中間資料段,及藉 第三濾波信號應用第三整合濾波器組產生信號樣本的結束 資料段,其中第一與第二整合濾波器組的長度不相等且第二 與第三瀘波器组的長度不相等;及以樣本的包含起始資料 段、一個或多個中間資料段及結束資料段的框排列方式產生 一輸出信號,該樣本表示音頻資訊。 根據本發明進一步的態樣原教示的技術,對信號處理的 方法或裝置接收一包含第一 ^第乜及第三濾波信號資料段框 _____ --Γ--------裝------IT----- 一 (旬先閱讀背而之注意事項^λ"?本頁) ί 本紙张又度過州中闽围家m ( ('NS ) Λ4規格(210 ) A7 B7 本紙乐尺度⑴liTiil謂'(CNS ) Λ4^ ( 五、發明説明(1() 的輸入信號;對於各別的枢,藉第一遽波信號資料段應用第 一整合濾波器組產生信號樣本的起始資料段,藉第二濾波信 號資料無應用第二整合濾波器組產生信號樣本的一個或多 個中間資料段,及藉第三濾波信號資料段應用第三整合濾波 Is組產生信號樣本的結束資料段,其中第二整合濾波器組產 生具有偽造資料的中間資料段,第一整合濾波組產生具有偽 造資料的起始資料段’該偽造資料消除在各別的中間資料段 中的偽造資料但實際上並無其他僞造資料,及第三整合濾波 器組產生具有偽造資料的結束資料段,該偽造資料消除在各 別的中間資料段中的偽造資料但實際上並無其他偽造資 料,及以包舍樣本的起始資料段、一個或多個中間資料段及 結束資料段的框排列方式產生一輸出信號,該樣本表示音頻 資訊。 本發明的許多特徵及其較佳實施例可藉由參考下列討 論與所附圖式而有較好的瞭解,其中幾個圖式中類似參考數 字係指類似的元素,圖解說明許多裝置的圖式顯示主要零 件,這有助於了解本發明。為了清楚起見,這些圖式省許多 其他特徵,這些特徵在實際的實施例可能重要’但在瞭解本 發明的觀念並不是重要的因素。實踐本發明需要的信號處理 可以較廣的各種方式來完成,這些方式包括藉由微處理機、 數位信號處理H、賴❹j與其似彡式㈣算電路師執行的 程式。信號毅器基本上可以任何方式,包括遞迴,非遞迴 與LATTICE數位濾波S’ ’來完成。根據應㈣需要與特徵 數位與類比技術可以各類結合方式使用。 更特別的提及到適合處理音頻及視頻資訊流的條件;妖 而’本發明的態樣可實施在不包括視„訊處理的應,。、 " 11 I 1 ("先閱讀背面之注意事項寫本頁j 裝. 線 434529 搜 A7 --------------- B7_ 五、發明説明(η ) ^ 以下討論與圖式的内容僅供例子的說明,不應該視為在本發 明的範圍上表示限制》 [圖式的簡單說明] 圖一 A與圖一 B為排列資料段、音框及超級框的視頻與 音頻資訊的示意圖表示。 圖一 A至圖一 C是重疊資料段的示意圖表不’該資料段 被窗框函數與對於包含窗框資料段的音框之產生的GAIN PROFILE所調變。 圖三係圖解由偽造消除轉換所產生的信號與偽造成 份。 ,圖四A至圖四C圖解裝置的功能方塊圊,該裝置編碼的 資訊流中產生、改變及響應增益控制字元 圖五A與圖五B圖解裝置的功能方塊圖,該裝置應用交 的濾波器組抑制在音框邊界的偽音。 圏六A至圖六D是窗框函數的示意圖表示,該函數可用 以抑制在音框邊界的偽音。 圖七圖解在音框邊界使用各種窗框函數所產生的頻率 響應特徵。 圖八圖解裝置的功能方塊圖,該裝置應用交的濾波器組 增加在接合處頻率干擾的衰減。 圖九、圖十A與圖十一A是適於圖八的裝置之許多窗框 函數的示意圖表示。 圖十B與圖十一B圖解在圖八的裝置中使用的各種窗框 函數所產生之頻率響應特徵。 吟胃! 圖十二A與圖十二B圖解裝置的方塊圖,該裝置提 ___.___v _ 本紙張尺度適 ( CNS } { 210X297^-31 )一"~ 隱9 (請先閱讀背面之注意亨項再域{"本頁) 訂 43^52 A7 B7 五、發明説明(12 供取樣率轉換以逹到介於音頻樣本與視頻框之間的同步。 圖十二A與圖十三B圖解裝置的功能方塊圖,該裝置提 (讀先閱讀背面之注意事項再填寫本頁 供了動態的音頻框對準以達到跨越—個接合具有視頻超級 框的同步。 圖十四是跨越一個接合視頻框特徵與動態音頻框對準 的效應的示意圖表示。 [發明實施之模式] 信號舆處理 信號資料段與框 衫"部中头κ4,^·-;ί-τ·"贽合作.^印" 圖一A係圖解一列音頻資料段1〇到18所排列之編碼音 頻資訊流及一序列視頻框所排列之視頻資訊流。在一些如 NTSC視頻的格式中,每一視頻框包含兩個視頻欄位(VIDE〇 FIELDS),該視頻欄位共同地定義為單一畫面或影像。音頻 資料段11到17係與視頻框設為一組成為編碼的信號框 如上所述與表四所示,有些應用的視頻框並未分割編碼 的音頻為整數個樣本,轉換係數或類似的單元。這可藉由排 列編碼的信號框群成為各別的超級框。圖一 B即圖解了五個 編碼信號權1到25的排列聚成超級框31。這特別的排列可 能使用於NTSC視頻與48K樣本/秒PCM音頻的應用。 處理的信號資料段 一序列的編碼音頻資訊之資料段可表示音頻信號的重 疊間隔。例如’一些分頻知覺的編碼系統處理彼此重疊一半 的資料段長度之音頻樣本資料段。一般,這些重疊的資料段 中樣本被一分析框函數所調變。 圖二A圖解了應用在一序列的聋邊^頻資料段中每一資 料段之分析框函數的調變包絡線61^^δ7。重疊的長度是 論 本紙張尺度適疋十_家蘇7[^77^⑺0X297公釐屮: U' ¾¾.部中少標ii-^β 印y 43452 9« A7 __B7 五、發明説明(13 ) . 等於一半的資料段長度。這重疊間隔通常被一些如上所述之 0-TDAC轉換的信號分析整合系統所使用。 圖二B圖解了應用在一編碼信號框的一序列重疊資料 段之窗框函數的產生之調變包络線。如圖二B所示,此調變 的淨效應或増益輪廓81是在重疊間隔中鄰近的資料段之調 變包絡線71到77的合成。最好是,跨越每一重疊的淨效應 應該是單位增益。 圖二C圖解跨越鄰接的編碼信號框時窗框函數的整體 效應。就如圖示,增益輪廓8〇到82重疊且相加,如此淨效 應單位增益。 在僅使用分析窗框函數的應用中,所有窗框函數調變的 淨效應是等效於分析窗框函數單獨的調變效應。藉由確使分 析窗框函數的調變包絡線重疊且相加為一定值可達到理想 的增益輪廓。 在使用分析與整合窗框函數的系統中,所有窗框函數調 變的淨效應;I:等效於由分#窗框函數與整合窗框函數之乘 積形成、、相乘"的窗框函數。在此種系統中,在重疊間隔中 使相乘窗框函數的調變包絡線相加為定值可達到理想的增 益輪琳。 遍及此說明,一些所提及的編碼系統與方法同時使用分 析與堅合窗框純。在此内容巾,重㈣分析餘函數所產 生的增益輪翁時將視為料―定值。類似地,重疊的整合 窗框函數所纽的增益輪㈣時將視為等於—定值。應該了 解的是此魏明意指系統中所有;_的淨輕效應/ 窗框函數4 ___ d :i:.l 娜尺度㈣中嶋㈣ --:--.-----裝------17------.^ (1ί先閱讀背面之注意事項再,.巧本頁) 434529^ Α7 Β7 .¾. A 屮 4\ 樣 卑 ;n a 杜 印 ν 五、發明説明^ 分析窗框函數的形狀不僅影響信號的增益輪廓亦影響 了相對的濾波器組的頻率響應特徵。
I 頻率干摄 如上所述,許多知覺的分頻編碼系統使用具有頻率響應 楚舉且,前述特徵藉由增加濾波器截止頻率換成較 濾波器帶通頻率中頻率衰減以最佳化知覺的編碼。不幸地, 接合編輯傾向在頻率範圍之内產生有效的頻率加工或、、頻率 干擾",該範圍不是在濾波器截止頻率之内。被設計成最佳 化一般知覺編碼性能的濾波器組不提供足夠的衰減使其聽 不到在接合編辑處所造成的這些頻率加工。 TDAC轉換偽造消除 關於0-TDAC轉換,分析窗框函數以及整合轉換的應用 之後被使用的整合窗框函數,必須也要滿足一些限制以允許 時域偽造資料的消除。 從整合轉換恢復的信號在觀念上視為原始信號與時域 偽造成份的合成,該時域偽造成份係分析轉換所產生。在圖 二中,曲線91、83與95表示一輸入信號的振幅包絡線片 斷,當輸入信號從逆轉換或整合轉換恢復且被分析與整合窗 框函數調變。曲線92、94與96表科域⑽成份,當輸 入號從逆轉換或整合轉換恢復且被分析與整合窗框函數 調變。可㈣中得知以下將麵則,纽讀人信號被 分析與整合窗框函數調變原始輪入信號的複製反應了時域 偽造成份。
分析與整σ 〇_TDAC轉換的數F⑽化。的 被設計來產生時域制成份,這K —,—------裝------訂-------線 (¾先閱婧背而之.注意事項声、>?本頁) A7 B7 15
丨紀.C
五、發明説明(, 窗框信號的輯端反應(end_for_end邊—㈣在princen等 人所揭露之中,O-TDAC轉換在兩個不同區域產生時域偽 造成份。在區域2,時域偽造成份是那區域中原始信號端對 端窗框反應。在區域1中,時域僞造成份是那區域之内輸入 信號的端對端窗框反應,但反應的振幅被倒轉。 例如’偽造成份94a是信號成份93a的端對端窗框反應。 偽造成份92b亦是信號成份91b的端對端窗框反應,但反應 的振幅被倒轉。 藉由重疊且相加鄰接資料段,而恢復原始信號且消除僞 造成份。例如,信號成份910與93a相加而恢復該信號沒有 窗框函數調變效應’且偽造成份92b與94a相加而消除偽 造。同樣地,信號成份93b與95a相加而恢復該信號且偽造 成份94b與96a相加則消除偽造。 在接合邊界的任一邊上時域偽造成份一般將不會被消 除,因為直接地在接合前整合的音頻樣本的一半資料段中偽 造成份將不會是直接地接合後整合的音頻資料段的一半資 料段中偽造成份的倒轉。 相同的考量應用在其他偽造消除濾波器組,諸如Princen 與 Bradley,在 1986 年 IEEE Trans.on Acoust.,Speech, Signal Proc·,Vol. ASSP-34,第1153至1161真所揭露之、、以時域 偽造消除為基礎的分析/整合濾波器組設計" (analysis/synthesis filter bank design based on time domain aliasing cancellation)。此遽波器組是偶數疊層臨界取樣的單 一邊頻分析整合係統的時域等效,且在此係指偶數疊層時域 偽造消除(Evenly-stacked Time-doiraain Aliasing Cancellation E-TDAC)。 才、紙乐尺度適川屮阈《象標彳{ (、NS ) Λ4叱格(210X 297 --r--------^-------ΐτ------.^ (誚先閱讀背面之-注意事項jpl:i5本頁) 4 3 452 Α7 Β7 五、發明説明 衰減在接合處偽造成份之增益控制 (誚先閱讀背面之注意事項K· 寫本頁) 可用以減少接合所造成之偽造成份的能聽度(audibility) 之技術#入到編碼的音頻信數複數個增益。控制字元,係指 示解碼器或回轉系統改變回轉信號(playback signal)的振 幅。使用這些增益-控制字元的裝置之簡單實施例在下面段 落中討論。 圖四A圖解裝置100的功能方塊圖,其中格式順著路徑 112產生輸出信號,該輸出信號以框排列而框包含視頻資 訊、表示多重音頻通道的編碼音頻資訊,及增益-控制字元。 格式111產生輸出信號係反應接收來自路徑108及路徑110 的信號,而路徑108的信號是以表示頻資訊與多重音頻通道 的編碼音頻資訊之框排列,路徑110的信號則表示增益-控 制字元。處理器109接收來自路徑103a與103b的多重控制 信號,每一控制信號與多重音頻通道之一有關聯。且反應到 每一控制信號,而順著路徑110對關聯的音頻通道產生一對 增益-控制字元,該音頻通道在各別的框之内表示起始增益 與結東增益。為了清楚起見,只有二個控制信號103與二個 關聯音頻通道102顯示於圖中,若有需要,這增益-控制技 術可應用到更多的那二個通道。 在顯示的實施例中,編碼105順著路徑106a與106b產 生多重音頻通道的編碼音頻資訊,係反應接收來自路徑l〇2a 與102b的多重音頻通道信號,且框107順著路徑108產生 信號,係以框排列,而該框包含接收來自路徑1〇1的視頻資 訊及接收來自路徑l〇6a與106b的編碼音頻資訊。 此增益-控制技術可與類似沿108通過的輸入信 號使用;因此,編碼105與框107¾¾都不需要。在包括編 木紙张尺度遍;丨_1十闽囤家標磾(('NS ) Λ4规格(2IOX 公: # ^345 2 9>i 五
A7 發明説明(l7 碼105的實施例中,編碼可獨立地應用到每一音頻通道或共 同地應用到多重音頻通道。例如,AC-3編碼技術可共同地 應用到南個或兩個以上音頻通道以降低總頻寬的要求,藉此 移去或減少通道之間的多餘資訊。 圖四C係圖解裝置HO功能方塊圖,該裝置H0根據輪 號中的增ώ -控制字元產生輸出信號再生產或回轉多重 音頻通道。解格式142從路徑141接收輪入信號 ,而該輸入 乜號疋以樞排列,且前述框包含視頻資訊編碼的音頻資訊 與増益-控制字元。解格式142從輪入信號的每一獲得表示 多重音頻通道的編碼音頻資訊與且獲得與每一音頻通道有 關的一對增益-控制字元。處理148從路徑145接收增益-控 制予元且在路徑149a與149b反應產生增益_控制信號。解 瑪為146從路徑144a與144b接收編碼音頻資訊的多重通道 且對每一音頻通道差生輪出信號,如此每一輸出信號的振幅 與準位係反應了相關聯增益控制信號而變化。 一對增益-控制字元表示在特定的框之内各別的音頻通 道的起始增益與結束增益。處理148產生增益控制信號,該 等信號表示增益-控制字元對的内插法。該内插法可跟隨要 求的軌線,諸如線性、二次函數、對數性或指數性。例如, 以線性内插法增益控制仏號可表示穿過特定的框線性地變 化增益。 解碼可獨立地應用在每一青頻通道或可共同地應用在 多重音頻通道。例如,解碼可互補於編碼的形式,該編碼移 衣成減少通道之間的重複資訊。在使用整合濾波器组與整合 窗榣邊數之分頻編碼應时,可養^☆控制信號藉以在整 合滅波器組的應用之前修改編碑齡_、在整合窗框之前修
1 rNS ! ( 2U)X29T --Γ--------裝-------訂-----ί線- (討先閲請背1¾之ίι意事項J:朽本頁) 43 452 9* A7 B7 經 部 中 央 樣 準 扃 員 工 消 会 合 作 社 印 ___________ 本紙張尺度適用中國國家樓準(CNS ) ( 210X297公们搜ρ丨
五、發明説明8( iS 改從整合濾波器組獲得的整合音頻、或修改從整合窗框函數 的應用獲得的音頻資訊而有效地調變輸出信號。 圖四B圖解裝置120的功能方塊圖,該裝置12〇修改信 號中存在的增益-控制字元。解格式123從路徑121接收以 框排列方式的輸入信號,而前述框包含視頻資訊'表示多重 音頻通道的編碼音頻資訊及輸入增益-控制字元。解格式123 從輸入信號獲得與多重音頻通道之一的編碼音頻資訊有關 聯的一個或多個輸入增益-控制字元且經路徑124a與124b 送出輸入增益-控制字元。處理126藉以修改對接收自路徑 122的控制信號反應之一個或多個輸入增益—控制字元而順 著路徑127產生一個或多個輸出增益-控制字元。格式Kg 順著路徑路129產生以框排列方式的輸出信號,該框包括視 頻資訊'對多重音頻通道的編音頻資訊、輸出增益_控制字 元及與輸出增益控制字元不一致的輸入增益_控制字元。 在編輯應用中,控制信號122指出輸入信號121的接 合。響應之中,處理126產生一個或多個輪出增益—控制字 元,該等字元引起一裝置,如裝置14〇係在接合之前直接衰 減回轉信號且在接合之後直接反轉該衰減。在增益中的變化 可延伸橫跨許多框:然而,在許多應用中變化受限於接合的 任一邊的一個框。增益一變化間隔可衡調變結果的能聽度來 決定該調變結果以本身增益變化的能聽度被增益變化而產 生。此增益控制字元技術並不受限於編輯應用。 在框邊界抑制偽造的濾波器 在使用偽造消除形式的編碼系統中,諸如被提供TDac 轉換之…為了上述討論的理由接合接合的每一被消 除的邊界防止偽造資料。這些無法消造資料由應 _ ;沁 Ά ί I. Π n 裝 111 訂 i 線 (請先閱讀背面之注意事項再试^未瓦) ! 43452 9^! ^^ A7 τ ~_______ Β7 五、發明説明^Τϊ —— --- ^交賴聽料頻科_每< 起始麟束位置來 2資:參考圖_Α顯示的㈣,一第一義組應 又 第一濾波器組應用在資料段12到16, ^-第三遽波器组應用在資料段17。這些較器組的特 料基本上從每—框恢復的音頻包含無法消除的偽造資 轉考圖五A ’裝置2GG &含緩衝器加,係接收音頻 '訊的資料段,且該緩衝器2〇2順著路徑2〇3產生一控制信 號該控制信號指ifc音頻科段是否為音框巾的第一或起始 資枓段’是否為音框中的最後或結束料段或W音框中的 中間資料段。接收自路徑203之控制信號的響應中,開關2〇4 導引每-音框中第-或起始資料段至第一遽波器组2〇6及 導弓1每-音框中最後或結束資料段到第三遽波器组207。格 式208組合接收自每一三個濾波器組之濾波音頻資訊成為 輪出信號通過路徑209。 圖五Β圖解裝置220 ’其中解格式222從路徑221接收 輪入信號,藉此獲得編褐的音頻訊順著路徑224通過,且該 解格式222順著路徑223產生一控制信號,該控制信號指出 編螞的音頻資訊是否為音框中第一或起始資料段,是否為音 樞中最後或結束料段,或是否為音框中中間資料段。在接收 自路徑223之控制信號的窨應中,開關225導引编碼的音頻 資訊到三個整合濾波器組226、227、228之一。開關225 導引編碼音頻資訊的第一資料段到第一整合濾器組226,編 碼音頻資訊的中間資料段到第二整合濾波器組227,及編碼 音頻資訊的最後資料段到第三整合濾器組228。缓衝器229 對接收自三個整合濾波器組的整合香頻資料段f應而順著 ^紙?厂乂度適川中闲阀家從1? ( (’NS ) Λ4規格(210X 297公筇).. (請先閱請背而之·;±·意事項再斗碎本頁) .裝 丁 i . -& 線
_-:'"^r·屮失技"V 43452 9·^ A7 ~ ·~--—Β7 五、發明説明(2〇 ) 路徑230產生輪出信號。 第二濾波器組 在編碼器的一實施例巾,根據上述提及由―咖等人 揭露之0_TDAC轉換’可藉點修改D(:T與N點分析窗 框函數來實現第二料器'组。在其互補的解碼器中,根據 〇-TDAC轉換’可藉由N點修改反向DCT與N整合窗框函 數來實現第U組。正向與反向〇_TDAC轉換分別由表示 或(1)與(2)顯示。 M-ϊ ^ 雄;=)]對於 〇 以 > M ⑴ 咖=¥5雄細[登如對於0 S « > Μ (2) ζ 2 其中a:=頻率指榡, «=信號樣本數, 从=樣本資料段長·度 m =對於 O-tdac 的相位項(Phase Term), 窗框的輪入信號樣本’及 W幻=轉換係數k。 第一慮波器組的長度μ==Ν且產生具有邊界之僞造反應 的兩個區域,該邊界介於兩個區域的資料段中點處,如圖三 顯示。需要來產生這兩個區或之TDAC相位項是m=N/2。 在較佳實施例中,分析與整合窗框函數是根據以下說明 的技術所推導而出。在圖六A中這些窗框函數的形狀由曲線 242來加以圖解。為了便於討論這些窗框函數是以%(«)為 參考。 第一濾波器^^ 本纸张尺度诚州屮闷囚家樣冷(C'NS )八4規格(2!0'X297公犮 L_---I. m (^^1 ^^^1 ^^^1 I ^^^1 ^^1 ^^^1 loi1^1. ίΐ 1- —u- - - -n - I- - (对先閱讀背而之i£意事項爯AST本頁} t 43452 9¾ A7 經淖部中次標準局貝-X消介合竹扑印來
_ B7 五、發明説明(21 ) · 在此相同的實施例中,在編碼器與互補的解碼器中第一 濾波器組可被上面提及的修改DCT與修改形式的窗框函數 %(«)來1實現。正向與反向轉換分別由表示式(1)與(2)顯示。 第一濾波器組的長度M=3N/2且產生僞造反應的單一區域 1。偽造資料是資料段中信號的反轉邊對邊反應。在影響中* 广 反應區域2的長度是零且介於兩區域之間的邊界是在資料 段的前部邊緣或右側邊緣。需要來產生此單一區或的TDAC 相位項是w=0 〇 對於第一濾波器組分析與整合窗框函數的(《)是完全相 同的。此窗框函數的形狀在圖六Β中由曲線241加以圖解。 這是由三個部份组成。第一與第二部份,係指區段1與2, 是相同於上述且顯示於圖六Α中的窗框函數JT2(x)。第三部 份,係指區段3,是等於零。 此第一分析窗框函數叭(《)確保信號在區段3中是零。 如此的結果,從區段3至區段1所反應的偽造資料亦是零。 從區段1至區段3所反應的偽造資料通常將不會是零;然 而,當第一整合窗框函數叭(η)被用到整合的音頻資料段 時,反應到區域3的任何偽造資料的被消除。如此之結果, 偽造資料僅存在於區段2。 第三濾波器組 在此相同的實施例中,編碼器與互補的解碼器中第三濾 波器組可被上面提及的修改DCT與修改形式的窗框函數% («)來實現。正向轉換與反向轉換分別由表示或(1)與(2)顯 示。第三濾波器組的長度Μ=3Ν/2且產生偽造反應的單一區 域2。偽造資料是資料段中信號的邊對邊反應。在影響中, 反應區域1的長度是零且介於兩個區域之間的邊界是在資 I .·- ·. 本紙張尺度適用中阈Κ家榡.争((,NS } Λ4规格{ 2丨0Χ 297公漦TTfF --^--.-----¾------ΪΤ------.^ (諳先閱讀背面之注意事項荠^寫本頁) 經潢部中决標ΐί-局MJ.消资合竹杜印Τ 43^152 A7 B7 五、發明説明(22 ) 料段的尾部邊缘或左侧邊緣。需要來產生此單一區域的 TDAC相位項是m=3N/2。 對於第三濾波器组分析與整窗框函數叭〇)是完全相同 的。一種適當的窗框函數的形狀在圖六C中由曲線243加以 圖解。這是由三個部份所組成。第一部份,係指區段1,是 零。第二與第三部份,係指區段2與3,是相同於上述且顯 示於圖六A中的窗框函數ί^2(χ)。 此第三分析窗框函數%(«)確保該信號在區域1中是 零。如此的結果,從區段1至區段3所反應的偽造資料亦是 零。從區段3至區段1所反應的偽造資料通常將不會是零; 然而,當第三整合窗框函數%(«)被用到整合的音頻資料段 時,反應到區段1的任何偽造資料將被消除。如此的結果, 偽造資料僅存在於區段2中。 圖六D圖解窗框函數叭(《)、%(«)與%(«)24丨至243 彼此是如何重疊的。增益輪廓240表示對邊到邊窗框的淨效 益,對於TDAC係指從相關的分析與整合窗框函數之結果所 形成之一序列重疊結果窗框函數。在資料段11的區域2中 偽造資料被資料段12的前半段中偽造資料所消除,其中資 料段11被分析一整合窗框函數恥(《)加權重,而資料段12 係被分析-整合窗框函數%加權重。在資料段17的區段2 中偽造資料是被資料段16的後半段中偽造資料所消除,其 中賢料段Π被分析-整合窗框函數灰3(«)加權重,而料段16 係被分析-整合窗框函數叭(《)加權重。在中間資料段對如資 料段12與13或資料段15與16中,信號恢復與偽造消除是 根據習知的TDAC所完成的。 >' _ ^··. 藉由使用此技術,接合編輯在任#摇1^界處實施且沒有 木紙ί[尺度適川中阀内家掠彳(CN'S丨/Wi見格(2IOX297公费.)
—————i. i I 士 ---T II ! ,1----- AK. 05, ,\έ ^ («先閱讀背面之-注意事項寫本頁) A7 B7 h
Wtcs(n)~
對於0 g « <N (3) (X/才
4 3 4 g ^ 9 rl —^—— _ 五、發明说明(23) 僞造資料將是無法消除的。 窗框函數的推導 窗推函數%⑷可使用以下段料所㈣的技術推導基 礎窗框函數。雖然具有適當的重疊-知成特性的任柯窗框二 數可用來當做基礎窗框函數,但使用在較佳實施例中基礎窗 框函數是Kaiser-bessel窗框函數 n 、W2j /0[m] 其中a = Kaiser-Bessel窗框函數因數 v=窗框樣本數 N =在樣本數中的窗框長度 Φ]=Σ k 二Ο 藉著以矩形窗框函數s㈨旋轉(Convolving) Kaiser-Bessel 窗框函數㈨使推導產生一分析-整合積窗框函數 WX«)(product window function),前述矩形窗框函數*5兩具有 一長度,該長度等於資料長度N減去重疊間隔v,或: N-i
WP(n) = ^—v-對於 0Sn<N k~0 此方程式可簡化為: N-w~l ^W^n-k)
WP(n) =气- 對於0爸η < N
k 二Q 其中《=積-窗框(product-window)樣:本丨數,
iS ___^ 木紙张尺度適用中CNS ) A4C格(210X2W公梦) ----.-----^------iT------Φ: ("先閱讀背而之-注意事項罗>-??本頁) 34^2 9^3 A7 B7 赘明説坍(24 ) · v=窗框重疊間隔之内的樣本數, N=積-窗框的預期長度’ ;ί^ΚΒ(«)=長度V+1的基礎窗框函數’ 貯(《)=長度N的推導積-窗框;及 s(k)= \ ,對於 0 S k<N-v =0 ,其他 對於0-TDAC轉換,重疊間隔v=n/2與分析窗框函數與 楚合窗框函數的完全相同的;因此,兩者之一的窗框函數可 從下式獲得: ^(n) N/2-l ^W^n-k)
k^O
對於0含η < N (4) 經.v'.i部中夾榡準局貝J-消扑合竹社印掌 1 ΣΜ4 I k^O 以此方式推導的分析與整合窗框函數在此係指Kaiser_ Bessel-Derived(KBD)窗框函數。積窗框函數係指Kbd積窗 框數數。對於基礎Kaiser-Bessel窗框函數的α因數可被選擇 來最佳化編碼性能。在許多應用中,對於編碼的最佳α因數 是在2到6的範圍之中。 實質上在整個框中沒有無法消除之偽造資料可允許任 何窗框函數被使用在接合處。通常,這些窗框函數具有的形 狀係保持一定值增益輪廓橫跨重疊間隔。在接合處,重疊間 隔可延伸跨越許多框;然而,所預期的是許多應用將使用、、接 合-重疊間隔",係在5到30ms的範圍之中q為了以下將討 論的理由。跨越接合的重疊間隔可被增加是很重要的。 減少在接合處頻率干擾的波器組 對許多編碼應用就最佳化知覺的編碼(⑽叩― coding),上述提及的範团之内α因數#_的。如上所述, ---------裝------訂-------線 (锖先閱請背*之-注意事項^4-寫本頁) 本錄尺度關屮賴冢制( 2K)xl^f )" 薄. 43452 Α7 ______Β7 五、發明説明 (25 ) 通常在遽波器截止頻寬換成較寬的遽波器帶通頻寬中增加 頻率的衰減以最佳化編碼。對於一個用來最佳化知覺編碼的 濾波器典型頻率響應的例子在圖七中以曲線342來顯示。 此曲線表示0-TDAC分析-整合系統的框增益輪廓之頻率響 應,該0-TDAC分析-整合系統使用01=6的窗框函數且 具有框重疊間隔等於256個樣本。雖然介於帶通頻寬與截止 頻寬之間的邊界不是被精確地界定,但在此例子中帶通頻寬 涵蓋頻率到達200Hz以上且截止頻寬涵蓋頻率超過1ΚΗΖ。 傳統區域延伸介於兩頻寬之間。 使用應用到256-樣本資料段之轉換的應用中,接合編輯 向於產生有效偽造的頻率成份或濾波器的中心頻率大約在 200Hz到1kHz之内的“頻率干擾”。對於使用其他長度的資 料段之應用,此頻率範圍可解釋為與被資料段長度分割兩個 數有關聯;因此,有效頻率干擾發生在頻率範圍以Hz表示 從大约50,000到大約256,000,每一個被資料段長度所分 割。 在圖七顯示的子中,這些頻率是指被視為濾波器截止頻 寬之外的頻率。設計來最佳化知編碼性能的濾波器組是無法 提供在接合編辑造成頻率干擾的足夠衰減。這些偽造資料通 常是可聽得見,因為他們經常是太大以致於無法被信號覆 蓋。 在圖七中曲線341與343圖解兩個其他分析-整合系統的 頻率響應,這些系統截止頻寬中提供有效地較小衰減,但受 到在接合處產生的頻率干擾影響之頻率範圍中提供較多的 衰減。在知覺的編碼中一些性能在為了增加頻率干擾的衰減 而被犧牲。最好是,頻率響應在一頻良转丨圍之内最佳化頻譜 11 ______ 本録尺心财酬轉彳(TNS)A4^ 017x297^) ;·'·Μ—--- ----·-----裝------iT-----—線 (1ί先閱讀背而之.注意事項#4寫本頁) A7 A7 26 五、發明説明( 能量的衰減,該頻率範圍對於—個毅256·樣本資料段的系 統包括2_Z或600Hz,或大約5〇’〇〇〇與】5〇,咖的頻率, 每一個被資料段長度分割。 有時折衰方式可料到同時對於在接合處的通用編 碼:、同時^人及淡出的框來滿足頻铸應的要求。在那一些 不此達到這種折方式的應用中,接合被制且分折—整系統 =頻率響應被改變。這些改變被完成必須與整合遽波有關 聯,因為分析濾波器組一般不能預處理接合的操作。 圖八圖解了裝置320,該裝置32〇可用來藉著修改分析 -整合系統的邊界到邊錢料應以減少在接合處的頻率干 擾在此裝置中’解格式322順著路徑321接收一輪入信號, 以獲得編碼音頻資訊,並順著路徑324通過,而且在路徑323 產生控制信號,該控㈣號指储合是研生錄的任—起 始邊緣處’接合的發生可在輪人信號中被表示傳遞或可能意 味其他在信號中傳遞的資訊a 例如,根據AES-3/EBU標準,音頻資訊連續的資料段 包a資料段數量,係從零增加到255,然後再回到零。兩個 前後相接而不是隨後而來的資料段數量可指示一個接合;然 而,此種測試並不可冑,因* —些處理AES/EBU資料流的 ^置不朴錄量,若音錢被料,㈣的方式可提供連 ’”的編號或其它預測形式的資訊。若該資訊*能符合所期望 的,可產生一信號指示接合的出現。 接收自路徑323的控制信號的響應中,開關奶導 碼的音頻資訊到三個整遽波器組的其中一個。開關仍對於 j合^框中[㈣料段的編碼音頻資訊導引到第1 j波IS組326,對於接合之前的框中最後資料段的編 =訊導引到第三整合遽波器組328,#對於其它的賢 音《訊料料二二者擇其一地, ’ M :A m:ν .一 -."' _ ---- 丨雄〒 1 ---------t------IT------0 (销先間讀背面之注意事項渾4寫本頁) -^.部十·ν^^^Όί-τ·'·-Γ·-;η於合什"印 t 本紙狀度埯(71^7罐格 m 43452 9¾ A7 —------_____^__ B7 五、發明説坍(27、 ------ 5 ϋ::ί它資訊段的編碼音頻資訊可被導引到三個濾波 =2 —個,這係根據上討論圖五有關聯之技術。緩衝 ^路徑别產生—輪出信號,該輪出信號係對接收 一#整合濾波器組之整合音頻資料段產生饗應。 第與第二整合濾波器組係設計來達到關於一些分析 的所需頻率響應。在許多應用中,這分析遽波器組 二-與第二整合遽波器組最佳化一般編碍性能。第一與 第三整合m組基本上可以許μ式來實施,這些方式提 供所需整體的頻率窨應。—般,這兩㈣波器組將有完全相 同的頻率警應,但將有彼此是時間反向(Time-re簡ed)的複 製之脈衝ft在制轉換與窗框函數實施奴器组的應用 中,可使―合絲錄來f施適當㈣波肢,那些函數 接合的任一邊上增加相鄰框之間的重疊間隔。 整合音頻的調變 這可藉由幾種方式來完成。—種方式係調變接收自整合 漉波器組的整合音·號’如此錢合的任—邊上的框彼此 同時淡入及淡出。這可由圖四c所示的裝置⑽來完成。解 碼器146在接合之前的框跨越所要的接合-重疊間隔㈣咖_ overlap mterval)以整合整合信號的振幅。實際上在接合之 前的框的增益輪廓從一單位(unity)跨越此間隔減少到二些 低位階。解碼器146亦在接合之後的跨越所要的接合-重疊 間隔以增加整合信號的振幅。實際上,在接合之後的框的择 益輪廓從低位階跨越此間隔增加到一單位。假如對於分析_ 整合窗框的調變效果在增益⑽中該效果改變,則重叠框的 整體增益可被維持。 在增益㈣中該效果變化可線性化。圖七中曲線⑷顯 示大約在5 msee顧祕地成錐,_益輪#之頻率響 應特徵,在每秒他個樣本的取樣頻_此間隔相當於約256 __________;A - i 紙張尺度ϋΐ 屮阀 Κ ΐ樣…(CNS ) A4^ --- ---------¾------π------線.. (誚先閱讀背而之洼意事項异^·巧本頁) 4 345 2 9 ί Α7 Β7 五、發明説吩(28 ) 、 個樣本。在許多的編碼應用中’轉換被用以取樣具有256個 '樣本數的資料段;因此,這些特定的應用中,256個樣本的 斜昇(ramp)或線性化成錐形增益輪廓跨越在框邊界的-尾 端"資料段延伸且跨越重疊此尾端資料段之鄰近資料段的一 部份延伸。這等效於應用一濾波器組到尾端資料段,應用另 一濾波器組到直接鄰近的資料段,及再應用另一濾波器組到 框的中間的其他資料段。參考圖八中所示的裝置320,兩個 額外的整合濾波器組被要求來處理鄰接且重疊尾端資料段 的資料段。 此線性地成錐形之斜昇的頻率響應表示了以其他被評 估的頻率響應為背景之參考響應。一般,最佳化關於此參考 響應之頻率能量的衰減之濾波器組在減少接合處造成的頻 率干擾是有效的。 修正的整合窗框函數 另一方法改變一分析-整合系統的整體頻率響應特徵是 修整合窗框函數,如此分析-整合窗框的淨效應達到想要的 響應。實際上,整輝頻率響應係根據產生的分析-整合積窗 框函數而改變。 圖七中曲線341表示一頻率響應,係衰減在接合處的頻 率干擾到大於5msec的頻率響應的程度。曲線343表示了線 性地成錐形的增益輪廓。曲線341的響應是由0-TDAC分 析-整合系統使用256-點轉換及α=1的KBD窗函數所完成。 如上所述,曲線342相當於α=6的KBD窗框函數。 這些分析-整合系統的端到端頻率響應是等效於由分析 窗框函數與整合窗框函數之乘積形成的窗框的頻率響應。這 可表示成代數方式: 阶6⑻=⑽6(«)奶6(旬 j - ^ (5a) WP,{n)=WAx{n)WSx{n) (5b) ____一— 本紙張尺度埤爪中闪阀家枵今(7'NS ) Λ4^δ ( 210 X297^^ """' "' 料衣t —I! 訂.1 —_ _~線 (誚先閱请背面之-注意事項本頁j (5d) Λ d T- A" 印!^ ;Λ345 2 A7 --、_B7 — 五、發明説明(29 ) 其中叱4ό(«) = α=6的分析KBD窗框函數 吻办)=α=6的整合KBD窗框函數, 1吵e⑻= α=6的KBD乘積窗框函數 叱4|(«)二α=1的分析KBD窗框函數, 吻〗(《) = α=1的整合KBD窗框函數,及 二α=1的KBD乘積窗框函數 右整合窗框函數被修改以轉換端到端頻率警應為一些 其他所需的響應,如此必需修改其本身與分析窗框^數的^ 積等於所需響應之乘積的窗框。若反應沙Ρ!的頻率響應被要 求且分析窗框函數似6被用於信號分析,則此關係可表示成 代數方式為:
Wpi(n)^WA6(nWX(n) (5c) 其中需要轉換頻率響應的整合窗框函數。 這可寫成: 哪)=¾ 若接合疊間隔延伸到在框中重疊尾端資料段之鄰近音 頻資料段,則窗框函數WX的實際形狀比起表示式(5d)所顯 示是有些較為複雜。以下以會有更允分的討論。在任何情形 中’表示式(5d)精確地表示了在尾端資料段的那部份要求的 窗框函數WX,該尾端資料段不重疊框中任何其他資料段。 對於使用0-TDAC的系統,那部份等於資料段長度的一半, 或對 0 S η < N/2。 若整合窗框函數WX被用來從較高α輪廓到較低α輪廓 轉換端到端頻率響應,則在接近框邊緣必需有很大的值。 如圖九中顯示的例子,其中曲線351解〇t=l的KBD分析 或整合窗框函數,及曲線352圖解α=1的KBD乘積窗框, 曲線356圖解α=6的KBD分析或整數,及曲線359根 (Τί^Γ) ( 2,0x 297^# )Wll m ύ --1.--:-----裝------訂------線- (对先閱讀背而之注意事項/>..寫本頁) 43452 A7 B7 五、發明説明 (30 ) ‘ 據表示式(5d)圖解整合窗框函數。當曲線356接近框邊緣 時,曲線356會非常小於曲線352 ;因此,曲線359成為非 常大。不幸地,其形狀像曲線359窗框函數WX的邊緣處具 有很大的增加之整合窗框函數會有很差的頻率響應特徵且 將退化了恢復信號的聲音品質。用來解決此問題有兩種技術 以下將會討論。 抛棄樣本 用以修改整合窗框函數第一個技術避免在窗框函數的 WX中有很大的增加,這是藉由在分析窗框函數有最小值的 框邊缘處拋棄一些數量的樣本。藉著改變拋樣本的數目,在 框重疊間隔中傳轉樣本所要求的頻寬可獲得好處以防止在 解碼器中較差的頻率響應特徵導致系統編碼性能的衰減。 例如,假如在框之中對前三個資料段修改整合窗框函數 以完成與乘積窗框函數WP, —致所需的頻率響應及用來做 信號分析的窗框函數是wa6,則要求修改整合窗框函數如 下: (1Ϊ先閜请背面之注意事項再4.艿本頁) -裝- 訂 WP^n- x) WAs{n) WP^n- x)WC45(n) 0 <n<x jV 對於x ! « < — 2 货於^-in<N 2 (6a) 中 標 .杓 工 消 f: 合 ίΐ 社 印 WX2(n) WX3(n)
Wp[n -x+—V^(«) 2. WA6{n) [WPt («- x+N) WA6 («) I WA6{n)
N 對於 0 < « <-- 2 對於令+ x < « < #
0 < n < x x<n <N (6b) (6c) 其中WXl(n)=對第一個資料段的修正整合窗框函數 WX2(n)=對第二個資料段的正整合窗框函數 本紙张尺度滴川十1¾¾家標今((’NS > ΛΊ现格(210'χπ7公荩) 轉: m'·:] 4 345 2 913 Α7 Β7 五、發明説坍(31 ) · WX3(n)=對第一個資料段的修正整合窗框函數 在框邊界處拋的樣本數 圖十A對於X的數個值圖解了修正整合窗框函數的形 狀,該修正整合窗框函數要將使用KBD ot=6的分析窗框函 數之256-點0-TDAC分析-整合系統轉換成一個分析-整合系 統的頻率響應是等效於使用KBD α=1的分析與整合窗框函 數之系統的頻率響應,前述分析與整合窗框函數是有等於 256個本之框重疊間隔。曲線361、362、363與364分別 是對;c=8,16,24與32樣本的修正整合窗框函數。 使用這些修正的窗框函數的整合濾波器组之頻率響應 係顯示在圖十B中。曲線372、373與374分別是對x=8,16 與24樣本的頻率響應。曲線371是使用α=1之KBD窗框函 數之整合濾波器组的頻率響應。這可從此圖瞭解x=16的修 正整合窗框函數衰減頻率大約在200Hz以上,這與使用cx=l 之KBD窗框函數的整合濾波器組可完成大約相同的程度。 換句話說,當使用關於分析濾波器组與α=6分析窗框函數時 x=16樣本的整合濾波器組能達到端到端分析_整合系統的頻 率響應,這是等效於使用α=1的分析與整合窗框函數的系統 的端到端頻率響應’在此同時,提供—整合濾波器組的頻率 響應4係衰減頻率大約接近200Hz以上,這是與使用α=〗的 整合窗框函數的整合濾波器組之頻率響應一樣多。 對於一般編碼使用具較低值的α之KBD窗框函數的系 統通常將需要對整合窗框函數及框的末端處少許被拋棄的 樣本做小的修改。在框的末端處所要求的修改整合窗框函數 是類似於表示式(6a)至(6c)所顯示的窗框函數,但除了時間 反向(Time Reversal)之外。 調變框增益輪廓- 對於修正整合窗框函數的第二技術可藉由允許增益輪 * 〜一 _ 丨丨 - .· _______ 本紙张尺度通i'NS ) Λ4ί^ ( 210-^7¾ ). 11 --=,1±私 訂 I 線 (ίί先閱請背面之注意事項异>..寫本页) A7 B7 WP^WMjn) WA6(n) WP^n) WA6{n) WP^n^WA^ri) WXl(n) 43^529« 五、發明说明(32 ) ~ 廓在一接合的任一邊端直接稍微偏離理想的位準以避免窗 框函數WX很大的增加,藉著改變增益輪廓中的偏差,該偏 差的可聽度可獲得改善以防聽到頻率干擾的聲音。 此技術使修正整合窗框函數平滑,如此使其在框邊界或 其附近處具有較小的值。當適當地執行後,產生的 函數將有可接受的頻率響應且框增益輪廓在框邊界或其附 近處將偏離理想的KBD乘積窗框函數,其中在框邊界附近 的增益相對地較低。頻率干擾的衰減與理想的同時淡出及淡 入之增益形狀所提供之衰減相比較將僅稍微地降低。 例如,對於一框中的前三個資料段若整合窗框函數必須 被修正以達到所需的頻率響應,則對第二與第三資料段所要 求的修正整合窗框函數评\ 一般與上述表示式(6b)與(6c乂對 χ=〇)所顯示的相同。於上述表示式(6a)所顯示的修正整合窗 框函數WX1被一平滑窗框函數以點對點相乘的方式使其平 ,,且在該平滑窗框函數之長度的前半段期間完成相乘。對 弟賢料段所產生之修正整合窗框函數為; 對於0 < w < f 2 ,於已<n<^~ 2 2 繁於^~ <n <N 2 其中 WM(n)=平滑窗框函數, P =平滑窗框函數的長度,假設小於N 樞的Μ邊處所需之修正整合窗框函數與此窗框 數完全相同,除了時間反向之外。 平清窗框函數WM基本上可以任何窗框函數為基礎; 而’ KBd平滑窗框函數似乎運算j罈釋好。在此例子中, 滑窗框函數為一α=6,長度為窗框函數。在圖 装------訂------線 (哿先閱讀背面之注意事項-?、寫本頁j 及 然 平 434529^ A7 B7 五、發明説明(33 ) ‘ 11A中,曲線381圖解了沒有平滑之修正整合窗框函數的形 狀,以及曲線382圖解了有平滑之修正整合窗框函數的形 狀0 ' 對於使用平滑之修正窗框函數的分析-整合系統的頻率 響應顯示於圖11B中。曲線391表示使用平滑之修正窗框函 數所產生之頻率響應。曲線341表示使用α=1之KBD窗框 函數之分析-整合系統的頻率響應,及曲線393表示對於使 用大約5msec期間的線性地錐形框同時淡入及淡出窗框函 數所產生之頻率響應峰值的包絡線,如上所討論且如曲線 343所圖解。從此圖中可瞭解,一平滑之修正整合窗框函數 達成的頻率響應類似於使用α=1之KBD窗框函數的分析-整 合系統所達到的頻率響應。 混合分析-整合窗框函數修正 在上面討論的技術中,對框增益輪廓的所有改變被做在 信號整合處理。如同一個替代方案是分析處理可對框邊界的 資料段使用有一種頻率響應的濾波器组,且對中間的資料段 使用另一個濾波器组。對於框邊界處的資料段所使用的濾波 器组可設計成減少在整合處理中所要修正的量以達到接合 處頻率干擾有足夠的衰減。 資料同步 在同時處理視頻與音頻資訊的應用中,一般視頻框長度 是不等於音頻資料段長度。對於在表三與表四中所顯示的標 準,視頻框與音頻資料段很少被同步。不同地說明是,在一 視頻框邊界上視頻/音頻資訊的編輯並不是可能在音頻資料 段的邊界。因此,在資料段編碼系統中,被剩餘的部份資料 段所表示的音頻資訊是無法適當地恢復。可用解決此問題的 兩種技術以下將有所討論。 音頻取樣頻率的@ (請先閱讀背面之注意事項声V寫本頁) 本紙张尺度询州屮阀改家標彳((’NS ) Λ4規格(2Ι0Χ 297公釐) A7 B7 34 五、發明説明( 第-種技術係轉換以外部頻率接收的輸入音頻伊號成 為在編碼系統的内部處理中所使用的另一頻率。該内 被選擇來_部信號提供-個足_頻寬,从許以適+的 樣本數與每-視頻框成為群組。在解瑪或放映的時候^出 信號被㈣賴⑽換耕㈣率,其中並不f要等於原始 輸入音頻信號的外部頻率。 表五顯示了幾種視頻標準之視頻框長度,在每秒48κ個 樣本時音頻樣本的數量,該取樣率等於視頻框長度,轉換這 些曰頻心本成目標樣本數所需的内部頻率及樣本中内部音 頻框的長度,以下將有所討論。對於每一視頻標準後面括號 内的數據是單位為赫茲(Hz)的視頻框頻率。對於大於3〇Ηζ 的視頻框頻率,目標樣本數為896。對於視頻框頻率不大於 30Hz,目標樣本數為Π92。為了圖解說明所以選擇這些目 標長度’但是Ϊ4些目標長度對許多編碼應用亦是便利的長 度,因為它們可以被分割彼此重疊128樣本之256-樣本資料 段的整數倍。 視頻標準 框長度 (msec) 音頻頻率 (樣本) 内部頻率 (kHz) 内部 框ί DTV(60) 16 667 800 53.76 1024 NTSC(95.94) 16.683 800.8 53.706 1024 PAL(50) 20 960 44.8 1024 DTV(30) 33.333 1600 53.76 1920 NTSC(29.97) 33.367 1601.6 53.706 1920 PAL(25) 40 1920 44.8 1920 Film(24) 41.667 2000 43 1920 DTV(23.976) 41.7 2002 42.965 1920 表五視頻與音頻頻率 例如,在每秒48Κ個樣本時處理,赞、公音頻信號以及每秒 25個框時處PAL視頻信號的應用可輸入音頻信號成為 ----^-----^------iT------線· (誚先閱讀背而之注意事項再本萸) Α7 ___________Β7____ 五、發明説明(35 ) 〜 ,有每秒43Κ個樣本之頻率的内部信號。為了處理該内部作 ^樣本可安排在内部音頻框中。在表五中賴示的子,内^ 曰^框長度♦ 192°個樣本。在這些例子中,内部音頻樞長 度是:f等於視_長度i個不㈣係由於樣本的數量 此在二個框中音頻樣本重疊了另一個框中的音頻樣本。 味參考圖二C中圖解的例子,每一係以一些數量的樣本 重疊另-個框。這個樣本數量構成了框重疊間隔。在許多應 用中,樞重疊間隔在各別的框之内是等於鄰近音頻資料段之 間的重疊間&。等於_個視頻柩長度的樣本數是指從一個框 的起始制T —健的起始销展間的_之樣本數。這等 於内部音頻框長度而小於柩重叠間隔中的樣本數。 在表五中所顯示且上面所討論的例子中,等於視頻框長 度=樣本數是1792或柳兩者之一,這可根據視頻框頻率 而疋。框重疊間隔是128個樣本。對於視顏框頻率大約 3〇ΗΖ,每一内部音頻框包括1024(896+128)個樣本,可安排 成彼此重疊128個樣本之256_樣本數的7個資料段。對於較 低的視頻框頻率’每—内部音頻框包]92〇(1792+128)個樣 本’可安排成彼此重疊128個樣本之256-樣本數的14個資 料段。 枵"—部中少標""兑^消贽合仍^印^. ---------_ _ I If ------- 丁 ^--11 f謂先閲请背面之注意事項再湾本頁) 假如使用不會在框邊界產生偽音或加工音的濾波器 組’框重疊間隔最好是增加到256個樣本,係對大於3〇Ηζ 的視頻樞頻率增加内部框長度到1152(896+256),而對於較 低的視頻框頻率增加内部框長度到2〇48(1792+256)。 以要求的視頻框頻率同步一音頻信號所需的内部樣本 頻率是等於視頻框頻率與等於該視頻框長度之樣本數目的 乘積。這是等於是: = Ry*(LA - L〇) !:v (8) 其中办二内部樣本頻率 二-1 本縣凡度制中_家料一- 43452 9¾ A7 B7 ^-•Λ·ΐρ十决^^^妇工消贽合竹社印*'·1^ 木紙仏尺度制彳,賴讀1 ( ('NS ) ( 210X 297/^# 五、發明説明(36 =視頻框頻率 L二内部音頻長度,及 !乙〇 =框重疊間隔。 圖十二A圖解了裝置400的功能方塊圖,其中轉換4(B 從路徑402接收具有外部樣本頻率的輸人音頻信號,以轉換 該輸入音頻信號成為具㈣部樣林率㈣雜號且傳送 此内部信號至編褐404。在對内部信號的響應中,編碼4〇4 沿著路徑405產生以内部音頻框所排列的編碼信號。格式 406從路徑則接收以框方式排列的視頻資訊且組合内部音 頻框與每一視頻框以沿著路徑407產生輪出信號。 圖十二B圖解了裝置410的功能方塊圖,其中解格式412 從路徑411接收以框以框方式排列的輪入信號,該框包含 視頻資訊與編碼的音頻資訊。解格式412所獲得的輪入信號 視頻^訊是沿著路徑413傳送,且所獲得的輪人信號編碑的 音頻資訊是沿著路徑414傳送,前述編碼的音頻資訊係以内 部音頻框方式排列。解碼415解瑪該編碼的音頻資訊以產生 具有内部樣本頻率的内部信號並傳送至轉換4丨6。轉換416 將内部乜號轉換成具有外部樣本頻率的輪出信號。 基本上是可以使用任何的樣本頻率轉換技術,對於檨本 頻率轉換的各種考Ϊ與實施方式揭露於Adams與Kwan在 1993 年 7 月 J0umal of Audio Engr. Soc.第 41 冊第 7/8 號的第 539頁到555買所刊出的論文「Theory and VLSI Architectures for Asynchronous Sample Rate Converters」中0 動態音頻框對位 假如不使用取樣頻率轉換,則音頻框頻率必須隨著視頻 框頻率變化。内部音頻框長度可設定為便利的長度,即合理 的較大2次方的整數倍,以便利於殺處理,諸如使用轉 換的分頻編碼。然後,框重疊間隔^如楚等於内部音頻框長 觀. ^1. — ,1τ-------^— (銷先閲讀背16之注意事項尸^-巧本頁) 43452 91^ A7 ’1 ____Β7____ ___ 五、發明説明(37 ) - 度與正確地展開—視頰框的樣本數之_差值。這可表示為 L〇^La- Lv (9) 其中以音頻樣本數表*視頻根長度 不幸地,如上面表五中所顯示,此技術對於那些處理 NTSC視㈣應用較騎雜,因為NTSC視頻框頻率不是音 頻取樣頻率的整數倍。這是由於NTSC框長度是不等於音頻 樣本的整數數量。如表四中所示,NTSC視頻的五個框被要 求以每秒48K個本之頻率同步音頻的8〇〇8個樣本。五個框 的群組在此係當做超級框(Superframe)。 在一個超級框中與每—視頻框一致的音頻樣本數量不 是定數而是可變的。許多的排列都是可能是但對於29.97Hz NTSC視頻的最佳排列是分別符合ι6〇2、16〇1、16〇2、 1601及1602個樣本的連續五個框。對於59.94Hz NTSC視 頻,類似的順序也可使用,其中對於每一 1602資料段取代 了一對801-樣本數資料段且對於每一 1601資料段取代了 801/800-樣本數資料段對。以下所討論指導了對處29.97Hz 視頻框的應用的一種解決方式。這些觀念可被應用至其他視 頻框頻率。 如表示式(9)所顯示,解碼器必須能決定視頻框長度 Lv,如此才可正確地決定重疊間隔的長度。假如解碼器在 框邊界上面臨到接合編輯,緊接在該接合的框可表示五個可 能的超級框對位(Superframe Aligements)之任何一個。解碼器 將無法恢復由緊接在接合之後的資料段所表示的聲音,除非 這些資料段符合使用的解碼器之超級框對位。這可藉由下述 動態音頻框對位技術來完成。 根據此技術,如圖十三A中所圖解的裝置420中,編碼 423從路徑422接收音頻資訊且產生級框的方式排列的 編碼音頻資訊,其中以標記(Label)戒^認每一框’該標記在 _卜一;_ 紙張尺廋i4 W中闲戌ϋ呤;(,NS ) Λ4规格(210X297公# ----·-----Λί衣------ΪΤ------ (請先閱讀背面·5;"意事項罗〜寫本頁) 2 9¾ A7 五、發明説明(38 ) 各別的趄級框中對每-框是,的。編碼音頻資訊的超級框 沿著路㈣5被傳送,且順著徑似傳送框標記。格式似 順著路徑仍接收視頻賢訊的框且組合此視頻資訊'編碼音 頻資訊的框及相對應之標記成為一輪出信號,並順著路徑 427被傳送出去。 在圖十三8中所圖解的裝置43〇中,解格式432從路徑 431接輪入信號’以獲得視頻資訊的框,那些框順著路徑如 被傳送;及獲得㈣音m的超級框㈣,_超級框序 列順著路徑435被傳送;以及獲得編碼音頻資訊的每一框的 標記’那標記是順著路徑434被傳送。處理⑽;決定依記所 警應之編瑪音頻資訊的每—框的起始樣本與框長度,且解碼 438順著路徑439產生輪出信號,這是根據處理视所決定 的,始樣本與框長度解褐編褐之音頻資訊的框而獲得的輸 出信號。 在較佳的實施例中,在每一超級框中框被標記上〇 , 1 2 ’ 3與4。在框〇中起始的樣本是假設很正確地與視 频信號框邊界同步。在一超級框中每一框是以相同結構產 生’具有 ''初期樣本"、、、正常起始樣本〜以及對於總數 祕個樣本的16G1個其他樣本。在較佳實施中,樣本編號 從〇到1602,其中正常起始樣本是樣本編號i ;因此,視 頻樞度疋16G3 ’如上所討論,由於框重叠間隔所以内部音 框長度可較大。-個合宜的内部音頻框長度是1792個樣 本。框增益Μ是根據1603的餘長度來決定的。對於剛 才提及的例子,重疊間隔是189(17吃·)個樣本。、 裝垔430假設了任所要的超級框對位且動態改變每一音 ,的對位,如此才可與視頻·f訊達到較適當的同步。對: 疋藉由動遽選擇起始樣本與每—長度赛改變。如上所述,根 級框中5-框的樣式(Pattern)長度赞於16〇1與16〇2樣 ----.-----¾------ϊτ------線 {•ΐί?先閱讀背面之注意事項罗>丄:55本頁j
434529^ Α7 ---- Β7五、發明説明(39 ) > 本之間變化。此動怨對立的效果是在接合之後可直接達到適 當的對位’以保留與隨同的頻資訊的同步。 在此所討論的較佳實施例,起始樣本數與視頻框長度可 根據下列關鍵而從一個表中獲得: K = (Fe - Fd) modulo 5 ⑽) 其中K =對位表存取關鍵 fe =編碼器框標記 FD二解碼器框標記 解碼器從編碑的信號獲得編褐器框標記。根據解碼器所 設的超級框對位,解碼器框梯記被解碼器以0到4的重複順 序產生。 解碼器使用存取關鍵K從表五獲得適當的框起始樣本 數量與視頻框長度。 存取編瑪框起始 關鍵標記樣本 0 0 f 0 1 1 0 2 1 0 3 1 0 4 1 視頻寬 長度 2 12 12 ο ο ο ο ο 6 6 6 6 6 1Α 11 11 11 1Α 存取編碑框起如 關鍵標記 多i '''T 1 視頻寬 長度 —Ϊ602 1602 1602 1602 1 --..-------裝------訂------線 (誚先閱讀背面之注意事項wv4{?·;本頁) ο 1 2 3 4 2 0 1 1601 3 0 2 1 0 1601 3 1 2 2 1 1602 3 2 2 3 1 1601 3 3 2 4 1 1602 3 4 4 0 1 1601 4 1 0 1601 4 2 1 1601 4 3 0 1601 4 4 1 1602 表五動態音頻框:_ 1602 1601 1602 1602 1602 '本紙张尺度過州中闽阄家標屮((,ns)八‘视格(公犛) 經沪部屮夾liif-^e-t消贽合竹社印父 二 5 2‘ 9 _ A7 -------------B7 五、發明説明(4〇 ) _一 在圖十四中圖解說明動態對位的例子。在這個例子中, 超級框從框453開始且在框455之後被一接合所中斷。在超 級框中最從框456跟隨在前述接合,而接著以框457為起始 的一個新的超級框。在每一框中音頻賢訊的理想長度顯示在 列450之中。對於編碼器所產生的每一框之編碼器框標記下 Fe則顯示在列461中。而注意的是標記〇係符合至每一起級 框中的第一框。在此例子中,解碼器所假設的解碼器標記Fd 是顯不在列462。根據表示式(10)所計算,介於這些兩個標 記之間差異決定了對位表在取關鍵κ,此關鍵尺係顯示於 列463中。當從對位表決定後,起始與結束樣本數顯示於列 464中。例如,記號0-1601是意味著在樣本〇起始而在樣本 1601結束的一個1602-樣本框。 在框451中,解碼器處理一個有16〇2個樣本長度的資 料段。根據編碼的超級框對位,此框是比、、理想"長度為長 的樣本。因此,框452較慢開始一個樣本而且是一個比理想 長度為短的樣本。這在框453中產生,而該框453在樣本編 號1處開始,準確地與起超級框的第一框同步。框454與框 456的對位符合理想對位。 直接在接合之後,框456的對位符合理想對位。框45? 在樣本編號1處開始,準確地與下一個超級框的起始同步。 然而’框457的長度是一個小於理想長度的樣本,所以框458 較快開始一個樣本而且有比理想長度為長的樣本長度。框 459的起始符合理想但卻是一個比理想短的樣本。因此,框 460更快開始一個樣個且是一個比理想長的樣本。 如此例子所顯示,解碼器完與每一超級框的起始準確的 同步而沒有由接合造成的任何不連續。 裝置430以類似於上述關於表令:讀^6a)到(6c)所討論的 ---------^------IT------.^ (先閱請背面之注意事項# 4寫本頁)
部屮次¾涑而β.τ消fr合β.ί.1印V A3A52 9¾ at ' B7 五、發明説坍(41 ) 方式使用了修正的整合窗框函數來完成適當的端到端框增 益輪廓。修正的整合窗框函數在每一框的起始處根據表示式 (6a)來▲定,其中在框邊界處''拋棄〃的樣本數jc是等於框 起始對位抵銷相對的較早起始樣本。例如,對樣本2處起始 的框,λ=2。在每一的結束處修正整合窗框函數亦是根據表 示式(6a)來決定的,但除了時間反向的方式外。 轉.
]^:M I 1* ' Λ I / ---------裝------訂------線 2?先閱请背面之注意事項界呔寫本頁)
本紙张尺度過川屮囚S家时('NS M4現格公筇) 1?KJ

Claims (1)

  1. 經濟部中央標準局負工消費合作社印製 /-λ〇29^ έΙ C8 D8六、申請專利範圍 ι 1. 一種信號處理的方法,包含: 接收一包含一序列框的輪入信號,各別的輪入信號 框包舍信號樣本的起始資料段、信號樣本的一個或多個 中間資料段及信號樣本的結束資料段,信號樣本的前述 資料段表示音頻資訊; 對各別的輸入信號框反應,信號樣本的前述起始資 料段利用第一濾波器組產生第一濾波信號,信號樣本的 前述一'個或多個中間資料段利用第二濾波器組產生第 二濾波信號,及信號樣本的前述結束資料段利用第三濾 波器組產生第三濾波信號,其中每一前述第一、第二與 第三濾波器組有一各別長度,前述第一與第二濾波器组 的各別長度不相等且前述第二與第三濾波器組的各別 長度不相等,以及 組合前述第一遽波信號、第二慮波信號與第三ϊ慮波 信號成為一各別的輸出信號框以產生適於傳輸或儲存 的輸出信號,藉此組合對前述複數輸入信號框反應產生 的第一、第二與第三濾波信號而產生一序列輸出信號 框。 2. —種信號處理的方法,包含: 接收一包舍一序列框的輸入信號,各別的輸入信號 框包含信號樣本的起始資料段、信號樣本的一個或多個 中間資料段及信號樣本的结束資料段,信號樣本的前述 資料段表示音頻資訊; 丨您. .,雄 V..、: _: _ 本紙張尺度逋用中國國家搮準(CNS ) Α4说格(210Χ297公釐)i (請先閱讀背面之注意事項寫本頁) 經濟部_央標率局男工消費合作杜印製 / B8 D8六、申請專利範圍 對各別的輪入信號框反應,信號樣本的前述起始資 料段利用第一濾波器组產生第一濾波信號資料段,信號 樣本的前述一個或多個中間資料段用第二濾波器组產 生一個或多個第二濾波信號資料段,及信號樣本的前述 結束資料段利用第三濾波器組產生第三濾波信號資料 段,其中前述第二濾波器组產生具有偽造資料的前述第 二濾波信號資料段,前述第一濾波器組產生具有偽造資 料的前述第一濾波信號資料段,該偽造資料消除在各別 的第二濾波信號資料段中的偽造資料但實際上並無其 他偽造資料,及前述第三濾波器組產生具有僞造資料的 前述第三濾波信號資料段,該偽造資料消除在各別的第 二濾波信號資料段中的偽造資料但實際上並無其他偽 造資料,以及 組合前述第一濾波信號資料段、一或多個第二濾波 信號資料段與第三濾波信號資料段成為一各別的輸出 信號框以產生適於傳輸或儲存的輸出信號,藉此組合對 前述複數輪入信號框反應產生的第一、第二與第三濾波 信號資料段而產生一序列輪出信號框。 3.如申請專利範圍第1或2項所述之信號處理的方法,其 中在一各別的輸入信號框中前述信號樣本資料段彼此 以N/2個樣本重疊, 前述第一濾波器組的長度為3N/2且有偽造(aliasing) 特徵,諸如對前述第一濾波信號的響應,一互補第一整 (請先聞讀背面之注意事項孑4'寫本頁) 本紙浪尺度逋用中國國家捸準(CNS ) A4规格(210X297公釐) 434529 A8 B8 C8 D8 經 濟 部 中 央 標 準 % Ά X 消 費 合 作 社 印 裝 本紙張尺度適用宁國國家梯準(CNS ) A4現格(210X297公着 申請專利範圍 合濾波器组產生信號樣本的恢復起始資料段,該起#資 料段係在中間N/2個樣本具有僞造成分且在前面 個樣本不具有偽造成分, 前述第二濾波器组的長度為N/2且有偽造特徵,諸 如對前述第二濾波信號的響應,一互補第二整合滹竣= 組產生信號樣本的一個或多個恢復中間資料段,且每 個資料段具有偽造成分,及 前述第三濾波器組的長度為3N/2且有偽造特徵, 諸如對前述第三濾波信號的響應,一互補第三整合躁破 器組產生信號樣本的恢復結束資料段,該結束資料段係 在中間N/2個樣本具有偽造成分且在後面n/2個樣本 不具有偽造成分。 4.如申請專利範圍第3項所述之信號處理的方法,其中 前述第一濾波器組以第一種轉換與長度為3N/2個 樣本的第一分析窗框函數實現,其中前述第一窗框函數 有長度為N/2的第一部分,與長度為N/2且實降上孓為 零的第二部分’以及長度為N/2且實際上為零的第三杳 分; 〜15 則述第二濾波器組以第二種轉換與長度為N個栌 本的第二分析窗框函數實現,其中前述第二窗框函數有 長度為N/2個樣本的第一部分,以及長度為N/2且實陕 上不為零的第二部分,及 ' + 前述第三遽波器組以第三種轉換與長度為3N/ > " ·· j X;' '-; _$代! m -n n 裳 — I I I 訂—I H —1 I n 線 (請先閎讀背面 <注意事項#教寫本耳) A8 B8 C8 D8 六、申請專利範圍 樣本的第三分析窗框函數實現,其中前述第三窗框函數 有長度為N/2且實際上為零的第一部分,與長度為N/2 的第二部分,以及長度為N/2且實際上不為零的第三部 分0 5. 如申請專利範圍第4項所述之信號處理的方法,其中前 述第一分析窗框函數的第一與第二部分是源自Kaiser-Bessel窗框函數,前述第二分析窗框函數是源自前述 Kaiser-Bessel窗框函數,及前述第三分析窗框函數的第 二與第三部分是源自前述Kaiser-Bessel窗框函數。 6. —種信號處理的方法,包含: 經濟部中央樣隼局員工消费合作社印策 (請先閲讀背面之"意事項孑4寫本頁) 接收一包含一序列框的輸入信號,各別的輸入信號 框包含第'一;慮波信號、第二遽波信號及第三ί慮波信號; 對各別的輪入信號框反應,前述第一濾波信號利用 第一整合濾波器组產生信號樣本的起始資料段,前述第 二濾波信號利用第二整合濾波器組產生信號樣本的一 個或多個中間資料段,及前述第三濾波信號利用第三整 合濾波器组產生信號樣本的結束資料段,其中每一前述 第一、第二與第三整合濾波器组有一各別長度,前述第 一與第二整合濾波器組的各別長度不相等且前述第二 與第三整合濾波器組的各別長度不相等,以及 產生一序列輸出信號框,各別的輸出信號框包含複 數個信號樣本資料段,其中各別的框包含前述起始資料 段、前述一個或多個中間資料段及前述结束資料段,其 本紙張尺度逋用中國國家標牟(CNS ) Α4規格(210 X 297公* 4 3 452 8 8 88 ABCD 經濟部中央標率局負工消費合作社印製 々、申請專利範圍 中前述信號樣本資料段表示音頻資訊。 7. —種信號處理的方法,包舍: 接收一包含一序列框的輸入信號,各別的輪入信號 框包含第一濾波信號資料段、一個或多個第二濾波信號 資料段及第三濾波信號資料段; 對各別的輸入信號框反應,前述第一濾波信號資料 段利用第一整合濾波器組產生信號樣本的起始資料 段,前述一個或多個第二濾波信號資料段利用第二整合 濾波器組產生信號樣本的一個或多個中間資料段,及前 述第三濾波信號資料段利用第三整合濾波器組產生信 號樣本的結束資料段,其中前述第二整合濾波器組產生 具有偽造資料的前述中間資料段,前述第一整合濾波器 組產生具有偽造資料的前述起始資料段,該偽造資料消 除在各別的中間資料段中的偽造資料但實際上並無其 他的偽造資料,及前述第三整合濾波器組產生具有僞造 資料的前述结東資料段,該偽造資料消除在各別的中間 資料段中的偽造資料但實際上並無其他的偽造資料,以 及 產生一序列輸出信號框,各別的輪出信號框包舍複 數個信號樣本資料段,其中各別的框包含前述起始資料 段、前述一個或多個中間資料段及前述結束資料段,其 中前述信號樣本資料段表示音頻資訊。 8. 如申請專利範圍第6或7項所述之信號處理的方法,其 查t .I知 _^_ (請先閲讀背面之注意事項再填寫本頁) 本紙琅尺度逋用中國國家標準(CNS) A4说格(210X:297公釐) D8 六、申請專利範圍 ' 中在一各別的輸出信號框中前述信號樣本資料段彼此 以N/2個樣本重疊, 前述第一整合濾波器组的長度為3N/2且產生信號 樣本的前述起始資料段,該起始資料段係在中間N/2個 樣本具有偽的(aliasing)成分且在前面N/2個樣本不具 有偽的成分, 前述第二整合濾波器組的長度為N且產生信號樣 本的前述一個或多個中間資料段,且每一中間資料段 具有偽的成分,及 前述第三整合濾波器組的長度為3N/2且產生信號 樣本的前述結束資料段,該結束資料段係在中間N/2個 樣本具有偽的成分且在後面N/2個樣本不具有偽的成 分。 9.如申請專利範圍第8項所述之信號處理的方法,其中 經濟部中央標準局員工消費合作社印製 前述第一整合濾波器組以第一種轉换與長度為 3N/2個樣本的第一整合窗框函數實現,其中前述第一窗 框函數有長度為N/2的第一部分,與長度為N/2且實際 上不為零的第二部分,以及長度為N/2且實際上為零的 第三部分; 前述第二整合濾波器組以第二種轉換與長度為N 個樣本的第二整合窗框函數實現,其中前述第二窗框函 數有長度為N/2個樣本的第一部分,以及長度為N/2且 實際上不為零的第二部分,及 •:V Τ·α , ....,.-…
    (請先敗讀背面之注意事項|填寫本頁) 本紙張尺度適用中國國家標準(CNS ) A4洗格(210X297公釐) 0 9 2 〔3 8 8 8 8 ABCD 經濟部中央標準局員工消費合作社印製 六、申請專珂範圍 前述第三整合濾波器組以第三種轉換與長度為 3N/2個樣本的第三整合窗框函數實現,其中前述第三窗 框函數有長度為N/2且實際上為零的第一部分,與長度 為N/2的第二部分,以及長度為N/2且實際上不為零的 第三部分。 10. 如申請專利範圍第9項所述之信號處理的方法,其中前 述第一整合窗框函數的第一與第二部分是源自Kaiser-Bessel窗框函數,前述第二整合窗框函數是源自前述 Kaiser-Bessel窗框函數,及前述第三整合窗框函數的第 二與第三部分是源自前述Kaiser-Bessel窗框函數。 11. 一種信號處理的裝置,包舍: 用以接收一包舍一序列框的輸入信號之裝置,各別 的輸入信號框包含信號樣本的起始資料段、信號樣本的 一個或多個中間資料段及信號樣本的結束資料段,信號 樣本的前述資料段表示音頻資訊; 對各別的輸入信號框反應,藉著信號樣本的前述起 始資料段利用第一濾波器組而用以產生第一濾波信 號,藉著信號樣本的前述一個或多個中間資料段利用第 二濾波器組而用以產生第二濾波信號,及藉著信號樣本 的前述結束資料段利用第三濾波器組而用以產生第三 濾波信號之裝置,其中每一前述第一、第二與第三濾波 器組有一各別長度,前述第一與第二濾波器组的各別長 度不相等且前述第二與第三濾波器組的各別長度不相到__防,广_ 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) ----------装------、玎-------0 (請先閱讀背面t注意事項"填寫本頁) AS B8 C8 D8 m κ、申請專珂範圍 等,以及 藉著組合前述第一濾波信號、第二濾波信號與第三 遽波信號成為一各別的輪出信號框而用以產生適於傳 輪或儲存的輸出信號之裝置,藉此組合對前述複數輸入 信號框反應產生的第一、第二與第三濾波信號而產生一 序列輸出信號框。 —種信號處理的裝置,包含: 用以接收一包舍一序列框的輸入信號之裝置,各別 的輪入信號框包含信號樣本的起始資料段、信號樣本的 一個或多個中間資料段及信號樣本的結束資料段,信號 樣本的前述資料段表示音頻資訊; 對各別的輸入信號框反應,藉著信號樣本的前述 起始資料段利用第一濾波器組而用以產生第一遽波信 號資料段,藉著信號樣本的前述一個或多個中間資料段 用弟二 >慮波器組而用以產生一個或多個第二遽波信號 資料段,及藉著信號樣本的前述結東資料段利闬第三遽 波器組而用以產生第三濾波信號資料段之裝置,其中前 述第二濾波器組產生具有偽造資料的前述第二遽波信 號資料段,前述第一濾波器組產生具有僞造資料的前述 第一濾波信號資料段,該偽造資料消除在各別的第二渡 波信號資料段中的偽造資料但實際上並無其他偽造資 料,及前述第三濾波器組產生具有偽造資料的前述第三 濾波信號資料段,該僞造資料消f李各別的第二遽波信 j 子..:4. ^ 。 I I n it . —i ^54 I I —訂 I i— i— n n n 線 (請先¾.讀背面之注意事®^:填寫本頁) 經濟部中央標準局具工消费合作社印製 本紙張尺度適用中國國家標準(CNS ) A4規格(2丨〇><297公瘦. m ^ 3452 3^l( A8 ' B8 ___ C8 ——. _ 1 DS 六、申請專利範圍 ^資料段㈣料⑽但料上結魏糾資科 及 藉著組合前述第一遽波信號資料段、-或多個第二 遽波信號資枓段與第三遽波信號資料段成為一各別的 輸出信號框而用以產生適於傳輸或儲存的輸出信號之 裝置―,藉此組合對前述複數輪入信號框反應產生的第 -、第二與第三遽波信號資料段而產生—序列輸出信號 •申凊專利範圍第π或12項所述之信號處理的裝置, 其中在一各別的輸入信號框中前述信號樣本資料段彼 此以Ν/2個樣本重疊, 前述第一濾波器組的長度為3Ν/2且有偽的特徵, 諸如對前述第一濾波信號的響應,一互補第一整合遽波 器組產生信號樣本的恢復起始資料段,該起始資料段係 在中間Ν/2個樣本具有偽的成分且在前面Ν/2個樣本 不具有偽的成分, 經濟部中央棣準局員工消費合作社印製 前述第二濾波器組的長度為Ν/2且有偽的特徵,諸 如對前述第二濾波信號的響應,一互補第二整合遽波器 組產生信號樣本的一個或多個恢復中間資料段’且每一 個資料段具有偽的成分’及 前述第三濾波器組的長度為3Ν/2且有偽的特徵, 諸如對前述第三濾波信號的響應,一互補第三整合濾波 器組產生信號樣本的恢復結東資ft极,該結束資料段係 本紙張尺度逋用中國围家標準(CNS > A4規格(210X297公釐 r f «·' > i V. 顧 經濟部中央標準局員工消費合作社印製 4 34529:-, A8 B8 C8 D8 六、申請專利範圍 i 在中間N/2個樣本具有僞的成分且在後面N/2個樣本 不具有偽的成分。 14. 如申請專利範圍第13項所述之信號處理的裝置,其中 前述第一濾波器组以第一種轉換與長度為3N/2個 樣本的第一分析窗框函數實現,其中前述第一窗框函數 有長度為N/2的第一部分,與長度為N/2且實際上不為 零的第二部分,以及長度為N/2且實際上為零的第三部 分; 前述第二濾波器组以第二種轉換與長度為N個樣 本的第二分析窗框函數實現,其中前述第二窗框函數有 長度為N/2個樣本的第一部分,以及長度為N/2且實際 上不為零的第二部分,及 前述第三濾波器組以第三種轉換與長度為3N/2個 樣本的第三分析窗框函數實現,其中前述第三窗框函數 有長度為N/2且實際上為零的第一部分,與長度為N/2 的第二部分·,以及長度為N/2且實際上不為零的第三部 分。 15. 如申請專利範圍第14項所述之信號處理的裝置,其中 前述第一分析窗框函數的第一與第二部分是源自 Kaiser-Bessel窗框函數,前述第二分析窗框函數是源自 前述Kaiser-Bessel窗框函數,及前述第三分析窗框函數 的第二與第三部分是源自前述Kaiser-Bessel窗框函
    本紙張尺度適用中國國家標孪(CNS ) A4規格(2I0X297公釐 ---------d------ir------,^- (請先Μ.讀背面之注意事項#填寫本頁) 經濟部中央標率局男工消費合作社印製 9® B8 _______D8 六、申請專利範圍 - 16.—種信號處理的裝置,包含: 用以接收一包含一序列框的輪入信號之裝置,各別 的輸入信號框包含第一濾波信號、第二濾波信號及第三 濾波信號; 對各別的輪入信號框反應,藉著前述第一濾波信號 利用弟整合’慮波為組而用以產生信號樣本的起始資 料段,藉著前述第二濾波信號利用第二整合濾波器組而 用以產生信號樣本的一個或多個中間資料段,及藉著前 述第二濾波信號利用第三整合濾波器組而用以產生信 號樣本的結束資料段之裝置,其中每一前述第一、第二 與第二整合遽波器組有一各別長度,前述第一與第二整 合濾波器組的各別長度不相等且前述第二與第三整合 濾波器組的各別長度不相等,以及 用以產生一序列輸出信號框之裝置,各別的輪出信 號框包含複數個信號樣本資料段,其中各別的框包含前 述起始資料段、前述一個或多個中間資料段及前述.结束 資料段,其中前述信號樣本資料段表示音頻資訊。 17. —種信號處理的裝置,包含: 用以接收一包舍一序列框的輪入信號之裝置,各別 的輸入信號框包含第一濾波信號資料段'一個或多個第 二濾波信號資料段及第三濾波信號資料段; 對各別的輸入信號框反應,藉著前述第一濾波信號 資料段利用第一整合濾波器組而汽以產生信號樣本的 丨:¾1 V. (- I V. 紙浪用中關家標率(CNS) Α4*ϋ8·(加X297公;t ) -----— ---------1------ΐτ-------^ (請先閲—背面之注意事項一^寫本頁) 4 3452 9翅 經濟部中央標準局員工消費合作社印袈 申請專利範圍 起始資料段,藉著前述一個戍客 飞多個第二濾波信號資料段 =弟二整合遽波器組而用以產生信號樣本的一個或 ㈣I間料段,及藉著前«三錢信㈣料段利用 器組而用以產生信號樣本的結束資料段 _ +. ^ °4/皮器組產生具有偽造資料 的則述中間資料段,前述第一 n皮n組產生具有偽 把資㈣“起始㈣段’該料消除在各別的中 :資料段中的偽造資料但實際上並無其他的僞造資 料,及前述第三整合歧器組產生具有偽造資料的前述 結束資料段’㈣《料消除在各別的中_料段中的 偽造資料但實際上並無其他的偽造資料,以及 用以產生一序列輸出信號框之裂置,各別的輸出信 號框包含複數㈣號樣本科段,其中各㈣框包含前 述起始科段、前述-喊_巾„料妓前述結束 資料段’其中前述信號樣本f料段表示音頻資訊。 18.如申料職㈣16或17項所狀信號處料裝置, 其中在-各別的輪出信號框中前述信號樣本資料段彼 此以N/2個樣本重疊, 前述第一整合濾波器组的長度為3N/2且產生信號 樣本的前述起始資料段,該起始資料段係在中間N/2個 樣本具有偽的成分且在前面N/2個樣本不具有偽的成 分, 請 先 聞 讀 背 τδ 之' 注 項 i 訂 如述苐一整合濾波器組的長度為N且產生信號樣 --i : •-V 1 ;i 又丨 良紙張尺度適财SI國家標率(CNS ) Α4^ ( 210Χ2·97公釐) 1¾¾ 4 345 2 9^ A8 B8 C8 D8 A、申請專利範圍 本的前述-個或乡財,且每—中财料段 具有偽的成分,及 月’j4第二整合濾波器組的長度為3N/2且產生信號 樣本的前述結束資料段’該結束f料段係在中間n/2個 樣本具有偽的成分且在後面N/2個樣本不具有偽 分。 19. 如申請專利範圍第18項所述之信號處理的裝置,其中 w述第整合遽波器組以第一種轉換與長度為 3N/2個樣本的第-整合純錢實現,其中前述第—窗 框函數有長度為N/2的第一部分,與長度為N/2且實際 上不為零的第二部分,以及長度為N/2且實際上為零的 第三部分; 前述第二整合濾波器組以第二種轉換與長度為n 個樣本的第二整合窗框函數實現,其中前述第二窗框函 數有長度為N/2個樣本的第一部分,以及長度為N/2且 實際上不為零的第二部分,及 經濟部中央梯隼局員工消費合作社印裝 如述弟二整合遽波益组以第三種轉換與長度為 3N/2個樣本的第三整合窗框函數實現,其中前述第三窗 框函數有長度為N/2且實際上為零的第一部分,與長度 為N/2的第二部分,以及長度為n/2且實際上不為零的 第三部分。 20. 如申請專利範圍第19項所述之信號處理的裝置,其中 前述第一整合窗框函數的第一秀第二部分是源自 本紙張尺度適用中國國家標卒(CNS ) A4規格(210X297公釐) 43^52 9'" II D8 經濟部中央樣率局貝工消費合作社印装 六、申請專利範圍 Kaiser-Bessel窗框函數,前述第二整合窗框函數是源自 前述Kaiser-Bessel窗框函數,及前述第三整合窗框函數 的第二與第三部分是源自前述Kaiser-Bessel窗框函 數0 請 先 閲 背 ιέ 之 注- 意 事 項 再 寫 本 頁 本紙張尺度適用中國困家標率(CNS )八4见格(210Χ297公釐)
TW087117091A 1997-10-17 1998-10-14 In the united states patent and trademark office application for united states patent TW434529B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08/953,121 US5913191A (en) 1997-10-17 1997-10-17 Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries

Publications (1)

Publication Number Publication Date
TW434529B true TW434529B (en) 2001-05-16

Family

ID=25493597

Family Applications (1)

Application Number Title Priority Date Filing Date
TW087117091A TW434529B (en) 1997-10-17 1998-10-14 In the united states patent and trademark office application for united states patent

Country Status (16)

Country Link
US (1) US5913191A (zh)
EP (1) EP1023727B1 (zh)
JP (1) JP4236813B2 (zh)
KR (1) KR100567353B1 (zh)
CN (1) CN1267920C (zh)
AT (1) ATE211576T1 (zh)
AU (1) AU762707B2 (zh)
BR (1) BR9813863A (zh)
CA (1) CA2306113C (zh)
DE (1) DE69803402T2 (zh)
DK (1) DK1023727T3 (zh)
ES (1) ES2165704T3 (zh)
HK (1) HK1033195A1 (zh)
MY (1) MY123186A (zh)
TW (1) TW434529B (zh)
WO (1) WO1999021185A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI455119B (zh) * 2006-07-24 2014-10-01 Marvell World Trade Ltd 具有音訊監視模組之旋轉資料儲存裝置

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6163508A (en) * 1999-05-13 2000-12-19 Ericsson Inc. Recording method having temporary buffering
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6678647B1 (en) * 2000-06-02 2004-01-13 Agere Systems Inc. Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
JP4867076B2 (ja) * 2001-03-28 2012-02-01 日本電気株式会社 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法
FR2824978B1 (fr) * 2001-05-15 2003-09-19 Wavecom Sa Dispositif et procede de traitement d'un signal audio
US7369709B2 (en) * 2003-09-07 2008-05-06 Microsoft Corporation Conditional lapped transform
US7292902B2 (en) * 2003-11-12 2007-11-06 Dolby Laboratories Licensing Corporation Frame-based audio transmission/storage with overlap to facilitate smooth crossfading
CA2566368A1 (en) * 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
US8744862B2 (en) * 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
JP4245030B2 (ja) * 2006-09-27 2009-03-25 ソニー株式会社 出力処理装置及びその制御方法
CN101179735B (zh) * 2006-11-08 2010-07-14 中兴通讯股份有限公司 一种多媒体广播系统媒体数据流的封装方法
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US9338523B2 (en) * 2009-12-21 2016-05-10 Echostar Technologies L.L.C. Audio splitting with codec-enforced frame sizes
CN103282958B (zh) 2010-10-15 2016-03-30 华为技术有限公司 信号分析器、信号分析方法、信号合成器、信号合成方法、变换器和反向变换器
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP3342040B1 (en) 2015-08-24 2019-12-18 Dolby Laboratories Licensing Corporation Volume-levelling processing
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
CN115237369B (zh) * 2022-09-23 2022-12-13 成都博宇利华科技有限公司 一种高精度信息戳标记方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US577992A (en) * 1897-03-02 Gas-governor
US4551688A (en) * 1984-05-23 1985-11-05 Rockwell International Corporation Delay compensated automatic gain control
US4625240A (en) * 1984-07-25 1986-11-25 Eeco, Inc. Adaptive automatic gain control
FR2613154A1 (fr) * 1987-03-24 1988-09-30 France Etat Systeme de traitement numerique de signal a bancs de filtres
JP2811369B2 (ja) * 1989-01-27 1998-10-15 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 高品質オーディオ用短時間遅延変換コーダ、デコーダ、及びエンコーダ・デコーダ
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5479562A (en) * 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5069210A (en) * 1989-04-17 1991-12-03 Jeutter Dean C Cochlear implant employing frequency-division multiplexing and frequency modulation
DE59108205D1 (de) * 1990-12-05 1996-10-24 Itt Ind Gmbh Deutsche Verfahren zur Taktratenumsetzung eines digitalisierten Signals
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US5394508A (en) * 1992-01-17 1995-02-28 Massachusetts Institute Of Technology Method and apparatus for encoding decoding and compression of audio-type data
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
EP0738441B1 (en) * 1994-11-04 2002-03-13 Koninklijke Philips Electronics N.V. Encoding and decoding of a wideband digital information signal
ES2143673T3 (es) * 1994-12-20 2000-05-16 Dolby Lab Licensing Corp Metodo y aparato para aplicar una prediccion de formas de onda a subbandas de un sistema codificador perceptual.
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US5732189A (en) * 1995-12-22 1998-03-24 Lucent Technologies Inc. Audio signal coding with a signal adaptive filterbank
US5781888A (en) * 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
EP0827647B1 (en) * 1996-03-19 2002-07-17 Dolby Laboratories Licensing Corporation Analysis/synthesis filtering system with efficient oddly-stacked single-sideband filter bank using time-domain aliasing cancellation
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI455119B (zh) * 2006-07-24 2014-10-01 Marvell World Trade Ltd 具有音訊監視模組之旋轉資料儲存裝置

Also Published As

Publication number Publication date
CA2306113C (en) 2005-08-02
WO1999021185A1 (en) 1999-04-29
MY123186A (en) 2006-05-31
HK1033195A1 (en) 2001-08-17
ES2165704T3 (es) 2002-03-16
EP1023727A1 (en) 2000-08-02
AU762707B2 (en) 2003-07-03
CA2306113A1 (en) 1999-04-29
KR100567353B1 (ko) 2006-04-04
CN1276903A (zh) 2000-12-13
BR9813863A (pt) 2000-09-26
KR20010024051A (ko) 2001-03-26
CN1267920C (zh) 2006-08-02
DE69803402T2 (de) 2002-08-01
US5913191A (en) 1999-06-15
JP2001521259A (ja) 2001-11-06
AU1065699A (en) 1999-05-10
DK1023727T3 (da) 2002-02-11
EP1023727B1 (en) 2002-01-02
JP4236813B2 (ja) 2009-03-11
ATE211576T1 (de) 2002-01-15
DE69803402D1 (de) 2002-02-28

Similar Documents

Publication Publication Date Title
TW434529B (en) In the united states patent and trademark office application for united states patent
TW391137B (en) Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
JP4126681B2 (ja) エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化
TW519629B (en) Data framing for adaptive-block-length coding system
CN104681030B (zh) 用于编码/解码信号的装置和方法
JP4229586B2 (ja) エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化
JP2001521309A5 (zh)
JP4126682B2 (ja) エイリアシング抑制追加フィルタバンク付フレーム・基礎オーディオ符号化
US7020615B2 (en) Method and apparatus for audio coding using transient relocation
CN105453172B (zh) 应用加权噪音的帧丢失的校正
JP2001521308A5 (zh)
JP2001521347A5 (zh)
JPH09505193A (ja) 複数のオーディオ信号を符号化する方法
JP2001521310A5 (zh)
Goodwin et al. Parametric coding and frequency-domain processing in multichannel audio applications

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent
MK4A Expiration of patent term of an invention patent