TWI380288B - Device and method for manipulating an audio signal having a transient event - Google Patents
Device and method for manipulating an audio signal having a transient event Download PDFInfo
- Publication number
- TWI380288B TWI380288B TW098105710A TW98105710A TWI380288B TW I380288 B TWI380288 B TW I380288B TW 098105710 A TW098105710 A TW 098105710A TW 98105710 A TW98105710 A TW 98105710A TW I380288 B TWI380288 B TW I380288B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- time
- audio signal
- transient
- transient event
- Prior art date
Links
- 230000001052 transient effect Effects 0.000 title claims description 164
- 230000005236 sound signal Effects 0.000 title claims description 139
- 238000000034 method Methods 0.000 title claims description 44
- 238000012545 processing Methods 0.000 claims description 49
- 230000003595 spectral effect Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000004904 shortening Methods 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 claims description 5
- 230000000873 masking effect Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000010363 phase shift Effects 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims description 2
- 230000037431 insertion Effects 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 238000003860 storage Methods 0.000 claims description 2
- 230000003362 replicative effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 19
- 238000001228 spectrum Methods 0.000 description 19
- 230000000694 effects Effects 0.000 description 13
- 230000008859 change Effects 0.000 description 9
- 238000000605 extraction Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 206010011469 Crying Diseases 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000016507 interphase Effects 0.000 description 1
- 238000009940 knitting Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Electrophonic Musical Instruments (AREA)
- Amplifiers (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
1380288 六、發明說明: 【發明所屬之技術領域】 本發明涉及音頻信號處理’具體涉及在向包含瞬變事 件的信號應用音頻效果的情況下的音頻信號操縱。 ' 【先前技術】 已知操縱音頻信號使得改變再現速度,同時保持音高 (pitch)不變。針對這樣的過程的已知方法是利用相位聲 φ 碼器(vocoder)或方法來實現的,如(音高同步的)疊加 (overlap-add)、(P)SOLA,如在 J.L. Flanagan 和 R.M.
Golden, The Bell System Technical Journal, November 1966, pp. 1349 to 1590 ;美國專利 6549884 Laroche,J. & Dolson, M.: Phase-vocoder pitch-shifting ; Jean Laroche 和 Mark
Dolson, New Phase-Vocoder Techniques for Pitch-Shifting, Harmonizing And Other Exotic Effects”,Proc. 1999 IEEE φ Workshop on Applications of Signal Processing to Audio and
Acoustics, New Paltz, New York,Oct. 17-20, 1999 ;以及
Zolzer, U: DAFX: Digital Audio Effects i Wiley & Sons > 、 Edition: 1 (February 26, 2002) ; pp. 201-298 中所描述的。 此外,可以使用這樣的方法(即,相位聲碼器或 (P)SOLA)對音頻信號進行轉換(transposition),其中這 種轉換的具體問題是:轉換後的音頻信號與轉換之前的原 始音頻信號具有相同的再現/重放長度,而音高發生改變。 這是通過加速再現拉伸信號(stretched signal)而得到的, 3 1380288 其中執行加速再現的加速因數依賴於在時間上拉伸肩始 音頻信號的拉伸因數。在採用時間離散的信號表示時,該 過程對應於··利用等於拉伸因數的因數對拉伸信號的下採 樣(d〇wn-sampling)或對拉伸信號的抽取(dedmati〇n), 其中採樣頻率保持不變。 - 在這樣的音頻信號操縱方面的具體挑戰是瞬變事 v 件。瞬變事件是:在整個頻帶中或特定頻率範圍内信號的 能量快速改變(即,快速增大或快速減小)的信號中的事 件。具體瞬變(瞬變事件)的特有特徵(eh_teristie φ feature)是信號能量在頻譜中的分佈。典型地,在瞬變事 件期間音頻信號的能量分佈在整個頻率上,而在非瞬變作· 號部分能量通常集中在音頻信號的低頻部分或特定頻 帶中這忍未著,還稱作穩定或音調(t〇nal)信號部分的 非瞬變信號部分具有非平坦的(麵彻)頻譜。換言之, 信號的能量包含在很少數目的譜線/譜帶中,這些譜線/譜 帶明顯高於音頻信號的雜訊基底(nGisefl⑽)。然而在^ 變部分,音頻信號的能量將分佈在許多不同頻帶上,具體· 地’將分佈在高頻部分,使得音頻信號的瞬變部分的頻譜 會比較平坦,並且在任何事件下都會比音翁號的音調; 分的頻譜更為平坦。典魏,瞬變事件是時間上的_ · 化,這意味著當執行傅㈣分解時信號將包括高次 (higherharmonic)。這些高次譜波的重要特徵是,這此I 次舰的相位有非常特殊的相互_,使得所有這些正= 波的&加(supe_itiGn)將導致信號能量的快速改變。 4 1380288 換言之,在頻譜上存在強相關(strongcorrelation)。 所有諧波之間的具體相位情況還可以稱作“垂直相干 性(vertical coherence) ”。該“垂直相干性”與信號的時間/ 頻率譜圖表示有關,在所述信號的時間/頻率譜圖表示中, 水準方向對應於信號在時間上的演進,垂直尺度在頻率上 描述了 一個短時譜中譜分量的頻率(轉換頻率點 (transform frequency bins ))的相互依賴。 ,了時間拉伸或縮短音頻信號而執行的典型處理步 驟ί得這種垂直相干性被破壞,這意味著當例如由相位聲 2器或任何其他方法對瞬變執行時間拉伸或縮短操作 時,瞬變隨時間而“模糊(smear), 何其他方法執行美於㈣沾走w 仪料器或任 頻率係數而不_相^處理,向音頻信號引入隨不同 操縱^音頻信號處理方法破壞了瞬變的垂直相干性時,受 、、-(manipulated)信號將會扃籍—斗 :於原始信號,而在受操縱信二==常: 的時=的(Γ直相了性進行不受控制的操:導致。了。瞬變 =量_變事件做貢獻,並且多譜波 有這些分量的相位,不可㈣2制的方式來改變所 (artifact)。 免也導致了這樣的偽像 然而’瞬變部分對於音頻信號的 就或语言信號,其中在特定時動^而吕(如音樂信 控信號的品質的大量主觀用戶突然改變表示對受 疋尤為重要的。換言 5 之,典型地,音頻彳§號中的瞬變事件是語音信號的非常明 顯的“重要事件,,,其對主觀品質印象有超比例 (〇Ver-pr〇P〇rtional)的影響。受操縱的瞬變將使收聽者聽 到失真的、迴響的並且不自然的聲音,在所述受操作瞬變 中,垂直相關性被信號處理操作所破壞或相對於原始信號 的瞬變部分而變差。 一些當前方法將瞬變周圍的時間拉伸到更高的程 度,以便隨後在瞬變的持續時間期間不執行或僅執行小 (minor)的時間拉伸。這樣的現有技術參考和專利描述 了時間和/或音高操縱的方法。現有技術參考是·· L a r 〇 c h e L., Dolson M.: Improved phase vocoder timescale modification of audio , IEEE trans. Speech and Audio Processing, vol. 7, no. 3, pp. 323-332’Emmanuel Ravelli,Mark Sandler 和 Juan P. Bello: Fast implementation for non-linear time-scaling of stereo audio ; Proc. of the 8th Int. Conference on Digital Audio Effects (DAFx? 05), Madrid, Spain, September 20-22, 2005 ; Duxbury, C. M. Davies 和 M. Sandler (2001, December) : Separation of transient audio using multiresolution analysis techniques. In proceedings of the COST G-6 Conference on Digital Audio Effects (DAFX-01),Limerick, Ireland ;以及 R6bel,A.: A NEW APPROACH TO TRANSIENT PROCESSING IN THE PHASE VOCODER ; Proc. of the 6th Int. Conference on
Digital Audio Effect (DAFx-03), London, UK, September 1380288 8-11,2003。 在相位聲碼器對音頻信號進行時間拉伸期間,時門八 散使瞬變信號部錢得·”,這是因為_了所= 信號垂直奸性。使用所謂的疊加方法的方法月 (P)SOLA ’可以產生瞬變聲音事件的干擾前 (P_h())㈣喊—> 通過瞬變環境中^ 的時間拉伸’可以實際上解決這些問題;然而,如果: 現轉換’貞1丨在瞬變環境下轉換因數將不再是恒定的,β, 所疊加的(可能是音調)信齡量的音高將改變並二乍 為干擾而被感知。 1乍 【發明内容】 本發明的目的是為音頻信號操縱提供一種更高品曾 的構思。 同叩買 ^利用依據申請專利範圍第!項所述的操縱音頻信號的 :備、依據申請專利範圍第12項所述的產生音頻信二 設儳、依據申請專利範圍帛13摘述的操縱音頻信號的 方法、依據申請專利範圍第14項所述的產生音頻信號的 方法、依據申請專利範圍第15項所述的具有瞬變部分和 辅助貧訊的音頻信號、或者依據申請專利範圍第16項所 述的電腦程式,實現了該目的。 、 為了解決在對瞬變部分的非受控處理中出現的品質 問題’本發明保證根本不會以有害的方式對瞬變部分進行 處理’即’在處理之前去除瞬變部分並且在處理之後將其 7 變部分’但是將其從處理過的信號 中去除並曰才奐成未處理過的瞬變事件。 中相=二2過的瞬_ W本使仔文刼縱信號由不包含瞬 理過的部分以及包含瞬變事件的未處理過的或不 同地處理過的部分组成。例如 或_型的加權或參數化處理。然而=:
部分替換成合成地產生的瞬變部分,以這樣的方式來 合成所述合成地產生的瞬變部分,使得合成的瞬變部分在 某些瞬變參數(如’在特定時刻的能量變化量,或描述瞬 變事件特徵的贿其他量度)方面_於原鱗變部分。 因此’甚至可以對源始音頻信號中的瞬變部分特徵化,可 =在處理之前去除該瞬變,或將處理過的瞬變替換成合成 瞬變,所述合成瞬變是根據瞬變參數資訊而合成地產生 的。然而,出於效率原因’優選的是在操縱之前複製原始 音頻信號的-部分,以及將該副本插入處理過的音頻信號 中’這疋β]為該過絲證了處理過的信號中的瞬變部分與 原始信號的瞬變相同。該過程將確保與處理之前的原始信 號相比,在處理過的信號中保持了瞬變對聲音信號感知的 特殊的高影響。因此,用於操縱音頻信號的任何類型的音 頻信號處理都不會降低關於瞬變的主觀或客觀品質。 在優選實施例中,本申請提供了一種新方法,在這樣 的處理的架構内,對瞬變聲音事件進行感知性良好的處 理,否則將由於信號的分散而產生時間上的“模糊”。該優 1380288 選方法主要包括:在信號操縱之前去除瞬變聲音事件,以 執行時間拉伸;隨後考慮到該拉伸,以精確的方式將未處 理的瞬變信號部分添加到修改後的(拉伸後的)信號中。 【實施方式】 隨後參考附圖說明了本發明的優選實施例。 第一圖示出了操縱具有瞬變事件的音頻信號的優選 設備。優選地’該設備包括瞬變信號去除器100,瞬變信 號去除器100具有用於具有瞬變事件的音頻信號的輸入 101。瞬變信號去除器的輸出1〇2與信號處理器u〇連接。 k號處理器輸出U1與信號插入器120連接。信號插入器 輸出121可以與諸如信號調節器(c〇nditi〇ner) 13〇之類 的其他設備連接,其中在所述信號插人雜出i2i上具有 处理的自然@或合成的瞬變的被操縱音頻信號是可 =’所述信號調節器13G可以執行受操縱信號的任何其 心it1帶寬擴展的目的而需要的下採樣/抽取,如 、、。合第七圖八和第七圖B所討論的。 …、而如果按原樣使用在信號插入器^ 到的受操縱音頻作铗,p ^ 叼輸出處得 傳輸至接收機、或。被傳:至:儲存以進行進-步處理、被 操縱音頻㈣錢備連接叫終產生表示受 130 〇 9 則根本不能使用信號 在«擴展的料下’線121上纖可以已經是高 9 頻段信敢。那麼,信號處理器已經根據輸入的低頻段信號 產生了而頻段信號,而且從音頻信號1〇1提取的低頻段瞬 變部分將會被置於高頻段的頻率範圍中,優選地,這是通 過不干擾垂直相干性的信號處理來實現的,如抽取。在信 號插入器之前執行這種抽取,以便將所抽取的瞬變部分插 入塊110的輸出處的高頻段信號中。在該實施例中,信號 «周節器將執行純段信號的任何其他處理,如包絡整形、 雜訊添加、反向濾波、或添加諧波等等,如在MPEG4頻
帶複製(spectral band replication )中進行的。 選地,信號插入器120經由線123接收來自去除 1〇〇的輔助資訊,以便根據將要插入lu中的未處理信 來選擇正確的部分。
在實現具有設備100、110、12〇、130的實施例時 可以得到如結合第八圖A至第八圖E所討論的信號序列 ”、i而不疋要在指號處理器11〇中執行信號處理操作 前去除瞬變部分。在該實施射,*需要瞬變信號去 觸,錢確定要從㈣⑴上的處理信號; 切除的信號部分1及將該切除信號替換成如線⑵示g r t所,原:始信號氣㈣141示意性所示的合成信藏,^ 中该合成信號是可以從瞬變信號發生器140令產生的。% :能夠產,合適的瞬變,將信號插人器12()配置為向瞬變 δ·生轉送瞬變描述參數。從而,如項目141所示的 塊M〇與120之間的連接被示為雙向連接。如果在用於摔 縱的設備中提供敎_變_器,那麼可以從該瞬^ 測器(第一圖中未示出)向瞬變信號發生器140提供與瞬 變有關的資訊。可以將瞬變信號發生器實現為具有可以直 接使用的瞬變採樣或具有可以使用瞬變參數來加權的預 先儲存的蜂變採樣’以實際產生/合成將由信號插入器120 所使用的瞬變。 在一個實施例中,瞬變信號去除器100用於從音頻信 號中去除第一時間部分,以得到瞬變減小的音頻信號,其 中所述第一時間部分包括瞬變事件。 此外,優選地信號處理器用於處理瞬變減小的音頻信 號’其巾包括瞬變事件的第一時間部分被去除,或用於處 理包括瞬變事件的音頻信號,以得到線⑴上的處理後的 音頻信號。 優選地,信號插入器12〇用於:在第一時間部分被士 除的信號位置’或在瞬變事件位於音頻健中的信號相 置’將第:時間部分插人處理後的音頻信射,其中第二 時門邰/7 L括不受由彳§號處理器丨1〇執行的處理所影響的 瞬變事件,從而得顺出121處的已驗音頻信號。曰 立第二圖示出了瞬變信號去除器1〇〇的優選實施例。在 音頻信號W含與瞬變有關的任何_資訊/元資訊(meti mf〇rmati〇n)的一個實施例中,_信號去除器1〇〇包括 瞬變檢測器1G3、淡出(触侧)/淡人計算器 =4以及第1分去除器1G5。在彻如隨後將參考第九 圖來討論的編似備_音齡财_ 瞬變有關的資訊的可選實施例中,瞬變信號去除器;^ 括輔助資訊提取器1〇6 ,所述辅 線1。7所示附到音頻信號的辅助資訊。如二 =取如 =Γ::;的資訊提供給淡出:: 出現瞬變事二二= 資:要時::僅瞬變時間,(即 , 要攸曰頻信號排除的部 刀的開始~止時間,(即音頻信號“第 和停止時間),都是不m而以1刀的開始時間 瞀哭讓^• ⑦要的而且也不需要淡出/淡入計 〜刚’可Μ如線108所示將開始/停 發給第一部分去除器105。線108示 == 所示的所有其他線也是可選的。 而且虛線 在第二圖十,優選地淡出/淡入計算器1〇4輸 訊=該輔助資訊109與第-部分的開始/停止時間不 同’适是因為考慮了第—圖的處理器11G巾的處理特性。 此外’優選地將輸人音齡號饋送至絲器105。 ▲優選地,淡出/淡入計算器104提供第一部分的開始/ 停止時間。這些時間根據瞬變時間計算而得,這樣第一部 分去除器105不僅去除瞬變事件,還去除瞬變事件周圍的 一些採樣6此外’魏岐,補_ _矩職切除瞬 變部分,還利用淡出部分和淡入部分執行提取。為了執行 淡出或/淡入部分,可以應用相對於矩形濾波器而言具有平 滑過渡(smoother transition)的任何種類的窗,如上升余 弦由,使得這種提取的頻率回應不如應用矩形窗時那樣成 問題,儘管這也是選項。這種時域加窗操作輸出加窗操作 的殘餘(remainder ),即’不具有加窗部分(wind〇wed 1380288
Portion)的音頻信號。
在运楂情況下可以使用任何瞬變抑制方 除瞬變之後留下瞬變減小的或優選地完=括在去 信號(reSidUalsignal)的瞬變抑制方法n的殘留 部分相比,其中在特定時_分上^_=^瞬變 瞬變抑職以下情況下是有_ :由種 分對於音頻信號而言非常不自然,使得對音=== 步處理會受到被設為0的部分的影響。 1 自然地’如結合第九圖所討論的,可以在編碼器側應 々由瞬變檢測器103和淡出/淡入計算器104執行的所有計 鼻,只要將這些計算的結果,如瞬變時間和/或第一部分的 開始/停止_,傳輸至信號操縱器,作為與音頻信號一起 或與音頻㈣分__資訊或元:#訊,勤在要經由單 獨傳輸通道來傳輸的單獨音頻元資料信號内。
第二圖A示出了第一圖的信號處理器11〇的優選實 現。該實現包括頻率選擇分析器112以及後續連接的頻率 選擇處理設備113。實現頻率選擇處理設備U3,使得所 述頻率選擇處理設備113對原始音頻信號的垂直相干性起 到負面影響(negative infIuence)。該處理的示例是,在時 間上拉伸信號’或在時間上縮短信號,其中以頻率選擇的 方式來應用這種拉伸或縮短,使得例如該處理向處理後的 音頻信號引入了隨不同頻帶而不同的相移。 在相位聲碣器處理的情況下,在第三圖B中示出了一 種優選的處理方式。通常’相位聲碼器包括··子帶/變換分 1380288 析器】】4,·隨後連接的處理器出,用於對專案】i4所提 供的夕個輸Μ號執行頻率選擇性處理;以及隨後的子帶 /變換组合器116 ’所述子帶/變換組合器116將由專案出 處㈣信號她合樣終在輸出117處得麟域t的處理 後的信號,由於子帶/變換組合H 116執行對鮮選擇性信 號的組合’使得只要處理後的信號】P #帶寬大於由專案 15與116之間的單個分支所表示的帶寬,那麼時域中的 該處理後的信號就同樣是全帶寬信號或低通遽波後的信 一隨後結合第五圖A、第五圖Β、第五圖c和第六圖來 时淪相位聲碼器的其他細節。 •隨後’在第四圖中討論並描述了第—圖的信號插入器 〇的優選實現。優選地,信號插人器包括用於計算第二 =間部分的長度的計算器122。在第一圖的信號處理器110 如丁信號處理H經去除了_部分的實施例中為了 =計算第二時㈣分的長度,需要所絲的第—部分的 伸(物縮短隨),以便在項目 2中计异第二時·分的長度。如結合第1和第二圖 斤^的,可以從外部來輸入這些資料項目。例如,通過 長t部分的長度乘以拉伸因數來計算第二時間部分的 將第二_部麵長度轉發料算器123,音 地4,號中的第二時間部分的第—邊界和第二邊界。:體 ’可以將W 133實現為··在不具有在輸出以處供 1380288 應的瞬變事件的處理後的音頻信號與具有瞬變事件的音 頻=號之間執行互相關處理,所述具有瞬變事件的音頻信 號提供如在輸入125處供應的第二部分。優選地計算器 又另外的控制輸入126的控制,使得與稱後將討論的 瞬變事件的負移位相比,第二時間部分内瞬變事件的正移 * 位是優選的。 將第一時間部分的第—邊界和第二邊界提供給提取 # 11 127。優選地’提取器⑵切除該部分,即,從輸入125 4提供料始音難射姆第二時_分,為使用隨 後的父叉衰減器(er°ss-fader) 128,所以使用矩形濾波器 進行切除。在父叉衰減器128中,通過對開始部分將權重 從0增大到卜和/或在結束部分中將權重從i減小到〇, 對第-時間部分的開始部分以及第二時間部分的停止部 分進行加權,使得在該交又衰減區域内,處理後的信號的 結束部分與所提取的信號的開始部分在相加時產生有用 籲师號。在提取之後,針對第二時間部分的結束以及處理 後的音齡號的開始,在交又衰減器m中執行類似的處 理。交又衰減保證了不出現時域偽像,否則當不具有瞬變 • 部分的已處理音頻信號的邊界未與第二時間部分邊界完 美地匹配在一起時,所述時域偽像將作為滴答聲偽像 (clicking artifact)被感知。 隨後,參考第五圖A、第五圖B、第五圖❻第六圖 來s兒明在相位聲碼器的情況下信號處理器11〇的優選實 現0 1380288 聲碼器I:二參考第五圖和第六圖說明了根據本發明的 實現。第五圖八示出了相位聲碼器的濾波器 人漏處饋入音頻信號,在輸出別處 具舰,第五所示的示纽濾波器組 個通道包括帶通濾、波器叫下游(d〇w論_) 幹出組合器將來自每個通道的所有振盪器的 號相組合,例如,將所述組合II實現為加法器並且 = 503表不’以得到輸出信號。實現每個渡波器训,使 得遽波器5〇1 一方面提供幅度信號,另一方面提供頻率信 號。幅度信號和頻率信號是時間錢,說 中的幅度隨時間的演進,頻率信號表示由據波器衝慮波 的信號的頻率的演進。 在第五圖Β令示出了攄波器5〇1的示意性設置。可以 如第五圖Β所示來⑨置第五圖Α的每個丨慮波器,然而其 中僅供應至兩個輸A混頻器(mixer) 551和加法器M2的 頻率fi隨通道的不同而不同。由低通553對混頻器輸出信 號進行低通濾波’其巾,這些低通信號與在本地振盪器頻 率(LO頻率)所產生的情況下不同,它們是9〇。異相以 of phase)的。上面的低通濾波器553提供正交信號554, 而下面的濾波器553提供同相信號555。將這兩個信號 (即,I和Q)供應至座標變換器556,所述座標變換器 556根據矩形表示產生量值相位表示。在輸 出557處隨時間分別輸出第五圖A的量值信號或幅度信 號將相位號供應至相位展開器558。在 讀558的輸出處,不再存在總是位㈣至⑽。之間的相 位值,而Μ現線性增大_位值。料種‘·的,,相位 值供應至相位/頻率轉換器559,例如可以將所述相位/頻 率,換器I59實現為簡單的相位差形成器,所述相位差形 成=從#則時間點的相位減去先前時間點的相位以得到 二别時間點_率值。將該頻率值加上濾波器通道i的恒 疋頻率值fi,以在輸出560處得到時變頻率值。輸出娜 處的頻率值具有直流分量=fi和交流分量通道中信 號的當前頻率偏離平均頻率ί的頻率偏差(fteqUeiJy deviation)〇 因此如第五圖A和第五圖B所示,相位聲碼琴實 現了譜資訊與時間資訊的分離。分別地,譜資訊在特定通 道中或在為每個通道提供頻率的直流部分的頻率右中,而 時間資訊分別包含在隨時間變化的頻率偏差或量值令。 第五圖C示出了根據本發明的、針對帶寬增大而執行 的操縱,具體是在聲石馬器中,以及在第五圖A中以虛線繪 製的所示電路位置處執行的操縱。 5 例如,對於時間縮放,可以對每個通道中的幅度信鱿 A(t)或每個信號中的信號解f(t)進行抽取或插值。出於轉“ 換的目的,由於其對本發明是有用的,因而執行插值,即 信號A⑴和聯的時間擴展或延展(temporal extension 〇r spreading),以得到延展信號A,(t)和⑽,其中在帶寬擴 展情況下該插值受延展因數的控制。通過相位變數 (variation)的插值,即,加法器552加上恒定頻率之前 第五圖A+每個獨立振皇器502的頻率不變。缺而, 〜體音頻信號的時間變化減P, 的社里β 吁间I化减『又,即,以因數2減慢。得到 j疋具有原始音高(即原始基波(fundamemai幫) 及一諧波)的時間延展音調。 通過執行如第五圖c所示的信號處理, A =母倾波H頻段通道中執行這樣的處理,以及通過缺 ^抽取器+對得_關信號進行抽取,音頻信號縮回 ^ rink baek)其原始持續時間,而所有頻率同時加倍。
1仔由隨2進行音高轉換’然而其中得到了與原始音 頻信號具有相同長度(即,相同數目的採樣)的音頻信號曰。 作為對第五圖A所示的濾波器組實現的備選,還可以 如第六圖所示來使用相位聲碼器的變換實現。這裏,將音 頻信號100饋送至FFT處理器,或更普遍地饋送至短時^ 裏葉變換(Short-Time-Fourier-Transfomi)處理器 _,作 為時間採樣的序列。第六圖中示意性地實現了附處理器 600,以對音頻信號執行時間加窗(_ __ ),從而隨
後通過FFT计昇谱的量值和相位,其中針對與強交疊的音 頻信號塊有關的連續譜來執行該計算。 在極端情況下,可以對於每個新的音·號採樣來計 算新的缙,其117還可以例如僅針對每2〇個新的採樣來計 算新的譜。優選地,這種兩個譜之_採樣的距離3是由 控制器602給出的。控制器6〇2還用於供給ιρρτ處理器 604,所述IFFT處理器604用於執行交疊操作。具體地, 將IFFFT處理H 604實現為··通過根據修改後的譜的量值 和相位為母個譜執行一個IFFT來執行逆短時傅裏葉變 換以便然後執行疊加操作,其中根據所述疊加操作得到 結果時間信號。疊加操作消除了分析加窗的影響。 FFT處理器604來處理兩個譜時,利用這兩 個譜之間的距離b來實現時間信號的延展,所述距離b大 於在產生FFT譜時譜之_距離a。基本思想是,利用比 刀析FFT相隔更遠的逆FFT來延展音頻信號^因此,與 原始音頻信號相比,合成音頻信號的時間變化出現得更為 緩慢。 然而’在塊606中沒有相位重縮放的情況下,這將導 致偽像。例如,在考慮單個頻率點時,其中針對該頻率點 .以45間隔實現連續相位值,這意味著該遽波器組内的作 號在相位上則/8週期的速率增大,每個時間間隔增 大45。’ 14裏所述時間間隔是連續FFT之間的時間間隔。 如果現在使逆FFT彼此相隔更遠’則這意味著跨越更長的 時間間隔出現45。相位增大。這意味著,由於相移,後續 疊加過程中出現失配,導致了不期望的信號抵消 (cancellation)。為了消除這種偽像,以實際上相同的因 數來重縮放相位,其中_翻數對音頻信號進行時間延 展。從而每個FFT譜值的相位以因數b/a而增大,使得消 除這種失配。
在第五圖C所示實施例中’針對第五圖a的遽波器 組實現中的-•個信t;㈣H ’通過幅度/辭控制信號的插 值來實現延展’而利用兩個IFFT之間的距離大於兩個FFT 1380288 譜之間的距離來實現第六圖中的擴展’即,b大於a ’然 而,其中為了防止偽像,根據b/a來執行相位重縮放。 關於相位聲碼器的詳細描述,參考以下文獻: “The phase Vocoder: A tutorial”,Mark Dolson,
Computer Music Journal, vol. 10, no.4, pp. 14—27,1986,或 “New phase Vocoder techniques for pitch-shifting, harmonizing and other exotic effects55, L. Laroche und M. Dolson, Proceedings 1999 IEEE Workshop on applications of signal processing to audio and acoustics, New Paltz, New York,October 17-20,1999,pages 91 to 94; “New approached to transient processing interphase vocoder’’,A. Robel, Proceeding of the 6th international conference on digital audio effects (DAFx-03), London, UK, September 8-11,2003,pages DAFx_l to DAFx-6; “Phase-locked Vocoder’,,Meller Puckette,Proceedings 1995, IEEE ASSP,
Conference on applications of signal processing to audio and acoustics,或美國專利申請號6,549,884 可選地,其他信號延展-方法是可用的,例如,“音高 同步疊加”方法。音高同步疊加(簡稱ps〇LA)是一種合 成方法’在打法巾語言信號的記錄位於資料庫中。只要 這些信號是職錢,就為其提供與基頻(音高)有關的 貧訊並且標記每個週期的開始。在合成中,利用窗函數以 境來娜這些週期,並將物添加到要合成的信 號中&適的㈣:轉所敏的基蚊高於還是低於資料 20 庫條目的基頻,相應地比原始更密集或更稀疏地組合它 們。為了調整可聽的持續時間,該週期可以被省略或雙倍 輸出。該方法還稱作TD-PS〇LA,其中TD代表時域,並 強調方法在時域中操作。另外的發展是多頻段再合成疊加 (multiband resynthesis overlap add )方法,簡稱 MBROLA。這裏通過預處理使資料庫中的片段達到統一的 基頻’並將諧波的相位位置歸一化(⑽加汕沈卜這樣, 在從一個片段到另一片段的瞬變的合成中,產生更少的感 知性干擾’並且所實現的語言品質更高。 在另外的備選方案中,在延展之前已經對音頻信號進 行帶通濾波,使得延展和抽取後的信號已經包含期望的部 分,並且可以省略隨後的帶通濾、波。這樣,設置帶通滤波 器’使得帶通濾波器的輸出信號中仍然包含可能在帶寬擴 展之後已經濾除的音頻信號部分。從而帶通濾波器包含了 在延展和抽取之後的音頻信號中並未包含的頻率範圍。具 有該頻率範圍的信號是形成合成高頻信號的所需信號。 如第一圖所示的信號操縱器還可以額外包括信號調 節器130,用於對線121上具有未處理的“自然的”或合成 的瞬變的音頻信號進行進一步處理。該信號調節器可以是 帶寬擴展應用中的信號抽取器’所述信號抽取器在其輸出 處產生高頻段信號,然後通過使用要與HFr (高頻重建) 資料流程一起傳輸的高頻(HF)參數來進一步調節(a(japt) 所述高頻段信號,以使其非常類似原始高頻段信號的特 j38〇288 第七圖A和第七圖b示出了帶寬擴展方案,有利地, 該方案可以使用第七圖B的帶寬擴展編碼器72〇内的信號 調節器的輸出信號。將音頻信號饋送至輸入7〇〇處的低通 /尚通組合中。低通/高通組合一方面包括低通(Lp),產生 曰頻仏號700的低通濾波版本,如第七圖a中的703所 示。採用音頻編碼器704對該低通濾波後的音頻信號進行 · 編碼。例如,音頻編碼器是MP3編碼器(MpEG1層3) 或AAC編碼益,還稱作]yjp4編碼器,如在MPEG4標準 中描述的。在編碼器704中可以使用提供頻段受限音頻信 鲁 號703的透明(transparent)表示或有利地為感知性透明 表示的備選音頻編碼器,以分別產生完全編碼的或感知性 編碼的、(優選為感知性透明編碼的音頻信號7〇5。 濾波器702的高通部分(表示為“Hp”)在輸出7〇6處 輸出音頻信號的上頻段(Upperband)。將音頻信號的高通 部分,即,也表示為HF部分的上頻段或HF頻段,供應 至用於計算不同參數的參數計算器707。例如,這些參^ 是在相對粗糙解析度下上頻段706的譜包絡,例如,分別 · 針對每個心理聲學(psychoacoustic)頻率組或針對 尺度(scale)上每個Bark頻段的尺度因數的表示。參數 計算器707可以計算的另外的參數是上頻段中的雜訊基 . 底’其每頻段能量可以優選地與該頻段中包絡的能量有 關。參數計算器707可以計算的其他參數包括針對段 的每個局部(partial)頻段的音調測量(tonaiity ), 其指示譜能量如何在頻段中分佈,即,譜能量是否相對均 22 1380288 勻地分佈在頻段中(其巾,那麼該頻段中存在非音調信 號或該頻段中的能量是否相對強烈地集中在頻段中的 特定位置(其中,那麼相反,該頻段存在音調信號)。 其他參數包括:對上頻段中在其高度和其頻率方面相 對強烈地突出的峰值的顯式(explicitly)編碼在未對上 頻段中顯著的正弦部分進行這種顯式編碼的重建中,帶寬 擴展構思只會非常基本地或根本不恢復相同的信號。 ^在任何情況下,參數計算器用於僅產生在^對上頻 段的參數7G8,其中,彳以對所述參數·執行類似的烟 咸J ν驟,因為還可以在音頻編碼器704中針對量化的頻 譜值來執行這些步驟,例如差分編碼、测或霍夫曼編碼 等。然後將參數表示708矛口音頻信號7〇5供應至用於提供 輸出輔助資料流程71G的資料流程格式器,典型地, 所述輸出辅助資料流程71〇是具有特定格式的位元流如 在MPEG4標準中標準化的格式。 口〇因為尤其適於本發明’所以以下參考第七圖Β對解碼 器側進行說明。資料流程71〇進人資料流程解釋器 (terpreter) 711 ’所述資料流程解釋器711用於將與帶 寬擴展有關的參數部分708與音頻信號部分7〇5分開。利 用參數解碼器712對參數部分進行解碼,以得到解碼 後的參數713。與此並行地,利用音頻解碼器w對音頻 信號部分705進行解碼,以得到音頻信號。 根據該實現’可以經由第一輸出715輸出音頻信號 100。在輸出7】5處,然後可以得到具有小帶寬從而具有 23 1380288 低品質的音頻信號。然而,為了提高σ 帶寬擴展720,以分別在輸出側得二二’執行士發明的 而具有高品質的音頻信號7】2。 、擴展或高帶寬從 根據WO 98/57436已知,在編踩 頻段限制,並_高品質的音頻編碼器頻信號執行 頻段進行編碼。然而,僅非常粗趟地°對曰頻信號的低 段的譜包絡的一組參數)描述上頻段的二利=現上頻 碼器側合成上頻段。為此,提出譜 ^二後,在解 組通道與上頻段的渡波器組通組=的滤波器 下頻段的遽波器組通道,對每個拼凑的i通仲 :二於特定分析濾波器組的合輪 f又中的音頻信號的帶通信號,並接收下触的包絡= (harmonically) ==波器組的輸出信號是在其帶寬方面被擴展 輸該音頻二速率從編碼器側向解碼器側傳 ^ a 、體地’遽波器組領域中的滤波器組計算 及拼湊可駿得f絲大料n 、裏所提出的方法解決了所提出的問題。與現有方法 人=本方法的新穎之處在於,從要操縱的信號中去除包 3瞬變的加窗部分,以及還從原始信號中額外選擇出第二 加固=分(通常與第一部分不同),其中還可以將所述第 加®邛刀重新插入受操縱信號中以便在瞬變的環境下 盡可能多地保留時間包絡。選擇所述第二部分,使得該第 24 1380288 二部分會精確適合被時間拉伸操作所改變的凹處 (⑽ss> it過計算所得到的凹處的邊沿與縣瞬變部分 的邊沿的最大互相關’來執行所述精媒適合。 因此’瞬變的主觀音頻品質不再被分散(dispersion) 或回聲效應削弱。
為了選擇合適部分,例如,可以通過在合適的時間段 上進行能量的移動以(moving叫。id)計算,來精確 地確定瞬變的位置。 第-部分的大小與時間拉伸因數確定了第二部 分的所需大’卜優選地’將選擇該大小,使得第二部分容 納夕於_的瞬變,只有在彼此緊鄰的瞬變之間的時間間 隔低於人碱知獨立時間事件_值的情況下,所述第二 部分才會用於重新插入。 根據最大互相’瞬變的最優適合可能需要相對於
該瞬變原始位置的微小時間偏移。然而,由於存在時間前 掩蔽(阿侧―)效應以及特別是後掩蔽(_侧king) 效應’重新插人的瞬變的位置不需要與原始位置精確匹 配。由於後掩蔽動作的擴展週期,所以瞬變在正時間方向 上的移位是優選的。 ㈣,、❿㈣邵分,在隨後的抽取步驟改變㈣ 速率的情況下’其音色(timbre)或音高將發生改變。缺 身通心转學相絲機制所掩 敝八體地,如果出現以整數因數進行的拉伸 會發生微小改變’因為在_環境外部只會㈣每n固 25 (n=拉伸因數)譜波。 使用新的方法,有效防止了在通過時間拉伸和轉換方 法處理瞬變的過程_產生的偽像(分散、前回聲和後回 聲)。避免了對疊加的(可能是音調)信號部分的品質的 潛在削弱。 本方法適於其_音頻信號的再現速度或它們的音高 將發生改變的任何音頻應用。 隨後,將根據第八圖A至第八圖E來討論優選實施 例。第八圖A示出了音頻信號的表示,然而與直向前 (straightforward)時域音頻採樣序列不同,第八圖a示 出了能量包絡表示,所述能量包絡表示例如是通過對時域 採樣圖例中的母個音頻採樣求平方而得到的。具體地,第 八圖A示出了具有瞬變事件801的音頻信號8〇〇,其中瞬 變事件的特徵在於能量隨時間的急劇増大或減小。自然 地,瞬變還可以是:當能量保持在特定高度時,該能量的 急劇升高;或當能量在下降之前已經在特定高度保持了特 疋時間時’邊犯置的急劇降低。例如,瞬樂的呈辦try β 掌聲或由打料具產生的任他音調。 具的快速擊打’其開始大聲播放音調’即,在特定閣值級 別以上特定閾值時間以下將聲音能量提供到特定頻帶中 或多麵帶中。自然、地,其他能量波動,如第人圖a中的 音頻信號800的能量波動8〇2未被檢測為瞬變。瞬變檢測 器是現有技術中已知的,並且在文獻中被廣泛描述,其依 賴於許多*_演算法,所述演算法可以包括··頻率選擇 26 性處理’以及將解轉性處理的絲與聽相比較以 及隨後確定是否存在瞬變。 第八圖B不出了加窗瞬變。從利用所示窗形狀加權的 心號中減去實線限定的區域。在處理之後,再次添加由虛 線標記的區域。具體地’必須從音頻信號麵中切除在特 疋瞬變時間803出現的_。穩妥起見’不僅要從原始信 號中切除瞬變’還要切除—些婦/鄰近採樣。從而,確定 第-時間部分804,其中第一時間部分從開始時刻8〇5延 伸至停止_ 8G6。通常,選擇第—時間部分,使得 瞬變時間803包含在第一時間部分謝内。第八圖c示出 了拉伸之刖沒有瞬變的信號。從緩慢衰落 (slowly-decaying)的邊沿8〇7和8〇8可以看出,不僅通 過矩形濾波器/加窗器(wind〇wer)來切除第一時間部分, 還執行加窗以使音頻信號具有緩慢衰落的邊沿或側邊 (flank)〇 —重要的是’第八圖C示出了第一圖的線1〇2上的音頻 ’即’在輕信號去除之後的音齡號。緩慢衰落/ 升问的侧邊807、808提供了由第四圖的交叉衰減器128 使用的淡人或淡出區域。第人圖D示出了第人圖c的信 /」、、;而是以拉伸後的狀態示出的,即,在信號處理器11〇 進仃處理之後。因此,第八圖D中的信號是第一圖的線 ⑴上的信號。由於拉伸操作使得第一部分謝㈣更長。 因此第八圖D的第一部分8〇4被拉伸到了第二時間部分 _ ’所述第二時間部分_具有第二時間部分起始時刻 27 1380288 °通過拉伸信號,還拉
的長度進行計算時,說明了該拉伸。 810和第二時間部分停止時刻811。 伸了 度0 如第八圖B中的虛線所示,-旦確定了第二時間部分 的長度,就從第八圖A所示的原始音頻信號中切除與第二 時間部分的長度相對應的部分。這樣,第二時間部分_ 進入了第八圖E。如所述的,第二時間部分的起始時刻812 (即,原始音頻信號中第二時間部分8〇9的第一邊界)與鲁 第一時間部分的停止時刻813 (即,原始音頻信號中第二 時間部分的第二邊界)不必須相對於瞬變事件時間8⑽、 803’而對稱以使瞬變801精確位於與其在原始引號中相同 的時刻上。相反,第八圖B的時刻812、813可以有微小 變化’使得原始信號中這些邊界上的信號形狀之間的互相 關結果盡可能地與拉伸後的信號中相應的部分相類似。從 而,可以將瞬變803的實際位置移出第二時間部分的中 央’直到如第八圖E中由參考數字803 ’所指示的特定程度 · 為止’參考數字803,指示相對於第二時間部分的特定時 間,其偏離了相對於第八圖B中的第二時間部分的對應時 間803。如結合第四圖所述’瞬變相對於時間803向時間 · 803’的正位移是優選的’這歸因於比前掩蔽效應更為顯著 · (pronounced)的後掩蔽效應。第八圖E還示出了交迭 (crossover) /過渡區域813a、813b,在所述交迭/過渡區 域813a、813b中,交叉衰減器128提供不具有瞬變的拉 28 1380288 伸佗號與包括瞬變的原始信號副本之間的交叉衰減器。 如第四圖所示,用於計算第二時間部分122的長度的 計算器被配置為接收第-時間部分的長度以及拉伸因 數。可選地’計算H 122還可以接㈣鄰近瞬變包含在同 (allowability) 訊。因此’㈣該容許性,計算器可以獨立地確定第一時
間部分804的長度’然後根據拉伸/縮短因數來計算第二時 間部分809的長度。 一· 如以上所述,信號插入器的功能在於,該信號插入器 從原始錢中去除針對第簡E的_ 的合適區 域(其在拉伸後的信號内被擴大),並使用互相關計算使 ^合適區域(即,第二時間部分)適合處理過的信號以確 疋時刻812和813 ’以及優選地還在交又衰減(1域813a 和813b中執行交叉衰減操作。
=圖示出了用於產生音頻信號的輔助資訊的設 虽在編踢器側執行瞬變檢測,並且計算 檢測的辅助資訊並將其傳輸至然後將表 = 號操縱器時,該設備可㈣在本發明㈣況下。^ ί 用與第一圖中的瞬變檢測器1〇3相類似的瞬變檢測器來八 析包含瞬變事件的音頻信號^瞬變檢卿計算瞬變時間, 即?-圖中的時間803,並且將該瞬變時間轉發 =异裔1G4,,可以將所述元資料計算器1()4,構似 =圖,出/淡入計算器·。通常,元資料計算 -可以。十算要轉發至信號輸出介面9⑽的元資料其 29 -料可以包括:針對瞬變去除的邊界,即,針對第 心的邊界,即,第八圖Μ的邊界805和806, 二邱八:圖3中812、813所示的針對瞬變插入(第二時 二❾邊界,或瞬變事件時刻803或甚至803,。即使 ㈣縱嶋夠根據瞬變事件時刻 疋厅有所需資料,即,第一時間部分資料二 時間部分資料等。 而案1〇4,所產生的元資料轉發至信號輸出介 仏山奸Μ號輸*介面產生信號,即,用於傳輸或儲存的 〜。號。輪出㈣可以僅包括元f料或可 和音頻信號,其中,在後一稀产、戈下 . 隹俊種匱况下,兀資料將表示音頻 吕號的輔助資訊。這樣,可以經由線9〇1將音頻信號 至信號輸出介面900。可以將信號輸出介面_所產生^ 輸出信號儲存在任何類型的儲存介質上,或經由任何麵 的傳輸通道傳輸至信號操縱器或需要瞬變資訊的任何直 他設備。 將注意的是’儘管以方框圖的形式描述了本發明,其 中方框表示實際的或邏輯的硬體元件,然而還可以通過電 腦實現的方法來實現本發明《在後一種情; _ A卜’方框表不 相應的方法步驟,其中這些步驟代表由相應的邏輯或物理 硬體模組所執行的功能。 所述實施例僅僅是為了說明本發明的原理。應理解, 對這裏所述的佈置和細節的修改和改變野於本領域技、 人員而言顯而易見的。因此,意圖在於,僅受限於所附;
Claims (1)
1380288 七、申請專利範圍: 丨叫〇4月”日^^ 1、一種用於操縱具有瞬變事件(801)的音頻信號的 設備,包括: “號處理器(110),用於處理瞬變減小的音頻信號, 或用於處理包括瞬變事件(803)的音頻信號,以得到處 理後的音頻信號,在所述瞬變減小的音頻信號中,包括瞬 變事件(801)的第一時間部分(8〇4)被去除了; 信號插入器(12〇),用於在信號位置處將第二時間部 分(809)插入處理後的音頻信號中,所述信號位置是第 邛勿被去除的信號位置或瞬變事件在處理後的音頻信 號中所處的信號位置,其中第二時間部分( 809)包括不 受信號處理器(110)執行的處理的影響的瞬變事件 (801),以得到受操縱的音頻信號, 其中,所述信號處理器(110)被配置為通過拉伸或 縮短而在音頻信號中產生感知性降低的瞬變部分,使得音 頻信號具有比原始音頻信號更長或更短的持續時間,以及 所述第二時間部分(809)具有與第一時間部分(8〇4) 不同的持續時間,其中,在拉伸的情況下第二時間部分 (809)比第一時間部分(8〇4)長,或在縮短的情況下第 二時間部分(809)比第一時間部分(804)短。 2、依據申請專利範圍第1項所述的設備,還包括: 瞬變信號去除器(1〇〇),用於從音頻信號中去除第一時間 部分(804),以得到瞬變減小的音頻信號,所述第一時間 部分(804)包括瞬變事件(8〇1)。 36 1380288 101年04月25日修正替換頁 3、 依據申請專利範圍第1項所^^7777^— 述信號處理器(110)被配置為以基於頻率的方式(112, 113)來處理輕減小的音頻信號,使得該處理向 小的音頻信號中引入隨不同的譜分量而有所不同的相移。 4、 依據申請專利制第1項所述的設備,其中,所 述信號插人H (12G)她置為通過複製至少第一時 分(804)來產生第二時間部分,使得第二時間部分至1 包括來自具有瞬變事件的音頻錢的第—時間部分的副 本。 5、 依據申請專利範圍第i項所述的設備,其中,所 述信號處理器(11G)執行對瞬變減小的音頻信號的拉伸, 以及 所述信號插入器(120)被配置為:複製包括瞬變事 件的音頻信號的部分(8〇9)以及瞬變事件之前或之後的 信號部分’使得所述瞬變事件之前或之後的信號部分與所 述第一部分一共具有第二部分(8〇9)的持續時間;以及 在處理後的音頻信號中插入未修改的副本,或插入其中僅 起始部分(813)或結尾部分(813b)被修改過的、包括 瞬變的信號的副本。 ό、依據申請專利範圍第5項所述的設備,其中,所 述k號插入器(120)被配置為續定第二部分(8〇9),使 得所述第二部分在第二時間部分的起始或結尾處與處理 後的音頻信號具有交疊,以及所述信號插入器(12〇)被 配置為在處理後的音頻信號與第二時間部分之間的邊界 37 1380288 101年04月25日修正替換頁 處執行交叉哀減(128 ) 〇----- 7、依據申請專利範圍第丨項所述的設備,其中,所 述信號處理器包括聲碼器、相位聲碼器、或(p)SOLA處理 器。 8、 依據申请專利範圍第1項所述的設備,還包括信 號調節器(130),用於通過對受操縱音頻信號的時間離散 版本進行抽取或插值來調節所述受操縱音頻信號。 9、 依據申請專利範圍第1項所述的設備,其中,所 述信號插入器(120)被配置為: 確定(122)要從具有瞬變事件的音頻信號複製的第 二時間部分(809)的時間長度, 優選地通過找到最大互相關計算來確定(123)第二 時間部分的起始時刻或第二時間部分的停止時刻,使得優 選地第二時間部分的邊界盡可能地與處理後的音頻信號 的相應邊界相匹配, 其中’受操縱音頻信號中瞬變事件的時間位置(8〇3,) 與音頻信號中瞬變事件的時間位置(8〇3) 一致,或與音 頻信號中瞬變事件的時間位置(803)偏離小於心理聲學 可承受程度的時間差,所述心理聲學可承受程度由瞬變事 件的前掩蔽或後掩蔽來確定。 1 〇依據申凊專利範圍第1項所述的設備,還包括瞬 變檢測器(103),用於檢測音頻信號中的瞬變事件,或 還包括輔助資訊提取器(106)’用於提取並解釋與音 頻信號相關聯的輔助資訊,所述輔助資訊指示瞬變事件的 38 101年04月25日修正替換頁 時間位置(803),或指示第一時間部分或第二時間部分的 起始時刻或停止時刻。 11 〜種用於產生針對具有瞬變事件的音頻信號的元 貝料k號的設備,包括: (*變檢測器(1 〇3)’用於檢測音頻信號中的瞬變事件 ^匕疋資料計算器(1〇4,),用於產生元資料所述元資 ;斗心示瞬變事件在音頻信號中的時間位置,或指示瞬變事 ^之則的㈣時刻或瞬變事件之後的停止_或包括瞬 事件的音頻信號的時間部分的持續時間;以及 =號輪出介面(900),用於產生元資料信號,所述元 ;斗彳。號具有元資料或具有音頻信號和元資料兩者以供 傳輪或儲存。 U、一種操縱具有瞬變事件(801)的音頻信號的方 法’包括: 处理(110)瞬變減小的音頻信號,或處理包括瞬變 事件( 803)的音頻信號,以得到處理後的音頻信號,在 所述瞬變減小的音頻信號中’包括瞬變事件(801)的第 -時間部分(8〇4)被去除了; 在信號位置處將第二時間部分(8〇9)插入(12〇)處 理後的音軸射,所麟餘置是第_部分被去除的信 號位置’或瞬變事件在處理後的音頻信號中所處的信號位 ^ ”中苐二時間部分(809)包括不受所述處理影響的 瞬變事件(SQ1 ),以得到受操縱的音頻信號, 39 ▲其中,所述處理(11G)步驟通 頻㈣中產生感知性降低的瞬變部分,使得音頻 比原始音頻信敎長或更短轉續時間,以及7 所述第二時間部分⑽)具有與第-時間部分(804) 不同的持續時間,复φ,y_ # | & 伸的情灯第二時間部分 ()比弟一時間部分(8〇4)長,或在縮短 二時間部分⑽)比第一時間部分(8〇4)短,兄下第 一 13、:種產生針對具有瞬變事件的音頻信號的元資料 信號的方法,包括: 檢測(103)音頻信號中的瞬變事件(8〇1); 產生(104 )疋資料,所述元資料指示瞬變事件在音 頻信號中的時間位置,或指示瞬變事件之前的起始時刻^ 瞬變事件之後的停止時刻或包括_事件的 時間部分的持續時間;以及 ^ 產生(900)元資料信號,所述元資料信號具有元資 料或具號和元:雜兩者,祕__存。、 種針對具有瞬變事件⑽)的音頻信號的元 貧料仏’所述凡資料信號包括:指示瞬變事件在音頻作 號中的時間位置、或指示瞬變事件之前的起變 事件之後的停止❹U具㈣變事件的音齡號的U 部分的持__資訊,叹麟斜_分 中的位置有關的資訊。 15、-種具有程式竭的電腦程式,當所述電腦程式運 行在電腦上時,所述程式碼執行依據申請專利範圍第12 1380288 101年04月25日修正替換頁 項所述的方法或依據申請專利範圍第13項所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US3531708P | 2008-03-10 | 2008-03-10 | |
PCT/EP2009/001108 WO2009112141A1 (en) | 2008-03-10 | 2009-02-17 | Device and method for manipulating an audio signal having a transient event |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200951943A TW200951943A (en) | 2009-12-16 |
TWI380288B true TWI380288B (en) | 2012-12-21 |
Family
ID=40613146
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101114952A TWI505265B (zh) | 2008-03-10 | 2009-02-23 | 操縱具有瞬變事件的音頻信號的設備和方法以及具有執行該方法之程式碼的電腦程式 |
TW098105710A TWI380288B (en) | 2008-03-10 | 2009-02-23 | Device and method for manipulating an audio signal having a transient event |
TW101114956A TWI505266B (zh) | 2008-03-10 | 2009-02-23 | 操縱具有瞬變事件的音頻信號的設備和方法以及具有執行該方法之程式碼的電腦程式 |
TW101114948A TWI505264B (zh) | 2008-03-10 | 2009-02-23 | 操縱具有瞬變事件的音頻信號的設備和方法以及具有執行該方法之程式碼的電腦程式 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101114952A TWI505265B (zh) | 2008-03-10 | 2009-02-23 | 操縱具有瞬變事件的音頻信號的設備和方法以及具有執行該方法之程式碼的電腦程式 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101114956A TWI505266B (zh) | 2008-03-10 | 2009-02-23 | 操縱具有瞬變事件的音頻信號的設備和方法以及具有執行該方法之程式碼的電腦程式 |
TW101114948A TWI505264B (zh) | 2008-03-10 | 2009-02-23 | 操縱具有瞬變事件的音頻信號的設備和方法以及具有執行該方法之程式碼的電腦程式 |
Country Status (14)
Country | Link |
---|---|
US (4) | US9275652B2 (zh) |
EP (4) | EP2250643B1 (zh) |
JP (4) | JP5336522B2 (zh) |
KR (4) | KR101291293B1 (zh) |
CN (4) | CN102881294B (zh) |
AU (1) | AU2009225027B2 (zh) |
BR (4) | BR122012006265B1 (zh) |
CA (4) | CA2717694C (zh) |
ES (3) | ES2738534T3 (zh) |
MX (1) | MX2010009932A (zh) |
RU (4) | RU2487429C2 (zh) |
TR (1) | TR201910850T4 (zh) |
TW (4) | TWI505265B (zh) |
WO (1) | WO2009112141A1 (zh) |
Families Citing this family (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102881294B (zh) * | 2008-03-10 | 2014-12-10 | 弗劳恩霍夫应用研究促进协会 | 操纵具有瞬变事件的音频信号的方法和设备 |
USRE47180E1 (en) * | 2008-07-11 | 2018-12-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
KR101424944B1 (ko) * | 2008-12-15 | 2014-08-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 인코더 및 대역폭 확장 디코더 |
WO2010086461A1 (en) | 2009-01-28 | 2010-08-05 | Dolby International Ab | Improved harmonic transposition |
PL3751570T3 (pl) | 2009-01-28 | 2022-03-07 | Dolby International Ab | Ulepszona transpozycja harmonicznych |
EP2214165A3 (en) * | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
CN102318004B (zh) | 2009-09-18 | 2013-10-23 | 杜比国际公司 | 改进的谐波转置 |
CA2907353C (en) | 2009-10-20 | 2018-02-06 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values |
ES2532203T3 (es) | 2010-01-12 | 2015-03-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, decodificador de audio, método para codificar y decodificar una información de audio y programa de computación que obtiene un valor de contexto de sub-región basado en una norma de valores espectrales previamente decodificados |
DE102010001147B4 (de) | 2010-01-22 | 2016-11-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Mehrfrequenzbandempfänger auf Basis von Pfadüberlagerung mit Regelungsmöglichkeiten |
EP2362376A3 (en) * | 2010-02-26 | 2011-11-02 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using envelope shaping |
MX2012010350A (es) | 2010-03-09 | 2012-10-05 | Fraunhofer Ges Forschung | Aparato y metodo para manejar episodios de sonido de transitorios en señales de audio al cambiar el tono o velocidad de repeticion. |
WO2011110499A1 (en) | 2010-03-09 | 2011-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing an audio signal using patch border alignment |
CA2792449C (en) | 2010-03-09 | 2017-12-05 | Dolby International Ab | Device and method for improved magnitude response and temporal alignment in a phase vocoder based bandwidth extension method for audio signals |
CN102436820B (zh) * | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
JP5807453B2 (ja) * | 2011-08-30 | 2015-11-10 | 富士通株式会社 | 符号化方法、符号化装置および符号化プログラム |
KR101833463B1 (ko) * | 2011-10-12 | 2018-04-16 | 에스케이텔레콤 주식회사 | 음향 신호 품질 개선 시스템 및 그 방법 |
US9286942B1 (en) * | 2011-11-28 | 2016-03-15 | Codentity, Llc | Automatic calculation of digital media content durations optimized for overlapping or adjoined transitions |
EP2631906A1 (en) * | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
WO2013189528A1 (en) * | 2012-06-20 | 2013-12-27 | Widex A/S | Method of sound processing in a hearing aid and a hearing aid |
US9064318B2 (en) | 2012-10-25 | 2015-06-23 | Adobe Systems Incorporated | Image matting and alpha value techniques |
US9201580B2 (en) | 2012-11-13 | 2015-12-01 | Adobe Systems Incorporated | Sound alignment user interface |
US10638221B2 (en) | 2012-11-13 | 2020-04-28 | Adobe Inc. | Time interval sound alignment |
US9355649B2 (en) * | 2012-11-13 | 2016-05-31 | Adobe Systems Incorporated | Sound alignment using timing information |
US9076205B2 (en) | 2012-11-19 | 2015-07-07 | Adobe Systems Incorporated | Edge direction and curve based image de-blurring |
US10249321B2 (en) | 2012-11-20 | 2019-04-02 | Adobe Inc. | Sound rate modification |
US9451304B2 (en) | 2012-11-29 | 2016-09-20 | Adobe Systems Incorporated | Sound feature priority alignment |
US9135710B2 (en) | 2012-11-30 | 2015-09-15 | Adobe Systems Incorporated | Depth map stereo correspondence techniques |
US10455219B2 (en) | 2012-11-30 | 2019-10-22 | Adobe Inc. | Stereo correspondence and depth sensors |
US10249052B2 (en) | 2012-12-19 | 2019-04-02 | Adobe Systems Incorporated | Stereo correspondence model fitting |
US9208547B2 (en) | 2012-12-19 | 2015-12-08 | Adobe Systems Incorporated | Stereo correspondence smoothness tool |
US9214026B2 (en) | 2012-12-20 | 2015-12-15 | Adobe Systems Incorporated | Belief propagation and affinity measures |
WO2014136629A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
WO2014136628A1 (ja) * | 2013-03-05 | 2014-09-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
US9980074B2 (en) | 2013-05-29 | 2018-05-22 | Qualcomm Incorporated | Quantization step sizes for compression of spatial components of a sound field |
EP2838086A1 (en) | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
CN110619882B (zh) * | 2013-07-29 | 2023-04-04 | 杜比实验室特许公司 | 用于降低去相关器电路中瞬态信号的时间伪差的系统和方法 |
US9812150B2 (en) | 2013-08-28 | 2017-11-07 | Accusonus, Inc. | Methods and systems for improved signal decomposition |
BR112016009563B1 (pt) * | 2013-10-31 | 2021-12-21 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Extensão de largura de banda de áudio através da inserção de ruído temporal pré- formado no domínio de frequência |
ES2941782T3 (es) | 2013-12-19 | 2023-05-25 | Ericsson Telefon Ab L M | Estimación de ruido de fondo en señales de audio |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
US10468036B2 (en) * | 2014-04-30 | 2019-11-05 | Accusonus, Inc. | Methods and systems for processing and mixing signals using signal decomposition |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
EP2963646A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
US9640157B1 (en) * | 2015-12-28 | 2017-05-02 | Berggram Development Oy | Latency enhanced note recognition method |
US9711121B1 (en) * | 2015-12-28 | 2017-07-18 | Berggram Development Oy | Latency enhanced note recognition method in gaming |
US11562759B2 (en) | 2018-04-25 | 2023-01-24 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
MA52530A (fr) | 2018-04-25 | 2021-03-03 | Dolby Int Ab | Intégration de techniques de reconstruction audio haute fréquence |
US11158297B2 (en) * | 2020-01-13 | 2021-10-26 | International Business Machines Corporation | Timbre creation system |
CN112562703B (zh) * | 2020-11-17 | 2024-07-26 | 普联国际有限公司 | 一种音频的高频优化方法、装置和介质 |
Family Cites Families (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE179827T1 (de) * | 1994-11-25 | 1999-05-15 | Fleming K Fink | Verfahren zur veränderung eines sprachsignales mittels grundfrequenzmanipulation |
JPH08223049A (ja) * | 1995-02-14 | 1996-08-30 | Sony Corp | 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法 |
JP3580444B2 (ja) | 1995-06-14 | 2004-10-20 | ソニー株式会社 | 信号伝送方法および装置、並びに信号再生方法 |
US6049766A (en) | 1996-11-07 | 2000-04-11 | Creative Technology Ltd. | Time-domain time/pitch scaling of speech or audio signals with transient handling |
US6766300B1 (en) * | 1996-11-07 | 2004-07-20 | Creative Technology Ltd. | Method and apparatus for transient detection and non-distortion time scaling |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3017715B2 (ja) * | 1997-10-31 | 2000-03-13 | 松下電器産業株式会社 | 音声再生装置 |
US6266003B1 (en) * | 1998-08-28 | 2001-07-24 | Sigma Audio Research Limited | Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
US6316712B1 (en) | 1999-01-25 | 2001-11-13 | Creative Technology Ltd. | Method and apparatus for tempo and downbeat detection and alteration of rhythm in a musical segment |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP2001075571A (ja) * | 1999-09-07 | 2001-03-23 | Roland Corp | 波形生成装置 |
US6549884B1 (en) | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
GB2357683A (en) | 1999-12-24 | 2001-06-27 | Nokia Mobile Phones Ltd | Voiced/unvoiced determination for speech coding |
US7096481B1 (en) * | 2000-01-04 | 2006-08-22 | Emc Corporation | Preparation of metadata for splicing of encoded MPEG video and audio |
US7447639B2 (en) * | 2001-01-24 | 2008-11-04 | Nokia Corporation | System and method for error concealment in digital audio transmission |
US6876968B2 (en) * | 2001-03-08 | 2005-04-05 | Matsushita Electric Industrial Co., Ltd. | Run time synthesizer adaptation to improve intelligibility of synthesized speech |
US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
MXPA03009357A (es) * | 2001-04-13 | 2004-02-18 | Dolby Lab Licensing Corp | Escalamiento en el tiempo y escalamiento en el tono de alta calidad de senales de audio. |
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
DK1386312T3 (da) * | 2001-05-10 | 2008-06-09 | Dolby Lab Licensing Corp | Forbedring af transient ydeevne af audio kodningssystemer med lav bithastighed ved reduktion af forudgående stöj |
BR0309598A (pt) * | 2002-04-25 | 2005-02-09 | Shazam Entertainment Ltd | Método para a caracterização de um relacionamento entre uma primeira e uma segunda amostras de áudio, produto de programa de computador e sistema de computador |
JP4817658B2 (ja) * | 2002-06-05 | 2011-11-16 | アーク・インターナショナル・ピーエルシー | 音響仮想現実エンジンおよび配信された音声改善のための新技術 |
TW594674B (en) * | 2003-03-14 | 2004-06-21 | Mediatek Inc | Encoder and a encoding method capable of detecting audio signal transient |
JP4076887B2 (ja) * | 2003-03-24 | 2008-04-16 | ローランド株式会社 | ボコーダ装置 |
US7233832B2 (en) | 2003-04-04 | 2007-06-19 | Apple Inc. | Method and apparatus for expanding audio data |
SE0301273D0 (sv) | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
US6982377B2 (en) | 2003-12-18 | 2006-01-03 | Texas Instruments Incorporated | Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing |
CA3035175C (en) | 2004-03-01 | 2020-02-25 | Mark Franklin Davis | Reconstructing audio signals with multiple decorrelation techniques |
ATE523876T1 (de) * | 2004-03-05 | 2011-09-15 | Panasonic Corp | Fehlerverbergungseinrichtung und fehlerverbergungsverfahren |
JP4355745B2 (ja) * | 2004-03-17 | 2009-11-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化 |
TWI404419B (zh) * | 2004-04-07 | 2013-08-01 | Nielsen Media Res Inc | 與壓縮過音頻/視頻資料一起使用之資料插入方法、系統、機器可讀取媒體及設備 |
US8843378B2 (en) | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
KR100750115B1 (ko) * | 2004-10-26 | 2007-08-21 | 삼성전자주식회사 | 오디오 신호 부호화 및 복호화 방법 및 그 장치 |
US7752548B2 (en) * | 2004-10-29 | 2010-07-06 | Microsoft Corporation | Features such as titles, transitions, and/or effects which vary according to positions |
WO2006079349A1 (en) * | 2005-01-31 | 2006-08-03 | Sonorit Aps | Method for weighted overlap-add |
US7742914B2 (en) * | 2005-03-07 | 2010-06-22 | Daniel A. Kosek | Audio spectral noise reduction method and apparatus |
US7983922B2 (en) | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
JP5191886B2 (ja) * | 2005-06-03 | 2013-05-08 | ドルビー ラボラトリーズ ライセンシング コーポレイション | サイド情報を有するチャンネルの再構成 |
US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
US8121836B2 (en) | 2005-07-11 | 2012-02-21 | Lg Electronics Inc. | Apparatus and method of processing an audio signal |
US7565289B2 (en) * | 2005-09-30 | 2009-07-21 | Apple Inc. | Echo avoidance in audio time stretching |
US7917358B2 (en) * | 2005-09-30 | 2011-03-29 | Apple Inc. | Transient detection by power weighted average |
US8473298B2 (en) * | 2005-11-01 | 2013-06-25 | Apple Inc. | Pre-resampling to achieve continuously variable analysis time/frequency resolution |
WO2007066818A1 (ja) * | 2005-12-09 | 2007-06-14 | Sony Corporation | 音楽編集装置及び音楽編集方法 |
EP1964438B1 (en) * | 2005-12-13 | 2010-02-17 | Nxp B.V. | Device for and method of processing an audio data stream |
JP4949687B2 (ja) * | 2006-01-25 | 2012-06-13 | ソニー株式会社 | ビート抽出装置及びビート抽出方法 |
BRPI0706887A2 (pt) * | 2006-01-30 | 2012-08-21 | Clearplay Inc | "método para suprimir algum conteúdo de multimìdia de uma apresentação de conteúdo de multimìdia fornecida por um servidor remoto a um aparelho reprodutor de conteúdo de multimìdia do cliente e método para aplicar e sincronizar dados de filtro de conteúdo de mutimìdia com uma apresentação de conteúdo de multimìdia." |
JP4487958B2 (ja) * | 2006-03-16 | 2010-06-23 | ソニー株式会社 | メタデータ付与方法及び装置 |
DE102006017280A1 (de) * | 2006-04-12 | 2007-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals |
WO2007127023A1 (en) * | 2006-04-27 | 2007-11-08 | Dolby Laboratories Licensing Corporation | Audio gain control using specific-loudness-based auditory event detection |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
US8046749B1 (en) * | 2006-06-27 | 2011-10-25 | The Mathworks, Inc. | Analysis of a sequence of data in object-oriented environments |
US8239190B2 (en) | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US7514620B2 (en) * | 2006-08-25 | 2009-04-07 | Apple Inc. | Method for shifting pitches of audio signals to a desired pitch relationship |
WO2008066930A2 (en) * | 2006-11-30 | 2008-06-05 | Dolby Laboratories Licensing Corporation | Extracting features of video & audio signal content to provide reliable identification of the signals |
WO2008088482A1 (en) * | 2006-12-28 | 2008-07-24 | Thomson Licensing | Method and apparatus for automatic visual artifact analysis and artifact reduction |
US20080181298A1 (en) * | 2007-01-26 | 2008-07-31 | Apple Computer, Inc. | Hybrid scalable coding |
US20080221876A1 (en) * | 2007-03-08 | 2008-09-11 | Universitat Fur Musik Und Darstellende Kunst | Method for processing audio data into a condensed version |
US20090024234A1 (en) * | 2007-07-19 | 2009-01-22 | Archibald Fitzgerald J | Apparatus and method for coupling two independent audio streams |
CN102881294B (zh) * | 2008-03-10 | 2014-12-10 | 弗劳恩霍夫应用研究促进协会 | 操纵具有瞬变事件的音频信号的方法和设备 |
US8380331B1 (en) * | 2008-10-30 | 2013-02-19 | Adobe Systems Incorporated | Method and apparatus for relative pitch tracking of multiple arbitrary sounds |
WO2010086461A1 (en) * | 2009-01-28 | 2010-08-05 | Dolby International Ab | Improved harmonic transposition |
TWI484473B (zh) | 2009-10-30 | 2015-05-11 | Dolby Int Ab | 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統 |
-
2009
- 2009-02-17 CN CN201210261998.1A patent/CN102881294B/zh active Active
- 2009-02-17 JP JP2010550054A patent/JP5336522B2/ja active Active
- 2009-02-17 CN CN201210262760.0A patent/CN102789785B/zh active Active
- 2009-02-17 TR TR2019/10850T patent/TR201910850T4/tr unknown
- 2009-02-17 BR BR122012006265-0A patent/BR122012006265B1/pt active IP Right Grant
- 2009-02-17 EP EP09719651.3A patent/EP2250643B1/en active Active
- 2009-02-17 CN CN2009801081751A patent/CN101971252B/zh active Active
- 2009-02-17 MX MX2010009932A patent/MX2010009932A/es active IP Right Grant
- 2009-02-17 ES ES09719651T patent/ES2738534T3/es active Active
- 2009-02-17 KR KR1020107020270A patent/KR101291293B1/ko active IP Right Grant
- 2009-02-17 RU RU2010137429/08A patent/RU2487429C2/ru active
- 2009-02-17 EP EP10194088.0A patent/EP2293294B1/en active Active
- 2009-02-17 KR KR1020127005833A patent/KR101230480B1/ko active IP Right Grant
- 2009-02-17 WO PCT/EP2009/001108 patent/WO2009112141A1/en active Application Filing
- 2009-02-17 ES ES10194088T patent/ES2747903T3/es active Active
- 2009-02-17 BR BR122012006269-3A patent/BR122012006269A2/pt not_active Application Discontinuation
- 2009-02-17 CA CA2717694A patent/CA2717694C/en active Active
- 2009-02-17 US US12/921,550 patent/US9275652B2/en active Active
- 2009-02-17 RU RU2012113092/08A patent/RU2565009C2/ru active IP Right Revival
- 2009-02-17 KR KR1020127005832A patent/KR101230479B1/ko active IP Right Grant
- 2009-02-17 RU RU2012113087/08A patent/RU2565008C2/ru active
- 2009-02-17 CA CA2897276A patent/CA2897276C/en active Active
- 2009-02-17 KR KR1020127005834A patent/KR101230481B1/ko active IP Right Grant
- 2009-02-17 ES ES10194086T patent/ES2739667T3/es active Active
- 2009-02-17 CA CA2897271A patent/CA2897271C/en active Active
- 2009-02-17 AU AU2009225027A patent/AU2009225027B2/en active Active
- 2009-02-17 EP EP10194095A patent/EP2293295A3/en not_active Withdrawn
- 2009-02-17 BR BRPI0906142-8A patent/BRPI0906142B1/pt active IP Right Grant
- 2009-02-17 CA CA2897278A patent/CA2897278A1/en active Pending
- 2009-02-17 CN CN201210262522.XA patent/CN102789784B/zh active Active
- 2009-02-17 BR BR122012006270-7A patent/BR122012006270B1/pt active IP Right Grant
- 2009-02-17 EP EP10194086.4A patent/EP2296145B1/en active Active
- 2009-02-23 TW TW101114952A patent/TWI505265B/zh active
- 2009-02-23 TW TW098105710A patent/TWI380288B/zh active
- 2009-02-23 TW TW101114956A patent/TWI505266B/zh active
- 2009-02-23 TW TW101114948A patent/TWI505264B/zh active
-
2012
- 2012-03-12 JP JP2012055130A patent/JP5425952B2/ja active Active
- 2012-03-12 JP JP2012055128A patent/JP5425249B2/ja active Active
- 2012-03-12 JP JP2012055129A patent/JP5425250B2/ja active Active
- 2012-04-03 RU RU2012113063/08A patent/RU2598326C2/ru active IP Right Revival
- 2012-05-07 US US13/465,946 patent/US9236062B2/en active Active
- 2012-05-07 US US13/465,958 patent/US20130010983A1/en not_active Abandoned
- 2012-05-07 US US13/465,936 patent/US9230558B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI380288B (en) | Device and method for manipulating an audio signal having a transient event | |
CA2821035A1 (en) | Device and method for manipulating an audio signal having a transient event | |
AU2012216538B2 (en) | Device and method for manipulating an audio signal having a transient event |