KR100945673B1 - 프리-노이즈를 감소시킴으로써 로우 비트 레이트 오디오코딩 시스템의 과도현상 성능을 개선시키는 방법 - Google Patents
프리-노이즈를 감소시킴으로써 로우 비트 레이트 오디오코딩 시스템의 과도현상 성능을 개선시키는 방법 Download PDFInfo
- Publication number
- KR100945673B1 KR100945673B1 KR1020037014462A KR20037014462A KR100945673B1 KR 100945673 B1 KR100945673 B1 KR 100945673B1 KR 1020037014462 A KR1020037014462 A KR 1020037014462A KR 20037014462 A KR20037014462 A KR 20037014462A KR 100945673 B1 KR100945673 B1 KR 100945673B1
- Authority
- KR
- South Korea
- Prior art keywords
- transient
- time
- audio
- audio signal
- delete delete
- Prior art date
Links
- 230000001052 transient effect Effects 0.000 title claims description 279
- 230000005236 sound signal Effects 0.000 claims abstract description 84
- 230000002123 temporal effect Effects 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims description 106
- 238000012545 processing Methods 0.000 claims description 70
- 230000006835 compression Effects 0.000 claims description 19
- 238000007906 compression Methods 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 16
- 230000008961 swelling Effects 0.000 claims 2
- 238000005259 measurement Methods 0.000 claims 1
- 238000004904 shortening Methods 0.000 claims 1
- 238000013139 quantization Methods 0.000 abstract description 8
- 230000008569 process Effects 0.000 description 43
- 238000007781 pre-processing Methods 0.000 description 31
- 238000012805 post-processing Methods 0.000 description 29
- 238000004458 analytical method Methods 0.000 description 19
- 238000001514 detection method Methods 0.000 description 18
- 230000000873 masking effect Effects 0.000 description 18
- 230000035945 sensitivity Effects 0.000 description 13
- 230000009467 reduction Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000010420 art technique Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Analogue/Digital Conversion (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
Claims (51)
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 코딩 블럭들을 사용하는 변환 기반 로우 비트 레이트 오디오 코딩 시스템의 디코더에서, 역변환에 후속하는 오디오 신호 스트림의 신호 과도현상에 선행하는 왜곡 가공물들을 감소시키기 위한 방법에 있어서,오디오 신호 스트림에서 과도현상을 검출하는 단계;상기 왜곡 가공물들의 시간 기간이 감소되도록 신호 과도현상에 선행하는 상기 왜곡 가공물들의 적어도 일부분을 시간 압축하는 단계; 및오디오 신호 스트림의 시간 전개와 길이가 실질적으로 변동되지 않도록 상기 시간 압축 이전에 시간 팽창하거나, 오디오 신호 스트림의 길이가 실질적으로 변동되지 않도록 상기 시간 압축에 후속하여 시간 팽창하는 단계;를 포함하는 방법.
- 제 32 항에 있어서, 왜곡 가공물들의 일부분은 디폴트 파라미터와 검출된 과도현상의 위치에 의해 적어도 부분적으로 결정되는 방법.
- 제 32 항에 있어서, 왜곡 가공물들의 일부분은 상기 과도현상에 선행하는 신호 특성과 검출된 과도현상의 위치에 의해 적어도 부분적으로 결정되는 방법.
- 제 34 항에 있어서, 상기 신호 특성은 오디오 신호 스트림의 고주파수 성분의 측정을 포함하는 방법.
- 삭제
- 삭제
- 제 32 항에 있어서, 과도현상 사전-잡음 기간을 감소시킬 시 유용한 메타데이터 정보를 수신하는 단계를 더 포함하는 방법.
- 제 38 항에 있어서, 상기 메타데이터 정보는 오디오 코더 블럭(들)의 길이, 오디오 데이터에 대한 코더 블럭 경계들의 관계, 및 과도현상 사전-잡음의 소정의 길이 중 하나 이상을 포함하는 방법.
- 코딩 블럭들을 사용하는 변환 기반 로우 비트 레이트 오디오 코딩 시스템의 디코더에서, 역변환에 후속하는 오디오 신호 스트림의 신호 과도현상에 선행하는 왜곡 가공물들을 감소시키기 위한 방법에 있어서,과도현상 사전-잡음 기간을 감소시킬 시 유용한 신호 과도현상들의 위치를 포함하는 메타데이터 정보를 수신하는 단계; 및상기 왜곡 가공물들의 시간 기간이 감소되도록 상기 왜곡 가공물들의 적어도 일부분을 시간 압축하는 단계;를 포함하는 방법.
- 제 40 항에 있어서, 상기 메타데이터 정보는 또한 오디오 코더 블럭(들)의 길이, 오디오 데이터에 대한 코더 블럭 경계들의 관계, 및 과도현상 사전-잡음의 소정의 길이 중 하나 이상을 포함하는 방법.
- 제 38 내지 41 항 중 어느 한 항에 있어서, 오디오 신호 스트림의 시간 전개 및 길이가 실질적으로 변동되지 않도록 상기 시간 압축 이전에 시간 팽창 단계를 더 포함하는 방법.
- 제 38 내지 41 항 중 어느 한 항에 있어서, 오디오 신호 스트림의 길이가 실질적으로 변동되지 않도록 상기 시간 압축에 후속하여 시간 팽창 단계를 더 포함하는 방법.
- 삭제
- 코딩 블럭들을 사용하는 변환 기반 로우 비트 레이트 오디오 코딩 시스템에 의해 프로세싱된 오디오 신호 스트림에서의 신호 과도현상에 선행하는 왜곡 가공물들을 감소시키기 위한 방법에 있어서,상기 코딩 시스템에 의한 프로세싱 이전에 오디오 신호 스트림에서 과도현상을 검출하는 단계;상기 왜곡 가공물들의 시간 기간이 단축되도록, 상기 신호 과도현상에 선행하는 상기 오디오 신호 스트림의 세그먼트를 타임 스케일링하여 상기 코딩 블럭들에 관련한 상기 과도현상의 시간적 관계를 시프팅하는 단계로서, 상기 타임 스케일링은 코딩 시스템에 적용되는 오디오 신호 스트림들로부터 신호 성분들을 삭제하거나 또는 코딩 시스템에 적용되는 오디오 신호 스트림들에 신호 성분들을 부가하는 효과를 갖는 시프팅 단계; 및상기 신호 과도현상에 이은 부가적인 타임 스케일링을 적용하는 단계로서, 상기 부가적인 타임 스케일링은 상기 시프팅 단계에서의 타임 스케일링에 반대 의미로 작용하는 적용 단계;를 포함하는 방법.
- 코딩 블럭들을 사용하는 변환 기반 로우 비트 레이트 오디오 코딩 시스템에 의해 프로세싱된 오디오 신호 스트림에서의 신호 과도현상에 선행하는 왜곡 가공물들을 감소시키기 위한 방법에 있어서,상기 코딩 시스템에 의한 프로세싱 이전에 오디오 신호 스트림에서 과도현상을 검출하는 단계;상기 왜곡 가공물들의 시간 기간이 단축되도록, 상기 신호 과도현상에 선행하는 상기 오디오 신호 스트림의 세그먼트를 타임 스케일링하여 상기 코딩 블럭들에 관련한 상기 과도현상의 시간적 관계를 시프팅하는 단계로서, 상기 타임 스케일링은 코딩 시스템에 적용되는 오디오 신호 스트림들로부터 신호 성분들을 삭제하거나 또는 코딩 시스템에 적용되는 오디오 신호 스트림들에 신호 성분들을 부가하는 효과를 갖는 시프팅 단계; 및프로세싱된 오디오 신호 스트림의 시간 전개가 상기 시프팅 단계 이전의 오디오 신호 스트림의 시간 전개와 실질적으로 동일하고 상기 오디오 신호 스트림의 시간 기간이 실질적으로 변동되지 않도록, 상기 과도현상에 선행하는 상기 왜곡 가공물들에 선행하며 상기 코딩 시스템의 디코더에서 역변환에 후속하는 오디오 신호 스트림에 타임 스케일링 보상을 적용하는 단계;를 포함하는 방법.
- 코딩 블럭들을 사용하는 변환 기반 로우 비트 레이트 오디오 코딩 시스템에 의해 프로세싱된 오디오 신호 스트림에서의 신호 과도현상에 선행하는 왜곡 가공물들을 감소시키기 위한 방법에 있어서,상기 코딩 시스템에 의한 프로세싱 이전에 오디오 신호 스트림에서 과도현상을 검출하는 단계;상기 왜곡 가공물들의 시간 기간이 단축되도록, 상기 신호 과도현상에 선행하는 상기 오디오 신호 스트림의 세그먼트를 타임 스케일링하여 상기 코딩 블럭들에 관련한 상기 과도현상의 시간적 관계를 시프팅하는 단계; 및상기 신호 과도현상에 이은 부가적인 타임 스케일링을 적용하는 단계로서, 상기 부가적인 타임 스케일링은 상기 시프팅 단계에서의 타임 스케일링에 반대 의미로 작용하는 적용 단계;를 포함하는 방법.
- 코딩 블럭들을 사용하는 변환 기반 로우 비트 레이트 오디오 코딩 시스템에 의해 프로세싱된 오디오 신호 스트림에서의 신호 과도현상에 선행하는 왜곡 가공물들을 감소시키기 위한 방법에 있어서,상기 코딩 시스템에 의한 프로세싱 이전에 오디오 신호 스트림에서 다중 과도현상들을 검출하는 단계;상기 과도현상들 중 첫 번째 과도현상이 단축되기 전에 왜곡 가공물들의 시간 기간이 단축되도록, 상기 첫 번째 과도현상에 선행하는 상기 오디오 신호 스트림의 세그먼트를 타임 스케일링하여 상기 코딩 블럭들에 관련한 상기 첫 번째 과도현상의 시간적 관계를 시프팅하는 단계; 및상기 첫 번째 과도현상에 이어 그리고 상기 다중 과도현상들 중 하나 이상의 다른 과도현상 전에 부가적인 시간 스케일링을 적용하는 단계로서, 상기 부가적인 시간 스케일링은 상기 시프팅 단계에서의 타임 스케일링에 반대 의미로 작용하는 적용 단계;를 포함하는 방법.
- 코딩 블럭들을 사용하는 변환 기반 로우 비트 레이트 오디오 코딩 시스템의 디코더에서, 역변환에 후속하는 오디오 신호 스트림에서의 신호 과도현상에 선행하는 왜곡 가공물들을 감소시키기 위한 방법에 있어서,오디오 신호 스트림에서 과도 현상을 검출하는 단계;상기 왜곡 가공물들의 시간 기간이 단축되도록, 상기 왜곡 가공물들의 적어도 일부분을 시간 압축하는 단계; 및상기 오디오 신호 스트림의 길이가 실질적으로 변동되지 않도록, 상기 시간 압축에 후속하여 시간 팽창하는 단계;를 포함하는 방법.
- 코딩 블럭들을 사용하는 변환 기반 로우 비트 레이트 오디오 코딩 시스템의 디코더에서, 역변환에 후속하는 오디오 신호 스트림에서의 신호 과도현상에 선행하는 왜곡 가공물들을 감소시키기 위한 방법에 있어서,과도현상 사전-잡음 기간을 단축하는데 유용한 메타데이터 정보를 수신하는 단계;상기 왜곡 가공물들의 시간 기간이 단축되도록, 상기 왜곡 가공물들의 적어도 일부분을 시간 압축하는 단계; 및상기 오디오 신호 스트림의 길이가 실질적으로 변동되지 않도록, 상기 시간 압축에 후속하여 시간 팽창하는 단계;를 포함하는 방법.
- 제 50 항에 있어서, 상기 메타데이터는 신호 과도현상들의 위치를 포함하는 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US29028601P | 2001-05-10 | 2001-05-10 | |
US60/290,286 | 2001-05-10 | ||
PCT/US2002/012957 WO2002093560A1 (en) | 2001-05-10 | 2002-04-25 | Improving transient performance of low bit rate audio coding systems by reducing pre-noise |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040034604A KR20040034604A (ko) | 2004-04-28 |
KR100945673B1 true KR100945673B1 (ko) | 2010-03-05 |
Family
ID=23115313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020037014462A KR100945673B1 (ko) | 2001-05-10 | 2002-04-25 | 프리-노이즈를 감소시킴으로써 로우 비트 레이트 오디오코딩 시스템의 과도현상 성능을 개선시키는 방법 |
Country Status (14)
Country | Link |
---|---|
US (1) | US7313519B2 (ko) |
EP (1) | EP1386312B1 (ko) |
JP (1) | JP4290997B2 (ko) |
KR (1) | KR100945673B1 (ko) |
CN (1) | CN1312662C (ko) |
AT (1) | ATE387000T1 (ko) |
AU (1) | AU2002307533B2 (ko) |
CA (1) | CA2445480C (ko) |
DE (1) | DE60225130T2 (ko) |
DK (1) | DK1386312T3 (ko) |
ES (1) | ES2298394T3 (ko) |
HK (1) | HK1070457A1 (ko) |
MX (1) | MXPA03010237A (ko) |
WO (1) | WO2002093560A1 (ko) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4134297A1 (de) * | 1991-10-17 | 1993-04-22 | Behringwerke Ag | Monoclonale antikoerper gegen mycoplasma pneumoniae, diese produzierende hybridome, verfahren zu deren herstellung sowie deren verwendung |
US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7711123B2 (en) | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
US7283954B2 (en) | 2001-04-13 | 2007-10-16 | Dolby Laboratories Licensing Corporation | Comparing audio using characterizations based on auditory events |
US7461002B2 (en) | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
EP1386312B1 (en) | 2001-05-10 | 2008-02-20 | Dolby Laboratories Licensing Corporation | Improving transient performance of low bit rate audio coding systems by reducing pre-noise |
US7171367B2 (en) * | 2001-12-05 | 2007-01-30 | Ssi Corporation | Digital audio with parameters for real-time time scaling |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US20030182106A1 (en) * | 2002-03-13 | 2003-09-25 | Spectral Design | Method and device for changing the temporal length and/or the tone pitch of a discrete audio signal |
JP4076887B2 (ja) * | 2003-03-24 | 2008-04-16 | ローランド株式会社 | ボコーダ装置 |
US7548852B2 (en) * | 2003-06-30 | 2009-06-16 | Koninklijke Philips Electronics N.V. | Quality of decoded audio by adding noise |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
ATE430360T1 (de) | 2004-03-01 | 2009-05-15 | Dolby Lab Licensing Corp | Mehrkanalige audiodekodierung |
CN101023484A (zh) * | 2004-07-30 | 2007-08-22 | 汤姆森特许公司 | 机械震动或摆动情况下在光盘系统中缓冲音频数据的方法 |
US7508947B2 (en) | 2004-08-03 | 2009-03-24 | Dolby Laboratories Licensing Corporation | Method for combining audio signals using auditory scene analysis |
JP2006084754A (ja) * | 2004-09-16 | 2006-03-30 | Oki Electric Ind Co Ltd | 音声録音再生装置 |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100750115B1 (ko) * | 2004-10-26 | 2007-08-21 | 삼성전자주식회사 | 오디오 신호 부호화 및 복호화 방법 및 그 장치 |
MX2007015118A (es) * | 2005-06-03 | 2008-02-14 | Dolby Lab Licensing Corp | Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion. |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7562021B2 (en) | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
US7917358B2 (en) * | 2005-09-30 | 2011-03-29 | Apple Inc. | Transient detection by power weighted average |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
CN101308655B (zh) * | 2007-05-16 | 2011-07-06 | 展讯通信(上海)有限公司 | 一种音频编解码方法与装置 |
CN101308656A (zh) * | 2007-05-17 | 2008-11-19 | 展讯通信(上海)有限公司 | 音频暂态信号的编解码方法 |
ES2358786T3 (es) * | 2007-06-08 | 2011-05-13 | Dolby Laboratories Licensing Corporation | Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial. |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US9495971B2 (en) | 2007-08-27 | 2016-11-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Transient detector and method for supporting encoding of an audio signal |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
JP5328804B2 (ja) * | 2007-12-21 | 2013-10-30 | フランス・テレコム | 適応型ウィンドウを有する変換ベースの符号化/復号化 |
CN101488344B (zh) * | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
EP2293294B1 (en) | 2008-03-10 | 2019-07-24 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Device and method for manipulating an audio signal having a transient event |
JP2010017216A (ja) * | 2008-07-08 | 2010-01-28 | Ge Medical Systems Global Technology Co Llc | 音声データ処理装置,音声データ処理方法、および、イメージング装置 |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
PL2311033T3 (pl) | 2008-07-11 | 2012-05-31 | Fraunhofer Ges Forschung | Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem |
US8380498B2 (en) * | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US9384748B2 (en) * | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
CN101770776B (zh) | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理系统 |
EP2214165A3 (en) * | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
US8554348B2 (en) * | 2009-07-20 | 2013-10-08 | Apple Inc. | Transient detection using a digital audio workstation |
US8153882B2 (en) * | 2009-07-20 | 2012-04-10 | Apple Inc. | Time compression/expansion of selected audio segments in an audio file |
KR100940532B1 (ko) | 2009-09-28 | 2010-02-10 | 삼성전자주식회사 | 저비트율 복호화방법 및 장치 |
TWI557723B (zh) | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
EP2372704A1 (en) * | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor and method for processing a signal |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
FR2961938B1 (fr) * | 2010-06-25 | 2013-03-01 | Inst Nat Rech Inf Automat | Synthetiseur numerique audio ameliore |
CN103026406B (zh) | 2010-09-28 | 2014-10-08 | 华为技术有限公司 | 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法 |
WO2012040898A1 (en) | 2010-09-28 | 2012-04-05 | Huawei Technologies Co., Ltd. | Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal |
WO2013075753A1 (en) * | 2011-11-25 | 2013-05-30 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
EP2828854B1 (en) | 2012-03-23 | 2016-03-16 | Dolby Laboratories Licensing Corporation | Hierarchical active voice detection |
CN110232929B (zh) | 2013-02-20 | 2023-06-13 | 弗劳恩霍夫应用研究促进协会 | 用于对音频信号进行译码的译码器和方法 |
US20150179181A1 (en) * | 2013-12-20 | 2015-06-25 | Microsoft Corporation | Adapting audio based upon detected environmental accoustics |
KR20160119859A (ko) * | 2014-02-10 | 2016-10-14 | 아우디맥스, 엘엘씨 | 개선된 잡음 내성을 갖는 통신 시스템들, 방법들 및 디바이스들 |
PL232466B1 (pl) * | 2015-01-19 | 2019-06-28 | Zylia Spolka Z Ograniczona Odpowiedzialnoscia | Sposób kodowania, sposób dekodowania, koder oraz dekoder sygnału audio |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
US10726851B2 (en) * | 2017-08-31 | 2020-07-28 | Sony Interactive Entertainment Inc. | Low latency audio stream acceleration by selectively dropping and blending audio blocks |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0863194A (ja) * | 1994-08-23 | 1996-03-08 | Hitachi Denshi Ltd | 残差駆動形線形予測方式ボコーダ |
WO2000022611A1 (en) * | 1998-10-09 | 2000-04-20 | Hejna Donald J Jr | Method and apparatus to prepare listener-interest-filtered works |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4624009A (en) * | 1980-05-02 | 1986-11-18 | Figgie International, Inc. | Signal pattern encoder and classifier |
US4464784A (en) * | 1981-04-30 | 1984-08-07 | Eventide Clockworks, Inc. | Pitch changer with glitch minimizer |
US4723290A (en) * | 1983-05-16 | 1988-02-02 | Kabushiki Kaisha Toshiba | Speech recognition apparatus |
US4700391A (en) * | 1983-06-03 | 1987-10-13 | The Variable Speech Control Company ("Vsc") | Method and apparatus for pitch controlled voice signal processing |
US4792975A (en) * | 1983-06-03 | 1988-12-20 | The Variable Speech Control ("Vsc") | Digital speech signal processing for pitch change with jump control in accordance with pitch period |
US5202761A (en) * | 1984-11-26 | 1993-04-13 | Cooper J Carl | Audio synchronization apparatus |
US4703355A (en) * | 1985-09-16 | 1987-10-27 | Cooper J Carl | Audio to video timing equalizer method and apparatus |
USRE33535E (en) * | 1985-09-16 | 1991-02-12 | Audio to video timing equalizer method and apparatus | |
US5040081A (en) * | 1986-09-23 | 1991-08-13 | Mccutchen David | Audiovisual synchronization signal generator using audio signature comparison |
US4852170A (en) * | 1986-12-18 | 1989-07-25 | R & D Associates | Real time computer speech recognition system |
JPS63225300A (ja) * | 1987-03-16 | 1988-09-20 | 株式会社東芝 | パタ−ン認識装置 |
GB8720527D0 (en) * | 1987-09-01 | 1987-10-07 | King R A | Voice recognition |
US5055939A (en) | 1987-12-15 | 1991-10-08 | Karamon John J | Method system & apparatus for synchronizing an auxiliary sound source containing multiple language channels with motion picture film video tape or other picture source containing a sound track |
IL84902A (en) * | 1987-12-21 | 1991-12-15 | D S P Group Israel Ltd | Digital autocorrelation system for detecting speech in noisy audio signal |
JP2739950B2 (ja) * | 1988-03-31 | 1998-04-15 | 株式会社東芝 | パターン認識装置 |
WO1991019989A1 (en) | 1990-06-21 | 1991-12-26 | Reynolds Software, Inc. | Method and apparatus for wave analysis and event recognition |
US5313531A (en) * | 1990-11-05 | 1994-05-17 | International Business Machines Corporation | Method and apparatus for speech analysis and speech recognition |
US5216744A (en) * | 1991-03-21 | 1993-06-01 | Dictaphone Corporation | Time scale modification of speech signals |
FR2674710B1 (fr) * | 1991-03-27 | 1994-11-04 | France Telecom | Procede et systeme de traitement des preechos d'un signal audio-numerique code par transformee frequentielle. |
JP3134338B2 (ja) * | 1991-03-30 | 2001-02-13 | ソニー株式会社 | ディジタル音声信号符号化方法 |
US5175769A (en) | 1991-07-23 | 1992-12-29 | Rolm Systems | Method for time-scale modification of signals |
US5450522A (en) * | 1991-08-19 | 1995-09-12 | U S West Advanced Technologies, Inc. | Auditory model for parametrization of speech |
US5621857A (en) * | 1991-12-20 | 1997-04-15 | Oregon Graduate Institute Of Science And Technology | Method and system for identifying and recognizing speech |
JP3104400B2 (ja) * | 1992-04-27 | 2000-10-30 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
US5630013A (en) | 1993-01-25 | 1997-05-13 | Matsushita Electric Industrial Co., Ltd. | Method of and apparatus for performing time-scale modification of speech signals |
KR100372208B1 (ko) * | 1993-09-09 | 2003-04-07 | 산요 덴키 가부시키가이샤 | 음성신호의시간축압축/신장방법 |
JP3186412B2 (ja) * | 1994-04-01 | 2001-07-11 | ソニー株式会社 | 情報符号化方法、情報復号化方法、及び情報伝送方法 |
JP3307138B2 (ja) * | 1995-02-27 | 2002-07-24 | ソニー株式会社 | 信号符号化方法及び装置、並びに信号復号化方法及び装置 |
US5920840A (en) | 1995-02-28 | 1999-07-06 | Motorola, Inc. | Communication system and method using a speaker dependent time-scaling technique |
US5730140A (en) * | 1995-04-28 | 1998-03-24 | Fitch; William Tecumseh S. | Sonification system using synthesized realistic body sounds modified by other medically-important variables for physiological monitoring |
US5699404A (en) | 1995-06-26 | 1997-12-16 | Motorola, Inc. | Apparatus for time-scaling in communication products |
US6002776A (en) * | 1995-09-18 | 1999-12-14 | Interval Research Corporation | Directional acoustic signal processor and method therefor |
US5960390A (en) * | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
FR2739736B1 (fr) * | 1995-10-05 | 1997-12-05 | Jean Laroche | Procede de reduction des pre-echos ou post-echos affectant des enregistrements audio |
JPH10513282A (ja) * | 1995-11-22 | 1998-12-15 | フィリップス エレクトロニクス ネムローゼ フェンノートシャップ | 言語信号再合成方法および装置 |
US5749073A (en) * | 1996-03-15 | 1998-05-05 | Interval Research Corporation | System for automatically morphing audio information |
US5828994A (en) * | 1996-06-05 | 1998-10-27 | Interval Research Corporation | Non-uniform time scale modification of recorded audio |
JPH1074097A (ja) | 1996-07-26 | 1998-03-17 | Ind Technol Res Inst | オーディオ信号のパラメータを変更する方法及び装置 |
US6049766A (en) | 1996-11-07 | 2000-04-11 | Creative Technology Ltd. | Time-domain time/pitch scaling of speech or audio signals with transient handling |
US5893062A (en) * | 1996-12-05 | 1999-04-06 | Interval Research Corporation | Variable rate video playback with synchronized audio |
DE19710545C1 (de) | 1997-03-14 | 1997-12-04 | Grundig Ag | Effizientes Verfahren zur Geschwindigkeitsmodifikation von Sprachsignalen |
US6211919B1 (en) * | 1997-03-28 | 2001-04-03 | Tektronix, Inc. | Transparent embedment of data in a video signal |
TW357335B (en) * | 1997-10-08 | 1999-05-01 | Winbond Electronics Corp | Apparatus and method for variation of tone of digital audio signals |
EP0976125B1 (en) | 1997-12-19 | 2004-03-24 | Koninklijke Philips Electronics N.V. | Removing periodicity from a lengthened audio signal |
US6266003B1 (en) | 1998-08-28 | 2001-07-24 | Sigma Audio Research Limited | Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals |
US6266644B1 (en) | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
SE9903552D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching |
JP3430968B2 (ja) * | 1999-05-06 | 2003-07-28 | ヤマハ株式会社 | ディジタル信号の時間軸圧伸方法及び装置 |
JP3430974B2 (ja) * | 1999-06-22 | 2003-07-28 | ヤマハ株式会社 | ステレオ信号の時間軸圧伸方法及び装置 |
US6505153B1 (en) * | 2000-05-22 | 2003-01-07 | Compaq Information Technologies Group, L.P. | Efficient method for producing off-line closed captions |
CN1408146A (zh) * | 2000-11-03 | 2003-04-02 | 皇家菲利浦电子有限公司 | 音频信号的参数编码 |
US7461002B2 (en) * | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
US7283954B2 (en) * | 2001-04-13 | 2007-10-16 | Dolby Laboratories Licensing Corporation | Comparing audio using characterizations based on auditory events |
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
WO2002084645A2 (en) | 2001-04-13 | 2002-10-24 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US20020116178A1 (en) * | 2001-04-13 | 2002-08-22 | Crockett Brett G. | High quality time-scaling and pitch-scaling of audio signals |
EP1386312B1 (en) | 2001-05-10 | 2008-02-20 | Dolby Laboratories Licensing Corporation | Improving transient performance of low bit rate audio coding systems by reducing pre-noise |
MXPA03010749A (es) | 2001-05-25 | 2004-07-01 | Dolby Lab Licensing Corp | Comparacion de audio usando caracterizaciones basadas en eventos auditivos. |
MXPA03010751A (es) | 2001-05-25 | 2005-03-07 | Dolby Lab Licensing Corp | Segmentacion de senales de audio en eventos auditivos. |
US7346667B2 (en) | 2001-05-31 | 2008-03-18 | Ubs Ag | System for delivering dynamic content |
US20040122772A1 (en) * | 2002-12-18 | 2004-06-24 | International Business Machines Corporation | Method, system and program product for protecting privacy |
-
2002
- 2002-04-25 EP EP02769666A patent/EP1386312B1/en not_active Expired - Lifetime
- 2002-04-25 DE DE60225130T patent/DE60225130T2/de not_active Expired - Lifetime
- 2002-04-25 CA CA2445480A patent/CA2445480C/en not_active Expired - Lifetime
- 2002-04-25 DK DK02769666T patent/DK1386312T3/da active
- 2002-04-25 AT AT02769666T patent/ATE387000T1/de active
- 2002-04-25 MX MXPA03010237A patent/MXPA03010237A/es active IP Right Grant
- 2002-04-25 US US10/476,347 patent/US7313519B2/en not_active Expired - Lifetime
- 2002-04-25 WO PCT/US2002/012957 patent/WO2002093560A1/en active IP Right Grant
- 2002-04-25 ES ES02769666T patent/ES2298394T3/es not_active Expired - Lifetime
- 2002-04-25 JP JP2002590350A patent/JP4290997B2/ja not_active Expired - Lifetime
- 2002-04-25 AU AU2002307533A patent/AU2002307533B2/en not_active Expired
- 2002-04-25 CN CNB028095421A patent/CN1312662C/zh not_active Expired - Lifetime
- 2002-04-25 KR KR1020037014462A patent/KR100945673B1/ko active IP Right Grant
-
2005
- 2005-04-08 HK HK05102947A patent/HK1070457A1/xx not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0863194A (ja) * | 1994-08-23 | 1996-03-08 | Hitachi Denshi Ltd | 残差駆動形線形予測方式ボコーダ |
WO2000022611A1 (en) * | 1998-10-09 | 2000-04-20 | Hejna Donald J Jr | Method and apparatus to prepare listener-interest-filtered works |
Non-Patent Citations (1)
Title |
---|
ICASSP 2001, Vol.5, pp.3285-3288, MODIFYING TRANSIENTS FOR EFFICIENT CODING OF AUDIO* |
Also Published As
Publication number | Publication date |
---|---|
EP1386312A1 (en) | 2004-02-04 |
US7313519B2 (en) | 2007-12-25 |
ES2298394T3 (es) | 2008-05-16 |
MXPA03010237A (es) | 2004-03-16 |
HK1070457A1 (en) | 2005-06-17 |
DE60225130T2 (de) | 2009-02-26 |
CN1312662C (zh) | 2007-04-25 |
EP1386312B1 (en) | 2008-02-20 |
ATE387000T1 (de) | 2008-03-15 |
DK1386312T3 (da) | 2008-06-09 |
CA2445480A1 (en) | 2002-11-21 |
WO2002093560A1 (en) | 2002-11-21 |
AU2002307533B2 (en) | 2008-01-31 |
CA2445480C (en) | 2011-04-12 |
CN1552060A (zh) | 2004-12-01 |
JP4290997B2 (ja) | 2009-07-08 |
DE60225130D1 (de) | 2008-04-03 |
US20040133423A1 (en) | 2004-07-08 |
KR20040034604A (ko) | 2004-04-28 |
JP2004528597A (ja) | 2004-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100945673B1 (ko) | 프리-노이즈를 감소시킴으로써 로우 비트 레이트 오디오코딩 시스템의 과도현상 성능을 개선시키는 방법 | |
AU2002307533A1 (en) | Improving transient performance of low bit rate audio coding systems by reducing pre-noise | |
JP3224130B2 (ja) | 高品質オーディオ用符号器・復号器 | |
US11373666B2 (en) | Apparatus for post-processing an audio signal using a transient location detection | |
EP0797313B1 (en) | Switched filterbank for use in audio signal coding | |
US6226608B1 (en) | Data framing for adaptive-block-length coding system | |
Sinha et al. | Audio compression at low bit rates using a signal adaptive switched filterbank | |
KR101376762B1 (ko) | 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법 | |
KR101046982B1 (ko) | 전대역 오디오 파형의 외삽법에 기초한 부분대역 예측코딩에 대한 패킷 손실 은닉 기법 | |
KR100630893B1 (ko) | 프레임 경계에서 분광 스플래터를 감쇠하기 위한 추가의필터뱅크를 갖는 프레임 기반 오디오 코딩 | |
US10170126B2 (en) | Effective attenuation of pre-echoes in a digital audio signal | |
US11562756B2 (en) | Apparatus and method for post-processing an audio signal using prediction based shaping | |
JPH06242797A (ja) | 変換符号化装置のブロックサイズ決定法 | |
JPH113091A (ja) | 音声信号の立ち上がり検出装置 | |
JP2917766B2 (ja) | 音声高能率符号化装置 | |
KR100930995B1 (ko) | 오디오 신호의 톤 주파수 조절 방법 및 장치, 이를 이용한오디오 신호 부호화 방법 및 장치, 그리고 상기 방법을수행하는 프로그램이 기록된 기록 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130208 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20140211 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20150206 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160211 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170222 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180209 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20190212 Year of fee payment: 10 |