KR100959701B1 - 오디오 신호의 시간 워핑된 변형 변환 코딩 - Google Patents
오디오 신호의 시간 워핑된 변형 변환 코딩 Download PDFInfo
- Publication number
- KR100959701B1 KR100959701B1 KR1020087010642A KR20087010642A KR100959701B1 KR 100959701 B1 KR100959701 B1 KR 100959701B1 KR 1020087010642 A KR1020087010642 A KR 1020087010642A KR 20087010642 A KR20087010642 A KR 20087010642A KR 100959701 B1 KR100959701 B1 KR 100959701B1
- Authority
- KR
- South Korea
- Prior art keywords
- warping
- frame
- frames
- information
- spectral coefficients
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 65
- 230000003595 spectral effect Effects 0.000 claims abstract description 110
- 238000000034 method Methods 0.000 claims abstract description 79
- 230000006870 function Effects 0.000 claims abstract description 48
- 238000012952 Resampling Methods 0.000 claims description 36
- 230000008859 change Effects 0.000 claims description 20
- 238000001228 spectrum Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 5
- 238000009795 derivation Methods 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 8
- 238000005070 sampling Methods 0.000 abstract description 5
- 230000002123 temporal effect Effects 0.000 abstract description 3
- 239000011295 pitch Substances 0.000 description 58
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000013139 quantization Methods 0.000 description 10
- 230000011218 segmentation Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 8
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000002045 lasting effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Description
Claims (37)
- 제1 프레임, 상기 제1 프레임을 뒤따르는 제2 프레임, 및 상기 제2 프레임을 뒤따르는 제3프레임을 가지는 시간 도메인 오디오 신호의 표현을 도출하는 인코더에 있어서:상기 제1 및 상기 제2 프레임에 대한 제1 워핑 정보를 추정하고 상기 제2 및 상기 제3 프레임에 대한 제2 워핑 정보를 추정하는 워핑 추정기로서, 상기 워핑 정보들은 상기 오디오 신호의 피치 정보를 나타내는 것인, 워핑 추정기;상기 제1 워핑 정보를 이용하여 상기 제1 및 상기 제2 프레임에 대한 제1 스펙트럼 계수들을 도출하고 상기 제2 워핑 정보를 이용하여 상기 제2 및 상기 제3 프레임에 대한 제2 스펙트럼 계수들을 도출하는 스펙트럼 분석기; 및상기 제1 및 상기 제2 스펙트럼 계수들을 포함하는 상기 오디오 신호의 상기 표현을 출력하는 출력 인터페이스를 포함하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 워핑 추정기는, 프레임의 워핑된 표현 내에 있는 피치가 워핑되지 않은 프레임 내의 피치보다 더 일정하게 되도록 하는 워핑 정보를 추정하고,워핑되지 않은 프레임들로부터 도출된 워핑된 표현은 상기 워핑 정보에 의해 지시된 바에 따라 상기 워핑되지 않은 프레임들 내에 있는 오디오 신호의 시간 축을 변환하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 워핑 추정기는, 상기 프레임들에 있는 상기 피치의 변화에 관한 정보를 이용하여, 상기 워핑 정보를 추정하는 것을 특징으로 하는 인코더.
- 청구항 3에 있어서,상기 워핑 추정기는, 상기 피치의 변화가 소정의 최대 피치 변화보다 낮을 때만 상기 피치의 변화에 관한 정보가 이용되도록, 상기 워핑 정보를 추정하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 워핑 추정기는, 프레임으로부터 도출된 워핑된 표현의 스펙트럼 표현이 상기 프레임의 스펙트럼 표현 보다 더 성기게 배치되도록, 상기 워핑 정보를 추정하고,상기 프레임들로부터 도출된 상기 워핑된 표현은 상기 워핑 정보에 의한 지시에 따라 상기 프레임들 내에 있는 상기 오디오 신호의 시간 축을 변환하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 워핑 추정기는, 표현들 양자 모두가 동일한 인코딩 규칙을 이용하여 도출된 경우에 프레임들로부터 도출된 워핑된 표현의 스펙트럼 계수들의 인코딩된 표 현이 상기 프레임들의 스펙트럼 계수들의 인코딩된 표현 보다 더 낮도록 상기 워핑 정보를 추정하고,상기 프레임들로부터 도출된 워핑된 표현은 상기 워핑 정보에 의한 지시에 따라 상기 프레임들 내에 있는 상기 오디오 신호의 시간 축을 변환하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,이산 샘플 값의 시퀀스에 의해 주어진 오디오 신호의 표현을 도출하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 워핑 추정기는, 프레임들로부터 도출된 워핑된 표현이 상기 대응 프레임들과 동일한 길이의 오디오 신호를 나타내도록, 상기 워핑 정보를 추정하고,상기 프레임들로부터 도출된 워핑 표현은 상기 워핑 정보에 의한 지시에 따라 상기 프레임들 내에 있는 상기 오디오 신호의 시간 축을 변환하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 워핑 추정기는, 제1 해당 프레임의 제1 중간 워핑 정보와 제2 해당 프레임의 제2 중간 워핑 정보가 결합 규칙을 이용하여 결합되도록, 상기 워핑 정보를 추정하는 것을 특징으로 하는 인코더.
- 청구항 9에 있어서,상기 결합 규칙은, 상기 제1 중간 워핑 정보의 리스케일링된 워핑 파라미터 시퀀스가 상기 제2 중간 워핑 정보의 리스케일링된 워핑 파라미터 시퀀스와 연결되도록, 이루어진 것을 특징으로 하는 인코더.
- 청구항 10에 있어서,상기 결합 규칙은, 얻어진 워핑 정보가 연속 미분가능한 워핑 파라미터 시퀀스를 포함하도록, 이루어진 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 워핑 추정기는, 상기 워핑 정보가 워핑 파라미터들의 증가 시퀀스를 포함하도록, 상기 워핑 정보를 추정하는 것을 특징으로 하는 인코더
- 청구항 1에 있어서,상기 워핑 추정기는, 상기 워핑 정보가 간격 [0,2]를 그 자체 상으로 맵핑하는 연속 미분가능한 리샘플링 규칙을 나타내도록, 상기 워핑 정보를 추정하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 스펙트럼 분석기는 상기 워핑 정보에 따른 코사인 베이시스를 이용하여 상기 스펙트럼 계수들들 도출하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 스펙트럼 분석기는 2개 프레임의 가중된 표현을 이용하여 상기 스펙트럼 계수들을 도출하는 것을 특징으로 하는 인코더.
- 청구항 15에 있어서,상기 스펙트럼 분석기는, 상기 2개 프레임의 가중된 표현이 윈도우 함수를 상기 2개 프레임에 적용함으로써 얻어지도록, 상기 스펙트럼 계수들을 도출하고,상기 윈도우 함수는 상기 워핑 정보에 의존하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 스펙트럼 분석기는 상기 프레임들의 리샘플링된 표현을 이용하여 상기 스펙트럼 계수들을 도출하는 것을 특징으로 하는 인코더.
- 청구항 17에 있어서,상기 스펙트럼 분석기는, 상기 리샘플링된 표현이 상기 워핑 정보에 의한 지시에 따라 상기 프레임들의 시간 축을 변환하도록 도출하는 것을 특징으로 하는 인 코더.
- 청구항 1에 있어서,상기 도출된 워핑 정보는 상기 오디오 신호의 상기 피치에 대하여 표준화된 상기 오디오 신호의 피치 변화를 나타내는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 워핑 추정기는 상기 워핑 정보가 워핑 파라미터들의 시퀀스를 포함하도록 상기 워핑 정보를 추정하고,각 워핑 파라미터는 상기 오디오 신호의 유한 길이 간격을 나타내는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 출력 인터페이스는 상기 워핑 정보를 더 포함하는 것을 특징으로 하는 인코더.
- 청구항 1에 있어서,상기 출력 인터페이스는 상기 워핑 정보의 양자화된 표현을 더 포함하는 것을 특징으로 하는 인코더.
- 제1 프레임, 상기 제2 프레임을 뒤따르는 제2 프레임, 및 상기 제2 프레임을 뒤따르는 제3 프레임을 가지는 오디오 신호를 제1 워핑 정보, 제2 워핑 정보, 제1 스펙트럼 계수들, 및 제2 스펙트럼 계수들을 이용하여 복원하는 디코더로서, 상기 제1 워핑 정보는 상기 제1 및 상기 제2 프레임에 대한 상기 오디오 신호의 피치 정보를 나타내고, 상기 제2 워핑 정보는 상기 제2 및 제3 프레임에 대한 상기 오디오 신호의 피치 정보를 나타내고, 상기 제1 스펙트럼 계수들은 상기 제1 및 상기 제2 프레임에 대한 스펙트럼 계수이고, 상기 제2 스펙트럼 계수들은 상기 제2 및 상기 제3 프레임에 대한 스펙트럼 계수이며, 상기 디코더는:상기 제1 스펙트럼 계수들 및 상기 제1 워핑 정보를 이용하여 제1 결합된 프레임을 도출하고, 제2 스펙트럼 계수들 및 상기 제2 워핑 정보를 이용하여 제2 결합된 프레임을 도출하는 스펙트럼 값 프로세서로서, 상기 제1 결합된 프레임은 상기 제1 및 상기 제2 프레임에 관한 정보를 가지고 상기 제2 결합된 프레임은 상기 제2 및 상기 제3 프레임에 관한 정보를 가지는 것인, 스펙트럼 값 프로세서; 및상기 제1 결합된 프레임과 상기 제2 결합된 프레임을 이용하여 상기 제2 프레임을 복원하는 합성기를 포함하는 것을 특징으로 하는 디코더.
- 청구항 23에 있어서,상기 스펙트럼 값 프로세서는 상기 결합된 프레임들을 도출하기 위하여 코사인 베이스 함수들을 이용하고,상기 코사인 베이스 함수들은 상기 워핑 정보에 의존하는 것을 특징으로 하 는 디코더.
- 청구항 24에 있어서,상기 스펙트럼 값 프로세서는, 상기 스펙트럼 계수들에 관하여 상기 코사인 베이스 함수들을 이용하는 것이 결합된 프레임의 시간-워핑된(time-warped) 비가중(unweighted) 표현을 산출하도록, 상기 코사인 베이스 함수들을 이용하는 것을 특징으로 하는 디코더.
- 청구항 23에 있어서,상기 스펙트럼 값 프로세서는 상기 결합된 프레임들의 샘플 값들에 가중치를 적용하기 위하여 윈도우 함수를 이용하고,상기 윈도우 함수는 상기 워핑 정보에 의존하는 것을 특징으로 하는 디코더.
- 청구항 25에 있어서,상기 스펙트럼 값 프로세서는, 윈도우 함수가 결합된 프레임의 상기 시간-워핑된 비가중 표현에 적용될 때 결합된 프레임의 시간-워핑된 표현을 산출하도록, 상기 윈도우 함수를 이용하는 것을 특징으로 하는 디코더.
- 청구항 23에 있어서,상기 스펙트럼 값 프로세서는, 워핑 정보에 의한 지시에 따라 결합된 프레임 들의 표현들의 시간 축을 변환함으로써 결합된 프레임을 도출하도록, 상기 워핑 정보를 이용하는 것을 특징으로 하는 디코더.
- 청구항 23에 있어서,상기 합성기는 상기 제1 결합된 프레임과 상기 제2 결합된 프레임을 가산하여 상기 제2 프레임을 복원하는 것을 특징으로 하는 디코더.
- 청구항 23에 있어서,이산 샘플 값들의 시퀀스에 의하여 표현된 오디오 신호를 복원하는 것을 특징으로 하는 디코더.
- 청구항 23에 있어서,상기 제1 및 상기 제2 스펙트럼 계수들로부터 상기 제1 및 상기 제2 워핑 정보를 도출하는 워핑 추정기를 더 포함하는 것을 특징으로 하는 디코더.
- 청구항 23에 있어서,상기 스펙트럼 값 프로세서는, 소정 가중 팩터를 상기 스펙트럼 계수들에 적용하는, 상기 스펙트럼 계수들의 가중을 수행하는 것을 특징으로 하는 디코더.
- 제1 프레임, 상기 제1 프레임을 뒤따르는 제2 프레임, 및 상기 제2 프레임을 뒤따르는 제3 프레임을 가지는 오디오 신호의 표현을 도출하는 방법에 있어서:상기 제1 및 상기 제2 프레임에 대한 제1 워핑 정보와 상기 제2 및 상기 제3 프레임에 대한 제2 워핑 정보를 추정하는 추정 단계로서, 상기 워핑 정보는 상기 오디오 신호의 피치 정보를 나타내는 것인, 추정 단계;상기 제1 워핑 정보를 이용하여 상기 제1 및 상기 제2 프레임에 대한 제1 스펙트럼 계수들을 도출하고 상기 제2 워핑 정보를 이용하여 상기 제2 및 상기 제3 프레임에 대한 제2 스펙트럼 계수들을 도출하는 도출 단계; 및상기 제1 및 상기 제2 스펙트럼 계수들을 포함하는 상기 오디오 신호의 상기 표현을 출력하는 출력 단계를 포함하는 것을 특징으로 하는 방법.
- 제1 프레임, 상기 제2 프레임을 뒤따르는 제2 프레임, 및 상기 제2 프레임을 뒤따르는 제3 프레임을 가지는 오디오 신호를 제1 워핑 정보, 제2 워핑 정보, 제1 스펙트럼 계수들, 및 제2 스펙트럼 계수들을 이용하여 복원하는 방법으로서, 상기 제1 워핑 정보는 상기 제1 및 상기 제2 프레임에 대한 상기 오디오 신호의 피치 정보를 나타내고, 상기 제2 워핑 정보는 상기 제2 및 제3 프레임에 대한 상기 오디오 신호의 피치 정보를 나타내고, 상기 제1 스펙트럼 계수들은 상기 제1 및 상기 제2 프레임에 대한 스펙트럼 계수이고, 상기 제2 스펙트럼 계수들은 상기 제2 및 상기 제3 프레임에 대한 스펙트럼 계수이며, 상기 방법은:상기 제1 스펙트럼 계수들 및 상기 제1 워핑 정보를 이용하여 제1 결합된 프레임을 도출하고, 제2 스펙트럼 계수들 및 상기 제2 워핑 정보를 이용하여 제2 결 합된 프레임을 도출하는 도출 단계로서, 상기 제1 결합된 프레임은 상기 제1 및 상기 제2 프레임에 관한 정보를 가지고 상기 제2 결합된 프레임은 상기 제2 및 상기 제3 프레임에 관한 정보를 가지는 것인, 도출 단계; 및상기 제1 결합된 프레임 및 상기 제2 결합된 프레임을 이용하여 상기 제2 프레임을 복원하는 복원 단계를 포함하는 것을 특징으로 하는 방법.
- 컴퓨터에서 구동될 때 제1 프레임과 상기 제1 프레임을 뒤따르는 제2 프레임과 상기 제2 프레임을 뒤따르는 제3 프레임을 가지는 오디오 신호의 표현을 도출하는 방법을 수행하는 프로그램 코드를 가지는 컴퓨터 프로그램으로서,상기 방법은:상기 제1 및 상기 제2 프레임에 대한 제1 워핑 정보와 상기 제2 및 상기 제3 프레임에 대한 제2 워핑 정보를 추정하는 추정 단계로서, 상기 워핑 정보는 상기 오디오 신호의 피치 정보를 나타내는 것인, 추정 단계;상기 제1 워핑 정보를 이용하여 상기 제1 및 상기 제2 프레임에 대한 제1 스펙트럼 계수들을 도출하고 상기 제2 워핑 정보를 이용하여 상기 제2 및 상기 제3 프레임에 대한 제2 스펙트럼 계수들을 도출하는 도출 단계; 및상기 제1 및 상기 제2 스펙트럼 계수들을 포함하는 상기 오디오 신호의 상기 표현을 출력하는 출력 단계를 포함하는 것인, 컴퓨터 프로그램.
- 컴퓨터에서 구동될 때 제1 프레임, 상기 제2 프레임을 뒤따르는 제2 프레임, 및 상기 제2 프레임을 뒤따르는 제3 프레임을 가지는 오디오 신호를 제1 워핑 정보, 제2 워핑 정보, 제1 스펙트럼 계수들, 및 제2 스펙트럼 계수들을 이용하여 복원하는 방법을 수행하는 프로그램 코드를 가지는 컴퓨터 프로그램으로서, 상기 제1 워핑 정보는 상기 제1 및 상기 제2 프레임에 대한 상기 오디오 신호의 피치 정보를 나타내고, 상기 제2 워핑 정보는 상기 제2 및 제3 프레임에 대한 상기 오디오 신호의 피치 정보를 나타내고, 상기 제1 스펙트럼 계수들은 상기 제1 및 상기 제2 프레임에 대한 스펙트럼 계수이고, 상기 제2 스펙트럼 계수들은 상기 제2 및 상기 제3 프레임에 대한 스펙트럼 계수이며,상기 방법은:상기 제1 스펙트럼 계수들 및 상기 제1 워핑 정보를 이용하여 제1 결합된 프레임을 도출하고, 제2 스펙트럼 계수들 및 상기 제2 워핑 정보를 이용하여 제2 결합된 프레임을 도출하는 도출 단계로서, 상기 제1 결합된 프레임은 상기 제1 및 상기 제2 프레임에 관한 정보를 가지고 상기 제2 결합된 프레임은 상기 제2 및 상기 제3 프레임에 관한 정보를 가지는 것인, 도출 단계; 및상기 제1 결합된 프레임 및 상기 제2 결합된 프레임을 이용하여 상기 제2 프레임을 복원하는 복원 단계를 포함하는 것인, 컴퓨터 프로그램.
- 제1 프레임, 상기 제1 프레임을 뒤따르는 제2 프레임, 및 상기 제2 프레임을 뒤따르는 제3 프레임을 가지는 오디오 신호의 표현으로서, 상기 표현은:상기 제1 및 상기 제2 프레임에 대한 제1 스펙트럼 계수들로서 상기 제1 및 상기 제2 프레임의 워핑된 표현의 스펙트럼 조성을 나타내는 제1 스펙트럼 계수들; 및상기 제2 및 상기 제3 프레임의 워핑 표현의 스펙트럼 조성을 나타내는 제2 스펙트럼 계수들을 포함하는 것을 특징으로 하는 표현.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US73351205P | 2005-11-03 | 2005-11-03 | |
US60/733,512 | 2005-11-03 | ||
US11/464,176 | 2006-08-11 | ||
US11/464,176 US7720677B2 (en) | 2005-11-03 | 2006-08-11 | Time warped modified transform coding of audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080066760A KR20080066760A (ko) | 2008-07-16 |
KR100959701B1 true KR100959701B1 (ko) | 2010-05-24 |
Family
ID=37507461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087010642A KR100959701B1 (ko) | 2005-11-03 | 2006-10-24 | 오디오 신호의 시간 워핑된 변형 변환 코딩 |
Country Status (14)
Country | Link |
---|---|
US (3) | US7720677B2 (ko) |
EP (7) | EP2306455B1 (ko) |
JP (4) | JP4927088B2 (ko) |
KR (1) | KR100959701B1 (ko) |
CN (2) | CN102592602B (ko) |
AT (1) | ATE395687T1 (ko) |
DE (1) | DE602006001194D1 (ko) |
DK (1) | DK1807825T3 (ko) |
ES (5) | ES2604758T3 (ko) |
HK (2) | HK1105159A1 (ko) |
MY (1) | MY141264A (ko) |
PL (1) | PL1807825T3 (ko) |
TW (1) | TWI320172B (ko) |
WO (1) | WO2007051548A1 (ko) |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8682652B2 (en) * | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101380170B1 (ko) * | 2007-08-31 | 2014-04-02 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
TWI455064B (zh) * | 2007-12-20 | 2014-10-01 | Thomson Licensing | 聲影文件突起映圖之決定方法和裝置 |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
CN102150201B (zh) | 2008-07-11 | 2013-04-17 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
AU2013206265B2 (en) * | 2008-07-11 | 2015-05-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Providing a time warp activation signal and encoding an audio signal therewith |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2211335A1 (en) | 2009-01-21 | 2010-07-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal |
EP2674943B1 (en) | 2009-01-28 | 2015-09-02 | Dolby International AB | Improved harmonic transposition |
BR122019023709B1 (pt) | 2009-01-28 | 2020-10-27 | Dolby International Ab | sistema para gerar um sinal de áudio de saída a partir de um sinal de áudio de entrada usando um fator de transposição t, método para transpor um sinal de áudio de entrada por um fator de transposição t e meio de armazenamento |
KR101701759B1 (ko) | 2009-09-18 | 2017-02-03 | 돌비 인터네셔널 에이비 | 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체 |
WO2011048815A1 (ja) * | 2009-10-21 | 2011-04-28 | パナソニック株式会社 | オーディオ符号化装置、復号装置、方法、回路およびプログラム |
US9338523B2 (en) * | 2009-12-21 | 2016-05-10 | Echostar Technologies L.L.C. | Audio splitting with codec-enforced frame sizes |
CA2792500C (en) * | 2010-03-10 | 2016-05-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio signal decoder, audio signal encoder, methods and computer program using a sampling rate dependent time-warp contour encoding |
EP2372704A1 (en) | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor and method for processing a signal |
KR101809298B1 (ko) * | 2010-10-06 | 2017-12-14 | 파나소닉 주식회사 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
TWI488177B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 使用頻譜域雜訊整形之基於線性預測的編碼方案 |
SG192721A1 (en) * | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
MX2013009304A (es) | 2011-02-14 | 2013-10-03 | Fraunhofer Ges Forschung | Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad. |
ES2639646T3 (es) | 2011-02-14 | 2017-10-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificación y decodificación de posiciones de impulso de pistas de una señal de audio |
SG192745A1 (en) | 2011-02-14 | 2013-09-30 | Fraunhofer Ges Forschung | Noise generation in audio codecs |
ES2529025T3 (es) | 2011-02-14 | 2015-02-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio decodificada en un dominio espectral |
CA2827000C (en) | 2011-02-14 | 2016-04-05 | Jeremie Lecomte | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
CA2827335C (en) | 2011-02-14 | 2016-08-30 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
SG185519A1 (en) * | 2011-02-14 | 2012-12-28 | Fraunhofer Ges Forschung | Information signal representation using lapped transform |
WO2014108393A1 (en) | 2013-01-08 | 2014-07-17 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
CA2964362C (en) * | 2013-06-21 | 2020-03-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Jitter buffer control, audio decoder, method and computer program |
EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
EP2830055A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
FR3020732A1 (fr) * | 2014-04-30 | 2015-11-06 | Orange | Correction de perte de trame perfectionnee avec information de voisement |
EP3000110B1 (en) * | 2014-07-28 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
EP3107096A1 (en) * | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
CN117238300A (zh) | 2016-01-22 | 2023-12-15 | 弗劳恩霍夫应用研究促进协会 | 使用帧控制同步来编码或解码多声道音频信号的装置和方法 |
CN110998722B (zh) * | 2017-07-03 | 2023-11-10 | 杜比国际公司 | 低复杂性密集瞬态事件检测和译码 |
EP3483879A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000074039A1 (en) * | 1999-05-26 | 2000-12-07 | Koninklijke Philips Electronics N.V. | Audio signal transmission system |
EP1271471A2 (en) | 2001-06-29 | 2003-01-02 | Microsoft Corporation | Signal modification based on continuous time warping for low bitrate celp coding |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3519830A1 (de) * | 1985-06-03 | 1986-12-18 | Ruhrkohle Ag, 4300 Essen | Verfahren zur kohlehydrierung mit integrierten raffinationsstufen |
JPH01233835A (ja) * | 1988-03-14 | 1989-09-19 | Mitsubishi Electric Corp | 音声時間軸圧縮符号化装置 |
JPH0546199A (ja) * | 1991-08-21 | 1993-02-26 | Matsushita Electric Ind Co Ltd | 音声符号化装置 |
JPH0784597A (ja) * | 1993-09-20 | 1995-03-31 | Fujitsu Ltd | 音声符号化装置および音声復号化装置 |
AU3690197A (en) | 1996-08-02 | 1998-02-25 | Universite De Sherbrooke | Speech/audio coding with non-linear spectral-amplitude transformation |
PL193723B1 (pl) * | 1997-04-07 | 2007-03-30 | Koninkl Philips Electronics Nv | Sposób i urządzenie do kodowania sygnału mowy oraz sposób i urządzenie do dekodowania sygnału mowy |
US6169970B1 (en) * | 1998-01-08 | 2001-01-02 | Lucent Technologies Inc. | Generalized analysis-by-synthesis speech coding method and apparatus |
US6182042B1 (en) * | 1998-07-07 | 2001-01-30 | Creative Technology Ltd. | Sound modification employing spectral warping techniques |
US6330533B2 (en) | 1998-08-24 | 2001-12-11 | Conexant Systems, Inc. | Speech encoder adaptively applying pitch preprocessing with warping of target signal |
US6502066B2 (en) * | 1998-11-24 | 2002-12-31 | Microsoft Corporation | System for generating formant tracks by modifying formants synthesized from speech units |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
AU2001276893A1 (en) | 2000-07-13 | 2002-01-30 | Qualcomm Incorporated | Maximum distance block coding scheme |
CN1408146A (zh) * | 2000-11-03 | 2003-04-02 | 皇家菲利浦电子有限公司 | 音频信号的参数编码 |
EP1262952B1 (en) * | 2001-05-28 | 2006-08-16 | Texas Instruments Incorporated | Programmable melody generator |
US6941263B2 (en) * | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
DE60232560D1 (de) | 2001-08-31 | 2009-07-16 | Kenwood Hachioji Kk | Vorrichtung und Verfahren zur Erzeugung eines Signals mit konstanten Grundfrequenz und Vorrichtung sowie Verfahren zum Synthetisieren von Sprachsignalen unter Verwendung dieser Signals mit konstanten Grundfrequenz. |
JP3994332B2 (ja) * | 2001-09-27 | 2007-10-17 | 株式会社ケンウッド | 音声信号圧縮装置、音声信号圧縮方法、及び、プログラム |
EP1439524B1 (en) | 2002-07-19 | 2009-04-08 | NEC Corporation | Audio decoding device, decoding method, and program |
CN1290036C (zh) | 2002-12-30 | 2006-12-13 | 国际商业机器公司 | 根据机器可读词典建立概念知识的计算机系统及方法 |
EP1604352A4 (en) * | 2003-03-15 | 2007-12-19 | Mindspeed Tech Inc | SINGLE NOISE DELETION MODEL |
US7587254B2 (en) * | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
US7433463B2 (en) | 2004-08-10 | 2008-10-07 | Clarity Technologies, Inc. | Echo cancellation and noise reduction method |
US7676362B2 (en) * | 2004-12-31 | 2010-03-09 | Motorola, Inc. | Method and apparatus for enhancing loudness of a speech signal |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
US7917561B2 (en) | 2005-09-16 | 2011-03-29 | Coding Technologies Ab | Partially complex modulated filter bank |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8010350B2 (en) * | 2006-08-03 | 2011-08-30 | Broadcom Corporation | Decimated bisectional pitch refinement |
DE602007004502D1 (de) * | 2006-08-15 | 2010-03-11 | Broadcom Corp | Neuphasierung des status eines dekodiergerätes nach einem paketverlust |
US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
PL2165328T3 (pl) * | 2007-06-11 | 2018-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodowanie i dekodowanie sygnału audio zawierającego część impulsową i część stacjonarną |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
CN102150201B (zh) * | 2008-07-11 | 2013-04-17 | 弗劳恩霍夫应用研究促进协会 | 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码 |
WO2011048815A1 (ja) * | 2009-10-21 | 2011-04-28 | パナソニック株式会社 | オーディオ符号化装置、復号装置、方法、回路およびプログラム |
-
2006
- 2006-08-11 US US11/464,176 patent/US7720677B2/en active Active
- 2006-10-24 WO PCT/EP2006/010246 patent/WO2007051548A1/en active IP Right Grant
- 2006-10-24 EP EP10183308.5A patent/EP2306455B1/en active Active
- 2006-10-24 ES ES08008361.1T patent/ES2604758T3/es active Active
- 2006-10-24 ES ES17193127T patent/ES2863667T3/es active Active
- 2006-10-24 CN CN201210037454.7A patent/CN102592602B/zh active Active
- 2006-10-24 ES ES06792443T patent/ES2307287T3/es active Active
- 2006-10-24 PL PL06792443T patent/PL1807825T3/pl unknown
- 2006-10-24 CN CN200680049867XA patent/CN101351840B/zh active Active
- 2006-10-24 ES ES10183308.5T patent/ES2646814T3/es active Active
- 2006-10-24 EP EP06792443A patent/EP1807825B1/en active Active
- 2006-10-24 DK DK06792443T patent/DK1807825T3/da active
- 2006-10-24 EP EP23205462.7A patent/EP4290512A3/en active Pending
- 2006-10-24 EP EP23205479.1A patent/EP4290513A3/en active Pending
- 2006-10-24 ES ES21156798T patent/ES2967257T3/es active Active
- 2006-10-24 EP EP17193127.2A patent/EP3319086B1/en active Active
- 2006-10-24 JP JP2008538284A patent/JP4927088B2/ja active Active
- 2006-10-24 AT AT06792443T patent/ATE395687T1/de active
- 2006-10-24 EP EP21156798.7A patent/EP3852103B1/en active Active
- 2006-10-24 DE DE602006001194T patent/DE602006001194D1/de active Active
- 2006-10-24 EP EP08008361.1A patent/EP1953738B1/en active Active
- 2006-10-24 KR KR1020087010642A patent/KR100959701B1/ko active IP Right Grant
- 2006-10-25 TW TW095139384A patent/TWI320172B/zh active
-
2007
- 2007-09-21 HK HK07110315A patent/HK1105159A1/xx unknown
-
2008
- 2008-04-29 MY MYPI20081350A patent/MY141264A/en unknown
-
2010
- 2010-01-29 US US12/697,137 patent/US8412518B2/en active Active
-
2011
- 2011-11-02 JP JP2011240716A patent/JP5323164B2/ja active Active
-
2013
- 2013-02-14 US US13/766,945 patent/US8838441B2/en active Active
- 2013-05-20 JP JP2013106030A patent/JP6125324B2/ja active Active
-
2014
- 2014-09-08 JP JP2014182138A patent/JP6084595B2/ja active Active
-
2018
- 2018-10-22 HK HK18113511.3A patent/HK1254427A1/zh unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000074039A1 (en) * | 1999-05-26 | 2000-12-07 | Koninklijke Philips Electronics N.V. | Audio signal transmission system |
EP1271471A2 (en) | 2001-06-29 | 2003-01-02 | Microsoft Corporation | Signal modification based on continuous time warping for low bitrate celp coding |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100959701B1 (ko) | 오디오 신호의 시간 워핑된 변형 변환 코딩 | |
AU2009231135B2 (en) | Audio transform coding using pitch correction | |
EP0698876B1 (en) | Method of decoding encoded speech signals | |
JP2003044097A (ja) | 音声信号および音楽信号を符号化する方法 | |
Eriksson et al. | On waveform-interpolation coding with asymptotically perfect reconstruction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130507 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20140512 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20150508 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160509 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170508 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180509 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20190515 Year of fee payment: 10 |