KR20050009384A - 광대역 음성 신호 압축 및 복원 장치와 그 방법 - Google Patents
광대역 음성 신호 압축 및 복원 장치와 그 방법 Download PDFInfo
- Publication number
- KR20050009384A KR20050009384A KR1020030048665A KR20030048665A KR20050009384A KR 20050009384 A KR20050009384 A KR 20050009384A KR 1020030048665 A KR1020030048665 A KR 1020030048665A KR 20030048665 A KR20030048665 A KR 20030048665A KR 20050009384 A KR20050009384 A KR 20050009384A
- Authority
- KR
- South Korea
- Prior art keywords
- band
- dct
- signal
- dct coefficient
- code
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000007906 compression Methods 0.000 title claims description 59
- 230000006835 compression Effects 0.000 title claims description 53
- 230000006837 decompression Effects 0.000 title description 8
- 238000013139 quantization Methods 0.000 claims abstract description 135
- 238000011084 recovery Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000003247 decreasing effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 241000512259 Ascophyllum nodosum Species 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
Claims (48)
- 광대역 음성 신호 압축 장치에 있어서,상기 광대역 음성 신호의 저역 음성 신호를 압축하고, 상기 압축된 저역 음성 신호를 저역 음성 패킷으로서 출력하는 협대역 음성 압축기;상기 협대역 음성 압축기로부터 제공되는 저역 신호의 에너지를 이용하여 상기 광대역 음성 신호의 고역 음성 신호를 압축하고, 압축된 고역 음성 신호를 고역 음성 패킷으로서 출력하는 고역 음성 압축 유니트를 포함하는 광대역 음성 신호 압축 장치.
- 제 1 항에 있어서, 상기 협대역 음성 압축기가 켈프(CELP) 계열의 압축기이면, 상기 저역 신호의 에너지는 상기 협대역 음성 압축기에서 상기 고역 음성 압축 유니트의 프레임에 해당하는 양자화된 고정 코드북 이득인 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 1 항에 있어서, 상기 협대역 음성 압축기가 켈프(CELP) 계열의 압축기이면, 상기 저역 신호의 에너지는 상기 협대역 음성 압축기에서 상기 고역 음성 압축 유니트의 프레임에 해당하는 양자화된 고정 코드북 이득의 평균값인 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 1 항에 있어서, 상기 고역 음성 압축기는,상기 광대역 음성 신호의 고역 음성신호를 복수개의 대역으로 분해하는 필터 뱅크;상기 필터 뱅크에서 출력되는 각 대역 신호에 대해 독립적인 알엠에스(RMS)값을 구하는 대역 RMS 값 계산기;상기 대역 RMS 값 계산기에서 계산된 RMS 값을 토대로 상기 필터 뱅크에서 분해된 대역의 순위를 정하는 대역 순위 결정기;상기 대역 순위 결정기에서 결정된 대역 순위 정보와 상기 저역 신호의 에너지를 이용하여 상기 필터 뱅크에서 분해된 각 대역의 신호를 양자화하여 대역별 양자화 인덱스를 출력하는 대역 신호 양자화 모듈;상기 대역 순위 정보와 상기 대역 신호 양자화 모듈에서 출력되는 대역별 양자화 인덱스를 패킷화하고, 상기 패킷화된 정보를 상기 고역 음성 패킷으로서 출력하는 패킷화기를 포함하는 광대역 음성 신호 압축장치.
- 제 4 항에 있어서, 상기 대역 순위 결정기는 상기 RMS 값의 크기 순서에 따라 상기 대역의 순위를 결정하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 4 항에 있어서, 상기 대역 순위 결정기는 상기 RMS 값이 큰 대역일수록 중요한 대역으로 순위를 결정하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 4 항에 있어서, 상기 대역 신호 양자화 모듈은,상기 필터 뱅크로부터 제공되는 각 대역의 신호에 대해 이산여현변환(DCT)을 수행하여 제 1 DCT 계수를 구하는 제 1 DCT 연산기;상기 제 1 DCT 계수의 크기를 구하는 크기 추출기;상기 제 1 DCT 계수의 부호를 구하는 부호 추출기;상기 크기 추출기에서 출력된 제 1 DCT 계수 크기에 대하여 DCT를 수행하여 제 2 DCT 계수를 구하는 제 2 DCT 연산기;상기 제 2 DCT 연산기에서 출력되는 제 2 DCT 계수에서 디씨(DC) 성분과 상기 DC 성분을 제외한 DCT계수를 분리하고, 상기 DC성분을 제외한 DCT계수를 제 3 DCT 계수로서 출력하는 DC분리기;상기 DC분리기에서 출력되는 상기 DC 성분을 양자화하는 DC 양자화 모듈;상기 제 3 DCT 계수의 RMS 값을 구하는 RMS 값 계산기;상기 RMS 값 계산기에서 구한 RMS 값을 양자화 하는 RMS 값 양자화 모듈;상기 RMS 값 양자화 모듈에서 출력되는 RMS값 양자화 인덱스를 이용하여 검출된 양자화된 RMS 값을 이용하여 상기 제 3 DCT 계수를 정규화하는 정규화기;상기 정규화된 제 3 DCT 계수를 양자화하는 DCT 계수 양자화기;상기 부호 추출기에서 추출된 부호를 양자화하는 부호 양자화 모듈을 포함하는 광대역 음성 신호 압축 장치.
- 제 7 항에 있어서, 상기 DC 양자화 모듈은 상기 저역 신호 에너지 정보와 상기 각 대역의 DC 성분을 이용한 대역간 예측으로 상기 DC 성분을 양자화하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 7 항에 있어서, 상기 DC 양자화 모듈은,상기 저역 신호 에너지 정보와 상기 각 대역의 DC 값을 이용하여 대역간을 예측 하는 대역간 예측기;상기 대역간 예측기에서 출력되는 각 대역의 DC 예측 오차를 양자화 하여 DC 양자화 인덱스를 출력하는 DC 양자화기;상기 DC 양자화기에서 출력되는 상기 DC 양자화 인덱스로부터 대역별 양자화 된 DC 예측 오차를 구하고, 상기 DC 예측 오차로부터 대역별 양자화된 DC 값을 구하는 DC 역양자화기를 포함하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 9 항에 있어서, 상기 대역간 예측기는 하기 식에 따라 대역간 DC 예측 오차를 구하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.(상기 식에서 Di는 i번째 고역 음성 대역의 Log DC값이고,는 i번째 고역 음성 대역의 양자화된 Log DC값이고,는 저역 신호의 Log 에너지이고, G는 예측기의 계수이고,는 i번째 고역 음성 대역의 DC 예측 오차이다.)
- 제 9 항에 있어서, 상기 DC 양자화 모듈은 상기 DC 예측 오차를 독립적으로 스칼라 양자화 하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 7 항에 있어서, 상기 RMS 값 양자화 모듈은 상기 제 3 DCT 계수의 RMS 값과 상기 제 2 DCT 계수의 양자화된 DC 값을 이용한 대역내에서의 예측으로 상기 제 3 DCT 계수의 RMS 값을 양자화 하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 7 항에 있어서 상기 RMS 값 양자화 모듈은,상기 제 3 DCT 계수의 RMS 값과 상기 제 2 DCT 계수의 양자화된 DC 값을 이용하여 대역내에서 예측 동작을 수행하는 대역내 예측기;상기 대역내 예측기에서 출력되는 RMS 예측 오차를 양자화 하는 RMS 양자화기를 포함하는 광대역 음성 신호 압축 장치.
- 제 13 항에 있어서, 상기 대역내 예측기는 하기 식에 따라 대역내 RMS 예측 오차를 구하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.(상기 식에서 si는 i번째 고역 음성 대역에 해당하는 제 3 DCT 계수의 Log RMS 값,는 i번째 고역 음성 대역에 해당하는 제 2 DCT 계수의 양자화된 Log DC 값, G 는 예측기 계수이고,는 i번째 고역 음성 대역에 해당하는 대역내 RMS 예측 오차값이다. )
- 제 7 항에 있어서, 상기 DCT 계수 양자화기는 각 대역의 제 3 DCT 계수중에서 일부 DCT 계수만을 양자화하고 나머지 계수는 제거하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 15 항에 있어서, 상기 DCT 계수 양자화기는 상기 대역 순위 정보에 따라 중요한 대역에서는 상기 제 3 DCT 계수를 적게 제거하고, 중요하지 않은 대역에서는 상기 제 3 DCT 계수를 많이 제거하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 7 항에 있어서, 상기 DCT 계수 양자화기는 상기 대역 순위 정보에 따라 각 대역에서 양자화 할 DCT 계수의 범위에 해당하는 인덱스를 결정하고, 결정된 인덱스를 참조하여 각 대역별로 제 3 DCT 계수를 양자화하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 7 항에 있어서, 상기 DCT 계수 양자화기는 상기 대역 순위 정보에 따라 각 대역에서 양자화 할 DCT 계수의 범위에 해당하는 인덱스를 결정하고, 상기 결정된 DCT 계수의 인덱스보다 하위의 인덱스에 해당하는 제 3 DCT 계수를 제거하고, 상기 결정된 DCT 계수 인덱스보다 상위의 인덱스에 해당되는 나머지 제 3 DCT 계수만을 양자화 하는 광대역 음성 신호 압축 장치.
- 제 7 항에 있어서, 상기 DCT 계수 양자화기는 각 대역에서 양자화 할 제 3 DCT 계수를 다수의 서브 벡터(subvector)로 분할하고 상기 대역 순위정보에 따라 전체 서브 벡터중에서 양자화할 서브 벡터와 제거할 서브 벡터를 선택하는 선택적 분할 벡터 양자화 방식에 따라 양자화하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 7 항에 있어서, 상기 부호 양자화 모듈은, 상기 제 3 DCT 계수의 양자화 인덱스와 상기 제 2 DCT 계수의 DC 양자화 인덱스를 이용하여 상기 양자화된 제 1 DCT 계수의 크기 순서 정보를 검출하고, 상기 제 1 DCT 계수의 크기 순서 정보에 따라 상기 제 1 DCT 계수 부호를 양자화 하는 광대역 음성 신호 압축 장치.
- 제 20 항에 있어서, 상기 부호 양자화 모듈은 상기 제 1 DCT 계수의 크기 순서 정보를 이용하여 양자화할 제 1 DCT 계수 부호와 제거할 제 1 DCT 계수 부호를 구분하여 제 1 DCT 계수의 부호를 양자화 하는 광대역 음성 신호 압축 장치.
- 제 21 항에 있어서, 상기 양자화할 제 1 DCT 계수 부호는 최대 크기의 제 1 DCT 계수부터 작은 순서로 미리 정해진 수만큼의 제 1 DCT 계수의 부호를 포함하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
- 제 7 항에 있어서, 상기 부호 양자화 모듈은,상기 제 3 DCT 계수의 양자화 인덱스로부터 양자화된 제 3 DCT 계수를 구하는 DCT 계수 역양자화기;상기 제 2 DCT 계수의 DC 양자화 인덱스로부터 제 2 DCT 계수의 양자화된 DC 값을 구하는 DC 역양자화기;상기 양자화된 제 3 DCT 계수와 제 2 DCT 계수의 양자화된 DC 값을 DCT 역변환하는 역 DCT 연산기;상기 역 DCT 연산기에서 출력되는 양자화된 제 1 DCT 계수의 크기를 크기 순으로 정렬하는 크기 순 정렬기;상기 크기 순 정렬기에서 출력되는 양자화된 제 1 DCT 계수의 크기 순서 정보에 따라 상기 제 1 DCT 계수 부호를 양자화 하는 부호 양자화기를 포함하는 광대역 음성 신호 압축 장치.
- 제 23 항에 있어서, 상기 부호 양자화기는 상기 크기 순 정렬기에서 출력되는 양자화된 제 1 DCT 계수의 크기 순서 정보를 이용하여, 최대 크기의 제 1 DCT 계수부터 크기가 작은 순서로 미리 정해진 수 만큼의 제 1 DCT 계수에 해당하는 계수 부호는 양자화 하고, 나머지 크기가 작은 제 1 DCT 계수에 해당하는 계수 부호는 제거하여 전달하지 않는 것을 특징을 하는 광대역 음성 신호 압축 장치.
- 제 1 항에 있어서, 상기 광대역 음성 신호 압축 장치는,상기 광대역 음성 신호를 협대역 저역 음성신호로 변환하여 상기 협대역 음성 압축기로 제공하는 제 1 대역 변환 유니트를 더 포함하는 광대역 음성 신호 압축 장치.
- 계층적인 대역폭 구조로 압축되어 저역 음성 패킷과 고역 음성 패킷으로 구분되어 전송되는 광대역 음성 신호를 복원하는 장치에 있어서,상기 압축된 저역 음성 패킷을 저역 음성 신호로 복원하는 협대역 음성 복원기;상기 협대역 음성 복원기에서 제공되는 저역 복원 신호의 에너지 정보를 이용하여 상기 압축된 고역 음성 패킷을 고역 음성신호로 복원하는 고역 음성 복원기;상기 협대역 음성 복원기에서 출력되는 저역 음성 신호와 상기 고역 음성 복원기에서 출력되는 고역 음성 신호를 가산하여 광대역 복원 신호를 출력하는 가산기를 포함하는 광대역 음성 신호 복원 장치.
- 제 26 항에 있어서, 상기 고역 음성 복원기는,상기 고역 음성 패킷을 모듈별로 분해하는 역 패킷화기;상기 역 패킷화기로부터 출력되는 부호를 역양자화하는 부호 역양자화기;상기 역 패킷화기로부터 출력되는 대역 순위 정보, 제 3 DCT 양자화 인덱스, 제 2 DCT 계수의 DC 양자화 인덱스, 및 제 3 DCT 계수의 RMS 양자화 인덱스를 각각역양자화하여 양자화된 DCT를 구하고, 상기 양자화된 DCT로부터 양자화된 제 1 DCT 계수 크기를 구하는 역 DCT 연산 모듈;상기 역 DCT 연산 모듈로부터 출력되는 양자화된 제 1 DCT 계수 크기를 크기 순으로 정렬하여 상기 양자화된 제 1 DCT 계수의 크기 순서 정보를 출력하는 크기 순 정렬기;상기 제 1 DCT 계수의 크기 순서 정보를 토대로 제 1 DCT 계수 크기에 상기 고역 음성 패킷으로부터 구한 제 1 DCT 계수의 부호를 삽입하는 부호 삽입기;상기 크기 순 정렬기로부터 제공되는 제 1 DCT 계수 크기 순서 정보를 토대로 제 1 DCT 계수 크기의 부호 정보 중에서 전달되지 않은 부호를 예측하여 해당되는 제 1 DCT 계수 크기에 삽입하는 부호 예측 모듈;상기 부호 삽입기 및 부호 예측 모듈로부터 출력되는 부호가 삽입된 제 1 DCT 계수를 각 대역별로 양자화된 시간 영역 신호로 변환하여 출력하는 역 DCT 연산기;상기 역 DCT 연산기로부터 출력되는 각 대역별 양자화된 시간 영역의 신호를 이용하여 각 대역별 음성 신호를 얻고, 상기 각 대역별 음성신호를 이용하여 고역 음성신호를 복원하는 복원 처리부를 포함하는 광대역 음성 신호 복원 장치.
- 제 27 항에 있어서, 상기 부호 삽입기는 상기 양자화된 제 1 DCT 계수의 크기 순서 정보를 이용하여, 최대 크기의 양자화된 제 1 DCT 계수부터 시작하여 크기가 작아지는 차례로 미리 정해진 수 만큼의 상기 제 1 DCT 계수 부호를 양자화된제 1 DCT 계수에 삽입하는 것을 특징을 하는 광대역 음성 신호 복원 장치.
- 제 27 항에 있어서, 상기 부호 예측 모듈은 상기 부호 삽입기의 동작에 의하여 부호가 할당되지 않은 제 1 DCT 계수에 대하여 부호를 예측하고, 예측된 부호를 해당되는 제 1 DCT 계수에 삽입하는 것을 특징으로 하는 광대역 음성 신호 복원 장치.
- 제 27 항에 있어서, 상기 부호 예측 모듈은,상기 부호가 전달되지 않은 제 1 DCT 계수의 각 인덱스별로 양의 부호와 음의 부호를 각각 삽입하고 역 DCT 연산을 통하여 각 계수 인덱스에 대하여 각 부호별로 시간축 정보를 출력하는 복수개의 시간축 변환기;상기 부호가 전달되지 않은 제 1 DCT 계수의 각 인덱스에 대하여 한 프레임 이전의 고역 신호 정보를 이용하여 각 DCT 계수 인덱스별로 현재 프레임의 시간축 예측정보를 출력하는 신호 예측기; 및각 DCT 계수 인덱스별로 상기 양의 부호와 음의 부호를 사용하여 구하여진 시간축 정보와 상기 시간축 예측정보를 비교하여 각 DCT 계수 인덱스에 대한 최종 부호를 결정하는 부호 선택기를 포함하는 것을 특징을 하는 광대역 음성 신호 복원 장치.
- 제 30 항에 있어서, 상기 복수개의 시간축 변환기는 하기 식에 따라 각 부호별로 시간축 신호를 구하고, n=0을 대입한 값을 출력하는 광대역 음성 신호 복원 장치.(여기서와는 현재 프레임 m에서 제 1 DCT 계수 인덱스 k에 대한 시간 인덱스 n에서의 샘플값을 각각 나타내고,는 양자화된 제 1 DCT 계수 크기이다.)
- 제 30 항에 있어서, 상기 복수개의 시간축 변환기는 하기 식을 n에 대하여 미분하고 n=0을 대입하여 n=0에서의 기울기를 출력하는 광대역 음성 신호 복원 장치.(여기서와는 현재 프레임 m에서 제 1 DCT 계수 인덱스 k에 대한 시간 인덱스 n에서의 샘플값을 각각 나타내고,는 양자화된 제 1 DCT 계수 크기이다. )
- 제 30 항에 있어서, 상기 신호 예측기는 하기 식에 따라 각 DCT 계수별로 한프레임 전의 DCT 계수로부터 현재 프레임의 시간 축 신호를 예측하고, n=0을 대입한 예측 정보를 출력하는 광대역 음성 신호 복원 장치.(여기서는 DCT 계수 인덱스 k에 대한 시간축 예측 신호이고,는 이전 프레임 m-1에서 구한 시간 인덱스 n+L에 해당하는 신호이고,는 한 프레임 이전의 양자화된 제 1 DCT 계수이다.)
- 제 30 항에 있어서, 상기 신호 예측기는 하기 식을 n에 대하여 미분하고 n=0을 대입하여 n=0에서의 예측 기울기를 출력하는 것을 특징으로 하는 광대역 음성 신호 복원 장치.(여기서는 DCT 계수 인덱스 k에 대한 시간축 예측 신호이고,는 이전 프레임 m-1에서 구한 시간 인덱스 n+L에 해당하는 신호이고,는 한 프레임 이전의 양자화된 제 1 DCT 계수이다.)
- 제 30 항에 있어서, 상기 부호 선택기는 상기 복수개의 시간축 변환기의 출력중에서 상기 신호 예측기에서 출력되는 시간축 예측 정보에 더 근접한 부호를 최종 부호로 선택하는 것을 특징으로 하는 광대역 음성 신호 복원 장치.
- 광대역 음성 신호 압축 방법에 있어서,광대역 음성신호가 입력되면, 상기 광대역 음성신호의 저역 신호의 에너지를 이용하여 상기 광대역 음성 신호의 고역 음성 신호를 압축하는 단게;상기 압축된 고역 음성 신호를 고역 음성 패킷으로서 출력하는 단계를 포함하는 광대역 음성 신호 압축 방법.
- 제 36 항에 있어서, 상기 저역 신호의 에너지는 상기 광대역 음성 신호의 저역 신호에 대한 협대역 음성 압축과정에 의해 생성된 것을 특징으로 하는 광대역 음성 신호 압축 방법.
- 제 36 항에 있어서, 상기 고역 음성 신호 압축 단계는,상기 광대역 음성신호의 고역 음성 신호를 복수개의 주파수 대역으로 분해하는 단계;각 대역별로 순위를 결정하는 단계;상기 결정된 대역별 순위에 따라 각 대역별로 양자화 하는 단계를 포함하는 광대역 음성 신호 압축 방법.
- 제 38 항에 있어서, 상기 각 대역별로 순위를 결정하는 단계는 상기 각 대역 신호별로 구한 알엠에스(RMS) 값을 토대로 각 대역별 순위를 결정하는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
- 제 39 항에 있어서, 상기 각 대역별로 순위를 결정하는 단계는 상기 RMS 값이 큰 대역일수록 중요한 대역으로 순위를 결정하는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
- 제 38 항에 있어서, 상기 각 대역별로 양자화 하는 단계는,상기 각 대역별 신호를 이산여현변환(DCT)하여 제 1 DCT 계수를 구하는 단계;상기 제 1 DCT 계수의 크기와 부호를 독립적으로 추출하는 단계;상기 제 1 DCT 계수의 크기에 대하여 DCT를 수행하여 제 2 DCT 계수를 구하는 단계;상기 제 2 DCT 계수에서 디씨(DC) 성분과 나머지 DCT계수를 분리하고, 상기 나머지 DCT 계수를 제 3 DCT로 생성하는 단계;상기 제 3 DCT 계수의 RMS 값을 계산하는 단계;상기 DC 성분, 상기 제 3 DCT 계수의 RMS 값, 상기 제 3 DCT 계수 및 상기 제 1 DCT 계수의 부호를 독립적으로 양자화하는 단계를 포함하는 광대역 음성 신호 압축 방법.
- 제 41 항에 있어서, 상기 양자화 단계는,상기 DC성분은 대역간 예측 양자화 과정으로 양자화하는 단계;상기 제 3 DCT 계수의 RMS 값은 대역내 예측 양자화 과정으로 양자화하는 단계;상기 제 3 DCT 계수는 각 대역의 제 3 DCT 계수중에서 일부 DCT 계수만을 양자화하고 나머지 DCT 계수는 제거되도록 양자화하는 단계;상기 제 1 DCT 계수의 부호는 크기가 큰 DCT 계수에 해당되는 부호를 양자화 하는 단계를 포함하는 광대역 음성 신호 압축 방법.
- 제 42 항에 있어서, 상기 DC 성분에 대한 대역간 예측 양자화 과정은 하기 식에 따라 대역간 DC 예측 오차를 구하고, 상기 DC 예측 오차를 양자화 하는 것을 특징으로 하는 광대역 음성 신호 압축 방법.(상기 식에서 Di는 i번째 고역 음성 대역의 Log DC값이고,는 i번째 고역 음성 대역의 양자화된 Log DC값이고,는 저역 신호의 Log 에너지이고, G는 예측기의 계수이고,는 i번째 고역 음성 대역의 DC 예측 오차이다.)
- 제 42 항에 있어서, 상기 제 3 DCT 계수의 RMS 값에 대한 대역내 예측 양자화는 상기 제 3 DCT 계수의 RMS 값과 상기 제 2 DCT 계수의 양자화된 DC값을 이용하여 수행되는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
- 제 42 항에 있어서, 상기 제 3 DCT 계수 양자화 단계는, 상기 각 대역의 순위 정보에 따라 중요한 대역에서는 상기 제 3 DCT 계수를 적게 제거하고, 중요하지 않은 대역에서는 상기 제 3 DCT 계수를 많이 제거하는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
- 제 42 항에 있어서, 상기 제 1 DCT 계수의 부호 양자화 단계는 상기 제 1 DCT 계수의 크기 순서 정보에 따라 최대 크기의 제 1 DCT 계수부터 크기가 작은 순서로 미리 정해진 수만큼의 제 1 DCT 계수에 해당하는 계수 부호는 양자화 하고, 나머지 크기가 작은 제 1 DCT 계수에 해당하는 계수 부호는 제거하여 양자화 하지 않는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
- 계층적인 대역폭 구조로 압축되어 저역 음성 패킷과 고역 음성 패킷으로 구분되어 전송되는 광대역 음성 신호를 복원하는 방법에 있어서,상기 저역 음성 패킷을 저역 음성 신호로 복원하는 단계;상기 저역 음성 신호 복원 시 구한 저역 복원 신호의 에너지 정보를 이용하여 상기 고역 음성 패킷을 고역 음성 신호로 복원하는 단계;상기 저역 음성 신호와 상기 고역 음성 신호를 가산하여 광대역 복원 신호를 생성하는 단계를 포함하는 광대역 음성신호 복원 방법.
- 제 47 항에 있어서, 상기 고역 음성 신호 복원 단계는,상기 고역 음성 패킷을 각 모듈별로 역 양자화하는 단계;상기 역 양자화에 의해 양자화된 제 1 DCT 계수 크기를 구하는 단계;상기 역양자화에 의해 얻어진 제 1 DCT 계수 부호를 상기 제 1 DCT 계수 크기 순서 정보에 따라 DCT 계수에 삽입하는 단계;상기 제 1 DCT 계수 크기 순서 정보와 한 프레임 전의 DCT 계수를 이용하여 수신되지 않은 제 1 DCT 계수 부호를 예측하는 단계;상기 에측된 제 1 DCT 계수 부호를 해당되는 양자화된 제 1 DCT 계수에 삽입하는 단계;양자화된 제 1 DCT 계수에 대한 역 DCT 연산으로 대역별 시간 영역신호를 구하여 상기 고역 음성 신호를 출력하는 단계를 포함하는 광대역 음성 신호 복원 방법.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030048665A KR100940531B1 (ko) | 2003-07-16 | 2003-07-16 | 광대역 음성 신호 압축 및 복원 장치와 그 방법 |
US10/891,423 US8433565B2 (en) | 2003-07-16 | 2004-07-15 | Wide-band speech signal compression and decompression apparatus, and method thereof |
JP2004208615A JP4726445B2 (ja) | 2003-07-16 | 2004-07-15 | 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法 |
EP04254266A EP1498874B1 (en) | 2003-07-16 | 2004-07-16 | Wide-band speech signal compression and decompression apparatus, and method thereof |
DE602004001101T DE602004001101T2 (de) | 2003-07-16 | 2004-07-16 | Breitbandsprachsignalkompressionsvorrichtung, Breitbandsprachsignaldekompressionsvorrichtung, Breitbandsprachsignalkompressionsverfahren, Breitbandsprachsignaldekompressionsverfahren |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030048665A KR100940531B1 (ko) | 2003-07-16 | 2003-07-16 | 광대역 음성 신호 압축 및 복원 장치와 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050009384A true KR20050009384A (ko) | 2005-01-25 |
KR100940531B1 KR100940531B1 (ko) | 2010-02-10 |
Family
ID=36643387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030048665A KR100940531B1 (ko) | 2003-07-16 | 2003-07-16 | 광대역 음성 신호 압축 및 복원 장치와 그 방법 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8433565B2 (ko) |
EP (1) | EP1498874B1 (ko) |
JP (1) | JP4726445B2 (ko) |
KR (1) | KR100940531B1 (ko) |
DE (1) | DE602004001101T2 (ko) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006243041A (ja) * | 2005-02-28 | 2006-09-14 | Yutaka Yamamoto | 高域補間装置及び再生装置 |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
KR101261524B1 (ko) * | 2007-03-14 | 2013-05-06 | 삼성전자주식회사 | 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치 |
CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
US8000968B1 (en) | 2011-04-26 | 2011-08-16 | Huawei Technologies Co., Ltd. | Method and apparatus for switching speech or audio signals |
CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
US8560330B2 (en) * | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
CN102741831B (zh) * | 2010-11-12 | 2015-10-07 | 宝利通公司 | 多点环境中的可伸缩音频 |
US9905236B2 (en) | 2012-03-23 | 2018-02-27 | Dolby Laboratories Licensing Corporation | Enabling sampling rate diversity in a voice communication system |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
US10264116B2 (en) * | 2016-11-02 | 2019-04-16 | Nokia Technologies Oy | Virtual duplex operation |
CN112770269B (zh) * | 2019-11-05 | 2022-05-17 | 海能达通信股份有限公司 | 宽窄带互通环境下语音通讯方法及系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8421498D0 (en) * | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
JPH07334194A (ja) * | 1994-06-14 | 1995-12-22 | Matsushita Electric Ind Co Ltd | 音声符号化/復号化方法およびそれらの装置 |
JPH08160996A (ja) * | 1994-12-05 | 1996-06-21 | Hitachi Ltd | 音声符号化装置 |
JPH08163056A (ja) * | 1994-12-09 | 1996-06-21 | Hitachi Denshi Ltd | 音声信号帯域圧縮伝送方式 |
JP3134817B2 (ja) * | 1997-07-11 | 2001-02-13 | 日本電気株式会社 | 音声符号化復号装置 |
DE19743662A1 (de) * | 1997-10-02 | 1999-04-08 | Bosch Gmbh Robert | Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms |
US6353808B1 (en) * | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
JP2001217999A (ja) * | 2000-02-03 | 2001-08-10 | Nikon Corp | 画像入力装置 |
US6691085B1 (en) * | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
-
2003
- 2003-07-16 KR KR1020030048665A patent/KR100940531B1/ko active IP Right Grant
-
2004
- 2004-07-15 JP JP2004208615A patent/JP4726445B2/ja not_active Expired - Fee Related
- 2004-07-15 US US10/891,423 patent/US8433565B2/en active Active
- 2004-07-16 DE DE602004001101T patent/DE602004001101T2/de not_active Expired - Lifetime
- 2004-07-16 EP EP04254266A patent/EP1498874B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR100940531B1 (ko) | 2010-02-10 |
JP4726445B2 (ja) | 2011-07-20 |
US8433565B2 (en) | 2013-04-30 |
JP2005037949A (ja) | 2005-02-10 |
DE602004001101D1 (de) | 2006-07-20 |
DE602004001101T2 (de) | 2007-06-14 |
EP1498874A1 (en) | 2005-01-19 |
US20050027516A1 (en) | 2005-02-03 |
EP1498874B1 (en) | 2006-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101143724B1 (ko) | 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치 | |
KR101220621B1 (ko) | 부호화 장치 및 부호화 방법 | |
US8571878B2 (en) | Speech compression and decompression apparatuses and methods providing scalable bandwidth structure | |
US7596492B2 (en) | Apparatus and method for concealing highband error in split-band wideband voice codec and decoding | |
US6353808B1 (en) | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal | |
KR100940531B1 (ko) | 광대역 음성 신호 압축 및 복원 장치와 그 방법 | |
KR100921867B1 (ko) | 광대역 오디오 신호 부호화 복호화 장치 및 그 방법 | |
CN103258541A (zh) | 音频解码方法 | |
US20070040709A1 (en) | Scalable audio encoding and/or decoding method and apparatus | |
KR100657916B1 (ko) | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 | |
US20030088402A1 (en) | Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope | |
US6141637A (en) | Speech signal encoding and decoding system, speech encoding apparatus, speech decoding apparatus, speech encoding and decoding method, and storage medium storing a program for carrying out the method | |
WO2015049820A1 (ja) | 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法 | |
KR101037931B1 (ko) | 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법 | |
JP4274614B2 (ja) | オーディオ信号復号方法 | |
JP3468184B2 (ja) | 音声通信装置及びその通信方法 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
JP2002215192A (ja) | オーディオ情報処理装置及び処理方法 | |
Radha et al. | Comparative analysis of compression techniques for Tamil speech datasets | |
JPH0944194A (ja) | 音声符号化通信方式 | |
KR20160098597A (ko) | 통신 시스템에서 신호 코덱 장치 및 방법 | |
Milner et al. | Transform-based feature vector compression for distributed speech recognition | |
Amro et al. | Exploiting Linear Prediction Coefficients Redundancy in VoIP Data Rate Reduction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121210 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20131217 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20141224 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20151217 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20161219 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20171219 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20181220 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20191217 Year of fee payment: 11 |