KR20050009384A - 광대역 음성 신호 압축 및 복원 장치와 그 방법 - Google Patents

광대역 음성 신호 압축 및 복원 장치와 그 방법 Download PDF

Info

Publication number
KR20050009384A
KR20050009384A KR1020030048665A KR20030048665A KR20050009384A KR 20050009384 A KR20050009384 A KR 20050009384A KR 1020030048665 A KR1020030048665 A KR 1020030048665A KR 20030048665 A KR20030048665 A KR 20030048665A KR 20050009384 A KR20050009384 A KR 20050009384A
Authority
KR
South Korea
Prior art keywords
band
dct
signal
dct coefficient
code
Prior art date
Application number
KR1020030048665A
Other languages
English (en)
Other versions
KR100940531B1 (ko
Inventor
이우석
박호종
손창용
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020030048665A priority Critical patent/KR100940531B1/ko
Priority to US10/891,423 priority patent/US8433565B2/en
Priority to JP2004208615A priority patent/JP4726445B2/ja
Priority to DE602004001101T priority patent/DE602004001101T2/de
Priority to EP04254266A priority patent/EP1498874B1/en
Publication of KR20050009384A publication Critical patent/KR20050009384A/ko
Application granted granted Critical
Publication of KR100940531B1 publication Critical patent/KR100940531B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 기존의 표준 협대역 음성 신호 압축장치와 호환이 가능하면서 저역 음성신호의 압축 정보를 이용하여 고역 음성 신호를 압축하고 이를 복원할 수 있는 광대역 음성 신호 압축 및 복원 장치와 그 방법을 개시한다.
본 발명에 따른 광대역 음성 신호 압축 장치는, 협대역 음성 압축기, 고역 음성 압축 유니트를 포함한다. 협대역 음성 압축기는 광대역 음성 신호의 저역 음성 신호를 압축하고, 상기 압축된 저역 음성 신호를 저역 음성 패킷으로서 출력한다. 고역 음성 압축 유니트는 협대역 음성 압축기로부터 제공되는 저역 신호의 에너지를 이용하여 광대역 음성 신호의 고역 음성 신호를 압축하고, 압축된 고역 음성 신호를 고역 음성 패킷으로서 출력한다. 본 발명에 따른 광대역 음성 신호 복원 장치는, 협대역 음성 복원기 및 고역 음성 복원기 및 가산기를 포함한다. 협대역 음성 복원기는 압축된 저역 음성 패킷을 저역 음성 신호로 복원한다. 고역 음성 복원기는 협대역 음성 복원기에서 제공되는 저역 복원 신호의 에너지 정보를 이용하여 압축된 고역 음성 패킷을 고역 음성신호로 복원한다. 가산기는 저역 음성 신호와 고역 음성 신호를 가산하여 광대역 복원 신호를 출력한다.

Description

광대역 음성 신호 압축 및 복원 장치와 그 방법{Wide-band speech compression and decompression apparatus and method thereof}
본 발명은 음성신호 부호화 및 복호화에 관한 것으로서, 특히 음성신호를 계층적인 대역폭(scalable bandwidth) 구조로 압축하고 이를 복원하는 광대역 음성 신호 압축 및 복원 장치와 그 방법에 관한 것이다.
기존의 공중전화교환망(Public Switched Telephone Network, PSTN) 기반의 통신은 8kHz로 음성 신호를 샘플링 하여 4kHz 대역의 음성 신호를 전달하고 있다. 따라서 기존의 PSTN 기반의 음성 통신은 4kHz 대역을 벗어나는 음성 신호를 전달하지 못하므로 음질이 많이 떨어진다.
이를 개선하기 위하여 입력되는 음성 신호를 16kHz로 샘플링 하여 8kHz의 대역폭을 제공하는 패킷(packet)기반의 광대역 음성 신호 압축장치가 개발되고 있다. 그러나 음성 신호의 대역폭이 증가하면 음질이 향상되는 반면에 통신 채널의 데이터 전송량이 증가하게 된다. 따라서 광대역 음성 신호 압축장치를 효율적으로 운영하기 위해서는 항상 광대역의 데이터 전송을 위한 통신 채널을 확보하여야 한다.
그러나 패킷 기반의 통신 채널은 데이터 전송량이 고정되어 있지 않고 다양한 요인에 따라 데이터 전송량이 변한다. 따라서 광대역 음성 신호 압축 장치가 필요로 하는 통신 채널이 보장되지 않아 음질이 저하될 수 있다. 이는 특정 순간에 통신 채널의 전송량이 필요한 만큼 제공되지 않으면, 전송되는 음성 패킷이 손실되어 통신 음질이 급격하게 저하되기 때문이다.
따라서, 계층적인 대역(scalable bandwidth) 구조로 음성신호를 압축하는 기술이 제안된 바 있다. ITU(International Telecommunication Union, 이하 ITU라고약함) 표준 G.722가 그 예이다. ITU 표준 G.722는 저역 통과 필터와 고역 통과 필터를 이용하여 입력되는 음성신호를 두 대역으로 분리하고, 각 대역을 독립적으로 압축하는 기술을 제안하고 있다. ITU 표준 G.722에서 각 대역 정보는 ADPCM(Adaptive Differential Pulse Code Modulation)방식으로 압축한다. 그러나, ITU 표준 G.722에서 제안하고 있는 압축 기술은 데이터 전송률이 매우 높은 단점을 갖고 있다.
또 기존에는 광대역 입력 신호를 주파수 영역으로 변환하고 주파수 영역을 몇 개의 부대역(sub-bandwidth)으로 분리하여 각 부대역의 정보를 압축하는 기술이 제안된 바 있다. ITU 표준 G722.1에 의해 제안된 방식이 그 예이다. 그러나 이 ITU 표준 G.722.1은 음성 패킷을 계층적인 대역폭 구조로 압축하지 않을 뿐 아니라 기존의 표준 협대역 음성신호 압축장치와 호환되지 않는 문제점을 갖고 있다.
표준 협대역 음성 신호 압축장치의 호환 문제를 고려하여 개발된 기존의 광대역 음성 신호 압축 기술은 광대역 음성 신호에 저역 통과 필터를 적용하여 협대역 음성 신호를 구하고, 이 협대역 음성 신호를 표준 협대역 음성신호 압축기로 부호화하고 고역 음성 신호는 별도의 방식으로 압축한다. 각 대역의 패킷은 계층적으로 전달된다.
고역 음성 신호를 처리하는 기존의 기술로는 고역 음성 신호를 필터 뱅크를 이용하여 다수의 부대역 신호로 분리하고, 각 부대역 정보를 압축하는 기술이 있다. 고역 음성 신호를 압축하는 또 다른 기술로서 고역 음성 신호를 DCT(Discrete Cosine Transform) 또는 DFT(Discrete Fourier Transform)를 통하여 주파수 영역으로 변환하고, 각 주파수 계수를 양자화 하는 기술이 있다.
그러나, 이러한 기존의 계층적인 대역 구조를 가지는 광대역 음성 신호 압축 기술들은 고역 음성 신호의 압축 과정에서 저역 음성 신호의 특성을 활용하지 않아 압축 효율이 떨어진다.
또한, 고역 음성 신호의 압축 과정에서 대역간과 대역내의 상관관계를 효율적으로 사용하지 않고, 주파수 영역으로 변환된 모든 주파수 계수를 양자화함으로써, 양자화 효율이 저하되고, 압축으로 인해 전송되지 않은 정보를 복원과정에서 예측하여 활용하는 기술이 부족한 문제점들을 갖고 있다.
본 발명이 이루고자 하는 기술적 과제는 기존의 표준 협대역 음성 신호 압축장치와 호환이 가능한 광대역 음성 신호 압축 및 복원장치와 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 계층적인 대역폭 구조로 음성신호를 압축 및 복원할 때, 저역 음성신호의 압축 정보를 이용하여 고역 음성 신호를 압축하고 이를 복원할 수 있는 광대역 음성 신호 압축 및 복원 장치와 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 고역 음성 신호의 압축 시, 대역 사이와 대역 내의 상관관계를 활용하여 압축하고 이를 복원하는 광대역 음성 신호 압축 및 복원 장치와 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 음성 신호를 압축할 때, 음성신호를 주파수 영역으로 변환하여 얻은 주파수 계수를 주파수 계수 및 대역의 특성에 따라 구분하여 양자화 하고 이를 복원하는 광대역 음성 신호 압축 및 복원 장치와 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 압축으로 전송되지 않은 정보를 복원 과정에서 예측함으로써 복원되는 정보의 손실을 최소화할 수 있는 음성 압축 및 복원 장치와 그 방법을 제공하는데 있다.
도 1은 본 발명에 따른 광대역 음성 신호 압축 장치의 기능 블록도이다.
도 2는 도 1에 도시된 고역 음성 압축기의 상세 기능 블록도이다.
도 3은 도 2에 도시된 대역 신호 양자화 모듈의 상세 기능 블록도이다.
도 4는 도 3에 도시된 DC 양자화 모듈의 상세 기능 블록도이다.
도 5는 도 3에 도시된 RMS 양자화 모듈의 상세 기능 블록도이다.
도 6은 도 3에 도시된 부호 양자화 모듈의 상세 기능 블록도이다.
도 7은 본 발명에 따른 광대역 음성 신호 복원 장치의 기능 블록도이다.
도 8은 도 7에 도시된 고역 음성 복원기의 상세 기능 블록도이다.
도 9는 도 8에 도시된 부호 예측 모듈의 상세 기능 블록도이다.
도 10은 본 발명에 따른 광대역 음성 신호 압축 방법에 있어서 고역 음성신호 압축 과정의 동작 흐름도이다.
도 11은 본 발명에 따른 광대역 음성 신호 복원 방법에 있어서 고역 음성신호 복원 과정의 동작 흐름도이다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 광대역 음성 신호의 저역 음성 신호를 압축하고, 상기 압축된 저역 음성 신호를 저역 음성 패킷으로서 출력하는 협대역 음성 압축기; 상기 협대역 음성 압축기로부터 제공되는 저역 신호의 에너지를 이용하여 상기 광대역 음성 신호의 고역 음성 신호를 압축하고, 압축된 고역 음성 신호를 고역 음성 패킷으로서 출력하는 고역 음성 압축 유니트를 포함하는 광대역 음성 신호 압축 장치를 제공한다.
상기 협대역 음성 압축기가 켈프(CELP) 계열의 압축기이면, 상기 저역 신호의 에너지는 상기 협대역 음성 압축기에서 상기 고역 음성 압축 유니트의 프레임에 해당하는 양자화된 고정 코드북 이득 또는 고정 코드북 이득의 평균값일 수 있다.
상기 고역 음성 압축기는, 상기 광대역 음성 신호의 고역 음성신호를 복수개의 대역으로 분해하는 필터 뱅크; 상기 필터 뱅크에서 출력되는 각 대역 신호에 대해 독립적인 알엠에스(RMS) 값을 구하는 대역 RMS 값 계산기; 상기 대역 RMS 값 계산기에서 계산된 RMS 값을 토대로 상기 필터 뱅크에서 분해된 대역의 순위를 정하는 대역 순위 결정기; 상기 대역 순위 결정기에서 결정된 대역 순위 정보와 상기 저역 신호의 에너지를 이용하여 상기 필터 뱅크에서 분해된 각 대역의 신호를 양자화하여 대역별 양자화 인덱스를 출력하는 대역 신호 양자화 모듈; 상기 대역 순위 정보와 상기 대역 신호 양자화 모듈에서 출력되는 대역별 양자화 인덱스를 패킷화하고, 상기 패킷화된 정보를 상기 고역 음성 패킷으로서 출력하는 패킷화기를 포함할 수 있다.
상기 대역 순위 결정기는 상기 RMS 값의 크기 순서에 따라 상기 대역의 순위를 결정할 수 있다.
상기 대역 순위 결정기는 상기 RMS 값이 큰 대역일수록 중요한 대역으로 순위를 결정할 수 있다.
상기 대역 신호 양자화 모듈은, 상기 필터 뱅크로부터 제공되는 각 대역의 신호에 대해 이산여현변환(DCT)을 수행하여 제 1 DCT 계수를 구하는 제 1 DCT 연산기; 상기 제 1 DCT 계수의 크기를 구하는 크기 추출기; 상기 제 1 DCT 계수의 부호를 구하는 부호 추출기; 상기 크기 추출기에서 출력된 제 1 DCT 계수 크기에 대하여 DCT를 수행하여 제 2 DCT 계수를 구하는 제 2 DCT 연산기; 상기 제 2 DCT 연산기에서 출력되는 제 2 DCT 계수에서 디씨(DC) 성분과 상기 DC 성분을 제외한 DCT계수를 분리하고, 상기 DC성분을 제외한 DCT계수를 제 3 DCT 계수로서 출력하는 DC분리기; 상기 DC분리기에서 출력되는 상기 DC 성분을 양자화하는 DC 양자화 모듈; 상기 제 3 DCT 계수의 RMS 값을 구하는 RMS 값 계산기; 상기 RMS 값 계산기에서 구한 RMS 값을 양자화 하는 RMS 값 양자화 모듈; 상기 RMS 값 양자화 모듈에서 출력되는RMS값 양자화 인덱스를 이용하여 검출된 양자화된 RMS 값을 이용하여 상기 제 3 DCT 계수를 정규화하는 정규화기; 상기 정규화된 제 3 DCT 계수를 양자화하는 DCT 계수 양자화기; 상기 부호 추출기에서 추출된 부호를 양자화하는 부호 양자화 모듈을 포함할 수 있다.
상기 DC 양자화 모듈은 상기 저역 신호 에너지 정보와 상기 각 대역의 DC 성분을 이용한 대역간 예측으로 상기 DC 성분을 양자화할 수 있다.
상기 DC 양자화 모듈은, 상기 저역 신호 에너지 정보와 상기 각 대역의 DC 값을 이용하여 대역간을 예측 하는 대역간 예측기; 상기 대역간 예측기에서 출력되는 각 대역의 DC 예측 오차를 양자화 하여 DC 양자화 인덱스를 출력하는 DC 양자화기; 상기 DC 양자화기에서 출력되는 상기 DC 양자화 인덱스로부터 대역별 양자화 된 DC 예측 오차를 구하고, 상기 DC 예측 오차로부터 대역별 양자화된 DC 값을 구하는 DC 역양자화기를 포함할 수 있다.
상기 대역간 예측기는 하기 식에 따라 대역간 DC 예측 오차를 구할 수 있다.
.
상기 DC 양자화 모듈은 상기 DC 예측 오차를 독립적으로 스칼라 양자화할 수 있다.
상기 RMS 값 양자화 모듈은 상기 제 3 DCT 계수의 RMS 값과 상기 제 2 DCT 계수의 양자화된 DC 값을 이용한 대역내에서의 예측으로 상기 제 3 DCT 계수의 RMS 값을 양자화할 수 있다.
상기 RMS 값 양자화 모듈은, 상기 제 3 DCT 계수의 RMS 값과 상기 제 2 DCT 계수의 양자화된 DC 값을 이용하여 대역내에서 예측 동작을 수행하는 대역내 예측기; 상기 대역내 예측기에서 출력되는 RMS 예측 오차를 양자화 하는 RMS 양자화기를 포함할 수 있다.
상기 대역내 예측기는 하기 식에 따라 대역내 RMS 예측 오차를 구할 수 있다.
상기 DCT 계수 양자화기는 각 대역의 제 3 DCT 계수중에서 일부 DCT 계수만을 양자화하고 나머지 계수는 제거할 수 있다.
상기 DCT 계수 양자화기는 상기 대역 순위 정보에 따라 중요한 대역에서는 상기 제 3 DCT 계수를 적게 제거하고, 중요하지 않은 대역에서는 상기 제 3 DCT 계수를 많이 제거할 수 있다.
상기 DCT 계수 양자화기는 상기 대역 순위 정보에 따라 각 대역에서 양자화 할 DCT 계수의 범위에 해당하는 인덱스를 결정하고, 결정된 인덱스를 참조하여 각 대역별로 제 3 DCT 계수를 양자화할 수 있다.
상기 DCT 계수 양자화기는 상기 대역 순위 정보에 따라 각 대역에서 양자화 할 DCT 계수의 범위에 해당하는 인덱스를 결정하고, 상기 결정된 DCT 계수의 인덱스보다 하위의 인덱스에 해당하는 제 3 DCT 계수를 제거하고, 상기 결정된 DCT 계수 인덱스보다 상위의 인덱스에 해당되는 나머지 제 3 DCT 계수만을 양자화할 수 있다.
상기 DCT 계수 양자화기는 각 대역에서 양자화 할 제 3 DCT 계수를 다수의 서브 벡터(subvector)로 분할하고 상기 대역 순위정보에 따라 전체 서브 벡터중에서 양자화할 서브 벡터와 제거할 서브 벡터를 선택하는 선택적 분할 벡터 양자화 방식에 따라 양자화할 수 있다.
상기 부호 양자화 모듈은, 상기 제 3 DCT 계수의 양자화 인덱스와 상기 제 2 DCT 계수의 DC 양자화 인덱스를 이용하여 상기 양자화된 제 1 DCT 계수의 크기 순서 정보를 검출하고, 상기 제 1 DCT 계수의 크기 순서 정보에 따라 상기 제 1 DCT 계수 부호를 양자화할 수 있다.
상기 부호 양자화 모듈은 상기 제 1 DCT 계수의 크기 순서 정보를 이용하여 양자화할 제 1 DCT 계수 부호와 제거할 제 1 DCT 계수 부호를 구분하여 제 1 DCT 계수의 부호를 양자화할 수 있다.
상기 양자화할 제 1 DCT 계수 부호는 최대 크기의 제 1 DCT 계수부터 작은 순서로 미리 정해진 수만큼의 제 1 DCT 계수의 부호를 포함할 수 있다.
상기 부호 양자화 모듈은, 상기 제 3 DCT 계수의 양자화 인덱스로부터 양자화된 제 3 DCT 계수를 구하는 DCT 계수 역양자화기; 상기 제 2 DCT 계수의 DC 양자화 인덱스로부터 제 2 DCT 계수의 양자화된 DC 값을 구하는 DC 역양자화기; 상기 양자화된 제 3 DCT 계수와 제 2 DCT 계수의 양자화된 DC 값을 DCT 역변환하는 역 DCT 연산기; 상기 역 DCT 연산기에서 출력되는 양자화된 제 1 DCT 계수의 크기를 크기 순으로 정렬하는 크기 순 정렬기;상기 크기 순 정렬기에서 출력되는 양자화된 제 1 DCT 계수의 크기 순서 정보에 따라 상기 제 1 DCT 계수 부호를 양자화 하는부호 양자화기를 포함할 수 있다.
상기 부호 양자화기는 상기 크기 순 정렬기에서 출력되는 양자화된 제 1 DCT 계수의 크기 순서 정보를 이용하여, 최대 크기의 제 1 DCT 계수부터 크기가 작은 순서로 미리 정해진 수 만큼의 제 1 DCT 계수에 해당하는 계수 부호는 양자화 하고, 나머지 크기가 작은 제 1 DCT 계수에 해당하는 계수 부호는 제거하여 전달하지 않는다.
상기 광대역 음성 신호 압축 장치는, 상기 광대역 음성 신호를 협대역 저역 음성신호로 변환하여 상기 협대역 음성 압축기로 제공하는 제 1 대역 변환 유니트를 더 포함할 수 있다.
상기 기술적 과제들을 달성하기 위하여 본 발명은 압축된 저역 음성 패킷을 저역 음성 신호로 복원하는 협대역 음성 복원기; 상기 협대역 음성 복원기에서 제공되는 저역 복원 신호의 에너지 정보를 이용하여 상기 압축된 고역 음성 패킷을 고역 음성신호로 복원하는 고역 음성 복원기; 상기 협대역 음성 복원기에서 출력되는 저역 음성 신호와 상기 고역 음성 복원기에서 출력되는 고역 음성 신호를 가산하여 광대역 복원 신호를 출력하는 가산기를 포함하는 광대역 음성 신호 복원 장치를 제공한다.
상기 고역 음성 복원기는, 상기 고역 음성 패킷을 모듈별로 분해하는 역 패킷화기; 상기 역 패킷화기로부터 출력되는 부호를 역양자화하는 부호 역양자화기; 상기 역 패킷화기로부터 출력되는 대역 순위 정보, 제 3 DCT 양자화 인덱스, 제 2 DCT 계수의 DC 양자화 인덱스, 및 제 3 DCT 계수의 RMS 양자화 인덱스를 각각 역양자화하여 양자화된 DCT를 구하고, 상기 양자화된 DCT로부터 양자화된 제 1 DCT 계수 크기를 구하는 역 DCT 연산 모듈; 상기 역 DCT 연산 모듈로부터 출력되는 양자화된 제 1 DCT 계수 크기를 크기 순으로 정렬하여 상기 양자화된 제 1 DCT 계수의 크기 순서 정보를 출력하는 크기 순 정렬기; 상기 제 1 DCT 계수의 크기 순서 정보를 토대로 제 1 DCT 계수 크기에 상기 고역 음성 패킷으로부터 구한 제 1 DCT 계수의 부호를 삽입하는 부호 삽입기; 상기 크기 순 정렬기로부터 제공되는 제 1 DCT 계수 크기 순서 정보를 토대로 제 1 DCT 계수 크기의 부호 정보 중에서 전달되지 않은 부호를 예측하여 해당되는 제 1 DCT 계수 크기에 삽입하는 부호 예측 모듈; 상기 부호 삽입기 및 부호 예측 모듈로부터 출력되는 부호가 삽입된 제 1 DCT 계수를 각 대역별로 양자화된 시간 영역 신호로 변환하여 출력하는 역 DCT 연산기; 상기 역 DCT 연산기로부터 출력되는 각 대역별 양자화된 시간 영역의 신호를 이용하여 각 대역별 음성 신호를 얻고, 상기 각 대역별 음성신호를 이용하여 고역 음성신호를 복원하는 복원 처리부를 포함할 수 있다.
상기 부호 삽입기는 상기 양자화된 제 1 DCT 계수의 크기 순서 정보를 이용하여, 최대 크기의 양자화된 제 1 DCT 계수부터 시작하여 크기가 작아지는 차례로 미리 정해진 수 만큼의 상기 제 1 DCT 계수 부호를 양자화된 제 1 DCT 계수에 삽입할 수 있다.
상기 부호 예측 모듈은 상기 부호 삽입기의 동작에 의하여 부호가 할당되지 않은 제 1 DCT 계수에 대하여 부호를 예측하고, 예측된 부호를 해당되는 제 1 DCT 계수에 삽입할 수 있다.
상기 부호 예측 모듈은, 상기 부호가 전달되지 않은 제 1 DCT 계수의 각 인덱스별로 양의 부호와 음의 부호를 각각 삽입하고 역 DCT 연산을 통하여 각 계수 인덱스에 대하여 각 부호별로 시간축 정보를 출력하는 복수개의 시간축 변환기; 상기 부호가 전달되지 않은 제 1 DCT 계수의 각 인덱스에 대하여 한 프레임 이전의 고역 신호 정보를 이용하여 각 DCT 계수 인덱스별로 현재 프레임의 시간축 예측정보를 출력하는 신호 예측기; 및 각 DCT 계수 인덱스별로 상기 양의 부호와 음의 부호를 사용하여 구하여진 시간축 정보와 상기 시간축 예측정보를 비교하여 각 DCT 계수 인덱스에 대한 최종 부호를 결정하는 부호 선택기를 포함할 수 있다.
상기 복수개의 시간축 변환기는 하기 식에 따라 각 부호별로 시간축 신호를 구하고, n=0을 대입한 값을 출력하거나 하기 식을 n에 대하여 미분하고 n=0을 대입하여 n=0에서의 기울기를 출력할 수 있다.
상기 신호 예측기는 하기 식에 따라 각 DCT 계수별로 한 프레임 전의 DCT 계수로부터 현재 프레임의 시간 축 신호를 예측하고, n=0을 대입한 예측 정보를 출력하거나 하기 식을 n에 대하여 미분하고 n=0을 대입하여 n=0에서의 예측 기울기를 출력할 수 있다.
상기 부호 선택기는 상기 복수개의 시간축 변환기의 출력중에서 상기 신호예측기에서 출력되는 시간축 예측 정보에 더 근접한 부호를 최종 부호로 선택할 수 있다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 광대역 음성신호가 입력되면, 상기 광대역 음성신호의 저역 신호의 에너지를 이용하여 상기 광대역 음성 신호의 고역 음성 신호를 압축하는 단게; 상기 압축된 고역 음성 신호를 고역 음성 패킷으로서 출력하는 단계를 포함하는 광대역 음성 신호 압축 방법을 제공한다.
상기 고역 음성 신호 압축 단계는, 상기 광대역 음성신호의 고역 음성 신호를 복수개의 주파수 대역으로 분해하는 단계; 각 대역별로 순위를 결정하는 단계; 상기 결정된 대역별 순위에 따라 각 대역별로 양자화 하는 단계를 포함할 수 있다.
상기 기술적 과제들을 달성하기 위하여 본 발명은 저역 음성 패킷을 저역 음성 신호로 복원하는 단계; 상기 저역 음성 신호 복원 시 구한 저역 복원 신호의 에너지 정보를 이용하여 상기 고역 음성 패킷을 고역 음성 신호로 복원하는 단계; 상기 저역 음성 신호와 상기 고역 음성 신호를 가산하여 광대역 복원 신호를 생성하는 단계를 포함하는 광대역 음성신호 복원 방법을 제공한다.
이하 본 발명의 실시 예에 따른 광대역 음성 신호 압축 및 복원 장치와 그 방법을 살펴보면 다음과 같다.
도 1은 본 발명에 따른 광대역 음성신호 압축장치의 기능 블록도이다. 도 1을 참조하면, 본 발명에 따른 광대역 음성 신호 압축장치는 제 1 대역 변환 유니트(102), 협대역 음성 압축기(106), 고역 음성 압축기(107)로 구성된다.
제 1 대역 변환 유니트(102)는 라인(101)을 통해 입력되는 광대역 음성 신호를 협대역 신호로 변환한다. 상기 광대역 음성 신호는 아날로그 신호를 16kHz로 샘플링하고, 각 샘플을 16 비트 선형 PCM(Pulse Code Modulation)으로 양자화 한 신호이다.
제 1 대역 변환 유니트(102)는 저역 통과 필터(104)와 다운 샘플러(down sampler)(105)로 구성된다.
저역 통과 필터(104)는 차단 주파수에 따라 라인(101)을 통해 입력되는 광대역 음성 신호를 저역 필터링한다. 상기 차단 주파수는 계층적인 대역폭 구조에 따라 정의되는 협대역의 대역폭에 의해 결정된다. 예로, 저역 통과 필터(104)의 차단 주파수는 3700Hz를 사용할 수 있다.
다운 샘플러(105)는 1/2 다운 샘플링 동작에 따라 저역 통과 필터(104)로부터 출력되는 신호를 샘플마다 교차적으로 제거한 협대역 저역 신호(103)를 출력한다. 협대역 저역 신호(103)는 협대역 음성 압축기(106)로 출력된다.
협대역 음성 압축기(106)는 상기 협대역 저역 신호(103)를 압축하여 저역 음성 패킷(108)을 출력한다. 협대역 저역 신호(103)를 압축하는 방식은 기존의 표준 협대역 음성 압축장치에서 이용되는 방식을 사용할 수 있다. 저역 음성 패킷(108)은 통신 채널(미 도시됨)로 전달된다.
또한, 협대역 음성 압축기(106)는 협대역 음성압축 시 저역 음성 신호의 에너지를 계산한다. 상기 저역 음성 신호의 에너지 계산 방식은 기존의 표준 협대역 음성 압축장치에서 이용하는 방식을 사용할 수 있다. 예를 들어, G.729가 협대역 음성 압축기(106)로 사용될 경우, 고역 음성 압축기(107)의 프레임에 해당하는 양자화된 고정 코드북 이득의 평균값이 상기 저역 음성 신호의 에너지에 해당한다. 따라서, 협대역 음성 압축기(106)는 기존의 협대역 음성 압축기에서 프레임의 양자화된 고정 코드북 이득을 계산하는 방식을 이용하여 상기 저역 음성 신호의 에너지를 계산할 수 있다.
상기 저역 음성 신호의 에너지에 대한 정보는 저역 음성 패킷(108)에 포함되어 전송된다. 그러나 본 발명에 따라 협대역 음성 압축기(106)는 저역 음성 신호의 에너지 정보를 포함한 저역 음성 패킷(108)을 미 도시된 통신 채널로 전송함과 동시에 상기 저역 음성 신호의 에너지를 검출하여 고역 음성 압축기(107)로 제공한다. 이에 따라 라인(110)을 통해 저역 음성 신호의 에너지 정보가 협대역 음성 압축기(106)로부터 고역 음성 압축기(107)로 전송된다.
고역 음성 압축기(107)는 광대역 음성 신호(101)의 고역 음성 신호를 압축하여 고역 음성 패킷(109)을 얻는다. 상기 고역 음성 패킷(109)은 통신 채널(미 도시됨)로 전달된다.
이를 위하여 고역 음성 압축기(107)는 도 2에 도시 된 바와 같이 구성된다. 도 2를 참조하면, 본 발명에 따른 고역 음성 압축기(107)는 필터 뱅크(201), 대역 알엠에스(RMS(Root-Mean-Square), 이하 RMS 라고 약함) 값 계산기(203), 대역 순위 결정기(205), 대역 신호 양자화 모듈(207), 및 패킷화기(209)로 구성된다.
필터 뱅크(201)는 광대역 음성 신호(101)가 입력되면, 상기 광대역 음성 신호(101)을 다수의 대역으로 분해한다. 예를 들어, 중심 주파수 4000Hz, 4800Hz, 5800Hz, 7000Hz를 이용하여 상기 광대역 음성신호(101)를 4개의 대역 신호로 분해할 수 있다. 상기 필터 뱅크(201)는 기존의 감마톤(Gammatone) 필터 뱅크를 사용할 수 있다.
본 발명의 일 실시 예에 따라 필터 뱅크(201)는 30msec 프레임 단위로 동작하고, 라인(202)을 통해 출력되는 각 대역별 신호(202)는 480 샘플로 구성되고, 분해된 대역들은 대역 0부터 대역 3으로 정의할 수 있다.
대역 RMS 값 계산기(203)는 수신되는 각 대역별 신호(202)에 대해 독립적으로 RMS 값을 계산한다. 각 대역별 RMS 값은 라인(204)을 통해 대역 순위 결정기(205)로 제공된다.
대역 순위 결정기(205)는 각 대역의 RMS 값의 크기 순서에 따라 대역의 순위를 결정한다. 즉, 대역 순위 결정기(205)는 RMS 값의 크기 순서에 따라 대역의 중요도를 결정하고, 결정된 대역의 중요도 정보(206)를 출력한다.
대역 신호 양자화 모듈(207)은 각 대역별 신호(202)가 입력되면, 상기 각 대역별 신호(202)를 양자화 한다. 각 대역 신호(202)를 양자화 할 때, 대역 신호 양자화 모듈(207)은 대역 순위 결정기(205)로부터 출력되는 대역의 중요도 정보(206)와 협대역 음성 압축기(106)로부터 출력되는 저역 신호의 에너지 정보(110)를 사용한다. 필터 뱅크(201)가 30msec 프레임 단위로 동작되면, 상기 대역 신호 양자화 모듈(207)도 30msec 프레임 단위로 동작한다.
대역 신호 양자화 모듈(207)은 도 3에 도시된 바와 같이 구성된다. 도 3을 참조하면, 본 발명에 따른 대역 신호 양자화 모듈(207)은 제 1 DCT(Discrete Cosine Transform, 이하 DCT라고 약함) 연산기(301), 크기 추출기(303), 부호 추출기(304), 제 2 DCT 연산기(307), DC(Direct Current) 분리기(309), DC 양자화 모듈(311), RMS 값 계산기(314), RMS 값 양자화 모듈(316), 정규화기(318), DCT 계수 양자화기(320), 부호 양자화 모듈(322), 데이터 결합부(324)로 구성된다.
제 1 DCT 연산기(301)는 각 대역별 신호(202)에 대해 독립적으로 DCT 연산을 적용하여 각 대역별로 제 1 DCT 계수를 구한다. 즉, 상술한 도 2에서 언급한 실시 예와 같이 각 대역별 신호가 480 샘플로 구성되면, 제 1 DCT 연산기(301)는 각 대역별 신호에 대하여 480-포인트 DCT 연산을 실시하여 각 대역별로 제 1 DCT 계수를 구한다. 이 때, 각 대역별 신호(202)는 특정 대역에 한정된 신호이므로 제 1 DCT 연산기(301)로부터 출력되는 제 1 DCT 계수들(302)은 해당되는 주파수 대역의 DCT 계수로 한정된다.
도 2에서 설명한 바와 같이 필터뱅크(201)에서 상기 광대역 음성신호(101)를 4개의 대역으로 분할하면, 각 대역별로 제 1 DCT 연산기(301)로부터 출력되는 480개의 DCT 계수중에서 각 대역에 해당되는 제 1 DCT 계수의 시작 인덱스 및 끝 인덱스와 그에 따른 제 1 DCT 계수의 개수는 표 1과 같이 정의할 수 있다. 대역 i의 제 1 DCT 계수의 개수는 Ni로 표시한다.
[표 1]
각 대역별 제 1 DCT 계수(302)는 크기 추출기(303)와 부호 추출기(304)로 제공된다. 크기 추출기(303)는 입력되는 각 대역별 제 1 DCT 계수들의 크기를 구한다. 부호 추출기(304)는 입력되는 각 대역별 제 1 DCT 계수들의 부호를 구한다. DCT 계수들의 크기 및 부호를 구하는 방식은 기존에 알려진 방식을 사용한다. 크기 추출기(303)에서 출력되는 제 1 DCT 계수들의 크기 정보(305)는 제 2 DCT 연산기(307)로 전송된다. 부호 추출기(304)에서 출력되는 제 1 DCT 계수들의 부호 정보(306)는 부호 양자화 모듈(322)로 전송된다.
제 2 DCT 연산기(307)는 각 대역별로 제 2 DCT 계수(308)를 구한다. 각 대역별로 제 1 DCT 계수의 개수 Ni가 상이하므로 제 2 DCT 연산기(307)는 각 대역별 제 1 DCT계수의 개수 Ni에 맞추어 Ni-포인트 DCT 연산을 실시하여 각 대역별 제 2 DCT 계수들(308)을 구한다. 각 대역별 제 2 DCT 계수들(308)은 DC 분리기(309)로 출력된다.
DC 분리기(309)는 각 대역별 제 2 DCT 계수들(308)에 대해 DC 성분과 나머지 DCT 계수를 분리하고, 각 대역별 DC 성분은 제 2 DCT 계수의 DC 성분(310)으로서출력하고, 각 대역별 나머지 DCT 계수는 제 3 DCT 계수(313)로서 출력한다. DCT 계수에서 DC 성분은 인덱스 0 에 해당하는 DCT 계수이고, 제 2 DCT 계수의 나머지 인덱스 1부터 인덱스 Ni-1 의 계수가 제 3 DCT 계수가 된다. 따라서 각 대역별 제 3 DCT 계수의 개수는 Ni-1이 된다.
DC 양자화 모듈(311)은 제 2 DCT 계수의 DC성분(310)이 입력되면, 상기 제 2 DCT계수의 DC성분(310)을 양자화한다. DC 양자화 모듈(311)은 도 4에 도시된 바와 같이 구성된다. 도 4를 참조하면, DC 양자화 모듈(311)은 대역간 예측기(401), DC 양자화기(403), DC 역양자화기(404)로 구성된다.
대역간 예측기(401)는 각 대역의 DC 성분에 대하여 대역 사이의 예측 동작을 수행하여 DC 예측 오차(402)를 검출한다. 대역간 예측기(401)는 1차 AR(Auto-Regressive) 모델을 사용할 수 있다. 첫번째 대역에 대한 예측 동작은 라인(110)을 통해 입력되는 저역 신호의 양자화된 에너지 정보를 사용한다. 예를 들어 협대역 음성 압축기(106)로 G.729 협대역 음성 압축기를 사용할 경우, 30msec 동안 양자화된 고정 코드북 이득의 평균값이 상기 저역 신호의 양자화된 에너지 정보이므로, 상기 고정 코드북 이득의 평균값을 사용하여 첫번째 대역의 DC 예측 오차를 검출한다. 대역 i의 Log DC 값을 Di라 하고 DC 예측 오차를 Δi라 하고, 30msec 동안의 양자화된 고정 코드북 이득의 평균값을라 할 때, 첫번째 대역의 DC 예측 오차 Δ0는 수학식 1에 의해 구한다.
수학식 1에서 G 는 예측기의 계수이며, 본 발명에 따른 실시 예에서는 G=1.0을 사용할 수 있다.
나머지 대역의 DC 예측 오차 검출은 차례로 실시하다. 나머지 대역의 DC 예측 오차는 수학식2에 의해 검출한다.
수학식 2에서는 DC 역양자화기(404)에서 구한 대역 i의 양자화된 Log DC 값이다. G는 예측기의 계수이며, 수학식 1에서와 같이 G=1.0을 사용할 수 있다.
DC 양자화기(403)는 DC 예측 오차(402)가 입력되면, 상기 DC 예측 오차(402)를 양자화한다. DC 양자화기(403)는 DC 예측 오차(402)의 통계적 특성에 따라 각 대역별로 독립적인 스칼라 양자화를 수행하여 DC 양자화 인덱스(312)를 출력한다. DC 양자화기(403)로부터 출력되는 DC 양자화 인덱스(312)는 도 3의 데이터 결합부(324)와 도 4의 DC 역양자화기(404)로 입력된다.
DC 역양자화기(404)는 DC 양자화 인덱스(312)를 이용하여 대역간 DC 예측 과정에 필요한 양자화된 Log DC 값을검출한다. 양자화된 Log DC 값는 수학식 3에 의해 검출된다. 검출된 양자화된 Log DC 값(405)는 대역간 예측기(401)로 제공된다.
도 3의 RMS 값 계산기(314)는 제 3 DCT 계수(313)가 입력되면, 각 대역별로 제 3 DCT 계수의 RMS 값을 구한다. 각 대역별로 구한 제 3 DCT 계수의 RMS 값(315)은 RMS 값 양자화 모듈(316)로 제공된다.
RMS 값 양자화 모듈(316)은 도 5에 도시된 바와 같이 구성된다. 도 5를 참조하면, RMS 값 양자화 모듈(316)은 대역내 예측기(501), DC 역양자화기(504), RMS 값 양자화기(503)로 구성된다.
DC 역양자화기(504)는 도 4의 DC 역양자화기(404)와 동일한 동작을 수행한다. 따라서 DC 역양자화기(504)는 상기 대역별 DC 양자화 인덱스(312)가 입력되면, 입력되는 대역별 DC 양자화 인덱스(312)로부터 대역별 양자화된 Log DC 값(505)을 구한다. 이 때, 구해진 대역별 양자화된 Log DC값(505)은 도 4의 DC 역양자화기(404)로부터 출력되는 신호(405)와 동일한 값을 갖는다.
대역내 예측기(501)는 각 대역의 양자화된 Log DC 값(505)으로부터 각 대역내에서 RMS 값(315)을 예측하여 RMS 예측 오차(502)를 구한다. 검출된 RMS 예측 오차(502)는 RMS 값 양자화기(503)로 출력된다.
RMS 값 양자화기(503)는 입력되는 RMS 예측 오차(502)를 양자화하여 RMS 값 양자화 인덱스(317)를 출력된다. 대역내 예측기(501)는 수학식 4에 따라 1차 AR 모델 예측을 실시하여 RMS 예측 오차를 구한다.
수학식 4에서 Si는 대역 I의 Log RMS 값이고, G 는 예측기의 계수로서 본 발명에 따른 실시 예에서는 G=1.0을 사용한다.
RMS 값 양자화기(503)는 RMS 예측 오차(502)의 통계적 특성에 따라 각 대역별로 독립적인 스칼라 양자화를 실시하여 RMS 값 양자화 인덱스(317)를 출력한다.
도 3에 도시된 정규화기(318)는 제 3 DCT 계수(313)를 각 대역별 양자화된 RMS 값으로 정규화한다. 정규화기(318)는 상기 각 대역별 양자화된 RMS 값을 RMS 값 양자화 인덱스(317)로부터 구한다. 정규화기(318)는 각 대역별로 제 3 DCT 계수(313)를 상기 양자화된 RMS 값으로 나누어 정규화된 제 3 DCT 계수(319)를 검출하고 출력한다.
DCT 계수 양자화기(320)는 정규화된 제 3 DCT 계수(319)가 입력되며, 상기 정규화된 제 3 DCT 계수(319)를 벡터 양자화 하여 제 3 DCT 계수 양자화 인덱스(321)를 출력한다. 즉, DCT 계수 양자화기(320)는 각 대역별로 정규화된 제 3 DCT 계수(319)를 다수의 서브 벡터(Subvector)로 분리하고, 서브 벡터 단위로 벡터 양자화 하는 분할 벡터 양자화(Split Vector Quantization) 방법을 사용한다.
또한, DCT 계수 양자화기(320)는 입력되는 대역 순위 정보(206)에 따라 양자화의 세부 동작에 차이를 갖는다. 각 대역의 제 1 DCT 계수 크기(305)는 대역내에서 높은 상관관계를 갖는다. 상기 상관관계로 인하여 제 2 DCT 계수 및 제 3 DCT 계수에서의 에너지 집중(Compaction) 현상이 뚜렷이 나타난다. 그에 따라 제 3 DCT 계수의 에너지는 상위 인덱스에 해당하는 DCT 계수에 대부분 분포한다. 그러므로, 하위 인덱스에 해당하는 제 3 DCT 계수는 제거하여 전달하지 않아도 복원되는 음성 신호에 큰 오차를 발생시키지 않는다.
따라서 DCT 계수 양자화기(320)는 제 3 DCT 계수중 상위 인덱스의 제 3 DCT 계수만 양자화 한다. 각 대역의 제 3 DCT 계수 중에서 양자화 할 계수의 인덱스는 대역 순위(206)에 따라 결정된다. DCT 계수 양자화기(320)는 가장 순위가 낮은 대역은 매우 적은 수의 제 3 DCT 계수만 양자화하고, 순위가 높아짐에 따라 더 많은 제 3 DCT 계수를 양자화한다.
예를 들어 4개의 대역에 대한 양자화 하고, 양자화 할 제 3 DCT 계수를 3개의 서브 벡터로 분할할 때, 대역 순위 정보(206)에 따라 가장 순위가 낮은 대역은 상위 1 개의 서브 벡터만 양자화 하고, 두 번째로 순위가 낮은 대역은 상위 2 개의 서브 벡터만 양자화 하고, 나머지 두 개 대역은 3개의 서브 벡터를 모두 양자화 할 수 있다. 4개의 대역에 대한 제 3 DCT 계수의 전체 인덱스와 3개의 서브 벡터들의 인덱스는 표 2와 같이 정의될 수 있다. 표 2에서 알 수 있는 바와 같이 인덱스 29보다 하위에 해당하는 제 3 DCT 계수는 대역 순위에 관계없이 항상 제거되어 전달되지 않는다. 이는 각 대역에서 실제로 양자화되는 DCT 계수는 모두 30개이기 때문이다.
부호 양자화 모듈(322)은 제 1 DCT 계수들의 부호(306)가 입력되면, 상기 제 1DCT 계수들의 부호(306)를 양자화 하여 부호 양자화 인덱스(323)를 출력한다.
부호 양자화 모듈(322)은 도 6와 같이 구성된다. 도 6을 참조하면, 부호 양자화 모듈(322)은 DCT 계수 역양자화기(601), DC 역양자화기(603), 역 DCT 연산기(605), 크기 순 정렬기(607), 부호 양자화기(609)로 구성된다.
DCT 계수 역양자화기(601)는 제 3 DCT 계수 양자화 인덱스(321)에 대해 역양자화기 동작을 수행하여 양자화된 제 3 DCT 계수(602)를 구한다.
DC 역양자화기(603)는 제 2 DCT 계수의 DC 양자화 인덱스(312)에 대해 DC 역양자화 동작을 수행하여 양자화된 DC 값(604)을 구한다.
역 DCT 연산기(605)는 상기 양자화된 제 3 DCT 계수(602)와 제 2 DCT 계수의 양자화된 DC 값(604)을 이용하여 양자화된 제 2 DCT 계수를 구하고, 이 양자화된 제 2 DCT 계수를 이용하여 양자화된 제 1 DCT 계수 크기(606)를 구한다.
크기 순 정렬기(607)는 각 대역내에서 양자화된 제 1 DCT 계수 크기에 대한 순서 정보를 구한다.
부호 양자화기(609)는 크기 순 정렬기(607)로부터 제공되는 순서 정보를 토대로 제 1 DCT 계수들의 부호(306)중에서 큰 값을 가지는 제 1 DCT 계수의 부호만 양자화하고, 나머지 부호는 제거하여 전달하지 않는다. 따라서 부호 양자화기(609)는 제 1 DCT 계수의 크기를 토대로 미리 정해진 수 만큼의 선택된 제 1 DCT 계수 부호만 양자화하고, 1 비트로 양자화 한 부호 양자화 인덱스(323)를 출력한다. 이 때 양자화된 부호의 출력 순서는 제 1 DCT 계수 크기 순서와 동일하고, 이 순서에 의해 음성신호 복원 과정에서 부호의 재삽입이 정확하게 수행된다. 표 3은 본 발명에 따른 부호 양자화 범위 예이다.
표 3을 통해 알 수 있는 바와 같이 부호 양자화기(609)는 전체 계수중에서 크기가 큰 것에 해당하는 부호만 양자화한다. 예를 들어 표 3의 대역 0의 경우에, 전체 DCT 계수의 수는 44개이나 부호가 양자화되는 DCT 계수의 수는 30개이다. 이 때, 부호가 양자화 되는 DCT계수들은 44개의 DCT 계수중에서 크기가 큰 DCT 계수들이다
도 3의 데이터 결합부(324)는 제 2 DCT 계수 DC 양자화 인덱스(312), 제 3 DCT 계수 RMS 양자화 인덱스(317), 제 3 DCT 계수 양자화 인덱스(321), 제 1 DCT 계수 부호 양자화 인덱스(323)가 입력되면, 이들을 결합한 신호(208)를 출력한다.
도 2의 패킷화기(209)는 대역 순위 결정기(205)로부터 출력되는 대역 순위 정보(206)와 상기 데이터 결합부(324)로부터 출력되는 상기 결합된 신호(208)를 패킷화하여 고역 음성 패킷(109)으로서 출력한다.
각 대역별 대역신호가 480 샘플일 때, 본 발명에 따른 양자화 동작에 의하여 출력되는 각 양자화 인덱스에 할당된 비트 수는 표 4와 같이 정의될 수 있다. 이와 같이 양자화 인덱스에 할당된 비트 수가 정의될 경우에, 고역 음성 신호는 8k의 전송율을 갖는다.
도 7은 본 발명에 따른 광대역 음성 신호 복원장치의 기능 블록도이다. 도 7을 참조하면, 본 발명에 따른 광대역 음성 신호 복원장치는 협대역 음성 복원기(702), 제 2 대역 변환 유니트(704), 고역 음성 복원기(707) 및 가산기(709)로 구성된다.
협대역 음성 복원기(702)는 도 1의 협대역 음성 압축기(106)의 동작에 의하여 정의된다. 협대역 음성 복원기(702)는 라인(701)을 통해 저역 음성 패킷이 입력되면, 협대역 저역 음성 복원신호(703)를 출력한다.
제 2 대역 변환 유니트(704)는 협대역 저역 음성 복원신호(703)를 광대역 저역 복원신호(705)로 변환한다. 제 2 대역 변환 유니트(704)는 업 샘플러(710)와 저역 통과 필터(711)로 구성된다.
업 샘플러(710)는 라인(703)을 통해 협대역 저역 음성 복원 신호가 입력되면, 각 샘플 사이에 제로(zero) 샘플을 삽입하는 과정으로 업 샘플링 한다. 저역 통과 필터(711)는 도 1의 저역 통과 필터(104)와 동일하게 동작한다.
고역 음성 복원기(707)는 라인(706)을 통해 고역 음성 패킷이 수신되면, 협대역 음성 복원기(702)로부터 제공되는 저역 복원 신호의 에너지 정보(703)를 활용하여 고역 음성 복원 신호(708)를 구한다. 고역 음성 복원기(707)는 도 2의 고역 음성 압축기(107)에 의하여 정의된다.
따라서, 고역 음성 복원기(707)는 도 8에 도시된 바와 같이 구성될 수 있다. 도 8을 참조하면, 고역 음성 복원기(707)는 역 패킷화기(801), 부호 역양자화기(806), DC 역양자화기(808), DCT 계수 역양자화기(810), RMS 값 역양자화기(812), 승산기(814), 역 DCT 연산기(816), 크기 순 정렬기(818), 부호 삽입기(820), 부호 예측 모듈(822), 역 DCT 연산기(824), 필터 뱅크(826), 가산기(828), 및 프레임 지연기(829) 등으로 구성될 수 있다.
역패킷화기(801)는 고역 음성 패킷(706)이 입력되면, 각 모듈별로 양자화된 인덱스를 분해하여 출력한다.
부호 역양자화기(806)는 역패킷화기(801)로부터 전송되는 부호 양자화 인덱스(802)를 역양자화하여 제 1 DCT 계수 부호(807)를 출력한다.
DC 역양자화기(808)는 역 패킷화기(801)로부터 전송되는 DC 양자화 인덱스(803)와 입력되는 저역 신호의 에너지 정보(703)로부터 제 2 DCT 계수의 양자화된 DC 값(809)을 출력한다. DC 역양자화기(808)는 도 4의 DC 역양자화기(404)와 동일하게 동작한다.
DCT 계수 역양자화기(810)는 역 패킷화기(801)로부터 제공되는 DCT 계수 양자화 인덱스(804)와 대역 순위 정보(830)로부터 정규화되고 양자화된 제 3 DCT 계수(811)를 출력하며, 도 6의 DCT 계수 역양자화기(601)와 동일하게 동작한다.
RMS 값 역양자화기(812)는 역 패킷화기(801)로부터 제공되는 RMS 양자화 인덱스(805)와 DC 역양자화기(808)로부터 제공되는 제 2 DCT 계수의 양자화된 DC 값(809)으로부터 양자화된 제 3 DCT 계수의 RMS 값(813)을 출력한다. RMS 값 역양자화기(812)는 도 3의 RMS 값 양자화 모듈(316)의 역과정을 수행한다. 따라서 RMS 값 역양자화기(812)에서의 역양자화 과정은 수학식 5와 같이 정의할 수 있다.
승산기(814)는 정규화되고 양자화된 제 3 DCT 계수(811)와 양자화된 제 3 DCT RMS 값(813)을 곱하여 양자화된 제 3 DCT 계수(815)를 구한다.
역 DCT 연산기(816)는 상기 양자화된 제 3 DCT 계수(815)와 제 2 DCT 계수의 양자화된 DC 값(809)을 결합하여 양자화된 제 1 DCT 계수 크기(817)를 출력한다. 역 DCT 연산기(816)는 도 6의 역 DCT 연산기(605)와 동일하게 동작한다.
상술한 DC 역양자화기(808), RMS 값 역양자화기(812), DCT 계수 역양자화기(810), 승산기(814), 역 DCT 연산기(816)는 대역 순위 정보, 제 3 DCT 양자화 인덱스, 제 2 DCT 계수의 DC 양자화 인덱스, 및 제 3 DCT 계수의 RMS 양자화 인덱스를 각각 역양자화하여 양자화된 DCT를 구하고, 상기 양자화된 DCT로부터 양자화된 제 1 DCT 계수 크기를 구하는 역 DCT 연산 모듈로 정의할 수 있다.
크기 순 정렬기(818)는 양자화된 제 1 DCT 계수 크기(817)가 입력되면, 양자화된 제 1 DCT 계수 크기의 크기 순서 정보(819)를 구한다.
부호 삽입기(820)는 크기 순 정렬기(818)로부터 제공되는 순서 정보(819)를 이용하여 제 1 DCT 계수 부호(807)를 크기가 큰 제 1 DCT 계수 순으로 차례로 삽입한다.
부호 예측 모듈(822)은 부호 삽입기(820)에서 부호를 할당받지 못한 크기가 작은 제 1 DCT 계수 크기의 부호를 예측한다. 이를 위하여 부호 예측 모듈(822)은 도 9와 같이 구성된다. 도 9를 참조하면, 부호 예측 모듈(822)은 제 1 시간축 변환기(901), 제 2 시간축 변환기(901'), 신호 예측기(904), 및 부호 선택기(906)로 구성된다.
제 1 시간축 변환기(901)는 라인(819)을 통해 입력되는 제 1 DCT 계수 크기에 각 DCT 계수 인덱스별로 양(+)의 부호를 삽입하고, 역 DCT 연산을 통하여 양(+)의 부호에 의한 시간축 정보(902)를 출력한다.
제 2 시간축 변환기(901')는 라인(819)을 통해 입력되는 제 1 DCT 계수 크기에 각 DCT 계수 인덱스별로 음(-)의 부호를 삽입하고, 역 DCT 연산을 통하여 음(-)의 부호에 의한 시간축 정보(903)를 출력한다.
본 발명에 따른 실시 예에서는 시간축 변환기(901, 901')에서 각 부호에 의한 시간축 신호의 첫 샘플값을 출력하며, 수학식 6으로 정의되는 시간축 신호에서 시간 인덱스 n=0 을 대입한 값을 출력한다. 수학식 6에서 L은 샘플 포인트이다. 따라서, 상술한 제 1 DCT 연산기(301)에서 설명한 바와 같이 480-포인트 DCT 연산을 실시하는 경우에, L은 480으로 설정될 수 있다.
수학식 6에서는 현재 프레임 m에서 제 1 DCT 계수 인덱스 k에 대한 시간 인덱스 n에서의 샘플값(902, 903)을 각각 나타내고,는 양자화된 제 1 DCT 계수 크기를 나타낸다.
본 발명에 따른 또 다른 실시 예에서는 제 1 및 제 2 시간축 변환기(901, 901')에서 각 부호에 의한 시간축 신호의 첫 샘플값에서의 기울기를 출력하며, 상기 수학식 6으로 정의되는 시간축 신호를 n에 대하여 미분하여 시간 인덱스 n=0을 대입한 값을 출력한다.
신호 예측기(904)는 프레임 지연기(829)로부터 제공되는 한 프레임 전의 양자화된 제 1 DCT 계수(830)로부터 각 계수 인덱스별로 현재 프레임의 신호에 대한 시간축 예측 정보(905)를 출력한다.
부호 선택기(906)는 제 1 DCT 계수 인덱스별로 예측된 시간축 예측정보(905)와 각 부호에 의하여 실제로 계산된 시간축 정보(902, 903)를 비교하여 예측 정보에 가까운 값을 가지는 부호를 제 1 DCT 계수의 최종 부호(823)로 정한다.
본 발명에 따른 실시 예에서는 신호 예측기(904)는 각 DCT 계수 인덱스별로 한 프레임 전의 양자화된 제 1 DCT 계수를 사용하여 현재 프레임의 시간축 신호를 예측하고, 수학식 7에 따라 구하여진 신호에서 시간축 인덱스 n=0을 대입한 값을 출력한다.
수학식 7에서는 DCT 계수 인덱스 k에 대한 시간축 예측 정보(905)이고,는 이전 프레임 m-1에서 구한 시간 인덱스 n+L에 해당하는 샘플값을 의미한다. 한 프레임의 시간 인덱스가 0부터 L-1까지이므로,값이 이전 프레임에서 구한 현 프레임의 샘플값이 된다.
본 발명에 따른 또 다른 실시 예에서 신호 예측기(904)는 각 DCT 계수 인덱스별로 한 프레임 전의 양자화된 제 1 DCT 계수를 사용하여 현재 프레임의 시간축 신호를 예측하여 시간축 인덱스 n=0에서의 기울기를 출력한다. 즉, 수학식 7에 구해진 신호를 n에 대하여 미분하고, n=0을 대입한 값을 출력한다.
역 DCT 연산기(824)는 양자화된 제 1 DCT 계수 크기와 부호(821, 823)가 입력되면, 이를 이용하여 각 대역별로 양자화된 시간 영역의 신호(825)를 출력한다.각 대역별로 양자화된 시간 영역의 신호(825)는 필터 뱅크(826)로 입력된다.
필터 뱅크(826)는 도 2에 도시된 필터 뱅크(201)에 의해 정의된다. 따라서, 필터 뱅크(826)에서 각 대역은 필터 뱅크(201)에 정의된 중심주파수와 동일한 중심주파수에 의해 정의된다. 필터 뱅크(826)는 각 대역별 양자화된 시간 영역의 신호(825)를 이용하여 각 대역별 최종 음성신호(827)를 얻는다. 가산기(828)는 필터 뱅크(826)를 통해 전송되는 각 대역별 음성 신호(827)를 가산하여 최종 복원된 고역 음성신호(708)를 얻는다.
상기 필터 뱅크(826)와 가산기(828)는 역 DCT 연산기(824)로부터 출력되는 각 대역별 양자화된 시간 영역의 신호를 이용하여 각 대역별 음성 신호를 얻고, 상기 각 대역별 음성신호를 이용하여 고역 음성신호를 복원하는 복원 처리부로 정의할 수 있다.
프레임 지연기(829)는 부호 삽입기(820)와 부호 예측 모듈(822)로부터 출력되는 제 1 DCT 계수 크기와 부호(821, 823)가 입력되면, 입력되는 제 1 DCT 계수 크기와 부호(821, 823)를 이용하여 1 프레임 지연된 양자화된 제 1 DCT 계수(830)를 부호화 모듈(822)로 제공한다. 따라서, 라인(830)을 통해 프레임 지연기(829)로부터 출력되는 신호는 한 프레임 이전의 고역 신호 정보(DCT 계수)이다.
가산기(709)는 광대역 저역 복원 신호(705)와 최종 복원된 고역 음성신호(708)를 가산하여 광대역 복원신호(712)를 출력한다.
본 발명에 따른 광대역 음성 신호의 저역 음성 신호에 대한 압축은 도 1에서 설명한 바와 같이 상기 광대역 음성 신호를 협대역 저역 음성 신호로 변환하고, 상기 저역 음성 신호를 압축한다. 압축된 저역 음성신호는 저역 음성 패킷으로서 전송된다. 이 때, 압축된 저역 음성 신호는 도 1에서 설명한 바와 같이 저역 신호의 에너지 정보를 포함한다.
도 10은 본 발명에 따른 광 대역 음성 신호 압축 방법에 있어서 고역 음성신호 압축 과정에 대한 동작 흐름도이다.
광대역 음성 신호가 입력되면, 제 1001 단계에서 상기 광대역 음성 신호를 필터 뱅크(201)를 이용하여 도 2에서와 같이 다수의 주파수 대역으로 분해한다.
제 1002 단계에서 각 대역별로 도 2의 대역 RMS 값 계산기(203)에서와 같이 RMS 값을 계산하여 분해된 주파수 대역의 순위를 정하고, 대역별 순위에 따라 각 대역의 양자화 방법을 결정한다.
제 1003 단계에서 도 2의 대역 신호 양자화 모듈(207)에서와 같이 대역 순위 정보와 상기 저역 신호의 에너지 정보를 이용하여 각 대역별 신호를 DCT 하여 제 1 DCT 계수를 구하고, 도 3에서와 같이 DCT 크기와 부호를 나누어 각각 독립적으로 추출하고, 양자화 하도록 준비한다.
제 1004 단계에서 도 3에서와 같이 제 1 DCT 계수 크기를 다시 DCT 하여 제 2 DCT 계수를 구하고, 상기 제 2 DCT 계수를 DC 성분과 제 3 DCT 계수로 분리한다.
제 1005 단계에서는 도 3에서와 같이 제 2 DCT 계수의 DC 값과 제 3 DCT 계수를 각각 독립적으로 양자화 한다. 이때, 도 4에서와 같이 대역간 예측 양자화 방법으로 DC 값을 양자화하고, 도 5에서와 같이 양자화된 DC 값을 이용한 대역 내 예측 양자화 방법으로 제 3 DCT 계수의 RMS 값을 양자화 한다.
제 1006 단계에서 도 6에서와 같이 제 1 DCT 계수 부호를 양자화하여 전송한다. 이 때, 양자화된 제 1 DCT 계수의 크기 순서 정보를 활용하여 크기가 큰 DCT 계수에 해당하는 부호만 전송한다.
계층적인 대역폭 구조로 압축된 저역 음성 패킷과 고역 음성 패킷이 수신되면, 본 발명에 따른 광대역 음성 신호 복원 방법은 도 7를 통해 알 수 있는 바와 같이 저역 음성 패킷을 저역 음성 신호로 복원하고, 저역 음성 신호 복원 시 구한 저역 복원 신호의 에너지 정보를 이용하여 고역 음성 패킷을 고역 음성 신호로 복원한다.
도 11은 본 발명에 따른 광대역 음성 복원 방법에 있어서 고역 음성 복원 과정의 동작 흐름도이다.
통신 채널(미 도시됨)을 통해 고역 음성 패킷이 수신되면, 제 1101 단계에서 수신된 고역 음성 패킷을 각 모듈별로 역양자화 하고, 양자화된 제 1 DCT 계수 크기를 구한다.
제 1102 단계에서 수신된 제 1 DCT 계수 부호를 도 8에서 설명한 바와 같이 양자화된 제 1 DCT 계수 크기의 크기 순서 정보에 따라 해당되는 DCT 계수에 삽입한다.
제 1103 단계에서는 수신되지 않은 제 1 DCT 계수 부호를 도 8의 부호 예측 모듈(822)과 같이 예측하고, 예측된 부호를 해당되는 양자화된 제 1 DCT 계수에 삽입한다.
제 1104 단계에서는 양자화된 제 1 DCT 계수에 대한 역 DCT 연산에 따라 대역별 시간 영역 신호를 구하고, 도 8의 필터 뱅크(826)를 이용하여 최종 복원된 고역 음성 신호를 출력한다.
한편, 도 11과 같은 방식으로 복원된 고역 음성신호는 도 7에서 설명한 바와 같은 방식으로 복원된 저역 음성 신호와 결합되어 광대역 복원 신호를 생성한다.
상술한 본 발명에 따르면, 기존의 표준 협대역 음성 압축기와 호환이 가능한 계층적인 대역폭 구조를 갖는 광대역 음성 신호 압축 및 복원 장치를 제공할 수 있다.
그리고 본 발명은 고역 음성 신호의 압축 과정에서 저역 음성 신호 압축으로 검출된 저역 신호의 에너지를 활용하고 대역 사이 및 대역내의 상관관계를 이용함으로써, 양자화 효율을 향상시킬 수 있다.
또한, 본 발명은 DCT 계수를 크기와 부호로 나누어 양자화 하고, 부호의 양자화를 계수의 크기에 따라 선별적으로 실시하고, 일부 부호에 대한 정보를 전달하지 않고도 복원 시 전송되지 않은 부호에 대한 예측이 가능함으로써, 효율적인 양자화 및 예측 기술을 향상시킨 광대역 음성 신호 압축 및 복원 장치를 제공할 수 있다.

Claims (48)

  1. 광대역 음성 신호 압축 장치에 있어서,
    상기 광대역 음성 신호의 저역 음성 신호를 압축하고, 상기 압축된 저역 음성 신호를 저역 음성 패킷으로서 출력하는 협대역 음성 압축기;
    상기 협대역 음성 압축기로부터 제공되는 저역 신호의 에너지를 이용하여 상기 광대역 음성 신호의 고역 음성 신호를 압축하고, 압축된 고역 음성 신호를 고역 음성 패킷으로서 출력하는 고역 음성 압축 유니트를 포함하는 광대역 음성 신호 압축 장치.
  2. 제 1 항에 있어서, 상기 협대역 음성 압축기가 켈프(CELP) 계열의 압축기이면, 상기 저역 신호의 에너지는 상기 협대역 음성 압축기에서 상기 고역 음성 압축 유니트의 프레임에 해당하는 양자화된 고정 코드북 이득인 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  3. 제 1 항에 있어서, 상기 협대역 음성 압축기가 켈프(CELP) 계열의 압축기이면, 상기 저역 신호의 에너지는 상기 협대역 음성 압축기에서 상기 고역 음성 압축 유니트의 프레임에 해당하는 양자화된 고정 코드북 이득의 평균값인 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  4. 제 1 항에 있어서, 상기 고역 음성 압축기는,
    상기 광대역 음성 신호의 고역 음성신호를 복수개의 대역으로 분해하는 필터 뱅크;
    상기 필터 뱅크에서 출력되는 각 대역 신호에 대해 독립적인 알엠에스(RMS)값을 구하는 대역 RMS 값 계산기;
    상기 대역 RMS 값 계산기에서 계산된 RMS 값을 토대로 상기 필터 뱅크에서 분해된 대역의 순위를 정하는 대역 순위 결정기;
    상기 대역 순위 결정기에서 결정된 대역 순위 정보와 상기 저역 신호의 에너지를 이용하여 상기 필터 뱅크에서 분해된 각 대역의 신호를 양자화하여 대역별 양자화 인덱스를 출력하는 대역 신호 양자화 모듈;
    상기 대역 순위 정보와 상기 대역 신호 양자화 모듈에서 출력되는 대역별 양자화 인덱스를 패킷화하고, 상기 패킷화된 정보를 상기 고역 음성 패킷으로서 출력하는 패킷화기를 포함하는 광대역 음성 신호 압축장치.
  5. 제 4 항에 있어서, 상기 대역 순위 결정기는 상기 RMS 값의 크기 순서에 따라 상기 대역의 순위를 결정하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  6. 제 4 항에 있어서, 상기 대역 순위 결정기는 상기 RMS 값이 큰 대역일수록 중요한 대역으로 순위를 결정하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  7. 제 4 항에 있어서, 상기 대역 신호 양자화 모듈은,
    상기 필터 뱅크로부터 제공되는 각 대역의 신호에 대해 이산여현변환(DCT)을 수행하여 제 1 DCT 계수를 구하는 제 1 DCT 연산기;
    상기 제 1 DCT 계수의 크기를 구하는 크기 추출기;
    상기 제 1 DCT 계수의 부호를 구하는 부호 추출기;
    상기 크기 추출기에서 출력된 제 1 DCT 계수 크기에 대하여 DCT를 수행하여 제 2 DCT 계수를 구하는 제 2 DCT 연산기;
    상기 제 2 DCT 연산기에서 출력되는 제 2 DCT 계수에서 디씨(DC) 성분과 상기 DC 성분을 제외한 DCT계수를 분리하고, 상기 DC성분을 제외한 DCT계수를 제 3 DCT 계수로서 출력하는 DC분리기;
    상기 DC분리기에서 출력되는 상기 DC 성분을 양자화하는 DC 양자화 모듈;
    상기 제 3 DCT 계수의 RMS 값을 구하는 RMS 값 계산기;
    상기 RMS 값 계산기에서 구한 RMS 값을 양자화 하는 RMS 값 양자화 모듈;
    상기 RMS 값 양자화 모듈에서 출력되는 RMS값 양자화 인덱스를 이용하여 검출된 양자화된 RMS 값을 이용하여 상기 제 3 DCT 계수를 정규화하는 정규화기;
    상기 정규화된 제 3 DCT 계수를 양자화하는 DCT 계수 양자화기;
    상기 부호 추출기에서 추출된 부호를 양자화하는 부호 양자화 모듈을 포함하는 광대역 음성 신호 압축 장치.
  8. 제 7 항에 있어서, 상기 DC 양자화 모듈은 상기 저역 신호 에너지 정보와 상기 각 대역의 DC 성분을 이용한 대역간 예측으로 상기 DC 성분을 양자화하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  9. 제 7 항에 있어서, 상기 DC 양자화 모듈은,
    상기 저역 신호 에너지 정보와 상기 각 대역의 DC 값을 이용하여 대역간을 예측 하는 대역간 예측기;
    상기 대역간 예측기에서 출력되는 각 대역의 DC 예측 오차를 양자화 하여 DC 양자화 인덱스를 출력하는 DC 양자화기;
    상기 DC 양자화기에서 출력되는 상기 DC 양자화 인덱스로부터 대역별 양자화 된 DC 예측 오차를 구하고, 상기 DC 예측 오차로부터 대역별 양자화된 DC 값을 구하는 DC 역양자화기를 포함하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  10. 제 9 항에 있어서, 상기 대역간 예측기는 하기 식에 따라 대역간 DC 예측 오차를 구하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
    (상기 식에서 Di는 i번째 고역 음성 대역의 Log DC값이고,는 i번째 고역 음성 대역의 양자화된 Log DC값이고,는 저역 신호의 Log 에너지이고, G는 예측기의 계수이고,는 i번째 고역 음성 대역의 DC 예측 오차이다.)
  11. 제 9 항에 있어서, 상기 DC 양자화 모듈은 상기 DC 예측 오차를 독립적으로 스칼라 양자화 하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  12. 제 7 항에 있어서, 상기 RMS 값 양자화 모듈은 상기 제 3 DCT 계수의 RMS 값과 상기 제 2 DCT 계수의 양자화된 DC 값을 이용한 대역내에서의 예측으로 상기 제 3 DCT 계수의 RMS 값을 양자화 하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  13. 제 7 항에 있어서 상기 RMS 값 양자화 모듈은,
    상기 제 3 DCT 계수의 RMS 값과 상기 제 2 DCT 계수의 양자화된 DC 값을 이용하여 대역내에서 예측 동작을 수행하는 대역내 예측기;
    상기 대역내 예측기에서 출력되는 RMS 예측 오차를 양자화 하는 RMS 양자화기를 포함하는 광대역 음성 신호 압축 장치.
  14. 제 13 항에 있어서, 상기 대역내 예측기는 하기 식에 따라 대역내 RMS 예측 오차를 구하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
    (상기 식에서 si는 i번째 고역 음성 대역에 해당하는 제 3 DCT 계수의 Log RMS 값,는 i번째 고역 음성 대역에 해당하는 제 2 DCT 계수의 양자화된 Log DC 값, G 는 예측기 계수이고,는 i번째 고역 음성 대역에 해당하는 대역내 RMS 예측 오차값이다. )
  15. 제 7 항에 있어서, 상기 DCT 계수 양자화기는 각 대역의 제 3 DCT 계수중에서 일부 DCT 계수만을 양자화하고 나머지 계수는 제거하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  16. 제 15 항에 있어서, 상기 DCT 계수 양자화기는 상기 대역 순위 정보에 따라 중요한 대역에서는 상기 제 3 DCT 계수를 적게 제거하고, 중요하지 않은 대역에서는 상기 제 3 DCT 계수를 많이 제거하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  17. 제 7 항에 있어서, 상기 DCT 계수 양자화기는 상기 대역 순위 정보에 따라 각 대역에서 양자화 할 DCT 계수의 범위에 해당하는 인덱스를 결정하고, 결정된 인덱스를 참조하여 각 대역별로 제 3 DCT 계수를 양자화하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  18. 제 7 항에 있어서, 상기 DCT 계수 양자화기는 상기 대역 순위 정보에 따라 각 대역에서 양자화 할 DCT 계수의 범위에 해당하는 인덱스를 결정하고, 상기 결정된 DCT 계수의 인덱스보다 하위의 인덱스에 해당하는 제 3 DCT 계수를 제거하고, 상기 결정된 DCT 계수 인덱스보다 상위의 인덱스에 해당되는 나머지 제 3 DCT 계수만을 양자화 하는 광대역 음성 신호 압축 장치.
  19. 제 7 항에 있어서, 상기 DCT 계수 양자화기는 각 대역에서 양자화 할 제 3 DCT 계수를 다수의 서브 벡터(subvector)로 분할하고 상기 대역 순위정보에 따라 전체 서브 벡터중에서 양자화할 서브 벡터와 제거할 서브 벡터를 선택하는 선택적 분할 벡터 양자화 방식에 따라 양자화하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  20. 제 7 항에 있어서, 상기 부호 양자화 모듈은, 상기 제 3 DCT 계수의 양자화 인덱스와 상기 제 2 DCT 계수의 DC 양자화 인덱스를 이용하여 상기 양자화된 제 1 DCT 계수의 크기 순서 정보를 검출하고, 상기 제 1 DCT 계수의 크기 순서 정보에 따라 상기 제 1 DCT 계수 부호를 양자화 하는 광대역 음성 신호 압축 장치.
  21. 제 20 항에 있어서, 상기 부호 양자화 모듈은 상기 제 1 DCT 계수의 크기 순서 정보를 이용하여 양자화할 제 1 DCT 계수 부호와 제거할 제 1 DCT 계수 부호를 구분하여 제 1 DCT 계수의 부호를 양자화 하는 광대역 음성 신호 압축 장치.
  22. 제 21 항에 있어서, 상기 양자화할 제 1 DCT 계수 부호는 최대 크기의 제 1 DCT 계수부터 작은 순서로 미리 정해진 수만큼의 제 1 DCT 계수의 부호를 포함하는 것을 특징으로 하는 광대역 음성 신호 압축 장치.
  23. 제 7 항에 있어서, 상기 부호 양자화 모듈은,
    상기 제 3 DCT 계수의 양자화 인덱스로부터 양자화된 제 3 DCT 계수를 구하는 DCT 계수 역양자화기;
    상기 제 2 DCT 계수의 DC 양자화 인덱스로부터 제 2 DCT 계수의 양자화된 DC 값을 구하는 DC 역양자화기;
    상기 양자화된 제 3 DCT 계수와 제 2 DCT 계수의 양자화된 DC 값을 DCT 역변환하는 역 DCT 연산기;
    상기 역 DCT 연산기에서 출력되는 양자화된 제 1 DCT 계수의 크기를 크기 순으로 정렬하는 크기 순 정렬기;
    상기 크기 순 정렬기에서 출력되는 양자화된 제 1 DCT 계수의 크기 순서 정보에 따라 상기 제 1 DCT 계수 부호를 양자화 하는 부호 양자화기를 포함하는 광대역 음성 신호 압축 장치.
  24. 제 23 항에 있어서, 상기 부호 양자화기는 상기 크기 순 정렬기에서 출력되는 양자화된 제 1 DCT 계수의 크기 순서 정보를 이용하여, 최대 크기의 제 1 DCT 계수부터 크기가 작은 순서로 미리 정해진 수 만큼의 제 1 DCT 계수에 해당하는 계수 부호는 양자화 하고, 나머지 크기가 작은 제 1 DCT 계수에 해당하는 계수 부호는 제거하여 전달하지 않는 것을 특징을 하는 광대역 음성 신호 압축 장치.
  25. 제 1 항에 있어서, 상기 광대역 음성 신호 압축 장치는,
    상기 광대역 음성 신호를 협대역 저역 음성신호로 변환하여 상기 협대역 음성 압축기로 제공하는 제 1 대역 변환 유니트를 더 포함하는 광대역 음성 신호 압축 장치.
  26. 계층적인 대역폭 구조로 압축되어 저역 음성 패킷과 고역 음성 패킷으로 구분되어 전송되는 광대역 음성 신호를 복원하는 장치에 있어서,
    상기 압축된 저역 음성 패킷을 저역 음성 신호로 복원하는 협대역 음성 복원기;
    상기 협대역 음성 복원기에서 제공되는 저역 복원 신호의 에너지 정보를 이용하여 상기 압축된 고역 음성 패킷을 고역 음성신호로 복원하는 고역 음성 복원기;
    상기 협대역 음성 복원기에서 출력되는 저역 음성 신호와 상기 고역 음성 복원기에서 출력되는 고역 음성 신호를 가산하여 광대역 복원 신호를 출력하는 가산기를 포함하는 광대역 음성 신호 복원 장치.
  27. 제 26 항에 있어서, 상기 고역 음성 복원기는,
    상기 고역 음성 패킷을 모듈별로 분해하는 역 패킷화기;
    상기 역 패킷화기로부터 출력되는 부호를 역양자화하는 부호 역양자화기;
    상기 역 패킷화기로부터 출력되는 대역 순위 정보, 제 3 DCT 양자화 인덱스, 제 2 DCT 계수의 DC 양자화 인덱스, 및 제 3 DCT 계수의 RMS 양자화 인덱스를 각각역양자화하여 양자화된 DCT를 구하고, 상기 양자화된 DCT로부터 양자화된 제 1 DCT 계수 크기를 구하는 역 DCT 연산 모듈;
    상기 역 DCT 연산 모듈로부터 출력되는 양자화된 제 1 DCT 계수 크기를 크기 순으로 정렬하여 상기 양자화된 제 1 DCT 계수의 크기 순서 정보를 출력하는 크기 순 정렬기;
    상기 제 1 DCT 계수의 크기 순서 정보를 토대로 제 1 DCT 계수 크기에 상기 고역 음성 패킷으로부터 구한 제 1 DCT 계수의 부호를 삽입하는 부호 삽입기;
    상기 크기 순 정렬기로부터 제공되는 제 1 DCT 계수 크기 순서 정보를 토대로 제 1 DCT 계수 크기의 부호 정보 중에서 전달되지 않은 부호를 예측하여 해당되는 제 1 DCT 계수 크기에 삽입하는 부호 예측 모듈;
    상기 부호 삽입기 및 부호 예측 모듈로부터 출력되는 부호가 삽입된 제 1 DCT 계수를 각 대역별로 양자화된 시간 영역 신호로 변환하여 출력하는 역 DCT 연산기;
    상기 역 DCT 연산기로부터 출력되는 각 대역별 양자화된 시간 영역의 신호를 이용하여 각 대역별 음성 신호를 얻고, 상기 각 대역별 음성신호를 이용하여 고역 음성신호를 복원하는 복원 처리부를 포함하는 광대역 음성 신호 복원 장치.
  28. 제 27 항에 있어서, 상기 부호 삽입기는 상기 양자화된 제 1 DCT 계수의 크기 순서 정보를 이용하여, 최대 크기의 양자화된 제 1 DCT 계수부터 시작하여 크기가 작아지는 차례로 미리 정해진 수 만큼의 상기 제 1 DCT 계수 부호를 양자화된제 1 DCT 계수에 삽입하는 것을 특징을 하는 광대역 음성 신호 복원 장치.
  29. 제 27 항에 있어서, 상기 부호 예측 모듈은 상기 부호 삽입기의 동작에 의하여 부호가 할당되지 않은 제 1 DCT 계수에 대하여 부호를 예측하고, 예측된 부호를 해당되는 제 1 DCT 계수에 삽입하는 것을 특징으로 하는 광대역 음성 신호 복원 장치.
  30. 제 27 항에 있어서, 상기 부호 예측 모듈은,
    상기 부호가 전달되지 않은 제 1 DCT 계수의 각 인덱스별로 양의 부호와 음의 부호를 각각 삽입하고 역 DCT 연산을 통하여 각 계수 인덱스에 대하여 각 부호별로 시간축 정보를 출력하는 복수개의 시간축 변환기;
    상기 부호가 전달되지 않은 제 1 DCT 계수의 각 인덱스에 대하여 한 프레임 이전의 고역 신호 정보를 이용하여 각 DCT 계수 인덱스별로 현재 프레임의 시간축 예측정보를 출력하는 신호 예측기; 및
    각 DCT 계수 인덱스별로 상기 양의 부호와 음의 부호를 사용하여 구하여진 시간축 정보와 상기 시간축 예측정보를 비교하여 각 DCT 계수 인덱스에 대한 최종 부호를 결정하는 부호 선택기를 포함하는 것을 특징을 하는 광대역 음성 신호 복원 장치.
  31. 제 30 항에 있어서, 상기 복수개의 시간축 변환기는 하기 식에 따라 각 부호별로 시간축 신호를 구하고, n=0을 대입한 값을 출력하는 광대역 음성 신호 복원 장치.
    (여기서는 현재 프레임 m에서 제 1 DCT 계수 인덱스 k에 대한 시간 인덱스 n에서의 샘플값을 각각 나타내고,는 양자화된 제 1 DCT 계수 크기이다.)
  32. 제 30 항에 있어서, 상기 복수개의 시간축 변환기는 하기 식을 n에 대하여 미분하고 n=0을 대입하여 n=0에서의 기울기를 출력하는 광대역 음성 신호 복원 장치.
    (여기서는 현재 프레임 m에서 제 1 DCT 계수 인덱스 k에 대한 시간 인덱스 n에서의 샘플값을 각각 나타내고,는 양자화된 제 1 DCT 계수 크기이다. )
  33. 제 30 항에 있어서, 상기 신호 예측기는 하기 식에 따라 각 DCT 계수별로 한프레임 전의 DCT 계수로부터 현재 프레임의 시간 축 신호를 예측하고, n=0을 대입한 예측 정보를 출력하는 광대역 음성 신호 복원 장치.
    (여기서는 DCT 계수 인덱스 k에 대한 시간축 예측 신호이고,는 이전 프레임 m-1에서 구한 시간 인덱스 n+L에 해당하는 신호이고,는 한 프레임 이전의 양자화된 제 1 DCT 계수이다.)
  34. 제 30 항에 있어서, 상기 신호 예측기는 하기 식을 n에 대하여 미분하고 n=0을 대입하여 n=0에서의 예측 기울기를 출력하는 것을 특징으로 하는 광대역 음성 신호 복원 장치.
    (여기서는 DCT 계수 인덱스 k에 대한 시간축 예측 신호이고,는 이전 프레임 m-1에서 구한 시간 인덱스 n+L에 해당하는 신호이고,는 한 프레임 이전의 양자화된 제 1 DCT 계수이다.)
  35. 제 30 항에 있어서, 상기 부호 선택기는 상기 복수개의 시간축 변환기의 출력중에서 상기 신호 예측기에서 출력되는 시간축 예측 정보에 더 근접한 부호를 최종 부호로 선택하는 것을 특징으로 하는 광대역 음성 신호 복원 장치.
  36. 광대역 음성 신호 압축 방법에 있어서,
    광대역 음성신호가 입력되면, 상기 광대역 음성신호의 저역 신호의 에너지를 이용하여 상기 광대역 음성 신호의 고역 음성 신호를 압축하는 단게;
    상기 압축된 고역 음성 신호를 고역 음성 패킷으로서 출력하는 단계를 포함하는 광대역 음성 신호 압축 방법.
  37. 제 36 항에 있어서, 상기 저역 신호의 에너지는 상기 광대역 음성 신호의 저역 신호에 대한 협대역 음성 압축과정에 의해 생성된 것을 특징으로 하는 광대역 음성 신호 압축 방법.
  38. 제 36 항에 있어서, 상기 고역 음성 신호 압축 단계는,
    상기 광대역 음성신호의 고역 음성 신호를 복수개의 주파수 대역으로 분해하는 단계;
    각 대역별로 순위를 결정하는 단계;
    상기 결정된 대역별 순위에 따라 각 대역별로 양자화 하는 단계를 포함하는 광대역 음성 신호 압축 방법.
  39. 제 38 항에 있어서, 상기 각 대역별로 순위를 결정하는 단계는 상기 각 대역 신호별로 구한 알엠에스(RMS) 값을 토대로 각 대역별 순위를 결정하는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
  40. 제 39 항에 있어서, 상기 각 대역별로 순위를 결정하는 단계는 상기 RMS 값이 큰 대역일수록 중요한 대역으로 순위를 결정하는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
  41. 제 38 항에 있어서, 상기 각 대역별로 양자화 하는 단계는,
    상기 각 대역별 신호를 이산여현변환(DCT)하여 제 1 DCT 계수를 구하는 단계;
    상기 제 1 DCT 계수의 크기와 부호를 독립적으로 추출하는 단계;
    상기 제 1 DCT 계수의 크기에 대하여 DCT를 수행하여 제 2 DCT 계수를 구하는 단계;
    상기 제 2 DCT 계수에서 디씨(DC) 성분과 나머지 DCT계수를 분리하고, 상기 나머지 DCT 계수를 제 3 DCT로 생성하는 단계;
    상기 제 3 DCT 계수의 RMS 값을 계산하는 단계;
    상기 DC 성분, 상기 제 3 DCT 계수의 RMS 값, 상기 제 3 DCT 계수 및 상기 제 1 DCT 계수의 부호를 독립적으로 양자화하는 단계를 포함하는 광대역 음성 신호 압축 방법.
  42. 제 41 항에 있어서, 상기 양자화 단계는,
    상기 DC성분은 대역간 예측 양자화 과정으로 양자화하는 단계;
    상기 제 3 DCT 계수의 RMS 값은 대역내 예측 양자화 과정으로 양자화하는 단계;
    상기 제 3 DCT 계수는 각 대역의 제 3 DCT 계수중에서 일부 DCT 계수만을 양자화하고 나머지 DCT 계수는 제거되도록 양자화하는 단계;
    상기 제 1 DCT 계수의 부호는 크기가 큰 DCT 계수에 해당되는 부호를 양자화 하는 단계를 포함하는 광대역 음성 신호 압축 방법.
  43. 제 42 항에 있어서, 상기 DC 성분에 대한 대역간 예측 양자화 과정은 하기 식에 따라 대역간 DC 예측 오차를 구하고, 상기 DC 예측 오차를 양자화 하는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
    (상기 식에서 Di는 i번째 고역 음성 대역의 Log DC값이고,는 i번째 고역 음성 대역의 양자화된 Log DC값이고,는 저역 신호의 Log 에너지이고, G는 예측기의 계수이고,는 i번째 고역 음성 대역의 DC 예측 오차이다.)
  44. 제 42 항에 있어서, 상기 제 3 DCT 계수의 RMS 값에 대한 대역내 예측 양자화는 상기 제 3 DCT 계수의 RMS 값과 상기 제 2 DCT 계수의 양자화된 DC값을 이용하여 수행되는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
  45. 제 42 항에 있어서, 상기 제 3 DCT 계수 양자화 단계는, 상기 각 대역의 순위 정보에 따라 중요한 대역에서는 상기 제 3 DCT 계수를 적게 제거하고, 중요하지 않은 대역에서는 상기 제 3 DCT 계수를 많이 제거하는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
  46. 제 42 항에 있어서, 상기 제 1 DCT 계수의 부호 양자화 단계는 상기 제 1 DCT 계수의 크기 순서 정보에 따라 최대 크기의 제 1 DCT 계수부터 크기가 작은 순서로 미리 정해진 수만큼의 제 1 DCT 계수에 해당하는 계수 부호는 양자화 하고, 나머지 크기가 작은 제 1 DCT 계수에 해당하는 계수 부호는 제거하여 양자화 하지 않는 것을 특징으로 하는 광대역 음성 신호 압축 방법.
  47. 계층적인 대역폭 구조로 압축되어 저역 음성 패킷과 고역 음성 패킷으로 구분되어 전송되는 광대역 음성 신호를 복원하는 방법에 있어서,
    상기 저역 음성 패킷을 저역 음성 신호로 복원하는 단계;
    상기 저역 음성 신호 복원 시 구한 저역 복원 신호의 에너지 정보를 이용하여 상기 고역 음성 패킷을 고역 음성 신호로 복원하는 단계;
    상기 저역 음성 신호와 상기 고역 음성 신호를 가산하여 광대역 복원 신호를 생성하는 단계를 포함하는 광대역 음성신호 복원 방법.
  48. 제 47 항에 있어서, 상기 고역 음성 신호 복원 단계는,
    상기 고역 음성 패킷을 각 모듈별로 역 양자화하는 단계;
    상기 역 양자화에 의해 양자화된 제 1 DCT 계수 크기를 구하는 단계;
    상기 역양자화에 의해 얻어진 제 1 DCT 계수 부호를 상기 제 1 DCT 계수 크기 순서 정보에 따라 DCT 계수에 삽입하는 단계;
    상기 제 1 DCT 계수 크기 순서 정보와 한 프레임 전의 DCT 계수를 이용하여 수신되지 않은 제 1 DCT 계수 부호를 예측하는 단계;
    상기 에측된 제 1 DCT 계수 부호를 해당되는 양자화된 제 1 DCT 계수에 삽입하는 단계;
    양자화된 제 1 DCT 계수에 대한 역 DCT 연산으로 대역별 시간 영역신호를 구하여 상기 고역 음성 신호를 출력하는 단계를 포함하는 광대역 음성 신호 복원 방법.
KR1020030048665A 2003-07-16 2003-07-16 광대역 음성 신호 압축 및 복원 장치와 그 방법 KR100940531B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020030048665A KR100940531B1 (ko) 2003-07-16 2003-07-16 광대역 음성 신호 압축 및 복원 장치와 그 방법
US10/891,423 US8433565B2 (en) 2003-07-16 2004-07-15 Wide-band speech signal compression and decompression apparatus, and method thereof
JP2004208615A JP4726445B2 (ja) 2003-07-16 2004-07-15 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法
DE602004001101T DE602004001101T2 (de) 2003-07-16 2004-07-16 Breitbandsprachsignalkompressionsvorrichtung, Breitbandsprachsignaldekompressionsvorrichtung, Breitbandsprachsignalkompressionsverfahren, Breitbandsprachsignaldekompressionsverfahren
EP04254266A EP1498874B1 (en) 2003-07-16 2004-07-16 Wide-band speech signal compression and decompression apparatus, and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030048665A KR100940531B1 (ko) 2003-07-16 2003-07-16 광대역 음성 신호 압축 및 복원 장치와 그 방법

Publications (2)

Publication Number Publication Date
KR20050009384A true KR20050009384A (ko) 2005-01-25
KR100940531B1 KR100940531B1 (ko) 2010-02-10

Family

ID=36643387

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030048665A KR100940531B1 (ko) 2003-07-16 2003-07-16 광대역 음성 신호 압축 및 복원 장치와 그 방법

Country Status (5)

Country Link
US (1) US8433565B2 (ko)
EP (1) EP1498874B1 (ko)
JP (1) JP4726445B2 (ko)
KR (1) KR100940531B1 (ko)
DE (1) DE602004001101T2 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006243041A (ja) * 2005-02-28 2006-09-14 Yutaka Yamamoto 高域補間装置及び再生装置
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR101261524B1 (ko) * 2007-03-14 2013-05-06 삼성전자주식회사 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
CN101964189B (zh) * 2010-04-28 2012-08-08 华为技术有限公司 语音频信号切换方法及装置
US8000968B1 (en) 2011-04-26 2011-08-16 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
WO2012065081A1 (en) * 2010-11-12 2012-05-18 Polycom, Inc. Scalable audio in a multi-point environment
US9905236B2 (en) 2012-03-23 2018-02-27 Dolby Laboratories Licensing Corporation Enabling sampling rate diversity in a voice communication system
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
US10264116B2 (en) * 2016-11-02 2019-04-16 Nokia Technologies Oy Virtual duplex operation
CN112770269B (zh) * 2019-11-05 2022-05-17 海能达通信股份有限公司 宽窄带互通环境下语音通讯方法及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
JPH07334194A (ja) * 1994-06-14 1995-12-22 Matsushita Electric Ind Co Ltd 音声符号化/復号化方法およびそれらの装置
JPH08160996A (ja) * 1994-12-05 1996-06-21 Hitachi Ltd 音声符号化装置
JPH08163056A (ja) * 1994-12-09 1996-06-21 Hitachi Denshi Ltd 音声信号帯域圧縮伝送方式
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
DE19743662A1 (de) 1997-10-02 1999-04-08 Bosch Gmbh Robert Verfahren und Vorrichtung zur Erzeugung eines bitratenskalierbaren Audio-Datenstroms
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
JP2001217999A (ja) * 2000-02-03 2001-08-10 Nikon Corp 画像入力装置
US6691085B1 (en) 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information

Also Published As

Publication number Publication date
US20050027516A1 (en) 2005-02-03
DE602004001101D1 (de) 2006-07-20
KR100940531B1 (ko) 2010-02-10
JP4726445B2 (ja) 2011-07-20
EP1498874A1 (en) 2005-01-19
US8433565B2 (en) 2013-04-30
EP1498874B1 (en) 2006-06-07
JP2005037949A (ja) 2005-02-10
DE602004001101T2 (de) 2007-06-14

Similar Documents

Publication Publication Date Title
KR101143724B1 (ko) 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치
KR101220621B1 (ko) 부호화 장치 및 부호화 방법
US8571878B2 (en) Speech compression and decompression apparatuses and methods providing scalable bandwidth structure
US7596492B2 (en) Apparatus and method for concealing highband error in split-band wideband voice codec and decoding
US6353808B1 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
KR100940531B1 (ko) 광대역 음성 신호 압축 및 복원 장치와 그 방법
KR100921867B1 (ko) 광대역 오디오 신호 부호화 복호화 장치 및 그 방법
CN103258541A (zh) 音频解码方法
US20070040709A1 (en) Scalable audio encoding and/or decoding method and apparatus
CN104485111A (zh) 音频/语音编码装置和音频/语音解码装置
KR100657916B1 (ko) 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US20030088402A1 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
US6141637A (en) Speech signal encoding and decoding system, speech encoding apparatus, speech decoding apparatus, speech encoding and decoding method, and storage medium storing a program for carrying out the method
WO2015049820A1 (ja) 音響信号符号化装置、音響信号復号装置、端末装置、基地局装置、音響信号符号化方法及び復号方法
KR101037931B1 (ko) 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
JP4274614B2 (ja) オーディオ信号復号方法
JP3468184B2 (ja) 音声通信装置及びその通信方法
JP4618823B2 (ja) 信号符号化装置及び方法
JP2002215192A (ja) オーディオ情報処理装置及び処理方法
Radha et al. Comparative analysis of compression techniques for Tamil speech datasets
JPH0944194A (ja) 音声符号化通信方式
KR20160098597A (ko) 통신 시스템에서 신호 코덱 장치 및 방법
Milner et al. Transform-based feature vector compression for distributed speech recognition
Amro et al. Exploiting Linear Prediction Coefficients Redundancy in VoIP Data Rate Reduction

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121210

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131217

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141224

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20151217

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20161219

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20171219

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20181220

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20191217

Year of fee payment: 11