KR101037931B1 - 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법 - Google Patents

2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법 Download PDF

Info

Publication number
KR101037931B1
KR101037931B1 KR1020040033697A KR20040033697A KR101037931B1 KR 101037931 B1 KR101037931 B1 KR 101037931B1 KR 1020040033697 A KR1020040033697 A KR 1020040033697A KR 20040033697 A KR20040033697 A KR 20040033697A KR 101037931 B1 KR101037931 B1 KR 101037931B1
Authority
KR
South Korea
Prior art keywords
coefficient
dimensional
frequency
band
magnitude
Prior art date
Application number
KR1020040033697A
Other languages
English (en)
Other versions
KR20050108685A (ko
Inventor
손창용
성호상
박호종
정병학
김영보
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020040033697A priority Critical patent/KR101037931B1/ko
Priority to DE602005021274T priority patent/DE602005021274D1/de
Priority to JP2005141989A priority patent/JP5280607B2/ja
Priority to EP05076133A priority patent/EP1596365B1/en
Priority to US11/128,432 priority patent/US8019600B2/en
Publication of KR20050108685A publication Critical patent/KR20050108685A/ko
Application granted granted Critical
Publication of KR101037931B1 publication Critical patent/KR101037931B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Abstract

주파수 변환을 기반으로 음성 신호를 압축하고 복원하는 장치 및 방법에 있어서, 입력 음성 신호를 다수의 부프레임 단위로 분할하고, 각 부프레임의 음성 신호를 독립적으로 주파수 변환하여 주파수 계수를 시간과 주파수 축의 2차원으로 구성하고, 주파수 계수의 크기와 부호를 각각 독립적으로 양자화한다. 주파수 계수 크기의 양자화는, 2차원 구조의 주파수 계수 크기를 다수의 세부 2차원 구조로 분할하고, 각 분할된 2차원 데이터를 각각 2차원 DCT 변환하여 DCT 계수를 구하고, 각각의 DCT 계수를 최종적으로 양자화한다. 2차원 구조의 주파수 계수 크기를 세부적으로 분할하는 방법은 입력 신호의 특성에 따라 가변적으로 선택할 수 있다. 주파수 계수 부호의 양자화는, 양자화된 주파수 계수 크기의 순서 정보를 이용하여 크기가 큰 주파수 계수에 해당하는 부호만을 양자화하며, 복호기에 전달되지 않은 부호 정보는 임의로 정하거나 예측하여 사용할 수 있다.

Description

2차원 데이터 처리를 이용한 음성 신호 압축 및 복원 장치와 그 방법{Speech compression and decompression apparatus and method thereof using two-dimensional processing}
도 1은 본 발명에 따른 음성 신호 압축 장치의 기능 블록도이다.
도 2는 도 1에 도시된 제 1 주파수 변환기의 상세 기능 블록도이다.
도 3은 도 1에 도시된 제 1 주파수 계수 크기 양자화기의 상세 기능 블록도이다.
도 4는 도 1에 도시된 제 1 주파수 계수 부호 양자화기의 상세 기능 블록도이다.
도 5는 본 발명에 따른 음성 신호 복원 장치의 기능 블록도이다.
도 6은 본 발명에 따른 음성 신호 압축 방법에 있어서 음성신호 압축 과정의 동작 흐름도이다.
도 7은 본 발명에 따른 음성 신호 복원 방법에 있어서 음성신호 복원 과정의 동작 흐름도이다.
도 8은 도 3에 도시된 2차원 제 2 변환기에서의 여러 분할 과정을 예로 보여주는 그림이다.
본 발명은 음성신호 부호화 및 복호화에 관한 것으로서, 특히 음성 신호를 주파수 영역으로 변환하여 주파수 계수 정보를 양자화하고 역양자화하는 음성 신호 압축 및 복원 장치와 그 방법에 관한 것이다.
주파수 변환을 기반으로 음성 신호를 압축하고 복원하는 기술은 많이 개발되어 있고, 기본적인 압축 구조는 주파수 변환 모듈, 대역 분할 모듈, 비트 할당 모듈, 주파수 계수 양자화 모듈로 구성된다. 일반적으로 주파수 변환 모듈은 일정 길이 단위로 음성 신호를 입력 받아 한 단위의 입력 신호를 한번의 변환 과정을 통하여 주파수 영역으로 변환하여 주파수 계수를 구하고, 한 단위의 주파수 계수를 독립적으로 양자화 하는 과정으로 이루어진다. 이 때, 주파수 변환 단위의 길이가 짧으면 입력 신호의 시간 영역에서의 상관관계를 충분히 활용하지 못하여 주파수 변환의 효과가 감소되고 양자화 성능이 저하되며, 주파수 변환 단위의 길이가 길면 입력 신호의 시간 영역에서의 특성 변화가 사라져 주파수 변환의 효과가 감소되고 양자화 성능이 저하되며 또한 압축 과정의 시간 지연이 증가하고 계산량이 증가하는 문제점을 가진다. 따라서, 주파수 변환 단위의 길이에 따라 서로 상충되는 장단점을 가지게 되어 최적의 압축 성능을 얻기가 어렵다.
또한, 음성 신호의 특성은 시간에 따라 계속적으로 변하며, 특히 매우 안정적으로 반복되는 특성을 가지는 구간과 불규칙적으로 급하게 변하는 성질을 가지는 구간이 존재한다. 따라서, 시간에 따른 특성을 주파수 변환 과정에 적극적으로 활 용하여 항상 최적의 주파수 변환 효과를 얻고 이로부터 양자화 성능을 향상시켜 압축 성능을 극대화 시키는 것이 필요하다.
본 발명이 이루고자 하는 기술적 과제는 주파수 영역에서 음성 신호를 압축 및 복원하는 장치와 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 입력 음성 신호를 짧은 단위로 분해하고 각 단위를 독립적으로 주파수 변환하여 양자화 하는 음성 신호 압축 및 복원 장치와 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 짧은 단위의 주파수 변환으로 구한 주파수 계수를 시간의 진행에 따라 2차원 구조를 배열하여 처리함으로써 양자화 성능을 향상시키는 음성 신호 압축 및 복원 장치와 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 2차원 구조로 배열된 주파수 계수를 처리할 때, 2차원 주파수 계수를 제 2 변환 과정을 통하여 또 다른 영역으로 변환하여 처리하는 음성 신호 압축 및 복원 장치와 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 2차원 구조로 배열된 주파수 계수를 제 2 변환시킬 때, 입력 음성 신호의 특성에 따라 제 2 변환의 구조를 조절하여 입력 신호의 특성에 최적인 변환 결과를 얻도록 하는 음성 압축 및 복원 장치와 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 주파수 계수를 양자화 할 때, 주파수 계수의 크기와 부호를 분리하여 각각을 독립적으로 양자화 하는 음성 압축 및 복원 장치와 그 방법을 제공하는데 있다.
상기 기술적 과제들을 달성하기 위하여 본 발명에 따른 음성 압축 장치는 음성 신호를 주파수 영역으로 변환하여 제 1 주파수 계수를 구하고, 상기 제 1 주파수 계수를 양자화에 효율적인 성질을 가지도록 제 2 변환하여 제 2 계수를 구하고, 상기 제 2 계수를 양자화하여 음성 패킷으로서 출력하는 압축기를 포함한다.
상기 압축기는, 상기 음성 신호를 주파수 영역으로 변환하는 제 1 주파수 변환기; 상기 제 1 주파수 변환기에서 출력되는 제 1 주파수 계수의 크기를 양자화 하는 제 1 계수 크기 양자화기; 및 상기 제 1 주파수 변환기에서 출력되는 제 1 주파수 계수의 부호를 양자화 하는 제 1 계수 부호 양자화기를 포함한다.
상기 제 1 주파수 변환기는, 상기 음성 신호를 다수의 부프레임으로 분할하고, 각 부프레임에 해당하는 음성 신호를 독립적으로 제 1 주파수 변환 시켜 부프레임별 다수의 제 1 주파수 계수를 구하는 것이 바람직하다.
상기 제 1 주파수 변환기는, 부프레임별 다수의 제 1 주파수 계수를 구하기 위하여, 상기 부프레임별 제 1 주파수 계수를 하나의 그룹으로 묶어 한 번에 처리할 수 있도록 하는 것이 바람직하다.
상기 제 1 주파수 변환기는, 부프레임 인덱스와 주파수 인덱스를 2차원 구조로 배열하여 2차원의 제 1 주파수 계수를 출력하는 것이 바람직하다.
상기 제 1 주파수 계수 크기 양자화기는, 상기 제 1 주파수 변환기에서 제공되는 제 1 주파수 계수에 대하여 제 1 주파수 계수 크기를 추출하는 크기 추출기; 상기 제 1 주파수 계수 크기를 다수의 대역으로 분할하여 대역별 제 1 주파수 계수 크기를 구하는 대역 분할기; 상기 대역별 제 1 주파수 계수 크기에 대하여 제 2 변환 과정을 수행하여 대역별 제 2 계수를 구하는 제 2 변환기; 상기 대역별 제 2 계수에 대하여 대역별 1차원 제 2 계수로 재배열하는 1차원 배열기; 상기 대역별 1차원 제 2 계수에 대하여 DC 성분을 추출하여 양자화하는 DC 양자화기; 상기 대역별 1차원 제 2 계수에 대하여 RMS를 계산하여 양자화하는 RMS 양자화기; 상기 RMS 양자화기가 출력하는 양자화된 RMS 값을 이용하여 상기 대역별 1차원 제 2 계수를 정규화하는 정규화기; 상기 대역별 정규화된 1차원 제 2 계수를 양자화하는 제 2 계수 양자화기; 상기 제 2 계수 양자화기의 비트 수를 할당하는 비트 할당 모듈을 포함하는 것이 바람직하다.
상기 크기 추출기는, 상기 제 1 주파수 계수를 2차원의 구조로 입력받아 동일한 2차원 구조를 가지는 제 1 주파수 계수 크기를 출력하는 것이 바람직하다.
상기 대역 분할기는, 상기 2차원 구조의 제 1 주파수 계수 크기에 대하여, 주파수 축에 대하여 다수의 대역으로 분할하여 대역별로 2차원의 구조를 가지는 제 1 주파수 계수 크기를 출력하는 것이 바람직하다.
상기 제 2 변환기는, 상기 대역별 2차원 구조의 제 1 주파수 계수 크기에 대하여, 대역별로 제 2 변환을 수행하여 2차원의 제 2 계수를 출력하는 것이 바람직하다. 이때, 상기 제 2 변환기에서 수행되는 제2 변환은 2차원 DCT 변환을 포함하 는 것이 바람직하다.
상기 제 2 변환기는, 상기 대역별 제 1 주파수 계수 크기의 2차원 구조를 N*P 라 할 때, 전체 N*P 구조를 다수의 세부 2차원 구조로 분할하고, 각 분할된 2차원 구조의 데이터에 대하여 동일한 구조의 2차원 제 2 변환을 적용하여, 대역별로 다수의 2차원 제 2 계수를 출력하는 것이 바람직하다.
상기 제 2 변환기에서 전체 N*P 구조를 다수의 2차원 구조로 분할하기 위하여, 부프레임을 경계로 다수의 2차원 구조로 분할하는 것이 바람직하다.
상기 제 2 변환기에서 상기 부프레임을 경계로 2차원 구조로 분할하기 위하여, 총 N개로 분할하여 분할 후 N 개의 1*P 구조가 존재하고, 1*P 구조의 2차원 제 2 변환을 N 회 수행하는 것이 바람직하다.
상기 제 2 변환기에서 상기 부프레임을 경계로 2차원 구조로 분할하기 위하여, 총 1개로 분할하여 분할 후 N*P 구조를 가지는 것이 바람직하다.
상기 제 2 변환기에서 상기 전체 N*P 구조를 다수의 2차원 구조로 분할하기 위하여, 입력 음성 신호의 특징에 따라 분할 구조를 가변적으로 선택하고 그에 따라 가변적 구조의 2차원 제 2 변환을 수행하는 것이 바람직하다.
상기 제 2 변환기에서 상기 입력 신호의 특성에 따라 분할 구조를 가변적으로 선택하기 위하여, 입력 음성 신호의 시간적 에너지 변화 특징을 활용하는 것이 바람직하다.
상기 1차원 배열기는, 상기 2차원 제 2 계수에 대하여 미리 정해진 특정 규칙을 적용하여 1차원으로 재배열하여 1차원 구조로 제 2 계수를 출력하는 것이 바 람직하다.
상기 1차원 배열기에 적용되는 상기 1차원으로의 재배열 규칙은, 상기 2차원 제 2 계수에 대하여 각 값의 평균 에너지를 구하고, 그 값의 크기 순으로 배열되도록 하는 것이 바람직하다.
상기 1차원 배열기는 다수의 재배열 규칙을 정하고, 입력 신호의 특징에 따라 가변적으로 재배열 규칙을 선택적으로 사용하는 것이 바람직하다.
상기 DC 양자화기, RMS 양자화기 및 제 2 계수 양자화기는, 상기 1차원으로 재배열된 제 2 계수에 대하여, 제 2 계수의 DC 값과 나머지 제 2 계수를 별도로 양자화하는 것이 바람직하다.
상기 제 2 계수를 양자화하기 위하여, 상기 1차원으로 재배열된 제 2 계수에 대하여, 제 2 계수의 일부를 제거하여 양자화하지 않는 것이 바람직하다.
상기 비트 할당 모듈은, 상기 1차원으로 재배열된 제 2 계수에 대하여, 대역의 중요도와 각 대역내의 상기 1차원 제 2 계수의 1차원 인덱스에 따라 비트 할당을 달리하는 것이 바람직하다.
상기 제 1 계수 부호 양자화기는, 상기 제 1 계수 크기 양자화 인덱스로부터 양자화된 제 1 계수 크기를 구하고, 계수의 크기 순서 정보에 따라 상기 제 1 주파수 계수 부호를 양자화하는 것이 바람직하다..
상기 제 1 계수 부호 양자화기는 양자화된 제 1 주파수 계수 크기에 대하여, 최대 크기의 양자화된 제 1 계수로부터 작은 순서로 미리 정해진 수 만큼의 제 1 주파수 계수 부호만을 포함하는 것이 바람직하다..
상기 기술적 과제들을 달성하기 위하여 본 발명에 따른 음성 압축 방법은 음성 신호를 주파수 영역으로 변환하여 제 1 주파수 계수를 구하는 단계; 상기 제 1 주파수 계수를 양자화에 효율적인 성질을 가지도록 제 2 변환하고 제 2 계수를 구하는 단계; 및 상기 제 2 계수를 양자화 하여 음성 패킷으로서 출력하는 단계를 포함한다.
상기 기술적 과제들을 달성하기 위하여 본 발명에 따른 음성 복원 장치는 압축된 음성 패킷을 모듈별로 분해하는 역 패킷화기; 상기 역 패킷화기로부터 출력되는 부호를 역양자화하는 제 1 계수 부호 역양자화기; 상기 역 패킷화기로부터 출력되는 양자화 인덱스로부터 양자화된 1차원 제 2 계수를 구하는 모듈; 상기 1차원 제 2 계수를 2차원 구조로 재배열하는 2차원 배열기; 상기 2차원 제 2 계수를 제 2 역변환하여 양자화된 제 1 주파수 계수 크기를 구하는 2차 제 2 역변환기; 상기 제 1 주파수 계수 크기와 제 1 주파수 계수 부호를 합하여 제 1 주파수 계수를 구하는 부호 삽입기; 상기 제1 주파수 계수 부호 중에서 전달되지 않은 부호를 예측하는 부호 예측기; 상기 2차원 구조의 제 1 주파수 계수를 부프레임별로 1차원으로 분할하는 부프레임 분할기; 상기 부프레임 계수를 제 1 주파수 역변환하여 시간 영역 신호를 구하는 제 1 주파수 역변환기를 포함한다.
상기 기술적 과제들을 달성하기 위하여 본 발명에 따른 음성 복원 방법은 압축된 음성 패킷을 모듈별로 분해하는 역 패킷화 단계; 상기 역 패킷화 단계로부터 출력되는 부호를 역양자화하는 제 1 계수 부호 역양자화 단계; 상기 역 패킷화 단계로부터 출력되는 양자화 인덱스로부터 양자화된 1차원 제 2 계수를 구하는 단계; 상기 1차원 제 2 계수를 2차원 구조로 재배열하는 2차원 배열 단계; 상기 2차원 제 2 계수를 역변환하여 양자화된 제 1 주파수 계수 크기를 구하는 2차 제 2 역변환 단계; 상기 제 1 주파수 계수 크기와 제 1 주파수 계수 부호를 합하여 제 1 주파수 계수를 구하는 부호 삽입 단계; 상기 제1 주파수 계수 부호 중에서 전달되지 않은 부호를 예측하는 부호 예측 단계; 상기 2차원 구조의 제 1 주파수 계수를 부프레임별로 1차원으로 분할하는 부프레임 분할 단계; 상기 부프레임 계수를 제 1주파수 역변환하여 시간 영역 신호를 구하는 제 1 주파수 역변환 단계를 포함한다.
상기 음성 압축 및 복원방법은 바람직하게는 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로 구현할 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세하게 설명하기로 한다.
본 발명에 따른 상기 음성 신호 압축 및 복원 장치와 그 방법은 하나의 독립된 음성 압축기 및 복원기의 동작에 국한되지 않고, 전체 음성 압축기 및 복원기의 한 부분으로서 동작할 수 있으며, 다양한 형태의 입력 음성 신호에 대하여 신호를 압축 및 복원할 수 있다. 본 발명에서 다루는 입력 음성 신호는 협대역 또는 광대역 등의 다양한 대역폭을 가지는 원 음성 신호, 특정 주파수 대역에 한정된 대역 통과 음성 신호, 원 음성 신호에 여러 전처리 과정을 적용하여 얻어진 다양한 형태의 전처리된 음성 신호 등을 모두 포함할 수 있으며, 모든 형태의 입력 음성 신호에 대하여 동일한 동작과 개념에 따라 동일한 과정에 의하여 입력 신호를 압축 및 복원 할 수 있다. 본 발명의 일 실시 예로서 16kHz로 샘플링된 광대역 음성 신호를 저역 신호와 고역 신호로 분해 한 후, 고역 신호를 상기 음성 신호 압축 및 복원 장치의 입력 음성 신호로 하는 것을 기준으로 설명하며, 저역 신호를 처리하는 별도의 모듈에서 저역 신호의 압축 과정에서 계산되는 정보가 상기 음성 신호 압축 및 복원 장치에 전달되는 것을 가정한다.
도 1은 본 발명에 따른 음성 신호 압축 장치의 기능 블록도이다. 도 1을 참조하면, 본 발명에 따른 음성 신호 압축 장치는 제 1 주파수 변환기(102), 제 1 주파수 계수 크기 양자화기(104), 제 1 주파수 계수 부호 양자화기(107), 패킷화기(109)로 구성된다.
제 1 주파수 변환기(102)는 주어진 프레임 크기의 입력 음성 신호(101)를 입력 받아 주파수 변환 과정을 수행하여 제 1 주파수 계수(103)을 출력한다.
제 1 주파수 계수 크기 양자화기(104)는 상기 제 1 주파수 변환기(102)에서 구한 제 1 주파수 계수(103)의 크기(절대값)를 취하여 양자화 하여 제 1 주파수 계수 크기 양자화 인덱스(105)를 출력한다. 상기 제 1 주파수 계수 크기 양자화기(104)는 다른 모듈에서 구하여진 입력 음성 신호(101)에 대한 추가 정보(111)을 이용할 수 있다.
제 1 주파수 계수 부호 양자화기(107)은 상기 제 1 주파수 계수(103)의 부호만을 취하여 양자화 하여 제 1 주파수 계수 부호 양자화 인덱스(108)을 출력하며, 양자화 과정에서 상기 제 1 주파수 계수 크기 양자화기(104)에서 출력되는 양자화 인덱스(105)를 활용한다.
패킷화기(109)는 한 프레임 크기의 입력 음성 신호(101)에 대한 양자화 인덱 스(105, 108)를 입력받아 정해진 형태의 음성 패킷(110)을 출력하여 전송라인(미표기 됨)으로 전송한다.
상기 제 1 주파수 변환기(102)는 도 2에 도시된 바와 같이 구성된다. 도 2을 참조하면, 한 프레임의 입력 신호는 부프레임 분할기(201)에 의하여 다수의 부프레임 신호(202)으로 분할되고, 상기 각 부프레임 신호(202)는 독립적으로 주파수 변환 모듈(203)에 의하여 주파수 계수(204)로 변환된다. 각 부프레임별로 구하여진 상기 주파수 계수(204)는 모두 2차원 배열기(205)에 입력되어 하나의 2차원 구조로 배열된 제 1 주파수 계수(103)로 출력되며, 첫 부프레임에 해당하는 주파수 계수를 freq[0][k], k=0,...,M-1, 로 표시하고, 두 번째 부프레임에 해당하는 주파수 계수를 freq[1][k], 마지막 부프레임에 해당하는 주파수 계수를 freq[N-1][k]로 표시한다. 여기서 N 은 부프레임의 수이고, M은 부프레임의 샘플 수 이다. 이에 따라 제 1 주파수 계수(103)는 N*M 크기의 2차원 배열 구조로 나타낼 수 있으며, freq[subframe][k]에서 인덱스 subframe은 부프레임에 해당하는 시간 진행을 나타내고, 인덱스 k 는 주파수에 해당한다.
상기에서 언급한 본 발명의 일 실시 예에 따라 상기 음성 신호 압축 장치의 기본 프레임은 30msec이고, 상기 부프레임 분할기(201)는 30msec 프레임의 입력 신호를 5msec 단위의 부프레임으로 분할하여 6개의 부프레임 신호(202)를 출력하고, 각 부프레임 신호(202)에 대하여 총 6회의 주파수 모듈(203)을 수행하여 주파수 계수(204)를 출력할 수 있다. 따라서, 상기에서 언급한 일 실시 예에서는 N=6, M=40 이 되고, 전체 해당 주파수 영역이 4kHz 부터 8kHz이며, 2차원 제 1 주파수 계수(103) freq[subframe][k]에서 k=0 이 4kHz에 해당하고 k 가 1씩 증가함에 따라 해당하는 주파수는 100Hz씩 증가한다.
상기 주파수 변환 모듈(203)은 기존의 알려진 다양한 수학적 방법을 사용할 수 있고, 본 발명의 일 실시 예에서는 MLT(modulated lapped transform)을 사용한다. 입력 신호에 대하여 MLT 계수를 구하는 과정은 기존에 알려진 방법에 따른다.
상기 제 1 주파수 계수 크기 양자화기(104)는 도 3에 도시된 바와 같이 구성된다. 도 3을 참조하면 상기 2차원 구조의 제 1 주파수 계수(103)는 크기 추출기(301)에 의하여 2차원 구조의 제 1 주파수 계수 크기(302)로 출력되고, 상기 2차원 구조의 제 1 주파수 계수 크기(302)는 대역 분할기(303)를 통하여 다수의 주파수 대역으로 분할되어 3차원 구조의 대역별 제 1 주파수 계수 크기(304)로 출력되며, 이를 freq_mag[band][subframe][k]로 표기한다. 여기서 인덱스 band는 대역을 나타내고, 인덱스 subframe은 부프레임을 나타내고, 인덱스 k 는 각 대역별 주파수 인덱스를 나타내며, k의 범위는 상기 대역 분할기(303)의 대역분할 구조에 따라 결정된다. 이하 도 3의 그림은 설명을 간단히 하기 위하여 한 대역에 대하여서만 표시한다.
상기 대역별 제 1 주파수 계수 크기(304)를 각 대역별 독립적으로 설명하거나 한 대역에서만 표시하면 band 인덱스가 고정되므로 2차원 배열 구조를 가지게 된다. 따라서 이하 각 대역별 제 1 주파수 계수 크기(304)는 2차원 배열 구조를 가진다고 한다. 앞에서와 같이 부프레임의 수를 N이라 하고, 각 대역별로 P 개의 주파수 계수가 있다고 가정 한다. 상기 대역 분할기(303)의 동작에 따라 대역별로 주 파수 계수의 수가 서로 다를 수 있으나, 설명을 간단히 하기 위하여 모든 대역이 P 개의 주파수 계수를 가진다고 가정하며, 대역별 주파수 계수의 수가 서로 다른 경우에서 하기의 동작과 구조는 동일하게 적용된다. 따라서, 각 대역별 제 1 주파수 계수 크기(304)는 부프레임과 주파수 인덱스를 축으로 가지는 N*P 크기의 2차원 배열로 구성된다.
상기 대역별로 분할된 제 1 주파수 계수 크기(304)는 각 대역별로 독립적으로 양자화 한다. 특히, 제 1 주파수 계수 크기(304)에서 부프레임 사이의 상관관계를 활용하기 위하여 제 1 주파수 계수 크기(304)를 부프레임별로 다수의 그룹으로 묶어 그룹별로 처리하고 양자화 한다. 이를 구현하기 위하여 2차원으로 구성된 대역별 제 1 주파수 계수 크기(304)를 다수의 2차원 구조로 분할하고, 각각의 분할된 2차원 데이터를 동일 구조의 2차원 제 2 변환기(305)에 입력하여 대역별 다수의 2차원 제 2 계수(306)를 출력한다.
도 8을 참조하여 이 과정을 설명하면 아래와 같다. 도 8의 그림은 특정 대역에서의 제 1 주파수 계수 크기의 배열 구조를 나타내며, 각각의 Cell이 하나씩의 제 1 주파수 계수 크기를 나타내며, N = P = 4를 기준으로 설명한다. 프레임 내에 N개의 부프레임이 존재할 때, N 개의 모든 부프레임의 제 1 주파수 계수 크기를 하나의 그룹으로 묶을 때, 첫 그림처럼 N*P 구조의 2차원 제 2 변환을 통하여 N*P 구조의 2차원 제 2 계수를 출력한다. 만일 첫번째와 두번째 부프레임을 한 그룹으로 하고 나머지 N-2 개의 부프레임을 또 다른 그룹으로 할 때, 2*P 구조의 2차원 제 2 변환과 (N-2)*P 구조의 2차원 제 2 변환을 각각 해당 입력에 적용하여 2*P 구 조의 2차원 제 2 계수와 (N-2)*P 구조의 2차원 제 2 계수를 구한다. 또한, 극단적으로 전체 N 개의 부프레임을 각각 하나의 그룹으로 간주하여 1*P 구조의 2차원 제 2 변환을 N 번 실시하여 1*P 구조의 2차원 제 2 계수를 N 개 구할 수 있다.
상기 대역별 제 1 주파수 계수 크기(304)를 프레임 단위 그룹으로 묶는 방법은 모든 프레임에 대하여 한 방법으로 고정시킬 수 있고, 상기 입력 음성 신호(101)의 특성에 따라 가변적으로 할 수 있으며, 특성에 따라 그룹 구조를 결정하는 기준은 기존의 여러 기술을 활용하여 정할 수 있다.
이하, 압축 방법의 설명은 전체 부프레임을 하나의 그룹으로 묶어 N*P 구조의 2차원 제 2 변환을 한 번 실시할 경우에 한정하여 설명한다. 전체 부프레임을 다수의 그룹으로 묶을 경우에도 동일한 개념과 방법으로 각각의 그룹에 대하여 2차원 제 2 변환을 실시하여 그룹별 2차원 제 2 계수의 양자화를 독립적으로 실시할 수 있다.
상기 대역별 2차원 제 1 주파수 계수 크기(304)는 N*P 구조의 2차원 제 2 변환기(305)에 입력되어 대역별로 N*P 구조의 2차원 제 2계수(306)로 출력되고 이를 dct[band][n][m]으로 표시한다. 2차원 제 2 변환에 의하여 각 대역별로 시간 축과 주파수 축에 대한 상관관계가 동시에 고려되어 각 대역별의 2차원 배열 freq_mag[band][subframe][k]에 퍼져있는 에너지가 좁은 영역으로 집중되는 에너지 집중 현상이 나타나며, 이는 각 대역의 dct[band][n][m]에서 n과 m이 작은 영역에 많은 에너지가 집중되는 현상으로 나타난다.
본 발명에 따른 일 실시 예에서는, 제 2 변환기(305)의 동작으로 2차 DCT 변 환을 사용한다.
각 대역별 2차원 제 2 계수(306)는 1차원 배열기(307)에 의하여 대역별 1차원 제 2 계수(308)로 변환된다. 상기 1차원 배열기(307)는 미리 정해진 규칙에 따라 대역별로 N*P 구조의 2차원 배열 dct[band][n][m]를 대역별로 N*P 길이의 1차원 제 2 계수(308)로 변환한다. 상기 각 대역의 1차원 제 2 계수(308)를 dct_1[band][p]라 표시한다. 상기 1차원 배열기(307)의 동작은 단순히 2차원 배열을 1차원 배열로 변경하는 과정이며, 계수 값에는 변화가 발생하지 않는다.
상기 1차원 배열기(307)의 변환 규칙은 각 대역별 2차원 dct[band][n][m]의 각 제 2 계수값을 평균 에너지 크기의 순서대로 1차원으로 나열하여 1차원 계수로 출력하는 개념으로서, 각 대역별 N*P 개의 제 2 계수에 대하여 미리 실험에 의하여 각 위치의 계수값의 평균 에너지를 구하고, 에너지가 큰 계수를 앞에 위치하여 N*P 길이의 1차원 계수로 출력하는 규칙에 따른다. 상기 1차원 배열기(307)의 변환 규칙은 압축기 설계 단계에서 미리 결정되며, 다수의 규칙을 정하여 입력 신호의 특성에 따라 선택적으로 사용할 수 있다. 또한, 동일한 변환 규칙을 압축기와 복원기가 동시에 가지고 있으며, 이를 통하여 dct[band][n][m]과 dct_1[band][p] 사이의 변환은 추가 정보없이 정의된다. 일반적으로 dct[band][n][m]에서 가능 많은 에너지를 가지는 위치가 n=m=0 이므로 dct_1[band][0] = dct[band][0][0]이 된다.
DC 양자화기(309)는 1차원 제 2 계수(308) 중에서, DC 에 해당하는 첫 인덱스 값인 dct_1[band][0]을 취하여 양자화하여 DC 양자화 인덱스(310)와 양자화된 DC 값(311)을 출력한다. 상기 DC 양자화기(309)는 이웃 대역 DC 값들 사이의 상관 관계를 활용하기 위하여 모든 대역의 DC 값들을 모아서 처리할 수 있다. 상기에서 언급한 본 발명의 일 실시 예에서는, 상기 DC 양자화기(309)에는 저역 음성 압축기의 압축 과정에서 계산된 저역 음성 신호의 에너지 정보(111)를 활용할 수 있다. 또한, 본 발명의 한 실시 예에서는, 저역 신호를 CELP 구조의 음성 압축기로 처리할 경우, 저역 신호의 양자화된 고정 코드북 이득을 상기 에너지 정보(111)로 사용할 수 있다.
RMS 양자화기(312)는 각 대역의 1차원 제 2 계수(308) 중에서, DC 값을 제외한 나머지 1차원 제 2 계수, 즉 dct_1[band][1] ~ dct_1[band][N*P-1]의 의 RMS 값을 계산하여 양자화 하고, RMS 양자화 인덱스(313)와 양자화 된 RMS 값(314)을 출력한다. 각 대역의 RMS 값은 해당 대역의 DC 값과 높은 상관관계를 가지므로 이 성질을 활용하여 양자화 할 수 있다. 또한, 각 대역의 RMS 값 사이의 상관관계도 동시에 활용하여 양자화 할 수 있다. 본 발명의 한 실시 예에서는, 각 대역의 양자화된 DC 값(311)으로부터 RMS 값을 예측하여 양자화 한다.
상기 양자화된 RMS 값(314)은 정규화기(315)에 입력되어 해당 대역의 1차원 제 2 계수(308)를 정규화 한다. 이때, DC 값은 상기 DC 양자화기(309)에서 이미 양자화 되었으므로, DC를 제외한 나머지 1차원 제 2 계수(308)만 정규화하여 정규화된 1차원 제 2 계수(316)를 출력하며, 이를 dct_norm[band][p]라 한다.
제 2 계수 양자화기(317)는 상기 대역별 정규화된 1차원 제 2 계수(316)를 대역별로 독립적으로 양자화 하여 제 2 계수 양자화 인덱스(318)를 출력한다. 상기 제 2 양자화기(317)는 각 대역의 정규화된 1차원 제 2 계수(316)에 대하여 벡터 양 자화를 실시할 수 있으며, 계산량과 메모리를 고려하여 분할 벡터 양자화(split VQ)로 구현한다.
비트 할당 모듈(319)은 상기 제 2 양자화기(317)을 위한 비트 할당 정보(320)을 결정하여 출력한다. 상기 비트 할당 모듈(319)은 각 대역의 특성을 분석하여 각 대역에 할당된 비트 수를 결정하고, 만일 상기 제 2 양자화기(317)가 벡터 양자화를 할 경우 각 대역내의 분할된 부벡터에 할당된 비트 수를 세부적으로 결정하여 출력한다.
본 발명에 따라 일 실시예에서의 비트 할당 규칙은 각 대역의 dct_norm[band][p]에서 인덱스 p 가 작은 부벡터에 더 많은 비트를 할당하고, 특정 부벡터에 0(zero) 비트를 할당하여 계수를 전달하지 않고 버릴 수 있도록 한다. 이와 같은 비트 할당 규칙은 상기 1차원 배열기(307)의 변환 규칙에 따라 상기 1차원 제 2 계수(308)의 에너지는 주로 낮은 인덱스에 존재하고 높은 인덱스에는 매우 적은 양의 에너지만 존재하는 현상에 따른 것이다. 또한, 대역의 중요도에 따라 순위가 낮은 대역에서는 적은 수의 비트를 할당할 수 있으며, 대역 중요도를 결정하기 위하여 양자화된 DC 값(311)과 양자화된 RMS 값(314)를 이용할 수 있다.
도 1의 제 1 주파수 계수 크기 양자화기(104)의 양자화 인덱스 출력(105)은 상기 DC 양자화 인덱스(310), RMS 양자화 인덱스(313), 제 2 양자화 인덱스(318) 등을 포함한다.
상기에서 언급된 본 발명의 일실시예에 따르며, 고역 신호의 전체 8kHz 대역 중에서 7kHz 까지만 정보만 양자화 하여 전송하며, 이에 따라 제 1 주파수 계수 정 보 중에서 7kHz에 해당하는 계수 freq_mag[subframe][29] 까지만 양자화 한다. 또한, 4kHz-7kHz 영역을 5개의 600Hz 대역으로 분해한다. 이에 따라 상기 대역별 2차원 제 2 계수(306)는 각각 6*6이고, 1차원 제 2 계수(308)의 길이는 36이고, DC 값을 제외한 실제 벡터 양자화 할 제 2 계수는 대역별로 35개 이며, 분할 벡터 양자화를 위한 분할 구조와 대역 순위에 따른 부벡터의 비트 수는 표 1을 사용할 수 있다.
Figure 112004020071503-pat00001
제 1 주파수 계수 부화 양자화기(107)는 도 4의 구조를 가진다. 도 4를 참조하면, 상기 제 1 주파수 계수 부호 양자화기(107)는 부호 추출기(401), 계수 크기 역양자화기(403), 크기 정렬기(405), 부호 양자화기(407)로 구성된다.
상기 부호 추출기(401)는 상기 제 1 주파수 계수(103)에 대하여 부호를 추출하여 제 1 주파수 계수 부호(402)를 출력한다.
상기 계수 크기 역양자화기(403)는 상기 도 1의 제 1 주파수 계수 크기 양자화 인덱스(105)을 입력하여 각 파라미터 별로 역양자화 과정을 통하여 양자화된 제 1 주파수 계수 크기(404)를 출력한다. 상기 계수 크기 역양자화기(403)의 구체적인 동작은 도 3의 제 1 주파수 계수 크기 양자화 과정에 의하여 유일하게 정의되며 이미 알려진 기술에 의하여 수행된다.
상기 크기 정렬기(405)는 상기 양자화된 제 1 주파수 계수 크기(404)를 입력 받아 크기 순으로 정렬하여 크기 순서 정보(406)를 출력한다. 즉, 상기 양자화된 제 1 주파수 계수 크기(404)의 각각의 값이 전체 중에서 몇 번째로 큰 값인지를 명시한 정보를 출력한다.
상기 부호 양자화기(407)는 상기 크기 순서 정보(406)에 따라 전체 양자화된 제 1 주파수 계수 크기(404) 중에서 크기가 큰 양자화된 제 1 주파수 계수를 미리 지정된 수 만큼 선정하며, 상기 선정된 제 1 주파수 계수에 해당하는 제 1 주파수 계수 부호만 양자화 하여 부호 양자화 인덱스(108)을 출력한다.
본 발명의 일실시예에서는 상기 부호 양자화기(407)는 각 부호를 1 비트로 양자화 하며, 앞에서 언급된 본 발명의 실시 예에 의하면, 양자화된 제 1 주파수 계수 크기(404)는 총 180개이고, 180개 중에서 크기가 큰 92개의 주파수 계수에 해당하는 부호만 양자화 하여 전달하고, 나머지 88개의 부호 정보는 전달하지 않는다.
도 5는 본 발명에 따른 음성 신호 복원장치의 기능 블록도이다. 역패킷화기(502)는 전송라인으로부터(미도식 됨) 음성 패킷(501)을 받아 제 1 주파수 계수 크기 양자화 인덱스(503)와 제 1 주파수 계수 부호 양자화 인덱스(511)를 출력한다.
상기 제 1 주파수 계수 크기 양자화 인덱스(503)은 계수 크기 파라미터 역양자화기(504)에 입력되어 양자화된 1차원 구조의 제 2 계수(505)가 출력된다. 상기 계수 크기 파라미터 역양자화기(504)의 구체적인 동작은 도 3의 제 1 주파수 계수 크기 양자화 방법에 의하여 정의되며, 상기 양자화된 1차원 구조의 제 2 계수(505)는 도 3의 1차원 제 2 계수(308)의 양자화된 값에 해당한다.
2차원 배열기(506)은 상기 양자화된 1차원 구조의 제 2 계수(505)를 입력 받아 2차원으로 재배열된 2차원 제 2 DCT 계수(507)을 출력하며, 구체적인 동작은 도 3의 1차원 배열기(307)의 역동작에 해당한다.
제 2 역변환기는 상기 2차원 제 2 계수(507)에 대하여 2차원 역 변환 과정을 수행하여 2차원의 양자화된 제 1 주파수 계수 크기(509)를 출력한다. 2차원 제 2 역변환기는 도 3의 2차원 제 2 변환기(305)의 역동작을 수행한다.
계수 부호 역양자화기(512)는 상기 제 1 주파수 계수 부호 인덱스(511)을 입력받아 양자화된 제 1 주파수 계수 부호(513)을 출력한다. 부호 삽입기(510)은 상기 양자화된 제 1 주파수 계수 크기(509)에 양자화된 제 1 주파수 계수 부호(513)을 삽입하여 양자화된 제 1 주파수 계수(514)를 출력한다. 만일 도 4의 제 1 주파수 계수 부호 양자화 과정에서 일부 부호가 전달되지 않으면 부호 예측기(515)를 통하여 전달되지 않은 부호를 예측하여 최종 양자화된 제 1 주파수 계수(516)을 출력한다. 상기 부호 예측기(515)는 부호가 전달되지 않은 각 주파수 성분별로 프레임 경계에서의 불연속을 최소로 하도록 부호를 정하는 방법을 사용할 수 있다. 본 발명의 또 다른 실시 예에서는 전달되지 않은 부호에 대하여 상기 부호 예측기(515)가 불규칙적으로 부호를 임의로 구하여 사용할 수 있다.
최종 양자화된 제 1 주파수 계수(516)은 2차원 구조를 가지고 있으며, 이를 부프레임 분할기(517)에 입력하여 각각의 부프레임별 제 1 주파수 계수(518)을 출력하고, 상기 부프레임별 제 1 주파수 계수(518)을 각 부프레임별로 제 1 주파수 역변환기(519)에 입력하여 각 부프레임별 시간 영역 출력 신호(520)을 계산한다.
도 6은 본 발명에 따른 음성 신호 압축 과정에 대한 동작 흐름도이다.
음성 신호가 입력되면, 제 601 단계에서 상기 음성 신호를 부프레임 분할기(201)를 이용하여 다수의 부프레임으로 분할하고, 도 3에서와 같이 각 부프레임별로 독립적으로 주파수 변환하여 2차원 제 1 주파수 계수(103)을 구한다.
제 602 단계에서 2차원 제 2 주파수 계수(103)을 다수의 대역으로 분할하고, 도 3에서와 같이 각 대역별로 2차원 제 1 주파수 계수 크기(304)를 구한다.
제 603 단계에서 도 3의 대역별 2차원 제 1 주파수 계수 크기(304)를 다수의 세부 2차원 구조로 분할하고, 분할된 2차원 데이터를 제 2 변환하여 각 대역별 2차원 제 2 계수(306)을 구한다.
제 604 단계에서 2차원 제 2 계수로부터 1차원 구조의 제 2 계수(308)를 구한다.
제 605 단계에서는 상기 1차원으로 배열된 제 2 계수(308)에 대하여 DC, RMS, 제 2 계수 양자화를 실시한다.
제 606 단계에서 도 4에서와 같이 제 1 주파수 계수의 부호를 양자화하여 전송한다. 이 때, 양자화된 제 1 주파수 계수의 크기 순서 정보를 활용하여 크기가 큰 제 1 주파수 계수에 해당하는 부호만 전송한다.
도 7은 본 발명에 따른 음성 복원 과정의 동작 흐름도이다.
통신 채널(미 도시됨)을 통해 음성 패킷이 수신되면, 제 701 단계에서 수신된 음성 패킷을 각 모듈별로 역양자화 하고, 양자화된 1차원 구조의 제 2 계수를 구한다.
제 702 단계에서 상기 양자화된 1차원 구조의 제 2 계수를 2차원으로 배열하고, 2차원 제 2 역변환을 통하여 대역별로 양자화된 제 1 주파수 계수 크기를 구한다.
제 703 단계에서는 전달된 제 1 주파수 계수 부호 정보를 삽입하고, 전달되지 않은 계수 부호를 예측하여 양자화된 2차원 구조의 제 1 주파수 계수를 구한다.
제 704 단계에서는 양자화된 2차원 구조의 제 1 주파수 계수를 부프레임별로 분할하여 각 부프레임의 제 1 주파수 계수를 구하고, 각각을 제 1 주파수 역변환하여 시간 영역 신호를 구한다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터 가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고 본 발명을 구현하기 위한 기능적인(functional) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
상술한 본 발명에 따르면, 주파수 변환과 주파수 계수의 양자화를 통하여 음성 신호를 압축 및 복원하는 장치를 제공할 수 있다.
그리고 본 발명은 주파수 변환을 짧은 길이 단위로 실시하고, 시간 진행에 대한 다수의 주파수 계수를 2차원으로 배열하고 제 2 변환을 통하여 양자화에 유리한 계수를 구할 수 있다.
또한, 본 발명은 다수의 부프레임 정보를 여러 형태의 그룹으로 묶어 입력 신호의 특성에 가장 적합한 제 2 변환을 실행하여 성능을 향상 시킬 수 있다.
또한, 본 발명은 주파수 계수를 크기와 부호로 나누어 양자화 하고, 부호의 양자화를 계수의 크기에 따라 선별적으로 실시하고, 일부 부호에 대한 정보를 전달하지 않고도 복원 시 전송되지 않은 부호에 대한 예측을 통하여 효율적인 양자화 기술을 가지는 음성 신호 압축 및 복원 장치를 제공할 수 있다.
본 발명에 대해 상기 실시예를 참고하여 설명하였으나, 이는 예시적인 것에 불과하며, 본 발명에 속하는 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims (50)

  1. 음성신호를 주파수 영역으로 변환하여 주파수 계수를 구하는 제1 변환기;
    상기 제1 변환기로부터 제공되는 주파수계수의 크기를 변환하고, 변환된 주파수계수의 크기를 양자화하여 크기 양자화 인덱스를 출력하는 제1 계수 크기 양자화기;
    상기 제1 변환기로부터 제공되는 주파수계수의 부호를 양자화하여 부호 양자화인덱스를 출력하는 제1 계수 부호 양자화기; 및
    상기 크기 및 부호 양자화인덱스를 음성패킷으로 생성하는 패킷화기를 포함하는 것을 특징으로 하는 음성신호 압축장치.
  2. 삭제
  3. 제 1 항에 있어서, 상기 제 1 변환기는,
    상기 음성 신호를 다수의 부프레임으로 분할하고, 각 부프레임에 해당하는 음성 신호를 독립적으로 제 1 주파수 변환시켜 부프레임별 다수의 제 1 주파수 계수를 구하는 것을 특징으로 하는 음성 신호 압축 장치.
  4. 제 3 항에 있어서, 상기 제1 변환기는 부프레임별 다수의 제 1 주파수 계수를 구하기 위하여, 상기 부프레임별 제 1 주파수 계수를 하나의 그룹으로 묶어 한 번에 처리할 수 있도록 하는 것을 특징으로 하는 음성 신호 압축 장치.
  5. 제 4 항에 있어서, 상기 제1 변환기는
    부프레임 인덱스와 주파수 인덱스를 2차원 구조로 배열하여 2차원의 제 1 주파수 계수를 출력하는 것을 특징으로 하는 음성 신호 압축 장치.
  6. 제 1 항에 있어서, 상기 제 1 계수 크기 양자화기는,
    상기 제 1 변환기에서 제공되는 제 1 주파수 계수에 대하여 제 1 주파수 계수 크기를 추출하는 크기 추출기;
    상기 제 1 주파수 계수 크기를 다수의 대역으로 분할하여 대역별 제 1 주파수 계수 크기를 구하는 대역 분할기;
    상기 대역별 제 1 주파수 계수 크기에 대하여 제 2 변환 과정을 수행하여 대역별 제 2 계수를 구하는 제 2 변환기;
    상기 대역별 제 2 계수에 대하여 대역별 1차원 제 2 계수로 재배열하는 1차원 배열기;
    상기 대역별 1차원 제 2 계수에 대하여 DC 성분을 추출하여 양자화하는 DC 양자화기;
    상기 대역별 1차원 제 2 계수에 대하여 RMS를 계산하여 양자화하는 RMS 양자화기;
    상기 RMS 양자화기가 출력하는 양자화된 RMS 값을 이용하여 상기 대역별 1차원 제 2 계수를 정규화하는 정규화기;
    상기 대역별 정규화된 1차원 제 2 계수를 양자화하는 제 2 계수 크기 양자화기;
    상기 제 2 계수 크기 양자화기의 비트 수를 할당하는 비트 할당 모듈을 포함하는 음성 신호 압축 장치.
  7. 제 6 항에 있어서, 상기 크기 추출기는,
    상기 제 1 주파수 계수를 2차원의 구조로 입력받아 동일한 2차원 구조를 가지는 제 1 주파수 계수 크기를 출력하는 것을 특징으로 하는 음성 신호 압축 장치.
  8. 제 6 항에 있어서, 상기 대역 분할기는,
    2차원 구조의 제 1 주파수 계수 크기에 대하여, 주파수 축에 대하여 다수의 대역으로 분할하여 대역별로 2차원의 구조를 가지는 제 1 주파수 계수 크기를 출력하는 것을 특징으로 하는 음성 신호 압축 장치.
  9. 제 8 항에 있어서, 상기 제 2 변환기는,
    상기 대역별 2차원 구조의 제 1 주파수 계수 크기에 대하여, 대역별로 제 2 변환을 수행하여 2차원의 제 2 계수를 출력하는 것을 특징으로 하는 음성 신호 압축 장치.
  10. 제 9 항에 있어서, 상기 제 2 변환기에서 수행되는 제2 변환은 2차원 DCT 변환을 포함하는 것을 특징으로 하는 음성 신호 압축 장치.
  11. 제 9 항에 있어서, 상기 제 2 변환기는,
    상기 대역별 제 1 주파수 계수 크기의 2차원 구조를 N*P 라 할 때, 전체 N*P 구조를 다수의 세부 2차원 구조로 분할하고, 각 분할된 2차원 구조의 데이터에 대하여 동일한 구조의 2차원 제 2 변환을 적용하여, 대역별로 다수의 2차원 제 2 계수를 출력하는 것을 특징으로 하는 음성 신호 압축 장치.
  12. 제 11 항에 있어서, 상기 제 2 변환기에서 전체 N*P 구조를 다수의 2차원 구조로 분할하기 위하여,
    부프레임을 경계로 다수의 2차원 구조로 분할하는 것을 특징으로 하는 음성 신호 압축 장치.
  13. 제 12 항에 있어서, 상기 제 2 변환기에서 상기 부프레임을 경계로 2차원 구조로 분할하기 위하여,
    총 N개로 분할하여 분할 후 N 개의 1*P 구조가 존재하고, 1*P 구조의 2차원 제 2 변환을 N 회 수행하는 것을 특징으로 하는 음성 신호 압축 장치.
  14. 제 12 항에 있어서, 상기 제 2 변환기에서 상기 부프레임을 경계로 2차원 구조로 분할하기 위하여,
    총 1개로 분할하여 분할 후 N*P 구조를 가지는 것을 특징으로 하는 음성 신호 압축 장치.
  15. 제 11 항에 있어서, 상기 제 2 변환기에서 상기 전체 N*P 구조를 다수의 2차원 구조로 분할하기 위하여,
    입력 음성 신호의 특징에 따라 분할 구조를 가변적으로 선택하고 그에 따라 가변적 구조의 2차원 제 2 변환을 수행하는 것을 특징으로 하는 음성 신호 압축 장치.
  16. 제 15 항에 있어서, 상기 제 2 변환기에서 상기 입력 신호의 특성에 따라 분할 구조를 가변적으로 선택하기 위하여,
    입력 음성 신호의 시간적 에너지 변화 특징을 활용하는 것을 특징으로 하는 음성 신호 압축 장치.
  17. 제 6 항에 있어서, 상기 1차원 배열기는,
    2차원 제 2 계수에 대하여 미리 정해진 특정 규칙을 적용하여 1차원으로 재배열하여 1차원 구조로 제 2 계수를 출력하는 것을 특징으로 하는 음성 신호 압축 장치.
  18. 제 17 항에 있어서, 상기 1차원 배열기에 적용되는 상기 1차원으로의 재배열 규칙은,
    상기 2차원 제 2 계수에 대하여 각 값의 평균 에너지를 구하고, 그 값의 크기 순으로 배열되도록 하는 것을 특징으로 하는 음성 신호 압축 장치.
  19. 제 17 항에 있어서, 상기 1차원 배열기는
    다수의 재배열 규칙을 정하고, 입력 신호의 특징에 따라 가변적으로 재배열 규칙을 선택적으로 사용하는 것을 특징으로 하는 음성 신호 압축 장치.
  20. 제 6 항에 있어서 상기 DC 양자화기, RMS 양자화기 및 제 2 계수 양자화기는,
    상기 1차원으로 재배열된 제 2 계수에 대하여, 제 2 계수의 DC 값과 나머지 제 2 계수를 별도로 양자화하는 것을 특징으로 하는 음성 신호 압축 장치.
  21. 제 20 항에 있어서, 상기 제 2 계수를 양자화하기 위하여,
    상기 1차원으로 재배열된 제 2 계수에 대하여, 제 2 계수의 일부를 제거하여 양자화하지 않는 것을 특징으로 하는 음성 신호 압축 장치.
  22. 제 6 항에 있어서, 상기 비트 할당 모듈은,
    상기 1차원으로 재배열된 제 2 계수에 대하여, 대역의 중요도와 각 대역내의 상기 1차원 제 2 계수의 1차원 인덱스에 따라 비트 할당을 달리하는 것을 특징으로 하는 음성 신호 압축 장치.
  23. 제 1 항에 있어서, 상기 제 1 계수 부호 양자화기는,
    상기 제 1 계수 크기 양자화 인덱스로부터 양자화된 제 1 계수 크기를 구하고, 계수의 크기 순서 정보에 따라 상기 제 1 주파수 계수 부호를 양자화하는 것을 특징으로 하는 음성 신호 압축 장치.
  24. 제 23 항에 있어서, 상기 제 1 계수 부호 양자화기는
    양자화된 제 1 주파수 계수 크기에 대하여, 최대 크기의 양자화된 제 1 계수로부터 작은 순서로 미리 정해진 수 만큼의 제 1 주파수 계수 부호만을 포함하는 것을 특징으로 하는 음성 신호 압축 장치.
  25. 압축된 음성 패킷으로부터 음성 신호를 복원하는 장치는,
    상기 음성 패킷을 모듈별로 분해하는 역 패킷화기;
    상기 역 패킷화기로부터 출력되는 부호를 역양자화하는 제 1 계수 부호 역양자화기;
    상기 역 패킷화기로부터 출력되는 양자화 인덱스로부터 양자화된 1차원 제 2 계수를 구하는 모듈;
    상기 1차원 제 2 계수를 2차원 구조로 재배열하는 2차원 배열기;
    상기 2차원 제 2 계수를 제 2 역변환하여 양자화된 제 1 주파수 계수 크기를 구하는 2차 제 2 역변환기;
    상기 제 1 주파수 계수 크기와 제 1 주파수 계수 부호를 합하여 제 1 주파수 계수를 구하는 부호 삽입기;
    상기 제1 주파수 계수 부호 중에서 전달되지 않은 부호를 예측하는 부호 예측기;
    상기 2차원 구조의 제 1 주파수 계수를 부프레임별로 1차원으로 분할하는 부프레임 분할기;
    상기 부프레임 계수를 제 1 주파수 역변환하여 시간 영역 신호를 구하는 제 1 주파수 역변환기를 포함하는 음성 신호 복원 장치.
  26. 음성신호를 주파수 영역으로 변환하여 주파수 계수를 구하는 제1 변환 단계;
    상기 제1 변환단계로부터 제공되는 주파수계수의 크기를 변환하고, 변환된 주파수계수의 크기를 양자화하여 크기 양자화 인덱스를 출력하는 제 1 계수 크기 양자화 단계;
    상기 제1 변환단계로부터 제공되는 주파수계수의 부호를 양자화하여 부호 양자화인덱스를 출력하는 제 1 계수 부호 양자화 단계; 및
    상기 크기 및 부호 양자화인덱스를 음성패킷으로 생성하는 단계를 포함하는 것을 특징으로 하는 음성 압축 방법.
  27. 삭제
  28. 제 26 항에 있어서, 상기 제 1 변환 단계는,
    상기 음성 신호를 다수의 부프레임으로 분할하고, 각 부프레임에 해당하는 음성 신호를 독립적으로 주파수 변환 시켜 부프레임별 다수의 제 1 주파수 계수를 구하는 과정을 특징으로 하는 음성 신호 압축 방법.
  29. 제 28 항에 있어서, 상기 부프레임별 다수의 제 1 주파수 계수를 구하는 단계는,
    상기 부프레임별 제 1 주파수 계수를 하나의 그룹으로 묶어 한 번에 처리할 수 있도록 하는 과정을 포함하는 것을 특징으로 하는 음성 신호 압축 방법.
  30. 제 29 항에 있어서, 상기 부프레임별 제 1 주파수 계수를 묶는 단계는,
    부프레임 인덱스와 주파수 인덱스를 2차원 구조로 배열하여 2차원의 제 1 주파수 계수를 출력하는 것을 특징으로 하는 음성 신호 압축 방법.
  31. 제 28 항에 있어서, 상기 제 1 계수 크기 양자화 단계는,
    상기 제 1 주파수 변환 단계에서 제공되는 제 1 주파수 계수에 대하여 제 1 주파수 계수 크기를 추출하는 크기 추출 단계;
    상기 제 1 주파수 계수 크기를 다수의 대역으로 분할하여 대역별 제 1 주파수 계수 크기를 구하는 대역 분할 단계;
    상기 대역별 제 1 주파수 계수 크기에 대하여 제 2 변환 과정을 수행하여 대역별 제 2 계수를 구하는 제 2 변환 단계;
    상기 대역별 제 2 계수에 대하여 대역별 1차원 제 2 계수로 재배열하는 1차원 배열 단계;
    상기 대역별 1차원 제 2 계수에 대하여 DC 성분을 추출하여 양자화하는 DC 양자화 단계;
    상기 대역별 1차원 제 2 계수에 대하여 RMS를 계산하여 양자화하는 RMS 양자화 단계;
    상기 RMS 양자화 단계에서 출력되는 양자화된 RMS 값을 이용하여 상기 대역별 1차원 제 2 계수를 정규화하는 정규화 단계;
    상기 대역별 정규화된 1차원 제 2 계수를 양자화하는 제 2 계수 크기 양자화 단계;
    상기 제 2 계수 크기 양자화 단계에서 사용되는 비트 수를 할당하는 비트 할당 단계를 포함하는 음성 신호 압축 방법.
  32. 제 31 항에 있어서, 상기 크기 추출 단계는,
    상기 제 1 주파수 계수를 2차원의 구조로 입력받아 동일한 2차원 구조를 가지는 제 1 주파수 계수 크기를 출력하는 것을 특징으로 하는 음성 신호 압축 방법.
  33. 제 31 항에 있어서, 상기 대역 분할 단계는,
    2차원 구조의 제 1 주파수 계수 크기에 대하여, 주파수 축에 대하여 다수의 대역으로 분할하여 대역별로 2차원의 구조를 가지는 제 1 주파수 계수 크기를 출력하는 것을 특징으로 하는 음성 신호 압축 방법.
  34. 제 33 항에 있어서, 상기 제 2 변환 단계는,
    상기 대역별 2차원 구조의 제 1 주파수 계수 크기에 대하여, 대역별로 제 2 변환을 수행하여 2차원의 제 2 계수를 출력하는 것을 특징으로 하는 음성 신호 압축 방법.
  35. 제 34 항에 있어서, 상기 제 2 변환 단계는,
    2차원 DCT 변환 단계를 포함하는 것을 특징으로 하는 음성 신호 압축 방법.
  36. 제 34 항에 있어서, 제 2 변환 단계는,
    상기 대역별 제 1 주파수 계수 크기의 2차원 구조를 N*P 라 할 때, 전체 N*P 구조를 다수의 2차원 구조로 분할하고, 각 분할된 2차원 구조의 데이터에 대하여 동일한 구조의 2차원 제 2 변환 단계에 적용하여, 대역별로 다수의 2차원 제 2 계수를 출력하는 것을 특징으로 하는 음성 신호 압축 방법.
  37. 제 36 항에 있어서, 상기 전체 N*P 구조를 다수의 2차원 구조로 분할 하는 과정은,
    부프레임을 경계로 다수의 2차원 구조로 분할하는 것을 특징으로 하는 음성 신호 압축 방법.
  38. 제 37 항에 있어서, 상기 부프레임을 경계로 2차원 구조로 분할 하는 과정은,
    총 N개로 분할하여 N 개의 1*P 구조가 존재하고, 1*P 구조의 2차원 제 2 변환을 N 회 수행하는 것을 특징으로 하는 음성 신호 압축 방법.
  39. 제 37 항에 있어서, 상기 부프레임을 경계로 2차원 구조로 분할 하는 과정은,
    총 1개로 분할하여 분할 후 N*P 구조를 가지는 것을 특징으로 하는 음성 신호 압축 방법.
  40. 제 36 항에 있어서, 상기 전체 N*P 구조를 다수의 2차원 구조로 분할 하는 과정은,
    입력 음성 신호의 특징에 따라 분할 구조를 가변적으로 선택하고 그에 따라 가변적 구조의 2차원 제 2 변환 단계를 수행하는 것을 특징으로 하는 음성 신호 압축 방법.
  41. 제 40 항에 있어서, 상기 입력 신호의 특성에 따라 분할 구조를 가변적으로 선택하는 과정은,
    입력 음성 신호의 시간적 에너지 변화 특징을 활용하는 것을 특징으로 하는 음성 신호 압축 방법.
  42. 제 31 항에 있어서, 상기 1차원 배열 단계는,
    2차원 제 2 계수에 대하여 미리 정해진 특정 규칙을 적용하여 1차원으로 재배열하여 1차원 구조로 제 2 계수를 출력하는 것을 특징으로 하는 음성 신호 압축 방법.
  43. 제 42 항에 있어서, 상기 1차원으로의 재배열 규칙은,
    상기 2차원 제 2 계수에 대하여 각 값의 평균 에너지를 구하고, 그 값의 크기 순으로 배열되도록 하는 것을 특징으로 하는 음성 신호 압축 방법.
  44. 제 42 항에 있어서, 상기 1차원으로 재배열하는 과정은,
    다수의 재배열 규칙을 정하고, 입력 신호의 특징에 따라 가변적으로 재배열 규칙을 선택적으로 사용하는 것을 특징으로 하는 음성 신호 압축 방법.
  45. 제 31 항에 있어서 상기 DC 양자화 단계, RMS 양자화 단계 및 제 2 계수 양자화 단계는,
    상기 1차원으로 재배열된 제 2 계수에 대하여, 제 2 계수의 DC 값과 나머지 제 2 계수를 별도로 양자화 하는 것을 특징으로 하는 음성 신호 압축 방법.
  46. 제 45 항에 있어서, 상기 제 2 계수를 양자화 하는 과정은,
    상기 1차원으로 재배열된 제 2 계수에 대하여, 제 2 계수의 일부를 제거하여 양자화 하지 않는 것을 특징으로 하는 음성 신호 압축 방법.
  47. 제 31 항에 있어서, 상기 비트 할당 단계는,
    상기 1차원으로 재배열된 제 2 계수에 대하여, 대역의 중요도와 각 대역내의 상기 1차원 제 2 계수의 1차원 인덱스에 따라 비트 할당을 달리하는 것을 특징으로 하는 음성 신호 압축 방법.
  48. 제 26 항에 있어서, 상기 제 1 계수 부호 양자화 단계는,
    상기 제 1 계수 크기 양자화 인덱스로부터 양자화된 제 1 계수 크기를 구하고, 계수의 크기 순서 정보에 따라 상기 제 1 주파수 계수 부호를 양자화 하는 것을 특징을 하는 음성 신호 압축 방법.
  49. 제 48 항에 있어서, 상기 제 1 주파수 계수 부호 양자화 단계는,
    양자화된 제 1 주파수 계수 크기에 대하여, 최대 크기의 양자화된 제 1 계수로부터 작은 순서로 미리 정해진 수 만큼의 제 1 주파수 계수 부호만을 포함하는 것을 특징을 하는 음성 신호 압축 방법.
  50. 압축된 음성 패킷으로부터 음성 신호를 복원하는 방법은,
    상기 음성 패킷을 모듈별로 분해하는 역 패킷화 단계;
    상기 역 패킷화 단계로부터 출력되는 부호를 역양자화하는 제 1 계수 부호 역양자화 단계;
    상기 역 패킷화 단계로부터 출력되는 양자화 인덱스로부터 양자화된 1차원 제 2 계수를 구하는 단계;
    상기 1차원 제 2 계수를 2차원 구조로 재배열하는 2차원 배열 단계;
    상기 2차원 제 2 계수를 역변환하여 양자화된 제 1 주파수 계수 크기를 구하는 2차 제 2 역변환 단계;
    상기 제 1 주파수 계수 크기와 제 1 주파수 계수 부호를 합하여 제 1 주파수 계수를 구하는 부호 삽입 단계;
    상기 제1 주파수 계수 부호 중에서 전달되지 않은 부호를 예측하는 부호 예측 단계;
    상기 2차원 구조의 제 1 주파수 계수를 부프레임별로 1차원으로 분할하는 부프레임 분할 단계;
    상기 부프레임 계수를 제 1주파수 역변환하여 시간 영역 신호를 구하는 제 1 주파수 역변환 단계를 포함하는 음성 신호 복원 방법.
KR1020040033697A 2004-05-13 2004-05-13 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법 KR101037931B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020040033697A KR101037931B1 (ko) 2004-05-13 2004-05-13 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
DE602005021274T DE602005021274D1 (de) 2004-05-13 2005-05-13 Vorrichtung, Verfahren und Aufzeichnungsmedium zur Sprachsignalkompression und -dekompression
JP2005141989A JP5280607B2 (ja) 2004-05-13 2005-05-13 音声信号圧縮装置及び方法、音声信号復元装置及び方法、ならびにコンピュータ読取可能な記録媒体
EP05076133A EP1596365B1 (en) 2004-05-13 2005-05-13 Apparatus, method, and medium for speech signal compression and decompression
US11/128,432 US8019600B2 (en) 2004-05-13 2005-05-13 Speech signal compression and/or decompression method, medium, and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040033697A KR101037931B1 (ko) 2004-05-13 2004-05-13 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법

Publications (2)

Publication Number Publication Date
KR20050108685A KR20050108685A (ko) 2005-11-17
KR101037931B1 true KR101037931B1 (ko) 2011-05-30

Family

ID=34938273

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040033697A KR101037931B1 (ko) 2004-05-13 2004-05-13 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법

Country Status (5)

Country Link
US (1) US8019600B2 (ko)
EP (1) EP1596365B1 (ko)
JP (1) JP5280607B2 (ko)
KR (1) KR101037931B1 (ko)
DE (1) DE602005021274D1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4784281B2 (ja) * 2005-11-18 2011-10-05 富士ゼロックス株式会社 復号化装置、逆量子化方法及びこれらのプログラム
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
US8569221B2 (en) * 2007-08-30 2013-10-29 Kimberly-Clark Worldwide, Inc. Stain-discharging and removing system
KR101756834B1 (ko) 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
WO2012119012A1 (en) * 2011-03-02 2012-09-07 New Jersey Institute Of Technology System and method for vascularized biomimetic 3-d tissue models
US20150064142A1 (en) * 2012-04-12 2015-03-05 Harvard Apparatus Regenerative Technology Elastic scaffolds for tissue growth
KR102546098B1 (ko) * 2016-03-21 2023-06-22 한국전자통신연구원 블록 기반의 오디오 부호화/복호화 장치 및 그 방법
KR102650138B1 (ko) * 2018-12-14 2024-03-22 삼성전자주식회사 디스플레이장치, 그 제어방법 및 기록매체

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980080249A (ko) * 1997-03-14 1998-11-25 클라크 하드윅 존 스펙트럼 진폭의 듀얼 서브프레임 양자화

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
CA2140678C (en) * 1989-01-27 2001-05-01 Louis Dunn Fielder Coder and decoder for high-quality audio
US5752225A (en) 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
JPH0335300A (ja) * 1989-06-30 1991-02-15 Fujitsu Ltd 音声符号・復号化伝送方式
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
JP2878796B2 (ja) * 1990-07-03 1999-04-05 国際電気株式会社 音声符号化器
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
JP2969047B2 (ja) * 1994-07-04 1999-11-02 鐘紡株式会社 データ圧縮装置
US5819215A (en) * 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
JP3255022B2 (ja) 1996-07-01 2002-02-12 日本電気株式会社 適応変換符号化方式および適応変換復号方式
US6199037B1 (en) * 1997-12-04 2001-03-06 Digital Voice Systems, Inc. Joint quantization of speech subframe voicing metrics and fundamental frequencies
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
JP3472279B2 (ja) 2001-06-04 2003-12-02 パナソニック モバイルコミュニケーションズ株式会社 音声符号化パラメータ符号化方法及び装置
JP4534112B2 (ja) * 2001-06-05 2010-09-01 ソニー株式会社 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
JP3699912B2 (ja) * 2001-07-26 2005-09-28 株式会社東芝 音声特徴量抽出方法と装置及びプログラム
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980080249A (ko) * 1997-03-14 1998-11-25 클라크 하드윅 존 스펙트럼 진폭의 듀얼 서브프레임 양자화

Also Published As

Publication number Publication date
DE602005021274D1 (de) 2010-07-01
KR20050108685A (ko) 2005-11-17
EP1596365A1 (en) 2005-11-16
EP1596365B1 (en) 2010-05-19
US20060020453A1 (en) 2006-01-26
JP5280607B2 (ja) 2013-09-04
US8019600B2 (en) 2011-09-13
JP2005326862A (ja) 2005-11-24

Similar Documents

Publication Publication Date Title
EP1891740B1 (en) Scalable audio encoding and decoding using a hierarchical filterbank
JP2904472B2 (ja) ディジタル・オーディオ信号を効率的に圧縮するための方法、データ処理システムおよび装置
EP3336843A1 (en) Speech coding method and speech coding apparatus
JP5280607B2 (ja) 音声信号圧縮装置及び方法、音声信号復元装置及び方法、ならびにコンピュータ読取可能な記録媒体
KR102296067B1 (ko) 압축된 hoa 표현을 디코딩하기 위한 방법 및 장치와 압축된 hoa 표현을 인코딩하기 위한 방법 및 장치
KR102460820B1 (ko) Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치
KR102327149B1 (ko) Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치
EP1047047B1 (en) Audio signal coding and decoding methods and apparatus and recording media with programs therefor
CN101622665A (zh) 编码装置以及编码方法
KR102433192B1 (ko) 압축된 hoa 표현을 디코딩하기 위한 방법 및 장치와 압축된 hoa 표현을 인코딩하기 위한 방법 및 장치
KR100940531B1 (ko) 광대역 음성 신호 압축 및 복원 장치와 그 방법
EP2993665A1 (en) Method and apparatus for coding or decoding subband configuration data for subband groups
KR102363275B1 (ko) Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치
KR20210158108A (ko) 양자화 잡음을 줄이는 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기
CN111816196A (zh) 一种声波信息的解码方法及装置
AU2011205144B2 (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP3010637B2 (ja) 量子化装置及び量子化方法
Abduljabbar et al. A Survey paper on Lossy Audio Compression Methods
KR20210133554A (ko) 선형 예측 코딩을 이용한 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기
AU2011221401B2 (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JPH1091196A (ja) 音響信号符号化方法および音響信号復号化方法
JPH03156500A (ja) 適応変換符号化の方法及び装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140429

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150429

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160428

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee