KR100904605B1 - 음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법 - Google Patents

음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법 Download PDF

Info

Publication number
KR100904605B1
KR100904605B1 KR1020070004990A KR20070004990A KR100904605B1 KR 100904605 B1 KR100904605 B1 KR 100904605B1 KR 1020070004990 A KR1020070004990 A KR 1020070004990A KR 20070004990 A KR20070004990 A KR 20070004990A KR 100904605 B1 KR100904605 B1 KR 100904605B1
Authority
KR
South Korea
Prior art keywords
frequency
encoding
frequency conversion
conversion coefficient
code amount
Prior art date
Application number
KR1020070004990A
Other languages
English (en)
Other versions
KR20070076519A (ko
Inventor
히로야스 이데
Original Assignee
가시오게산키 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가시오게산키 가부시키가이샤 filed Critical 가시오게산키 가부시키가이샤
Publication of KR20070076519A publication Critical patent/KR20070076519A/ko
Application granted granted Critical
Publication of KR100904605B1 publication Critical patent/KR100904605B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

음성부호화장치(100)는 입력된 음성신호에 대해서 주파수 변환을 실시하는 주파수변환부(13)와, 상기 음성신호의 주파수성분마다 중요도를 산출하는 대역 중요도 산출부(19)와, 그 산출된 중요도가 높은 순번으로 엔트로피부호화를 실행하는 엔트로피부호화부(20)를 구비한다. 엔트로피부호화부(20)는 엔트로피부호화에 의한 생성부호량과, 미리 설정된 목표부호량을 비교하고, 해당 생성부호량이 목표부호량에 이를 때까지 중요도가 높은 순번으로 엔트로피부호화를 실행하는 것으로 음성부호화에 있어서의 연산량을 저감시킨다.
Figure R1020070004990
음성부호화, 음성복호, 중요도 산출, 엔트로피부호화, 엔트로피복호, 양자화, 대역분할

Description

음성부호화장치, 음성복호장치, 음성부호화방법 및 음성복호방법{AUDIO CODING APPARATUS, AUDIO DECODING APPARATUS, AUDIO CODING METHOD AND AUDIO DECODING METHOD}
도 1은 본 발명의 실시형태에 관련되는 음성부호화장치의 구성을 나타내는 블록도이다.
도 2는 본 발명의 실시형태에 관련되는 음성복호장치의 구성을 나타내는 블록도이다.
도 3은 주파수변환계수의 대역분할을 설명하기 위한 도면이다.
도 4는 본 실시형태의 음성부호화장치에서 실행되는 음성부호화처리를 나타내는 흐름도이다.
도 5는 본 실시형태에 있어서의 엔트로피부호화의 상세를 나타내는 흐름도이다.
도 6은 주파수성분마다의 주파수변환계수와 에너지의 관계를 나타내는 도면이다.
도 7은 본 실시형태의 음성복호장치에 있어서 실행되는 음성복호처리를 나타내는 흐름도이다.
도 8은 본 실시형태의 변형예 1에 있어서의 부호화처리를 나타내는 흐름도이 다.
도 9는 주파수성분마다의 주파수변환계수, 에너지, 플래그의 관계를 나타내는 도면이다.
도 10은 본 실시형태의 변형예 2에 있어서의 부호화처리를 나타내는 흐름도이다.
※도면의 주요부분에 대한 부호의 설명
11: 프레임화부 12: 레벨조정부
13: 주파수변환부 14: 대역분할부
15: 최대값 검색부 16: 시프트수 산출부
17: 시프트처리부 18: 양자화부
19: 중요도 산출부 20: 엔트로피부호화부
21: 엔트로피복호부 22: 역양자화부
23: 대역분할부 24: 시프트처리부
25: 주파수역변환부 26: 레벨재현부
27: 프레임합성부 100: 음성부호화장치
200: 음성복호장치
본 발명은 음성부호화장치, 음성복호장치, 음성부호화방법 및 음성복호방법 에 관한 것이다.
종래부터 음성신호에 대해 주파수변환과 엔트로피부호화를 실시하여 생성부호량을 목표값으로 제어하는 음성부호화방법이 알려져 있다. 이와 같은 음성부호화방법으로서 일본 특허출원: 특개 2005-128404호 공보에는 생성부호량이 목표값에 이를 때까지 부호화하는 주파수변환계수를 줄이면서, 부호화를 반복하는 주파수변환계수의 엔트로피부호화방법이 개시되어 있다.
그러나 상기의 종래의 음성부호화방법은 생성부호량이 목표값에 이를 때까지 몇 번이나 똑같은 엔트로피부호화를 반복할 필요가 있다. 이로 인해 연산량(처리량)이 증대하여 버린다고 하는 문제가 있었다.
본 발명의 목적은 음성부호화에 있어서의 연산량을 저감시키는 것이다.
상기의 목적을 달성하기 위해, 청구항 1에 기재한 음성부호화장치는, 음성신호에 대해서 주파수변환을 실시하고, 주파수변환계수를 산출하는 주파수변환수단과, 주파수변환수단에 의해 얻어지는 주파수변환계수의 주파수영역을 인간의 청각의 특성에 의거한 대역으로 분할하는 대역분할수단과, 대역분할수단에 의해 분할된 각 대역마다 주파수변환계수의 절대값의 최대값을 검색하는 검색수단과, 검색수단에 의해 검출된 최대값이 각 대역에서 미리 설정된 양자화비트수 이하가 되도록 시프트하기 위한 비트수를 산출하는 시프트수 산출수단과, 각 대역마다 대역 중의 주파수변환계수에 대해 시프트수 산출수단에 의해 산출된 시프트비트수 분량의 시프트처리를 실시하는 시프트처리수단과, 주파수성분마다 주파수변환계수의 중요도를 산출하는 중요도산출수단과, 중요도산출수단에 의해 산출된 중요도가 높은 순번으로 시프트처리수단에서 시프트처리된 주파수변환계수의 엔트로피부호화를 실행하는 부호화수단과, 엔트로피부호화에 의해서 생성된 부호량과, 미리 설정된 목표부호량을 비교하는 비교수단을 구비하고, 부호화수단은 생성부호량이 목표부호량으로 될 때까지 중요도가 높은 순으로 시프트처리수단에서 시프트처리된 주파수변환계수의 엔트로피부호화를 실행하는 것을 특징으로 하고 있다.
청구항 2에 기재한 발명은, 청구항 1에 기재한 음성부호화장치에 있어서, 부호화수단은 엔트로피부호화에 의해서 부호화된 주파수변환계수에 대해서, 주파수 순으로 재차 엔트로피부호화를 실행하는 것을 특징으로 하고 있다.
청구항 3에 기재한 발명은, 청구항 2에 기재한 음성부호화장치에 있어서, 주파수 순으로 재차 실행된 엔트로피부호화에 의한 생성부호량과 목표부호량을 비교하는 재생성부호량비교수단을 추가로 가지는 부호화수단은 상기 재생성부호량비교수단이 재차의 엔트로피부호화에 의한 생성부호량이 상기 목표부호량을 초과하고 있다고 판단한 경우, 생성부호 중에서 미리 지정된 주파수번호(i)의 주파수변환계수를 삭제하고, 남은 주파수변환계수에 대해서 재차 엔트로피부호화를 실행하는 것을 특징으로 하고 있다.
청구항 4에 기재한 발명은, 청구항 1에 기재한 음성부호화장치에 있어서, 부호화수단은 엔트로피부호화로서 레인지 코더에 의한 부호화를 이용하는 것을 특징으로 하고 있다.
청구항 5에 기재한 발명은, 청구항 1에 기재한 음성부호화장치에 있어서, 입력된 음성신호를 일정길이의 프레임으로 분할하는 프레임화수단과, 프레임마다 프레임에 포함되는 음성신호의 진폭의 최대값에 의거하여 해당 음성신호의 진폭을 조정하고, 조정된 음성신호를 주파수변환수단에 출력하는 진폭조정수단을 더 포함하는 것을 특징으로 하고 있다.
청구항 6에 기재한 발명은, 청구항 1에 기재한 음성부호화장치에 있어서, 주파수변환수단은 주파수변환으로서 변형이산코사인변환을 이용하는 것을 특징으로 하고 있다.
청구항 7에 기재한 음성부호화방법은, 음성신호에 대해서 주파수변환을 실시하고, 주파수변환계수를 산출하는 주파수변환스텝과, 주파수변환스텝에 의해 얻어지는 주파수변환계수의 주파수영역을, 인간의 청각의 특성에 의거한 대역으로 분할하는 대역분할스텝과, 대역분할스텝에 의해 분할된 각 대역마다 주파수변환계수의 절대값의 최대값을 검색하는 검색스텝과, 검색스텝에 의해 검출된 최대값이 각 대역에서 미리 설정된 양자화비트수 이하가 되도록 시프트하기 위한 비트수를 산출하는 시프트수 산출스텝과, 각 대역마다 대역중의 주파수변환계수에 대해 시프트수 산출스텝에 의해 산출된 시프트비트수 분량의 시프트처리를 실시하는 시프트처리스텝과, 주파수성분마다 주파수변환계수의 중요도를 산출하는 중요도산출스텝과, 중요도산출스텝에 의해 산출된 중요도가 높은 순번으로 시프트처리스텝에서 시프트처리된 주파수변환계수의 엔트로피부호화를 실행하는 부호화스텝과, 엔트로피부호화에 의해서 생성된 부호량과, 미리 설정된 목표부호량을 비교하는 비교스텝을 구비하고, 부호화스텝은 생성부호량이 목표부호량으로 될 때까지 중요도가 높은 순으로 시프트처리스텝에서 시프트처리된 주파수변환계수의 엔트로피부호화를 실행하는 것을 특징으로 하고 있다.
청구항 8에 기재한 발명은, 청구항 7에 기재한 음성부호화방법에 있어서, 부호화스텝은 엔트로피부호화에 의해서 부호화된 주파수변환계수에 대해서, 주파수 순으로 재차 엔트로피부호화를 실행하는 것을 특징으로 하고 있다.
청구항 9에 기재한 발명은, 청구항 8에 기재한 음성부호화방법에 있어서, 주파수 순으로 재차 실행된 엔트로피부호화에 의한 생성부호량과 목표부호량을 비교하는 재생성부호량비교스텝을 추가로 가지며, 부호화스텝은 재생성부호량비교스텝에 의해 재차의 엔트로피부호화에 의한 생성부호량이 목표부호량을 초과하고 있다고 판단된 경우, 생성부호 중에서 미리 지정된 주파수성분의 주파수변환계수를 삭제하고, 남은 주파수변환계수에 대해서 재차 엔트로피부호화를 실행하는 것을 특징으로 하고 있다.
청구항 10에 기재한 발명은, 청구항 7에 기재한 음성부호화방법에 있어서, 부호화스텝은 엔트로피부호화로서 레인지 코더에 의한 부호화를 이용하는 것을 특징으로 하고 있다.
청구항 11에 기재한 발명은, 청구항 7에 기재한 음성부호화방법에 있어서, 입력된 음성신호를 일정길이의 프레임으로 분할하는 프레임화스텝과, 프레임마다 프레임에 포함되는 음성신호의 진폭의 최대값에 의거하여 해당 음성신호의 진폭을 조정하고, 조정된 음성신호를 주파수변환스텝에 출력하는 진폭조정스텝을 더 포함하는 것을 특징으로 하고 있다.
청구항 12에 기재한 발명은, 청구항 7에 기재한 음성부호화방법에 있어서, 주파수변환스텝은 주파수변환으로서 변형이산코사인변환을 이용하는 것을 특징으로 하고 있다.
청구항 13에 기재한 음성복호장치는, 청구항 제 1항의 음성부호화 장치에 의해 부호화된 주파수변환계수를 복호하는 복호수단과, 복호수단에서 복호된 주파수변환계수를 인간의 청각의 특성에 의거한 대역으로 분할하고, 각 대역에서 부호화할 때와 역방향으로 시프트하는 시프트수단과, 시프트수단에 의해 시프트된 주파수변환계수에 대해, 주파수역변환을 실시하는 주파수역변환수단을 구비하는 음성복호장치를 특징으로 하고 있다.
청구항 14에 기재한 발명은, 청구항 13에 기재한 음성복호장치에 있어서, 복호수단은 복호된 주파수변환계수가 주파수변환시의 주파수변환계수보다도 적은 경우, 부족분의 주파수변환계수에 값 0을 삽입하는 것을 특징으로 하고 있다.
청구항 15에 기재한 음성복호방법은, 청구항 제 7항의 음성부호화 방법에 의해 부호화된 주파수변환계수를 복호하는 복호스텝과, 복호수단에서 복호된 주파수변환계수를 인간의 청각의 특성에 의거한 대역으로 분할하고, 각 대역에서 부호화할 때와 역방향으로 시프트하는 시프트스텝과, 시프트스텝에 의해 시프트된 주파수변환계수에 대해, 주파수역변환을 실시하는 주파수역변환스텝을 구비하는 것을 특징으로 하는 음성복호방법이다.
청구항 16에 기재한 발명은, 청구항 15에 기재한 음성복호방법에 있어서, 복호스텝은 복호된 주파수변환계수가 주파수변환시의 주파수변환계수보다도 적은 경우, 부족분의 주파수변환계수에 값 0을 삽입하는 스텝을 갖는 것을 특징으로 하고 있다.
이하, 도면을 참조하여 본 발명의 실시형태에 대해서 상세하게 설명한다.
도 1에 본 실시형태에 관련되는 음성부호화장치(100)의 구성을 나타낸다. 음성부호화장치(100)는 프레임화부(11), 레벨조정부(12), 주파수변환부(13), 대역분할부(14), 최대값 검색부(15), 시프트수 산출부(16), 시프트처리부(17), 양자화부(18), 중요도 산출부(19), 엔트로피부호화부(20)에 의해 구성된다. 음성부호화장치(100)로의 입력신호는, 예를 들면 16㎑ 샘플링으로 16bit 양자화된 디지털음성 등으로 한다.
프레임화부(11)는 입력된 음성신호를 일정길이의 프레임으로 분할한다. 1프레임은 부호화(압축)의 처리단위이다. 각 프레임은 레벨조정부(12)에 출력된다. 1개의 프레임에는, m개(m≥1)의 블록이 포함된다. 1블록은 1회의 MDCT(Modified Discrete Cosine Transform: 변형이산코사인변환)를 실행하는 단위이다. 1블록의 길이는 MDCT의 차수(次數)에 상당한다. MDCT의 탭길이는 512탭이 이상적이다.
레벨조정부(12)는 프레임마다, 입력된 음성신호의 레벨조정(진폭조정)을 실행한다. 레벨조정된 신호는 주파수변환부(13)에 출력된다. 레벨조정이란, 1프레 임 속에 포함되는 신호의 진폭의 최대값이 지정된 비트(이하, 제압목표비트)수 이하에 들어가도록 제어하는 것이다. 음성신호에서는 10비트 정도로 제압하는 것을 생각할 수 있다. 1프레임 속의 입력신호의 최대진폭을 nbit, 제압목표비트수를 N으로 하면, 제 1 시프트비트수, 즉 수학식 1에 있어서의 shift_bit의 절대값으로 나타내어지는 비트수만큼 프레임 속의 전체 신호가 LSB(Least Significant Bit: 최하위비트) 측으로 시프트된다.
Figure 112007004631397-pat00001
또한, 복호시에는 제압된 신호를 원래대로 되돌릴 필요가 있다. 이로 인해, shift_bit를 나타내는 신호가 부호화신호의 일부로서 출력된다.
주파수변환부(13)는 입력된 음성신호에 대해 주파수변환을 실시하고, 대역분할부(14)에 주파수변환계수를 출력한다. 음성신호의 주파수변환으로서 MDCT (Modified Discrete Cosine Transform: 변형이산코사인변환)을 이용한다. 입력된 음성신호를 {xn|n=0,…, M-1}로 한다. MDCT블록의 길이를 M으로 한다. MDCT계수(주파수변환계수){Xk|k=0,…, M/2-1}은 수학식 2와 같이 정의된다.
Figure 112007004631397-pat00002
여기에서 hn은 창함수이고, 수학식 3과 같이 정의된다.
Figure 112007004631397-pat00003
대역분할부(14)는 주파수변환부(13)로부터 입력되는 주파수변환계수의 주파수영역을 인간의 청각의 특성에 맞춘 대역으로 분할한다. 대역분할부(14)는 도 3에 나타내는 바와 같이, 주파수대역이 저주파수대역일수록 좁게, 고주파수대역일수록 넓어지게 분할한다. 예를 들면, 음성신호의 샘플링주파수가 16㎑이였을 경우, 분할의 경계를 187.5㎐, 437.5㎐, 687.5㎐, 937.5㎐, 1312.5㎐, 1687.5㎐, 2312.5㎐, 3250㎐, 4625㎐, 6500㎐로 설정하여, 주파수영역을 11대역으로 분할한다.
최대값 검색부(15)는 대역분할부(14)에서 분할된 각 대역마다 주파수변환계수의 절대값 중에서 최대값을 검색한다.
시프트수 산출부(16)는 시프트처리부(17)가 시프트해야 할 비트수(이하, 제 2 시프트비트수라고 부른다.)를 산출한다. 산출은 최대값 검색부(15)에서 얻어진 각 분할대역에서의 최대값이 각 대역에서 미리 설정된 양자화비트수 이하가 되도록 실행된다. 예를 들면, 어느 대역에서의 주파수변환계수의 절대값의 최대값이 1101010(2진수)일 때에는 이 최대값은 부호비트를 포함시키면 8비트로 나타내어진다. 이 대역에서 미리 설정된 양자화비트수가 6비트인 경우, 제 2 시프트비트수는 2비트가 된다. 각 대역에서 미리 설정되는 양자화비트수는 인간의 청각의 특성에 의거하여 저역일수록 많게, 고역일수록 적게 되는 것이 바람직하다. 예를 들면, 5 비트에서 8비트가 고주파수대역에서 저주파수대역으로 단계적으로 할당된다.
시프트처리부(17)는 각 분할대역마다 모든 주파수변환계수의 데이터를, 산출된 제 2 시프트비트수만큼 LSB측으로 시프트한다. 시프트된 주파수변환계수의 데이터는 양자화부(18)에 출력된다. 또한, 복호시에는 주파수변환계수를 원래의 비트수로 되돌릴 필요가 있다. 이로 인해, 각 대역마다의 제 2 시프트비트수를 나타내는 신호가 부호화신호의 일부로서 출력된다.
양자화부(18)는 시프트처리부(17)로부터 입력된 시프트처리 후의 주파수변환계수신호에 대해 소정의 양자화(예를 들면, 스칼라 양자화)를 실시한다. 양자화된 주파수변환계수신호는 중요도 산출부(19)에 출력된다.
중요도 산출부(19)는 주파수성분마다의 주파수변환계수신호의 중요도를 산출한다. 산출된 중요도는 엔트로피부호화부(20)에서 실행되는 레인지 코더(Range Coder)부호화시에 이용된다. 중요도를 이용한 부호화에 의해서 미리 설정된 목표부호량에 맞춘 부호가 생성된다. 중요도는 주파수성분마다의 주파수변환계수신호의 합계 에너지로 나타내어진다. 1프레임에 m개의 블록이 포함될 경우, 각 주파수성분에 대해서 MDCT에 의해 m개의 주파수변환계수가 산출된다. j번째의 MDCT블록으로부터 산출된 i번째의 주파수변환계수를 fij로 나타낸다. 각 블록으로부터 산출된 i번째의(i=0,…, M/2-1) 주파수변환계수를 정리하여 {fij|j=0,…, m-1}으로 나타낸다. 이하에서는 i를 주파수번호라 부른다. 주파수번호(i)에 의해서 특정되는 주파수성분에 대응하는 에너지(gi)는 수학식 4와 같이 나타내어진다.
Figure 112007004631397-pat00004
에너지(gi)의 값이 큰 주파수성분일수록 MDCT계수의 중요도가 높은 것으로 한다. 도 6은 주파수번호마다 주파수변환계수{fij|j=0,…, m-1} 및 에너지(gi)의 관계를 나타낸다. 각 주파수성분마다 m개의 주파수변환계수에 의거하여 에너지(gi)가 산출되어 있다. 또한, 에너지(gi)의 값에 주파수에 의존한 중량계수를 곱셈하도록 해도 좋다. 예를 들면, 500㎐ 미만의 주파수 에너지(gi)에는 1.3, 500㎐ 이상 3500㎐ 미만의 주파수 에너지(gi)에는 1.1, 3500㎐ 이상의 주파수대역에는 1.0을 곱셈하는 것을 생각할 수 있다.
엔트로피부호화부(20)는 중요도 산출부(19)에서 산출된 중요도가 높은 순번으로 주파수번호(i) 및 대응하는 m개의 주파수변환계수데이터{fij|j=0,…, m-1}를 엔트로피부호화 한다. 생성부호량이 미리 설정된 목표부호량으로 될 때까지 중요도의 순으로 생성된 부호를 부호화데이터(압축신호)로서 출력한다.
엔트로피부호화란, 이하의 방법으로 신호 전체의 부호길이가 더욱 짧아지도록 변환하는 부호화방식이다. 즉, 데이터의 통계적 성질을 이용하여 출현빈도가 많은 부호에는 짧은 부호, 출현빈도가 적은 부호에는 긴 부호를 할당하여 부호화를 실행한다. 엔트로피부호화에는 허프만(Huffman)부호화, 산술부호화, 레인지 코더(Range Coder)에 의한 부호화 등이 있다. 본 실시형태에서는 엔트로피부호화로 서 레인지 코더에 의한 부호화를 이용하는 것으로 한다.
도 2에 본 실시형태에 관련되는 음성복호장치(200)의 구성을 나타낸다. 음성복호장치(200)는 음성부호화장치(100)에서 부호화된 신호를 복호하는 장치이다. 음성복호장치(200)는 도 2에 나타내는 바와 같이, 엔트로피복호부(21), 역양자화부(22), 대역분할부(23), 시프트처리부(24), 주파수역변환부(25), 레벨재현부(26), 프레임합성부(27)에 의해 구성된다.
엔트로피복호부(21)는 엔트로피부호화된 입력신호를 복호한다. 복호된 입력신호는 주파수변환계수신호로서 역양자화부(22)에 출력된다.
역양자화부(22)는 엔트로피복호부(21)에서 복호된 주파수변환계수에 대해 역양자화(예를 들면, 스칼라 역양자화)를 실시한다. 역양자화부(22)는 처리대상의 프레임에 포함되는 주파수변환계수가 주파수변환시의 주파수변환계수보다도 적은 경우, 부족분의 주파수성분에 대응하는 주파수변환계수에 소정의 값(예를 들면, 0)을 대입한다. 대입은 부족 주파수성분의 에너지가 입력이 있었던 주파수성분의 에너지보다도 작아지도록 실행한다. 역양자화부(22)는 전체 주파수영역의 주파수변환계수를 대역분할부(23)에 출력한다.
대역분할부(23)는 역양자화에 의해 얻어진 데이터의 주파수영역을 인간의 청각에 맞추어 대역분할한다. 대역분할은 부호화시의 부호화장치(100)에 있어서의 대역분할부(14)에 의한 분할과 똑같이, 저역일수록 좁게, 고역일수록 넓어지게 실행된다.
시프트처리부(24)는 역양자화부(22)의 역양자화에 의해 얻어진 주파수변환계 수의 데이터를 각 분할대역마다 시프트처리한다. 부호화장치(100)에 있어서의 시프트처리부(17)에 의한 시프트처리와는 역방향으로 시프트를 실행한다. 시프트하는 비트수는 부호화시에 시프트처리부(17)에 의해 시프트된 비트수, 즉 제 2 시프트비트수와 일치한다. 시프트처리된 주파수변환계수 데이터는 주파수역변환부(25)에 출력된다.
주파수역변환부(25)는 시프트처리부(24)에서 시프트처리가 실시된 주파수변환계수 데이터에 대해 주파수역변환(예를 들면, 역MDCT)을 실시한다. 이에 따라 음성신호는 주파수영역으로부터 시간영역으로 변환된다. 주파수역변환된 음성신호는 레벨재현부(26)에 출력된다.
레벨재현부(26)는 주파수역변환부(25)로부터 입력된 음성신호의 레벨조정(진폭조정)을 실행한다. 레벨조정에 의해 부호화장치(100)에 있어서의 레벨조정부(12)에서 제어된 신호의 레벨이 원래의 레벨로 되돌아간다. 레벨조정된 음성신호는 프레임합성부(27)에 출력된다.
프레임합성부(27)는 부호화 및 복호의 처리단위였던 프레임을 합성한다. 합성 후의 신호는 재생신호로서 출력된다.
다음으로, 본 실시형태에 있어서의 동작에 대해서 설명한다.
우선, 도 4의 흐름도를 참조하여 음성부호화장치(100)에 있어서 실행되는 음성부호화처리에 대해서 설명한다.
프레임화부(11)는 입력된 음성신호를 일정길이의 프레임으로 분할한다(스텝S11). 레벨조정부(12)는 프레임마다 입력된 음성신호의 레벨(진폭)을 조정한다(스 텝S12). 레벨조정 후의 음성신호에 대해 주파수변환부(13)가 MDCT를 실시하고, MDCT계수(주파수변환계수)를 산출한다(스텝S13).
이어서, 대역분할부(14)에 의해 MDCT계수(주파수변환계수)의 주파수영역이 인간의 청각의 특성에 맞추어 대역분할된다(스텝S14). 최대값 검색부(15)는 각 분할대역마다 MDCT계수의 절대값의 최대값을 검색한다(스텝S15). 각 분할대역에서의 최대값이 각 분할대역에서 미리 설정된 양자화비트수 이하가 되도록 시프트수 산출부(16)는 제 2 시프트비트수를 산출한다(스텝S16).
이어서, 각 분할대역마다 모든 MDCT계수에 대해 스텝S16에서 산출된 제 2 시프트비트수에 따른 시프트처리가 시프트처리부(17)에 의해서 실시된다(스텝S17). 시프트처리 후의 신호에 대해 양자화부(18)에 의해 소정의 양자화(예를 들면, 스칼라 양자화)가 실시된다(스텝S18).
이어서, 중요도 산출부(19)는 스텝S13에서 산출된 MDCT계수로부터 각 주파수성분의 중요도를 산출한다(스텝S19). 중요도 순으로 엔트로피부호화부(20)에 의해 엔트로피부호화가 실행되고(스텝S20), 본 음성부호화처리가 종료된다.
다음으로, 도 5의 흐름도를 참조하여 엔트로피부호화부(20)에 있어서 실행되는 엔트로피부호화(도 4의 스텝S20)에 대해서 상세하게 설명한다.
우선, 스텝S19에 있어서 중요도 산출부(19)에 의해 산출된 중요도 중, 가장 중요도가 높은 주파수성분에 대응하는 주파수번호(i)가 선택된다(스텝S30). 선택된 주파수번호(i) 및, 주파수번호(i)에 의해서 특정되는 m개의 MDCT계수{fij|j=0, …, m-1}에 대해서 레인지 코더 부호화가 실시된다(스텝S31).
이어서, 스텝S31의 부호화에 의해서 생성된 부호량이 목표부호량에 이르렀는지 아닌지가 판정된다(스텝S32). 스텝S32에 있어서, 목표부호량으로 되었다고 판정된 경우(스텝S32; YES), 본 엔트로피부호화가 종료된다.
스텝S32에 있어서, 생성부호량이 목표부호량에 이르고 있지 않다고 판정된 경우(스텝S32; NO), 부호화가 실시되어 있지 않은 MDCT계수데이터(남은 데이터)가 있는지 없는지가 판정된다(스텝S33).
스텝S33에 있어서, 남은 데이터가 있다고 판정된 경우(스텝S33; YES), 스텝S34에 있어서, 부호화되어 있지 않은 주파수성분 중에서 가장 중요도가 높은 주파수성분에 대응하는 주파수번호(i)가 선택되고, 스텝S31 및 S32의 처리가 반복된다. 스텝S33에 있어서, 남은 데이터가 없다고 판정된 경우(스텝S33; NO), 본 엔트로피부호화가 종료된다.
다음으로, 도 7의 흐름도를 참조하여 음성복호장치(200)에 있어서 실행되는 음성복호처리에 대해서 설명한다.
우선, 엔트로피복호부(21)는 엔트로피부호화가 실시된 부호화신호에 대해서 엔트로피복호처리를 실행한다(스텝T10). 이 복호처리에 의해 레벨조정을 위한 제 1 시프트비트수, 각 분할대역에 있어서의 최대값 조정을 위한 제 2 시프트비트수, 각 주파수에 대응하는 주파수번호 및 주파수변환계수에 관한 데이터가 얻어진다. 역양자화부(22)는 주파수변환계수 데이터에 대해 역양자화를 실시한다(스텝T11). 여기에서, 처리대상인 프레임의 MDCT계수의 수가, 부호화장치(100)에 있어서의 주 파수변환부(13)에 의해 부호화시에 산출된 MDCT계수의 수보다도 적은 경우, 부족분의 MDCT계수에는 소정의 값(예를 들면, 0)이 삽입된다.
이어서, 대역분할부(23)는 역양자화된 MDCT계수의 주파수영역을 부호화시와 똑같이 인간의 청각의 특성에 맞추어 대역분할한다(스텝T12). MDCT계수에 대해 각 대역마다 부호화시에 시프트한 제 2 비트수 분량만큼 부호화시와는 역방향으로 시프트처리부(24)에 의한 시프트처리가 실행된다(스텝T13). 주파수역변환부(25)는 시프트처리가 실시된 데이터에 대해 역MDCT를 실시한다(스텝T14). 이어서, 레벨재현부(26)는 역MDCT 후의 음성신호가 원래의 레벨로 되돌아가도록 레벨조정한다(스텝T15). 프레임합성부(27)에 의해 부호화 및 복호의 처리단위였던 프레임이 합성되고, 본 음성복호처리가 종료된다.
이상과 같이, 본 실시형태의 음성부호화장치(100)는 엔트로피부호화를 실행하기 전에 미리 주파수성분마다 중요도를 산출하고, 산출된 중요도가 높은 순번으로 생성부호량이 목표부호량으로 될 때까지 주파수성분마다의 음성신호의 부호화를 실행한다. 이로 인해 종래와 같이 몇 번이나 똑같은 부호화를 반복할 필요가 없고, 연산량을 삭감시키는 것이 가능하게 된다.
다음으로, 본 실시형태의 변형예에 대해서 설명한다.
< 변형예 1>
상기의 실시형태에서는 주파수성분의 중요도 순으로 엔트로피부호화를 실행했다. 부호화데이터에 부호화의 순번을 나타내는 주파수번호데이터를 포함시켜서 복호장치에 송신할 필요가 있었다. 변형예 1에서는 상기의 실시형태와 똑같이 중 요도가 높은 순번으로 엔트로피부호화를 실행한다. 엔트로피부호화된 주파수변환계수에 대해서 재차, 주파수 순으로 엔트로피부호화를 실시한다. 이에 따라, 부호화 순을 나타내는 데이터를 송신할 필요가 없어진다. 변형예 1의 엔트로피부호화부(20)에 있어서 실행되는 부호화처리에 대해서 도 8의 흐름도를 참조하여 상세하게 설명한다.
우선, 1회째의 부호화로서, 도 5에 나타내는 엔트로피부호화가 실행된다(스텝S40). 이어서, 스텝S40에 있어서 부호화대상으로 된 주파수성분(선택주파수)이 특정된다(스텝S41). 즉, 스텝S40에 있어서의 엔트로피부호화의 대상으로 되었는지 아닌지를 나타내는 플래그를 각 주파수성분에 붙인다. 도 9는 주파수성분마다 주파수변환계수, 에너지(gi, 수학식 4 참조), 플래그의 관계의 예를 나타낸다. 스텝S41에 있어서 선택주파수성분으로서 특정된 주파수성분에 대응하는 플래그의 값에는 1이 대입된다. 선택주파수성분으로서 특정되어 있지 않은 주파수성분에 대응하는 플래그의 값에는 0이 대입된다.
이어서, 스텝S41에서 특정된 주파수성분(플래그의 값이 1인 주파수성분)에 대응하는 각 주파수변환계수를 주파수번호순(예를 들면, 주파수번호가 작은 순)으로 엔트로피부호화(레인지 코더 부호화)한다. 부호화된 주파수성분을 나타내는 데이터(예를 들면, 도 9의 플래그를 연속시킨 데이터)도 부호화되어 주파수변환계수의 부호화데이터에 부가되고,(스텝S42), 변형예 1의 부호화처리가 종료된다.
< 변형예 2>
변형예 1에서는 음성신호의 입력에 따라서 음성신호를 나타내는 각 기호의 출현확률을 격납한 생기(生起)확률표를 순차 갱신하는 레인지 코더 부호화가 이용되었다. 또, 변형예 1에서는 목표부호량에 따라서 제 1 회째의 부호화를 실행하고, 그 후 부호화 순을 바꾸어 부호화를 실행한다. 그러나 생기확률표의 차이로부터 생성부호량이 목표부호량보다 커져 버리는 경우가 있다. 그래서, 변형예 2에서는 변형예 1의 부호화처리에 의해서 생성된 부호량이 목표부호량을 초과해 버린 경우에 미리 지정된 주파수성분을 삭제하는 것으로 생성부호량을 목표부호량내로 억제한다. 변형예 2의 엔트로피부호화부(20)에 있어서 실행되는 부호화처리에 대해서 도 10의 흐름도를 참조하여 상세하게 설명한다.
우선, 변형예 1과 똑같이 1회째의 부호화로서, 도 5에 나타내는 엔트로피부호화가 실행된다(스텝S50). 목표부호량에 따라 부호화되는 주파수성분(선택주파수 성분)이 특정된다(스텝S51). 이어서, 스텝S51에서 특정된 주파수성분에 대응하는 각 주파수변환계수를 주파수번호순으로 엔트로피부호화한다(스텝S52).
이어서, 생성부호량이 목표부호량을 초과하고 있는지 아닌지가 판정된다(스텝S53). 스텝S53에 있어서, 생성부호량이 목표부호량을 초과하고 있지 않다고 판정된 경우(스텝S53; NO), 변형예 2의 부호화처리가 종료된다.
스텝S53에 있어서, 현재의 생성부호량이 목표부호량을 초과하고 있다고 판정된 경우(스텝S53; YES), 부호화의 대상으로 된 데이터 중에서, 미리 지정된 주파수성분의 데이터(예를 들면, 가장 고역측의 데이터)가 삭제된다(스텝S54). 이어서, 스텝S54에 있어서의 삭제처리 후에 남은 데이터에 대해 엔트로피부호화가 실시되고(스텝S55), 변형예 2의 부호화처리가 종료된다.
본 발명에 따르면, 음성부호화처리에 있어서, 엔트로피부호화를 실행하기 전에 미리 주파수대역마다 중요도를 산출하고, 생성부호량이 목표부호량으로 될 때까지 주파수대역의 중요도가 높은 순번으로 주파수변환계수의 부호화를 실행하므로, 종래와 같이 몇 번이나 부호화를 다시 하는 일이 없고, 연산량을 삭감시키는 것이 가능하게 된다.

Claims (16)

  1. 음성신호에 대해서 주파수변환을 실시하고, 주파수변환계수를 산출하는 주파수변환수단과,
    상기 주파수변환수단에 의해 얻어지는 주파수변환계수의 주파수영역을 인간의 청각의 특성에 의거한 대역으로 분할하는 대역분할수단과,
    상기 대역분할수단에 의해 분할된 각 대역마다 주파수변환계수의 절대값의 최대값을 검색하는 검색수단과,
    상기 검색수단에 의해 검출된 최대값이 각 대역에서 미리 설정된 양자화비트수 이하가 되도록 시프트하기 위한 비트수를 산출하는 시프트수 산출수단과,
    각 대역마다 대역 중의 주파수변환계수에 대해 상기 시프트수 산출수단에 의해 산출된 시프트비트수 분량의 시프트처리를 실시하는 시프트처리수단과,
    주파수성분마다 상기 주파수변환계수의 중요도를 산출하는 중요도산출수단과,
    상기 중요도산출수단에 의해 산출된 중요도가 높은 순번으로 상기 시프트처리수단에서 시프트처리된 주파수변환계수의 엔트로피부호화를 실행하는 부호화수단과,
    상기 엔트로피부호화에 의해서 생성된 부호량과, 미리 설정된 목표부호량을 비교하는 비교수단을 구비하고,
    상기 부호화수단은 상기 생성부호량이 상기 목표부호량으로 될 때까지 상기 중요도가 높은 순으로 상기 시프트처리수단에서 시프트처리된 주파수변환계수의 엔트로피부호화를 실행하는 것을 특징으로 하는 음성부호화장치.
  2. 제 1 항에 있어서,
    상기 부호화수단은 상기 엔트로피부호화에 의해서 부호화된 주파수변환계수에 대해서, 주파수 순으로 재차 엔트로피부호화를 실행하는 것을 특징으로 하는 음성부호화장치.
  3. 제 2 항에 있어서,
    상기 주파수 순으로 재차 실행된 엔트로피부호화에 의한 생성부호량과 상기 목표부호량을 비교하는 재생성부호량비교수단을 추가로 가지며,
    상기 부호화수단은 상기 재생성부호량비교수단이 재차의 엔트로피부호화에 의한 생성부호량이 상기 목표부호량을 초과하고 있다고 판단한 경우, 생성부호 중에서 미리 지정된 주파수번호(i)의 주파수변환계수를 삭제하고, 남은 주파수변환계수에 대해서 재차 엔트로피부호화를 실행하는 것을 특징으로 하는 음성부호화장치.
  4. 제 1 항에 있어서,
    상기 부호화수단은 상기 엔트로피부호화로서 레인지 코더에 의한 부호화를 이용하는 것을 특징으로 하는 음성부호화장치.
  5. 제 1 항에 있어서,
    입력된 음성신호를 일정길이의 프레임으로 분할하는 프레임화수단과,
    상기 프레임마다 프레임에 포함되는 음성신호의 진폭의 최대값에 의거하여 해당 음성신호의 진폭을 조정하고, 조정된 음성신호를 상기 주파수변환수단에 출력하는 진폭조정수단을 더 포함하는 것을 특징으로 하는 음성부호화장치.
  6. 제 1 항에 있어서,
    상기 주파수변환수단은 상기 주파수변환으로서 변형이산코사인변환을 이용하는 것을 특징으로 하는 음성부호화장치.
  7. 음성신호에 대해서 주파수변환을 실시하고, 주파수변환계수를 산출하는 주파수변환스텝과,
    상기 주파수변환스텝에 의해 얻어지는 주파수변환계수의 주파수영역을, 인간의 청각의 특성에 의거한 대역으로 분할하는 대역분할스텝과,
    상기 대역분할스텝에 의해 분할된 각 대역마다 주파수변환계수의 절대값의 최대값을 검색하는 검색스텝과,
    상기 검색스텝에 의해 검출된 최대값이 각 대역에서 미리 설정된 양자화비트수 이하가 되도록 시프트하기 위한 비트수를 산출하는 시프트수 산출스텝과,
    각 대역마다 대역중의 주파수변환계수에 대해 상기 시프트수 산출스텝에 의해 산출된 시프트비트수 분량의 시프트처리를 실시하는 시프트처리스텝과,
    주파수성분마다 상기 주파수변환계수의 중요도를 산출하는 중요도산출스텝과,
    상기 중요도산출스텝에 의해 산출된 중요도가 높은 순번으로 상기 시프트처리스텝에서 시프트처리된 주파수변환계수의 엔트로피부호화를 실행하는 부호화스텝과,
    상기 엔트로피부호화에 의해서 생성된 부호량과, 미리 설정된 목표부호량을 비교하는 비교스텝을 구비하고,
    상기 부호화스텝은 상기 생성부호량이 상기 목표부호량으로 될 때까지 상기 중요도가 높은 순으로 상기 시프트처리스텝에서 시프트처리된 주파수변환계수의 엔트로피부호화를 실행하는 것을 특징으로 하는 음성부호화방법.
  8. 제 7 항에 있어서,
    상기 부호화스텝은 상기 엔트로피부호화에 의해서 부호화된 주파수변환계수에 대해서, 주파수 순으로 재차 엔트로피부호화를 실행하는 것을 특징으로 하는 음성부호화방법.
  9. 제 8 항에 있어서,
    상기 주파수 순으로 재차 실행된 엔트로피부호화에 의한 생성부호량과 상기 목표부호량을 비교하는 재생성부호량비교스텝을 추가로 가지며,
    상기 부호화스텝은 상기 재생성부호량비교스텝에 의해 재차의 엔트로피부호화에 의한 생성부호량이 상기 목표부호량을 초과하고 있다고 판단된 경우, 생성부호 중에서 미리 지정된 주파수성분의 주파수변환계수를 삭제하고, 남은 주파수변환계수에 대해서 재차 엔트로피부호화를 실행하는 것을 특징으로 하는 음성부호화방법.
  10. 제 7 항에 있어서,
    상기 부호화스텝은 상기 엔트로피부호화로서 레인지 코더에 의한 부호화를 이용하는 것을 특징으로 하는 음성부호화방법.
  11. 제 7 항에 있어서,
    입력된 음성신호를 일정길이의 프레임으로 분할하는 프레임화스텝과,
    상기 프레임마다 프레임에 포함되는 음성신호의 진폭의 최대값에 의거하여 해당 음성신호의 진폭을 조정하고, 조정된 음성신호를 상기 주파수변환스텝에 출력하는 진폭조정스텝을 더 포함하는 것을 특징으로 하는 음성부호화방법.
  12. 제 7 항에 있어서,
    상기 주파수변환스텝은 상기 주파수변환으로서 변형이산코사인변환을 이용하는 것을 특징으로 하는 음성부호화방법.
  13. 제 1항의 음성부호화 장치에 의해 부호화된 주파수변환계수를 복호하는 복호수단과,
    상기 복호수단에서 복호된 주파수변환계수를 인간의 청각의 특성에 의거한 대역으로 분할하고, 각 대역에서 부호화할 때와 역방향으로 시프트하는 시프트수단과,
    상기 시프트수단에 의해 시프트된 주파수변환계수에 대해, 주파수역변환을 실시하는 주파수역변환수단을 구비하는 것을 특징으로 하는 음성복호장치.
  14. 제 13 항에 있어서,
    상기 복호수단은 복호된 주파수변환계수가 주파수변환시의 주파수변환계수보다도 적은 경우, 부족분의 주파수변환계수에 값 0을 삽입하는 것을 특징으로 하는 음성복호장치.
  15. 제 7항의 음성부호화 방법에 의해 부호화된 주파수변환계수를 복호하는 복호스텝과,
    상기 복호수단에서 복호된 주파수변환계수를 인간의 청각의 특성에 의거한 대역으로 분할하고, 각 대역에서 부호화할 때와 역방향으로 시프트하는 시프트스텝과,
    상기 시프트스텝에 의해 시프트된 주파수변환계수에 대해, 주파수역변환을 실시하는 주파수역변환스텝을 구비하는 것을 특징으로 하는 음성복호방법.
  16. 제 15 항에 있어서,
    상기 복호스텝은 복호된 주파수변환계수가 주파수변환시의 주파수변환계수보다도 적은 경우, 부족분의 주파수변환계수에 값 0을 삽입하는 스텝을 갖는 것을 특징으로 하는 음성복호방법.
KR1020070004990A 2006-01-18 2007-01-17 음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법 KR100904605B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2006-00010319 2006-01-18
JP2006010319A JP4548348B2 (ja) 2006-01-18 2006-01-18 音声符号化装置及び音声符号化方法

Publications (2)

Publication Number Publication Date
KR20070076519A KR20070076519A (ko) 2007-07-24
KR100904605B1 true KR100904605B1 (ko) 2009-06-25

Family

ID=38264338

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070004990A KR100904605B1 (ko) 2006-01-18 2007-01-17 음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법

Country Status (5)

Country Link
US (1) US20070168186A1 (ko)
JP (1) JP4548348B2 (ko)
KR (1) KR100904605B1 (ko)
CN (1) CN101004914B (ko)
TW (1) TWI329302B (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009068083A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation An encoder
JP5483813B2 (ja) * 2007-12-21 2014-05-07 株式会社Nttドコモ マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法
JP5018557B2 (ja) * 2008-02-29 2012-09-05 カシオ計算機株式会社 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム
JP4978539B2 (ja) * 2008-04-07 2012-07-18 カシオ計算機株式会社 符号化装置、符号化方法及びプログラム。
JP2011064961A (ja) * 2009-09-17 2011-03-31 Toshiba Corp 音声再生装置および方法
US20130030796A1 (en) * 2010-01-14 2013-01-31 Panasonic Corporation Audio encoding apparatus and audio encoding method
WO2011155786A2 (ko) * 2010-06-09 2011-12-15 엘지전자 주식회사 엔트로피 복호화 방법 및 복호화 장치
WO2012137617A1 (ja) 2011-04-05 2012-10-11 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
PL3457400T3 (pl) 2012-12-13 2024-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do kodowania głosowego audio, urządzenie do dekodowania głosowego audio, sposób kodowania głosowego audio i sposób dekodowania głosowego audio
JP6318904B2 (ja) * 2014-06-23 2018-05-09 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
JP6398607B2 (ja) 2014-10-24 2018-10-03 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
CN112767953B (zh) * 2020-06-24 2024-01-23 腾讯科技(深圳)有限公司 语音编码方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128404A (ja) * 2003-10-27 2005-05-19 Casio Comput Co Ltd 音声処理装置及び音声符号化方法
JP2005345707A (ja) * 2004-06-02 2005-12-15 Casio Comput Co Ltd 音声処理装置及び音声符号化方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1197619A (en) * 1982-12-24 1985-12-03 Kazunori Ozawa Voice encoding systems
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
JP2878796B2 (ja) * 1990-07-03 1999-04-05 国際電気株式会社 音声符号化器
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
JP3274284B2 (ja) * 1994-08-08 2002-04-15 キヤノン株式会社 符号化装置およびその方法
JP3353868B2 (ja) * 1995-10-09 2002-12-03 日本電信電話株式会社 音響信号変換符号化方法および復号化方法
JP3998281B2 (ja) * 1996-07-30 2007-10-24 株式会社エイビット デジタル音声信号の帯域分割符号化方法と復号化方法
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
KR100354531B1 (ko) * 1998-05-06 2005-12-21 삼성전자 주식회사 실시간 복호화를 위한 무손실 부호화 및 복호화 시스템
US6300888B1 (en) * 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
US6975254B1 (en) * 1998-12-28 2005-12-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Methods and devices for coding or decoding an audio signal or bit stream
US6499010B1 (en) * 2000-01-04 2002-12-24 Agere Systems Inc. Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
JP2002135122A (ja) * 2000-10-19 2002-05-10 Nec Corp オーディオ信号符号化装置
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
CN1301014C (zh) * 2001-11-22 2007-02-14 松下电器产业株式会社 可变长度编码方法以及可变长度解码方法
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
CN100401778C (zh) * 2002-09-17 2008-07-09 弗拉迪米尔·切佩尔科维奇 具有高压缩率和最小必需资源的快速codec
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
KR101015497B1 (ko) * 2003-03-22 2011-02-16 삼성전자주식회사 디지털 데이터의 부호화/복호화 방법 및 장치
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
JP4301091B2 (ja) * 2004-06-23 2009-07-22 日本ビクター株式会社 音響信号符号化装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005128404A (ja) * 2003-10-27 2005-05-19 Casio Comput Co Ltd 音声処理装置及び音声符号化方法
JP2005345707A (ja) * 2004-06-02 2005-12-15 Casio Comput Co Ltd 音声処理装置及び音声符号化方法

Also Published As

Publication number Publication date
JP4548348B2 (ja) 2010-09-22
CN101004914B (zh) 2011-03-16
TWI329302B (en) 2010-08-21
CN101004914A (zh) 2007-07-25
TW200805253A (en) 2008-01-16
US20070168186A1 (en) 2007-07-19
JP2007193043A (ja) 2007-08-02
KR20070076519A (ko) 2007-07-24

Similar Documents

Publication Publication Date Title
KR100904605B1 (ko) 음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법
US8019601B2 (en) Audio coding device with two-stage quantization mechanism
KR100840439B1 (ko) 음성부호화장치 및 음성복호장치
EP2282310B1 (en) Entropy coding by adapting coding between level and run-length/level modes
JP4981174B2 (ja) 確率テーブルの動的な計算によるシンボルプレーン符号化/復号化
US7433824B2 (en) Entropy coding by adapting coding between level and run-length/level modes
US9842603B2 (en) Encoding device and encoding method, decoding device and decoding method, and program
WO1998000837A1 (fr) Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio
KR20120008537A (ko) 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
JP5609591B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
US20100082589A1 (en) Computation apparatus and method, quantization apparatus and method, and program
US20050075888A1 (en) Fast codebook selection method in audio encoding
JP4734859B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4702645B2 (ja) 演算装置および方法、量子化装置および方法、並びにプログラム
JP4273062B2 (ja) 符号化方法、符号化装置、復号化方法及び復号化装置
JP5018557B2 (ja) 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム
JP5724338B2 (ja) 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
KR101644883B1 (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130524

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140522

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150605

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160517

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170522

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180530

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190530

Year of fee payment: 11