KR100463419B1 - 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 - Google Patents

적은 복잡도를 가진 고정 코드북 검색방법 및 장치 Download PDF

Info

Publication number
KR100463419B1
KR100463419B1 KR10-2002-0069600A KR20020069600A KR100463419B1 KR 100463419 B1 KR100463419 B1 KR 100463419B1 KR 20020069600 A KR20020069600 A KR 20020069600A KR 100463419 B1 KR100463419 B1 KR 100463419B1
Authority
KR
South Korea
Prior art keywords
pulse position
track
pulse
fixed codebook
prediction vector
Prior art date
Application number
KR10-2002-0069600A
Other languages
English (en)
Other versions
KR20040041740A (ko
Inventor
이응돈
김도영
김봉태
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR10-2002-0069600A priority Critical patent/KR100463419B1/ko
Priority to US10/671,649 priority patent/US20040093368A1/en
Publication of KR20040041740A publication Critical patent/KR20040041740A/ko
Application granted granted Critical
Publication of KR100463419B1 publication Critical patent/KR100463419B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook

Abstract

본 발명은 복잡도가 낮은 고정 코드북 검색 방법 및 장치에 관한 것으로, 구체적으로는 CELP(Code Excited Linear Prediction) 방식의 음성 부호화기에서 사용되는 고정 코드북 검색 방법 및 장치에 관한 것이다. 본 발명의 고정 코드북 검색방법은 트랙별로 각 펄스 위치에 대한 펄스 위치 최우 예측 벡터의 절대값을 계산하는 단계; 최우 예측 벡터의 절대값이 큰 값을 가지는 순서대로 소정의 개수만큼 상기 각 트랙별로 펄스 위치를 선택하는 단계; 선택된 각 트랙별 펄스 위치들 중에서 각 트랙별로 하나씩 선택하여 만들 수 있는 가능한 조합을 모두 만들어 전수검색을 수행하는 단계; 및 전수 검색된 펄스 위치 조합 중에서 하나의 펄스 위치 조합을 선택하는 단계를 구비한다. 본 발명의 방법을 사용하면 음질은 약간 떨어지지만 음성 부호화기의 고정 코드북 검색시 계산량을 대폭 감소시키는 효과가 있다.

Description

적은 복잡도를 가진 고정 코드북 검색방법 및 장치{Fixed codebook searching method with low complexity, and apparatus thereof}
본 발명은 복잡도가 낮은 고정 코드북 검색 방법 및 장치에 관한 것으로, 구체적으로는 CELP(Code Excited Linear Prediction) 방식의 음성 부호화기에서 사용되는 고정 코드북 검색 방법 및 장치에 관한 것이다.
음성을 전송에 적합한 디지털 신호로 변환시키기 위한 다양한 방법이 사용되고 있다. 특히, 이동통신 환경하에서는 제한된 채널에 더 많은 사용자를 수용해야 하며, 더 낮은 전송 비트수(bit rate)로 음성 데이터를 전송하면서 더 좋은 음성 품질을 얻어야 한다. 이와 같이 음성을 디지털 신호로 변환하고 다시 이를 압축하는 기능을 보코더(vocoder)가 수행한다. 보코더는 음성을 코딩하는 장치로, 파형 부호화기(waveform codec), 음원 부호화기(source codec) 및 혼성 부호화기(hybrid codec) 등 여러 종류로 나눌 수 있으며, CELP 부호화기는 낮은 전송 비트수의 음성인코딩시에 사용되는 압축 알고리즘을 사용한 혼성 부호화기의 한 종류로, 16kbps 보다 낮은 전송 비트수(bit rate)를 가지면서도 좋은 음질의 음성 신호를 만들어 낸다.
CELP 부호화기는 서로 다른 백색 가우시안 잡음(white gaussian noise)을 가지고 코드북(codebook)을 구성하고, 입력되는 음성신호와 합성음과의 오차가 최소가 되는 최적의 백색 잡음열에 해당하는 인덱스를 음성신호 대신 전송하여 압축효과를 얻는다. 그리고, VoIP(Voice over Internet Protocol)용 게이트웨이의 채널용량은 음성 부호화기의 복잡도에 의해 크게 좌우되고, CELP 방식을 사용하는 음성 부호화기의 복잡도는 고정 코드북 검색(fixed codebook search) 방식에 따라 결정된다.
표 1은 G.729 음성 부호화기의 고정 코드북 구조를 도시한 도표이다.
트랙 펄스 부호 펄스 위치
0 i 0 s 0:±1 m 0: 0 5 10 15 20 25 30 35
1 i 1 s 1:±1 m 1: 1 6 11 16 21 26 31 36
2 i 2 s 2:±1 m 2: 2 7 12 17 22 27 32 37
3 i 3 s 3:±1 m 3: 3 8 13 18 23 28 33 384 9 14 19 24 29 34 39
표 1에서 도시한 바와 같이, 트랙 0, 1, 2, 3에 각각 펄스 i0, i1,i2,i3을 가지며, 각 펄스는 +1 또는 -1의 크기를 갖는다. 또한 트랙 0에서 펄스 위치 인덱스는 0, 5, 10, ..., 35이고, 트랙 1에서 펄스 위치 인덱스는 1, 6, 11, ..., 36이고, 트랙 2에서 펄스 위치 인덱스는 2, 7, 12, ..., 37이고, 트랙 3에서 펄스 위치 인덱스는 3, 8, 13, ..., 39이다. 이때 고정 코드북을 탐색한다는 것은 트랙 0, 1,2, 3에서 트랙별 최적 펄스의 위치를 찾아내는 것을 의미한다.
G.729의 고정 코드북 벡터는 40개의 펄스(부프레임의 샘플 수와 동일) 중 4개의 펄스만을 가지고 그 크기도 -1 또는 +1로 제한되어 있다. 4개의 펄스는 표 1에 도시된 4개의 트랙에서 한 개씩만 취할 수 있고 트랙 3은 다른 트랙과는 달리 펄스 위치가 16가지입니다. 이것은 G.729만이 가지는 특징이다. 고정 코드북을 검색한다는 것은 바로 40개의 펄스 위치중에서 가장 최적의 4개의 펄스 위치와 부호를 찾는 것이다.
고정 코드북 검색 방식 중에서 G.723.1 표준의 6.3kbps 음성 부호화기에서 사용되는 전수 검색 방식은 가능한 모든 펄스 위치에 대해서 검색을 수행하는 방식이다. 따라서, 음질은 우수하나 계산량이 많아 고정 코드북 검색 시간이 필요 이상으로 오래 걸리는 문제점이 있다.
이러한 전수 검색 방식을 사용한 고정 코드북 검색 방식의 문제점을 보완하기 위하여 G.729 표준이나 G.723.1 표준의 5.3kbps와 같은 음성 부호화기에서는 집중 검색(focused search) 방식을 사용하고 있다. 집중 검색 방식은 트랙 0, 1, 2의 각 펄스 위치를 보고 문턱값을 미리 설정하고, 트랙 0, 1, 2의 트랙별로 펄스 위치에 대한 조합을 만들고 이 조합에 대한 상관도 벡터 크기의 합산값과 문턱값을 비교하여 문턱값을 넘는 트랙 0, 1, 2의 펄스 위치 조합에 대해서만 트랙 3의 펄스 위치를 검색하는 방식이다. 그러나 이러한 집중 검색 방식은 트랙 0, 1, 2의 펄스 위치에 대한 모든 조합에 대해 문턱값과 비교함으로써 계산량이 많고 복잡도가 일정하지 않다는 문제점이 있다.
상술한 문제점을 해결하기 위해 G.729A, AMR-NB(Adaptive Multi Rate-Narrow Band), AMR-WB(Adaptive Multi Rate-Wide Band) 표준을 사용하는 음성 부호화기에서는 깊이 우선 트리 검색(depth first tree search) 방식을 사용한다. 깊이 우선 트리 검색 방식은 2개의 트랙씩 펄스 위치에 대한 검색을 연속적으로 수행해 나가는 방식이다. 2개의 트랙중 하나의 트랙에서는 상관도 값에 의해 먼저 몇 개 후보 펄스 위치를 선택한 후 나머지 트랙에 대해 검색을 수행하므로, 계산량을 대폭 감소시킬 수 있고 복잡도가 일정하다. 그러나 깊이 우선 트리 검색 방식도 음질에 비해 계산량이 다소 많다는 문제점이 있다.
본 발명이 이루고자 하는 기술적 과제는, 종래의 고정 코드북 검색방식의 문제점을 해결하기 위하여 음질은 약간 떨어지지만 음성 부호화기의 고정 코드북 검색에 소요되는 계산량을 크게 감소시킴으로써 음질 대비 복잡도를 대폭 낮춘 고정 코드북 검색방법을 제공하는데 있다.
도 1은 본 발명의 고정 코드북 검색 방법의 순서도이다.
도 2는 본 발명의 고정 코드북 검색장치의 블록도이다.
상기의 과제를 이루기 위하여 본 발명에 의한 고정 코드북 검색방법은, 트랙별로 각 펄스 위치에 대한 펄스 위치 최우 예측 벡터의 절대값을 계산하는 단계; 상기 최우 예측 벡터의 절대값이 큰 값을 가지는 순서대로 소정의 개수만큼 상기 각 트랙별로 펄스 위치를 선택하는 단계; 상기 선택된 각 트랙별 펄스 위치들 중에서 각 트랙별로 하나씩 선택하여 만들 수 있는 가능한 조합을 모두 만들어 전수검색을 수행하는 단계; 및 상기 전수 검색된 펄스 위치 조합 중에서 하나의 펄스 위치 조합을 선택하는 단계를 구비한다.
상기의 과제를 이루기 위하여 본 발명에 의한 고정 코드북 검색장치는, 트랙별로 각 펄스 위치에 대한 펄스 위치 최우 예측 벡터의 절대값을 계산하는 펄스위치 최우예측벡터 크기 계산부; 상기 펄스 위치 최우 예측 벡터의 절대값 정보를 이용하여 상기 최우 예측 벡터의 절대값이 큰 값을 가지는 순서대로 소정의 개수만큼 상기 각 트랙별로 펄스 위치를 선택하는 펄스 위치 선택부; 상기 선택된 각 트랙별 펄스 위치들 중에서 각 트랙별로 하나씩 선택하여 만들 수 있는 가능한 조합을 모두 만들어 전수검색을 수행하는 전수검색 수행부; 및 상기 전수 검색된 펄스 위치 조합 중에서 하나의 펄스 위치 조합을 선택하는 최적 펄스 위치 선택부를 구비한다.
상기한 과제를 이루기 위하여 본 발명에서는, 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
고정 코드북 검색은 다음의 수학식 1을 최대화하는 코드북 벡터를 선택하는 것이다.
여기서 c k k번째 고정 코드북 벡터이고t는 전치 행렬(transpose matrix)을 나타내며, 상관도 벡터인 d 와 선형 예측 합성 필터의 임펄스 응답간의 상관도인 φ는 각각 다음 수학식 2와 수학식 3과 같이 표현된다.
상기 수학식 2에서x 2(n)는 고정 코드북 검색이 수행되는 대상 신호이고,h(n)는 저주파 통과(Low Pass : LP) 합성필터의 임펄스 응답을 나타낸다. 또한, 상기 수학식 1에서 C와 E는 다음 수학식 4 및 수학식 5와 같이 나타낼 수 있다.
여기서m i i번째 펄스 위치를 의미한다.b(n)는 펄스 위치 최우 예측 벡터(pulse position likelihood estimate vector)로서 다음 수학식 6과 같이 표현된다.
여기서r LTP (n)은 피치 잔여 신호를 의미한다.
도 2는 본 발명의 고정 코드북 검색 방법의 순서도이다.
우선 트랙별로 각 펄스 위치에 대한 펄스 위치 최우 예측 벡터의 값을 계산한다(S110). 보다 구체적으로는 트랙별 각 펄스 위치에 대한 펄스 위치 최우 예측 벡터의 절대값 |b(n)|을 결정한다. 펄스 위치 최우 예측 벡터는 최적 펄스 위치가 될 확률정보를 내포하고 있는 벡터이다.
표 2는 G.729의 특정 부프레임(subframe)에서 트랙 0, 1, 2, 3의 각 펄스 위치에 대한 펄스 위치 최우 예측 벡터의 절대값을 도시한 도표이다.
부프레임의 의미는 다음과 같다. 일반적으로 CELP 방식의 음성 부호화기에서는 프레임(frame)과 부프레임(subframe)이란 용어의 의미가 다르다. 먼저 음성 샘플은 프레임으로 쪼개어지고 다시 프레임은 몇 개의 부프레임으로 나누어진다. 이렇게 분리하는 이유는 음성 코딩 및 디코딩시 프레임별로 처리되는 과정도 있고 부프레임별로 처리되는 과정도 있기 때문이다.
예를 들면 G.723.1의 프레임 크기는 30msec(8kHz로 샘플링할 경우 240 샘플)이고 부프레임 크기는 7.5msec(8kHz로 샘플링할 경우 60 샘플)로서 프레임당 4개의 부프레임으로 구성된다. 그리고 G.729의 프레임 크기는 10msec(8kHz로 샘플링할 경우 80 샘플)이고 부프레임 크기는 5msec(8kHz로 샘플링할 경우 40 샘플 - 표 1 G.729의 고정 코드북 구조에서 펄스 위치가 40개인 이유가 이 때문임)로서 프레임당 2개의 부프레임으로 구성된다. 그리고, 고정 코드북은 이 부프레임에 대해서 검색을 수행한다.
트랙 펄스 위치 최우 예측 벡터의 절대값
0 0.10 0.31 0.15 0.02 0.10 0.17 0.67 0.35
1 0.29 0.07 0.06 0.21 0.00 0.04 0.32 0.00
2 0.36 0.17 0.06 0.04 0.34 0.29 0.66 0.05
3 0.180.33 0.080.05 0.430.13 0.060.26 0.100.11 0.480.11 0.160.11 0.120.05
그리고 나서, 트랙별로 M개의 펄스 위치를 선택한다(S120). 즉 전 단계(S110)에서 구한 펄스 위치 최우 예측 벡터의 절대값으로부터 트랙당 펄스 위치 최우 예측 벡터의 절대값이 큰 위치부터 M개의 펄스 위치만을 선택한다. 예를 들어, 만일 M=3이라면 표 2의 예에서 트랙 0에서는 0.67, 0.35, 0.31 값을 갖는 펄스 위치인 펄스 위치 30, 35, 5를 선택하고, 트랙 1에서는 0.32, 0.29, 0.21 값을 갖는 펄스 위치 31, 1, 16을 선택하고, 트랙 2에서는 0.66, 0.36, 0.34 값을 갖는 펄스 위치 32, 2, 22를 선택하고, 트랙 3에서는 0.48, 0.43, 0.18 값을 갖는 펄스 위치 28, 13, 3과, 0.33, 0.26, 0.13 값을 갖는 펄스 위치 4, 19, 14를 선택한다. 이렇게 선택하여 얻어진 결과가 표 3에 도시되어 있다.
만일 M=2인 경우에는 2개만 선택을 하여야 하므로, 가장 큰 절대값을 갖는 순서대로 트랙 0에서는 펄스 위치 30, 35를 선택하고, 트랙 1에서는 펄스 위치 31, 1을 선택하고, 트랙 2에서는 펄스 위치 32, 2를 선택하고, 트랙 3에서는 펄스 위치 28, 13과 4, 19를 선택한다.
표 3은 G.729의 특정 부프레임에서 최적 펄스 위치의 후보로 선택되는 트랙별 펄스 위치의 수를 세 개씩 설정한 경우와 두 개씩 설정한 경우 선택된 펄스 위치를 나타낸 도표이다. 즉 표 3의 좌측표는 M=3인 경우이고, 우측표는 M=2인 경우에 선택된 펄스 위치를 나타낸다.
트랙 선택된 펄스 위치
0 5 30 35
1 1 16 31
2 2 22 32
3 34 1314 2819
트랙 선택된 펄스 위치
0 30 35
1 1 31
2 2 32
3 134 2819
다음으로 표 3과 같이 선택된 펄스 위치에 대해 전수 검색을 수행한다(S130). 즉, 각 트랙에서 한 개씩의 펄스 위치를 선택한다. 그리고, 이렇게 선택할 수 있는 가능한 조합을 모두 만들어서 전수 검색을 수행한다. M=3인 경우를 예를 들어 전수검색 과정을 설명하면 다음과 같다. (5, 1, 2, 3), (5, 1, 2, 4), (5, 1, 2, 13)... , (5, 1, 2, 28), (5, 1, 2, 19), (5, 1, 22, 3), (5, 1, 22, 4), ... , (5, 1, 22, 28), (5, 1, 22, 19), ... , (35, 31, 32, 28), (35, 31, 32, 19)과 같이 4개의 트랙에서 펄스 위치를 1개씩 취하여 모든 조합에 대해서 수학식 1을 계산한다.
검색횟수를 살펴보면 표 3에서 G.729 음성 부호화기에 대해 트랙별로 선택된 펄스 위치의 수가 3일 경우 3x3x3x(3+3)=162번 검색을 수행하고 트랙별로 선택된 펄스 위치의 수가 2일 경우 2x2x2x(2+2)=32번 검색을 수행한다.
다음 단계는 전수 검색된 각 트랙별 선택된 펄스 위치 중 최적의 펄스 위치를 선택하는 단계이다(S140). 이 단계는 선택된 펄스에 대해 전수 검색한 후 상술한 수학식 1을 만족하는 최적의 펄스 위치를 선택하는 것이다. 이렇게 하여 부프레임에 대한 고정 코드북 검색이 완료된다. 그러면 각 트랙별로 선택된 최적의 펄스 위치 한쌍이 출력된다.
상술한 방법에 의해 각 트랙에서 최적 펄스 위치가 될 확률이 큰 몇 개의 펄스 위치에 대해서만 전수 검색 방식을 적용함으로써 음질은 약간 떨어지지만 음성 부호화기의 고정 코드북 검색 방식에 소요되는 계산량을 획기적으로 줄일 수 있다.
또한 본 발명에 의한 음성 부호화기의 고정 코드북 검색 방식은 대수 코드북 구조를 갖는 여러 가지 형태의 고정 코드북 검색에 사용될 수 있다.
도 2는 본 발명의 고정 코드북 검색장치의 블록도이다.
펄스위치 최우예측벡터 크기 계산부(210)는 트랙별로 각 펄스 위치에 대한 펄스 위치 최우 예측 벡터의 크기를 계산한다. 수학식 6을 사용하여 트랙별로 펄스 위치 최우 예측 벡터의 절대값을 계산한다.
펄스 위치 선택부(220)는 최우 예측 벡터의 절대값 정보를 이용하여 트랙당 펄스 위치 최우 예측 벡터의 크기가 큰 위치부터 M개의 펄스 위치를 선택한다.
전수검색 수행부(230)는 펄스 위치 선택부(220)에서 선택된 펄스 위치에 대해 전수 검색을 수행한다.
최적 펄스 위치 선택부(240)는 상기 전수 검색된 각 트랙별 펄스 위치 중 최적의 펄스 위치를 선택한다. 즉 상술한 수학식 1을 만족하는 최적의 펄스 위치를 선택한다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
상술한 바와 같이 본 발명의 고정 코드북 검색방법을 사용하면, 음질은 약간 떨어지지만 음성 부호화기의 고정 코드북 검색 수행시 계산량을 대폭 감소시키는 효과가 있다.
실험 결과에 의하면 G.729A의 음성 부호화기에 본 발명을 적용하여 트랙당두 개의 펄스 위치를 선택하도록 설정한 경우에, 종래의 깊이 우선 트리 검색 방식에 비해 음질은 PESQ(Perceptual Evaluation of Speech Quality) MOS(Mean Opinion Score) 값이 약 0.15정도가 얻어져 음질은 다소 떨어지나 검색횟수가 192번에서 32번으로 획기적으로 감소하는 효과가 있다.

Claims (8)

  1. 트랙별로 각 펄스 위치에 대한 펄스 위치 최우 예측 벡터의 절대값을 계산하는 단계;
    상기 최우 예측 벡터의 절대값이 큰 값을 가지는 순서대로 소정의 개수만큼 상기 각 트랙별로 펄스 위치를 선택하는 단계;
    상기 선택된 각 트랙별 펄스 위치들 중에서 각 트랙별로 하나씩 선택하여 만들 수 있는 가능한 조합을 모두 만들어 전수검색을 수행하는 단계; 및
    상기 전수 검색된 펄스 위치 조합 중에서 하나의 펄스 위치 조합을 선택하는 단계를 포함하는 것을 특징으로 하는 고정 코드북 검색방법.
  2. 제1항에 있어서,
    상기 전수 검색된 펄스 위치 조합 중에서 하나의 펄스 위치 조합을 선택하는 단계는 다음의 수학식을 만족시키는 펄스 위치를 검색하는 것을 특징으로 하는 고정 코드북 검색방법.
    여기서 c k k번째 고정 코드북 벡터이고t는 전치 행렬(transpose matrix)을 나타내며, d 는 상관도 벡터를 나타낸다.
  3. 제1항에 있어서, 상기 펄스 위치 최우 예측 벡터는
    피치 잔여 신호와 상관도 벡터에 의해서 결정되는 것을 특징으로 하는 고정 코드북 검색방법.
  4. 제1항에 있어서, 상기 펄스 위치 최우 예측 벡터는
    다음의 수학식과 같이 표현되는 것을 특징으로 하는 고정 코드북 검색방법.
    여기서r LTP (n)은 피치 잔여 신호를 의미하고 d는 상관도 벡터를 의미한다.
  5. 트랙별로 각 펄스 위치에 대한 펄스 위치 최우 예측 벡터의 절대값을 계산하는 단계;
    상기 최우 예측 벡터의 절대값이 큰 값을 가지는 순서대로 소정의 개수만큼 상기 각 트랙별로 펄스 위치를 선택하는 단계;
    상기 선택된 각 트랙별 펄스 위치들 중에서 각 트랙별로 하나씩 선택하여 만들 수 있는 가능한 조합을 모두 만들어 전수검색을 수행하는 단계; 및
    상기 전수 검색된 펄스 위치 조합 중에서 하나의 펄스 위치 조합을 선택하는 단계를 포함하는 것을 특징으로 하는 고정 코드북 검색방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  6. 트랙별로 각 펄스 위치에 대한 펄스 위치 최우 예측 벡터의 절대값을 계산하는 펄스위치 최우예측벡터 크기 계산부;
    상기 펄스 위치 최우 예측 벡터의 절대값 정보를 이용하여 상기 최우 예측 벡터의 절대값이 큰 값을 가지는 순서대로 소정의 개수만큼 상기 각 트랙별로 펄스 위치를 선택하는 펄스 위치 선택부;
    상기 선택된 각 트랙별 펄스 위치들 중에서 각 트랙별로 하나씩 선택하여 만들 수 있는 가능한 조합을 모두 만들어 전수검색을 수행하는 전수검색 수행부; 및
    상기 전수 검색된 펄스 위치 조합 중에서 하나의 펄스 위치 조합을 선택하는 최적 펄스 위치 선택부를 포함하는 것을 특징으로 하는 고정 코드북 검색장치.
  7. 제1항에 있어서, 상기 펄스 위치 최우 예측 벡터는
    피치 잔여 신호와 상관도 벡터의 함수로 표현되는 것을 특징으로 하는 고정 코드북 검색장치.
  8. 제1항에 있어서, 상기 펄스 위치 최우 예측 벡터는
    다음의 수학식과 같이 표현되는 것을 특징으로 하는 고정 코드북 검색장치.
    여기서r LTP (n)은 피치 잔여 신호를 의미하고 d는 상관도 벡터를 의미한다.
KR10-2002-0069600A 2002-11-11 2002-11-11 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 KR100463419B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR10-2002-0069600A KR100463419B1 (ko) 2002-11-11 2002-11-11 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
US10/671,649 US20040093368A1 (en) 2002-11-11 2003-09-26 Method and apparatus for fixed codebook search with low complexity

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0069600A KR100463419B1 (ko) 2002-11-11 2002-11-11 적은 복잡도를 가진 고정 코드북 검색방법 및 장치

Publications (2)

Publication Number Publication Date
KR20040041740A KR20040041740A (ko) 2004-05-20
KR100463419B1 true KR100463419B1 (ko) 2004-12-23

Family

ID=32226279

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-0069600A KR100463419B1 (ko) 2002-11-11 2002-11-11 적은 복잡도를 가진 고정 코드북 검색방법 및 장치

Country Status (2)

Country Link
US (1) US20040093368A1 (ko)
KR (1) KR100463419B1 (ko)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100772199B1 (ko) * 2006-09-29 2007-11-01 한국전자통신연구원 VoIP 서비스의 품질보장을 위한 통화 잡음 제거장치 및방법, 그리고 이를 적용한 VoIP 단말
ES2529292T3 (es) 2007-04-29 2015-02-18 Huawei Technologies Co., Ltd. Método de codificación y de decodificación
CN100530357C (zh) * 2007-07-11 2009-08-19 华为技术有限公司 固定码书搜索方法及搜索器
CN100578619C (zh) * 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
US7898763B2 (en) * 2009-01-13 2011-03-01 International Business Machines Corporation Servo pattern architecture to uncouple position error determination from linear position information
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
CN102623012B (zh) 2011-01-26 2014-08-20 华为技术有限公司 矢量联合编解码方法及编解码器
PL2661745T3 (pl) 2011-02-14 2015-09-30 Fraunhofer Ges Forschung Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio
TR201903388T4 (tr) * 2011-02-14 2019-04-22 Fraunhofer Ges Forschung Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi.
MX2013009303A (es) 2011-02-14 2013-09-13 Fraunhofer Ges Forschung Codec de audio utilizando sintesis de ruido durante fases inactivas.
AR085794A1 (es) 2011-02-14 2013-10-30 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral
SG192746A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for processing a decoded audio signal in a spectral domain
WO2012110448A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
AU2012217158B2 (en) 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822724A (en) * 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
KR20000074365A (ko) * 1999-05-20 2000-12-15 윤종용 음성 부호화시에 대수코드북에서의 대수코드 탐색방법
KR20010095585A (ko) * 2000-04-11 2001-11-07 대표이사 서승모 음성 부호화기의 고정코드북 고속탐색 방법
KR20010095909A (ko) * 2000-04-12 2001-11-07 윤종용 에이켈프 음성 압축기의 코드북 검색 장치 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822724A (en) * 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
KR20000074365A (ko) * 1999-05-20 2000-12-15 윤종용 음성 부호화시에 대수코드북에서의 대수코드 탐색방법
KR20010095585A (ko) * 2000-04-11 2001-11-07 대표이사 서승모 음성 부호화기의 고정코드북 고속탐색 방법
KR20010095909A (ko) * 2000-04-12 2001-11-07 윤종용 에이켈프 음성 압축기의 코드북 검색 장치 및 방법

Also Published As

Publication number Publication date
KR20040041740A (ko) 2004-05-20
US20040093368A1 (en) 2004-05-13

Similar Documents

Publication Publication Date Title
US8185385B2 (en) Method for searching fixed codebook based upon global pulse replacement
KR100463419B1 (ko) 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
CA2202825C (en) Speech coder
US6385576B2 (en) Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
CA2271410C (en) Speech coding apparatus and speech decoding apparatus
JPH0990995A (ja) 音声符号化装置
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JPH07160294A (ja) 音声復号装置
KR100463559B1 (ko) 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
KR100503414B1 (ko) 고정 코드북의 집중 검색 방법 및 장치
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
CA2336360C (en) Speech coder
Ozawa et al. MP‐CELP speech coding based on multipulse vector quantization and fast search
KR100550003B1 (ko) 상호부호화기에서 개회로 피치 추정 방법 및 그 장치
KR100463418B1 (ko) Celp 음성 부호화기에서 사용되는 가변적인 고정코드북 검색방법 및 장치
EP1154407A2 (en) Position information encoding in a multipulse speech coder
JP3299099B2 (ja) 音声符号化装置
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
Yoon et al. An efficient transcoding algorithm for G. 723.1 and G. 729A speech coders: interoperability between mobile and IP network
JP3471542B2 (ja) 音声符号化装置
JP2004309686A (ja) 広帯域音声符号化方法及び広帯域音声符号化装置
JPH08320700A (ja) 音声符号化装置
JPH08171400A (ja) 音声符号化装置
Huong et al. A new vocoder based on AMR 7.4 kbit/s mode in speaker dependent coding system
KR100309873B1 (ko) 코드여기선형예측부호화기에서무성음검출에의한부호화방법

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20091228

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee