KR100283087B1 - 음성 및 톤 부호화 방법 - Google Patents
음성 및 톤 부호화 방법 Download PDFInfo
- Publication number
- KR100283087B1 KR100283087B1 KR1019980059097A KR19980059097A KR100283087B1 KR 100283087 B1 KR100283087 B1 KR 100283087B1 KR 1019980059097 A KR1019980059097 A KR 1019980059097A KR 19980059097 A KR19980059097 A KR 19980059097A KR 100283087 B1 KR100283087 B1 KR 100283087B1
- Authority
- KR
- South Korea
- Prior art keywords
- tone
- signal
- function
- autocorrelation function
- input signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000005311 autocorrelation function Methods 0.000 claims abstract description 30
- 238000004458 analytical method Methods 0.000 claims abstract description 20
- 230000005540 biological transmission Effects 0.000 claims abstract description 13
- 230000008569 process Effects 0.000 claims abstract description 13
- 230000003595 spectral effect Effects 0.000 claims description 13
- 230000000737 periodic effect Effects 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 6
- 230000009977 dual effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- SGVWDRVQIYUSRA-UHFFFAOYSA-N 1-[2-[2-(2,5-dioxopyrrol-1-yl)ethyldisulfanyl]ethyl]pyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1CCSSCCN1C(=O)C=CC1=O SGVWDRVQIYUSRA-UHFFFAOYSA-N 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. 청구범위에 기재된 발명이 속하는 기술분야
본 발명은 송신시스템에서의 음성 및 톤 부호화 방법에 관한 것임.
2. 발명이 해결하고자 하는 기술적 과제
본 발명은 톤 전송시의 왜곡을 현저하게 감소시키고, 수신단의 변경없이 톤을 음성신호와 동일 채널로 보내기 위한 방법을 제공하고자 함.
3. 발명의 해결 방법의 요지
본 발명은 음성 및 톤 부호화 방법에 있어서, 입력신호에 대하여 자기상관함수를 구하여 저장하고, 상기 자기상관함수에 이항식 윈도우를 곱하며, 선형예측분석을 수행하는 제1단계; 입력신호가 톤신호이면 이항식 윈도우를 곱하지 않은 상기 저장된 자기상관함수를 이용하여 백색잡음을 수정하고, 선형계수를 구하여 전송하는 제2단계; 입력신호가 음성신호이면 제1단계의 선형예측분석 과정에서 구한 선형계수를 전송하는 제3단계; 및 제2단계 및 제3단계 중 어느 한 단계로부터 선형계수 및 신호를 입력받아 자기상관함수의 최대값 갱신 조건을 갱신시킨 개방 루프 피치주기를 검색하는 제 4 단계를 포함함.
4. 발명의 중요한 용도
본 발명은 톤신호의 전송에 이용됨.
Description
본 발명은, 음성통신 분야에 관한 것으로서, 특히 저 전송율 음성부호화기에서의 음성 및 톤 부호화 방법 및 그것을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 관한 것이다.
도 1a 및 도 1b 는 종래의 이중모드 부호화 시스템의 일실시예 구성도로서, 도 1a 는 송신단이며, 도 1b 는 수신단이다.
일반적으로, 종래의 부호화기(예컨데 G.723.1 등)(이하 간단히 "부호화기"라함)를 이용한 기존의 음성통신 방식에서는 도 1 에서 보는 바와 같이 이중음 다주파 신호(Dual Tone Multifrequency : 이하 "DTMF"이라함) 전송을 위해 DTMF 톤과 음성을 송신단에서 미리 구분하여 DTMF의 경우 별도의 데이터 채널로 전송하는 방법을 사용하는데, 이 방법은 상호 호환성문제가 있고 별도의 데이터 채널의 추가로 인한 관리의 불편함(103,104)이 따르며, 수신단에 다시 DTME 톤 발생기(106)를 실장 하여야 한다는 문제점이 있다.
도 2a 및 도 2b 는 종래의 부호화기를 통과 했을 때의 스펙트럼 왜곡을 나타내는 일실시예 스펙트럼도로서, 도 2a 는 부호화기를 통과하기 전의 스펙트럼이며, 도 2b 는 부호화기를 통과한 다음의 스펙트럼이다.
낮은 전송속도에서 중간정도의 품질(toll quality)의 음질을 갖는 부호화기는 제한된 전송률로 음성신호를 가장 잘 모델링 하도록 최적화되어 있기 때문에 도 2 에서 볼 수 있듯이 음성 대역의 톤 신호인 DTMF 톤의 전송시에는 피크(peak) 주파수의 변경, 잡음(noise) 발생, 한쪽 톤의 크기가 커지는 비틀림(twist) 등의 왜곡이 발생되어 수신단에서의 검출이 어려운 경우가 많이 발생한다.
일반적으로 이 문제의 해결을 위하여 도 1a 에 도시된 바와 같이 DTMF 톤의 경우 별도의 데이터 채널을 통해 전송하는 방식이 사용되고 있으나, 음성신호와 동일 채널로 전송하는 방식에 비하여 불편함이 따른다.
즉, 상기한 바와 같은 종래의 기술은, 전송시의 왜곡이 심할 뿐 아니라, 별도의 데이터 채널의 추가로 인한 관리의 불편함이 따르며, 수신단에 장치를 추가하여야 한다는 문제점이 있다.
상기 종래의 문제점을 해결하기 위하여 안출된 본 발명은, 종래의 부호화기의 구조를 변경시킴으로써 DTMF 톤 전송시의 왜곡을 현저하게 감소시키고, 그 결과로 수신단의 변경없이 DTMF 톤을 음성신호와 동일 채널로 보내기 위한, 음성 및 톤 부호화 방법 및 그것을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는데 그 목적이 있다.
도 1a 및 도 1b 는 종래의 이중모드 부호화 시스템의 일실시예 구성도.
도 2a 및 도 2b 는 종래의 부호화기를 통과 했을 때의 스펙트럼 왜곡을 나타내는 일실시예 스펙트럼도.
도 3 은 본 발명이 적용되는 이중모드 부호화기의 일실시예 구성도.
도 4 는 본 발명이 적용되는 음성모드 부호화기의 일실시예 상세 구성도.
도 5 는 본 발명이 적용되는 톤모드 부호화기의 일실시예 상세 구성도.
도 6 은 본 발명에 따른 음성신호의 선형예측분석블록에서의 음성 및 톤 부호화 방법의 일실시예 흐름도.
도 7 은 본 발명에 따른 개방 루프 피치주기 검색 블록에서의 음성 및 톤 부호화 방법의 일실시예 흐름도.
도 8a 및 도 8b 는 본 발명의 실시에 의한 스펙트럼 평탄화 기술(SST) 적용 여부가 극-제로 점에 미치는 영향을 나타낸 일실시예 그래프.
도 9 는 본 발명의 실시에 의한 톤신호의 자기상관함수의 일실시예 그래프.
도 10a 및 도 10b 는 본 발명의 실시에 의한 개방 루프(Open-loop) 피치선택에 의한 영향을 나타낸 일실시예 그래프.
도 11a 및 도 11b 는 본 발명의 실시에 의한 톤모드 부호화기에 의해 톤 검출성능 개선을 보여주는 일실시예 스펙트럼도.
상기 목적을 달성하기 위한 본 발명은, 입력신호의 음성 및 톤을 부호화하여 송신하는 음성 및 톤 부호화 방법에 있어서, 입력신호에 대하여 자기상관함수를 구하여 저장하고, 상기 자기상관함수에 이항식 윈도우를 곱하며, 톤왜곡을 초래하는 스펙트럼 평탄화 기술(SST)을 제외시킨 선형예측분석을 수행하는 제 1 단계; 상기 입력신호가 톤신호인지를 판단하여, 톤신호이면 이항식 윈도우를 곱하지 않은 상기 저장된 자기상관함수를 이용하여 백색잡음을 수정하고, 선형계수를 구하여 전송하는 제 2 단계; 상기 제 2 단계의 판단결과, 상기 입력신호가 음성신호이면 상기 제 1 단계의 상기 선형예측분석 과정에서 구한 선형계수를 전송하는 제 3 단계; 및 상기 제 2 단계 및 상기 제 3 단계 중 어느 한 단계로부터 상기 선형계수 및 상기 신호를 입력받아 자기상관함수의 최대값 갱신 조건을 갱신시킨 개방 루프 피치주기를 검색하는 제 4 단계를 포함한다.
또한 본 발명은, 입력신호의 음성 및 톤을 부호화하여 송신하기 위하여, 대용량 프로세서를 구비한 송신 시스템에, 입력신호에 대하여 자기상관함수를 구하여 저장하고, 상기 자기상관함수에 이항식 윈도우를 곱하며, 톤왜곡을 초래하는 스펙트럼 평탄화 기술(SST)을 제외시킨 선형예측분석을 수행하는 제 1 기능; 상기 입력신호가 톤신호인지를 판단하여, 톤신호이면 이항식 윈도우를 곱하지 않은 상기 저장된 자기상관함수를 이용하여 백색잡음을 수정하고, 선형계수를 구하여 전송하는 제 2 기능; 상기 제 2 기능의 판단결과, 상기 입력신호가 음성신호이면 상기 제 1 기능의 상기 선형예측분석 과정에서 구한 선형계수를 전송하는 제 3 기능; 및 상기 제 2 기능 및 상기 제 3 기능 중 어느 한 기능로부터 상기 선형계수 및 상기 신호를 입력받아 자기상관함수의 최대값 갱신 조건을 갱신시킨 개방 루프 피치주기를 검색하는 제 4 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 포함한다.
이하 도 3 내지 도 11 을 참조하여 본 발명의 바람직한 일실시예를 상세히 설명한다.
도 3 은 본 발명이 적용되는 이중모드 부호화기의 일실시예 구성도이다.
상기 종래 기술의 문제점을 해결하기 위하여 고안된 본 발명은 부호화기(예컨데 G.723.1 등)의 전단계 또는 그 내부에서 톤의 여부를 검출하여 음성 모드와 톤모드를 구분하고 이들 각각에 대해 별도의 처리를 해줌으로써 수신단의 변경없이 DTMF톤을 음성신호와 동일 채널로 보낼 수 있도록 하는 것이며, 발명된 시스템의 전체 구성도는 도 3 과 같다.
우선 입력신호가 들어오면 G.723.1부호화기의 전단계 또는 그 내부에 있는 톤 검출기(301)에서 입력신호가 톤인지의 여부를 검출하고 톤이면 톤모드 부호화기(303)로 동작하고 음성이면 음성모드 부호화기(302)로 동작을 하게 된다.
이때 음성모드 부호화기는 도 4 에서 보는 바와 같이 기존의 G.723.1 부호화기를 그대로 사용하는데, 이 부호화기는 제한된 전송율로 가장 음성을 잘 모델링 하기 위한 단계들을 포함하고 있기 때문에, 이들 중 일부가 DTMF톤의 왜곡을 초래한다.
따라서 톤모드 부호화기에서는 음성모드 부호화기(기존의 G.723.1음성부호화기)의 각 단계 중 DTMF톤의 왜곡을 야기시키는 단계들을 변경시킴으로써, DTMF톤의 전송성능을 향상시킨다.
도 4 는 본 발명이 적용되는 음성모드 부호화기의 일실시예 상세 구성도이다.
우선 음성모드 부호화기로 사용되는 기존의 G.723.1음성부호화기의 구조를 보면 도 4 와 같은데 선형예측 분석시에 오동작 상태(ill-condition)가 되는 것을 방지하기 위해 스펙트럼 평탄화 기술(spectral smoothing technique : SST), 밴드폭 확장(bandwidth expansion) 및 백색 잡음 수정(white noise correction)과 같은 방법이 사용되며, 매 프레임마다 마지막 부프레임의 선형예측 계수는 선스펙트럼 주파수(LSP)계수로 바뀌어지고, 이미 구해져 있는 음성의 LSP계수 DC값과의 차이를 예측 분할 벡터 양자화(predictive split vector quantization : PSVQ)로 양자화 한다.
두 개의 부프레임(120샘플)마다, 지각가중 필터를 통과한 음성을 이용하여 개방 루프(open-loop) 피치를 찾으며, 이때 피치 구간은 18부터 145사이의 값에서 탐색하게 된다. 추정된 개방 루프(open-loop) 피치와 전체 합성필터의 임펄스 응답으로 폐쇄 루프(closed-loop) 피치예측기를 구성하고 피치는 개방 루프(open-loop) 피치주위의 몇 샘플에서 찾게 된다.
폐쇄 루프(Close-loop) 피치예측 후 잔류신호는 5.3kbps 모드에서는 대수적 코드 여기 선형 예측(ACELP)방식, 6.3kbps모드에서는 다중 펄스 최대 우도 양자화(MP-MLQ)방식을 사용하여 압축을 하는데, 두 방식 모두 복수의 펄스들에 의해 복호화됐을 때 원음과 평균자승오차를 최소화 하도록 잔류신호를 모델링한다. 도 4 의 음성모드 부호화기의 각 블록에 대하여 설명하면 다음과 같다.
즉, 음성모드 부호화기는, 음성신호를 블록단위로 처리하기 위해 입력신호를 240샘플씩 받는 블록(401), DC성분을 제거하기 위한 고역통과 필터(402), 음성신호의 선형예측분석블록(403), LSP값을 양자화 시키는 블록(404), 양자화된 LSP값을 다시 복구시키는 블록(405), 복구된 LSP를 선형보간시키는 블록(406), 합성에 의한 분석에 사용되는 지각가중필터(407), 자기상관 계수를 이용한 개방 루프 피치주기 검색 블록(408), 주기적인 음성신호의 음질을 향상시키기 위한 블록(409), 합성에 의한 분석에 필요한 합성필터의 임펄스 응답 계산 블록(410), 이전 프레임의 합성필터 응답을 보상하기 위한 영입력 응답계산 블록(411), 피치주기의 검출의 정확도를 높이기 위한 폐쇄 루프 피치주기 검색 블록(412), 비주기적인 여기신호의 모델링 블록(413), 비주기적인 여기신호의 복구 블록(414), 주기적인 여기신호의 복구 블록(415), 합성필터와 지각가중 필터들의 메모리를 갱신시키는 블록(416)으로 구성되어있다.
위의 과정들은 음성신호에 대해 가장 잘 모델링이 되도록 구성되어 있기 때문에 이들 단계 중에서 DTMF톤의 왜곡을 초래하는 단계들을 변경시킴으로써 DTMF의 왜곡을 감소시킬 수 있다. 그 중 SST와 개방 루프(open-loop) 피치 탐색기만을 변경시켰을 경우의 결과가 도 8 과 도 10 에서 보는 바와 같다.
도 8a 및 도 8b 는 본 발명의 실시에 의한 스펙트럼 평탄화 기술(SST) 적용 여부가 극-제로 점(pole-zero plot)에 미치는 영향을 나타낸 일실시예 그래프이다.
즉, 도 8a 는 SST를 적용시킨 경우, 도 8b 는 SST를 제외시킨 경우의 극-제로 점(pole-zero plot)인데, SST는 스펙트럼 피크(spectral peak)를 완만히 하고 대역폭을 넓히는 작용을 하므로 이 단계를 제외시킴으로써 두 피크(peak)사이에 잘못 끼어든 불필요한 피크의 영향을 완화시킬 수 있다.
도 10a 및 도 10b 는 본 발명의 실시에 의한 개방 루프(Open-loop) 피치선택에 의한 영향을 나타낸 일실시예 그래프로서, 도 10a 는 개방 루프(open-loop) 피치 탐색 시에 DTMF톤의 가장 낮은 주파수가 음성 피치의 존재 범위보다 높기 때문에 피치가 제대로 구해지지 않는 개방 루프(open-loop)피치 탐색기를 변경 시키기 전의 스펙트럼이며, 도 10b 는 변경시킨 후의 스펙트럼이다.
도 10 에서 보는 바와 같이, 잘못 선정된 피치 주기에 의해 왜곡이 일어나는 것을 알 수 있다. 이때의 왜곡을 완화 시키기 위해, 개방 루프 피치탐색 과정을 변경시킨다. 즉, 기존에는 자기상관함수의 최대값을 갱신시킬 때 새로운 최대값이 이전의 최대값보다 커야만 갱신시켰는데 반하여, 제안된 톤모드 부호화기에서는 새로운 최대값이 이전의 최대값보다 어느 이하(예를 들면 1.25dB 이하)가 되지 않으면 갱신되도록 하였다. 그 예가 도 9 에 나타나 있다.
도 9 는 본 발명의 실시에 의한 톤신호(DTMF 2)의 자기상관함수의 일실시예 그래프이다.
기존의 부호화기에서 피치 주기 값으로 24를 선택한 반면, 톤모드 부호화기에서는 이보다 훨씬 큰 값인 140을 피치 주기 값으로 선택하게 된다. 이와 같이 톤의 전송에 왜곡을 주는 부분들을 왜곡이 완화 되도록 변경시킨 톤모드 부호화기의 전체적인 구조는 도 5 에 나타나 있다.
도 5 는 본 발명이 적용되는 톤모드 부호화기의 일실시예 상세 구성도이다.
실제로 이 부호화기는 도 4 의 음성모드 부호화기와 대부분 동일하므로 이들 부분에 대해서는 자원을 공유하는 것이 가능하다. 즉, 도 5 의 대부분의 기능(501, 502, 504, 505, 506, 507, 509 내지 516)은 도 4 의 기능(401, 402, 404, 405, 406, 407, 409 내지 416)과 동일하다. 도 5 에서 도 4 와 차이 나는 부분을 설명하면 다음과 같다.
음성신호의 선형예측분석블록(503)은 도 4 에서도 사용되었지만, 톤왜곡을 초래하는 스펙트럼 평탄화 기술(SST)을 제외시킨 선형예측분석 단계 및 DTMF톤을 검출하여 LSP값을 구하는 블록이며, 개방 루프 피치주기 검색 블록(508)은 도 4 에서 자기상관함수의 최대값 갱신 조건을 변경시킨 개방 루프(open-loop) 피치주기 검색 블록이다. 도 6 과 도 7 은 이 두 가지 변경되는 부분의 동작내용을 나타낸 것으로 우선 도 6 에 대해 설명하면 다음과 같다.
도 6 은 본 발명에 따른 음성신호의 선형예측분석블록에서의 음성 및 톤 부호화 방법의 일실시예 흐름도이다.
우선, 입력신호를 부프레임 단위로 처리하기 위해, 고역통과 필터를 거친 입력 신호(601)에 180 샘플(samples)을 갖는 햄밍 윈도우(hamming window)를 곱해준다.
각각의 부프레임에 대해 자기상관함수 Rx를 구하고(603), 선형예측 분석시 일어날수 있는 오동작 상태(ill-condition)를 방지하기 위해 Rx에 이항식 윈도우(binomial window)함수를 곱한다(604). 이때 이항식 윈도우 함수를 곱하지 않은 자기상관함수를 따로 저장해 둔다(604).
다음으로 백색 잡음 수정(white noise correction)을 하는 과정으로서(605) 다음의 (수학식 1)을 사용하여 음성의 스펙트럼-동적 레인지(spectral-dynamic range)를 줄여준다.
다음으로 선형예측 계수를 구하고(606), 그 과정에서 구한 선형 예측 부호화(LPC)계수를 이용하여 양자화 오차가 적은 LSP로 변환하며(607), DTMF톤을 검출하게 된다(United States Patent No. 5,459,784(1995)에 기술되어 있는 방법을 사용)(608).
이 단계에서 입력신호가 톤신호가 아니라고 결정되면 입력신호가 톤인지 음성신호인지를 나타내는 IsTone변수를 거짓(FALSE)으로 설정하고(610), LSP값을 양자화 시키는 블록(504), 합성에 의한 분석에 사용되는 지각가중필터(507)로 각각 LSP, LPC값을 넘겨준다(614).
톤 신호인 경우 IsTone변수를 참(TRUE)으로 설정하며(609), 이항식 윈도우(binomial window)가 곱해지지 않은 자기상관 계수 Rx(604)를 이용하여 백색 잡음 수정(White noise correction)을 한다(611).
그 다음 LPC계수를 구하고 그 값을 합성에 의한 분석에 사용되는 지각가중필터(507)로 넘겨주고(612), LPC를 LSP로 변경시키며(613) 그 출력은 LSP값을 양자화 시키는 블록(504)으로 들어가게 된다.
톤검출과정(608)은 부호화기 외부에 별도의 모듈 형태로 구성할 수도 있지만, 부호화 과정에서 구해지는 LSP값을 사용하여 입력신호가 톤인지 음성신호 인가를 판별할 수 있으며(United States Patent No. 5,459,784(1995)에 기술된 방법에 의하는 경우), 이 경우 톤 검출기는 부호화기에 내장되는 형태로 구현된다.
도 7 은 본 발명에 따른 개방 루프 피치주기 검색 블록에서의 음성 및 톤 부호화 방법의 일실시예 흐름도이다.
지각가중 필터를 거친 음성 신호가 입력되면(701), 루프 변수를 초기화 시켜 주게 되는데(702) j는 가능한 피치 주기의 범위로서 18-142사이의 값을 가지며, COL,MAX는 COL(j)값이 최대가 되는 때의 값이고 j는 그때의 index이다.
IsTone플래그에 따라(609,610) TH값(709)을 다르게 설정한다(703). 그리고, 다음의 (수학식 2)를 사용하여 대비관계(crosscorrelation)를 구하게 된다(706).
COL(j)와 COL,MAX를 비교하여(707) COL(j)가 더 클 경우, j와 j'의 차이를 다시 비교하는데(708), 그 차이가 18보다 작다면 COL,MAX와 j를 갱신 시키고(710), 18보다 크다면 COL(j)가 COL,MAX보다 약 THdB정도 더 커질때 COL,MAX와 j를 갱신 시킨다(709). 그리고, COL(j)와 COL,MAX를 비교하여 COL,MAX가 더 크다면 index j를 증가 시키고 루프를 다시 돌게 된다(712).
루프가 끝나는 조건으로서 index j가142이면(711) 루프를 마치고 주기적인 음성신호의 음질을 향상시키기 위한 블록(409), 피치주기의 검출의 정확도를 높이기 위한 폐쇄 루프 피치주기 검색 블록(412), 비주기적인 여기신호의 모델링 블록(413)으로 COL,MAX의 index j를 넘겨주게 된다(713).
본 발명에서 제안한 톤모드의 부호화기를 통과한 DTMF톤과 기존의 부호화기를 통과한 DTMF톤을 스펙트럼상에서 비교한 결과를 도 11에 나타내었다.
도 11a 및 도 11b 는 본 발명의 실시에 의한 톤모드 부호화기에 의해 톤 검출성능 개선을 보여주는 일실시예 스펙트럼도로서, 도 11a 는 톤 4 의 경우이고, 도 11b 는 톤 7 의 경우이다.
기존의 방법에 의한 스펙트럼은 비틀림(twist)이 발생하고 톤 사이에 작은 피크(peak) 성분이 존재 하는 등 여러 가지 왜곡이 생기지만, 도 11a 및 도 11b 에도시된 바와 같이 본 발명에 의해 전송된 스펙트럼은 왜곡이 상당히 줄어들었음을 확인할 수 있다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.
상기한 바와 같은 본 발명에 따르면, 이중모드 부호화 방식을 도입함으로써, 기존의 부호화기의 송신단만을 변경시켜 수신단에서의 DTMF 톤 검출성능을 향상시킬 수 있으며, 따라서 DTMF의 전송을 위한 별도의 통신채널을 마련할 피료가 없어 관리가 용이하고, 수신단에 별도의 톤 재생기를 실장 할 필요도 없으므로 전체 하드웨어 크기나 가격을 줄일 수 있는 우수한 효과가 있다.
Claims (4)
- 송신 시스템에서 입력신호의 음성 및 톤을 부호화하여 송신하는 음성 및 톤 부호화 방법에 있어서,입력신호에 대하여 자기상관함수를 구하여 저장하고, 상기 자기상관함수에 이항식 윈도우를 곱하며, 톤왜곡을 초래하는 스펙트럼 평탄화 기술(SST)을 제외시킨 선형예측분석을 수행하는 제 1 단계;상기 입력신호가 톤신호인지를 판단하여, 톤신호이면 이항식 윈도우를 곱하지 않은 상기 저장된 자기상관함수를 이용하여 백색잡음을 수정하고, 선형계수를 구하여 전송하는 제 2 단계;상기 제 2 단계의 판단결과, 상기 입력신호가 음성신호이면 상기 제 1 단계의 상기 선형예측분석 과정에서 구한 선형계수를 전송하는 제 3 단계; 및상기 제 2 단계 및 상기 제 3 단계 중 어느 한 단계로부터 상기 선형계수 및 상기 신호를 입력받아 자기상관함수의 최대값 갱신 조건을 갱신시킨 개방 루프 피치주기를 검색하는 제 4 단계를 포함하는 음성 및 톤 부호화 방법.
- 제 1 항에 있어서,상기 제 1 단계는,입력신호에 해밍 윈도우를 곱하고, 각각의 부프레임에 대해 자기상관함수를 구하는 제 5 단계;상기 자기상관함수를 저장한 후, 상기 저장전의 자기상관함수에 이항식 윈도우함수를 곱하는 제 6 단계; 및백색잡음을 수정하고 선형예측 계수를 구하며, 상기 선형예측 계수를 양자화 오차가 적은 선형계수로 변환하는 제 7 단계를 포함하는 음성 및 톤 부호화 방법.
- 제 1 항 또는 제 2 항에 있어서,상기 제 4 단계는,지각가중 필터로부터 신호를 입력받아 변수를 초기화하고, 상기 신호가 톤신호인지를 판단하는 제 8 단계;상기 제 8 단계의 판단결과에 따라 문턱값(TH)을 다르게 설정하는 제 9 단계; 및상기 입력신호의 주기적인 특징을 찾기위해 자기상관함수를 이용하여 가장 상관도가 높게 되는 인덱스를 찾는 제 10 단계를 포함하는 음성 및 톤 부호화 방법.
- 입력신호의 음성 및 톤을 부호화하여 송신하기 위하여, 대용량 프로세서를 구비한 송신 시스템에,입력신호에 대하여 자기상관함수를 구하여 저장하고, 상기 자기상관함수에 이항식 윈도우를 곱하며, 톤왜곡을 초래하는 스펙트럼 평탄화 기술(SST)을 제외시킨 선형예측분석을 수행하는 제 1 기능;상기 입력신호가 톤신호인지를 판단하여, 톤신호이면 이항식 윈도우를 곱하지 않은 상기 저장된 자기상관함수를 이용하여 백색잡음을 수정하고, 선형계수를 구하여 전송하는 제 2 기능;상기 제 2 기능의 판단결과, 상기 입력신호가 음성신호이면 상기 제 1 기능의 상기 선형예측분석 과정에서 구한 선형계수를 전송하는 제 3 기능; 및상기 제 2 기능 및 상기 제 3 기능 중 어느 한 기능로부터 상기 선형계수 및 상기 신호를 입력받아 자기상관함수의 최대값 갱신 조건을 갱신시킨 개방 루프 피치주기를 검색하는 제 4 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019980059097A KR100283087B1 (ko) | 1998-12-26 | 1998-12-26 | 음성 및 톤 부호화 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019980059097A KR100283087B1 (ko) | 1998-12-26 | 1998-12-26 | 음성 및 톤 부호화 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20000042814A KR20000042814A (ko) | 2000-07-15 |
KR100283087B1 true KR100283087B1 (ko) | 2001-03-02 |
Family
ID=19566067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019980059097A KR100283087B1 (ko) | 1998-12-26 | 1998-12-26 | 음성 및 톤 부호화 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100283087B1 (ko) |
-
1998
- 1998-12-26 KR KR1019980059097A patent/KR100283087B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR20000042814A (ko) | 2000-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100209454B1 (ko) | 부호화 장치 | |
US6202046B1 (en) | Background noise/speech classification method | |
US5751903A (en) | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset | |
EP0877355B1 (en) | Speech coding | |
KR100334202B1 (ko) | 이동전화에서고속음성압축을수행하기위한에이식 | |
US5230036A (en) | Speech coding system utilizing a recursive computation technique for improvement in processing speed | |
EP0501421B1 (en) | Speech coding system | |
KR100742443B1 (ko) | 손실 프레임을 처리하기 위한 음성 통신 시스템 및 방법 | |
CA2344523C (en) | Multi-channel signal encoding and decoding | |
RU2591021C2 (ru) | Устройство и способ для квантования усилений адаптивного и фиксированного вкладов возбуждения в кодеке celp | |
KR100395458B1 (ko) | 전송에러보정을 갖는 오디오신호 디코딩방법 | |
US8078457B2 (en) | Method for adapting for an interoperability between short-term correlation models of digital signals | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
EP0849724A2 (en) | High quality speech coder and coding method | |
US5924063A (en) | Celp-type speech encoder having an improved long-term predictor | |
US6470310B1 (en) | Method and system for speech encoding involving analyzing search range for current period according to length of preceding pitch period | |
US4945567A (en) | Method and apparatus for speech-band signal coding | |
KR100283087B1 (ko) | 음성 및 톤 부호화 방법 | |
KR100668247B1 (ko) | 음성 전송 시스템 | |
KR960011132B1 (ko) | 씨이엘피(celp) 보코더에서의 피치검색방법 | |
KR100587721B1 (ko) | 음성전송시스템 | |
JP3270146B2 (ja) | 音声符号化装置 | |
KR20000016318A (ko) | 가변 비트레이트 음성 전송 시스템 | |
JPH09269798A (ja) | 音声符号化方法および音声復号化方法 | |
JPH04270397A (ja) | 音声符号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121203 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20131202 Year of fee payment: 14 |
|
FPAY | Annual fee payment |
Payment date: 20141201 Year of fee payment: 15 |
|
LAPS | Lapse due to unpaid annual fee |