KR20060039320A - 상호부호화기의 연산량 감소를 위한 피치 검색 방법 - Google Patents
상호부호화기의 연산량 감소를 위한 피치 검색 방법 Download PDFInfo
- Publication number
- KR20060039320A KR20060039320A KR1020040088460A KR20040088460A KR20060039320A KR 20060039320 A KR20060039320 A KR 20060039320A KR 1020040088460 A KR1020040088460 A KR 1020040088460A KR 20040088460 A KR20040088460 A KR 20040088460A KR 20060039320 A KR20060039320 A KR 20060039320A
- Authority
- KR
- South Korea
- Prior art keywords
- pitch
- search
- encoder
- voice
- amount
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000004364 calculation method Methods 0.000 claims abstract description 14
- 230000008569 process Effects 0.000 claims description 25
- 238000013507 mapping Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 8
- 238000009499 grossing Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 241000512259 Ascophyllum nodosum Species 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 상호부호화기의 연산량 감소를 위한 피치 검색 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 송/수신단의 음성 부호화기의 특성을 이용하여 음질을 향상시키고 연산량을 감소시키기 위하여, 수신단의 피치 검색을 제한된 범위내에서 검색하도록 하는, 상호부호화기의 연산량 감소를 위한 피치 검색 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 서로 다른 프레임과 부프레임을 갖는 상호부호화기에 적용되는 연산량 감소를 위한 피치 검색 방법에 있어서, 서로 다른 음성 프레임 크기를 고려하여 프레임간 상호 변환할 수 있도록 프레임을 분할하는 분류 단계; 해당 프레임의 부프레임에서 음성 피치를 설정하는 피치 설정 단계; 송수신단의 음성 부호화기의 특성을 고려하여 상기 설정된 피치를 이용해 피치 추정 범위를 결정하는 추정 범위 결정 단계; 상기 추정 범위 내에서 최대값을 갖는 개루프 피치를 추정하는 피치 추정 단계; 및 상기 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 검색 단계를 포함한다.
4. 발명의 중요한 용도
본 발명은 상호부호화기 등에 이용됨.
상호부호화기, 피치, 부프레임, 연산량, 음성, AMR, G.723.1, 음질
Description
도 1 은 본 발명이 적용되는 음성 상호부호화 시스템의 구성예시도,
도 2a 및 도 2b 는 본 발명에 따른 음성 상호부호화기를 거치는 과정 중 탄뎀(tandem) 방식과 상호부호화기(transcoder)를 비교하는 예시도,
도 3a 및 도 3b 는 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 변환 과정을 방향에 따라 나타내는 예시도,
도 4a 및 도 4b 는 본 발명에 따른 상호부호화기의 피치 검색 범위에 따른 객관적 음질 변화를 그래프로 보여주는 예시도,
도 5a 및 도 5b 는 상호부호화기의 피치 검색 범위에 따른 피치의 변화를 나타내는 예시도,
도 6a 내지 도 6c 는 본 발명에 따른 피치 검색 범위에 따른 연산량과 객관적 음질을 나타내는 예시도,
도 7a 및 도 7b 는 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 검색 방법에 대한 일실시예 흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명
11 : 음성 상호부호화기 12 : LSP 맵핑
13 : 적응코드북(피치) 맵핑 14 : 고정코드북 맵핑
본 발명은 상호부호화기의 연산량 감소를 위한 피치 검색 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 더욱 상세하게는 송신단과 수신단의 음성 부호화기의 특성을 이용하여 최적화된 음질과 연산량을 위하여 수신단의 피치 검색을 위한 피치 검색 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
상호부호화기에서는 수신단에 해당하는 개회로 피치 변환과정을 통하여 해당하는 개회로 피치를 음질의 저하없이 적은 연산량으로 검색을 하게 된다. 기존의 방법으로는 송신단의 피치를 그대로 사용하거나 수신단의 특정 범위를 넘어간 송신단의 피치에 대해서 수신단의 최대 범위에 해당되는 피치로 자르는 방식을 사용하였다. 또한, 송신단의 피치와 수신단의 피치의 차이가 큰 경우 피치 완만화 방법(pitch smoothing)을 사용한 경우도 있다.
여기서, 피치 완만화 방법은 거의 음질의 저하없이 적은 연산량으로 개회로 피치를 검색할 수 있는 방법이다. 하지만, 피치 완만화 방법의 연산량은 송신단의 피치와 이전 프레임에 해당하는 수신단의 피치 간의 차이에 의존하게 된다.
그러나, 많은 실험을 통하여 확인해 본 결과, 일반적으로 피치의 중요성이 상대적으로 적은 무성음구간에서 그 차이가 큰 것으로 확인이 되었다. 즉, 음성 부호화 과정에서 피치가 음질의 영향을 거의 끼치지 않은 무성음 구간에서 많은 연산량을 필요로 한다는 단점을 가지게 된다.
상호부호화기에서의 개회로 피치 검색의 목적 신호는 송신단에서 전송된 파라미터들로 복원된 신호이다. 즉, 송신단에서 전송된 폐회로 피치를 그 주기로 가지는 신호이다. 만약, 송신단의 부호화기와 수신단의 부호화기가 같은 프레임 크기를 가진다면, 송신단의 폐회로 피치를 수신단의 개회로 피치로 아무런 변환 과정없이 사용할 수 있다. 하지만, AMR과 G.723.1 음성부호화기의 경우, G.723.1은 30ms의 프레임 크기를 가지고, AMR은 20ms의 프레임 크기를 갖는다. 이렇게, 서로 다른 프레임과 부프레임 크기를 갖는 상호부호화기의 경우 송신단의 폐회로 피치를 수신단의 개회로 피치로 사용하기 위해서는 이러한 프레임간의 불일치를 보상해 주기 위한 방안이 요구된다.
본 발명은 상기와 같은 요구에 부응하기 위하여 제안된 것으로, 송/수신단의 음성 부호화기의 특성을 이용하여 음질을 향상시키고 연산량을 감소시키기 위하여, 수신단의 피치 검색을 제한된 범위내에서 검색하도록 하는, 상호부호화기의 연산량 감소를 위한 피치 검색 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명은, 서로 다른 프레임과 부프레임을 갖는 상호부호화기에 적용되는 연산량 감소를 위한 피치 검색 방법에 있어서, 서로 다른 음성 프레임 크기를 고려하여 프레임간 상호 변환할 수 있도록 프레임을 분할하는 분류 단계; 해당 프레임의 부프레임에서 음성 피치를 설정하는 피치 설정 단계; 송수신단의 음성 부호화기의 특성을 고려하여 상기 설정된 피치를 이용해 피치 추정 범위를 결정하는 추정 범위 결정 단계; 상기 추정 범위 내에서 최대값을 갖는 개루프 피치를 추정하는 피치 추정 단계; 및 상기 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 검색 단계를 포함하여 이루어진 것을 특징으로 한다.
한편, 본 발명은, 서로 다른 프레임과 부프레임을 갖는 프로세서를 구비한 상호부호화기에, 서로 다른 음성 프레임 크기를 고려하여 프레임간 상호 변환할 수 있도록 프레임을 분할하는 분류 기능; 해당 프레임의 부프레임에서 음성 피치를 설정하는 피치 설정 기능; 송수신단의 음성 부호화기의 특성을 고려하여 상기 설정된 피치를 이용해 피치 추정 범위를 결정하는 추정 범위 결정 기능; 상기 추정 범위 내에서 최대값을 갖는 개루프 피치를 추정하는 피치 추정 기능; 및 상기 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 검색 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.
도 1 은 본 발명이 적용되는 음성 상호부호화 시스템의 구성예시도이다.
도 1에 도시된 바와 같이, 음성 상호부호화기(11)는 A 음성 부호화기와 B 음성 부호화기 간의 음성 비트스트림을 직접 변환하는 방식으로서, LSP 맵핑(12), 적응 코드북 맵핑(피치 검색)(13), 고정 코드북 맵핑(14) 과정으로 이루어지고, 본 발명은 그 중 적응 코드북 맵핑(13) 과정(피치 검색 과정)에 해당하는 방식이다.
일반적으로, 켈프(CELP : Code Excited Linear Predition) 방식의 음성 상호부호화기에서 적응 코드북 검색 과정은 개회로 피치 검색 과정과 폐회로 피치 검색 과정으로 이루어진다.
이 중, 개회로 피치 검색 과정에서는 간단하게 후보 피치를 찾고, 폐회로 피 치 검색 과정에서 다시 후보 피치를 주변으로 상세하게 최종 피치를 찾아낸다. 따라서, 적응 코드북 맵핑(13) 과정에서는 B 음성 부호화기의 개회로 피치 검색 과정을 사용하지 않고 A 음성 부호화기의 최종 피치를 이용하여 B 음성 부호화기의 후보 피치를 찾아낸다.
도 2a 및 도 2b 는 본 발명에 따른 음성 상호부호화기를 거치는 과정 중 탄뎀(tandem) 방식과 상호부호화기(transcoder)를 비교하는 예시도로서, 두 개의 서로 다른 음성 상호부호화기를 사용하는 환경에서의 탄뎀 방식(도 2a)과 이를 대신하는 상호부호화기(도 2b)를 비교하여 보여주고 있다.
도 3a 및 도 3b 는 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 변환 과정을 방향에 따라 나타내는 예시도로서, AMR(Audio/Modem Riser)과 G.723.1간의 상호부호화기의 피치 변환 과정을 보여준 도 3a 및 도 3b에 도시된 바와 같이, G.723.1은 폐회로 피치를 검색하는 과정에서 AMR의 폐회로 피치 검색 과정보다 큰 윈도우를 사용한다. 즉, 더욱 많은 샘플을 사용하여 피치를 결정하기 때문에 G.723.1의 피치가 AMR의 피치보다 신뢰성이 높다. 이러한 특징을 이용하여 제안된 피치 검색 방법의 검색 범위를 결정한다.
도 4a 및 도 4b 는 본 발명에 따른 상호부호화기의 피치 검색 범위에 따른 객관적 음질 변화를 그래프로 보여주는 예시도이다.
도 4a 및 도 4b에 도시된 바와 같이, G.723.1에서 AMR 방향의 상호부호화기의 경우 G.723.1의 피치를 AMR의 피치로 아무런 변환 과정없이 사용하였을 경우, 즉 다이렉트 맵핑(direct mapping)의 경우에는 많은 음질의 저하가 발생함을 알 수 있다. 그러나, G.723.1의 피치의 신뢰성이 높기 때문에 3샘플 검색, 즉 송신단의 피치 주위의 1샘플씩을 검색하는 것에 비하여, 검색 범위를 늘려도 음질의 향상은 거의 없음을 알 수 있다.
반대 방향, 즉 AMR에서 G.723.1로의 상호부호화기의 피치 검색 범위에 따른 객관적 음질의 변화를 보면 상대적으로 신뢰도가 낮은 AMR의 피치를 사용하기 때문에 검색 범위가 커질수록 객관적 음질은 향상됨을 알 수 있다. 그러나, 검색 범위에 따른 객관적 음질의 향상은 7샘플 이상에서는 거의 없음을 알 수 있다.
이러한 실험을 토대로 객관적 음질과 연산량을 고려하여, G.723.1과 AMR간의 상호부호화 알고리즘의 제안된 피치 검색 방법의 검색 범위를 하기의 [수학식 1]과 같이 결정하기로 한다.
도 5a 및 도 5b 는 상호부호화기의 피치 검색 범위에 따른 피치의 변화를 나타내는 예시도로서, 도면에서 "Full Search"는 연산량이 가장 많은 전체 검색 범위를 다 검색하는 방법을 의미하고, "Pitch smoothing"은 기존의 방법인 피치 완만화 방법을 의미하고, "Proposed"는 본 발명에 따른 피치 검색 방법인 개선된 고속 피치 검색 방법(modified fast pitch search method)을 의미한다.
도 5a 및 도 5b에 도시된 바와 같이, 본 발명에 따른 피치 검색 방법은 기존의 피치 완만화 방법을 사용했을 경우보다 좀 더 정확한 피치를 찾음을 알 수 있다.
도 6a 내지 도 6c 는 본 발명에 따른 피치 검색 범위에 따른 연산량과 객관적 음질을 나타내는 예시도이다.
도 6a 내지 도 6c에 도시된 바와 같이, 본 발명에 따른 개선된 고속 피치 검색 방법을 사용함으로써, 기존의 피치 완만화 방법 보다 연산량을 감소시킬 수 있고, 전체 검색 범위를 검색하는 방법에 비하여 92~96% 이상 연산량을 감소시킬 수 있는 장점이 있음을 알 수 있다. 또한, 본 발명에 따른 개선된 고속 피치 검색 방법을 사용함으로써 기존의 피치 완만화 방법 보다 음질 또한 향상시킬 수 있는 장점이 있음을 알 수 있다.
또한, 연산량이 가장 많은 전체 검색 범위를 검색하는 방법에 비하여 거의 음질의 저하는 없음을 알 수 있다.
도 7a 및 도 7b 는 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 검색 방법에 대한 일실시예 흐름도이다.
도 7a는 G723.1에서 AMR로의 적응 코드북 매핑(피치 검색)과정을 나타낸 것이고, 도 7b는 AMR에서 G723.1로의 적응 코드북 매핑(피치 검색) 과정을 나타낸 것이다.
도 7a 및 도 7b에 도시된 바와 같이, 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 검색 방법(적응 코드북 맵핑 과정)은, 크게 프레임 분류 과정 (700, 800), 해당 프레임의 부프레임에서 피치를 설정하는 과정(710, 810), 설정된 피치를 이용하여 피치 추정 범위를 설정하는 과정(720, 820), 피치 추정 범위 내에서 개루프 피치를 추정하는 과정(730, 830), 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 과정(740, 840)으로 구성된다.
상기한 바와 같은 구성을 갖는 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 검색 방법의 동작을 상세하게 설명하면 다음과 같다.
먼저, 프레임 분류 과정(700, 800)은 G.723.1은 30ms 단위로 부호화하고 AMR은 20ms 단위로 부호화하므로, 이러한 서로 다른 음성 프레임의 길이를 고려해 주기 위한 것이다. 즉, G.723.1의 두 개의 프레임과 AMR의 세 개의 프레임 사이를 상호 변환할 수 있도록 분할한다.
다음, 해당 프레임의 부프레임에서 피치를 설정하는 과정(710, 810)은 입력되는 음성의 피치를 PG나 PA로 설정한다(상기 도 3a 및 도 3b 참조).
이어서, PG나 PA 로 설정된 피치를 이용하여 피치 추정 범위를 설정하는 과정(720, 820)은 설정된 피치를 이용하여 피치 추정 범위의 최소값과 최대값을 설정하는 것이다.
이어서, 피치 추정 범위 내에서 개루프 피치를 추정하는 과정(730, 830)은 피치 추정 범위 내에서 하기의 [수학식 2]를 최대로 하는 j를 찾는 과정이다.
여기서, sw, N, Pmin과 Pmax는 인지 가중된 신호, 부프레임 사이즈, 검색 범위를 나타낸다. 즉, 개선된 고속 피치 검색 방법(빠른 개회로 피치 검색 방법)은 COL를 최대화하는 인덱스 j를 찾게 되고, 이때의 j를 개회로 피치로 선택하게 된다. 본 발명에 따른 고속 피치 검색 방법의 연산량은 Pmin과 Pmax로 표현된 검색 범위에 의하여 결정되고, 이 때의 검색범위는 각각에 해당하는 수신단의 특성을 고려하여 결정한다.
한편, 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 과정(740, 840)은 추정된 개루프 피치(j)를 이용하여 출력단의 각 프레임별 최종 피치를 검색한다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
상기와 같은 본 발명은, 각각의 음성 부호화기의 특성을 음성 상호부호화기에 적용함으로써, 상호부호화기 연산량을 더욱 감소시킬 수 있고, 복호화된 음성의 음질을 향상시킬 수 있는 효과가 있다.
Claims (5)
- 서로 다른 프레임과 부프레임을 갖는 상호부호화기에 적용되는 연산량 감소를 위한 피치 검색 방법에 있어서,서로 다른 음성 프레임 크기를 고려하여 프레임간 상호 변환할 수 있도록 프레임을 분할하는 분류 단계;해당 프레임의 부프레임에서 음성 피치를 설정하는 피치 설정 단계;송수신단의 음성 부호화기의 특성을 고려하여 상기 설정된 피치를 이용해 피치 추정 범위를 결정하는 추정 범위 결정 단계;상기 추정 범위 내에서 최대값을 갖는 개루프 피치를 추정하는 피치 추정 단계; 및상기 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 검색 단계를 포함하는 상호부호화기의 연산량 감소를 위한 피치 검색 방법.
- 제 1 항에 있어서,상기 피치 추정 단계는,상기의 피치 추정 범위 내에서 하기의 [수학식 1]의 식을 최대로 하는 j를 찾아 고속으로 피치를 검색하도록 하는 것을 특징으로 하는 상호부호화기의 연산량 감소를 위한 피치 검색 방법.[수학식 1](여기서, sw, N, Pmin과 Pmax는 인지 가중된 신호, 부프레임 사이즈, 검색 범위를 나타냄(즉, 제안된 개선된 고속 피치 검색 방법(빠른 개회로 피치 검색 방법)은 COL를 최대화하는 인덱스 j를 찾게 되고, 이때의 j를 개회로 피치로 선택하게 되며, 고속 피치 검색 방법의 연산량은 Pmin과 Pmax로 표현된 검색 범위에 의하여 결정되고, 이 때의 검색범위는 각각에 해당하는 수신단의 특성을 고려하여 결정됨))
- 제 3 항에 있어서,상기 검색 단계는,상기 추정된 개루프 피치(j)를 이용하여 출력단의 각 프레임별 최종 피치를 검색하는 것을 특징으로 하는 상호부호화기의 연산량 감소를 위한 피치 검색 방법.
- 서로 다른 프레임과 부프레임을 갖는 프로세서를 구비한 상호부호화기에,서로 다른 음성 프레임 크기를 고려하여 프레임간 상호 변환할 수 있도록 프레임을 분할하는 분류 기능;해당 프레임의 부프레임에서 음성 피치를 설정하는 피치 설정 기능;송수신단의 음성 부호화기의 특성을 고려하여 상기 설정된 피치를 이용해 피치 추정 범위를 결정하는 추정 범위 결정 기능;상기 추정 범위 내에서 최대값을 갖는 개루프 피치를 추정하는 피치 추정 기능; 및상기 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 검색 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040088460A KR20060039320A (ko) | 2004-11-02 | 2004-11-02 | 상호부호화기의 연산량 감소를 위한 피치 검색 방법 |
US11/261,348 US20060095255A1 (en) | 2004-11-02 | 2005-10-27 | Pitch conversion method for reducing complexity of transcoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040088460A KR20060039320A (ko) | 2004-11-02 | 2004-11-02 | 상호부호화기의 연산량 감소를 위한 피치 검색 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20060039320A true KR20060039320A (ko) | 2006-05-08 |
Family
ID=36263171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040088460A KR20060039320A (ko) | 2004-11-02 | 2004-11-02 | 상호부호화기의 연산량 감소를 위한 피치 검색 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20060095255A1 (ko) |
KR (1) | KR20060039320A (ko) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6829579B2 (en) * | 2002-01-08 | 2004-12-07 | Dilithium Networks, Inc. | Transcoding method and system between CELP-based speech codes |
US7469209B2 (en) * | 2003-08-14 | 2008-12-23 | Dilithium Networks Pty Ltd. | Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications |
-
2004
- 2004-11-02 KR KR1020040088460A patent/KR20060039320A/ko not_active Application Discontinuation
-
2005
- 2005-10-27 US US11/261,348 patent/US20060095255A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20060095255A1 (en) | 2006-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
USRE49363E1 (en) | Variable bit rate LPC filter quantizing and inverse quantizing device and method | |
US8428936B2 (en) | Decoder for audio signal including generic audio and speech frames | |
KR101430332B1 (ko) | 일반 오디오 및 음성 프레임들을 포함하는 오디오 신호를 위한 인코더 | |
KR100908219B1 (ko) | 로버스트한 음성 분류를 위한 방법 및 장치 | |
US7752038B2 (en) | Pitch lag estimation | |
JP5521097B2 (ja) | 信号を符号化する方法および信号を復号する方法 | |
CN103069483B (zh) | 编码装置以及编码方法 | |
US8078457B2 (en) | Method for adapting for an interoperability between short-term correlation models of digital signals | |
KR100647290B1 (ko) | 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법 | |
US8112271B2 (en) | Audio encoding device and audio encoding method | |
KR100550003B1 (ko) | 상호부호화기에서 개회로 피치 추정 방법 및 그 장치 | |
US20130096913A1 (en) | Method and apparatus for adaptive multi rate codec | |
KR20060039320A (ko) | 상호부호화기의 연산량 감소를 위한 피치 검색 방법 | |
Oshikiri et al. | A 2.4‐kbps variable‐bit‐rate ADP‐CELP speech coder | |
Miki et al. | Pitch synchronous innovation code excited linear prediction (PSI‐CELP) | |
JPH09120300A (ja) | ベクトル量子化装置 | |
Yang et al. | High performance CELP coder utilizing a novel adaptive forward-backward LPC quantization | |
JPH10105196A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |