KR20060039320A - 상호부호화기의 연산량 감소를 위한 피치 검색 방법 - Google Patents

상호부호화기의 연산량 감소를 위한 피치 검색 방법 Download PDF

Info

Publication number
KR20060039320A
KR20060039320A KR1020040088460A KR20040088460A KR20060039320A KR 20060039320 A KR20060039320 A KR 20060039320A KR 1020040088460 A KR1020040088460 A KR 1020040088460A KR 20040088460 A KR20040088460 A KR 20040088460A KR 20060039320 A KR20060039320 A KR 20060039320A
Authority
KR
South Korea
Prior art keywords
pitch
search
encoder
voice
amount
Prior art date
Application number
KR1020040088460A
Other languages
English (en)
Inventor
이응돈
성종모
김도영
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020040088460A priority Critical patent/KR20060039320A/ko
Priority to US11/261,348 priority patent/US20060095255A1/en
Publication of KR20060039320A publication Critical patent/KR20060039320A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야
본 발명은 상호부호화기의 연산량 감소를 위한 피치 검색 방법에 관한 것임.
2. 발명이 해결하려고 하는 기술적 과제
본 발명은 송/수신단의 음성 부호화기의 특성을 이용하여 음질을 향상시키고 연산량을 감소시키기 위하여, 수신단의 피치 검색을 제한된 범위내에서 검색하도록 하는, 상호부호화기의 연산량 감소를 위한 피치 검색 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있음.
3. 발명의 해결방법의 요지
본 발명은, 서로 다른 프레임과 부프레임을 갖는 상호부호화기에 적용되는 연산량 감소를 위한 피치 검색 방법에 있어서, 서로 다른 음성 프레임 크기를 고려하여 프레임간 상호 변환할 수 있도록 프레임을 분할하는 분류 단계; 해당 프레임의 부프레임에서 음성 피치를 설정하는 피치 설정 단계; 송수신단의 음성 부호화기의 특성을 고려하여 상기 설정된 피치를 이용해 피치 추정 범위를 결정하는 추정 범위 결정 단계; 상기 추정 범위 내에서 최대값을 갖는 개루프 피치를 추정하는 피치 추정 단계; 및 상기 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 검색 단계를 포함한다.
4. 발명의 중요한 용도
본 발명은 상호부호화기 등에 이용됨.
상호부호화기, 피치, 부프레임, 연산량, 음성, AMR, G.723.1, 음질

Description

상호부호화기의 연산량 감소를 위한 피치 검색 방법{Pitch search method for complexity reduction of transcoder}
도 1 은 본 발명이 적용되는 음성 상호부호화 시스템의 구성예시도,
도 2a 및 도 2b 는 본 발명에 따른 음성 상호부호화기를 거치는 과정 중 탄뎀(tandem) 방식과 상호부호화기(transcoder)를 비교하는 예시도,
도 3a 및 도 3b 는 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 변환 과정을 방향에 따라 나타내는 예시도,
도 4a 및 도 4b 는 본 발명에 따른 상호부호화기의 피치 검색 범위에 따른 객관적 음질 변화를 그래프로 보여주는 예시도,
도 5a 및 도 5b 는 상호부호화기의 피치 검색 범위에 따른 피치의 변화를 나타내는 예시도,
도 6a 내지 도 6c 는 본 발명에 따른 피치 검색 범위에 따른 연산량과 객관적 음질을 나타내는 예시도,
도 7a 및 도 7b 는 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 검색 방법에 대한 일실시예 흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명
11 : 음성 상호부호화기 12 : LSP 맵핑
13 : 적응코드북(피치) 맵핑 14 : 고정코드북 맵핑
본 발명은 상호부호화기의 연산량 감소를 위한 피치 검색 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 더욱 상세하게는 송신단과 수신단의 음성 부호화기의 특성을 이용하여 최적화된 음질과 연산량을 위하여 수신단의 피치 검색을 위한 피치 검색 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
상호부호화기에서는 수신단에 해당하는 개회로 피치 변환과정을 통하여 해당하는 개회로 피치를 음질의 저하없이 적은 연산량으로 검색을 하게 된다. 기존의 방법으로는 송신단의 피치를 그대로 사용하거나 수신단의 특정 범위를 넘어간 송신단의 피치에 대해서 수신단의 최대 범위에 해당되는 피치로 자르는 방식을 사용하였다. 또한, 송신단의 피치와 수신단의 피치의 차이가 큰 경우 피치 완만화 방법(pitch smoothing)을 사용한 경우도 있다.
여기서, 피치 완만화 방법은 거의 음질의 저하없이 적은 연산량으로 개회로 피치를 검색할 수 있는 방법이다. 하지만, 피치 완만화 방법의 연산량은 송신단의 피치와 이전 프레임에 해당하는 수신단의 피치 간의 차이에 의존하게 된다.
그러나, 많은 실험을 통하여 확인해 본 결과, 일반적으로 피치의 중요성이 상대적으로 적은 무성음구간에서 그 차이가 큰 것으로 확인이 되었다. 즉, 음성 부호화 과정에서 피치가 음질의 영향을 거의 끼치지 않은 무성음 구간에서 많은 연산량을 필요로 한다는 단점을 가지게 된다.
상호부호화기에서의 개회로 피치 검색의 목적 신호는 송신단에서 전송된 파라미터들로 복원된 신호이다. 즉, 송신단에서 전송된 폐회로 피치를 그 주기로 가지는 신호이다. 만약, 송신단의 부호화기와 수신단의 부호화기가 같은 프레임 크기를 가진다면, 송신단의 폐회로 피치를 수신단의 개회로 피치로 아무런 변환 과정없이 사용할 수 있다. 하지만, AMR과 G.723.1 음성부호화기의 경우, G.723.1은 30ms의 프레임 크기를 가지고, AMR은 20ms의 프레임 크기를 갖는다. 이렇게, 서로 다른 프레임과 부프레임 크기를 갖는 상호부호화기의 경우 송신단의 폐회로 피치를 수신단의 개회로 피치로 사용하기 위해서는 이러한 프레임간의 불일치를 보상해 주기 위한 방안이 요구된다.
본 발명은 상기와 같은 요구에 부응하기 위하여 제안된 것으로, 송/수신단의 음성 부호화기의 특성을 이용하여 음질을 향상시키고 연산량을 감소시키기 위하여, 수신단의 피치 검색을 제한된 범위내에서 검색하도록 하는, 상호부호화기의 연산량 감소를 위한 피치 검색 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
상기 목적을 달성하기 위한 본 발명은, 서로 다른 프레임과 부프레임을 갖는 상호부호화기에 적용되는 연산량 감소를 위한 피치 검색 방법에 있어서, 서로 다른 음성 프레임 크기를 고려하여 프레임간 상호 변환할 수 있도록 프레임을 분할하는 분류 단계; 해당 프레임의 부프레임에서 음성 피치를 설정하는 피치 설정 단계; 송수신단의 음성 부호화기의 특성을 고려하여 상기 설정된 피치를 이용해 피치 추정 범위를 결정하는 추정 범위 결정 단계; 상기 추정 범위 내에서 최대값을 갖는 개루프 피치를 추정하는 피치 추정 단계; 및 상기 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 검색 단계를 포함하여 이루어진 것을 특징으로 한다.
한편, 본 발명은, 서로 다른 프레임과 부프레임을 갖는 프로세서를 구비한 상호부호화기에, 서로 다른 음성 프레임 크기를 고려하여 프레임간 상호 변환할 수 있도록 프레임을 분할하는 분류 기능; 해당 프레임의 부프레임에서 음성 피치를 설정하는 피치 설정 기능; 송수신단의 음성 부호화기의 특성을 고려하여 상기 설정된 피치를 이용해 피치 추정 범위를 결정하는 추정 범위 결정 기능; 상기 추정 범위 내에서 최대값을 갖는 개루프 피치를 추정하는 피치 추정 기능; 및 상기 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 검색 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명하기로 한다.
도 1 은 본 발명이 적용되는 음성 상호부호화 시스템의 구성예시도이다.
도 1에 도시된 바와 같이, 음성 상호부호화기(11)는 A 음성 부호화기와 B 음성 부호화기 간의 음성 비트스트림을 직접 변환하는 방식으로서, LSP 맵핑(12), 적응 코드북 맵핑(피치 검색)(13), 고정 코드북 맵핑(14) 과정으로 이루어지고, 본 발명은 그 중 적응 코드북 맵핑(13) 과정(피치 검색 과정)에 해당하는 방식이다.
일반적으로, 켈프(CELP : Code Excited Linear Predition) 방식의 음성 상호부호화기에서 적응 코드북 검색 과정은 개회로 피치 검색 과정과 폐회로 피치 검색 과정으로 이루어진다.
이 중, 개회로 피치 검색 과정에서는 간단하게 후보 피치를 찾고, 폐회로 피 치 검색 과정에서 다시 후보 피치를 주변으로 상세하게 최종 피치를 찾아낸다. 따라서, 적응 코드북 맵핑(13) 과정에서는 B 음성 부호화기의 개회로 피치 검색 과정을 사용하지 않고 A 음성 부호화기의 최종 피치를 이용하여 B 음성 부호화기의 후보 피치를 찾아낸다.
도 2a 및 도 2b 는 본 발명에 따른 음성 상호부호화기를 거치는 과정 중 탄뎀(tandem) 방식과 상호부호화기(transcoder)를 비교하는 예시도로서, 두 개의 서로 다른 음성 상호부호화기를 사용하는 환경에서의 탄뎀 방식(도 2a)과 이를 대신하는 상호부호화기(도 2b)를 비교하여 보여주고 있다.
도 3a 및 도 3b 는 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 변환 과정을 방향에 따라 나타내는 예시도로서, AMR(Audio/Modem Riser)과 G.723.1간의 상호부호화기의 피치 변환 과정을 보여준 도 3a 및 도 3b에 도시된 바와 같이, G.723.1은 폐회로 피치를 검색하는 과정에서 AMR의 폐회로 피치 검색 과정보다 큰 윈도우를 사용한다. 즉, 더욱 많은 샘플을 사용하여 피치를 결정하기 때문에 G.723.1의 피치가 AMR의 피치보다 신뢰성이 높다. 이러한 특징을 이용하여 제안된 피치 검색 방법의 검색 범위를 결정한다.
도 4a 및 도 4b 는 본 발명에 따른 상호부호화기의 피치 검색 범위에 따른 객관적 음질 변화를 그래프로 보여주는 예시도이다.
도 4a 및 도 4b에 도시된 바와 같이, G.723.1에서 AMR 방향의 상호부호화기의 경우 G.723.1의 피치를 AMR의 피치로 아무런 변환 과정없이 사용하였을 경우, 즉 다이렉트 맵핑(direct mapping)의 경우에는 많은 음질의 저하가 발생함을 알 수 있다. 그러나, G.723.1의 피치의 신뢰성이 높기 때문에 3샘플 검색, 즉 송신단의 피치 주위의 1샘플씩을 검색하는 것에 비하여, 검색 범위를 늘려도 음질의 향상은 거의 없음을 알 수 있다.
반대 방향, 즉 AMR에서 G.723.1로의 상호부호화기의 피치 검색 범위에 따른 객관적 음질의 변화를 보면 상대적으로 신뢰도가 낮은 AMR의 피치를 사용하기 때문에 검색 범위가 커질수록 객관적 음질은 향상됨을 알 수 있다. 그러나, 검색 범위에 따른 객관적 음질의 향상은 7샘플 이상에서는 거의 없음을 알 수 있다.
이러한 실험을 토대로 객관적 음질과 연산량을 고려하여, G.723.1과 AMR간의 상호부호화 알고리즘의 제안된 피치 검색 방법의 검색 범위를 하기의 [수학식 1]과 같이 결정하기로 한다.
Figure 112004050730171-PAT00001
도 5a 및 도 5b 는 상호부호화기의 피치 검색 범위에 따른 피치의 변화를 나타내는 예시도로서, 도면에서 "Full Search"는 연산량이 가장 많은 전체 검색 범위를 다 검색하는 방법을 의미하고, "Pitch smoothing"은 기존의 방법인 피치 완만화 방법을 의미하고, "Proposed"는 본 발명에 따른 피치 검색 방법인 개선된 고속 피치 검색 방법(modified fast pitch search method)을 의미한다.
도 5a 및 도 5b에 도시된 바와 같이, 본 발명에 따른 피치 검색 방법은 기존의 피치 완만화 방법을 사용했을 경우보다 좀 더 정확한 피치를 찾음을 알 수 있다.
도 6a 내지 도 6c 는 본 발명에 따른 피치 검색 범위에 따른 연산량과 객관적 음질을 나타내는 예시도이다.
도 6a 내지 도 6c에 도시된 바와 같이, 본 발명에 따른 개선된 고속 피치 검색 방법을 사용함으로써, 기존의 피치 완만화 방법 보다 연산량을 감소시킬 수 있고, 전체 검색 범위를 검색하는 방법에 비하여 92~96% 이상 연산량을 감소시킬 수 있는 장점이 있음을 알 수 있다. 또한, 본 발명에 따른 개선된 고속 피치 검색 방법을 사용함으로써 기존의 피치 완만화 방법 보다 음질 또한 향상시킬 수 있는 장점이 있음을 알 수 있다.
또한, 연산량이 가장 많은 전체 검색 범위를 검색하는 방법에 비하여 거의 음질의 저하는 없음을 알 수 있다.
도 7a 및 도 7b 는 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 검색 방법에 대한 일실시예 흐름도이다.
도 7a는 G723.1에서 AMR로의 적응 코드북 매핑(피치 검색)과정을 나타낸 것이고, 도 7b는 AMR에서 G723.1로의 적응 코드북 매핑(피치 검색) 과정을 나타낸 것이다.
도 7a 및 도 7b에 도시된 바와 같이, 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 검색 방법(적응 코드북 맵핑 과정)은, 크게 프레임 분류 과정 (700, 800), 해당 프레임의 부프레임에서 피치를 설정하는 과정(710, 810), 설정된 피치를 이용하여 피치 추정 범위를 설정하는 과정(720, 820), 피치 추정 범위 내에서 개루프 피치를 추정하는 과정(730, 830), 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 과정(740, 840)으로 구성된다.
상기한 바와 같은 구성을 갖는 본 발명에 따른 상호부호화기의 연산량 감소를 위한 피치 검색 방법의 동작을 상세하게 설명하면 다음과 같다.
먼저, 프레임 분류 과정(700, 800)은 G.723.1은 30ms 단위로 부호화하고 AMR은 20ms 단위로 부호화하므로, 이러한 서로 다른 음성 프레임의 길이를 고려해 주기 위한 것이다. 즉, G.723.1의 두 개의 프레임과 AMR의 세 개의 프레임 사이를 상호 변환할 수 있도록 분할한다.
다음, 해당 프레임의 부프레임에서 피치를 설정하는 과정(710, 810)은 입력되는 음성의 피치를 PG나 PA로 설정한다(상기 도 3a 및 도 3b 참조).
이어서, PG나 PA 로 설정된 피치를 이용하여 피치 추정 범위를 설정하는 과정(720, 820)은 설정된 피치를 이용하여 피치 추정 범위의 최소값과 최대값을 설정하는 것이다.
이어서, 피치 추정 범위 내에서 개루프 피치를 추정하는 과정(730, 830)은 피치 추정 범위 내에서 하기의 [수학식 2]를 최대로 하는 j를 찾는 과정이다.
Figure 112004050730171-PAT00002
여기서, sw, N, Pmin과 Pmax는 인지 가중된 신호, 부프레임 사이즈, 검색 범위를 나타낸다. 즉, 개선된 고속 피치 검색 방법(빠른 개회로 피치 검색 방법)은 COL를 최대화하는 인덱스 j를 찾게 되고, 이때의 j를 개회로 피치로 선택하게 된다. 본 발명에 따른 고속 피치 검색 방법의 연산량은 Pmin과 Pmax로 표현된 검색 범위에 의하여 결정되고, 이 때의 검색범위는 각각에 해당하는 수신단의 특성을 고려하여 결정한다.
한편, 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 과정(740, 840)은 추정된 개루프 피치(j)를 이용하여 출력단의 각 프레임별 최종 피치를 검색한다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
상기와 같은 본 발명은, 각각의 음성 부호화기의 특성을 음성 상호부호화기에 적용함으로써, 상호부호화기 연산량을 더욱 감소시킬 수 있고, 복호화된 음성의 음질을 향상시킬 수 있는 효과가 있다.

Claims (5)

  1. 서로 다른 프레임과 부프레임을 갖는 상호부호화기에 적용되는 연산량 감소를 위한 피치 검색 방법에 있어서,
    서로 다른 음성 프레임 크기를 고려하여 프레임간 상호 변환할 수 있도록 프레임을 분할하는 분류 단계;
    해당 프레임의 부프레임에서 음성 피치를 설정하는 피치 설정 단계;
    송수신단의 음성 부호화기의 특성을 고려하여 상기 설정된 피치를 이용해 피치 추정 범위를 결정하는 추정 범위 결정 단계;
    상기 추정 범위 내에서 최대값을 갖는 개루프 피치를 추정하는 피치 추정 단계; 및
    상기 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 검색 단계
    를 포함하는 상호부호화기의 연산량 감소를 위한 피치 검색 방법.
  2. 제 1 항에 있어서,
    상기 피치 추정 단계는,
    상기의 피치 추정 범위 내에서 하기의 [수학식 1]의 식을 최대로 하는 j를 찾아 고속으로 피치를 검색하도록 하는 것을 특징으로 하는 상호부호화기의 연산량 감소를 위한 피치 검색 방법.
    [수학식 1]
    Figure 112004050730171-PAT00003
    (여기서, sw, N, Pmin과 Pmax는 인지 가중된 신호, 부프레임 사이즈, 검색 범위를 나타냄(즉, 제안된 개선된 고속 피치 검색 방법(빠른 개회로 피치 검색 방법)은 COL를 최대화하는 인덱스 j를 찾게 되고, 이때의 j를 개회로 피치로 선택하게 되며, 고속 피치 검색 방법의 연산량은 Pmin과 Pmax로 표현된 검색 범위에 의하여 결정되고, 이 때의 검색범위는 각각에 해당하는 수신단의 특성을 고려하여 결정됨))
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 추정 범위 결정 단계는,
    상기 상호부호화기의 송신단과 수신단의 음성부호화기의 특성에 따라, 피치 검색 과정의 검색 범위를 결정하기 위하여, 피치 추정 범위의 최대값과 최소값을 하기의 [수학식 2]와 같이 결정하는 것을 특징으로 하는 상호부호화기의 연산량 감소를 위한 피치 검색 방법.
    [수학식 2]
    Figure 112004050730171-PAT00004
  4. 제 3 항에 있어서,
    상기 검색 단계는,
    상기 추정된 개루프 피치(j)를 이용하여 출력단의 각 프레임별 최종 피치를 검색하는 것을 특징으로 하는 상호부호화기의 연산량 감소를 위한 피치 검색 방법.
  5. 서로 다른 프레임과 부프레임을 갖는 프로세서를 구비한 상호부호화기에,
    서로 다른 음성 프레임 크기를 고려하여 프레임간 상호 변환할 수 있도록 프레임을 분할하는 분류 기능;
    해당 프레임의 부프레임에서 음성 피치를 설정하는 피치 설정 기능;
    송수신단의 음성 부호화기의 특성을 고려하여 상기 설정된 피치를 이용해 피치 추정 범위를 결정하는 추정 범위 결정 기능;
    상기 추정 범위 내에서 최대값을 갖는 개루프 피치를 추정하는 피치 추정 기능; 및
    상기 추정된 개루프 피치를 이용하여 폐루프 피치를 검색하는 검색 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020040088460A 2004-11-02 2004-11-02 상호부호화기의 연산량 감소를 위한 피치 검색 방법 KR20060039320A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020040088460A KR20060039320A (ko) 2004-11-02 2004-11-02 상호부호화기의 연산량 감소를 위한 피치 검색 방법
US11/261,348 US20060095255A1 (en) 2004-11-02 2005-10-27 Pitch conversion method for reducing complexity of transcoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020040088460A KR20060039320A (ko) 2004-11-02 2004-11-02 상호부호화기의 연산량 감소를 위한 피치 검색 방법

Publications (1)

Publication Number Publication Date
KR20060039320A true KR20060039320A (ko) 2006-05-08

Family

ID=36263171

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020040088460A KR20060039320A (ko) 2004-11-02 2004-11-02 상호부호화기의 연산량 감소를 위한 피치 검색 방법

Country Status (2)

Country Link
US (1) US20060095255A1 (ko)
KR (1) KR20060039320A (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US7469209B2 (en) * 2003-08-14 2008-12-23 Dilithium Networks Pty Ltd. Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications

Also Published As

Publication number Publication date
US20060095255A1 (en) 2006-05-04

Similar Documents

Publication Publication Date Title
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
US8428936B2 (en) Decoder for audio signal including generic audio and speech frames
KR101430332B1 (ko) 일반 오디오 및 음성 프레임들을 포함하는 오디오 신호를 위한 인코더
KR100908219B1 (ko) 로버스트한 음성 분류를 위한 방법 및 장치
US7752038B2 (en) Pitch lag estimation
JP5521097B2 (ja) 信号を符号化する方法および信号を復号する方法
CN103069483B (zh) 编码装置以及编码方法
US8078457B2 (en) Method for adapting for an interoperability between short-term correlation models of digital signals
KR100647290B1 (ko) 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
US8112271B2 (en) Audio encoding device and audio encoding method
KR100550003B1 (ko) 상호부호화기에서 개회로 피치 추정 방법 및 그 장치
US20130096913A1 (en) Method and apparatus for adaptive multi rate codec
KR20060039320A (ko) 상호부호화기의 연산량 감소를 위한 피치 검색 방법
Oshikiri et al. A 2.4‐kbps variable‐bit‐rate ADP‐CELP speech coder
Miki et al. Pitch synchronous innovation code excited linear prediction (PSI‐CELP)
JPH09120300A (ja) ベクトル量子化装置
Yang et al. High performance CELP coder utilizing a novel adaptive forward-backward LPC quantization
JPH10105196A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application