KR100468960B1 - 음성부호화 시스템의 양방향 피치 강화 시스템 - Google Patents

음성부호화 시스템의 양방향 피치 강화 시스템 Download PDF

Info

Publication number
KR100468960B1
KR100468960B1 KR10-2001-7016919A KR20017016919A KR100468960B1 KR 100468960 B1 KR100468960 B1 KR 100468960B1 KR 20017016919 A KR20017016919 A KR 20017016919A KR 100468960 B1 KR100468960 B1 KR 100468960B1
Authority
KR
South Korea
Prior art keywords
pitch enhancement
speech
pulse
excitation signal
subframe
Prior art date
Application number
KR10-2001-7016919A
Other languages
English (en)
Other versions
KR20020013941A (ko
Inventor
양 가오
Original Assignee
코넥스안트 시스템스, 인코퍼레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코넥스안트 시스템스, 인코퍼레이티드 filed Critical 코넥스안트 시스템스, 인코퍼레이티드
Publication of KR20020013941A publication Critical patent/KR20020013941A/ko
Application granted granted Critical
Publication of KR100468960B1 publication Critical patent/KR100468960B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

음성부호화 시스템용의 양방향 피치강화 시스템에 있어서 음성데이터 어플리케이션이 고유의 대역폭 한계를 갖는 영역에서 계속하여 운용됨에 따라 전형적인 음성부호화 시스템에서 재생음성데이터의 인식품질이 상당히 손상을 입게 되었다. 본 발명은 재생음성의 높은 인식품질을 유지하기 위해 전방 피치강화와 후방 피치강화를 이용한다. 원하면 후방 피치강화는 이미 생성된 전방 피치강화의 미러 이미지인 후방 피치강화와 함께 전방 피치강화 자체를 이용하여 생성된다. 이와 달리 본 발명의 다른 실시예에서는 후방 피치강화가 전방 피치강화와 독립적으로 생성된다. 후방 피치강화는 보통 코드여기 선형예측(Code Excited Linear Prediction: CELP)의 고정 코드북에서 실행되거나 또는 디코더 내에서 후처리로서 실행된다.

Description

음성부호화 시스템의 양방향 피치 강화 시스템{BI-DIRECTIONAL PITCH ENHANCEMENT IN SPEECH CODING SYSTEMS}
종래의 음성부호화 시스템은 전형적으로 부호여기 선형예측 음성부호화 시스템(code-excited linear prediction speech coding system)에서 전방 피치 보강만을 이용한다. 이것은 비교적 큰 대역폭의 유용성을 갖는 서브프레임 크기의 종래의 음성코덱이 전방 피치보강만으로도 충분한 인식품질을 제공할 수 있다는 사실에 대부분 기인한 것이다. 그러나 음성부호화 시스템에서 사용되는 다양한 통신매체에서의 보다 낮은 비트율에 있어서는 재생음성의 인식품질이 합성후 높은 인식품질을 유지할 수 없다. 이들 감소된 비트율에서 동작하는 종래의 음성부호화 시스템에 있어서, 피치예측 중에 발생되는 피치지연(pitch lag)은 전체 서브프레임 크기보다 보통 훨씬 짧다. 즉, 피치지연은 전체 서브프레임의 비교적 작은 부분을 커버한다. 이 특성은 여성과 아이들 등의 보다 높은(짧은) 피치를 갖는 화자(話者)에 있어서는 더욱 감쇄된다. 전통적인 여기 코드북 구조(excitation codebook structure)는저비트율에서 동작할 때 충분히 높은 인식품질을 제공할 수 없다. 이것은 주로 음성신호의 주기성이 충분히 확립되지 않거나 코드북으로부터 추출된 여기 벡터가 높은 인식품질을 갖는 합성 음성신호를 생성할 만큼 충분하지 못하기 때문이다.
흔히 비트율을 감소시키는 통신 시스템과 관련되어 있는 바와 같이 음성부호화 시스템의 서브프레임 크기가 커짐에 따라 전방으로만 피치강화가 수행된다는 사실로 인해 상당히 빈약한 인식품질을 얻게 된다. 이것은 무엇보다도 많은 펄스의 부재로 인해 서브프레임에 상당량의 죽은 공간이 있기 때문이다. 보다 높은 비트율로 동작하고 결과적으로 보다 짧은 서브프레임을 갖는 종래의 음성부호화 시스템에서 이러한 효과는 인간의 귀로는 청각적으로 인식할 수 없다. 보다 낮은 인식품질의 이 효과는 비교적 낮은 이용가능한 비트율을 갖는 음성부호화를 처리하는 거의 모든 음성부호화 시스템에서 실현된다.
종래 및 전통적인 시스템에 대한 추가적인 한계와 단점은 도면을 참조로 이하에서 설명되는 본 발명과 상기 시스템의 비교를 통해 당해 분야의 기술자라면 분명히 알 수 있을 것이다.
발명의 요약
본 발명의 다양한 특징은 전방 피치강화 및 후방 피치강화를 이용하는 음성부호화 시스템에서 찾아볼 수 있다. 본 발명의 어떤 실시예에서는 전방 피치강화와 후방 피치강화가 전체 음성부호화 시스템의 단일 부분에서 실행된다. 예를 들어, 인코더와 디코더를 포함하는 음성코덱을 갖는 음성부호화 시스템에서는 전방 피치강화와 후방 피치강화는 음성코덱의 인코더와 디코더 모두에서 실행된다. 이와 달리 본 발명의 다른 실시예에서는 전방 피치강화 및 후방 피치강화가 음성코덱의 디코더에서만 실행된다. 특정 어플리케이션에 의해 결정된 바와 같이 전방 피치강화 및 후방 피치강화는 분배되는 방식으로 실행되며, 음성코덱의 인코더와 디코더의 각각에서 적어도 부분적으로는 각각 실행된다.
본 발명의 어떤 실시예에서는 전방 피치강화 자체를 이용하여 후방 피치강화가 발생된다. 후방 피치강화는 이미 발생된 전방 피치강화의 미러 이미지이며, 후방 피치강화는 전방 피치강화에 따라 발생된다. 이와 달리, 본 발명의 다른 실시예에서는 전방 피치강화와 독립하여 발생되며, 후방 피치강화는 이미 발생된 전방 피치강화와 상관없이 발생된다.
본 발명에 따라 만들어진 음성부호화 시스템은 한정되거나 축소된 대역폭의 유용성을 갖는 통신매체를 이용하여 동작하는 음성부호화 시스템과 적절하게 연동된다. 본 발명의 범위를 벗어나지 않는 어떠한 통신매체라도 본 발명에 이용될 수 있다. 이러한 통신매체의 예로는 무선 통신매체, 유선기반의 전화통신 매체, 광섬유 통신매체 및 이더넷이 있으나 그것에 한정되는 것은 아니다.
본 발명의다른 특징, 이점 및 신규의 특징은 첨부도면과 관련한 다음의 상세한 설명으로부터 분명해 질 것이다.
본 발명은 음성부호화에 관한 것으로, 보다 구체적으로는 재생된 음성의 인식품질(perceptual quality)을 향상시키기 위해 피치강화(pitch enhancement)를 이용하는 저비트율의 음성부호화 시스템에 관한 것이다.
도 1은 본 발명에 따라 구축된 음성 피치강화 시스템의 일실시예를 도시한 시스템도.
도 2는 본 발명에 따르는 음성 피치강화를 이용하는 분포된 음성코덱의 일실시예를 도시한 시스템도.
도 3은 본 발명에 따르는 음성 피치강화를 이용하는 분배된 음성코덱의 다른 실시예를 도시한 시스템도.
도 4는 본 발명에 따르는 음성 피치강화를 이용하는 통합 음성코덱의 다른 실시예를 도시한 시스템도.
도 5는 본 발명에 따르는 피치강화를 실행하기 위해 전방 및 후방 예측펄스를 나타내는 음성 서브프레임을 도시한 도면.
도 6은 본 발명에 따르는 전방 음성 피치강화를 이용하여 후방 음성 피치강화를 발생시키는 본 발명의 실시예를 도시한 기능 블록도.
도 7은 본 발명에 따르는 전방 음성 피치강화와 독립하여 후방 음성 피치강화를 실행하는 본 발명의 실시예를 도시한 기능 블록도.
도면의 상세한 설명
도 1은 본 발명에 따라 구축된 음성 피치강화 시스템(110)의 일실시예(100)를 도시한 시스템도이다. 음성 피치강화 시스템(110)은 무엇보다도 피치강화 처리회로(112), 음성부호화회로(114), 전방 피치강화회로(116), 후방 피치강화회로(118) 및 음성처리회로(119)를 포함한다. 음성 피치강화시스템(110)은 비강화 음성 데이터 또는 여기신호(120)로 동작하여 피치강화 음성데이터(130)를 발생시킨다. 피치가 강화된 피치강화 음성데이터 또는 여기신호(130)는 음성 서브프레임에 대해 전방 및 후방에서 피치예측 및 피치강화를 실행한 음성 데이터를 포함한다. 음성 피치강화 시스템(110)은 본 발명의 어떤 실시예에서는 여기신호에서만 동작하며, 본 발명의 다른 실시예에서는 음성 데이터에서만 동작한다.
본 발명의 어떤 실시예에서 음성 피치강화 시스템(110)은 후방 피치강화회로(118)를 이용하여 후방 피치예측을 생성하도록 독립적으로 동작한다. 이와 달리, 전방 피치강화회로(116) 및 후방 피치강화회로(118)는 음성부호화 시스템의 전체 피치강화를 발생시키도록 연동한다. 전방 피치강화회로(116)와 후방 피치강화회로(118)를 감시하는 관리제어동작은 본 발명의 다른 실시예에서는 피치강화 처리회로(112)를 이용하여 실행된다. 음성처리회로(119)는 음성 데이터의 조작을 음성처리하고 실행하는 분야의 기술자에게 알려져 있는 음성처리회로를 포함하지만 그것에 한정되는 것은 아니다. 음성부호화회로(114)는 마찬가지로 음성부호화 분야의 기술자에게 알려져 있는 회로를 포함하나 그것에 한정되는 것은 아니다. 이들 분야의 기술자에게 알려져 있는 이러한 음성부호화는 다른 음성부호화 방법 중에서도 코드여기 선형예측(code-excited linear prediction), 대수 코드여기 선형예측 및 펄스형 여기(pulse-like excitation)를 포함한다.
도 2는 본 발명에 따르는 음성 피치강화를 이용하는 분배 음성코덱(distributed speech codec)(200)의 일실시예를 도시한 시스템도이다. 분배 음성코덱(200)의 음성인코더(220)는 피치강화 부호화(221)를 실행한다. 피치강화 부호화(221)는 후방 펄스 피치예측회로(222)와 전방 펄스 피치예측회로(223)를 이용하여 실행된다. 본 발명의 다른 실시예에서 상술한 바와 같이, 피치강화 부호화(221)는 음성 서브프레임 내에서 전후방 양방향으로 피치예측 및 피치강화를 발생시킨다. 분배 음성코덱(200)의 음성인코더(220)는 또한 음성 서브프레임 내에 신호부호화(226)와 위치부호화(227)를 모두 포함하는 음성신호의 주펄스 부호화(225)를 실행한다. 음성처리회로(229)는 또한 분배 음성코덱(200)의 음성인코더(220) 내에서 이용되어 음성 데이터의 조작을 음성처리하고 실행하는 분야의 기술자에게 알려져 있는 방법을 이용하여 음성처리하는데 도움을 준다. 또한 음성처리회로(229)는 본 발명의 어떤 실시예에서는 후방 펄스 피치예측회로(222) 및 전방 펄스 피치예측회로(223)와 연동하여 동작한다. 분배 음성코덱(200)의 음성인코더(220)에 의해 적어도 어느 정도 처리된 후의 음성 데이터는 통신링크를 통해 분배 음성코덱(200)의 음성디코더(230)에 전송된다. 통신링크(210)는 음성데이터를 전송할 수 있는, 무선 통신매체, 유선기반의 전화통신매체, 광섬유 통신매체, 및 이더넷을 포함하는 임의의 통신매체이지만 그것에 한정되는 것은 아니다. 음성데이터를 전송할 수 있는 어떤 통신매체라도 본 발명의 사상 및 범위로부터 벗어나지 않는다면 이러한 통신링크(210)에 포함된다. 분배 음성코덱(200)의 음성디코더(230)는 무엇보다도 음성 재생회로(232), 인식보상회로(234) 및 음성처리회로(236)를 포함한다.
본 발명의 어떤 실시예에서는 음성처리회로(229)와 음성처리회로(236)는 분배 음성코덱(200)의 전체 내의 음성데이터와 연동하여 동작한다. 이와 달리 음성처리회로(229) 및 음성처리회로(236)는 음성데이터와 독립적으로 동작하기도 하며, 각각은 음성인코더(220)와 음성디코더(230)에서 개개의 음성처리기능을 각각 실행한다. 음성처리회로(229)와 음성처리회로(236)는 음성데이터의 조작을 동작 및 실행하는 음성처리 분야의 기술자에게 알려져 있는 음성처리회로를 포함하지만 그것에 한정되는 것은 아니다. 이와 유사하게 주펄스 부호화회로(225)는 음성부호화 분야의 기술자에게 알려져 있는 회로를 포함하지만 그것에 한정되는 것은 아니다. 이러한 주펄스 부호화회로의 예로는 다른 주펄스 부호화 방법 중에서도 본 발명의 다른 실시예에서 설명한 바와 같이 이 분야의 기술자에게 알려져 있는 회로인 코드여기 선형예측, 대수 코드여기 선형예측, 및 펄스형 여기를 포함한다.
도 3은 본 발명의 실시예에 따라 음성 피치강화를 이용하는 분포 음성코덱(300)의 다른 실시예를 도시한 시스템도이다. 분포 음성코덱(300)의 음성인코더(320)는 음성 서브프레임 내에서 신호부호화(326)와 위치부호화(327)를 모두 포함하는 음성신호의 주펄스 부호화(325)를 실행한다. 음성처리회로(329)는 또한 음성데이터의 조작을 동작시키고 실행하도록 음성처리하는 분야의 기술자에게 알려져 있는 방법을 이용하는 음성처리에서 도움을 주도록 분배 음성코덱(300)의 음성 인코더(320) 내에서 이용된다. 분배 음성코덱(300)의 음성인코더(320)에 의해 적어도 어느 정도 처리된 후의 음성 데이터는 통신링크(310)를 통해 분배 음성코덱(300)의 음성디코더(330)에 전송된다. 통신링크(310)는 음성데이터를 전송할 수 있는, 무선 통신매체, 유선기반의 전화통신매체, 광섬유 통신매체, 및 이더넷을 포함하는 임의의 통신매체이지만 그것에 한정되는 것은 아니다. 음성데이터를 전송할 수 있는 어떤 통신매체라도 본 발명의 사상 및 범위로부터 벗어나지 않는다면 이러한 통신링크(310)에 포함된다. 분배 음성코덱(300)의 음성디코더(330)는 피치강화 부호화(321)를 실행한다. 피치강화 부호화(321)는 후방 펄스 피치예측회로(322) 및 전방펄스 피치예측회로(323)를 모두 이용하여 실행된다. 본발명의 다양한 실시예에서 상술한 바와 같이, 피치강화 부호화(321)는 음성 서브프레임 내의 전후방 양방향으로 피치예측 및 피치보강을 생성한다. 음성처리회로(336)는 또한 음성데이터의 조작을 동작시키고 실행하도록 하는 음성처리 분야의 기술자에게 알려져 있는 방법을 이용하는 음성처리에 도움이 되도록 분포 음성코덱(300)의 음성디코더(330) 내에서 이용된다. 또한 음성처리회로(339)는 본 발명의 어떤 실시예에서는 후방펄스 피치예측회로(322)와 전방펄스 피치예측회로(323)와 연동하여 동작한다.
본 발명의 어떤 실시예에서는 음성처리회로(329)와 음성처리회로(336)는 분포 음성코덱(300)의 전체 내의 음성데이터에 연동하여 동작한다. 이와 달리 음성처리회로(329) 및 음성처리회로(336)는 음성데이터와 독립적으로 동작하기도 하며, 각각은 음성인코더(320)와 음성디코더(330)에서 개개의 음성처리기능을 각각 실행한다. 음성처리회로(329)와 음성처리회로(336)는 음성데이터의 조작을 동작 및 실행하는 음성처리 분야의 기술자에게 알려져 있는 음성처리회로(336)를 포함하지만 그것에 한정되는 것은 아니다. 이와 유사하게 주펄스 부호화회로(325)는 음성부호화 분야의 기술자에게 알려져 있는 회로를 포함하지만 그것에 한정되는 것은 아니다. 이러한 주펄스 부호화회로의 예로는 다른 주펄스 부호화 방법 중에서도 본 발명의 다른 실시예에서 설명한 바와 같이 이 기술분야의 기술자에게 알려져 있는 회로인 코드여기 선형예측, 대수 코드여기 선형예측, 및 펄스형 여기를 포함한다.
도 4는 본 발명의 실시예에 따라 음성 피치강화를 이용하는 통합 음성코덱(420)의 다른 실시예(400)를 도시한 시스템도이다. 통합 음성코덱(420)은무엇보다도 저비트율의 통신링크(410)를 통해 음성디코더(424)와 통신되는 음성인코더(422)를 포함한다. 저비트율의 통신링크(410)는 음성화된 데이터를 전송할 수 있는, 무선 통신매체, 유선기반의 전화통신매체, 광섬유 통신매체, 및 이더넷을 포함하는 임의의 통신매체를 포함하지만 그것에 한정되는 것은 아니다. 음성데이터를 전송할 수 있는 어떤 통신매체라도 본 발명의 사상 및 범위로부터 벗어나지 않는다면 저비트율 통신링크(410)에 포함된다. 피치강화 부호화(421)는 통합 음성코덱(420)에서 실행된다. 피치강화 부호화(421)는 무엇보다도 후방펄스 피치예측회로(422)와 전방펄스 피치예측회로(423)를 이용하여 실행된다. 본 발명의 다양한 실시예에서 설명된 바와 같이, 후방펄스 피치예측회로(422) 및 전방펄스 피치예측회로(423)는 본 발명의 어떤 실시예에서는 연동하여 동작하고, 본 발명의 다른 실시예에서는 독립적으로 동작한다.
실시예(400)에 도시된 바와 같이, 후방펄스 피치예측회로(422)와 전방펄스 예측회로(423)는 통합 음성코덱(420)의 전체 내에 포함된다. 만약 필요하면, 후방펄스 피치예측회로(422)와 전방펄스 예측회로(423)는 본 발명의 어떤 실시예에서는 음성인코더(422)와 음성디코더(424)의 각각에 모두 포함된다. 이와 달리, 본 발명의 다른 실시예에서는 후방펄스 피치예측회로(422) 또는 전방펄스 피치예측회로(423)의 어느 하나가 음성인코더(422)와 음성디코더(424) 중 어느 하나에만 포함된다. 특정 실시예에 따라 사용자는 음성인코더(422)와 음성디코더(424) 중 단 하나 또는 어느 하나에 후방펄스 피치예측회로(422)와 전방펄스 피치예측회로(423)를 위치시키도록 선택할 수 있다. 음성 인코더(422)와 음성디코더(424)에서 다양한 양의 후방펄스 피치예측회로(422)와 전방펄스 피치예측회로(423)를 위치시키도록 본 발명의 사상과 범위로부터 벗어남이 없는 본 발명의 다양한 실시예를 생각해 볼 수 있다. 예컨대 본 발명의 어떤 실시예에서는 후방펄스 피치예측회로(422)의 미리결정된 부분이 음성인코더(422)에 위치되지만 후방펄스 피치예측회로(422)의 나머지 부분은 음성디코더(424)에 위치된다. 유사하게 본 발명의 어떤 실시예에서는 전방펄스 피치예측회로(423)의 미리결정된 부분이 음성인코더(422)에 위치되지만 전방펄스 피치예측회로(423)의 나머지 부분은 음성디코더(424)에 위치된다.
도 5는 본 발명에 따라 실행된 전방 피치강화 및 후방 피치강화를 나타낸 음성 서브프레임(510)을 도시한 부호화 그래프(500)이다. 주펄스 Mo(520)는 코드여기 선형예측, 대수 코드여기 선형예측, 합성음성부호화에 의한 분석, 및 펄스형 여기를 포함하지만 그것에 제한되는 것은 아닌 음성처리 분야의 기술자에게 알려져 있는 임의의 방법을 이용하여 음성 서브프레임(510)에서 발생된다. 본 발명의 다양한 실시예에서 실행된 상술한 방법을 포함하는 음성처리의 다양한 방법을 이용하여, 전방 예측펄스 M1(530), 전방 예측펄스 M2(540) 및 전방 예측펄스 M3(550)이 모두 생성되며 음성 서브프레임(510) 내에 위치된다. 상술한 바와 같이, 전방 예측펄스 M1(530), 전방 예측펄스 M2(540) 및 전방 예측펄스 M3(550)은 본 발명의 어떤 실시예에서는 다양한 처리회로를 이용하여 실행된다. 또한 후방 예측펄스 M-1(560) 및 후방 예측펄스 M-2(570)도 본 발명에 따라 생성된다.
본 발명의 어떤 실시예에서는 후방 예측펄스 M-1(560) 및 후방 예측펄스 M-2(570)는 전방 예측펄스 M1(530), 전방 예측펄스 M2(540) 및 전방 예측펄스 M3(550)을 이용하여 생성된다. 이와 달리 다른 실시예에서는 후방 예측펄스 M-1(560)과 후방 예측펄스 M-2(570)는 전방 예측펄스 M1(530), 전방 예측펄스 M2(540) 및 전방 예측펄스 M3(550)과 독립하여 생성된다. 후방 예측펄스 M-1(560) 및 후방 예측펄스 M-2(570)의 독립적인 생성의 예는 음성 서브프레임(510)의 시간 스케일이 소프트웨어로 반전되는 소프트웨어 내에서의 실행이다. 주펄스 Mo(520)는 전방 예측펄스 M1(530), 전방 예측펄스 M2(540) 및 전방 예측펄스 M3(550)와, 후방 예측펄스 M-1(560) 및 후방 예측펄스 M-2(570)를 모두 생성시키기도록 유사한 방식으로 사용된다. 즉, 이 방법은 일단 통상적인 전방향으로 실행되고, 음성 서브프레임(510)이 소프트웨어에 의해 반전된 후, 다시 한번 변칙적인 후방으로 실행되지만, 이것은 동일한 수학적 방법을 이용한다. 다시 말해 데이터만이 음성 서브프레임(510)에 대해 반전된다.
도 6은 본 발명에 따라 전방 음성 피치강화를 이용하여 후방 음성 피치강화를 생성하는 본 발명의 실시예(600)를 나타낸 기능블록도를 도시한 것이다. 블록 610에서 음성신호가 처리된다. 블록 620에서는 음성데이터의 주펄스가 부호화된다. 다른 처리블록 655에서는 음성데이터 정보가 통신링크를 통해 전송된다. 다른 처리블록 655는 부호화된 음성데이터가 음성재생을 위해 전송된 후 전방 피치강화 및후방 피치강화가 실행되는 본 발명의 실시예에서 이용된다. 블록 630에서는 전방 피치강화가 실행되고, 블록 640에서는 후방 피치강화가 실행된다. 블록 640의 후방 피치강화는 본 발명의 어떤 실시예에서는 블록 630에서 생성된 전방 피치강화의 미러 이미지이다. 다른 실시예에서는 블록 640의 후방 피치강화는 블록 630에서 생성된 전방 피치강화의 미러 이미지가 아니다. 다른 처리블록 650에서는 음성데이터 정보가 통신링크를 통해 전송된다. 다른 처리블록 650은 부호화된 음성데이터가 음성재생을 위해 전송되기 전에 전방 피치강화 및 후방 피치강화가 실행되는 본 발명의 실시예에서 이용된다. 블록 660에서는 음성신호가 재생/합성된다.
본 발명의 어떤 실시예에서는 블록 640에서 실행되는 후방 피치강화가 블록 650에서 실행되는 전방 피치강화의 단순한 복사본이다. 즉, 블록 640의 후방 피치강화는 블록 630에서 생성된 전방 피치강화의 미러 이미지이다. 예컨대, 블록 650에서 전방 피치강화가 실행된 후, 음성신호를 합성 및 재생하는 음성처리 분야의 기술자에게 알려져 있는 방법을 사용하여 블록 640에서 실행된 후방 피치강화를 생성시키도록 최종 피치강화는 단순히 음성 서브프레임 내에서 복사 및 반전된다.
도 7은 본 발명에 따라 전방 음성 피치강화와 독립하여 후방 음성 피치강화를 실행하는 본 발명의 실시예(700)를 도시한 기능블록도이다. 블록 710에서는 음성신호가 처리된다. 블록 720에서는 음성데이터의 주펄스가 부호화된다. 다른 처리블록 755에서는 음성데이터 정보가 통신링크를 통해 전송된다. 다른 처리블록 755는 부호화된 음성데이터가 음성재생을 위해 전송된 후 전방 피치강화 및 후방 피치강화가 실행되는 본 발명의 실시예에서 이용된다. 블록 730에서는 전방 피치강화가실행되고, 블록 740에서는 후방 피치강화가 실행된다. 블록 740의 후방 피치강화는 음성데이터가 반전된 후, 즉 블록 740의 후방 피치강화가 블록 730에서 실행된 전방 피치강화와 독립적으로 실행된 후 실행된다. 이 특정 실시예는 음성데이터가 반전되고 블록 740의 후방 피치강화가 마치 전체의 새로운 음성데이터 세트가 처리된 것처럼 생성된다는 점에서 실시예(600)에 예시된 것과는 다르다. 반대로 실시예(600)에서는 최종 피치강화 자체가 이용되지만 반대방향으로 확장된다. 실시예(700)의 어떤 실시예에서는 2세트의 음성데이터가 각각의 서브프레임에 대하여 처리되는 것과 같다. 즉, 한 세트의 데이터는 블록 730에서 전방향으로 피치예측을 생성하도록 처리되고, 다른 한 세트의 데이터는 블록 740에서 후방으로 피치예측을 생성하도록 처리되나 이들은 모두 음성데이터의 동일한 서브프레임 상에서 동작한다. 다른 처리블록 750에서 음성데이터 정보는 통신링크를 통해 전송된다. 다른 처리블록 650은 블록 730의 전방 피치강화와 블록 740의 후방 피치강화가 부호화된 음성데이터가 음성재생을 위해 전송되기 전에 실행되는 본 발명의 실시예에서 이용된다. 블록 760에서 음성신호는 재구성/합성된다.
본 발명의 상세한 설명과 관련도면을 고려하면 이 기술분야의 기술자는 다른 수정 및 변경을 가할 수 있음이 분명하다. 이러한 수정과 변경은 본 발명의 범위를 벗어나지 않고 실행할 수 있는 것이 분명하다.

Claims (23)

  1. 여기신호에 대한 피치강화를 실행하는 코드여기 선형예측(Code Excited Linear Prediction: CELP) 음성코덱에 있어서,
    음성 서브프레임에서 적어도 하나의 주펄스를 위치하도록 구성된 주펄스 부호화 모듈;
    상기 음성코덱내에 포함되고, 상기 음성 서브프레임에서 동작하며, 상기 음성 서브프레임내에 적어도 하나의 전방 예측펄스를 위치하도록 추가로 구성된 전방 피치강화회로; 및
    상기 음성코덱내에 포함되고, 상기 음성 서브프레임에 동작하며, 상기 음성 서브프레임내에 적어도 하나의 후방 예측펄스를 위치하도록 추가로 구성된 후방 피치강화회로를 포함하는 것을 특징으로 하는 코드여기 선형예측 음성코덱.
  2. 제 1 항에 있어서,
    상기 전방 피치강화회로와 상기 후방 피치강화회로는 재생용 여기신호의 인식품질을 향상시키기 위해 연동하도록 구성되는 것을 특징으로 하는 코드여기 선형예측 음성코덱.
  3. 제 1 항에 있어서,
    상기 전방 피치강화회로와 상기 후방 피치강화회로는 재생용 여기신호의 인식품질을 향상시키기 위해 독립적으로 동작하도록 구성되는 것을 특징으로 하는 코드여기 선형예측 음성코덱.
  4. 여기신호에 동작하는 코드여기 선형예측 피치강화 시스템에 있어서,
    음성 서브프레임에서 적어도 하나의 주펄스를 위치하도록 구성된 주펄스 부호화 모듈;
    상기 음성 서브프레임에서 동작하도록 구성되고, 상기 음성 서브프레임내에서 적어도 하나의 후방 예측펄스를 위치하도록 추가로 구성되며, 인코더와 디코더 사이에 분배된 후방 피치강화회로; 및
    상기 후방 피치강화회로에 결합되며 여기신호를 조작하도록 구성된 음성처리회로를 포함하는 것을 특징으로 하는 코드여기 선형예측 음성 피치강화 시스템.
  5. 제 4 항에 있어서,
    상기 후방 피치강화회로에 결합되는 전방 피치강화회로를 추가로 포함하며, 상기 전방 피치강화회로는 상기 음성 서브프레임내에 적어도 하나의 전방 예측펄스를 위치하도록 구성되는 것을 특징으로 하는 코드여기 선형예측 음성 피치강화 시스템.
  6. 제 5 항에 있어서,
    상기 전방 피치강화회로와 상기 후방 피치강화회로는 재생용 여기신호의 인식품질을 향상시키시기 위해 연동하도록 구성되는 것을 특징으로 하는 코드여기 선형예측 음성 피치강화 시스템.
  7. 제 5 항에 있어서,
    상기 전방 피치강화회로와 상기 후방 피치강화회로는 재생용 여기신호의 인식품질을 향상시키시기 위해 독립적으로 동작하도록 구성되는 것을 특징으로 하는 코드여기 선형예측 음성 피치강화 시스템.
  8. 여기신호에 대한 코드여기 선형예측 피치강화를 실행하는 코드여기 선형예측방법에 있어서,
    음성 서브프레임내에 적어도 하나의 주펄스를 위치시키는 단계;
    상기 음성 서브프레임내에 적어도 하나의 전방 예측펄스를 위치시킴으로써 여기신호에 대하여 전방 피치강화를 실행하는 단계; 및
    상기 음성 서브프레임내에 적어도 하나의 후방 예측펄스를 위치시킴으로써 여기신호에 대하여 후방 피치강화를 실행하는 단계를 포함하는 것을 특징으로 하는 방법.
  9. 제 8 항에 있어서,
    상기 여기신호에 대하여 전방 피치강화를 실행하는 단계와 상기 여기신호에 대하여 후방 피치강화를 실행하는 단계는 재생용 여기신호의 인식품질을 향상시키도록 독립적으로 또는 연동하여 실행되는 것을 특징으로 하는 방법.
  10. 제 8 항에 있어서,
    상기 여기신호에 대하여 후방 피치강화를 실행하는 단계는 상기 여기신호에 대하여 전방 피치강화를 실행하는 단계에 기초한 것을 특징으로 하는 방법.
  11. 제 8 항에 있어서,
    상기 각각의 예측펄스는 상기 주펄스보다 낮은 게인(gain)을 가지는 것을 특징으로 하는 방법.
  12. 제 8 항에 있어서,
    상기 후방 예측펄스가 상기 전방 예측펄스를 이용하여 생성되는 것을 특징으로 하는 방법.
  13. 제 8 항에 있어서,
    상기 후방 예측펄스와 상기 전방 예측펄스가 상기 주펄스를 이용하여 생성되는 것을 특징으로 하는 방법.
  14. 여기신호에 대하여 피치강화를 실행하는 코드여기 선형예측 음성코덱에 있어서,
    음성 서브프레임에서 적어도 하나의 주펄스를 위치하도록 구성된 인코더;
    상기 인코더에 통신가능하게 결합된 통신링크;
    상기 통신링크를 통해 상기 인코더에 통신가능하게 결합된 디코더;
    상기 음성코덱내에 포함되고, 상기 음성 서브프레임에서 동작하며, 상기 음성 서브프레임내에 적어도 하나의 전방 예측펄스를 위치하도록 추가로 구성된 전방 피치강화회로; 및
    상기 음성코덱내에 포함되고, 상기 음성 서브프레임에서 동작하며, 상기 음성 서브프레임내에 적어도 하나의 후방 예측펄스를 위치하도록 추가로 구성된 후방 피치강화회로를 포함하는 것을 특징으로 하는 코드여기 선형예측 음성코덱.
  15. 제 14 항에 있어서,
    상기 전방 피치강화회로와 상기 후방 피치강화회로가 재생용 여기신호의 인식품질을 향상시키도록 연동하는 것을 특징으로 하는 코드여기 선형예측 음성코덱.
  16. 제 14 항에 있어서,
    상기 전방 피치강화회로와 상기 후방 피치강화회로가 재생용 여기신호의 인식품질을 향상시키도록 독립적으로 동작하는 것을 특징으로 하는 코드여기 선형예측 음성코덱.
  17. 제 1 항에 있어서,
    상기 각각의 예측펄스는 상기 주펄스보다 낮은 게인(gain)을 가지는 것을 특징으로 하는 코드여기 선형예측 음성코덱.
  18. 제 1 항에 있어서,
    상기 후방 예측펄스와 상기 전방 예측펄스가 상기 주펄스를 이용하여 생성되는 것을 특징으로 하는 코드여기 선형예측 음성코덱.
  19. 제 1 항에 있어서,
    상기 후방 예측펄스가 상기 전방 예측펄스를 이용하여 생성되는 것을 특징으로 하는 코드여기 선형예측 음성코덱.
  20. 여기신호에 대해 동작하는 코드여기 선형예측 음성피치강화 시스템에 있어서,
    음성 서브프레임에서 적어도 하나의 주펄스를 위치하도록 구성된 주펄스 부호화 모듈; 및
    상기 음성 서브프레임에 동작하도록 구성되고, 상기 음성 서브프레임내에 적어도 하나의 후방 예측펄스가 위치하도록 추가로 구성된 후방 피치강화회로를 포함하는 것을 특징으로 하는 코드여기 선형예측 음성피치강화 시스템.
  21. 제 20 항에 있어서,
    상기 후방 피치강화회로에 통신가능하게 결합되고, 상기 음성 서브프레임에서 동작하며, 상기 음성 서브프레임내에 적어도 하나의 전방 예측펄스를 위치하도록 추가로 구성된 전방 피치강화회로를 추가로 포함하는 코드여기 선형예측 음성 피치강화 시스템.
  22. 제 21 항에 있어서,
    상기 전방 피치강화회로와 상기 후방 피치강화회로가 재생용 여기신호의 인식품질을 향상시키도록 연동하는 것을 특징으로 하는 코드여기 선형예측 음성피치강화 시스템.
  23. 제 21 항에 있어서,
    상기 전방 피치강화회로와 상기 후방 피치강화회로가 재생용 여기신호의 인식품질을 향상시키도록 독립적으로 동작하는 것을 특징으로 하는 코드여기 선형예측 음성피치강화 시스템.
KR10-2001-7016919A 1999-07-02 2000-06-30 음성부호화 시스템의 양방향 피치 강화 시스템 KR100468960B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US14209299P 1999-07-02 1999-07-02
US60/142,092 1999-07-02
US36544499P 1999-08-02 1999-08-02
US60/365,444 1999-08-02

Publications (2)

Publication Number Publication Date
KR20020013941A KR20020013941A (ko) 2002-02-21
KR100468960B1 true KR100468960B1 (ko) 2005-01-29

Family

ID=49516346

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-7016919A KR100468960B1 (ko) 1999-07-02 2000-06-30 음성부호화 시스템의 양방향 피치 강화 시스템

Country Status (1)

Country Link
KR (1) KR100468960B1 (ko)

Also Published As

Publication number Publication date
KR20020013941A (ko) 2002-02-21

Similar Documents

Publication Publication Date Title
JP2011048387A (ja) 音声コーディングシステムにおける双方向ピッチエンハンスメント
US8000967B2 (en) Low-complexity code excited linear prediction encoding
EP0890943B1 (en) Voice coding and decoding system
CN102834862B (zh) 用于包括通用音频和语音帧的音频信号的编码器
JP2940005B2 (ja) 音声符号化装置
CN102834863B (zh) 用于包括通用音频和语音帧的音频信号的解码器
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
CN103187066A (zh) 处理音频帧以在不同编解码器之间转变的方法和装置
US6996522B2 (en) Celp-Based speech coding for fine grain scalability by altering sub-frame pitch-pulse
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
JP3064947B2 (ja) 音声・楽音符号化及び復号化装置
US5828811A (en) Speech signal coding system wherein non-periodic component feedback to periodic excitation signal source is adaptively reduced
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP2003280694A (ja) 階層ロスレス符号化復号方法、階層ロスレス符号化方法、階層ロスレス復号方法及びその装置並びにプログラム
KR100468960B1 (ko) 음성부호화 시스템의 양방향 피치 강화 시스템
JP3179291B2 (ja) 音声符号化装置
JP3451998B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP3303580B2 (ja) 音声符号化装置
EP1859441B1 (en) Low-complexity code excited linear prediction encoding
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3308783B2 (ja) 音声復号化装置
US8948403B2 (en) Method of processing signal, encoding apparatus thereof, decoding apparatus thereof, and signal processing system
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E801 Decision on dismissal of amendment
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE AMENDMENT REQUESTED 20040828

Effective date: 20041228

S901 Examination by remand of revocation
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130107

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140103

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20150116

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20151229

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20161228

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20171228

Year of fee payment: 14

LAPS Lapse due to unpaid annual fee