KR100272477B1 - 코드여진선형 예측부호화기 및 복호기 - Google Patents

코드여진선형 예측부호화기 및 복호기 Download PDF

Info

Publication number
KR100272477B1
KR100272477B1 KR1019950035415A KR19950035415A KR100272477B1 KR 100272477 B1 KR100272477 B1 KR 100272477B1 KR 1019950035415 A KR1019950035415 A KR 1019950035415A KR 19950035415 A KR19950035415 A KR 19950035415A KR 100272477 B1 KR100272477 B1 KR 100272477B1
Authority
KR
South Korea
Prior art keywords
signal
excitation
excitation signal
adaptive
code
Prior art date
Application number
KR1019950035415A
Other languages
English (en)
Other versions
KR960019069A (ko
Inventor
히로미 아오야기
요시히로 아리야마
겐이찌로 호소다
Original Assignee
사와무라 시코
오끼 덴끼 고오교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 사와무라 시코, 오끼 덴끼 고오교 가부시키가이샤 filed Critical 사와무라 시코
Publication of KR960019069A publication Critical patent/KR960019069A/ko
Application granted granted Critical
Publication of KR100272477B1 publication Critical patent/KR100272477B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

[목적]
데이터선이나 클럭신호선 등이 공유되어 있는 어느 하나의 메모리 모듈을 액세스하여도, 충분한 셋업 타임이나 홀드타임을 확보할 수 있는 고속동작 가능한 반도체 기억장치를 실현한다.
[구성]
각 반도체 메모리 모듈 (21,‥‥, 2n) 에 대응한 액세스 타이밍정보(3Aa)를 미리 격납해 두고, 이 타이밍정보에 의거하여, 액세스 대상의 반도체 메모리 모듈에 따라서, 전송측으로부터의 데이터 취입 타이밍을 가변시키거나, 또는 클럭폭을 변화시킨다.

Description

코드여진선형 예측부호화기 및 복호기
제1도는 코드여진선형 예측부호화기의 실시예 1을 나타낸 블럭도.
제2도는 코드여진선형 예측복호기의 실시예 1을 나타낸 블럭도.
제3도는 코드여진선형 부호화기의 실시예 2를 나타낸 블럭도.
제4도는 코드여진선형 예측복호기의 실시예 2를 나타낸 블럭도.
제5도는 코드여진선형 예측부호화기의 실시예 3을 나타낸 블럭도.
제6도는 간인·보간 조작부(132)의 동작 설명도.
제7도는 간인·보간 조작부(132)의 또 다른 동작 설명도.
제8도는 코드여진선형 예측복호기의 실시예 3을 나타낸 불럭도임.
제9도는 코드여진선형 예측복호기의 실시예 4 를 나타낸 블럭도임.
* 도면의 주요부분에 대한 부호의 설명
101 : 성도 (聲叢) 분석부 102 : 성도예측계수 양자화부
103, 213 : 합성필터 104 : 프레임 파워 양자화부
105, 204 : 적응부호장 106, 205 : 잡음부호장
172, 206 : 펄스부호장 108, 207 : 이득 부호장
109,209 : 벡터 변환부 110,111,210,211 : 승산기
112, 212, 241 : 가산기 113, 208 : 고정 여진벡터 선택스위치
114 : 가중거리 계산부 115 : 부호장 검색부
116, 201 : 메모리 인터페이스 120, 220 : 인덱스 변환부
130, 230 : 버퍼 메모리 131, 231 : 주기성 분석부
132, 232 : 간인·보간 조작부 202 : 성도예측계수 역양자화부
203 : 프레임 파워 역양자화부 214 : 포스트 필터
240 : 잡음 발생부
본 발명은, 코드여진선형 예측 (CELP) 부호화방식에 따르는 부호화기 및 복호기에 관하고, 예를들면, 소위 부재시 녹음 기능을 갖춘 전화기에 적용할 수 있는 것이다.
부재시 녹음 기능을 갖춘 전화기에 있어서, 종래, 발신자 및 수신자의 메세지를 기록하는 기록매체로서는 카세트 테이프가 맡이 쓰여졌다.
그렇지만, 기록매체로서 카세트 테이프를 적용하고 있으면, 메세지의 기록 재생 구성에 많은 공간이 점유된다는 과제가 있고, 또, 복수의 메세지가 있었던 경우에, 듣고싶은 메세지의 시작부분 찾기에 시간이 걸리거나, 메세지 단위의 삭제가 곤란함 등의 문제가 있다.
기록 재생 구성에 많은 공간이 점유된다는 과제가 있고, 또, 복수의 메세지가 있었던 경우에 있어서, 듣고싶은 메세지의 시작부분 찾기에 시간이 걸리거나, 메세지 단위의 삭제가 곤란함 등의 문제가 있다.
이 때문에, 메세지의 기록매체로서, 반도체 메모리(IC 메모리)를 적용하는 것도 이미 제안되어 있다. 이와 같이, IC 메모리를 메세지 기록매체로서 이용하는 경우에 있어서, 가능한한 간단한 구성으로 많은 메세지의 기록을 가능하게 하려면, 음성신호를 압축하여 기록하고, 재생시에 신장하는 압축 부호화방식을 적응하는 것이 바람직하다.
주지하는 바와 같이, 음성신호에 대한 고능률 압축 부호화방식으로서, 코드여진선형 예측부호화방식이 존재한다. 코드여진선형 예측부호화방식은, 음성신호의 협의의 전송을 위해 생각된 것으로, 적은 전송량으로 복호측으로부터 입력 음성신호에 가능한한 충실한 음성신호를 재생할 수 있도록 한 것이다.
그렇지만, 부재시 녹음 기능을 갖춘 전화기에 있어서, 메세지의 기록재생용의 압축 부호화방식으로서, 기존의 코드여진선형 예측부호화방식을 적용한 경우에 있어서는, 부재시 녹음 기능에 관련한 각종 요구를 만족할 수 없는 일도 발생한다.
이 때문에, 코드여진선형 예측부호화방식이 지금까지 적용되고 있지않은 부재시 녹음 기능을 갖춘 전화기 등의 장치에 대하여, 적용하는데에 적합한 코드여진선형 예측부호화기 및 복호기가 요구되고 있다.
이와 관련된 과제를 해결하기 위해, 본 발명의 제 1 태양에 있어서는, 코드여진선형 예측부호화기를 아래의 각 수단으로 구성하였다.
즉, ① 원음성신호 또는 국부 재생의 합성 음성신호에 의거하여, LPC계수를 얻고, 이를 LSP 계수로 변환하여 양자화함과 동시에, 이 양자화된 LSP 계수를 역 양자화하여 LPC 재수로 되돌리는 성도(聲道)정보 작성 수단과, ② 원음성신호의 파워를 계산하여 양자화.역양자화를 행하는 음성파워 양자화부와, ③ 적응적으로 갱신되는 적응여진신호를 출력하는 적응부호장과, ④ 잡음성의 여진신호를 출력하는 잡음부호장과, ⑤ 펄스성의 여진신호를 출력하는 펄스부호장과, ⑥ 잡음부호장 및 펄스부호장으로부터의 여진신호를 선택하는 고정 여진신호 선택수단과, ⑦ 고정 여진신호 선택 수단으로부터 출력된 잡음 여진신호 또는 펄스성 여진신호를, 원음성신호와 유사한 주파수 특성을 갖도록 변환하는 주파수 특성 조작부와, ⑧ 적응부호장으로부터의 적응여진신호, 및 주파수 특성 조작부로부터의 잡음 여진신호 또는 펄스성 여진신호에 대한, 음성파워 양자화부로부터의 역양자화 파워에 의해 정해지는 여진 게인을 출력하는 이득 부호장과, ⑨ 이득 제어된 적응부호장으로부터의 적응여진신호, 및 주파수 특성 조작부로부터의 잡음 여진신호 또는 펄스성 여진신호를 가산하여 최종적인 여진신호를 형성하는 가산기와, ⑩ 성도정보 작성수단으로부터의 LPC 계수 및 가산기로부터의 최종적인 여진신호에 의거하여, 적응부호장, 잡음부호장, 펄스부호장 및 이득 부호장으로부터 출력시키는 최적인 여진신호와, 잡음부호장 및 펄스부호장의 어느쪽의 부호장으로부터의 출력 여진신호를 이용하는지를 결정하는 최적 여진신호 탐색수단과, ⑪ 최적 여진신호가 정해진 경우에, 각종 부호장외 인덱스와, 고정 여진신호 선택 수단에 의한 선택 상태 인덱스와, 음성파워 양자화부의 양자화 파워와, 성도정보작성 수단의 양자화 LSP 계수로부터 부호화 음성신호를 형성하는 부호화 음성신호 형성수단으로 구성하였다.
또, 본 발명의 제 2 태양의 코드여진선형 예측복호기는, 전술한 본 발명의 제 1 태양의 코드여진선형 예측부호화기에 대응하는 것이며, 이하의 각 수단으로 구성하고 있는 것을 특징으로 한다.
즉, ① 부호화 음성신호를 각종 정보로 분리하는 부호화 음성신호 분리수단과, ② 분리된 양자화 LSP 계수를 역 양자화하여 LPC 계수로 되돌리는 성도정보 재생수단과, ③ 분리된 양자화 파워를 역 양자화하는 음성파워 역양자화부와, ④ 분리된 적응여진신호 인덱스에 대응한 적응여진신호를 출력하는 적응부호장과, ⑤ 잡음 여진신호 인덱스가 분리된 경우에 그 인덱스에 대응한 잡음성의 여진신호를 출력하는 잡음부호장과, ⑥ 펄스성 여진신호 인덱스가 분리된 경우에 이 인덱스 대용한 펄스성의 여진신호를 출력하는 펄스부 호장과, ⑦ 분리된 선택 상태 인덱스에 따라서, 잡음부호장 및 펄스부호장으로부터의 여진신호를 선택하는 고정 여진신호 선택 수단과, ⑧ 이 고정 여진신호 선택 수단으로부터 출력된 잡음 여진신호 또는 펄스성 여진신호를, 원음성신호와 유사한 주파수 특성을 갖게 하도륵 변환하는 주파수 특성 조작부와, ⑨ 적응부호장으로부터의 적응여진신호, 및 주파수 특성 조작부로부터의 잡음 여진신호 또는 펄스성 여진신호에 대한, 음성파워 역양자화부로부터의 역양자화 파워 및 분리된 여진 게인에 의해 정해지는 여진 게인을 출력하는 이득 부호장과, ⑩ 이득 제어된 적응부호장으로부터의 적응여진신호, 및 주파수 특성 조작부로부터의 잡음 여진신호 또는 펄스성 여진신호를 가산하여 최종적인 여진신호를 형성하는 가산기와, ⑪ 성도정보 재생수단으로부터의 LPC 계수 및 가산기로부터의 최종적인 여진신호에 의거하여, 재생음성신호를 형성하는 재생음성신호 형성수단을 갖는다.
본 발명의 제 3 태양은, 적어도 적응부호장을 갖는 코드여진선형 예측부호화기에 있어서, 음높이 제어모드가 지시된 경우에, 적응부호장에 대하여 정해진 적응여진신호 인덱스를, 고정의 적응여진신호 인덱스로 변환하여 부호화 음성신호 형성수단으로 보내어 부호화 음성신호에 고정의 적응여진신호 인덱스를 포함시키도록 하는 인덱스 변환부를 갖는 것을 특징으로 한다.
본 발명의 제 4 태양은, 적어도 적응부호장을 갖는 코드여진선형 예측복호기에 있어서, 음높이 제어모드가 지시된 경우에, 부호화 음성신호를 분리하여 얻은 적응부호장에 대하여 정해진 적응여진신호 인덱스를, 고정의 적응여진신호 인텍스로 변환하여 적응부호장으로 보내는 인덱스 변환부를 갖는 것을 특징으로 한다.
본 발명의 제 5 태양은, 입력된 원음성신호를 코드여진선형 예측부호화 방식에 따라서 부호화하는 코드여진선형 예측부호화기에 있어서, 재생 속도 제어모드가 지시된 경우에, 원음성신호를, 지시된 변배율 및 원음성신호가 갖는 주기성에 따라서 간인 또는 보간하여 부호화 처리부로 보내는 재생 속도 제어 수단을 갖는 것을 특징으로 한다.
본 발명의 제 6 태양은, 입력된 부호화 음성신호로부터 여진신호를 형성하는 여진신호 재생수단과, 입력된 부호화 음성신호로부터 성도예측계수를 형성하는 성도정보 재생수단, 여진신호 재생수단으로부터의 여진신호와 성도 정보 재생수단으로부터의 성도예측계수에 의거하여, 재생음성신호를 형성하는 재생음성신호 형성수단을 갖는 코드여진선형 예측복호기에 있어서, 재생 속도 제어모드가 지시된 경우에, 여진신호 재생수단으로부터의 여진신호를, 지시된 변배율 및 여진신호가 갖는 주기성에 따라서 간인 또는 보간하여 재생음성신호 형성수단으로 보내는 재생 속도 제어 수단을 갖는 것을 특징으로 한다.
본 발명의 계 7 태양은, 입력된 부호화 음성신호로부터 여진신호를 형성하는 여진신호 재생수단과, 입력된 부호화 음성신호로부터 성도예측계수를 형성하는 성도정보 재생수단, 여진신호 재생수단으로부터의 여진신호와 성도 정보 재생수단으로부터의 성도예측계수에 의거하여, 재생음성신호를 형성하는 재생음성신호 형성수단을 갖는 코드여진선형 예측복호기에 있어서, 재생음성 신호 형성수단의 후단에, 재생음성신호에 백색잡음을 가하는 백색잡음 인가수단을 설치한 것을 특징으로 한다.
본 발명의 제 1 태양의 코드여진선형 예측부호화기, 및 본 발명의 제 2 태양의 코드여진선형 예측복호기는, 저부호화 속도를 실현하는 것을 의도한 것으로, 대칭적인 구성을 갖는다. 따라서, 하나로 정리하여 작용을 설명한다.
부호화 음성신호에 포함되는 성도예측계수로서 LSP 계수를 이용하기로 하였다. 그 이유는, 성도의 주파수 특성에 대한 보간 특성이 좋아질 것, LSP 계수는 적은 부호화 비트수로 부호화하여도 LPC 계수 등 보다 성도 스펙트럼에 주는 변형이 작을 것, 벡터 양자화법과의 조합에 의해 효율이 좋은 부호화를 할 수 있는 것에 의한다.
또, 부호장으로서, 일반적인 적응부호장 및 잡음부호장에 가하여, 펄스부호장 및 이득 부호장을 설치하고, 잡음부호장 및 펄스부호장은 선택적으로 이용하는 것으로 하고, 선택된 잡음 여진신호 또는 펄스성 여진신호에 대해서는, 원음성신호와 유사한 주파수 특성을 갖게 하도록 조작하는 것으로 하였다.
잡음부호장 및 펄스부호장은 선택적으로 이용하기로 한 것은, 주기성이 강한 유성음의 시작이나, 펄스성이 명확한 유성음의 정상(定常) 부분에 기여하기 위해, 펄스성 여진신호를 이용하였다고 해도, 저부호화 속도로 응할 수 있도록 하기 위해서 이다. 즉, 할당되어 있는 비트수가 적은 상황에서도, 양호한 여진신호를 형성시키려고 했기 때문이다. 주파수 특성을 조작하도록 한 것은, 여진신호의 주파수 특성은 이론적으로 백색으로서 모델화 되었지만, 실제로는 백색적인 것이 아니라, 원음성신호의 주파수 특성에 가까운 특성을 갖고, 잡음 여진신호나 펄스성 여진신호의 주파수 특성을, 원음성신호의 주파수 특성에 가깝게 하면, 그만큼 고품질인 재생음성신호를 얻을 수 있고, 또, 여진신호가 유효한 주파수 성분은 양자화 오차신호 보다 상당히 커져 양자화 오차신호의 마스킹 효과를 얻을 수 있기 때문이다. 이득 제어를 행하도록 한 것은, 부호화 비트수의 계약이 큰 상황에 있어서는 여진신호의 길이를 크게는 할 수 없지만, 이와 같은 상황에서 음성파워에 응한 이득 제어를 도입하는 것으로 고품질을 달성하려 했기 때문이다.
이상과 같은 이유에 의해, 본 발명의 제 1 태양의 코드여진선형 예측부호화기, 및 본 발명의 제 2 태양의 코드여진선형 예측복호기에 있어서는, 저부호화 속도의 부호화 음성신호로 고품질의 재생음성신호를 얻을 수 있게 된다.
본 발명의 제 3 태양의 코드여진선형 예측부호화기, 및 본 발명의 제 4 태양의 코드여진선형 예측복호기는, 모두, 재생음성신호에 있어서의 음높이를 가변할 수 있도록 한 것이며, 전자는, 복호기측을 변경하는 일 없이 부호화기측의 처리로 재생음성신호에 있어서의 음높이를 가변하는 것이고, 후자는, 부호화기측으로 변경하는 일 없이 복호기측의 처리로 재생음성신호에 있어서의 음높이를 가변하는 것이다.
적응부호장으로부터의 적응여진신호의 인덱스는, 개략적으로 말하면, 음성신호의 주파수에 가장 영향을 받고 있는 것이며, 인덱스를 고정하면, 재생음성신호의 주파수(음높이)를 대충 고정할 수 있다. 이 때문에, 다른 각부에 영량을 주지않을 것을 고려하여, 본 발명의 제 3 태양의 코드여진선형 예측부호화기에 있어서는, 부호화 음성신호의 형성수단의 전에, 또, 본 발명의 제 4 태양의 코드여진선형 예측복호기에 있어서는, 부호화 음성신호로부터 분리된 인덱스를 적응부호장으로 보내는 경로에, 적응부호장에 대하여 정해진 적응여진신호 인덱스를, 고정의 적응여진신호 인덱스로 변환하는 인덱스 변환부를 설치하고 있다.
본 발명의 제 5 태양의 코드여진선형 예측부호화기, 및 본 발명의 제 6 태양의 코드여진선형 예측복호기는, 모두, 재생음성신호에 있어서의 속도를 원음성신호가 갖는 속도으로부터 가변할 수 있도록 한 것이며, 전자는, 복호기측을 변경하는 일 없이 부호화기측의 처리로 재생음성신호에 있어서의 속도를 가변하는 것이고, 후자는, 부호화기측을 변경하는 일 없이 복호기측의 처리로 재생음성신호에 있어서의 속도를 가변하는 것이다.
재생 속도를 가변하는데는, 샘플을 간인하든지 보간하면 좋다. 단순히, 간인 또는 보간하면 불연속점이 발생하기 쉽다. 그래서, 신호의 주기성을 고려하여, 이 주기를 단위로 하여 간인 또는 보간을 행하면 좋다.
여기으로부터, 속도 변환이 다른 구성에 가능한한 영향을 주지않는 것이 바람직하고, 재생음성신호에 있어서의 품질의 저하도 최소한으로 억제하여야 한다. 그리고, 본 발명의 제 5 태양의 코드여진선형 예측부호화기에 있어서는, 원음성신호의 입력단에, 또, 본 발명의 제 6 태양의 코드여진선형 예측복호기에 있어서는, 여진신호를 재생음성신호 형성수단으로 보내는 경로에, 처리 대상 신호를, 지시된 변배율 및 처리 대상 신호가 갖는 주기성에 따라서 간인 또는 보간하는 재생 속도 제어 수단을 설치하고 있다.
본 발명의 제 7 태양의 코드여진선형 예측복호기는, 저부호화 속도로 됨에 따라서, 재생음성신호에 있어서의 잡음 성분이 핑크화 하기 쉬운 것을 고려하여 이루어진 것이다 (또한, 백색잡음이 변조되어 백색잡음과 다른 귀에 거슬리는 음색으로 변화하는 것을 이 명세서에서는 핑크화라고 부르고, 귀에 거슬리는 잡음을 이후 핑크 잡음이라 한다). 핑크잡음에 백색잡음을 가하면 핑크 잡음은 눈에 띄지 않게 되고, 자연스런 음성신호에 가까워진다.
그래서, 본 발명의 제 7 태양의 코드여진선형 예측복호기는, 재생음성신호 형성수단의 후단에, 재생음성신호에 백색잡음을 가하는 백색잡음 인가수단을 설치하고 있다.
[실시예]
(A) 코드여진선형 예측부호화기의 실시예 1
제1도는, 본 발명에 의한 코드여진선형 예측부호화기의 실시예 1을 나타낸 것이며, 부호화 음성신호를, 예를들면 부재시 녹음 기능 부착 전화기의 IC 메모리에 기억할 수 있도륵 한 것이다.
이 코드여진선형 예측부호화기의 실시예 1 및 후술하는 코드여진선형 예측복호기의 실시예 1은, IC 메모리에 다수의 메세지를 격납할 수 있도록, 저부호화 속도(예를들면 4kbit/s)를 의식한 것이다.
제1도에 있어서, 입력단자(100)보다 프레임 단위로 정리되어 벡터로서 입력되는 원음성 벡터(원음성신호 : S)는, 프레임 파워 양자화부(104)에 입력된다. 프레임 파워 양자화부(104)는, 원음성 벡터(S)의 파워를 계산하여 양자화하고, 이 인덱스(Io)를 메모리 인덱스(116)에 출력함과 동시에, 역양자화치(P)를 계산하여 이득 부호장(108)에 출력한다.
또, 원음성 벡터(S)는 성도 분석부(101)에 입력되고, 성도예측계수(LPC 계수 : a) 가 계산되고, 성도예측계수 양자화부(102)로 송출된다. 성도예측계수 양자화부(102)는, LPC 계수(a)를 LSP(Line Spectrum Pair) 계수로 변환하여 양자화하고, 이 인덱스(Ic)를 메모리 인터페이스(116)로 출력한다. 또한, 성도예측계수 양자화부(102)는, 인덱스(Ic)에서 LSP 계수의 역양자화치를 계산하고, LPC 계수(aq)로 변환하여 합성 필터(103) 및 벡터 변환부(109)에 출력한다.
여기에서, 기록부호(부호화 음성신호)에 포함되는 성도예측계수로서 LSP 계수를 이용하도록 한 것은, 성도의 주파수 특성에 대한 보간 특성이 좋아질 것, LSP 계수는 적은 부호화 비트수로 부호화하여도 LPC 계수 등 보다 성도 스펙트럼에 주는 변형이 작을 것, 벡터 양자화법과의 조합에 의해 효율이 좋은 부호화를 할 수 있는 것에 의한다.
합성필터(103)는, 국부 재생의 LPC 계수(aq)와, 가산기(112)로부터 출력된 여진벡터(여진신호 : e)로부터 합성 음성 벡터(국부 재생의 합성 음성신호 : Sw) 를 계산하여 무게 부착 거리계산부(114)에 출력한다.
이 국부 재생의 합성 음성 벡터(Sw)가 원음성 벡터(S)에 가장 가까워지는 최적인 여진벡터(e)를 탐색하고, 이 때의 각종 부호장(105)∼(108)의 인덱스 등이 기록부호에 포함된다.
또한, 예를들면, 성도예측계수나 프레임 파워는, 프레임별로 구해지는데 대하여, 후술하는 최적인 여진신호(e)의 탐색은, 1프레임을 복수로 분할한 서브 프레임 단위로 실행된다.
이 실시예의 경우, 부호장으로서, 적응부호장(105), 잡음부호장(106), 펄스부호장(107) 및 이득 부호장(108)이 설치되어 있다.
적응부호장(105), 잡음부호장(106) 및 펄스부호장(107)은 각각, 여진신호에 관련된 파형 코드 벡터(여진신호인 적응여진벡터, 잡음 여진벡터, 펄스성 여진벡터)을 격납하는 것이며, 이득 부호장(108)은 적응여진벡터 및 고정 여진벡터 (잡음 여진벡터 및 펄스성 여진벡터를 정리하여 이와 같이 부른다)에 관한 이득 코드 (이득 게인)을 격납하는 것이다.
적응여진벡터 및 잡음 여진벡터는 각각, 종래와 같이, 통계적으로 주기성이 강한 유성음에 기여하는 파형 여진벡터, 통계적으로 주기성이 약한 랜덤적인 무성음에 기여하는 파형 여진벡터이다. 또한, 적응부호장(105)의 적응여진 벡틀은 후술하는 바와 같이 적응적으로 갱신된다. 펄스성 여진벡터는, 고립 인펄스로 이루어진 파형 여진벡터이다. 펄스성 여진벡터는, 주기성이 강한 유성음의 시작이나, 펄스성이 명확한 유성음의 정상부분에 기여하는 것을 고려한 것이다. 이득 코드는, 예를들면 벡터 양자화되어 있고, 코드의 한 성분이 적응여진벡터의 이득에 관하고, 타성분이 고정 여진벡터의 이득에 관한 것(2차원 양자화 테이블)으로 되어 있다.
또한, 펄스성의 음원 신호는, 주기성을 갖는 단순한 신호이므로 펄스 신호 발생부가 발생하는 것도 생각할 수 있는데, 이 실시예와 같이 코드화하여 부호장(107)으로부터 독출하는 것으로 발생하는 것이 아래의 이유에 의해 바람직하다. 즉, 적응부호장(105)으로부터의 출력과 동기시키기 쉽고, 또, 잡음부호장(106)과 동일한 북(book) 구성으로 하는 것으로 후술하는 바와 같이 잡음 여진벡터 또는 펄스성 여진벡터를 선택하여 기록부호에 정리할 때의 다중화처리 등이 용이해지기 때문이다.
이와 같은 각종 여진벡터를 이용하여 국부재생한 합성음성 벡터(S) w가 원음성 벡터(S)에 가장 유사한, 각종 벡터에 대한 최적 여진벡터를 구하여 그 인덱스를 메모리 인터페이스(116)로 보내고, 기록부호(부호화 음성신호)에 정리시켜 도시하지 않은 IC 메모리에 기록시킨다. 이 실시예는, 저 부호화 속도를 의식한 것이므로, 고정 여진벡터에 대해서는 잡음 여진벡터 또는 펄스성 여진벡터를 선택하여 그 인덱스를 기록하는 것으로 하고 있다.
따라서, 고정 여진벡터로서 어느것을 선택하고 있는가의 선택정보도 기록부호에 포함된다.
이와 같은 최적 여진벡터의 탐색(잡음 여진벡터 또는 펄스성 여진벡터의 선택처리를 포함)이, 여기에서는, 적응여진벡터, 잡음 여진벡터, 펄스성 여진벡터, 이득 코드의 순으로 실행되는 것으로서 설명한다. 또한, 최적인 적응여진벡터, 잡음 여진벡터, 펄스성 여진벡터, 이득 코드를 얻을 수 있다면, 이 탐색 순서 등은 아래에 설명하는 것에 한정되지 않는다.
최적인 적응여진벡터의 탐색시에 있어서는, 잡음부호장(106) 및 펄스성 부호장(107)으로부터의 출력을 0 으로 하고, 또, 승산기(110)가 적절한 값의 이득계수 (bk : 예를들면 1)을 승산하도록 되어 있다. 이와 같은 상태에 있어서, 적응부호장(105)에 격납되어 있는 모든 적응여진벡터(eai)를 시간순서로 또는 병렬적으로 출력시켜, 승산기(110) 및 가산기(112)를 통하여 할성필터(103)에 여진벡터로 하여 보낸다. 합성필터(103)는, LPC 계수(aq)를 탑계수로서 이 여진벡터(e : eai) 대하여 컨벌루션되는 처리를 행하고, 음원 파라미터로서 적응합성필터(eai)의 내용만이 반영된 합성 음성 벡터 (여기에서는 (Swi)로 나타낸다)를, 모든 적응여진벡터(eai : i=1∼n)에 대하여 구한다.
가중거리계산부(114)는, 원음성 벡터(S)와 각 후보의 합성 음성 벡터(SWi) 와의 감산을 행하고, 더욱 주파수적인 무게를 부가한 후, 각 후보의 벡터의 각각에 대하여 각 성분의 2승의 합 (ew : ewi)를 계산하여 부호장 검색부(115)에 출력한다. 부호장 검색부(115)는, n개의 2승의 합(ewi) 중의 최소치에 대응하는 최소의 적응여진벡터(ea)를 최적인 것으로 결정한다.
다음에, 최적인 잡음 여진벡터의 탐색이 실행된다. 이 탐색시에 있어서는, 고정 여진벡터 선택스위치(113)가 잡음부호장(106) 측으로 전환되어, 적응부호장(105)의 출력을 0으로 하고 (최적 적응여진벡터를 출력하여도 좋다), 또, 승산기(111)가 적절한 값의 이득계수(gk : 예를들면 1)을 승산하도록 되어 있다. 이와 같은 상태에 있어서, 잡음부호장(106)에 격납되어 있는 모든 잡음 여진벡터 (esj : j=1∼m)을 시간순서로 또는 병렬적으로 출력시켜, 고정 여진벡터 선택스위치(113)를 통하여 벡터 변환부(주파수 특성 조작부 : 109)에 입력시킨다.
벡터 변환부(109)는, LPC 계수(aq) 및 최적 적응여진벡터 인덱스(Ia)에 의거하여, 입력된 각 잡음 여진벡터(esj)의 주파수 특성을 잡음 여진벡터의 시간적인 길이에 대응하여 원음성 벡터(S)의 주파수 특성에 가깝도록 변환 조작한다. 이와 같이 주파수 특성이 변환 조작된 모든 잡음 여진 벡터(ev : evj)가 승산기(111) 및 가산기(112)를 통하여 여진벡터 (e : ej)로서 합성필터(103)로 보낸다.
이 이후는, 최적인 적음여진벡터의 탐색과 마찬가지로 처리되고, 부호장 검색부(115)가 최적인 잡음 여진벡터(es)를 결정한다.
여기에서, 벡터 변환부(109)를 설치하도록 한 것은 아래의 이유에 의한다. 종래, 여진벡터의 주파수 특성은 이론적으로 백색으로서 모델화되어 왔지만, 실제로는 백색적인 것이 아니라, 원음성 벡터(S)의 주파수 특성에 가까운 특성을 갖고 있는 것이 실험적으로 확인되어 있다. 따라서, 잡음 여진벡터이나 펄스성 여진벡터의 주파수 특성을, 원음성 백터(S)의 주파수 특성에 가까워지면, 그만큼 고품질인 합성 음성 벡터를 얻을 수 있고, 또, 여진벡터가 유효한 주파수 성분은 양자화 오차신호 보다 상당히 커져 양자화 오차신호의 마스킹 효과를 얻을 수 있다. 그래서, 벡터 변환부(109)를 설치하고 있다. 여기에서, 원음성 벡터(S)의 주파수 특성을 나타내는 정보로서는 LPC 계수(ac) 가 있고, 또, 피치 여측 정보를 의미하는 최적인 적응여진벡터의 정보(그것에 대한 이득을 포함한다 : la) 가 있다. 따라서, 벡터 변환부(109)는 이들의 전보에 의거하여, 잡음 여진벡터이나 펄스성 여진벡터의 주파수 특성을 조작한다.
이와 같이 하여 최적인 잡음 여진벡터의 탐색이 종료하면, 다음에는, 최적인 펄스성 여진벡터의 탐색을 행한다. 이 탐색시에 있어서는, 고정여진벡터 선택스위치(113)가 펄스성 부호장(107) 측으로 전환되고, 적응부호장(105) 이 출력을 0 으로 하고 (최적 적응여진벡터를 출력하여도 좋다), 또, 승산기 (111)가 적절한 값의 이득 계수(gk : 예를들면 1)을 승산하도록 되어 있다. 이와 같은 상태에 있어서, 펄스성 부호장(107)에 격납되어 있는 모든 펄스성 여진벡터(epk : k=1~m)을 시간순서로 또는 병렬적으로 출력시킨다. 이후의 처리는, 최적인 잡음 여진벡터의 탐색시와 같으므로 그 설명은 생략한다.
이와 같이 하여 최적인 펄스성 여진벡터(ep)가 결정된 때에는, 부호장검색부(115)는, 최적인 잡음 여진벡터(es)의 2 승의 합(ew)과 최적인 펄스성 여진벡터(ep)의 2 승의 합(ew) 을 비교하여, 2 승의 합(ew)이 작은 쪽을 기록시키는 고정 여진벡터의 정보로 결정한다.
이 후, 최적인 이득 코드의 탐색을 행한다. 이 이득 코드의 탐색시에 있어서는, 적응부호장 (105)으로부터는 최적인 적응여진벡터(ea)가 출력되고, 고정 여진벡터 선택스위치(113)는 선택된 잡음부호 장(106) 또는 펄스성 부호장 (107) 측으로 전환되고, 선택된 고정 부호장(106) 또는 (107)로부터는 최적인 고정 여진벡터(es) 또는 (ep)가 출력된다. 이득 부호장(108)으로부터의 1개의 이득 코드는, 적응여진벡터용의 이득과 고정여진벡터용의 이득으로 이루어지고, 이들에 프레임 파워(P)를 반영시킨 후, 적응여진벡터용의 이득(bk : k=1~t) 는 승산기(110)에 주어지고, 고정 여진벡터용의 이득(gk)은 승산기 (111)로 보낸다. 따라서, 이득 제어된 최적 적응여진벡터와, 주파수 특성 조작과 이득 제어가 된 최적 고정 여진벡터가 가산기(112)에 의해 가산되고, 여진벡터(e)로서 할성필터(103)로 보내진다. 이와 같은 처리는, 이득 부호장(108) 내의 모든 이득 코드에 대하여 시간순서로 또는 병렬적으로 실행된다. 가중합성필터(103) 이후의 탐색시의 처리는, 각종 여진벡터의 탐색시의 처리와 같다.
부호장 탐색부(115)는, 최적 적응여진벡터, 최적 고정 여진벡터, 최적 이득 코드가 얻어지면, 이들의 인덱스(Ia, Is 또는 Ip), 및 (Ig)를 메모리 인터페이스(116)로 보냄과 동시에, 잡음 여진벡터 및 펄스성 여진벡터의 어느쪽을 선택했는지를 나타내는 고정 코드 선택스위치 정보(Iw)도 메모리 인터페이스 (116)로 보낸다.
메모리 인터페이스(116)는, 이들의 여진원에 관련된 정보(Ia, Is 또는 Ip, Ig, 및 Iw)와, 상술한 LPS 계수 양자화 정보(Ic) 및 프레임 파워 정보(Io)를, 외부에 접속되는 IC 메모리의 격납 형식에 따르는 신호(M으로 다중 변환하여 출력단자(117)로부터 출력한다.
또, 부호장 검색부(115)는, 메모리 인터페이스(116)로 보내는 인덱스 및 고정 코드 선택스위치 정보를, 대응하는 부호장(105 및 108과, 106 또는 107)이나 고정 코드 선택스위치(113)로 보낸다. 이 때, 스위치(113) 가 절환되고, 각 부호장으로부터 최적 여진벡터이나 최적 코드가 출력된다. 이에 의해, 금회의 프레임 처리시에 있어서 가장 원음성 벡터(S)에 가까운 합성음성 벡터(5w)를 형성할 수 있는 여진벡터(e : eo)가 가산기(112)로부터 출력되고, 이것이 적응부호장(105)으로 보내진다. 그리고, 적응부호장(105)은 적응합성필터(eai)의 갱신 처리를 행한다.
이상과 같은 부호화 처리가, 프레임 및 서브 프레임별로 반복되어, 부호화 음성신호(M) 이 순차 IC 메모리에 기록된다.
또한, 이와 같은 부호화 처리는, 부재시 녹음 기능 부착 전화기에 대하여, 그 소유자(수신자)가 부재중인 내용의 메세지를 기록시키는 때나, 발신자가 부재시의 사용자로의 전달 메세지를 기록시킬 때에, 전화기의 전체를 제어하는 제어부(CPU)로부터의 지령에 의거하여 실행된다.
따라서, 상기 실시예 1의 코드여진선형 예측부호화기에 의하면, 저부호화 속도에 있어서도 고품질의 재생음성을 얻을 수 있으며, 다수의 메세지를 IC 메모리에 격납할 수 있게 된다.
이하, 저부호화 속도에 있어서도 고품질의 재생음성을 얻을 수 있는 것을 구체적으로 설명한다.
① 저부호화 속도를 기대하는 경우, 음원 파라미터(여진신호)에 할당되는 부호화 비트수가 적으므로, 준비되는 고정 여진벡터도 적어지고, 원음성 벡터 (S)에 포함되어 있는 펄스성 잡음을 명확하게 재생하기 어렵지만, 이 실시예의 경우, 펄스성 여진벡터를 이용하고 있으므로, 이와 같은 경우의 음성의 재생 품질을 높일 수 있다.
또, 펄스성 여진벡터와 잡음 여진벡터를 바꾸어 이용하고 있으므로, 저부호화 속도에 대응할 수 있음과 동시에, 음성의 과도부와 같은 랜덤 신호와 펄스적 신호가 혼재하는 신호에 대한 재생 품질을 높일 수 있다.
② 저부호화 속도를 기한 경우, 음원 파라미터에 대한 부호화 비트수도 적어 지지만, 성도 파라미터에 대한부호화 비트수도 적어진다. 이 실시예의 경우, 적은 부호화 비트수로 부호화하여도 LPC 계수 등으로부터 성도 스펙트럼에 주는 변형이 작은 LSP 계수의 정보를 기록하도륵 하고 있으므로 이 점으로부터 재생 품질을 높일 수 있다.
③ 상술하는 바와 같이, 실제의 여진신호(여진벡터(e) 가 대응)이 입력 음성신호(원음성 벡터(S)가 대응)의 주파수 특성에 가까운 주파수 특성을 갖는 것을 고려하여 벡터 변환부(109)를 설치하고 있으므로, 실제에 알맞는 정도로 재생품질을 높일 수 있음과 동시에, 이 변환에 따라서 양자화 오차신호에 대한 마스킹 효과가 생겨 재생 품질을 높일 수 있다.
(B) 코드여진선형 예측복호기의 실시예 1
다음에, 본 발명에 의한 코드여진선형 예측복호기의 실시예 1 을 도면을 참조하면서 상술한다. 이 실시예는, 제1도에 나타나는 코드여진선형 예측부호화기의 실시예 1에 대응하는 것으로, 제2도의 블럭도에 나타나는 구성을 갖는다.
제2도에 있어서, 실시예 1의 코드여진선형 예측복호기는, 메모리 인터페이스 (201), 성도예측계수 역양자화부(202), 프레임 역양자화부(203), 적응부호장 (204), 잡음부호장(205), 펄스부호장 (206), 이득 부호장 (207), 고정 여진벡터 선택스위치(208), 벡터 변환부(209), 승산기(217, 211), 가산기(212), 합성필터(213) 및 포스트 필터(214)로 구성되어 있다.
IC 메모리로부터 독출되어 입력단자(200)로부터 상기 코드여진선형 예측복호기에 입력된 부호화 은성신호(M)는, 메모리 인터페이스(201)에 입력된다. 메모리 인터폐이스(201)는, 이 부호화 음성신호(M)를, LSP 계수의 양자화 정보(Ic), 프레임 파워(Io), 최적 적응여진벡터(ea)의 인덱스(Ia), 최적 고정 여진벡터(es) 또는 (ep)의 인덱스(Is) 또는 (Ip), 최적 이득 코드의 인덱스 (Ig) 및 고정 여진벡터 선택스위치 정보(Iw)로 분리한다.
그리고, LSP 계수의 양자화 정보(Ic)는 성도예측계수 역양자화부(202)로 보내고, 프레임 파워 정보(Io) 는 프레임 파워 역양자화부(203)로 보내고, 최적 적응여진벡터(ea)의 인덱스(Ia)를 적응부호장(204) 및 벡터 변환부(209)로 보내고, 최적 이득 코드의 인덱스(Ig)를 이득 부호장(207)으로 보내고, 고정 여진벡터 선택스위치 정보(Iw)를 고정 여진벡터 선택스위치(208)로 보낸다. 또, 최적 고정 여진벡터(es) 또는 (ep)의 인덱스(IS) 또는 (Ip)를, 고정 여진벡터 선택스위치 정보(Iw)에 의거하여 정해지는 잡음부호장(205) 또는 펄스부호장(206)으로 보낸다.
성도예측계수 역양자화부(202)는, 주어진 부호화되어 있는 LSP 계수를 복호화 (예를들면 벡터 역양자화)하고, 또한 LPC 계수(aq)로 변환한다.
이와 같이 변환된 LPC 계수(aq)가, 벡터 변환부(209), 합성필터(213) 및 포스트 필터(214)에 성도예측정보로서 보내진다.
프레임 파워 역양자화부(203)는, 프레임 파워 정보(Io)에 의거하여, 프레임 파워 역양자화치(재생된 프레임 파워 : P)를 구하여 이득 부호장(207)으로 보낸다.
이득 부호장(207)은, 주어진 인덱스(Ig)로 정해지는 적응여진벡터용과 고정 여진벡터용의 이득 코드에 프러임 파워(P)를 반영시켜, 각각의 이득 코드 b, g를 적응여진벡터용의 승산기(210), 고정 여진벡터용의 승산기(211)로 보낸다.
적응부호장(204)은, 주어진 인덱스(Ia)로 정해지는 적응여진벡터(ea) 를 출력하고, 이 적응여진벡터(ea)가 승산기(210)를 통하여 히득 제어되어 가산기 (212)로 보낸다.
잡음부호장(205) 또는 펄스부호장(206)은, 주어진 인덱스(Is) 또는 (Ip)에 대응하는 잡음 여진벡터(ea) 또는 펄스성 여진벡터(ep)를 고정 여진 벡터 선택스위치(208)를 통하여 벡터 변환부(209)로 보내고, 벡터 변환부(209)는, LPC 계수(aq), 적응여진벡터(es)의 인덱스(Is)에 의거하여 이 주파수 특성을 조작한다. 이와 같이 주파수 특성이 조작된 고정 여진벡터(ev)가, 이득 제어기(211)로 이득 제어되어 가산기 (212) 로 보낸다. 가산기(212)는, 주어진 적응여진벡터와 고정 여진벡터를 가산하여 이 가산 신호를 여진벡터(e)로서 합성필터(213)로 보낸다. 합성필터(213)는, 이 여진벡터(e)를 LPC 계수(aq) 로 보존하여 합성 음성 벡터(Sw) 를 얻어 포스트 필터(214)에 출력한다. 포스트 필터(214)는, 합성 음성 벡터(Sw)에 대하여 청각 특성에 따른 주파수적인 변환을 하여, 재생음성 벡터(Sp)로서 출력단자(215)로부터 출력시킨다.
가산기(212)로부터 출력된 여진벡터(e)는, 또 적응부호장(204)으로 보낸다. 이 때, 적응부호장(204)은, 이 여진벡터(e)를 이용하여 적응 여진벡터의 갱신을 행한다.
코드여진선형 예측복호기는, 이상과 같은 처리를 부호화 음성신호가 주어질 때마다, 따라서 프레임별로 (여진신호에 대해서는 서브 프레임별로) 행한다.
따라서, 이 실시예 1의 코드여진선형 예측복호기에 의하면, 주어진 LSP 계수를 처리하는 구성을 갖으며, 음원으로서 펄스부호장(206)을 갖고, 입력 음성신호의 주파수 특성에 고정 음원의 주파수 특성에 가깝게 한 벡터 변환부(209)를 가지므로, 이에 의하여, 상술한 실시예 1의 코드여진선형 예측부호화기에 대한 효과가 실효한 것이 된다.
(C) 코드여진선형 예측부호화기의 실시예 2
제3도는, 본 발명에 의한 코드여진선형 예측부호화기의 실시예 2를 나타낸 것으로, 부호화 음성신호를, 예를들면 부재시 녹음 기능 부착 전화기의 IC메모리에 기억할 수 있도록 한 것이다. 또한, 제3도에 있어서, 제1도와 동일, 대응부분에는 동일 부호를 붙여 나타내고 있다.
실시예 2의 코드여진선형 예측부호화기는, 복호기로서, 상술한 실시예 1의 코드여진선형 예측복호기틀 적응하는 것을 전제로 하고 있다.
실시예 2의 코드여진선형 부호화기 및 후술하는 실시예 2 의 코드여진 선형 예측복호기는, 재생음성 벡터의 주기성(음의 높이)를 일정화시키는 것을 의도한 것이다.
실시예 2의 코드여진선형 예측부호화기는, 제3도 및 제1도와 비교로부터 명확한 바와 같이, 실시예 1의 구성에 인덱스 변환부(120)을 추가 한 것이다. 이 인덱스 변환부(120)에는, 음높이 제어 신호(conl)와 최적 적응여진벡터 (ea)의 인덱스(Ia) 가 입력되어 있다. 인덱스 변환부(120)는, 음높이 제어 신호(conl)가 음높이의 비제어 상태를 지시하고 있을 때에, 최적 적응여진벡터 (ea)의 인덱스(Ia)를 그 대로 통과시켜 메모리 인터페이스(116)로 보내고, 음높이 제어신호(conl)가 음높이의 제어상태를 지시할 때에, 최적 적적응여진벡터(ea)의 인덱스(Ia) 에 관계없이 고정의 인덱스(Ia)를 발생시켜 메모리 인터페이스(116)로 보낸다.
여기에서, 적응부호장 (105)의 인덱스(Ia) 는 음성신호의 주기성 (목소리의 높이)의 정보를 나타내는 파라미터이다. 음성신호의 주기는 화자에 따라서 다르고, 또 동일 화자라도 회화의 억양 등으로부터 시간적으로 변화한다. 고정의 인덱스(Iac)를, 부호화 음성신호(M)에 포함하여, 음성신호의 주기를 항상 있는 일정한 값으로 고정함으로써, 실시예 1의 코드여진 선형 예측복호기 (제2도 참조)로 재생한 음성신호는, 목소리의 높이가 변하지 않는 로보트적인 음성이 된다.
부재시 녹음 기능 부착 전화기에 있어서도, 장난 전화 격퇴의 요청이 있다. 이와 같은 요청에 답하는 한 방법으로서, 수신자의 메세지 음성신호를 로보트적인 음성신호로 하는 것은 유효하다. 이 때문에, 이와 같은 동작 모드의 선택 조작자틀 설치해 놓고, 이 선택조작자가 조작된 때에, 전화기의 전체를 제어하는 제어부(CPU)가, 인덱스 변환부(120)에, 음높이의 제어상태를 지시하고 있는 음높이 제어 신호(conl)를 보내고, 최적 적응 여진벡터(ea)의 인덱스(Ia)에 관계없이 고정의 인덱스(Iac)를 부호화 음성신호(M)에 포함하여 격 납시키고, 그 재생시에 음높이가 대략 일정한 음성신호를 출력시키도록 하고 있다.
상기 실시예 2의 코드여진선형 예측부호화기에 따라서도, 실시예 1의 코드여진선형 예측부호화기와 같은 효과를 얻을 수 있고, 또한, 재생시에, 음높이가 대략 일정한 음성신호를 적절하게 형성할 수 있다는 효과도 얻을 수 있다.
(D) 코드여진선형 예측복호기의 실시예 2
제4도는, 본 발명에 의한 코드여진선형 예측복호기의 실시예 2를 나타낸 것이다. 또한, 제4도에 있어서, 제2도와 동일, 대응 부분에는 동일 부호를 붙여 나타낸다. 실시예 2의 코드여진선형 예측복호기는, 부호화기로서, 상술한 제 2도에 나타나는 실시예 1의 코드여진선형 예측부호화기를 적응하는 것을 전제로 하고 있다.
실시예 2의 코드여진선형 예측복호기는, 제4도 및 제2도의 비교로 부터 명확한 바와 같이, 실시예 1의 구성에 인덱스 변환부(220)를 추가한 것이다. 이 인덱스 변환부(220)에는, 음높이 제어 신호(conl)와, 메모리 인터페이스 (201)가 부호화 음성신호(M)로부터 분리한 최적 적응여진벡터(ea)의 인덱스 (Ia)가 입력된다. 인덱스 변환부(220)는, 음높이 제어 신호 (coal)가 음높이의 비 제어 상태를 지시하고 있을 때에, 최적 적응여진벡터(ea)의 인덱스 (Ia)를 그대로 통과시켜 적응부호장(204) 및 벡터 변환부(209)로 보내고, 음높이 제어 신호(conl)가 음높이의 제어상태를 지시하고 있을 때에, 최적 적응여진벡터(ea)의 인덱스(Ia)에 관계없이 고정의 인덱스(Iac)를 발생시켜 적응부호장(204) 및 벡터 변환부(209)로 보낸다.
따라서, 실시예 2의 코드여진선형 예측복호기는, 음높이 제어 신호(conl)가 음높이의 비제어 상태를 지시하고 있을 때에는 분리된 최적 적응여진 벡터 (ea)의 인덱스(ea)를 이용하여 복호를 행하고, 음높이 제어 신호(conl)가 음높이의 제어 상태를 지시하고 있을 때에는 분리된 최적 적응여진벡터(ea)의 인덱스(Ia)를 대신하여 고정 인덱스(Iac)를 이용하여 복호를 행한다.
그 결과, 메세지 음성신호의 기록에는 음높이가 제어되어 있지 않아도, 그 재생시에는, 실시예 2의 코드여진선형 예측부호화기에 대하여 상술한 것과 같은 이유에 의해, 음높이가 대략 일정한 음성신호틀 적절하게 출력시킬 수 있다.
상기 실시예 2의 코드여진선형 예측복호기에 따라서도, 실시예 1의 코드여진선형 예측복호기와 같은 효과를 얻을 수 있고, 또한 음높이가 대략 일정한 음성신호를 적절하게 형성할 수 있다는 효과도 얻을 수 있다.
(E) 코드여진선형 예측부호화기의 실시예 3
제5도는, 본 발명에 의한 코드여진선형 예측부호화기의 실시예 3을 나타낸 것이다. 또한, 제5도에 있어서, 제1도와, 대응 부분에는 동일 부호를 붙여 나타내고 있다.
실시예 3의 코드여진선형 예측 부호화기는, 복호기로서, 상술한 실시예 1의 코드여진선형 예측복호기(제2도)를 적용하는 것을 전제로 하고 있다.
실시예 3의 코드여진선형 예측부호화기 및 후술하는 실시예 3의 코드 여진선형 예측북호기는, 재생음성 벡터의 재생 속도를 임의로 선정할 수 있도록 하는 것을 의도한 것이다.
실시예 3의 코드여진선형 예측부호화기는, 제5도 및 제1도와 비교로부터 명확한 바와 같이, 실시예 1의 구성에, 버퍼 메모리 (130), 주기성 분석부(131) 및 간인·보간 조작부(132) 를 추가한 것이다. 이들 새로운 구성(130)∼(132)는, 원음성 벡터(S)의 입력단에 설치되어 있고, 간인 · 보간 조작부(132)로부터 출력된 음성 벡터(Sm)를 입력 음성 벡터로 하여 실시예 1과 같이 부호화 처리 된다.
여기에서, 버퍼 메모리(130)~간인·보간 저작부(132) 에는, 속도 제어 신호 (con2) 가 주어져 있다. 이 속도 제어 신호 (con2) 가 비제어 상태를 지시하고 있을 때에는, 버퍼 메모리 (130)~간인 ·보간 조작부(132)는 동작하는 일 없이, 원음성 벡터(S)가 그대로 부호화 처리 구성으로 보내진다. 한편, 속도 제어 신호(con2)가 제어 상태를 지시하고 있을 때에는, 버퍼 메모리(130)~간인 ·보간 조작부(132) 는 음성신호의 속도 변경 동작을 행한다.
버퍼 메모리(133)는, 원음성 벡터(S)를 여러 프레임만큼 격납하는 것이다. 주기성 분석부(131)는 , 버파 메모리(130)에 격납되어 있는 원음성 벡터 (Sf)의 주기성을 프레임별로 분석하고, 샘플수로 표현된 주기성 정보(피치 주기 : cc)를 간인 ·보간 조작부(132)로 보낸다. 간인 ·보간 조작부(132)에는, 속도 제어 신호(con2) 가 제어상태를 지시하고 있을 때에는, 변배배율(sf) 도 보내진다. 간인 보간 조작부(132)는, 이 변배배율(sf)로부터 간인 또는 보간하는 샘플수(di)를 계산한다. 간인 ·보간 조작부(132)는, 주기성 정보(co)의 정배수 중에서, 계산된 샘플수(di)에 가장 가까운 수(n × cc)를 구하고, 이 샘플수(n X cc) 만큼 샘플을 주기성 정보(cc)의 주기단위에 샘플수를 간인, 또는, 보간하고, 또한 프레임의 재구성을 행하여, 간인된 또는 보간된 음성 벡터(Sm)를 출력한다.
제6도는, 고속재생의 지시시 (변배배율 sf<1)에 있어서의 간인 ·보간 조작부(132)의 동작(간인 동작)의 설명도이다. 제6도에 나타나는 바와 같이, 1 프레임분(320 샘플)의 원음성 벡터(S)로부터 그 주기성(피치 주기)(cc)를 구한 바, 50 샘플 정도이며, 또, 변배율(sf)에 의해 정해지는 샘플 수 di로부터 몇주기(n 주기)분을 간인하는 가를 구한바, 2 주기 (n=2)라는 결과가 얻었다. 그리고, 이 예의 경우에는, 제6도에 나타나는 바와 같이, 프레임의 선두로부터 2주기분의 샘플을 간인하는 것으로 하였다. 이와 같이 하면, 1 프레임의 샘플수가 소정의 샘플수(320) 보다 적은 것으로 되고, 그리고, 금회의 간인 처리후의 샘플과, 다음의 프레임에 대하여 같이 간인 처리한 샘플로부터 1 프레임의 음성 벡터를 다시 형성하여 부호화 처리 구성으로 보낸다.
제7도는, 저속 재생의 지시시 (변배배율 sf〉1)에 있어서의 간인 ·보간 조작부(132)의 동작 (보간 동작)의 설명도이다. 제7도에 나타나는 바와 같이, 1 프레임분(320 샘플)의 원음성 벡터(5)로부터 주기성(피치 주기 : cc)를 구한바, 80 샘플 정도이며, 또, 변배율(sf)에 의해 정해지는 샘플수(di)로부터, 및주기( n주기) 분을 보간하는 가를 구한바, 2주기(n=2)라는 결과를 얻었다. 그리고, 이 예의 경우에는, 제7도에 나타나는 바와 같이, 프레임의 선두측의 주기(1)의 샘플 및 2번째의 주기(2)의 샘플을 2회씩 반복하여 보간하는 것으로 하였다. 이와 같이 하면, 1 프레임의 샘플수가 소정의 샘플수(320) 보다 많은 것으로 되고, 그리고, 금회의 보간 처리후의 샘플예의 내 320 샘플을 1 프레임의 샘플로서 부호화 처리 구성에 줌과 동시에, 나머지의 샘플과, 다음의 프레임에 대하여 동일하게 보간 처리한 샘플로부터 1 프레임의 음성 벡터를 다시 형성하여 부호화 처리 구성으로 보낸다.
부재시 녹음 기능 부착 전화기에 있어서는, 상술한 바와 같이 장난 전화 격퇴의 요청이 있다. 또, 전화가 많이 걸려 오는 사용자(수신자)의 경우, 발신자로부터의 부재 녹음 메세지도 다수가 되므로, 고속 재생을 원하는 경우가 있다. 이와 같은 요청이나 요구에 답하는 한 방법으로서, 수신자나 발신자의 메세지 음성신호의 재생 속도를 통상 속도로부터 바꾸는 것은 유효하다. 이를 위해, 이와 같은 동작 모드의 선택 조작자를 설치해 놓고, 이 선택 조작자가 조작된 때에, 전화기의 전체를 제어하는 제어부(CPU)가, 버퍼 메모리 (130)~간인·보간 조작부(132)에, 재생 속도의 제어 상태를 지시하고 있는 속도 제어 신호(con2)나 지시된 변배배율(sf)을 부여하고, 부호화 단계(기록 단계)로부터 재생 속도가 통상 속도와 다르도록 부호화 시키도록 하고 있다.
상기 실시예 3의 코드여진선형 예측부호화기에 의해서도, 실시예 1의 코드여진선형 예측부호화기와 같은 효과틀 얻을 수 있고, 또한, 재생시에, 사용자의 지시에 따른 재생 속도를 갖는 음성신호를 적절하게 형성할 수 있다는 효과도 얻을 수 있다.
또한, 주기성을 분석하여, 보간 또는 간인을 행하도륵 하였으므로, 보간 또는 간인을 행하여도 재생음성의 연속성을 유지할 수 있고, 또, 음높이를 유지할 수 있다.
(F) 코드여진선형 앤측복호기의 실시예 3
제8도는, 본 발명에 의한 코드여진선형 예측복호기의 실시예 3을 나타낸 것이다. 또한, 제8도에 있어서, 제2도와 동일, 대응 부분에는 동일 부호를 붙여 나타내고 있다. 실시예 3의 코드여진선형 예측복호기는, 부호화기로서, 상술한 제1도에 나타나는 실시예 1의 코드여진선형 예측부호화기에 적응하는 것을 전제로 하고 있다.
실시예 3의 코드여진선형 예측복호기도, 음성신호의 재생 속도를 입력 음성 자체가 갖는 통상 속도와 다르도록 한 것이지만, 재생 속도의 변경을 부호화기 측에서가 아니라 복호기 측에서의 처리로 행하도록 한 것이다.
실시예 3의 코드여진선형 예측복호기는, 제8도 및 제2도와 비교로 부터 명확하듯이, 실시예 1에 있어서의 가산기(212) 및 합성필터(213) 간에, 버퍼 메모리(230), 주기성 분석부(231) 및 간인·보간 조작부(232)를 추가한 것이고, 또, 합성필터(213) 및 포스트필터(214)가 프레임분의 소정 샘플수 이외의 샘플수에도 대층하도록 되어 있는 것이다. 따라서, 가산기(212) 까지의 처리는, 실시예 1의 코드여진선형 예측복호기와 같다.
여기에서, 버퍼 메모리 (230)~간인·보간 조작부(232)에는, 속도 제어 신호 (con2)가 주어져 있다. 이 속도 제어 신호(con2)가 비제어 상태를 지시하고 있을 때에는, 버퍼 메모리(230)∼간인·보간 조작부(232)는 동작하는 일 없이, 최적 여진벡터(ea)를 그대로 통과시킨다. 한편, 속도 제어 신호(cons)가 제어 상태를 지시하고 있을 때에는, 버퍼 메모리(230)~간인·보간 조작부(232) 는 속도 변경 동작을 행한다.
버퍼 메모리(230)는, 적어도 1 프레임분의 최적 여진벡터(e)를 축적한다. 주기성 분석부(231)는, 버퍼 메모리(230)에 축적된 최적 여진벡터(ef)에 있어서의 주기성의 값(피치주기 ; 샘플수 환산 : cc)를 계산한다.
간인·보간 조작부(232)는, 변속배율(sf)로부터 간인 또는 보간하는 샘플수 (di)를 계산하고, 이 변경분의 샘플수(di)에 가장 가까워지는 주기성의 값의 정수배(cc × n)를 구하고, 주기성의 간(co)의 샘플수 단위에, 최적 여진벡터 (ef)를 간인 또는 보간한다. 실시예 3의 코드여진선형 예측복호기는, 실시예 3의 코드여진선형 예측부호화기에 비교하여, 간인·보간 대상이 음성 벡터의 샘플인지 최적 여진벡터의 샘플인지의 차이가 있지만, 지금까지의 처리는 같다.
그러나, 실시예 3의 코드여진선형 예측복호기에 있어서의 간인 보간 조작부(232)는, 또한, 간인·보간 처리후의 최적 여진벡터(em)의 벡터길이(샘플수 : sl)를 구한다. 그리고, 간인·보간 조작부(232)는, 간인·보간 처리후의 최적 여진벡터(em)을 합성필터(213)에 출력함과 동시에, 벡터길이(sl)를 합성필터 (213) 및 포스트 필터(214)에 출력한다.
합성필터(213) 및 포스트 필터(214)는, 실시예 1의 코드여진선형 예측복호기와 같이 처리하는 것이지만, 입력 벡터의 벡터길이가, 간인·보간 처리에 의해 본래의 벡터길이와 다르므로, 그 벡터길이(sl)의 입력 샘플 계열에 대하여, 성도 분석 계수(aq)를 이용하여 필터링을 행한다.
상기 실시예 3의 코드여진선형 예측복호기에 의해서도, 실시예 1의 코드여진선형 예측복호기와 같은 효과를 얻을 수 있고, 또한, 사용자의 지시에 따른 재생 속도를 갖는 재생음성신호를 적절하게 형성할 수 있다는 효과는 얻을 수 있다.
여기에서, 주기성을 분석하여, 보간 또는 간인을 행하도륵 하였으므로, 보간 또는 간인을 행하여도 재생음성의 연속성을 유지할 수 있고, 또, 음높이를 유지할 수 있다.
또, 간인·보간 조작을 최적 여진벡터의 단계에서 행하도록 하였으므로, 보다 자연스런 재생음성신호를 얻는 것이 가능해진다. 즉, 간인· 보간에 의한 영향이, 합성 필터(213) 및 포스트 필터(214)의 필터링을 통하여 완화되고, 보다 자연스런 재생음성신호를 얻을 수 있다. 그리고, 포스트 필터(214)로부터의 출력 단계에서, 간인·보간을 행하는 것도 생각할 수 있지만, 주기성을 분석하여 보간 또는 간인을 행하여도, 출력 음성신호에 그 영향이 끼치는 정도는 실시예 보다 커진다.
(G) 코드여진선항 예측북호기의 실시예 4
제9도는, 본 발명에 의한 여진선형 예측복호기의 실시예 4를 나타낸 것이다. 또한, 제9도에 있어서, 제2도와 동일, 대응 부분에는 동일 부호를 붙여 나타내고 있다. 실시예 4의 코드여진선형 예측복호기는, 부호화기로서, 상술한 제1도에 나타내는 실시예 1의 코드여진선형 예측부호화기를 적응하는 것을 전제로 하고 있다.
제1도에 나타나는 실시예 1의 코드여진선형 예측부호화기는, 상술한 바와 같이, IC 메모리에 다수의 메세지를 격납할 수 있도록 해야 하고, 저부호화 속도를 갖도륵 부호화하는 것이었다. 부호화 속도가 낮아진 만큼 재생음성신호에 부호화 변형이 들어가는 것을 피할 수 없다. 실험적으로, 이 부호화 변형 때문에, 재생음성신호에 있어서의 잡음 성분이 핑크 잡음화하는 경향이 있는 것을 알았다. 실시예 4의 코드여진선형 예측복호기는, 재생음성신호에 있어서의 잡음 성분이 핑크 잡음화하는 경향에 있다는 부적합함을 해결하려 한 것이다.
실시예 4의 코드여진선형 예측복호기는, 제8도 및 제2도의 비교에서 명확한 바와 같이, 실시예 1의 구성에, 잡음 발생기(140)및 가산기(141)를 추가한 것이다.
잡음 발생부(140) 는, 프레임 파워(P)의 값에 따라서 백색잡음(nz)을 발생한다. 또한, 프레임 파워에 관계없이 일정한 변화를 하는 잡음을 발생하는 것이나, 배경 잡음을 미리 보충하여 격납해 두어 발생하는 것은 다른 실시예를 구성한다. 가산기(141)는, 포스트 필터(214)로부터의 음성 벡터에 이 잡음 (nz)를 가산하고, 이 가산후의 재생음성 벡터(Sp)를 출력단자(215)로부터 외부에 출력시킨다.
여기에서, 포스트 필터(214)로부터의 재생음성 벡터에 있어서의 잡음 성분이 핑크 잡음화하여도, 잡음 발생부(140)로부터의 백색잡음이 더해짐으로써, 가산기(141)로부터의 재생음성 벡터(Sp)의 잡음 성분은 백색잡음화되고, 핑크 잡음 성분이 눈에 띄지 않게 되고, 자연스런 잡음 성분에 가까워 진다.
상기 실시예 4의 코드여진선형 예측복호기에 의해서도, 실시예 1의 코드여진선형 예측복호기와 같은 효과를 얻을 수 있고, 또한, 부호화, 복호하므로써 이 배경 잡음 등이 변조를 받아 귀에 거슬리게 들리도록 변화하여도, 인위적으로 생성한 잡음을 크기를 적당히 정하여 가하므로, 귀에 거슬리는 부분을 마스크할 수 있고, 더 자연스런 재생음성신호를 얻을 수 있다.
(H) 기타 실시예
상기 각 실시예에 있어서는, 성도 분석 계수를 원음성 벡터로부터 얻는 소위 포워드형의 코드여진선형 예측부호화방식에 따르는 것을 나타냈지만, 실시예 1, 실시예 3 및 실시예 4의 특징 구성에 대해서는, 성도 분석계수를 국부 재생의 음성 비터로부터 얻는 소위 파워 워드형의 코드여진선형 예측부 호화방식에 따르는 것에 적용할 수 있다.
상기 각 실시예에 있어서는, 여진신호(여진벡터)의 발생 구성으로서, 적응부호장, 잡음부호장, 펄스부호장 및 이득 부호장을 갖추었는데, 실시예 2 ∼ 실시예 4에 대해서는, 여진신호(여진벡터)의 발생 구성은 이에 한정되지 않고, 적어도 적응부호장 및 잡음부호장을 갖추는 것이면 적용할 수 있다.
상기 각 실시예는, 부재시 녹음 기능 부착 전화기의 메세지의 기록 재생 구성에 적용하는 것을 의식하여 이루어진 것인데, 그 용도는 이에 한정하는 것은 아니며, 협의의 전송계에 적용할 수 있다.
본 발명의 제 1 태양의 코드여진선형 예측부호화기, 또는, 본 발명의 제 2 태양의 코드여진선형 예측복호기에 의하면, 부호화 음성신호에 포함되어 있는 성도예측계수를 LSP 계수로 하고, 잡음부호장 및 펄스성 부호장을 선택하여 이용하고, 그 선택 여진신호에 원음성신호의 주파수를 반영시켜, 적용 여진신호 및 선택 여진신호를 이득 제어하도륵 하였으므로, 저부호화 속도에
있어서도 고품질의 재생음성신호를 얻을 수 있다.
본 발명의 제 3 태양의 코드여진선형 예측부호화기, 또는, 본 발명의 제 4 태양의 코드여진선형 예측복호기에 의하면, 음높이 제어모드가 지시된 경우에, 적응여진신호 인덱스를, 고정의 적응여진신호 인덱스로 변환하는 인덱스 변환부를 설치했으므로, 재생음성신호에 있어서의 음높이를 필요에 따라서 가변할 수 있다.
본 발명의 제 5 태양의 코드여진선형 예측부호화기, 또는, 본 발명의 제 6 태양의 코드여진선형 예측복호기에 의하면, 처리 대상 신호를, 지시된 변배율 및 처리 대상 신호가 갖는 주기성에 따라서 간인 또는 보간하는 재생 속도 제어 수단을 설치했으므로, 필요에 따라서, 재생음성신호에 있어서의 속도를 가변할 수 있다.
본 발명의 제 7 태양의 코드여진선형 예측복호기에 의하면, 재생음성신호 형성수단의 후단에 재생음성신호에 백색잡음을 가하는 백색잡음 인가수단을 설치했으므로, 저부호화 속도에서는 재생음성신호의 잡음 성분이 핑크화하기 쉽지만, 핑크 잡음이 백색잡음에 묻혀 눈에 띄지 않게 되어, 자연스런 재생음성신호를 얻을 수 있다.

Claims (7)

  1. 원음성신호 또는 국부 재생의 합성 음성신호에 의거하여, LPC 계수를 얻고, 그것을 LSP 계수로 변환하여 양자화함과 동시에, 이 양자화된 LSP 계수를 역 양자화하여 LPC 재수로 되돌리는 성도정보 작성수단과, 상기 원음성신호의 파워를 계산하여 양자화.역양자화를 행하는 음성파워 양자화부와, 적응적으로 갱신되는 적응여진신호를 출력하는 적응부호장과, 잡음성의 여진신호를 출력하는 잡음부호장과, 펄스성의 여진신호를 출력하는 펄스부호장과, 상기 잡음부호장 및 펄스부호장으로부터의 여진신호를 선택하는 고정 여진신호 선택수단과, 고정 여진신호 선택 수단으로부터 출력된 잡음 여진신호 또는 펄스성 여진신호를, 원음성신호와 유사한 주파수 특성을 갖도록 변환하는 주파수 특성 조작부와, 상기 적응부호장으로부터의 적응여진신호, 및 상기 주파수 특성 조작부로부터의 잡음 여진신호 또는 펄스성 여진신호에 대한, 상기 음성파워 양자화부로부터의 역양자화 파워에 의해 정해지는 여진 게인을 출력하는 이득 부호장과, 이득 제어된 적응부호장으로부터의 적응여진신호, 및 주파수 특성 조작부로부터의 잡음 여진신호 또는 펄스성 여진신호를 가산하여 최종적인 여진신호를 형성하는 가산기와, 상기 성도정보 작성수단으로부터의 LPC 계수 및 가산기로부터의 최종적인 여진신호에 의거하여, 상기 적응부호장, 상기 잡음부호장, 상기 펄스부호장 및, 상기 이득 부호장으로부터 출력시키는 최적인 신호와, 상기 잡음부호장 및 상기 펄스부호장의 어느쪽의 부호장으로부터의 출력 여진신호를 이용하는지를 결정하는 최적 여진신호 탐색수단과, 최적 여진신호가 정해진 경우에, 각종 부호장외 인덱스와, 상기 고정 여진신호 선택 수단에 의한 선택 상태 인덱스와, 상기 음성파워 양자화부의 양자화 파워와, 상기 정보작성 수단의 양자화 LSP 계수로부터 부호화 음성신호를 형성하는 부호화 음성신호 형성수단을 갖는 것을 특징으로 하는 코드여진선형 예측부호화기.
  2. 부호화 음성신호를 각종 정보로 분리하는 부호화 음성신호 분리수단과, 분리된 양자화 LSP 계수를 역 양자화하여 LPC 계수로 되돌리는 성도정보 재생수단과, 분리된 양자화 파워를 역 양자화하는 음성파워 역양자화부와, 분리된 적응여진신호 인덱스에 대응한 적응여진신호를 출력하는 적응부호장과, 잡음 여진신호 인덱스가 분리된 경우에 그 인덱스에 대응한 잡음성의 여진신호를 출력하는 잡음부호장과, 펄스성 여진신호 인덱스가 분리된 경우에 그 인덱스에 대응한 펄스성의 여진신호를 출력하는 펄스부호장과, 분리된 선택상태 인덱스에 따라서, 상기 잡음부호장 및 상기 펄스부호장으로부터의 여진신호를 선택하는 고정 여진신호 선택수단과, 이 고정 여진신호 선택수단으로부터 출력된 잡음 여진신호 또는 펄스성 여진신호를, 원 음성신호와 유사한 주파수 특성을 갖도록 변환하는 주파수 특성 조작부와, 상기 적응부호장으로부터의 적응여진신호 및, 상기 주파수 특성 조작부로부터의 잡음 여진신호 또는 펄스성 여진신호에 대한, 상기 음성파워 역양자화부로부터외 역양자화 파워 및 분리된 여진게인 인덱스에 의해 정해지는 여진게인을 출력하는 이득 부호장과, 이득 제어된 상기 적응부호장으로부터의 적응여진신호 및, 상기 주파수 특성 조작부로부터의 잡음 여진신호 또는 펄스성 여진신호를 가산하여 최종적인 여진신호를 형성하는 가산기와, 상기 성도정보 재생수단으로부터의 LPC 계수 및 상기 가산기로부터의 최종적인 여진신호에 의거하여, 재생음성신호를 형성하는 재생음성신호 형수단을 갖는 것을 특징으로 하는 제1항에 기재된 코드여진선형 예측부호화기가 형성한 부호화 음성신호가 입력되는 코드여진선형 예측복호기.
  3. 적어도 적응부호장을 갖는 코드여진선형 예측부호화기에 있어서, 음높이 제어모드가 지시된 경우에, 상기 적응부호장에 대하여 정해진 적응여진신호 인덱스를, 고정의 적응여진신호 인덱스로 변환하여 부호화 음성신호 형성수단으로 보내어 부호화 음성신호에 고정의 적응여진신호 인덱스를 포함시키도록 하는 인덱스 변화부를 갖는 것을 특징으로 하는 코드여진선형 여측부호화기.
  4. 적어도 적응부호장을 갖는 코드여진선형 예측복호기에 있어서, 음높이 제어모드가 지시된 경우에, 부호화 음성신호를 분리하여 얻은 상기 적응부호장에 대하여 정해진 적응여진신호 인덱스를, 고정의 적응여진신호 인덱스로 변환하여 상기 적응부호장으로 보내는 인덱스 변환부를 갖는 것을 특징으로 하는 코드여진선형 예측복호기.
  5. 입력된 원음성신호를 코드여진선형 예측부호화방식에 따라서 부호화하는 코드여진선형 예측부호화기에 있어서, 재생 속도 제어모드가 지시된 경우에, 원음성신호를, 지시된 변배율 및 원음성신호가 갖는 주기성에 따라서 간인 또는 보간하여 부호화 처리부로 보내는 재생 속도 제어 수단을 갖는 것을 특징으로 하는 코드여진선형 예측부호화기.
  6. 입력된 부호화 음성신호로부터 여진신호를 형성하는 여진신호 재생수단과, 입력된 부호화 음성신호로부터 성도예측계수를 형성하는 성도정보 재생수단, 상기 여진신호 재생수단으로부터의 여진신호와 상기 성도정보 재생수단으로부터의 성도예측계수에 의거하여, 재생음성신호를 항성하는 재생음성신호 형성수단을 갖는 코드여진선형 예측복호기에 있어서, 재생 속도 제어모드가 지시된 경우에, 상기 여진신호 재생수단으로부터의 여진신호를, 지시된 변배율 및 여진신호가 갖는 주기성에 따라서 간인 또는 보간하여 상기 재생음성신호 형성수단으로 보내는 재생 속도 제어 수단을 갖는 것을 특징으로 하는 코드여진선형 예측복호기.
  7. 입력된 부호화 음성신호로부터 여진신호를 형성하는 여진신호 재생수단과, 입력된 부호화 음성신호로부터 성도예측계수를 형성하는 성도정보 재생수단, 상기 여진신호 재생수단으로부터의 여진신호와 상기 성도정보 재생수단으로부터의 성도예측계수에 의거하여, 재생음성신호를 형성하는 재생음성신호 형성수단을 갖는 코드여진선형 예측복호기에 있어서, 상기 재생음성신호 형성수단의 후단에, 재생음성신호에 백색잡음 가하는 백색잡음 인가수단을 설치한 것을 특징으로 하는 코드여진선형 예측복호기.
KR1019950035415A 1994-11-22 1995-10-13 코드여진선형 예측부호화기 및 복호기 KR100272477B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP28765494A JP3328080B2 (ja) 1994-11-22 1994-11-22 コード励振線形予測復号器
JP94-287654 1994-11-22

Publications (2)

Publication Number Publication Date
KR960019069A KR960019069A (ko) 1996-06-17
KR100272477B1 true KR100272477B1 (ko) 2000-11-15

Family

ID=17720008

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950035415A KR100272477B1 (ko) 1994-11-22 1995-10-13 코드여진선형 예측부호화기 및 복호기

Country Status (6)

Country Link
US (1) US5752223A (ko)
EP (2) EP1160771A1 (ko)
JP (1) JP3328080B2 (ko)
KR (1) KR100272477B1 (ko)
CN (1) CN1055585C (ko)
DE (1) DE69527410T2 (ko)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
SE506379C3 (sv) * 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
JP3092652B2 (ja) * 1996-06-10 2000-09-25 日本電気株式会社 音声再生装置
EP0883107B9 (en) 1996-11-07 2005-01-26 Matsushita Electric Industrial Co., Ltd Sound source vector generator, voice encoder, and voice decoder
JP3206497B2 (ja) * 1997-06-16 2001-09-10 日本電気株式会社 インデックスによる信号生成型適応符号帳
EP1734512B1 (en) 1997-10-22 2015-09-09 Godo Kaisha IP Bridge 1 CELP encoder and a method of CELP encoding
US6092040A (en) * 1997-11-21 2000-07-18 Voran; Stephen Audio signal time offset estimation algorithm and measuring normalizing block algorithms for the perceptually-consistent comparison of speech signals
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
CA2636552C (en) * 1997-12-24 2011-03-01 Mitsubishi Denki Kabushiki Kaisha A method for speech coding, method for speech decoding and their apparatuses
KR100249235B1 (ko) * 1997-12-31 2000-03-15 구자홍 에이치디티브이 비디오 디코더
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6449313B1 (en) * 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6728344B1 (en) * 1999-07-16 2004-04-27 Agere Systems Inc. Efficient compression of VROM messages for telephone answering devices
JP3365360B2 (ja) * 1999-07-28 2003-01-08 日本電気株式会社 音声信号復号方法および音声信号符号化復号方法とその装置
US6452517B1 (en) * 1999-08-03 2002-09-17 Dsp Group Ltd. DSP for two clock cycle codebook search
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US7133823B2 (en) * 2000-09-15 2006-11-07 Mindspeed Technologies, Inc. System for an adaptive excitation pattern for speech coding
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
JP3566220B2 (ja) * 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US6912495B2 (en) * 2001-11-20 2005-06-28 Digital Voice Systems, Inc. Speech model and analysis, synthesis, and quantization methods
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
US20040102975A1 (en) * 2002-11-26 2004-05-27 International Business Machines Corporation Method and apparatus for masking unnatural phenomena in synthetic speech using a simulated environmental effect
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
JP4525694B2 (ja) * 2007-03-27 2010-08-18 パナソニック株式会社 音声符号化装置
JP4525693B2 (ja) * 2007-03-27 2010-08-18 パナソニック株式会社 音声符号化装置および音声復号化装置
US9343079B2 (en) * 2007-06-15 2016-05-17 Alon Konchitsky Receiver intelligibility enhancement system
EP2269188B1 (en) 2008-03-14 2014-06-11 Dolby Laboratories Licensing Corporation Multimode coding of speech-like and non-speech-like signals
EP2313986A1 (en) * 2008-08-13 2011-04-27 Nokia Siemens Networks Oy Method of generating a codebook
JP5299631B2 (ja) * 2009-05-13 2013-09-25 日本電気株式会社 音声復号装置およびその音声処理方法
JP5287502B2 (ja) * 2009-05-26 2013-09-11 日本電気株式会社 音声復号装置及び方法
CN101834586A (zh) * 2010-04-21 2010-09-15 四川和芯微电子股份有限公司 随机信号产生电路及方法
DK2774145T3 (da) * 2011-11-03 2020-07-20 Voiceage Evs Llc Forbedring af ikke-taleindhold til celp-afkoder med lav hastighed
EP3011561B1 (en) 2013-06-21 2017-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improved signal fade out in different domains during error concealment
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
CN105007094B (zh) * 2015-07-16 2017-05-31 北京中宸泓昌科技有限公司 一种指数对扩频编码解码方法
EP3704863B1 (en) * 2017-11-02 2022-01-26 Bose Corporation Low latency audio distribution

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5650398A (en) * 1979-10-01 1981-05-07 Hitachi Ltd Sound synthesizer
US4624012A (en) * 1982-05-06 1986-11-18 Texas Instruments Incorporated Method and apparatus for converting voice characteristics of synthesized speech
FR2530101A1 (fr) * 1982-07-06 1984-01-13 Thomson Brandt Procede et systeme de transmission cryptee d'un signal, notamment audio-frequence
US4709390A (en) * 1984-05-04 1987-11-24 American Telephone And Telegraph Company, At&T Bell Laboratories Speech message code modifying arrangement
JP2884163B2 (ja) * 1987-02-20 1999-04-19 富士通株式会社 符号化伝送装置
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
EP0287741B1 (en) * 1987-04-22 1993-03-31 International Business Machines Corporation Process for varying speech speed and device for implementing said process
DE68922134T2 (de) * 1988-05-20 1995-11-30 Nec Corp Überträgungssystem für codierte Sprache mit Codebüchern zur Synthetisierung von Komponenten mit niedriger Amplitude.
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
EP0427953B1 (en) * 1989-10-06 1996-01-17 Matsushita Electric Industrial Co., Ltd. Apparatus and method for speech rate modification
AU644119B2 (en) * 1989-10-17 1993-12-02 Motorola, Inc. Lpc based speech synthesis with adaptive pitch prefilter
JPH0451199A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化・復号化方式
US5138661A (en) * 1990-11-13 1992-08-11 General Electric Company Linear predictive codeword excited speech synthesizer
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
US5195137A (en) * 1991-01-28 1993-03-16 At&T Bell Laboratories Method of and apparatus for generating auxiliary information for expediting sparse codebook search
JP2776050B2 (ja) * 1991-02-26 1998-07-16 日本電気株式会社 音声符号化方式
JP2661391B2 (ja) * 1991-03-01 1997-10-08 ヤマハ株式会社 楽音信号処理装置
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
EP0527527B1 (en) * 1991-08-09 1999-01-20 Koninklijke Philips Electronics N.V. Method and apparatus for manipulating pitch and duration of a physical audio signal
US5305420A (en) * 1991-09-25 1994-04-19 Nippon Hoso Kyokai Method and apparatus for hearing assistance with speech speed control function
WO1993018505A1 (en) * 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
SG43128A1 (en) * 1993-06-10 1997-10-17 Oki Electric Ind Co Ltd Code excitation linear predictive (celp) encoder and decoder

Also Published As

Publication number Publication date
DE69527410D1 (de) 2002-08-22
CN1132423A (zh) 1996-10-02
CN1055585C (zh) 2000-08-16
KR960019069A (ko) 1996-06-17
JPH08146998A (ja) 1996-06-07
JP3328080B2 (ja) 2002-09-24
EP1160771A1 (en) 2001-12-05
EP0714089B1 (en) 2002-07-17
DE69527410T2 (de) 2003-08-21
EP0714089A3 (en) 1998-07-15
EP0714089A2 (en) 1996-05-29
US5752223A (en) 1998-05-12

Similar Documents

Publication Publication Date Title
KR100272477B1 (ko) 코드여진선형 예측부호화기 및 복호기
US5717823A (en) Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US8068926B2 (en) Method for generating concealment frames in communication system
KR100427753B1 (ko) 음성신호재생방법및장치,음성복호화방법및장치,음성합성방법및장치와휴대용무선단말장치
US4821324A (en) Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
KR100873836B1 (ko) Celp 트랜스코딩
KR100882771B1 (ko) 부호화 음향 신호를 지각적으로 개선 강화시키는 방법 및장치
US5623575A (en) Excitation synchronous time encoding vocoder and method
JP2707564B2 (ja) 音声符号化方式
KR20090129450A (ko) 고정된 배경 잡음의 평활화를 위한 방법 및 장치
JP4420562B2 (ja) 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法
KR20170003596A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
JP3303580B2 (ja) 音声符号化装置
JP3050978B2 (ja) 音声符号化方法
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JPH0588697A (ja) 欠落音声補間方式
JP3607774B2 (ja) 音声符号化装置
JPH07261796A (ja) 音声符号化復号化装置
JPH08110800A (ja) A−b−S法による高能率音声符号化方式
JPS62207036A (ja) 音声符号化方式とその装置
JPH0632031B2 (ja) 音声符号化方法とその装置
JPH09185395A (ja) 音声符号化装置及び音声復号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110720

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20120802

Year of fee payment: 13

LAPS Lapse due to unpaid annual fee