KR20070083856A - 스케일러블 부호화 장치, 스케일러블 복호화 장치 및이러한 방법 - Google Patents

스케일러블 부호화 장치, 스케일러블 복호화 장치 및이러한 방법 Download PDF

Info

Publication number
KR20070083856A
KR20070083856A KR1020077009746A KR20077009746A KR20070083856A KR 20070083856 A KR20070083856 A KR 20070083856A KR 1020077009746 A KR1020077009746 A KR 1020077009746A KR 20077009746 A KR20077009746 A KR 20077009746A KR 20070083856 A KR20070083856 A KR 20070083856A
Authority
KR
South Korea
Prior art keywords
encoding
spectrum
frequency
pitch
scalable
Prior art date
Application number
KR1020077009746A
Other languages
English (en)
Inventor
마사히로 오시키리
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20070083856A publication Critical patent/KR20070083856A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Abstract

부호화 파라미터의 비트레이트를 감소시키고, 또, 복수의 조파(調波) 구조가 혼재하는 음성 신호에 대해서도 효율적으로 부호화할 수 있는 스케일러블 부호화 장치를 개시한다. 이 장치에 있어서, MDCT 분석부(111)는, 변환 부호화를 행하기위해서, 음성 신호(S15)에 대해서 MDCT 분석을 실시한다. 피치(pitch) 주파수 변환부(112)는, 피치 주기의 역수(逆數)를 구하여 피치 주파수를 산출한다. 선택부(113)는, 피치 주파수의 정수배(整數倍)의 주파수에 위치하는 스펙트럼을 선택한다. 제 2 레이어 부호화부(106)는, 이 선택된 복수의 스펙트럼에 대해서 부호화 처리를 행한다.

Description

스케일러블 부호화 장치, 스케일러블 복호화 장치 및 이러한 방법{SCALABLE ENCODING APPARATUS, SCALABLE DECODING APPARATUS, AND METHODS THEREOF}
본 발명은, 상위 레이어에 있어서 변환 부호화를 행하는 스케일러블(scalable) 부호화 장치, 스케일러블 복호화 장치 및 이러한 방법에 관한 것이다.
이동체 통신 시스템에서는, 전파 자원 등의 유효 이용을 위하여, 음성 신호를 저비트레이트(低bit rate)로 압축하여 전송하는 것이 요구되고 있다. 그런 한편, 사용자로부터는 통화 음성의 품질 향상이나 현장감 높은 통화 서비스의 실현이 요망되고 있으므로, 음성 신호의 고품질화 뿐 아니라, 보다 대역이 넓은 오디오 신호 등의 음성 이외의 신호도 고품질로 부호화할 수 있는 것이 희망된다.
이와 같이 상반되는 두 개의 요구에 대해, 복수의 부호화 기술을 계층적으로 통합하는 기술이 유망시 되고 있다. 이 기술은, 음성 신호에 적합한 모델로 입력 신호를 저비트레이트로 부호화하는 제 1 레이어와, 입력 신호와 제 1 레이어 복호 신호와의 차분(差分) 신호를 음성 이외의 신호에도 적합한 모델로 부호화하는 제 2 레이어를 계층적으로 조합한다. 이와 같이 계층적으로 부호화를 행하는 기술은, 부호화 장치로부터 얻어지는 비트 스트림(bit stream)에 스케일러빌리티성(scalability性), 즉, 비트 스트림의 일부 정보로부터도 복호 신호를 얻을 수 있는 성질을 가지기 때문에, 일반적으로 스케일러블 부호화로 불리고 있다. 이 스케일러블 부호화는, 비트레이트가 다른 네트워크 간의 통신에도 유연하게 대응할 수 있다. 따라서, 스케일러블 부호화는, IP 프로토콜로 다양한 네트워크가 통합되어 가는 향후의 네트워크 환경에 적합한 것이라고 말할 수 있다.
MPEG-4(Moving Picture Experts Group phase-4)로 규격화된 기술을 이용하여 스케일러블 부호화를 실현하는 예로서, 예를 들면, 비특허 문헌 1에 개시되어 있는 기술이 있다. 이 기술은, 제 1 레이어에 있어서, 음성 신호에 적합한 CELP(Code Excited Linear Prediction; 부호 여기 선형 예측) 부호화를 이용하고, 제 2 레이어에 있어서, 원(原)신호로부터 제 1 레이어 복호 신호를 뺀 잔차(殘差)신호에 대해서, AAC(Advanced Audio Coder)나 TwinVQ(Transform Domain Weighted Interleave Vector Quantization; 주파수 영역 보정 인터리브 벡터 양자화) 등의 변환 부호화를 이용한다. 이 변환 부호화란, 시간 영역의 신호를 주파수 영역의 신호로 변환한 뒤, 이 주파수 영역 신호에 대해 부호화를 행하는 기술이다.
또, 변환 부호화의 구체적인 예로서 특허 문헌 1에 개시되어 있는 기술이 있다. 이 기술은, 입력 신호를 피치(pitch) 분석해서 피치 주파수를 구하여, 피치 주파수의 정수배(整數倍)의 주파수에 위치하는 스펙트럼을 한꺼번에 부호화한다. 여기서, 음성 신호의 조파(調波) 구조를 특정하는 파라미터인 피치 주파수의 정수배 에 해당하는 주파수를 조파 주파수라고 부르고, 조파 주파수에 위치하는 스펙트럼을 조파 스펙트럼이라고 부르기로 한다면, 특허 문헌 1의 기술은, 조파 스펙트럼을 복호한 후에, 입력 스펙트럼으로부터 감산하여 오차 스펙트럼을 구하고, 이 오차 스펙트럼을 별도 부호화하는 것이 된다. 이 구성에 의해, 조파 스펙트럼을 비교적 적은 연산량으로 효율적으로 부호화할 수 있으며, 음질 열화가 적은 부호화 방식을 제공할 수 있다.
(특허 문헌 1) 일본 공개 특허 공보 평9-181611호
(비특허 문헌 1) 미키 스께이치(三木弼一) 편저, 「MPEG-4의 전모」, 초판, (주) 공업 조사회, 1998년 9월 30일, p.126-127
(발명이 해결하려고 하는 과제)
그렇지만, 특허 문헌 1의 기술을 스케일러블 부호화에 적용했을 경우, 조파 주파수를 특정하기 위해서는 피치 주파수를 부호화하여 복호화측에 전송할 필요가 있다. 또, 조파 스펙트럼을 복호한 뒤에 오차 스펙트럼 성분을 구하여, 그 오차 스펙트럼을 더 부호화할 필요가 있다. 그 때문에 부호화 파라미터의 비트레이트가 증가한다.
또 특허 문헌 1의 기술에서는, 1개의 피치 주파수에 대응한 1조의 조파 스펙트럼만이 존재하고 있을 경우, 즉, 음원이 1종류인 경우를 상정(想定)하고 있어, 입력 신호에 복수의 화자(話者)나 악기가 포함되어 있는 등, 음원이 복수 종류인 경우에 고품질의 부호화가 곤란해진다. 왜냐하면, 음원이 복수일 경우, 주된 조파 스펙트럼(주조파(主調波) 스펙트럼)과 부차적인 조파 스펙트럼(부조파(副調波) 스펙트럼)이라고 하는, 다른 피치 주파수에 의해 특정되는 복수 종류의 조파 스펙트럼이 혼재하게 되기 때문이다.
따라서, 본 발명의 목적은, 부호화 파라미터의 비트레이트를 감소시킬 수 있고, 또, 복수의 조파 구조가 혼재하는 음성 신호에 대해서도 효율적으로 부호화할 수 있는 스케일러블 부호화 장치, 스케일러블 복호화 장치 및 이러한 방법을 제공하는 것이다.
(과제를 해결하기 위한 수단)
본 발명의 스케일러블 부호화 장치는, 음성 신호를 해당 음성 신호의 피치 주기를 이용해서 부호화하는 제 1 부호화 수단과, 상기 피치 주기로부터 피치 주파수를 산출하는 산출 수단과, 상기 음성 신호의 스펙트럼 중, 상기 피치 주파수의 정수배의 주파수에 있어서의 스펙트럼에 대해서 부호화를 행하는 제 2 부호화 수단을 구비하는 구성을 취한다.
(발명의 효과)
본 발명에 의하면, 스케일러블 부호화에 있어서, 부호화 파라미터의 비트레이트를 감소시킬 수 있다. 또, 부호화측에 있어서, 복수의 조파 구조가 혼재하는 음성 신호에 대해서도 효율적으로 부호화할 수 있음과 동시에, 복호화측에 있어서, 복호된 음성 신호의 음질을 향상시킬 수 있다.
도 1은 실시형태 1에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도,
도 2는 실시형태 1에 따른 제 2 레이어 부호화부 내부의 주요한 구성을 나타내는 블록도,
도 3은 오디오 신호의 스펙트럼의 일례를 나타낸 도면,
도 4는 잔차 스펙트럼의 일례를 나타낸 도면,
도 5는 실시형태 1에 따른 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도,
도 6은 실시형태 1에 따른 제 2 레이어 복호화부 내부의 주요한 구성을 나타내는 블록도,
도 7은 실시형태 1에 따른 스케일러블 부호화 장치의 변형예 1의 주요한 구성을 나타내는 블록도,
도 8은 실시형태 1에 따른 제 2 레이어 부호화부의 주요한 구성을 나타내는 블록도,
도 9는 실시형태 1에 따른 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도,
도 10은 실시형태 1에 따른 제 2 레이어 복호화부의 주요한 구성을 나타내는 블록도,
도 11은 실시형태 1에 따른 제 2 레이어 부호화부의 변형예의 주요한 구성을 나타내는 블록도,
도 12는 실시형태 1에 따른 제 2 레이어 복호화부의 구성을 나타내는 블록도,
도 13은 실시형태 2에 따른 제 2 레이어 부호화부의 주요한 구성을 나타내는 블록도,
도 14는 잔차 스펙트럼과 기점(起点) 주파수의 관계를 설명하기 위한 도면,
도 15는 실시형태 2에 따른 제 2 레이어 복호화부의 주요한 구성을 나타내는 블록도,
도 16은 실시형태 3에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도,
도 17은 실시형태 3에 따른 제 2 레이어 부호화부 내부의 주요한 구성을 나타내는 블록도,
도 18은 실시형태 3에 따른 제 3 레이어 부호화부 내부의 주요한 구성을 나타내는 블록도,
도 19는 제 1 조파 주파수와 제 2 조파 주파수를 개념적으로 나타낸 도면,
도 20은 실시형태 3에 따른 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도,
도 21은 실시형태 3에 따른 제 2 레이어 복호화부 내부의 주요한 구성을 나타내는 블록도,
도 22는 실시형태 3에 따른 제 3 레이어 복호화부 내부의 주요한 구성을 나타내는 블록도이다.
이하, 본 발명의 실시형태에 대해서, 첨부 도면을 참조하여 상세히 설명한다.
(실시형태 1)
도 1은, 본 발명의 실시형태 1에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도이다.
본 실시형태에 따른 스케일러블 부호화 장치의 각 부는 이하의 동작을 행한다.
제 1 레이어 부호화부(102)는, 입력되는 음성 신호(원(原)신호)(S11)를 CELP 방식에 의해 부호화하고, 얻어지는 부호화 파라미터(S12)를, 다중화부(103), 제 1 레이어 복호화부(104)에 준다. 또, 제 1 레이어 부호화부(102)는, 얻어진 부호화 파라미터 중에서, 피치 주기(S14)를 제 2 레이어 부호화부(106)에 준다. 이 피치 주기는, 적응 코드북의 탐색에 있어서 얻어지는 적응 코드북 래그가 이용된다. 제 1 레이어 복호화부(104)는, 제 1 레이어 부호화부(102)로부터 출력된 부호화 파라 미터(S12)로부터 제 1 레이어의 복호 신호(S13)를 생성하여, 제 2 레이어 부호화부(106)에 출력한다.
한편, 지연부(105)는, 입력된 음성 신호(S11)에 소정 길이의 지연을 부여한다. 이 지연은, 제 1 레이어 부호화부(102), 제 1 레이어 복호화부(104) 등에서 발생하는 시간 지연을 보정하기 위한 것이다. 제 2 레이어 부호화부(106)는, 제 1 레이어 복호화부(104)에서 생성된 제 1 레이어 복호 신호(S13)를 이용하여, 지연부(105)로부터 출력되는 소정 시간 지연된 음성 신호(S15)에 대해, MDCT(Modified Discrete Cosine Transform;변형 이산 코사인 변환)를 이용한 변환 부호화를 실시하고, 생성되는 부호화 파라미터(S16)를 다중화부(103)에 출력한다.
다중화부(103)는, 제 1 레이어 부호화부(102)에서 구해지는 부호화 파라미터(S12)와, 제 2 레이어 부호화부(106)에서 구해지는 부호화 파라미터(S16)를 다중화하고, 이것을 출력 부호화 파라미터의 비트 스트림(bit stream)으로서 외부에 출력한다.
도 2는, 상기의 제 2 레이어 부호화부(106) 내부의 주요한 구성을 나타내는 블록도이다.
MDCT 분석부(111)는, 변환 부호화를 행하기 위해, 음성 신호(S15)에 대해서 MDCT 분석을 실시하고, 분석 결과 스펙트럼을 선택부(113)에 출력한다. 변환 부호화는, 시간 영역의 신호를 주파수 영역의 신호로 변환한 뒤, 이 주파수 영역의 신호에 대해 부호화를 행하는 기술로서, MDCT 분석을 이용하는 변환 부호화로서는, AAC(Advanced Audio Coder), TwinVQ(Transform Domain Weighted Interleave Vector Quantization;주파수 영역 보정 인터리브 벡터 양자화) 등이 있다.
피치 주파수 변환부(112)는, 제 1 레이어 부호화부(102)로부터 주어지는 피치 주기(S14)를 초단위의 값으로 변환한 후에 그 역수(逆數)를 구해 피치 주파수를 산출하여, 선택부(113, 115)에 출력한다.
선택부(113)는, 피치 주파수 변환부(112)로부터 출력되는 피치 주파수를 이용하여, MDCT 분석부(111)로부터 출력되는 음성 신호의 스펙트럼 중 일부 스펙트럼을 선택하여, 가산부(117)에 출력한다. 구체적으로는, 선택부(113)는, 피치 주파수의 정수배 주파수(조파 주파수)에 위치하는 스펙트럼(조파 스펙트럼)을 선택하여, 가산부(117)에 출력한다. 제 2 레이어 부호화부(106)는, 이 선택된 복수의 조파 스펙트럼에 대해서 이후의 부호화 처리를 행한다. 이와 같이, 부호화 대상의 스펙트럼을 전체 범위가 아니라 일부의 범위로 한정함으로써, 부호화 레이트의 저비트레이트화를 꾀할 수 있다. 그리고, 여기서 조파 스펙트럼이란, 조파 주파수상에 위치하는 협대역인 선스펙트럼(line spectrum)과 같은 스펙트럼을 말한다.
MDCT 분석부(114)는, MDCT 분석부(111)와 마찬가지로, 제 1 레이어 복호화부(104)로부터 출력되는 제 1 레이어 복호 신호(S13)에 대해서 MDCT 분석을 가하고, 분석 결과 스펙트럼을 선택부(115)에 출력한다.
선택부(115)는, 선택부(113)와 마찬가지로, 피치 주파수 변환부(112)로부터 출력되는 피치 주파수를 이용하여, MDCT 분석부(114)로부터 출력되는 제 1 레이어 복호 신호의 스펙트럼 중 일부 범위의 스펙트럼을 선택하여, 가산부(116)에 출력한다.
잔차 스펙트럼 코드북(121)은, 후술하는 탐색부(120)로부터 지시된 인덱스에 대응하는 잔차 스펙트럼을 생성하여, 곱셈기(123)에 출력한다.
게인 코드북(122)은, 후술하는 탐색부(120)로부터 지시된 인덱스에 대응하는 게인(gain)을 곱셈기(123)에 출력한다.
곱셈기(123)는, 잔차 스펙트럼 코드북(121)에서 생성된 잔차 스펙트럼에, 게인 코드북(122)으로부터 출력된 게인을 곱하여, 게인 조정 후의 잔차 스펙트럼을 가산기(116)에 출력한다.
가산기(116)는, 선택부(115)로부터 출력되는 일부 범위로 한정된 제 1 레이어 복호 신호의 스펙트럼에, 곱셈기(123)로부터 출력되는 게인 조정 후의 잔차 스펙트럼을 가산하여, 가산기(117)에 출력한다.
가산기(117)는, 선택부(113)로부터 출력되는 일부 범위로 한정된 음성 신호의 스펙트럼으로부터, 가산기(116)로부터 출력되는 제 1 레이어 복호 신호의 스펙트럼을 감산하고 잔차 스펙트럼을 구하여 보정부(119)에 출력한다. 제 2 레이어 부호화부(106)는, 이 잔차 스펙트럼을 최소(最小)로 하도록 부호화가 행해진다.
청각 마스킹 산출부(118)는, 음성 신호(S15)에 대해, 인간에게는 지각되지 않는 노이즈 파워(noise power)의 임계값, 즉, 청각 마스킹을 산출하여, 보정부(119)에 출력한다. 인간의 청각에는, 어떤 주파수의 신호가 주어졌을 때에 그 주파수 근방의 신호가 들리기 어려워진다는 특성(마스킹 효과)이 있어, 청각 마스킹 산출부(118)는, 이 특성을 제 2 레이어 부호화부(106)에서 이용하기 위해, 입력된 음성 신호(S15)의 스펙트럼으로부터 청각 마스킹을 산출한다.
보정부(119)는, 가산기(117)로부터 출력되는 잔차 스펙트럼에 대해, 청각 마스킹 산출부(118)에서 산출된 청각 마스킹에 의한 보정을 실시하여, 탐색부(120)에 출력한다.
상기의 잔차 스펙트럼 코드북(121), 게인 코드북(122), 곱셈기(123), 가산기(116, 117), 및 보정부(119)는, 폐(閉)루프(귀환 루프)를 구성하고 있으며, 탐색부(120)는, 보정부(119)로부터 출력되는 잔차 스펙트럼이 최소가 되도록, 잔차 스펙트럼 코드북(121) 및 게인 코드북(122)에 지시할 인덱스를 여러가지로 변화시킨다.
보다 상세한 것은, 잔차 스펙트럼 코드북(121)에 격납되어 있는 잔차 스펙트럼의 벡터 후보 및 게인 코드북(122)에 격납되어 있는 게인 후보는, 예를 들면 다음의 식(1)로 표시되는 왜곡(E)을 최소로 하도록 결정된다. 여기서, w(k)는 청각 마스킹에 의해 결정되는 보정 함수, o(k)는 원신호 스펙트럼, g(j)는 제 j 게인 후보, e(i, k)는 제 i 잔차 스펙트럼 후보, b(k)는 기본 레이어 스펙트럼을 나타낸다.
Figure 112007032140472-PCT00001
또, 제 2 레이어 부호화부(106)가 스케일 팩터(scale factor)를 이용하는 부호화부인 경우에는, 왜곡(E)은, 예를 들면 다음의 식(2)와 같이 정의된다. 여기서 SF(k)는 원신호 스펙트럼의 스케일 팩터를 부호화한 결과 얻어지는 복호 스케일 팩 터, b'(k)는 기본 레이어 스펙트럼을 자신의 스케일 팩터로 정규화한 결과 얻어지는 스펙트럼을 나타낸다.
Figure 112007032140472-PCT00002
탐색부(120)는, 상기의 폐루프에 의해 최종적으로 얻어지는 잔차 스펙트럼 코드북(121) 및 게인 코드북(122)의 인덱스를 부호화 파라미터(S16)로서 제 2 레이어 부호화부(106)의 외부로 출력한다.
이어서, 선택부(113, 115)가 스펙트럼을 일부 범위로 선택하는 처리를 이용하여 부호화 효율을 향상시킬 수 있는 원리에 대해서, 이하 도면을 이용하여 상세히 설명한다.
도 3은, 원신호인 오디오 신호의 스펙트럼의 일례를 나타낸 도면이다. 샘플링 주파수는 16㎑로 되어 있다.
이 예에서는, 피치 주파수는 약 600㎐로 되어 있으며, 일반적인 오디오 신호에 있어서, 피치 주파수의 정수배 위치, 즉, 조파 주파수 f1, f2, f3, …의 위치에 스펙트럼의 피크(조파 스펙트럼)가 복수 나타나는 것을 알 수 있다.
도 4는, 도 3에 나타낸 원신호 스펙트럼으로부터 제 1 레이어 복호 신호의 스펙트럼을 빼고 얻어지는 잔차 스펙트럼의 일례를 나타낸 도면이다. 이 도면에 있어서, 실선이 잔차 스펙트럼, 점선이 청각 마스킹 임계값을 나타내고 있다.
이 도면에 나타내는 바와 같이, 제 1 레이어에 있어서 부호화가 실시되어 있 기 때문에, 잔차 스펙트럼의 진폭은, 원신호 스펙트럼에 비해 전체적으로 작아져 있다. 또, 저역 스펙트럼의 진폭이 고역 스펙트럼의 진폭보다도 더욱 작아져 있다. 이것은, 제 1 레이어 부호화부(102)에 있어서 행해지는 CELP 부호화가, 신호 에너지가 큰 성분에 대해서 보다 부호화 왜곡을 작게 하는 처리를 실시한다고 하는 특징이 있기 때문이다.
또, 조파 주파수상에 위치하는 잔차 스펙트럼은, 원신호 스펙트럼과 비교해 진폭이 감쇠하고 있긴 하지만, 그 피크 형상은 여전히 남아 있다. 즉, 진폭이 감쇠해도, 조파 주파수상에 있어서는 잔차 스펙트럼의 피크가 청각 마스킹 임계값을 초과해 버리는 상황이 많이 발생한다. 또, CELP 부호화의 상기 특징으로 인해, 저역보다 고역 쪽이 청각 마스킹 임계값을 초과하는 잔차 스펙트럼의 피크수가 보다 많아진다.
한편, 청각 마스킹 임계값보다 잔차 스펙트럼이 작을 경우에는, 청감상 그 부호화 왜곡은 지각(知覺)되지 않는다. 전술한 바와 같이, 청각 마스킹 임계값을 초과하는 잔차 스펙트럼의 상당수는 조파 주파수상 또는 그 근방에 위치하는 것으로서, 고역(高域)일수록 이런 경향이 강하다. 또, 조파 주파수 이외의 주파수에 있어서의 잔차 스펙트럼의 상당수는, 청각 마스킹 임계값보다 작아, 부호화 대상으로 할 필요가 없다.
그래서, 이상의 특성을 고려하여, 본 실시형태에서는, 입력 신호의 효율적인 부호화를 행하기 위해서, 제 2 레이어에 있어서, 조파 주파수상에 위치하는 스펙트럼을 부호화 대상으로 한다.
도 5는, 상기의 스케일러블 부호화 장치로 부호화된 코드를 복호하는, 즉, 본 실시형태에 따른 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도이다.
분리부(151)는, 상기의 스케일러블 부호화 장치에서 부호화된 코드를, 제 1 레이어 복호화부(152)용 부호화 파라미터와, 제 2 레이어 복호화부(153)용 부호화 파라미터로 분리한다.
제 1 레이어 복호화부(152)는, 분리부(151)에서 얻어진 부호화 파라미터에 대해 CELP 방식의 복호화를 실시하고, 얻어지는 제 1 레이어 복호 신호를 제 2 레이어 복호화부(153)에 준다. 또, 제 1 레이어 복호화부(152)는, 상기의 CELP 방식의 복호화로 얻어지는 피치 주기를 제 2 레이어 복호화부(153)에 출력한다. 이 피치 주기로서, 적응 코드북 래그가 이용된다. 이 제 1 레이어 복호 신호는, 필요에 따라, 직접 외부로도 저품질 복호 신호로서 출력된다.
제 2 레이어 복호화부(153)는, 제 1 레이어 복호화부(152)로부터 얻어지는 제 1 레이어 복호 신호를 이용하여, 분리부(151)에서 분리된 제 2 레이어 부호화 파라미터에 대해서 후술하는 복호화 처리를 실시하고, 얻어지는 제 2 레이어 복호 신호를 필요에 따라 고품질 복호 신호로서 외부로 출력한다.
이와 같이, 제 1 레이어 복호 신호에 의해 재생 음성의 최저한의 품질이 담보되고, 제 2 레이어 복호 신호에 의해 재생 음성의 품질을 높일 수 있다. 또, 제 1 레이어 복호 신호 또는 제 2 레이어 복호 신호의 어느 것을 출력할지는, 네트워크 환경(패킷 로스의 발생 등)에 의해 제 2 레이어 부호화 파라미터가 얻어지는지 어떤지, 또는, 애플리케이션이나 사용자의 설정 등에 의존한다.
도 6은, 상기의 제 2 레이어 복호화부(153) 내부의 주요한 구성을 나타내는 블록도이다.
이 도면에 나타내는 MDCT 분석부(161), 가산기(162), 피치 주파수 변환부(164), 잔차 스펙트럼 코드북(166), 곱셈기(167), 및 게인 코드북(168)은, 상기의 스케일러블 부호화 장치의 제 2 레이어 부호화부(106)(도 2 참조)가 가지는 MDCT 분석부(114), 가산기(116), 피치 주파수 변환부(112), 잔차 스펙트럼 코드북(121), 곱셈기(123), 및 게인 코드북(122)에 각각 대응한 구성이며, 각 부는 기본적으로 동일한 기능을 가진다.
잔차 스펙트럼 코드북(166)은, 분리부(151)로부터 주어지는 부호화 파라미터(진폭 정보)를 이용하여, 격납되어 있는 복수의 잔차 스펙트럼 후보 중에서 1개의 잔차 스펙트럼을 선택하여, 곱셈부(167)에 출력한다.
게인 코드북(168)은, 분리부(151)로부터 주어지는 부호화 파라미터(게인 정보)를 이용하여, 격납되어 있는 복수의 게인 후보 중에서 1개의 게인을 선택하여, 곱셈부(167)에 출력한다.
곱셈부(167)는, 잔차 스펙트럼 코드북(166)으로부터 주어지는 잔차 스펙트럼에, 게인 코드북(168)으로부터 주어지는 게인을 곱하고, 게인 조정 후의 잔차 스펙트럼을 배치부(165)에 출력한다.
피치 주파수 변환부(164)는, 제 1 레이어 복호화부(152)로부터 주어지는 피치 주기를 이용해서 피치 주파수를 산출하여, 배치부(165)에 출력한다. 이 피치 주파수는, 피치 주기를 초(秒)단위의 값으로 변환하여, 그 역수로 표시된다.
배치부(165)는, 피치 주파수 변환부(164)로부터 주어지는 피치 주파수로 표시되는 조파 주파수상에, 곱셈부(167)로부터 주어지는 게인 조정 후의 잔차 스펙트럼을 배치하여, 가산부(162)에 출력한다. 이 잔차 스펙트럼의 배치 방법은, 부호화측의 제 2 레이어 부호화부(106) 내부의 선택부(113, 115)에 있어서, 피치 주파수를 이용하여 어떻게 MDCT 계수를 배치했는지에 의존하고 있으며, 복호화측에서도 부호화측과 동일한 배치 방법을 취한다.
MDCT 분석부(161)는, 제 1 레이어 복호화부(152)로부터 출력된 제 1 레이어 복호 신호를 MDCT 변환에 의해 주파수 분석하고, 얻어지는 MDCT 계수, 즉, 제 1 레이어 복호 스펙트럼을 가산기(162)에 출력한다.
가산기(162)는, MDCT 분석부(161)로부터 출력된 제 1 레이어 복호 스펙트럼에, 배치부(165)로부터 출력되는 각 잔차 스펙트럼 배치 후의 스펙트럼을 가산함으로써, 제 2 레이어 복호 스펙트럼을 생성하고, 이것을 시간 영역 변환부(163)에 출력한다.
시간 영역 변환부(163)는, 가산기(162)로부터 출력되는 제 2 레이어 복호 스펙트럼을 시간 영역의 신호로 변환한 후, 필요에 따라서 적절한 창걸기(windowing) 및 겹쳐서 가산 등의 처리를 행하여 프레임 간에 생기는 불연속을 회피하여, 최종적인 고품질 복호 신호를 출력한다.
이상 설명한 바와 같이, 본 실시형태에 의하면, 제 1 레이어에 있어서의 CELP 방식의 부호화에 의해 구해지는 피치 주기를 이용하여, 제 2 레이어에 있어 서, 음성 신호의 조파 구조를 특정하는 조파 주파수를 특정하고, 이 조파 주파수상의 스펙트럼만을 부호화 대상으로 한다. 따라서, 음성 신호의 전(全)주파수 대역을 부호화 대상으로 하는 것은 아니기 때문에, 부호화 파라미터의 비트레이트를 저감할 수 있음과 동시에, 또, 조파 주파수상의 스펙트럼은 음성 신호의 특징을 잘 나타낸 스펙트럼이기 때문에, 적은 비트레이트로 고품질 복호 신호를 얻을 수 있어 부호화 효율이 좋다. 또, 피치 주파수에 관한 부가 정보를 복호화측에 전송할 필요도 없다.
그리고, 본 실시형태에서는, 제 2 레이어에 있어서의 변환 부호화에 있어서, 조파 스펙트럼, 즉, 조파 주파수상의 스펙트럼을 부호화 대상으로 하는 경우를 예로 들어 설명했지만, 부호화 대상으로 하는 스펙트럼은 반드시 조파 주파수상의 스펙트럼으로 한정할 필요는 없으며, 예를 들면, 조파 주파수의 근방에 위치하는 스펙트럼 중에서, 다른 스펙트럼보다 예민한 피크 형상을 가지고 있는 스펙트럼을 선택하여 부호화 대상으로 해도 좋다. 이 경우, 조파 주파수로부터 선택된 스펙트럼까지의 상대적인 위치 정보를 부호화하여 복호화부에 전송할 필요가 있다.
또한, 본 실시형태에서는, 제 2 레이어에 있어서의 변환 부호화에 있어서, 조파 스펙트럼, 즉, 조파 주파수상에 위치하는 매우 협대역인 선스펙트럼과 같은 스펙트럼을 부호화 대상으로 하는 경우를 예로 들어 설명했지만, 부호화 대상으로 하는 스펙트럼은 반드시 선스펙트럼과 같은 스펙트럼으로 할 필요는 없으며, 예를 들면, 조파 주파수 근방의 일정한 대역폭(다만 협대역)을 가지는 스펙트럼을 부호화 대상으로 해도 좋다. 예를 들면, 이 일정한 대역폭으로서 조파 주파수를 중심 으로 한 일정 범위의 주파수 영역을 설정할 수 있다.
도 7은, 본 실시형태에 따른 스케일러블 부호화 장치의 변형예 1의 주요한 구성을 나타내는 블록도이다. 그리고, 이미 설명한 구성 요소와 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
제 1 레이어 부호화부(102a)는, 제 1 레이어 부호화부(102)와 기본적 동작은 동일하지만, 피치 주기를 제 2 레이어 부호화부(206)에 출력하지 않는 점이 다르다. 제 2 레이어 부호화부(206)는, 제 1 레이어 복호화부(104)로부터 출력되는 제 1 레이어 복호 신호(S13)를 상관 분석하여 피치 주기를 구한다.
도 8은, 상기의 제 2 레이어 부호화부(206) 내부의 주요한 구성을 나타내는 블록도이다. 그리고, 이미 설명한 구성 요소와 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
상관 분석부(211)에 있어서의 상관 분석은, 제 1 레이어 복호 신호를 y(n)으로 했을 때, 예를 들면 다음의 식(3)에 따라 행해진다. 여기서, τ은 피치 주기의 후보를 나타내며, 탐색 범위 TMIN~TMAX 중에서 가장 Cor(τ)를 크게 할 때의 τ을 피치 주기로서 출력한다.
Figure 112007032140472-PCT00003
제 1 레이어 부호화부(102a)에서 구해지는 피치 주기는, 내부의 적응 코드북에 포함되는 적응 벡터 후보와 원신호의 왜곡을 최소화하는 처리에 있어서 결정되 는 것이며, 적응 코드북에 포함되는 적응 벡터 후보의 내용에 따라서는 정상적인 피치 주기가 구해지지 않고, 그 정수배 또는 정수분의 1의 피치 주기가 구해지는 수가 있다. 그러나, 제 1 레이어 부호화부(102a)는, 적응 코드북으로 다 나타내지 못하는 오차 성분을 부호화하는 잡음 코드북도 가지고 있어, 만일 적응 코드북이 유효하게 기능하지 않는 경우에서도 잡음 코드북을 이용하여 부호화 파라미터가 생성됨으로써, 이 부호화 파라미터를 복호하여 얻어지는 제 1 레이어 복호 신호는, 보다 원신호에 가까워지게 된다. 따라서, 본 변형예에서는, 이 제 1 레이어 복호 신호를 피치 분석함으로써 보다 정확한 피치 정보를 얻는다.
따라서, 본 변형예에 의하면, 부호화 성능을 향상시킬 수 있다. 또, 제 1 레이어 복호 신호는 복호화측에서도 얻어지기 때문에, 본 변형예에 의하면, 피치 주기에 관한 정보를 복호화 측에 전송할 필요가 없다.
도 9는, 도 7에 나타낸 스케일러블 부호화 장치에 대응하는 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도이다. 또, 도 10은, 이 스케일러블 복호화 장치 내의 제 2 레이어 복호화부(253)의 주요한 구성을 나타내는 블록도이다. 여기에서도, 이미 설명한 구성 요소와 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
도 11은, 본 실시형태에 따른 스케일러블 부호화 장치의 변형예 2, 특히 제 2 레이어 부호화부(106)의 변형예(제 2 레이어 부호화부(306))의 주요한 구성을 나타내는 블록도이다. 여기에서도, 이미 설명한 구성 요소와 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
피치 주기 수정부(311)는, 제 1 레이어에서 얻어지는 피치 주파수를 기준으로 그 주변의 피치 주파수로부터, 보다 정확한 피치 주파수를 다시 구하여, 그 차분량을 부호화한다. 보다 상세한 것은, 피치 주기 수정부(311)는, 제 1 레이어에서 얻어지는 피치 주기(T)에 차분량(ΔT)을 더하고, T+ΔT를 초단위의 값으로 변환한 후에, 그 역수를 취하여 피치 주파수를 구한다. 이 피치 주파수로 특정되는 조파 주파수에 위치하는 하기의 식(4)의 d(k), 또는 조파 주파수를 중심으로 한정된 주파수 범위에 포함되는 하기 d(k)의 총합(總合)(S)을 취한다. 여기서, M(k)는 청각 마스킹 임계값, o(k)는 원신호 스펙트럼, b(k)는 제 1 레이어 복호 신호의 스펙트럼, MAX()는 최대값을 되돌리는 함수, d(k)는, 청각 마스킹 임계값(M(k))과 잔차 스펙트럼(o(k)-b(k))을 비교하여 잔차 스펙트럼의 진폭이 청각 마스킹 임계값을 어느 정도 초과하고 있는지를 나타내는 파라미터이다.
Figure 112007032140472-PCT00004
이 d(k)는, 청감적인 왜곡을 정량화(定量化)한 것에 상당한다. 피치 주기 수정부(311)는, 이 총합(S)이 최대가 될 때의 ΔT를 부호화하여 피치 주기 수정 정보로서 출력한다. 그리고, T+ΔT를 피치 주파수 변환부(112)에 출력한다.
도 12는, 도 11에 나타낸 제 2 레이어 부호화부(306)에 대응하는 제 2 레이어 복호화부(353)의 구성을 나타내는 블록도이다.
피치 주기 수정부(361)는, 제 2 레이어 부호화부(306)로부터 전송된 피치 주기 수정 정보를 기초로 차분량(ΔT)을 복호하고, 피치 주기(T)를 가산하여 수정 후 의 피치 주기를 생성하여 출력한다.
이러한 구성에 의하면, 적은 비트를 부가하여, 보다 정확한 피치 주파수를 구함으로써, 복호 신호의 고품질화를 꾀할 수가 있다.
(실시형태 2)
본 발명의 실시형태 2에서는, 잔차 스펙트럼(원신호 스펙트럼으로부터 제 1 레이어 복호 신호 스펙트럼을 뺀 스펙트럼)과 청각 마스킹 임계값과의 관계에 의해, 제 2 레이어에서 부호화 대상으로 하는 고역 스펙트럼을 결정하기 위한 주파수(기점(起点) 주파수)를 구하고, 이 기점 주파수보다 고역인 스펙트럼에 대해, 실시형태 1에서 설명한 조파 스펙트럼 부호화를 행한다. 그리고, 기점 주파수의 정보를 부호화하여 복호부에 전송한다.
제 1 레이어에 있어서의 부호화는 CELP 방식이기 때문에, 신호 에너지가 큰 성분의 부호화 왜곡을 작게 하는 성질이 있어, 청감적으로 왜곡이 지각되는 스펙트럼은 고역부에 발생하기 쉬워진다. 그 성질을 이용하여, 부호화의 대상이 되는 스펙트럼의 수를 한정함으로써, 부호화 효율을 개선시킨다.
본 실시형태에 따른 스케일러블 부호화 장치는, 실시형태 1에 나타낸 스케일러블 부호화 장치와 동일한 기본적 구성을 가지고 있으므로, 전체 도면의 설명은 생략하고, 실시형태 1과 다른 구성인 제 2 레이어 부호화부(406)에 대해서 이하에서 설명한다.
도 13은, 제 2 레이어 부호화부(406)의 주요한 구성을 나타내는 블록도이다. 그리고, 실시형태 1에 나타낸 제 2 레이어 부호화부(106)와 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
기점 주파수 결정부(411)는, 잔차 스펙트럼과 청각 마스킹 임계값의 관계에 의해, 기점 주파수를 결정한다. 기점 주파수의 후보는 미리 정해져 있으며, 부호화측과 복호화측에는 기점 주파수 및 부호화 파라미터의 후보가 기록된 동일한 테이블을 가지고 있다.
예를 들면, 기점 주파수는, 하기에서 표시되는 d(k)를 산출하고, 이 d(k)를 이용하여 결정된다.
Figure 112007032140472-PCT00005
d(k)는, 잔차 스펙트럼의 진폭이 청각 마스킹 임계값을 어느 정도 초과해 있는지를 나타내는 파라미터이며, 예를 들면, 잔차 스펙트럼의 진폭이 청각 마스킹 임계값을 초과하지 않은 스펙트럼은 0으로 간주한다.
기점 주파수 결정부(411)는, 기점 주파수의 각 후보에 대해서, 조파 주파수 또는 조파 주파수를 중심으로 한정된 구간의 d(k)의 총합을 취하고, 그 변화량이 커질 때의 기점 주파수를 선택하여, 그 부호화 파라미터를 출력한다.
도 14는, 잔차 스펙트럼과 기점 주파수의 관계를 설명하기 위한 도면이다. 상단은, 잔차 스펙트럼(실선) 및 청각 마스킹 임계값(점선)을 나타내고 있으며, 하단은, 기점 주파수를 0㎐에서 3000㎐로 변화시켰을 경우의, 즉, 기점 주파수#0~#3에 있어서의 부호화 대상 스펙트럼 주파수(대역)를 나타낸 것이다(여기에서는, 부 호화 대상 주파수와 부호화 대상외(外) 주파수를 신호의 온(on)/오프(off)를 이용하여 나타내고 있다).
잔차 스펙트럼은, 샘플링 주파수 16㎑의 오디오 신호를 원신호로 하여, 이 원신호 스펙트럼으로부터 제 1 레이어 복호 신호의 스펙트럼을 빼고 구한 것이다. 이 예에서는, 주파수 2000㎐ 이하의 잔차 스펙트럼은 청각 마스킹 임계값 이하로 되어 있고, 2000㎐ 이상의 고조파 위치에서 청각 마스킹 임계값을 초과하는 잔차 스펙트럼이 나타나 있다. 즉, 전술한 d(k)의 총합의 변화량은 기점 주파수#2(2000㎐)부터 기점 주파수#3(3000㎐)의 사이에서 크게 변화한다. 따라서, 이 때, 부호화 대상 스펙트럼 주파수를 특정하는 정보로서, 기점 주파수#2를 나타내는 부호화 파라미터가 출력되게 된다.
도 15는, 상기의 제 2 레이어 부호화부(406)에 대응하는 제 2 레이어 복호화부(453)의 주요한 구성을 나타내는 블록도이다. 실시형태 1에 나타낸 제 2 레이어 복호화부(153)(도 6 참조)와 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
기점 주파수 복호부(461)는, 기점 주파수의 부호화 파라미터를 이용하여 기점 주파수를 복호하여, 배치부(165b)에 출력한다. 배치부(165b)는, 이 기점 주파수와 피치 주파수 변환부(164)로부터 출력되는 피치 주파수를 이용하여 복호 잔차 스펙트럼을 배치할 주파수를 구하여, 이 주파수에 곱셈기(167)로부터 출력되는 복호 잔차 스펙트럼을 배치한다.
본 실시형태에 의하면, 이하의 효과가 얻어진다. 즉, 제 1 레이어의 부호화 는 CELP 방식의 부호화이기 때문에, 에너지가 큰 저역 스펙트럼은 비교적 부호화 왜곡이 적게 부호화된다. 따라서, 제 2 레이어에 있어서, 기점 주파수보다 고역에 위치하는 조파 스펙트럼만을 부호화함으로써, 부호화 대상 스펙트럼이 적어져, 부호화 파라미터의 비트레이트를 줄일 수 있다. 이것은, 기점 주파수에 관한 정보를 복호화 측에 전송하지 않으면 안된다 하더라도 부호화 파라미터의 저비트레이트화를 실현할 수 있다.
(실시형태 3)
본 발명의 실시형태 3에서는, 복수의 음원이 존재하여, 조파 스펙트럼을 특정하기 위한 피치 주파수가 복수 존재할 경우에, 1조(組)가 아니라 복수 조의 조파 스펙트럼을 각각 부호화한다.
도 16은, 본 발명의 실시형태 3에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도이다. 이 스케일러블 부호화 장치도, 실시형태 1에 나타낸 스케일러블 부호화 장치와 동일한 기본적 구성을 가지고 있어, 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
본 실시형태에 따른 스케일러블 부호화 장치의 구성은, 제 1 레이어 부호화부(102c)에서 얻어지는 피치 주기(S14)를 사용하여 부호화를 행하는 제 2 레이어 부호화부(106c)와, 피치 주기(S14)를 기준으로 하는 주변의 피치 주기로부터, 새로운 조파 스펙트럼 부호화용 피치 주기를 구하여, 부호화를 행하는 제 3 레이어 부호화부(501)로 되어 있다.
제 2 레이어 부호화부(106c)는, 제 1 레이어 부호화부(102c)에서 얻어지는 피치 주기(S14)를 기초로 피치 주파수를 구하고, 이 피치 주파수로 특정되는 조파 스펙트럼(제 1 조파 스펙트럼)을 부호화하고, 얻어지는 각 파라미터, 즉, 복호 제 1 조파 스펙트럼(S51), 청각 마스킹 임계값(S52), 원신호 스펙트럼(S53) 및 제 1 레이어 복호 신호 스펙트럼(S54)을 제 3 레이어 부호화부(501)에 출력한다.
제 3 레이어 부호화부(501)는, 제 1 레이어 부호화부(102c)에서 얻어지는 피치 주기(S14)를 기준으로, 그 주변의 피치 주기, 즉, 피치 주기(S14)와 가까운 값인 다른 피치 주기로부터, 가장 적합한 피치 주기를 산출하고, 산출된 피치 주기로 특정되는 조파 스펙트럼(제 2 조파 스펙트럼)을 부호화한다. 또, 제 3 레이어 부호화부(501)는, 실시형태 1의 변형예 2와 마찬가지로, 산출된 피치 주기의 피치 주기(S14)로부터의 차분량도 부호화한다. 또, 상기의 새롭게 산출되는 피치 주기의 산출법은, 실시형태 1의 변형예 2와 동일한 수법을 이용한다.
도 17은, 상기의 제 2 레이어 부호화부(106c) 내부의 주요한 구성을 나타내는 블록도이다. 또, 도 18은, 상기의 제 3 레이어 부호화부(501) 내부의 주요한 구성을 나타내는 블록도이다.
제 2 레이어 부호화부(106c) 내부의 제 1 조파 스펙트럼 복호부(511)는, 피치 주기(S14)로부터 구해지는 피치 주파수와 제 1 조파 스펙트럼을 부호화하여 얻어지는 부호화 파라미터(제 1 조파 부호화 파라미터)로부터 제 1 조파 스펙트럼을 복호하여, 제 3 레이어 부호화부(501)에 준다(S51).
제 3 레이어 부호화부(501)는, 제 1 레이어 복호 스펙트럼(S54)에 제 1 조파 스펙트럼(S51)을 가산하고, 그 결과를 이용하여 제 2 조파 스펙트럼의 부호화 파라미터(제 2 조파 부호화 파라미터)를 탐색에 의해 결정한다.
도 19는, 제 2 레이어 부호화부(106c)에서 부호화 대상이 되는 제 1 조파 주파수와 제 3 레이어 부호화부(501)에서 부호화 대상이 되는 제 2 조파 주파수를 개념적으로 나타낸 도면이다. 여기서는, 부호화 대상의 주파수와 부호화 대상외의 주파수를 신호의 온/오프를 이용하여 표시하고 있다.
이와 같이, 본 실시형태에 의하면, 다른 2개의 조파 스펙트럼을 가지는 입력 신호에 대해서도, 각 조파 스펙트럼을 각각 높은 효율로 부호화할 수 있다. 또, 이것을 응용하면, 예를 들면, 복수의 화자(話者)나 악기가 포함되어 있는 경우와 같이, 조파 주파수가 다른 복수의 조파 스펙트럼을 가지는 신호에 대해서, 고품질의 부호화를 행할 수 있다. 따라서, 주관 품질을 개선할 수 있다. 이 구성에 의하면, 기준 피치 주기로부터의 차분량을 부호화하기 때문에, 부호화 파라미터를 저비트레이트화할 수가 있다.
그리고, 실시형태 1의 변형예 1에서 나타낸 바와 같이, 제 2 레이어 부호화부(106c)는, 피치 주기(S14) 대신에, 제 1 레이어 복호 신호(S13)를 분석하여 구해지는 피치 주기를 이용해도 좋다.
도 20은, 상기의 본 실시형태에 따른 스케일러블 부호화 장치에 대응하는 스케일러블 복호화 장치의 주요한 구성을 나타내는 블록도이다. 실시형태 1에 나타낸 스케일러블 복호화 장치와 동일한 구성 요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
제 2 레이어 복호화부(153c)는, 제 1 레이어 부호화 파라미터와 제 1 조파 부호화 파라미터까지의 정보를 이용해 복호 처리를 행하여, 고품질#1의 복호 신호를 출력한다. 제 3 레이어 복호화부(551)는, 제 1 레이어 부호화 파라미터와 제 1 조파 부호화 파라미터와 제 2 조파 부호화 파라미터의 정보를 이용하여 복호 처리를 행하여, 고품질#1의 복호 신호보다 더 고품질인 고품질#2의 복호 신호를 출력한다.
도 21은, 상기의 제 2 레이어 복호화부(153c) 내부의 주요한 구성을 나타내는 블록도이다. 또, 도 22는, 상기의 제 3 레이어 복호화부(551) 내부의 주요한 구성을 나타내는 블록도이다.
제 2 레이어 복호화부(153c)는, 피치 주기와 제 1 조파 부호화 파라미터로부터 제 1 조파 스펙트럼을 복호하고, 제 1 조파 스펙트럼과 제 1 레이어 복호 스펙트럼의 가산 결과를 제 3 레이어 복호화부(551)에 준다. 제 3 레이어 복호화부(551)는, 제 1 레이어 복호 스펙트럼에 복호 제 1 조파 스펙트럼을 가산한 스펙트럼(S55)에 복호 제 2 조파 스펙트럼을 가산한다.
본 구성에 의하면, 부호화 파라미터의 일부 또는 전부를 이용함으로써, 저품질의 복호 신호, 고품질 #1의 복호 신호, 고품질 #2의 복호 신호 등, 3종류 품질의 복호 신호를 생성할 수 있다. 이것은 스케일러블 기능을 보다 섬세하게 제어할 수 있음을 의미한다.
이상, 본 발명의 각 실시형태에 대해서 설명했다.
본 발명에 따른 스케일러블 부호화 장치, 스케일러블 복호화 장치, 및 이러 한 방법은, 상기 각 실시형태로 한정되지 않으며, 여러 가지 변경하여 행할 수 있다. 예를 들면, 각 실시형태는, 적절하게 조합하여 행할 수 있다.
본 발명에 따른 스케일러블 부호화 장치 및 스케일러블 복호화 장치는, 이동 통신 시스템에 있어서의 통신 단말 장치 및 기지국 장치에 탑재하는 것도 가능하며, 이에 의해 상기와 동일한 작용 효과를 가지는 통신 단말 장치 및 기지국 장치를 제공할 수 있다.
그리고, 상기 각 실시형태에 있어서는, 스케일러블 부호화의 계층수가 2 또는 3인 경우를 예로 들어 설명했지만, 이것으로 한정되지 않으며, 4 이상의 계층을 가지는 스케일러블 부호화에도 적용할 수 있다.
또, 상기 각 실시형태에 있어서는, 제 1 레이어 부호화부에 있어서 CELP 방식의 부호화가 행해지는 경우를 예로 들어 설명했지만, 이것으로 한정되지 않으며, 제 1 레이어 부호화부에 있어서의 부호화 방법은, 음성 신호의 피치 주기를 이용한 부호화 방법이면 좋다.
또, 본 발명은, 각 레이어가 취급하는 신호의 샘플링 레이트가 다를 때도 적용 가능하다. 예를 들면, 제 n 레이어가 취급하는 신호의 샘플링 레이트를 Fs(n)이라고 표시했을 때, Fs(n)≤Fs(n+1)의 관계가 성립된다.
또, 상기 각 실시형태에 있어서는, 제 2 레이어에 있어서의 변환 부호화의 방식으로서 MDCT를 사용하는 경우를 예로 들어 설명했지만, 이것으로 한정되지 않으며, 예를 들면, DFT(이산 푸리에 변환), 코사인 변환, Wavelet 변환 등 다른 변환 부호화 방식이어도 좋다.
또, 제 1 레이어에서 얻어지는 피치 주기(T1)를 기준으로 주변의 피치 주기를 결정할 때에, T1의 정수배 또는 정수분의 1의 적어도 한쪽을 포함한 피치 주기도 피치 주기를 결정할 때의 기준에 추가해도 좋다. 이것은, 반(半)피치, 배(倍)피치의 대책이 된다.
또, 여기에서는, 본 발명을 하드웨어로 구성하는 경우를 예로 들어 설명했지만, 본 발명은 소프트웨어로 실현되는 것도 가능하다.
또, 상기 각 실시형태의 설명에 이용한 각 기능 블록은, 전형적으로는 집적회로인 LSI로서 실현된다. 이들은 개별적으로 1칩화 되어 있어도 좋고, 일부 또는 모두를 포함하도록 1칩화 되어 있어도 좋다.
또, 여기에서는 LSI라고 했지만, 집적도의 차이에 따라, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI등으로 호칭되는 일도 있다.
또, 집적회로화의 수법은 LSI에 한정하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현되어도 좋다. LSI 제조 후에, 프로그램화하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속 혹은 설정을 재구성 가능한 리컨피규러블 프로세서를 이용해도 좋다.
또, 반도체 기술의 진보 또는 파생하는 별개의 기술에 의해, LSI에 대체되는 집적회로화의 기술이 등장하면, 당연히 그 기술을 이용하여 기능 블록의 집적화를 행하여도 좋다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
본 명세서는, 2004년 10월 28일에 출원한 특허출원 2004-314230에 기초하고 있는 것이다. 이 내용은 모두 여기에 포함시켜 놓는다.
본 발명에 따른 스케일러블 부호화 장치, 스케일러블 복호화 장치, 및 이러한 방법은, 이동체 통신 시스템에 있어서의 통신 단말 장치, 기지국 장치 등의 용도에 적용할 수 있다.

Claims (17)

  1. 음성 신호를 해당 음성 신호의 피치(pitch) 주기를 이용해서 부호화하는 제 1 부호화 수단과,
    상기 피치 주기로부터 피치 주파수를 산출하는 산출 수단과,
    상기 음성 신호의 스펙트럼 중, 상기 피치 주파수의 정수배의 주파수에 있어서의 스펙트럼에 대해서 부호화를 행하는 제 2 부호화 수단
    을 구비하는 스케일러블 부호화 장치.
  2. 제 1 항에 있어서,
    복수의 피치 주파수가 존재하는 음성 신호의 스펙트럼에 대해서, 상기 제 2 부호화 수단에서 이용되는 피치 주파수와 다른 피치 주파수를 이용하여, 해당 피치 주파수의 정수배의 주파수에 있어서의 스펙트럼에 대해서 부호화를 행하는 제 3 부호화 수단을 더 구비하는 스케일러블 부호화 장치.
  3. 제 2 항에 있어서,
    상기 제 3 부호화 수단은,
    상기 다른 피치 주파수와 상기 제 2 부호화 수단에서 이용되는 피치 주파수 와의 차(差)를 더 부호화하는 스케일러블 부호화 장치.
  4. 제 1 항에 있어서,
    상기 산출 수단은,
    상기 제 1 부호화 수단에서 얻어지는 부호화 파라미터의 복호 신호로부터 상기 피치 주기를 취득하여, 상기 피치 주파수를 산출하는 스케일러블 부호화 장치.
  5. 제 1 항에 있어서,
    상기 제 2 부호화 수단은,
    상기 음성 신호의 스펙트럼 중, 소정 주파수보다 고역의 스펙트럼에 대해서 상기 부호화를 행하는 스케일러블 부호화 장치.
  6. 제 5 항에 있어서,
    상기 제 2 부호화 수단은,
    상기 소정 주파수에 관한 정보를 더 부호화하는 스케일러블 부호화 장치.
  7. 제 1 항에 있어서,
    상기 피치 주기를 해당 피치 주기의 주변 피치 주기에 기초하여 수정하는 수정 수단을 더 구비하고,
    상기 산출 수단은,
    수정 후의 피치 주기로부터 상기 피치 주파수를 산출하는
    스케일러블 부호화 장치.
  8. 제 7 항에 있어서,
    상기 제 2 부호화 수단은,
    상기 피치 주기와 상기 수정 후의 피치 주기와의 차(差)를 더 부호화하는 스케일러블 부호화 장치.
  9. 제 1 항에 있어서,
    상기 제 2 부호화 수단은,
    MDCT(Modified Discrete Cosine Transform;변형 이산 코사인 변환)를 이용하여 부호화를 행하는 스케일러블 부호화 장치.
  10. 제 1 항에 있어서,
    상기 피치 주파수의 정수배의 주파수에 있어서의 스펙트럼이란, 일정한 대역폭을 가지고 있는 스펙트럼인 스케일러블 부호화 장치.
  11. 음성 신호의 피치 주기를 이용해서 부호화된 상기 음성 신호의 제 1 부호화 파라미터를, 상기 피치 주기를 이용해서 복호하는 제 1 복호화 수단과,
    상기 피치 주기로부터 피치 주파수를 산출하는 산출 수단과,
    상기 음성 신호의 스펙트럼 중 일부의 스펙트럼을 부호화하여 얻어지는 제 2 부호화 파라미터로부터 상기 일부의 스펙트럼을 생성하는 생성 수단과,
    상기 산출 수단에 의해 산출되는 피치 주파수의 정수배의 주파수에, 상기 생성 수단에 의해 생성되는 스펙트럼을 배치하는 배치 수단
    을 구비하는 스케일러블 복호화 장치.
  12. 청구항 1에 기재한 스케일러블 부호화 장치를 구비하는 통신 단말 장치.
  13. 청구항 11에 기재한 스케일러블 복호화 장치를 구비하는 통신 단말 장치.
  14. 청구항 1에 기재한 스케일러블 부호화 장치를 구비하는 기지국 장치.
  15. 청구항 11에 기재한 스케일러블 복호화 장치를 구비하는 기지국 장치.
  16. 음성 신호를 해당 음성 신호의 피치 주기를 이용해서 부호화하는 단계와,
    상기 피치 주기로부터 피치 주파수를 산출하는 단계와,
    상기 음성 신호의 스펙트럼 중, 상기 피치 주파수의 정수배의 주파수에 있어서의 스펙트럼에 대해서 부호화를 행하는 단계
    를 구비하는 스케일러블 부호화 방법.
  17. 음성 신호의 피치 주기를 이용해서 부호화된 상기 음성 신호의 제 1 부호화 파라미터를, 상기 피치 주기를 이용해서 복호하는 제 1 복호화 단계와,
    상기 피치 주기로부터 피치 주파수를 산출하는 산출 단계와,
    상기 음성 신호의 스펙트럼 중 일부의 스펙트럼을 부호화하여 얻어지는 제 2 부호화 파라미터로부터 상기 일부의 스펙트럼을 생성하는 생성 단계와,
    상기 산출 단계에 있어서 산출되는 피치 주파수의 정수배의 주파수에, 상기 생성 단계에 있어서 생성되는 스펙트럼을 배치하는 배치 단계
    를 구비하는 스케일러블 복호화 방법.
KR1020077009746A 2004-10-28 2005-10-26 스케일러블 부호화 장치, 스케일러블 복호화 장치 및이러한 방법 KR20070083856A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2004-00314230 2004-10-28
JP2004314230 2004-10-28

Publications (1)

Publication Number Publication Date
KR20070083856A true KR20070083856A (ko) 2007-08-24

Family

ID=36227828

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077009746A KR20070083856A (ko) 2004-10-28 2005-10-26 스케일러블 부호화 장치, 스케일러블 복호화 장치 및이러한 방법

Country Status (9)

Country Link
US (1) US8019597B2 (ko)
EP (1) EP1806736B1 (ko)
JP (1) JP5036317B2 (ko)
KR (1) KR20070083856A (ko)
CN (1) CN101044553B (ko)
AT (1) ATE480851T1 (ko)
BR (1) BRPI0517246A (ko)
DE (1) DE602005023503D1 (ko)
WO (1) WO2006046587A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160100411A (ko) * 2012-05-23 2016-08-23 니폰 덴신 덴와 가부시끼가이샤 부호화 방법, 복호 방법, 주파수 영역 피치 주기 분석 방법, 부호화 장치, 복호 장치, 주파수 영역 피치 주기 분석 장치 및 기록 매체

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7769584B2 (en) 2004-11-05 2010-08-03 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
EP2096632A4 (en) * 2006-11-29 2012-06-27 Panasonic Corp DECODING DEVICE AND AUDIO DECODING METHOD
WO2008072732A1 (ja) * 2006-12-14 2008-06-19 Panasonic Corporation 音声符号化装置および音声符号化方法
WO2008072733A1 (ja) * 2006-12-15 2008-06-19 Panasonic Corporation 符号化装置および符号化方法
WO2008084688A1 (ja) * 2006-12-27 2008-07-17 Panasonic Corporation 符号化装置、復号装置及びこれらの方法
JP5294713B2 (ja) * 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
CN101903944B (zh) * 2007-12-18 2013-04-03 Lg电子株式会社 用于处理音频信号的方法和装置
CN101552005A (zh) * 2008-04-03 2009-10-07 华为技术有限公司 编码方法、解码方法、系统及装置
CN101604983B (zh) * 2008-06-12 2013-04-24 华为技术有限公司 编解码装置、系统及其方法
US8880410B2 (en) 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
CA2729474C (en) * 2008-07-11 2015-09-01 Frederik Nagel Apparatus and method for generating a bandwidth extended signal
US8977546B2 (en) 2009-10-20 2015-03-10 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device and method for both
JP2011253045A (ja) * 2010-06-02 2011-12-15 Sony Corp 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
US10410398B2 (en) * 2015-02-20 2019-09-10 Qualcomm Incorporated Systems and methods for reducing memory bandwidth using low quality tiles

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4809334A (en) * 1987-07-09 1989-02-28 Communications Satellite Corporation Method for detection and correction of errors in speech pitch period estimates
KR940002854B1 (ko) * 1991-11-06 1994-04-04 한국전기통신공사 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JPH0685607A (ja) 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JP3528258B2 (ja) * 1994-08-23 2004-05-17 ソニー株式会社 符号化音声信号の復号化方法及び装置
JPH0955778A (ja) 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
EP0763818B1 (en) * 1995-09-14 2003-05-14 Kabushiki Kaisha Toshiba Formant emphasis method and formant emphasis filter device
JP2778567B2 (ja) 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法
JP3840684B2 (ja) * 1996-02-01 2006-11-01 ソニー株式会社 ピッチ抽出装置及びピッチ抽出方法
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US6345246B1 (en) * 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
US6298322B1 (en) * 1999-05-06 2001-10-02 Eric Lindemann Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal
FR2796189B1 (fr) 1999-07-05 2001-10-05 Matra Nortel Communications Procedes et dispositifs de codage et de decodage audio
KR100474833B1 (ko) * 1999-11-17 2005-03-08 삼성전자주식회사 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치
US6889182B2 (en) 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6633839B2 (en) * 2001-02-02 2003-10-14 Motorola, Inc. Method and apparatus for speech reconstruction in a distributed speech recognition system
JP2002229599A (ja) * 2001-02-02 2002-08-16 Nec Corp 音声符号列の変換装置および変換方法
US6584437B2 (en) * 2001-06-11 2003-06-24 Nokia Mobile Phones Ltd. Method and apparatus for coding successive pitch periods in speech signal
US7260541B2 (en) 2001-07-13 2007-08-21 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
JP2003036097A (ja) * 2001-07-25 2003-02-07 Sony Corp 情報検出装置及び方法、並びに情報検索装置及び方法
KR100880480B1 (ko) * 2002-02-21 2009-01-28 엘지전자 주식회사 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
US7752052B2 (en) * 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation
KR100462611B1 (ko) 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
JP4313993B2 (ja) * 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8352248B2 (en) * 2003-01-03 2013-01-08 Marvell International Ltd. Speech compression method and apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160100411A (ko) * 2012-05-23 2016-08-23 니폰 덴신 덴와 가부시끼가이샤 부호화 방법, 복호 방법, 주파수 영역 피치 주기 분석 방법, 부호화 장치, 복호 장치, 주파수 영역 피치 주기 분석 장치 및 기록 매체
US9947331B2 (en) 2012-05-23 2018-04-17 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program and recording medium
US10083703B2 (en) 2012-05-23 2018-09-25 Nippon Telegraph And Telephone Corporation Frequency domain pitch period based encoding and decoding in accordance with magnitude and amplitude criteria
US10096327B2 (en) 2012-05-23 2018-10-09 Nippon Telegraph And Telephone Corporation Long-term prediction and frequency domain pitch period based encoding and decoding

Also Published As

Publication number Publication date
BRPI0517246A (pt) 2008-10-07
CN101044553B (zh) 2011-06-01
DE602005023503D1 (de) 2010-10-21
WO2006046587A1 (ja) 2006-05-04
EP1806736B1 (en) 2010-09-08
EP1806736A4 (en) 2008-03-19
EP1806736A1 (en) 2007-07-11
JPWO2006046587A1 (ja) 2008-05-22
JP5036317B2 (ja) 2012-09-26
CN101044553A (zh) 2007-09-26
US8019597B2 (en) 2011-09-13
US20090125300A1 (en) 2009-05-14
ATE480851T1 (de) 2010-09-15

Similar Documents

Publication Publication Date Title
JP5036317B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
KR101220621B1 (ko) 부호화 장치 및 부호화 방법
KR101414354B1 (ko) 부호화 장치 및 부호화 방법
KR101363793B1 (ko) 부호화 장치, 복호 장치 및 그 방법
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
US8099275B2 (en) Sound encoder and sound encoding method for generating a second layer decoded signal based on a degree of variation in a first layer decoded signal
KR101340233B1 (ko) 스테레오 부호화 장치, 스테레오 복호 장치 및 스테레오부호화 방법
JP4606418B2 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JP5533502B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP5236040B2 (ja) 符号化装置、復号装置、符号化方法および復号方法
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ
JP2005196029A (ja) 符号化装置及び方法

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid