KR101870962B1 - 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체 - Google Patents

부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체 Download PDF

Info

Publication number
KR101870962B1
KR101870962B1 KR1020187012387A KR20187012387A KR101870962B1 KR 101870962 B1 KR101870962 B1 KR 101870962B1 KR 1020187012387 A KR1020187012387 A KR 1020187012387A KR 20187012387 A KR20187012387 A KR 20187012387A KR 101870962 B1 KR101870962 B1 KR 101870962B1
Authority
KR
South Korea
Prior art keywords
vector
decoding
prediction
code
coefficient
Prior art date
Application number
KR1020187012387A
Other languages
English (en)
Other versions
KR20180050762A (ko
Inventor
타케히로 모리야
유타카 카마모토
노보루 하라다
Original Assignee
니폰 덴신 덴와 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 니폰 덴신 덴와 가부시끼가이샤 filed Critical 니폰 덴신 덴와 가부시끼가이샤
Publication of KR20180050762A publication Critical patent/KR20180050762A/ko
Application granted granted Critical
Publication of KR101870962B1 publication Critical patent/KR101870962B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Abstract

선형 예측 계수로 변환 가능한 계수를 적은 부호량으로 정밀도 좋게 나타낼 수 있는 부호화 및 복호 방법인 예측 대응의 부호화 및 복호 방법과, 현 프레임의 선형 예측 계수 부호가 복호 장치에 올바르게 입력되면, 현 프레임의 선형 예측 계수로 변환 가능한 계수를 올바르게 복호할 수 있는 것 같은 부호화 및 복호 방법을 병용 가능한 부호화 방법 및 복호 방법을 제공한다. 부호화 장치는 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터에 대한, 적어도 과거의 프레임으로부터의 예측을 포함하는 예측 벡터와의 차분으로 이루어지는 차분 벡터를 부호화하여 제1 부호를 얻어, 제1 부호에 대응하는 양자화 차분 벡터를 얻는 예측 대응 부호화부와, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터와, 양자화 차분 벡터와의 차분 또는 차분의 요소의 일부로 이루어지는 보정 벡터를 부호화하여 제2 부호를 생성하는 비예측 대응 부호화부를 포함한다.

Description

부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체{CODING DEVICE, DECODING DEVICE, METHOD, PROGRAM AND RECORDING MEDIUM THEREOF}
본 발명은 선형 예측 계수나 이것으로 변환 가능한 계수의 부호화 기술 및 복호 기술에 관한 것이다.
음성이나 음악 등의 음향 신호의 부호화에서는 입력 음향 신호를 선형 예측 분석하여 얻은 선형 예측 계수를 사용하여 부호화하는 수법이 널리 사용되고 있다.
부호화 처리에서 사용한 선형 예측 계수의 정보를 복호 장치측에서 복호할 수 있도록, 부호화 장치는 선형 예측 계수를 부호화하고, 선형 예측 계수에 대응하는 부호를 복호 장치에 보낸다. 비특허문헌 1에서는 부호화 장치는 선형 예측 계수를 선형 예측 계수와 등가인 주파수 영역의 파라미터인 LSP(Line Spectrum Pair) 파라미터의 열로 변환하고, LSP 파라미터의 열을 부호화하여 얻은 LSP 부호를 복호 장치에 보낸다.
비특허문헌 1에서는 LSP 부호의 부호량을 작게 하기 위해서, 이동 평균 예측(MA 예측)을 사용한 벡터 부호화 및 복호 기술이 사용되고 있다.
우선 부호화 처리의 흐름을 설명한다.
<선형 예측 계수 부호화 장치(80)>
도 1은 종래의 선형 예측 계수 부호화 장치(80)의 구성을 나타낸다.
선형 예측 계수 부호화 장치(80)에는 프레임마다의 LSP(Line Spectrum Pairs) 파라미터 θf[1], θf[2],…, θf[p]가 입력되고, 선형 예측 계수 부호화 장치(80)는 프레임마다 이하의 예측 대응 감산부(83), 벡터 부호화부(84), 지연 입력부(87)의 처리를 행하고, LSP 부호 Cf를 얻어 출력한다. 또한 f는 프레임 번호를, p는 예측 차수를 나타낸다.
선형 예측 계수 부호화 장치(80)에 입력 음향 신호 Xf가 입력되는 경우에는, 선형 예측 계수 부호화 장치(80)에 선형 예측 분석부(81)와 LSP 계산부(82)도 구비하고, 프레임 단위의 입력 음향 신호 Xf가 연속하여 입력되어, 프레임마다 이하의 처리가 행해진다.
이하에서는 각 부의 구체 처리를 설명한다.
<선형 예측 분석부(81)>
선형 예측 분석부(81)는 입력 음향 신호 Xf를 수취하고, 입력 음향 신호 Xf를 선형 예측 분석하여, 선형 예측 계수 af[1], af[2],…, af[p]를 구하여 출력한다. 여기서 af[i]는 f번째의 프레임의 입력 음향 신호 Xf를 선형 예측 분석하여 얻어지는 i차의 선형 예측 계수를 나타낸다.
<LSP 계산부(82)>
LSP 계산부(82)는 선형 예측 계수 af[1], af[2],…, af[p]를 수취하고, 선형 예측 계수 af[1], af[2],…, af[p]로부터 LSP 파라미터 θf[1], θf[2],…, θf[p]를 구하고, 구한 LSP 파라미터를 요소로 하는 벡터인 LSP 파라미터 벡터 Θf=(θf[1], θf[2],…, θf[p])T를 출력한다. 여기서 θf[i]는 f번째의 프레임의 입력 음향 신호 Xf에 대응하는 i차의 LSP 파라미터이다.
<예측 대응 감산부(83)>
예측 대응 감산부(83)는 예를 들면 소정의 계수 α를 기억한 기억부(83c), 예측 대응 평균 벡터 V를 기억한 기억부(83d), 승산부(88), 감산부(83a 및 83b)를 포함하여 구성된다.
예측 대응 감산부(83)는 LSP 파라미터 벡터 Θf와, 앞 프레임 양자화 차분 벡터 ^Sf-1를 수취한다.
예측 대응 감산부(83)는 LSP 파라미터 벡터 Θf로부터 예측 대응 평균 벡터 V와, 벡터 α^Sf-1를 감산한 벡터인 차분 벡터 Sff-V-α×^Sf-1=(sf[1], sf[2],…, sf[p])T를 생성하여 출력한다.
또한 예측 대응 평균 벡터 V=(v[1], v[2],…, v[p])T는 기억부(83d)에 기억된 미리 정한 벡터이며, 예를 들면 미리 학습용의 음향 신호로부터 구해 두면 된다. 예를 들면 선형 예측 계수 부호화 장치(80)에 있어서, 부호화의 대상이 되는 음향 신호와, 동일한 환경(예를 들면 화자, 수음 장치, 장소)에서 수음한 음향 신호를 학습용의 입력 음향 신호로서 사용하여, 다수의 프레임의 LSP 파라미터 벡터를 구하고, 그 평균을 예측 대응 평균 벡터로 한다.
승산부(88)는 기억부(83c)에 기억된 소정의 계수 α를 앞 프레임의 복호 차분 벡터 ^Sf-1에 곱하여 벡터 α×^Sf-1를 얻는다.
또한 도 1에서는 2개의 감산부(83a 및 83b)를 사용하여, 우선 감산부(83a)에 있어서, LSP 파라미터 벡터 Θf로부터 기억부(83d)에 기억된 예측 대응 평균 벡터 V를 감산한 후, 감산부(83b)에 있어서, 벡터 α×^Sf-1를 감산하고 있지만, 이 순서는 반대여도 된다. 또는 예측 대응 평균 벡터 V와 벡터 α×^Sf-1를 가산한 벡터 V+α×^Sf-1를, LSP 파라미터 벡터 Θf로부터 감산함으로써 차분 벡터 Sf를 생성해도 된다.
현재의 프레임의 차분 벡터 Sf는 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터(LSP 파라미터 벡터 Θf)로부터, 적어도 과거의 프레임으로부터의 예측을 포함하는 벡터를 감산하여 얻어지는 벡터라고 해도 된다.
<벡터 부호화부(84)>
벡터 부호화부(84)는 차분 벡터 Sf를 수취하고, 차분 벡터 Sf를 부호화하여, LSP 부호 Cf와 LSP 부호 Cf에 대응하는 양자화 차분 벡터 ^Sf=(^sf[1], ^sf[2],…, ^sf[p])T를 얻어 출력한다. 차분 벡터 Sf의 부호화에는 차분 벡터 Sf를 벡터 양자화하는 방법, 차분 벡터 Sf를 복수의 서브 벡터로 나누어서 서브 벡터 각각을 벡터 양자화하는 방법, 차분 벡터 Sf 또는 서브 벡터를 다단 벡터 양자화하는 방법, 벡터의 요소를 스칼라 양자화하는 방법, 이들을 조합한 방법 등의 주지의 어느 부호화 방법을 사용해도 된다.
여기서는 차분 벡터 Sf를 벡터 양자화하는 방법을 사용하는 경우의 예를 설명한다.
벡터 부호화부(84)는 벡터 부호장(86)에 기억되어 있는 복수의 후보 차분 벡터 중에서, 차분 벡터 Sf에 가장 가까운 후보 차분 벡터를 탐색하여 양자화 차분 벡터 ^Sf로서 출력함과 아울러, 양자화 차분 벡터 ^Sf에 대응하는 차분 벡터 부호를 LSP 부호 Cf로서 출력한다. 또한 양자화 차분 벡터 ^Sf는 후술하는 복호 차분 벡터에 대응한다.
<벡터 부호장(86)>
벡터 부호장(86)에는 각 후보 차분 벡터와 그 각 후보 차분 벡터에 대응하는 차분 벡터 부호가 미리 기억되어 있다.
<지연 입력부(87)>
지연 입력부(87)는 양자화 차분 벡터 ^Sf를 수취하고, 양자화 차분 벡터 ^Sf를 유지하고, 1프레임분 늦추어, 앞 프레임 양자화 차분 벡터 ^Sf-1로서 출력한다. 즉 f번째의 프레임의 양자화 차분 벡터 ^Sf에 대하여 예측 대응 감산부(83)가 처리를 행하고 있을 때에는, f-1번째의 프레임에 대한 양자화 차분 벡터 ^Sf-1를 출력한다.
<선형 예측 계수 복호 장치(90)>
도 2는 종래의 선형 예측 계수 복호 장치(90)의 구성을 나타낸다. 선형 예측 계수 복호 장치(90)에는 프레임 단위의 LSP 부호 Cf가 연속하여 입력되고, 프레임 단위로 LSP 부호 Cf를 복호하여 복호 예측 대응 LSP 파라미터 벡터 ^Θf=(^θf[1], ^θf[2],…, ^θf[p])를 얻는다.
이하에서는 각 부의 구체 처리를 설명한다.
<벡터 복호부(91)>
벡터 복호부(91)는 LSP 부호 Cf를 수취하고, LSP 부호 Cf를 복호하여, LSP 부호 Cf에 대응하는 복호 차분 벡터 ^Sf를 얻어 출력한다. LSP 부호 Cf의 복호에는 부호화 장치의 벡터 부호화부(84)의 부호화 방법에 대응하는 복호 방법을 사용한다.
여기서는 벡터 부호화부(84)의 차분 벡터 Sf를 벡터 양자화하는 방법에 대응하는 복호 방법을 사용하는 경우의 예를 설명한다.
벡터 복호부(91)는 벡터 부호장(92)에 기억되어 있는 차분 벡터 부호 중에서, LSP 부호 Cf에 대응하는 복수의 차분 벡터 부호를 탐색하고, 그 차분 벡터 부호에 대응하는 후보 차분 벡터를 복호 차분 벡터 ^Sf로서 출력한다. 또한 복호 차분 벡터 ^Sf는 상기 서술한 양자화 차분 벡터 ^Sf에 대응하고, 전송 오류나 부호화, 복호의 과정에서 오류 등이 없으면, 대응하는 요소는 동일한 값이 된다.
<벡터 부호장(92)>
벡터 부호장(92)에는 각 후보 차분 벡터와 그 각 후보 차분 벡터에 대응하는 차분 벡터 부호가 미리 기억되어 있다. 또한 벡터 부호장(92)은 상기 서술한 선형 예측 계수 부호화 장치(80)의 벡터 부호장(86)과 공통의 정보를 포함한다.
<지연 입력부(93)>
지연 입력부(93)는 복호 차분 벡터 ^Sf를 수취하고, 복호 차분 벡터 ^Sf를 유지하고, 1프레임분 늦추어, 앞 프레임 복호 차분 벡터 ^Sf-1로서 출력한다. 즉 f번째의 프레임의 복호 차분 벡터 ^Sf에 대하여 예측 대응 가산부(95)가 처리를 행하고 있을 때에는, f-1번째의 프레임의 복호 차분 벡터 ^Sf-1를 출력한다.
<예측 대응 가산부(95)>
예측 대응 가산부(95)는 예를 들면 소정의 계수 α를 기억한 기억부(95c), 예측 대응 평균 벡터 V를 기억한 기억부(95d), 승산부(94), 가산부(95a 및 95b)를 포함하여 구성된다.
예측 대응 가산부(95)는 현재의 프레임의 복호 차분 벡터 ^Sf와 앞 프레임 복호 차분 벡터 ^Sf-1를 수취한다.
예측 대응 가산부(95)는 복호 차분 벡터 ^Sf와, 예측 대응 평균 벡터 V=(v[1], v[2],…, v[N])T와, 벡터 α×^Sf-1를 가산한 벡터인 복호 예측 대응 LSP 파라미터 벡터 ^Θf(= ^Sf+V+α^Sf-1)를 생성하여 출력한다.
승산부(94)는 기억부(95c)에 기억된 소정의 계수 α를 앞 프레임 복호 차분 벡터 ^Sf-1에 곱하여 벡터 α×^Sf-1를 얻는다.
도 2에서는 2개의 가산부(95a 및 95b)를 사용하여, 우선 가산부(95a)에 있어서, 현재의 프레임의 복호 차분 벡터 ^Sf에 벡터 α×^Sf-1를 가산한 후, 가산부(95b)에 있어서 예측 대응 평균 벡터 V를 가산하고 있지만, 이 순서는 반대여도 된다. 또는 벡터 α×^Sf-1와 예측 대응 평균 벡터 V를 가산한 벡터를 복호 차분 벡터 ^Sf에 가산함으로써 복호 예측 대응 LSP 파라미터 벡터 ^Θf를 생성해도 된다.
또한 여기서 사용하는 예측 대응 평균 벡터 V는 상기 서술한 선형 예측 계수 부호화 장치(80)의 예측 대응 감산부(83)에서 사용한 예측 대응 평균 벡터 V와 동일한 것으로 한다.
<복호 예측 대응 선형 예측 계수 계산부(96)>
선형 예측 계수가 필요한 경우에는, 선형 예측 계수 복호 장치(90)에 복호 예측 대응 선형 예측 계수 계산부(96)를 구비해도 된다. 이 경우는 복호 예측 대응 선형 예측 계수 계산부(96)는 복호 예측 대응 LSP 파라미터 벡터 ^Θf를 수취하고, 복호 예측 대응 LSP 파라미터 벡터 ^Θf를 복호 예측 대응 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]로 변환하여 출력한다.
비특허문헌 1의 선형 예측 계수 복호 장치에서는 f-1번째의 프레임의 복호 결과인 복호 차분 벡터 ^Sf-1를 사용하여 f번째의 프레임의 복호 처리를 행하기 때문에, 현 프레임의 LSP 부호에 전송 오류가 생긴 경우 뿐만아니라, 1개 앞의 프레임의 LSP 부호에 전송 오류가 생긴 경우에도, 현 프레임의 LSP 파라미터도 올바르게 복호할 수 없게 되어버린다는 문제가 있다.
비특허문헌 1의 선형 예측 계수 복호 장치에서는 복호에 의해 얻어진 LSP 파라미터는 선형 예측 합성에만 사용되기 때문에, LSP 파라미터를 올바르게 복호할 수 없었다고 해도, 연속하는 복수의 프레임에서 복호 음향 신호의 음질이 열화하는 정도의 문제로 끝난다. 즉 비특허문헌 1의 선형 예측 계수 부호화 장치와 선형 예측 계수 복호 장치는 LSP 파라미터를 올바르게 복호할 수 없었던 경우의 문제보다, LSP 파라미터를 적은 부호량으로 나타내는 것을 우선한 구성이라고 할 수 있다.
그러나 선형 예측 계수 부호화 장치 및 선형 예측 계수 복호 장치는 LSP 파라미터를 선형 예측 분석 및 합성에 사용할 뿐만아니라, LSP 파라미터로부터 구해진 스펙트럼 포락을 구성하는 각 진폭값에 의존한 가변 길이 부호화 및 복호에도 사용하는 부호화 장치 및 복호 장치에도 이용된다. 이 경우는 1개의 프레임에서 LSP 파라미터를 올바르게 복호할 수 없었을 때에는, 그 프레임을 포함하는 연속하는 복수의 프레임에서 가변 길이 복호를 올바르게 행할 수 없고 복호 음향 신호를 얻을 수 없다는 문제가 생긴다.
이와 같은 문제를 감안하여, 본 발명에서는 예를 들면 선형 예측 분석 및 합성에 사용하는 것 같은 선형 예측 계수로 변환 가능한 계수를 적은 부호량으로 정밀도 좋게 나타낼 수 있는 부호화 방법 및 복호 방법인 예측 대응의 부호화 방법 및 복호 방법과, 예를 들면 LSP 파라미터로부터 구해진 스펙트럼 포락을 구성하는 각 진폭값에 의존한 가변 길이 부호화/복호에 사용하는 것 같은 앞의 프레임의 선형 예측 계수로 변환 가능한 계수에 대응하는 부호인 선형 예측 계수 부호(예를 들면 LSP 부호)가 선형 예측 계수 복호 장치에 올바르게 입력되지 않았다고 해도, 현 프레임의 선형 예측 계수 부호가 선형 예측 계수 복호 장치에 올바르게 입력되면, 현 프레임의 선형 예측 계수로 변환 가능한 계수를 올바르게 복호할 수 있는 것 같은 부호화 방법 및 복호 방법을 병용 가능한 선형 예측 계수로 변환 가능한 계수의 부호화 방법 및 복호 방법을 제공하는 것을 목적으로 한다.
상기한 과제를 해결하기 위해서, 본 발명의 하나의 태양에 의하면, 부호화 장치는 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터에 대한, 적어도 과거의 프레임으로부터의 예측을 포함하는 예측 벡터와의 차분으로 이루어지는 차분 벡터를 부호화하여 제1 부호를 얻어, 제1 부호에 대응하는 양자화 차분 벡터를 얻는 예측 대응 부호화부와, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터와, 양자화 차분 벡터와의 차분 또는 차분의 요소의 일부로 이루어지는 보정 벡터를 부호화하여 제2 부호를 생성하는 비예측 대응 부호화부를 포함한다.
상기한 과제를 해결하기 위해서, 본 발명의 다른 태양에 의하면, 부호화 장치는 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터와, 적어도 과거의 프레임으로부터의 예측과 미리 정한 벡터로 이루어지는 예측 벡터와의 차분으로 이루어지는 차분 벡터를 부호화하여 제1 부호를 얻어, 제1 부호에 대응하는 양자화 차분 벡터를 얻는 예측 대응 부호화부와, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터로부터 양자화 차분 벡터와 미리 정한 벡터를 감산하여 얻어지는 차분 또는 차분의 요소의 일부로 이루어지는 보정 벡터를 부호화하여 제2 부호를 생성하는 비예측 대응 부호화부를 포함한다.
상기한 과제를 해결하기 위해서, 본 발명의 다른 태양에 의하면, 복호 장치는 제1 부호를 복호하여 복호 차분 벡터를 얻어, 복호 차분 벡터와, 적어도 과거의 프레임으로부터의 예측을 포함하는 예측 벡터를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제1 복호 벡터를 생성하는 예측 대응 복호부와, 제2 부호를 복호하여 복호 보정 벡터를 얻어, 복호 보정 벡터와, 적어도 복호 차분 벡터와의 대응하는 차수의 요소끼리를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제2 복호 벡터를 생성하는 비예측 대응 복호부를 포함한다.
상기한 과제를 해결하기 위해서, 본 발명의 다른 태양에 의하면, 복호 장치는 제1 부호를 복호하여 복호 차분 벡터를 얻어, 복호 차분 벡터와, 적어도 과거의 프레임으로부터의 예측과 미리 정한 벡터로 이루어지는 예측 벡터를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제1 복호 벡터를 생성하는 예측 대응 복호부와, 제2 부호를 복호하여 복호 보정 벡터를 얻어, 복호 보정 벡터에, 적어도 복호 차분 벡터와 미리 정한 벡터를 대응하는 차수의 요소마다 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제2 복호 벡터를 생성하는 비예측 대응 복호부를 포함한다.
상기한 과제를 해결하기 위해서, 본 발명의 다른 태양에 의하면, 부호화 방법은 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터에 대한, 적어도 과거의 프레임으로부터의 예측을 포함하는 예측 벡터와의 차분으로 이루어지는 차분 벡터를 부호화하여 제1 부호를 얻어, 제1 부호에 대응하는 양자화 차분 벡터를 얻는 예측 대응 부호화 스텝과, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터와, 양자화 차분 벡터와의 차분 또는 차분의 요소의 일부로 이루어지는 보정 벡터를 부호화하여 제2 부호를 생성하는 비예측 대응 부호화 스텝을 포함한다.
상기한 과제를 해결하기 위해서, 본 발명의 다른 태양에 의하면, 부호화 방법은 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터와, 적어도 과거의 프레임으로부터의 예측과 미리 정한 벡터로 이루어지는 예측 벡터와의 차분으로 이루어지는 차분 벡터를 부호화하여 제1 부호를 얻어, 제1 부호에 대응하는 양자화 차분 벡터를 얻는 예측 대응 부호화 스텝과, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수에 의한 벡터로부터 양자화 차분 벡터와 미리 정한 벡터를 감산하여 얻어지는 차분 또는 차분의 요소의 일부로 이루어지는 보정 벡터를 부호화하여 제2 부호를 생성하는 비예측 대응 부호화 스텝을 포함한다.
상기한 과제를 해결하기 위해서, 본 발명의 다른 태양에 의하면, 복호 방법은 제1 부호를 복호하여 복호 차분 벡터를 얻어, 복호 차분 벡터와, 적어도 과거의 프레임으로부터의 예측을 포함하는 예측 벡터를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제1 복호 벡터를 생성하는 예측 대응 복호 스텝과, 제2 부호를 복호하여 복호 보정 벡터를 얻어, 복호 보정 벡터와, 적어도 복호 차분 벡터와의 대응하는 차수의 요소끼리를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제2 복호 벡터를 생성하는 비예측 대응 복호 스텝을 포함한다.
상기한 과제를 해결하기 위해서, 본 발명의 다른 태양에 의하면, 복호 방법은 제1 부호를 복호하여 복호 차분 벡터를 얻어, 복호 차분 벡터와, 적어도 과거의 프레임으로부터의 예측과 미리 정한 벡터로 이루어지는 예측 벡터를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제1 복호 벡터를 생성하는 예측 대응 복호 스텝과, 제2 부호를 복호하여 복호 보정 벡터를 얻어, 복호 보정 벡터에, 적어도 복호 차분 벡터와 미리 정한 벡터를 대응하는 차수의 요소마다 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제2 복호 벡터를 생성하는 비예측 대응 복호 스텝을 포함한다.
본 발명에 의하면, 선형 예측 계수로 변환 가능한 계수를 적은 부호량으로 정밀도 좋게 나타낼 수 있는 부호화 방법 및 복호 방법인 예측 대응의 부호화 방법 및 복호 방법과, 앞의 프레임의 선형 예측 계수 부호가 선형 예측 계수 복호 장치에 올바르게 입력되지 않았다고 해도, 현 프레임의 선형 예측 계수 부호가 선형 예측 계수 복호 장치에 올바르게 입력되면, 현 프레임의 선형 예측 계수로 변환 가능한 계수를 올바르게 복호할 수 있는 것 같은 부호화 방법 및 복호 방법을 병용할 수 있는 효과를 나타낸다.
도 1은 종래의 선형 예측 계수 부호화 장치의 구성을 나타내는 도면.
도 2는 종래의 선형 예측 계수 복호 장치의 구성을 나타내는 도면.
도 3은 제1 실시형태에 따른 선형 예측 계수 부호화 장치의 기능 블록도.
도 4는 제1 실시형태에 따른 선형 예측 계수 부호화 장치의 처리 플로우의 예를 나타내는 도면.
도 5는 제1 실시형태에 따른 선형 예측 계수 복호 장치의 기능 블록도.
도 6은 제1 실시형태에 따른 선형 예측 계수 복호 장치의 처리 플로우의 예를 나타내는 도면.
도 7은 제2 실시형태에 따른 선형 예측 계수 부호화 장치의 기능 블록도.
도 8은 제2, 제3 실시형태에 따른 선형 예측 계수 부호화 장치의 처리 플로우의 예를 나타내는 도면.
도 9는 제2 실시형태에 따른 선형 예측 계수 복호 장치의 기능 블록도.
도 10은 제2, 제3 실시형태에 따른 선형 예측 계수 복호 장치의 처리 플로우의 예를 나타내는 도면.
도 11은 제3 실시형태에 따른 선형 예측 계수 부호화 장치의 기능 블록도.
도 12는 제3 실시형태에 따른 선형 예측 계수 복호 장치의 기능 블록도.
도 13은 제4 실시형태에 따른 부호화 장치의 기능 블록도.
도 14는 제4 실시형태에 따른 부호화 장치의 처리 플로우의 예를 나타내는 도면.
이하, 본 발명의 실시형태에 대해서 설명한다. 또한 이하의 설명에 사용하는 도면에서는 동일한 기능을 가지는 구성부나 동일한 처리를 행하는 스텝에는 동일한 부호를 기재하고, 중복 설명을 생략한다. 이하의 설명에 있어서, 텍스트 중에서 사용하는 기호 「^」, 「~」, 「-」 등은 본래 바로 뒤의 문자의 바로 위에 기재되어야 할 것이지만, 텍스트 기법의 제한에 의해, 당해 문자의 바로 앞에 기재한다. 식 중에 있어서는 이들 기호는 본래의 위치에 기술하고 있다. 또 벡터나 행렬의 각 요소 단위에서 행해지는 처리는 특별히 언급이 없는 한 그 벡터나 그 행렬의 모든 요소에 대하여 적용되는 것으로 한다.
<제1 실시형태>
이하, 종래의 선형 예측 계수 부호화 장치 및 선형 예측 계수 복호 장치와 상이한 점을 중심으로 설명한다.
<제1 실시형태에 따른 선형 예측 계수 부호화 장치(100)>
도 3은 제1 실시형태에 따른 선형 예측 계수 부호화 장치(100)의 기능 블록도를, 도 4는 그 처리 플로우의 예를 나타낸다.
선형 예측 계수 부호화 장치(100)는 선형 예측 분석부(81)와 LSP 계산부(82)와 예측 대응 부호화부(120)와 비예측 대응 부호화부(110)를 포함한다. 선형 예측 분석부(81)와 LSP 계산부(82)에 있어서의 처리는 종래기술에서 설명한 내용과 동일하며, 도 4의 s81~s82에 대응한다.
선형 예측 계수 부호화 장치(100)는 음향 신호 Xf를 수취하고, LSP 부호 Cf 및 보정 LSP 부호 Df를 얻어 출력한다. 선형 예측 계수 부호화 장치(100)로부터 출력된 부호는 선형 예측 계수 복호 장치(200)에 입력된다. 또한 음향 신호 Xf에 유래하는 LSP 파라미터 벡터 Θf=(θf[1], θf[2],…, θf[p])T가 다른 장치에 의해 생성되어 있고, 선형 예측 계수 부호화 장치(100)의 입력이 LSP 파라미터 벡터 Θf인 경우에는, 선형 예측 계수 부호화 장치(100)는 선형 예측 분석부(81)와 LSP 계산부(82)를 포함하지 않아도 된다.
<예측 대응 부호화부(120)>
예측 대응 부호화부(120)는 예측 대응 감산부(83)와 벡터 부호화부(84)와 벡터 부호장(86)과 지연 입력부(87)를 포함하고, 각 부에 있어서의 처리는 종래기술에서 설명한 내용과 동일하다. 예측 대응 감산부(83)와 벡터 부호화부(84)와 지연 입력부(87)에 있어서의 처리는 각각 도 4의 s83~s87에 대응한다. 단, 벡터 부호화부(84)는 양자화 차분 벡터 ^Sf를 지연 입력부(87) 뿐만아니라 비예측 대응 부호화부(110)에도 출력한다.
예측 대응 부호화부(120)는 LSP 파라미터 벡터 Θf를 수취하고, LSP 파라미터 벡터 Θf와, 적어도 과거의 프레임으로부터의 예측을 포함하는 예측 벡터와의 차분으로 이루어지는 차분 벡터 Sf를 부호화하여, LSP 부호 Cf와 LSP 부호 Cf에 대응하는 양자화 차분 벡터 ^Sf를 얻어(s120) 출력한다. 또한 LSP 부호 Cf에 대응하는 양자화 차분 벡터 ^Sf는 차분 벡터 Sf의 각 요소값에 대응하는 양자화값으로 이루어지는 벡터이다.
여기서, 적어도 과거의 프레임으로부터의 예측을 포함하는 예측 벡터는 예를 들면 미리 정한 예측 대응 평균 벡터 V와, 1개 앞의 프레임의 양자화 차분 벡터(앞 프레임 양자화 차분 벡터) ^Sf-1의 각 요소에 미리 정한 α를 승산하여 얻어지는 벡터를 가산하여 얻어지는 벡터 V+α×^Sf-1이다. 이 예에서는 예측 벡터에 포함되는 과거의 프레임으로부터의 예측분을 나타내는 벡터는 앞 프레임 양자화 차분 벡터 ^Sf-1의 α배인 α×^Sf-1이다.
또한 예측 대응 부호화부(120)는 LSP 파라미터 벡터 Θf 이외에 외부로부터의 입력을 필요로 하지 않으므로, LSP 파라미터 벡터 Θf를 부호화하여 LSP 부호 Cf를 얻고 있다고 해도 된다.
또 예측 대응 부호화부(120)에서는 생성하고 있지 않지만, 예측 대응 부호화부(120)에 있어서의 LSP 파라미터 벡터 Θf의 각 요소를 양자화하여 얻어지는 예측 대응 양자화 LSP 파라미터 벡터 ^Θf는 양자화 차분 벡터 ^Sf에 예측 벡터 V+α×^Sf-1를 가산한 것이라고 할 수 있다. 즉 예측 대응 양자화 LSP 파라미터 벡터는 ^Θf=^Sf+V+α×^Sf-1이다. 또 예측 대응 부호화부(120)에 있어서의 양자화 오차 벡터는 Θf-^Θff- (^Sf+V+α×^Sf-1)이다.
<비예측 대응 부호화부(110)>
비예측 대응 부호화부(110)는 비예측 대응 감산부(111)와 보정 벡터 부호화부(112)와 보정 벡터 부호장(113)을 포함한다.
비예측 대응 부호화부(110)는 LSP 파라미터 벡터 Θf와 양자화 차분 벡터 ^Sf를 수취하고, LSP 파라미터 벡터 Θf와 양자화 차분 벡터 ^Sf의 차분인 보정 벡터를 부호화하여 보정 LSP 부호 Df를 얻어(s110) 출력한다.
여기서, 보정 벡터는 Θf-^Sf이며, 예측 대응 부호화부(120)의 양자화 오차 벡터는 Θf-^Θff-(^Sf+V+α×^Sf-1)이므로, 보정 벡터는 예측 대응 부호화부(120)의 양자화 오차 벡터 Θf-^Θf와 예측 대응 평균 벡터 V와 α배를 승산한 앞 프레임 양자화 차분 벡터 α×^Sf-1를 가산한 것이다. 즉 비예측 대응 부호화부(110)는 양자화 오차 벡터 Θf-^Θf와 예측 벡터 V+α×^Sf-1를 가산한 것을 부호화하여 보정 LSP 부호 Df를 얻고 있다고도 할 수 있다.
보정 벡터 Θf-^Sf의 부호화에는 주지의 부호화 방법의 어느 것을 사용해도 되는데, 이하의 설명에서는 보정 벡터 Θf-^Sf로부터 비예측 대응 평균 벡터 Y를 감산한 것을 벡터 양자화하는 방법에 대해서 설명한다. 또한 이하의 설명에서는 보정 벡터 Θf-^Sf로부터 비예측 대응 평균 벡터 Y를 감산하여 얻어지는 벡터인 Uff-Y-^Sf를 편의적으로 보정 벡터라고 부르고 있다.
이하, 각 부의 처리에 대해서 설명한다.
<비예측 대응 감산부(111)>
비예측 대응 감산부(111)는 예를 들면 비예측 대응 평균 벡터 Y를 기억한 기억부(111c), 감산부(111a 및 111b)를 포함하여 구성된다.
비예측 대응 감산부(111)는 LSP 계산부(82)로부터 출력된 LSP 파라미터 벡터 Θf=(θf[1], θf[2],…, θf[p])T와, 양자화 차분 벡터 ^Sf를 수취한다.
비예측 대응 감산부(111)는 LSP 파라미터 벡터 Θf=(θf[1], θf[2],…, θf[p])T로부터, 양자화 차분 벡터 ^Sf=(^sf[1], ^sf[2],…, ^sf[p])T와, 비예측 대응 평균 벡터 Y=(y[1], y[2],…, y[p])T를 감산하여 얻어지는 벡터인 보정 벡터 Uff-Y-^Sf를 생성하여(s111) 출력한다.
또한 도 3에서는 2개의 감산부(111a 및 111b)를 사용하여, 우선 감산부(111a)에 있어서 LSP 파라미터 벡터 Θf로부터 기억부(111c)에 기억된 비예측 대응 평균 벡터 Y를 감산한 후, 감산부(111b)에 있어서 양자화 차분 벡터 ^Sf를 감산하고 있지만, 이들 감산의 순서는 반대여도 된다. 또는 비예측 대응 평균 벡터 Y와 양자화 차분 벡터 ^Sf를 가산한 벡터를, LSP 파라미터 벡터 Θf로부터 감산함으로써 보정 벡터 Uf를 생성해도 된다.
또한 비예측 대응 평균 벡터 Y는 미리 정한 벡터이며, 예를 들면 미리 학습용의 음향 신호로부터 구해 두면 된다. 예를 들면 대응하는 선형 예측 계수 부호화 장치(100)에 있어서, 부호화의 대상이 되는 음향 신호와, 동일한 환경(예를 들면 화자, 수음 장치, 장소)에서 수음한 음향 신호를 학습용의 입력 음향 신호로서 사용하여, 다수의 프레임의 LSP 파라미터 벡터와 그 LSP 파라미터 벡터에 대한 양자화 차분 벡터와의 차분을 구하고, 그 차분의 평균을 비예측 대응 평균 벡터로 한다.
<보정 벡터 부호장(113)>
보정 벡터 부호장(113)에는 각 후보 보정 벡터와 그 각 후보 보정 벡터에 대응하는 보정 벡터 부호가 기억되어 있다.
<보정 벡터 부호화부(112)>
보정 벡터 부호화부(112)는 보정 벡터 Uf를 수취하고, 보정 벡터 Uf를 부호화하여 보정 LSP 부호 Df를 얻어(s112) 출력한다. 예를 들면 보정 벡터 부호화부(112)는 보정 벡터 부호장(113)에 기억되어 있는 복수의 후보 보정 벡터 중에서, 보정 벡터 Uf에 가장 가까운 후보 보정 벡터를 탐색하고, 그 후보 보정 벡터에 대응하는 보정 벡터 부호를 보정 LSP 부호 Df로서 출력한다. 또한 보정 벡터 부호화부(112)에서는 실제로는 생성하지 않아도 되지만, 보정 벡터 Uf에 가장 가까운 후보 보정 벡터를 양자화 완료 보정 벡터 ^Uf로 하여 이하의 설명을 행한다.
또한 상기 서술한 바와 같이, 보정 벡터는 예측 대응 부호화부(120)의 앞 프레임으로부터의 예측분인 앞 프레임 양자화 차분 벡터 ^Sf-1를 적어도 포함하므로, 보정 벡터 부호화부(112)는 적어도 예측 대응 부호화부(120)의 앞 프레임으로부터의 예측분을 부호화한다고도 할 수 있다.
또 비예측 대응 부호화부(110)에서는 생성하지 않아도 되지만, 비예측 대응 부호화부(110)에 있어서의 LSP 파라미터 벡터 Θf의 각 요소를 양자화하여 얻어지는 비예측 대응 양자화 LSP 파라미터 벡터 ^Φf는 비예측 대응 평균 벡터 Y와 양자화 차분 벡터 ^Sf와 양자화 완료 보정 벡터 ^Uf를 가산한 것이다. 즉 ^Φf=^Uf+Y+^Sf이다.
<제1 실시형태에 따른 선형 예측 계수 복호 장치(200)>
이하, 종래와 상이한 점을 중심으로 설명한다.
도 5는 제1 실시형태에 따른 선형 예측 계수 복호 장치(200)의 기능 블록도를, 도 6은 그 처리 플로우의 예를 나타낸다.
선형 예측 계수 복호 장치(200)는 예측 대응 복호부(220)와 비예측 대응 복호부(210)를 포함한다.
선형 예측 계수 복호 장치(200)는 LSP 부호 Cf와 보정 LSP 부호 Df를 수취하고, 복호 예측 대응 LSP 파라미터 벡터 ^Θ=(^θf[1], ^θf[2],…, ^θf[p])와 복호 비예측 대응 LSP 파라미터 벡터 ^Φf=(^φf[1], ^φf[2],…, ^φf[p])를 생성하여 출력한다. 또 필요에 따라 복호 예측 대응 LSP 파라미터 ^θf[1], ^θf[2],…, ^θf[p]와 복호 비예측 대응 LSP 파라미터 ^φf[1], ^φf[2],…, ^φf[p]의 각각을 선형 예측 계수로 변환하여 얻어지는 복호 예측 대응 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]와 복호 비예측 대응 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]를 생성하여 출력한다.
<예측 대응 복호부(220)>
예측 대응 복호부(220)는 종래기술의 선형 예측 계수 복호 장치(90)와 마찬가지의 구성이며, 벡터 부호장(92)과 벡터 복호부(91)와 지연 입력부(93)와 예측 대응 가산부(95)를 포함하고, 필요에 따라 복호 예측 대응 선형 예측 계수 계산부(96)도 포함한다. 벡터 복호부(91)와 지연 입력부(93)와 예측 대응 가산부(95)와 복호 예측 대응 선형 예측 계수 계산부(96)에 있어서의 처리는 각각 도 6의 s91~s96에 대응한다.
예측 대응 복호부(220)는 LSP 부호 Cf를 수취하고, LSP 부호 Cf를 복호하여 복호 차분 벡터 ^Sf를 얻어, 복호 차분 벡터 ^Sf와 적어도 과거의 프레임으로부터의 예측을 포함하는 예측 벡터를 가산하여, LSP 파라미터 벡터의 각 요소의 복호값 ^θf[1], ^θf[2],…, ^θf[p]으로 이루어지는 복호 예측 대응 LSP 파라미터 벡터 ^Θf=(^θf[1], ^θf[2],…, ^θf[p])를 생성하여(s220) 출력한다. 예측 대응 복호부(220)는 필요에 따라 또한 복호 예측 대응 LSP 파라미터 벡터 ^Θf를 복호 예측 대응 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]로 변환하여(s220) 출력한다.
본 실시형태에서는 예측 벡터는 미리 정한 예측 대응 평균 벡터 V와, 과거의 프레임의 복호 차분 벡터 ^Sf-1의 α배를 가산하여 얻어지는 벡터(V+α×^Sf-1)이다.
또한 벡터 복호부(91)는 복호 차분 벡터 ^Sf를 지연 입력부(93), 예측 대응 가산부(95)에 더해, 비예측 대응 복호부(210)의 비예측 대응 가산부(213)에도 출력한다.
<비예측 대응 복호부(210)>
비예측 대응 복호부(210)는 보정 벡터 부호장(212)과 보정 벡터 복호부(211)와 비예측 대응 가산부(213)를 포함하고, 필요에 따라 복호 비예측 대응 선형 예측 계수 계산부(214)도 포함한다.
비예측 대응 복호부(210)에는 보정 LSP 부호 Df와 복호 차분 벡터 ^Sf가 입력된다. 비예측 대응 복호부(210)는 보정 LSP 부호 Df를 복호하여 복호 보정 벡터 ^Uf=(^uf[1], ^uf[2],…, ^uf[p])T를 얻는다. 비예측 대응 복호부(210)는 또한 복호 보정 벡터 ^Uf에 적어도 복호 차분 벡터 ^Sf를 가산하여, 현재의 프레임의 LSP 파라미터 벡터의 각 요소의 복호값 ^φf[1], ^φf[2],…, ^φf[p]으로 이루어지는 복호 비예측 대응 LSP 파라미터 벡터 ^Φf=(^φf[1], ^φf[2],…, ^φf[p])를 생성하여(s210) 출력한다. 비예측 대응 복호부(210)는 필요에 따라 또한 복호 비예측 대응 LSP 파라미터 벡터 ^Φf를 복호 비예측 대응 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]로 변환하여(s210) 출력한다.
본 실시형태에서는 복호 비예측 대응 LSP 파라미터 벡터 ^Φf는 보정 LSP 부호 Df를 복호하여 얻어지는 복호 보정 벡터 ^Uf에, LSP 부호 Cf를 복호하여 얻어지는 복호 차분 벡터 ^Sf와, 미리 정한 비예측 대응 평균 벡터 Y를 가산하여 얻어지는 벡터이다. 즉 비예측 대응 복호부(210)에서는 현 프레임에서 입력된 부호만으로부터 현 프레임의 LSP 파라미터 벡터의 복호 벡터 ^Φf를 얻고 있게 된다.
이하, 각 부의 처리 내용을 설명한다.
<보정 벡터 부호장(212)>
보정 벡터 부호장(212)은 선형 예측 계수 부호화 장치(100) 내의 보정 벡터 부호장(113)과 동일한 내용의 정보를 기억하고 있다. 즉 보정 벡터 부호장(212)에는 각 후보 보정 벡터와 그 각 후보 보정 벡터에 대응하는 보정 벡터 부호가 기억되어 있다.
<보정 벡터 복호부(211)>
보정 벡터 복호부(211)는 보정 LSP 부호 Df를 수취하고, 보정 LSP 부호 Df를 복호하여 복호 보정 벡터 ^Uf를 얻어(s211) 출력한다. 예를 들면 보정 벡터 복호부(211)는 보정 벡터 부호장(212)에 기억되어 있는 복수의 보정 벡터 부호 중에서, 선형 예측 계수 복호 장치(200)에 입력된 보정 LSP 부호 Df에 대응하는 보정 벡터 부호를 탐색하고, 탐색된 보정 벡터 부호에 대응하는 후보 보정 벡터를 복호 보정 벡터 ^Uf로서 출력한다.
<비예측 대응 가산부(213)>
비예측 대응 가산부(213)는 예를 들면 비예측 대응 평균 벡터 Y를 기억한 기억부(213c), 가산부(213a 및 213b)를 포함하여 구성된다.
비예측 대응 가산부(213)는 복호 보정 벡터 ^Uf와 복호 차분 벡터 ^Sf를 수취한다. 비예측 대응 가산부(213)는 복호 보정 벡터 ^Uf와 복호 차분 벡터 ^Sf와 기억부(213c)에 기억된 비예측 대응 평균 벡터 Y를 가산하여 얻어지는 복호 비예측 대응 LSP 파라미터 벡터 ^Φf=^Uf+Y+^Sf=(^φf[1], ^φf[2],…, ^φf[p])를 생성하여(s213) 출력한다. 또한 도 5에서는 2개의 가산부(213a 및 213b)를 사용하여, 우선 가산부(213a)에 있어서 복호 보정 벡터 ^Uf에 복호 차분 벡터 ^Sf를 가산한 후, 가산부(213b)에 있어서 기억부(213c)에 기억된 비예측 대응 평균 벡터 Y를 가산하고 있지만, 이들 가산의 순서는 반대여도 된다. 또는 비예측 대응 평균 벡터 Y와 복호 차분 벡터 ^Sf를 가산한 벡터를 복호 보정 벡터 ^Uf에 가산함으로써 복호 비예측 대응 LSP 파라미터 벡터 ^Φf를 생성해도 된다.
또한 여기서 사용하는 비예측 대응 평균 벡터 Y는 상기 서술한 선형 예측 계수 부호화 장치(100)의 비예측 대응 감산부(111)에서 사용한 비예측 대응 평균 벡터 Y와 동일한 것으로 한다.
<복호 비예측 대응 선형 예측 계수 계산부(214)>
복호 비예측 대응 선형 예측 계수 계산부(214)는 복호 비예측 대응 LSP 파라미터 벡터 ^Φf를 수취한다. 복호 비예측 대응 선형 예측 계수 계산부(214)는 복호 비예측 대응 LSP 파라미터 벡터 ^Φf를 복호 비예측 대응 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]로 변환하여(s214) 출력한다.
<제1 실시형태의 효과>
제1 실시형태의 선형 예측 계수 복호 장치에 의하면, f-1번째의 프레임의 LSP 부호 Cf-1에 전송 오류가 생겨 복호 차분 벡터 ^Sf-1를 올바르게 복호할 수 없었다고 해도, 비예측 대응 복호부(210)에서 복호 차분 벡터 ^Sf-1에 의존하지 않는 LSP 파라미터 벡터의 복호값인 복호 비예측 대응 LSP 파라미터 벡터 ^Φf를 얻을 수 있으므로, f-1번째의 프레임의 LSP 부호 Cf-1의 전송 오류를 f번째의 프레임의 복호 비예측 대응 LSP 파라미터 벡터 ^Φf에 영향을 주지 못하게 할 수 있다. 예를 들면 LSP 파라미터 벡터로부터 구해진 스펙트럼 포락을 구성하는 각 진폭값에 의존한 가변 길이 부호화/복호에 사용하는 LSP 파라미터 벡터로서 비예측 대응 양자화 LSP 파라미터 벡터/복호 비예측 대응 LSP 파라미터 벡터 ^Φf를 사용하는 경우이면, f-1번째의 프레임에서 올바른 복호 비예측 대응 LSP 파라미터 벡터 ^Φf가 얻어지지 않고 가변 길이 복호를 올바르게 행할 수 없었다고 해도, f번째의 프레임에서는 올바른 복호 비예측 대응 LSP 파라미터 벡터 ^Φf가 얻어져, 가변 길이 복호를 올바르게 행할 수 있다.
또한 보정 벡터는 LSP 파라미터 벡터만큼 정밀도 좋게(양자화 오차가 작아지도록) 양자화될 필요는 없기 때문에, 보정 벡터 부호장(113)에 준비해 두는 후보 보정 벡터의 종류는 적어도 된다. 예를 들면 보정 벡터 부호의 비트 길이는 2bit이며, 보정 벡터 부호장(113)에는 4종류의 보정 벡터 부호(「00」 「01」 「10」 「11」)에 대응하는 4종류의 후보 보정 벡터가 격납되어 있다.
그 때문에 보정 벡터 부호장에 준비해 두는 후보 보정 벡터의 종류를 적게 할 수 있고, 작은 부호량의 부호를 할당할 수 있다. 따라서, 적은 부호량의 증가로 종래보다 왜곡이 작은 부호화 및 복호를 실현할 수 있다.
<변형예>
본 실시형태에서는 LSP 파라미터에 대해서 기재하고 있지만, 복수차의 선형 예측 계수로 변환 가능한 계수이면, 다른 계수를 사용해도 된다. PARCOR 계수나, LSP 파라미터 또는 PARCOR 계수를 변형한 계수, 또한 선형 예측 계수 자체를 대상으로 해도 된다. 이들 모든 계수는 음성 부호화의 기술분야에서는 서로 변환 가능한 것이며, 어느 계수를 사용해도 제1 실시형태의 효과를 얻을 수 있다. 또한 LSP 부호 Cf 또는 LSP 부호 Cf에 대응하는 부호를 제1 부호라고도 하고, 예측 대응 부호화부를 제1 부호화부라고도 한다. 마찬가지로 보정 LSP 부호 또는 보정 LSP 부호에 대응하는 부호를 제2 부호라고도 하고, 비예측 대응 부호화부를 제2 부호화부라고도 한다. 또 복호 예측 대응 LSP 파라미터 벡터 ^Θf 또는 복호 예측 대응 LSP 파라미터 벡터 ^Θf에 대응하는 벡터를 제1 복호 벡터라고도 하고, 예측 대응 복호부를 제1 복호부라고도 한다. 또 복호 비예측 대응 LSP 파라미터 벡터 ^Φf 또는 복호 비예측 대응 LSP 파라미터 벡터 ^Φf에 대응하는 벡터를 제2 복호 벡터라고도 하고, 비예측 대응 복호부를 제2 복호부라고도 한다.
본 실시형태에서는 「과거의 프레임」으로서 1프레임분만을 이용하고 있지만, 필요에 따라 적당히 2프레임분 이상을 이용해도 된다.
<제2 실시형태>
제1 실시형태와 상이한 부분을 중심으로 설명한다.
본 실시형태에서는 보정 벡터를 부호화할지 여부, 및 보정 LSP 부호를 복호할지 여부를 스펙트럼 포락의 진폭의 요철의 변화의 크기, 바꾸어 말하면 스펙트럼 포락의 산곡(山谷)의 크기를 이용하여 결정한다.
스펙트럼 포락의 진폭의 요철의 변화의 크기에 상관없이 LSP 파라미터를 동일한 부호량으로 부호화하면, 스펙트럼 포락의 진폭의 요철의 변화가 큰 쪽이 스펙트럼 포락의 진폭의 요철의 변화가 작을 때보다 양자화 오차는 크다. 그래서 LSP의 양자화 오차가 크다고 생각되는 경우에만, 선형 예측 계수 부호화 장치는 보정 벡터 부호화부를 실행하여 보정 LSP 부호 Df를 출력하고, 선형 예측 계수 복호 장치는 보정 LSP 부호 Df를 복호함으로써, 제1 실시형태보다 전체로서 부호량을 삭감하면서, 종래기술보다는 부호의 전송 오류에 의한 음질 열화가 적은 부호화 및 복호 처리를 행할 수 있다.
<제2 실시형태에 따른 선형 예측 계수 부호화 장치(300)>
도 7은 제2 실시형태에 따른 선형 예측 계수 부호화 장치(300)의 기능 블록도를, 도 8은 그 처리 플로우의 예를 나타낸다.
제2 실시형태의 선형 예측 계수 부호화 장치(300)는 비예측 대응 부호화부(110) 대신에 비예측 대응 부호화부(310)를 포함한다. 제1 실시형태의 선형 예측 계수 부호화 장치(100)와 마찬가지로, 음향 신호 Xf에 유래하는 LSP 파라미터 θ가 다른 장치에 의해 생성되어 있고, 선형 예측 계수 부호화 장치(300)의 입력이 LSP 파라미터 θf[1], θf[2],…, θf[p]인 경우에는, 선형 예측 계수 부호화 장치(300)는 선형 예측 분석부(81)와 LSP 계산부(82)를 포함하지 않아도 된다.
비예측 대응 부호화부(310)는 비예측 대응 감산부(311)와 보정 벡터 부호화부(312)와 보정 벡터 부호장(113)과 예측 대응 가산부(314)와 지표 계산부(315)를 포함한다. 지표 계산부(315)의 계산 결과에 따라, 비예측 대응 감산부(311)에 있어서 감산 처리를 실행할지 여부, 및 보정 벡터 부호화부(312)에 있어서 부호화 처리를 실행할지 여부가 결정되는 점이 상이하다.
또한 예측 대응 부호화부(120)는 양자화 차분 벡터 ^Sf에 더해, 승산부(88)의 출력값인 벡터 α×^Sf-1를 출력한다.
<예측 대응 가산부(314)>
예측 대응 가산부(314)는 예를 들면 예측 대응 평균 벡터 V를 기억한 기억부(314c), 가산부(314a 및 314b)를 포함하여 구성된다.
예측 대응 가산부(314)는 현재의 프레임의 양자화 차분 벡터 ^Sf 및 앞 프레임 양자화 차분 벡터 ^Sf-1에 소정의 계수 α를 곱한 벡터 α×^Sf-1를 수취한다.
예측 대응 가산부(314)는 양자화 차분 벡터 ^Sf와, 예측 대응 평균 벡터 V와, 벡터 α×^Sf-1를 가산한 벡터인 예측 대응 양자화 LSP 파라미터 벡터 ^Θf(=^Sf+V+α^Sf-1)=(^θf[1], ^θf[2],…, ^θf[p])T를 생성하여(s314) 출력한다.
도 7에서는 2개의 가산부(314a 및 314b)를 사용하여, 우선 가산부(314b)에 있어서 현재의 프레임의 양자화 차분 벡터 ^Sf에 벡터 α×^Sf-1를 가산한 후, 가산부(314)a에 있어서 예측 대응 평균 벡터 V를 가산하고 있지만, 이 순서는 반대여도 된다. 또는 벡터 α×^Sf-1와 예측 대응 평균 벡터 V를 가산한 벡터를 양자화 차분 벡터 ^Sf에 가산함으로써 예측 대응 양자화 LSP 파라미터 벡터 ^Θf를 생성해도 된다.
또한 예측 대응 가산부(314)에 입력되는 현재의 프레임의 양자화 차분 벡터 ^Sf, 앞 프레임 양자화 차분 벡터 ^Sf-1에 소정의 계수 α를 곱한 벡터 α×^Sf-1는 모두 예측 대응 부호화부(120)에서도 생성된 것이며, 예측 대응 가산부(314) 내의 기억부(314c)에 기억되어 있는 예측 대응 평균 벡터 V는 예측 대응 부호화부(120) 내의 기억부(83d)에 기억되어 있는 예측 대응 평균 벡터 V와 동일하므로, 예측 대응 가산부(314)가 행하는 처리를 예측 대응 부호화부(120)가 행하여 예측 대응 양자화 LSP 파라미터 벡터 ^Θf를 생성하여 비예측 대응 부호화부(310)에 출력하고, 비예측 대응 부호화부(310)에는 예측 대응 가산부(314)를 구비하지 않는 구성으로 해도 된다.
<지표 계산부(315)>
지표 계산부(315)는 예측 대응 양자화 LSP 파라미터 벡터 ^Θf를 수취한다. 지표 계산부(315)는 예측 대응 양자화 LSP 파라미터 벡터 ^Θf를 사용하여, 예측 대응 양자화 LSP 파라미터 벡터 ^Θf에 대응하는 스펙트럼 포락의 산곡의 크기에 대응하는 지표 Q, 즉 스펙트럼 포락의 산곡이 클수록 커지는 지표 Q, 및/또는 스펙트럼 포락의 산곡의 작음에 대응하는 지표 Q', 즉 스펙트럼 포락의 산곡이 클수록 작아지는 지표 Q'를 계산한다(s315). 지표 계산부(315)는 지표 Q 및/또는 Q'의 크기에 따라, 보정 벡터 부호화부(312)에 부호화 처리를 실행하도록, 또는 소정의 비트수로 부호화 처리를 실행하도록 제어 신호 C를 출력한다. 또 지표 계산부(315)는 지표 Q 및/또는 Q'의 크기에 따라, 비예측 대응 감산부(311)에 감산 처리를 실행하도록 제어 신호 C를 출력한다. 이하에 제어 신호 C의 생성 방법을 설명한다.
일반적으로 LSP 파라미터는 입력 음향 신호의 파워 스펙트럼 포락과 상관성이 있는 주파수 영역의 파라미터열이며, LSP 파라미터의 각 값은 입력 음향 신호의 파워 스펙트럼 포락의 극값의 주파수 위치와 상관한다. LSP 파라미터를 θ[1], θ[2],…, θ[p]로 했을 때, θ[i]와 θ[i+1] 사이의 주파수 위치에 파워 스펙트럼 포락의 극값이 존재하고, 이 극값의 주변의 접선의 경사가 급준할수록 θ[i]와 θ[i+1]의 간격(즉 (θ[i+1]-θ[i])의 값)이 작아진다. 즉 파워 스펙트럼 포락의 진폭의 요철이 급준할수록 각 i에 대해서 θ[i]와 θ[i+1]의 간격이 불균일하게 된다, 즉 LSP 파라미터의 간격의 분산이 커진다. 반대로 파워 스펙트럼 포락의 요철이 거의 없는 경우는, 각 i에 대해서 θ[i]와 θ[i+1]의 간격이 균등 간격에 가까워진다, 즉 LSP 파라미터의 간격의 분산이 작아진다.
따라서 LSP 파라미터의 간격의 분산에 대응하는 지표가 큰 것은, 파워 스펙트럼 포락의 진폭의 요철의 변화가 큰 것을 의미한다. 또 LSP 파라미터의 간격의 최소값에 대응하는 지표가 작은 것은, 파워 스펙트럼 포락의 진폭의 요철의 변화가 큰 것을 의미한다.
예측 대응 양자화 LSP 파라미터 ^θf[1], ^θf[2],…, ^θf[p]는 LSP 파라미터 θf[1], θf[2],…, θf[p]를 양자화하여 얻어진 것이며, 복호 예측 대응 LSP 파라미터 ^θf[1], ^θf[2],…, ^θf[p]는 LSP 부호 Cf가 선형 예측 부호화 장치로부터 선형 예측 복호 장치에 오류 없이 입력되어 있으면 예측 대응 양자화 LSP 파라미터 ^θf[1], ^θf[2],…, ^θf[p]와 동일하므로, 예측 대응 양자화 LSP 파라미터 ^θf[1], ^θf[2],…, ^θf[p]나 복호 예측 대응 LSP 파라미터 ^θf[1], ^θf[2],…, ^θf[p]에 대해서도 LSP 파라미터 θf[1], θf[2],…, θf[p]와 마찬가지의 성질이 성립한다.
그 때문에 예측 대응 양자화 LSP 파라미터 ^θf[1], ^θf[2],…, ^θf[p]의 간격의 분산에 대응하는 값을 스펙트럼 포락의 산곡이 클수록 커지는 지표 Q로 하고, 예측 대응 양자화 LSP 파라미터 벡터 ^Θf=(^θf[1], ^θf[2],…, ^θf[p]) 중의 차수가 인접하는 예측 대응 양자화 LSP 파라미터의 차분(^θf[i+1]-^θf[i])의 최소값을 스펙트럼 포락의 산곡이 클수록 작아지는 지표 Q'로 하여 각각 사용할 수 있다.
스펙트럼 포락의 산곡이 클수록 커지는 지표 Q는 예를 들면 소정의 차수 T(T≤p) 이하의 예측 대응 양자화 LSP 파라미터 벡터 ^Θf의 요소인 예측 대응 양자화 LSP 파라미터의 간격의 분산을 나타내는 지표 Q, 즉
[수 1]
Figure 112018042847121-pat00001
에 의해 계산한다.
또 스펙트럼 포락의 산곡이 클수록 작아지는 지표 Q'는 예를 들면 소정의 차수 T(T≤p) 이하의 예측 대응 양자화 LSP 파라미터 벡터 ^Θf의 차수가 인접하는 예측 대응 양자화 LSP 파라미터의 간격의 최소값을 나타내는 지표 Q', 즉
[수 2]
Figure 112018042847121-pat00002
에 의해 계산한다.
또는 예측 대응 양자화 LSP 파라미터 벡터 ^Θf의 차수가 인접하는 예측 대응 양자화 완료 LSP 파라미터의 간격, 및 최저차의 예측 대응 양자화 LSP 파라미터의 값 중 최소값을 나타내는 지표 Q'
[수 3]
Figure 112018042847121-pat00003
에 의해 계산한다. LSP 파라미터는 0 내지 π의 사이에 차수순으로 존재하는 파라미터이므로, 이 식의 최저차의 예측 대응 양자화 LSP 파라미터 ^θf[1]는 ^θf[1]와 0과의 간격(^θf[1]-0)을 의미한다.
지표 계산부(315)는 스펙트럼 포락의 산곡이 소정의 기준보다 큰 경우, 즉 상기한 예에서는 (A-1) 지표 Q가 소정의 역치 Th1 이상인 경우, 및/또는 (B-1) 지표 Q'가 소정의 역치 Th1' 이하인 경우, 비예측 대응 감산부(311) 및 보정 벡터 부호화부(312)에 보정 부호화 처리를 실행하는 것을 나타내는 제어 신호 C를 출력하고, 그 이외의 경우에 비예측 대응 감산부(311) 및 보정 벡터 부호화부(312)에 보정 부호화 처리를 실행하지 않는 것을 나타내는 제어 신호 C를 출력한다. 여기서 「(A-1)의 경우 및/또는 (B-1)의 경우」는 지표 Q만을 구하여 (A-1)의 조건을 만족하는 경우, 지표 Q'만을 구하여 (B-1)의 조건을 만족하는 경우, 지표 Q와 지표 Q'의 양쪽을 구하여 (A-1)과 (B-1)의 양쪽의 조건을 만족하는 경우의 3가지의 경우를 포함하는 표현이다. 물론 (A-1)의 조건을 만족하는지 여부를 판정하는 경우라고 해도 지표 Q'를 구해도 되고, (B-1)의 조건을 만족하는지 여부를 판정하는 경우라고 해도 지표 Q를 구해도 된다. 이하의 기재 중의 「및/또는」에 대해서도 마찬가지이다.
또 지표 계산부(315)는 (A-1) 및/또는 (B-1)의 경우에, 소정의 비트수를 나타내는 정의 정수(또는 정의 정수를 나타내는 부호)를 제어 신호 C로서 출력하고, 그 이외의 경우에 0를 제어 신호 C로서 출력하는 구성으로 해도 된다.
또한 비예측 대응 감산부(311)에 있어서, 제어 신호 C를 수취했을 때에 감산 처리를 실행하고, 보정 벡터 부호화부(312)에 있어서, 제어 신호 C를 수취했을 때에 부호화 처리를 실행하는 구성으로 하고 있는 경우에는, (A-1) 및/또는 (B-1) 이외의 경우에, 지표 계산부(315)는 제어 신호 C를 출력하지 않는 구성으로 해도 된다.
<비예측 대응 감산부(311)>
비예측 대응 감산부(311)는 제어 신호 C와 LSP 파라미터 벡터 Θf=(θf[1], θf[2],…, θf[p])T와 양자화 차분 벡터 ^Sf를 수취한다.
비예측 대응 감산부(311)는 보정 부호화 처리를 실행하는 것을 나타내는 제어 신호 C나, 정의 정수(또는 정의 정수를 나타내는 부호)를 제어 신호 C로서 수취한 경우, 요컨대 스펙트럼 포락의 산곡이 소정의 기준보다 큰 경우, 즉 상기한 예에서는 (A-1) 및/또는 (B-1)의 경우에, LSP 파라미터 벡터 Θf=(θf[1], θf[2],…, θf[p])T로부터, 양자화 차분 벡터 ^Sf-1와, 비예측 대응 평균 벡터 Y=(y[1], y[2],…, y[p])T를 감산하여 얻어지는 벡터인 보정 벡터 Uff-Y-^Sf를 생성하여(s311) 출력한다.
<보정 벡터 부호화부(312)>
보정 벡터 부호화부(312)는 제어 신호 C와 보정 벡터 Uf를 수취한다. 보정 부호화 처리를 실행하는 것을 나타내는 제어 신호 C나, 정의 정수(또는 정의 정수를 나타내는 부호)를 제어 신호 C로서 수취한 경우, 요컨대 스펙트럼 포락의 산곡이 소정의 기준보다 큰 경우, 즉 상기한 예에서는 (A-1) 및/또는 (B-1)의 경우에, 보정 벡터 부호화부(312)는 보정 벡터 Uf를 부호화하여 보정 LSP 부호 Df를 얻어(s312) 출력한다. 보정 벡터 Uf를 부호화하는 부호화 처리 자체는 보정 벡터 부호화부(112)와 마찬가지이다.
보정 부호화 처리를 실행하지 않는 것을 나타내는 제어 신호 C나, 0를 제어 신호 C로서 수취한 경우, 요컨대 스펙트럼 포락의 산곡이 소정의 기준보다 크지 않은 경우, 즉 상기한 예에서는 (A-1) 및/또는 (B-1) 이외의 경우에, 보정 벡터 부호화부(312)는 보정 벡터 Uf의 부호화를 행하지 않고, 보정 LSP 부호 Df를 얻지 않고 출력하지 않는다.
<제2 실시형태에 따른 선형 예측 계수 복호 장치(400)>
도 9는 제2 실시형태에 따른 선형 예측 계수 복호 장치(400)의 기능 블록도를, 도 10은 그 처리 플로우의 예를 나타낸다.
제2 실시형태의 선형 예측 계수 복호 장치(400)는 비예측 대응 복호부(210) 대신에 비예측 대응 복호부(410)를 포함한다.
비예측 대응 복호부(410)는 보정 벡터 부호장(212)과 보정 벡터 복호부(411)와 비예측 대응 가산부(413)와 지표 계산부(415)를 포함하고, 필요에 따라 복호 비예측 대응 선형 예측 계수 계산부(214)도 포함한다.
지표 계산부(415)의 계산 결과에 따라, 비예측 대응 가산부(413)에 있어서 가산 처리를 실행할지 여부, 및 보정 벡터 복호부(411)에 있어서 복호 처리를 실행할지 여부가 결정되는 점이 상이하다.
<지표 계산부(415)>
지표 계산부(415)는 복호 예측 대응 LSP 파라미터 벡터 ^Θf를 수취하고, 복호 예측 대응 LSP 파라미터 벡터 ^Θf=(^θf[1], ^θf[2],…, ^θf[p])T에 대응하는 스펙트럼 포락의 산곡의 크기에 대응하는 지표 Q, 즉 스펙트럼 포락의 산곡이 클수록 커지는 지표 Q, 및/또는 스펙트럼 포락의 산곡의 작음에 대응하는 지표 Q', 즉 스펙트럼 포락의 산곡이 클수록 작아지는 지표 Q'를 계산한다(s415). 지표 계산부(415)는 지표 Q 및/또는 Q'의 크기에 따라, 보정 벡터 복호부(411) 및 비예측 대응 가산부(413)에 보정 복호 처리를 실행하는/하지 않는 것을 나타내는 제어 신호 C를, 또는 소정의 비트수로 보정 복호 처리를 실행하는 것을 나타내는 제어 신호 C를 출력한다. 지표 Q 및 Q'는 지표 계산부(315)에서 설명한 것과 마찬가지이며, 예측 대응 양자화 LSP 파라미터 벡터 ^Θf 대신에 복호 예측 대응 LSP 파라미터 벡터 ^Θf를 사용하여, 지표 계산부(315)와 마찬가지의 방법으로 계산하면 된다.
지표 계산부(415)는 스펙트럼 포락의 산곡이 소정의 기준보다 큰 경우, 즉 상기한 예에서는 (A-1) 지표 Q가 소정의 역치 Th1 이상인 경우, 및/또는 (B-1) 지표 Q'가 소정의 역치 Th1'이하인 경우, 비예측 대응 가산부(413) 및 보정 벡터 복호부(411)에 보정 복호 처리를 실행하는 것을 나타내는 제어 신호 C를 출력하고, 그 이외의 경우에 비예측 대응 가산부(413) 및 보정 벡터 복호부(411)에 보정 복호 처리를 실행하지 않는 것을 나타내는 제어 신호 C를 출력한다.
또 지표 계산부(415)는 (A-1) 및/또는 (B-1)의 경우에, 소정의 비트수를 나타내는 정의 정수(또는 정의 정수를 나타내는 부호)를 제어 신호 C로서 출력하고, 그 이외의 경우에 0를 제어 신호 C로서 출력하는 구성으로 해도 된다.
또한 보정 벡터 복호부(411) 및 비예측 대응 가산부(413)에 있어서, 제어 신호 C를 수취했을 때에, 보정 복호 처리를 실행하는 것을 식별하는 구성으로 하고 있는 경우에는, (A-1) 및/또는 (B-1) 이외의 경우에, 지표 계산부(415)는 제어 신호 C를 출력하지 않는 구성으로 해도 된다.
<보정 벡터 복호부(411)>
보정 벡터 복호부(411)는 보정 LSP 부호 Df와 제어 신호 C를 수취한다. 보정 복호 처리를 실행하는 것을 나타내는 제어 신호 C나, 정의 정수(또는 정의 정수를 나타내는 부호)를 제어 신호 C로서 수취한 경우, 요컨대 스펙트럼 포락의 산곡이 소정의 기준보다 큰 경우, 즉 상기한 예에서는 (A-1) 및/또는 (B-1)의 경우에, 보정 벡터 부호장(212)을 참조하여, 보정 LSP 부호 Df를 복호하여 복호 보정 벡터 ^Uf를 얻어(s411) 출력한다. 보정 LSP 부호 Df를 복호하는 복호 처리 자체는 보정 벡터 복호부(211)와 마찬가지이다.
보정 벡터 복호부(411)는 보정 복호 처리를 실행하지 않는 것을 나타내는 제어 신호 C나, 0를 제어 신호 C로서 수취한 경우, 요컨대 스펙트럼 포락의 산곡이 소정의 기준보다 크지 않은 경우, 즉 상기한 예에서는 (A-1) 및/또는 (B-1) 이외의 경우에, 보정 LSP 부호 Df의 복호를 행하지 않고, 복호 보정 벡터 ^Uf를 얻지 않고 출력하지 않는다.
<비예측 대응 가산부(413)>
비예측 대응 가산부(413)는 예를 들면 비예측 대응 평균 벡터 Y를 기억한 기억부(413c), 가산부(413a 및 413b)를 포함하여 구성된다.
비예측 대응 가산부(413)는 제어 신호 C와 복호 차분 벡터 ^Sf를 수취한다. 보정 복호 처리를 실행하는 것을 나타내는 제어 신호 C나, 정의 정수(또는 정의 정수를 나타내는 부호)를 제어 신호 C로서 수취한 경우, 요컨대 스펙트럼 포락의 산곡이 소정의 기준보다 큰 경우, (A-1) 및/또는 (B-1)의 경우에는, 또한 복호 보정 벡터 ^Uf도 수취한다. 그리고 비예측 대응 가산부(413)는 복호 보정 벡터 ^Uf에, 복호 차분 벡터 ^Sf와, 기억부(413c)에 기억된 비예측 대응 평균 벡터 Y를 가산하여 얻어지는 복호 비예측 대응 LSP 파라미터 벡터 ^Φf=^Uf+Y+^Sf를 생성하여(s413) 출력한다. 또한 도 9에서는 2개의 가산부(413a 및 413b)를 사용하여, 우선 가산부(413)a에 있어서 복호 보정 벡터 ^Uf에 복호 차분 벡터 ^Sf를 가산한 후, 가산부(413b)에 있어서 기억부(413c)에 기억된 비예측 대응 평균 벡터 Y를 가산하고 있지만, 이들 가산의 순서는 반대여도 된다. 또는 비예측 대응 평균 벡터 Y와 복호 차분 벡터 ^Sf를 가산한 벡터를 복호 보정 벡터 ^Uf에 가산함으로써 복호 비예측 대응 LSP 파라미터 벡터 ^Φf를 생성해도 된다.
비예측 대응 가산부(413)는 보정 복호 처리를 실행하지 않는 것을 나타내는 제어 신호 C나, 0를 제어 신호 C로서 수취한 경우, 요컨대 스펙트럼 포락의 산곡이 소정의 기준보다 크지 않은 경우, 즉 상기한 예에서는 (A-1) 및/또는 (B-1) 이외의 경우, 즉 복호 보정 벡터 ^Uf를 수취하지 않은 경우에는, 복호 비예측 대응 LSP 파라미터 벡터 ^Φf=Y+^Sf를 생성하여(s413) 출력한다.
또한 여기서 사용하는 비예측 대응 평균 벡터 Y는 상기 서술한 선형 예측 계수 부호화 장치(300)의 비예측 대응 감산부(311)에서 사용한 비예측 대응 평균 벡터 Y와 동일한 것으로 한다.
<제2 실시형태의 효과>
이와 같은 구성에 의해, f-1번째의 프레임의 LSP 부호 Cf-1의 전송 오류를 f번째의 프레임의 복호 비예측 대응 LSP 파라미터 벡터 ^Φf에 영향을 주지 못하게 하는 것에 더해, 스펙트럼 포락의 산곡이 큰 경우에는, 비예측 대응 평균 벡터 Y와 복호 차분 벡터 ^Sf에 보정 LSP 부호 Df를 복호하여 얻어지는 복호 보정 벡터 ^Uf를 더함으로써 양자화 오차가 적은 복호 비예측 대응 LSP 파라미터 벡터 ^Φf를 얻음과 아울러, 스펙트럼 포락의 산곡이 크지 않은 경우에는, 보정 LSP 부호 Df가 불필요한 비예측 대응 평균 벡터 Y와 복호 차분 벡터 ^Sf를 더한 것을 복호 비예측 대응 LSP 파라미터 벡터 ^Φf로 함으로써, 보정 LSP 부호 Df분의 부호량을 적게 할 수 있다. 즉 제1 실시형태의 부호화 및 복호보다는 전체로서 부호량을 삭감하면서, 종래기술보다는 앞의 프레임의 부호의 전송 오류에 의한 음질 열화가 적은 부호화 및 복호 처리를 행할 수 있다.
<변형예>
제1 실시형태의 변형예에서 설명한 바와 같이, LSP 파라미터 대신에 선형 예측 계수로 변환 가능한 계수이면, 다른 계수를 사용해도 된다. PARCOR 계수나, LSP 파라미터나 PARCOR 계수의 어느 하나를 변형한 계수, 또한 선형 예측 계수 자체를 대상으로 해도 된다. 이하, PARCOR 계수 kf[1], kf[2],…, kf[p]를 사용한 경우에 대해서 설명한다.
LSP 파라미터 벡터 Θf에 대응하는 스펙트럼 포락의 산곡의 크기가 클수록 PARCOR 계수에 의해 구해지는
[수 4]
Figure 112018042847121-pat00004
의 값이 작아지는 것을 알고 있다. 따라서 PARCOR 계수를 사용하는 경우에는, 지표 계산부(315)는 양자화된 PARCOR 계수 ^kf[1], ^kf[2],…, ^kf[p]를 수취하고, 스펙트럼 포락의 산곡의 작음에 대응하는 지표 Q'를
[수 5]
Figure 112018042847121-pat00005
에 의해 계산한다(s315). 지표 계산부(315)는 지표 Q'의 크기에 따라, 보정 벡터 부호화부(312) 및 비예측 대응 감산부(311)에 보정 부호화 처리를 실행하는/하지 않는 것을 나타내는 제어 신호 C, 또는 소정의 비트수를 나타내는 정의 정수 또는 0인 제어 신호 C를 출력한다. 지표 계산부(415)도 마찬가지로, 지표 Q'의 크기에 따라, 보정 벡터 복호부(411) 및 비예측 대응 가산부(413)에 보정 복호 처리를 실행하는/하지 않는 것을 나타내는 제어 신호 C, 또는 소정의 비트수를 나타내는 정의 정수 또는 0인 제어 신호 C를 출력한다.
지표 계산부(315) 및 지표 계산부(415)는 제어 신호 C 대신에 지표 Q 및/또는 지표 Q'를 출력하는 구성으로 해도 된다. 그 경우, 지표 Q 및/또는 지표 Q'의 크기에 따라, 보정 벡터 부호화부(312) 및 보정 벡터 복호부(411)에서 각각 부호화 처리 및 복호 처리를 실행할지 여부를 판단하면 된다. 또 마찬가지로 지표 Q 및/또는 지표 Q'의 크기에 따라, 비예측 대응 감산부(311) 및 비예측 대응 가산부(413)에서 각각 감산 처리를 실행할지 여부, 어떠한 가산 처리를 실행할지를 판단하면 된다. 보정 벡터 부호화부(312), 보정 벡터 복호부(411), 비예측 대응 감산부(311) 및 비예측 대응 가산부(413)에 있어서의 판단은 상기한 지표 계산부(315) 및 지표 계산부(415)에 있어서 설명한 것과 동일한 판단이다.
<제3 실시형태>
제2 실시형태와 상이한 부분을 중심으로 설명한다.
보정 벡터 부호장에 격납되어 있는 후보 보정 벡터의 수가 많은 것은, 그 만큼 높은 근사 정밀도로 부호화를 행할 수 있는 것을 의미한다. 그래서 본 실시형태에서는 LSP 부호의 전송 오류에 기인하는 복호 정밀도의 저하의 영향이 클수록, 보다 높은 정밀도의 보정 벡터 부호장을 사용하여 보정 벡터 부호화부 및 보정 벡터 복호부를 실행한다.
<제3 실시형태에 따른 선형 예측 계수 부호화 장치(500)>
도 11은 제3 실시형태의 선형 예측 계수 부호화 장치(500)의 기능 블록도를, 도 8은 그 처리 플로우의 예를 나타낸다.
제3 실시형태의 선형 예측 계수 부호화 장치(500)는 비예측 대응 부호화부(310) 대신에 비예측 대응 부호화부(510)를 포함한다.
비예측 대응 부호화부(510)는 비예측 대응 감산부(311)와 보정 벡터 부호화부(512)와 보정 벡터 부호장(513A 및 513B)과 예측 대응 가산부(314)와 지표 계산부(315)를 포함한다. 제1, 2 실시형태의 선형 예측 계수 부호화 장치(100, 300)와 마찬가지로, 음향 신호 Xf에 유래하는 LSP 파라미터 θ가 다른 장치에 의해 생성되어 있고, 선형 예측 계수 부호화 장치(500)의 입력이 LSP 파라미터 θf[1], θf[2],…, θf[p]인 경우에는, 선형 예측 계수 부호화 장치(500)는 선형 예측 분석부(81)와 LSP 계산부(82)를 포함하지 않아도 된다.
제3 실시형태의 선형 예측 계수 부호화 장치(500)는 복수의 보정 벡터 부호장을 구비하고, 보정 벡터 부호화부(512)에서는 지표 계산부(315)로 계산된 지표 Q 및/또는 Q'에 따라 어느 1개의 보정 벡터 부호장을 선택하여 부호화를 행하는 점이 제2 실시형태와 상이하다.
이하에서는 2종류의 보정 벡터 부호장(513A 및 513B)을 가지는 경우를 예로 설명한다.
보정 벡터 부호장(513A 및 513B)은 격납되어 있는 후보 보정 벡터의 총 수가 상이하다. 후보 보정 벡터의 총 수가 많은 것은, 대응하는 보정 벡터 부호의 비트수가 큰 것을 의미한다. 반대로 말하면, 보정 벡터 부호의 비트수를 크게 하면, 보다 많은 후보 보정 벡터를 준비할 수 있다. 예를 들면 보정 벡터 부호의 비트수를 A로 하면 최대 2A개의 후보 보정 벡터를 준비할 수 있다.
이하에서는 보정 벡터 부호장(513A) 쪽이 보정 벡터 부호장(513B)보다 격납되어 있는 후보 보정 벡터의 총 수가 많은 것으로 하여 설명을 행한다. 바꾸어 말하면, 보정 벡터 부호장(513A)에 기억되어 있는 부호의 부호 길이(평균 부호 길이) 쪽이 보정 벡터 부호장(513B)에 기억되어 있는 부호의 부호 길이(평균 부호 길이)보다 크다. 예를 들면 보정 벡터 부호장(513A)에는 부호 길이가 A비트의 보정 벡터 부호와 후보 보정 벡터와의 세트가 2A개 격납되어 있고, 보정 벡터 부호장(513B)에는 부호 길이가 B비트(B<A)의 보정 벡터 부호와 후보 보정 벡터와의 세트가 2B개(2B<2A) 격납되어 있다.
또한 본 실시형태에서는 제2 실시형태의 변형예의 부분에서 설명한 바와 같이, 지표 계산부는 제어 신호 C 대신에 지표 Q 및/또는 지표 Q'를 출력하고, 지표 Q 및/또는 지표 Q'의 크기에 따라, 보정 벡터 부호화부 및 보정 벡터 복호부에서 각각 어떠한 부호화 및 복호를 행할지를 판단한다. 단, 제2 실시형태와 같이, 지표 계산부가 어떠한 부호화 및 복호를 행할지를 판단하고, 제어 신호 C를 출력하는 구성으로 해도 된다. 또한 비예측 대응 감산부(311) 및 비예측 대응 가산부(413)에서는 제2 실시형태의 변형예의 부분에서 설명한 바와 같이, 지표 Q 및/또는 지표 Q'의 크기에 따라, 각각 감산 처리를 행할지 여부, 어떠한 가산 처리를 행할지를 판단한다.
<보정 벡터 부호화부(512)>
보정 벡터 부호화부(512)는 지표 Q 및/또는 지표 Q'와 보정 벡터 Uf를 수취한다. 보정 벡터 부호화부(512)는 (A-2) 지표 Q가 클수록 및/또는 (B-2) 지표 Q'가 작을수록 비트수가 많은(부호 길이가 큰) 보정 LSP 부호 Df를 얻어(s512) 출력한다. 예를 들면 소정의 역치 Th2 및/또는 소정의 역치 Th2'를 사용하여, 이하와 같이 부호화를 행한다. 또한 보정 벡터 부호화부(512)가 부호화 처리를 실행하는 것은 지표 Q가 소정의 역치 Th1 이상인 경우, 및/또는 지표 Q'가 소정의 역치 Th1' 이하인 경우이므로, Th2는 Th1보다 큰 값이며, Th2'는 Th1'보다 작은 값이다.
(A-5) 지표 Q가 소정의 역치 Th2 이상인 경우, 및/또는 (B-5) 지표 Q'가 소정의 역치 Th2' 이하인 경우, 보정 LSP 부호 Df의 비트수로서 정의 정수인 A가 설정되는 것으로 하고, 보정 벡터 부호화부(512)는 비트수(부호 길이) A의 보정 벡터 부호와 후보 보정 벡터와의 세트를 2A개 기억하고 있는 보정 벡터 부호장(513A)을 참조하여, 보정 벡터 Uf를 부호화하여 보정 LSP 부호 Df를 얻어(s512) 출력한다.
(A-6) 지표 Q가 소정의 역치 Th2보다 작고 또한 지표 Q가 소정의 역치 Th1 이상인 경우, 및/또는 (B-6) 지표 Q'가 소정의 역치 Th2'보다 크고 또한 지표 Q'가 소정의 역치 Th1' 이하인 경우, 보정 LSP 부호 Df의 비트수로서 비트수 A 미만의 정의 정수인 B가 설정되는 것으로 하고, 보정 벡터 부호화부(512)는 비트수(부호 길이) B의 보정 벡터 부호와 후보 보정 벡터와의 세트를 2B개 기억하고 있는 보정 벡터 부호장(513B)을 참조하여, 보정 벡터 Uf를 부호화하여 보정 LSP 부호 Df를 얻어(s512) 출력한다.
(C-6) 그 이외의 경우, 보정 LSP 부호 Df의 비트수로서 0가 설정되는 것으로 하고, 보정 벡터 부호화부(512)는 보정 벡터 Uf를 부호화하지 않고, 보정 LSP 부호 Df를 얻지 않고 출력하지 않는다.
따라서 제3 실시형태의 보정 벡터 부호화부(512)는 지표 계산부(315)로 계산된 지표 Q가 소정의 역치 Th1보다 큰 경우, 및/또는 지표 Q'가 소정의 역치 Th1'보다 작은 경우에 실행된다.
<제3 실시형태에 따른 선형 예측 계수 복호 장치(600)>
도 12는 제3 실시형태에 따른 선형 예측 계수 복호 장치(600)의 기능 블록도를, 도 10은 그 처리 플로우의 예를 나타낸다.
제3 실시형태의 선형 예측 계수 복호 장치(600)는 비예측 대응 복호부(410) 대신에 비예측 대응 복호부(610)를 포함한다.
비예측 대응 복호부(610)는 비예측 대응 가산부(413)와 보정 벡터 복호부(611)와 보정 벡터 부호장(612A 및 612B)과 지표 계산부(415)를 포함하고, 필요에 따라 복호 비예측 대응 선형 예측 계수 계산부(214)도 포함한다.
제3 실시형태의 선형 예측 계수 복호 장치(600)는 복수의 보정 벡터 부호장을 구비하고, 보정 벡터 복호부(611)에서는 지표 계산부(415)로 계산된 지표 Q 및/또는 Q'에 따라 어느 1개의 보정 벡터 부호장을 선택하여 복호를 행하는 점이 제2 실시형태의 선형 예측 계수 복호 장치(400)와 상이하다.
이하에서는 2종류의 보정 벡터 부호장(612A 및 612B)을 가지는 경우를 예로 설명한다.
보정 벡터 부호장(612A 및 612B)은 각각 선형 예측 계수 부호화 장치(500)의 보정 벡터 부호장(513A 및 513B)과 공통의 내용을 기억하고 있다. 즉 보정 벡터 부호장(612A 및 612B)에는 각 후보 보정 벡터와 그 각 후보 보정 벡터에 대응하는 보정 벡터 부호가 기억되어 있고, 보정 벡터 부호장(612A)에 기억되어 있는 부호의 부호 길이(평균 부호 길이) 쪽이 보정 벡터 부호장(612B)에 기억되어 있는 부호의 부호 길이(평균 부호 길이)보다 크다. 예를 들면 보정 벡터 부호장(612A)에는 부호 길이가 A비트의 보정 벡터 부호와 후보 보정 벡터와의 세트가 2A개 격납되어 있고, 보정 벡터 부호장(612B)에는 부호 길이가 B비트(B<A)의 보정 벡터 부호와 후보 보정 벡터와의 세트가 2B개(2B<2A) 격납되어 있다.
<보정 벡터 복호부(611)>
보정 벡터 복호부(611)는 지표 Q 및/또는 지표 Q'와 보정 LSP 부호 Df를 수취한다. 보정 벡터 복호부(611)는 (A-2) 지표 Q가 클수록 및/또는 (B-2) 지표 Q'가 작을수록 많은 비트수를 가지는 보정 LSP 부호 Df를 복호하여, 많은 후보 보정 벡터로부터 복호 보정 벡터 ^Uf를 얻는다(s611). 예를 들면 소정의 역치 Th2 및/또는 Th2'를 사용하여, 이하와 같이 복호를 행한다. 또한 보정 벡터 복호부(611)가 복호 처리를 실행하는 것은 지표 Q가 소정의 역치 Th1 이상인 경우, 및/또는 지표 Q'가 소정의 역치 Th1' 이하인 경우이므로, Th2는 Th1보다 큰 값이며, Th2'는 Th1'보다 작은 값이다.
(A-5) 지표 Q가 소정의 역치 Th2 이상인 경우, 및/또는 (B-5) 지표 Q'가 소정의 역치 Th2' 이하인 경우, 보정 LSP 부호 Df의 비트수로서 정의 정수인 A가 설정되는 것으로 하고, 보정 벡터 복호부(611)는 비트수(부호 길이) A의 보정 벡터 부호와 후보 보정 벡터와의 세트를 2A개 기억하고 있는 보정 벡터 부호장(612A)을 참조하여, 보정 LSP 부호 Df와 일치하는 보정 벡터 부호에 대응하는 후보 보정 벡터를 복호 보정 벡터 ^Uf로서 얻어(s611) 출력한다.
(A-6) 지표 Q가 소정의 역치 Th2보다 작고 또한 지표 Q가 소정의 역치 Th1 이상인 경우, 및/또는 (B-6) 지표 Q'가 소정의 역치 Th2'보다 크고 또한 지표 Q'가 소정의 역치 Th1' 이하인 경우, 보정 LSP 부호 Df의 비트수로서 비트수 A 미만의 정의 정수인 B가 설정되는 것으로 하고, 보정 벡터 복호부(611)는 비트수(부호 길이) B의 보정 벡터 부호와 후보 보정 벡터와의 세트를 2B개 기억하고 있는 보정 벡터 부호장(612B)을 참조하여, 보정 LSP 부호 Df와 일치하는 보정 벡터 부호에 대응하는 후보 보정 벡터를 복호 보정 벡터 ^Uf로서 얻어(s611) 출력한다.
(C-6) 그 이외의 경우, 보정 LSP 부호 Df의 비트수로서 0가 설정되는 것으로 하고, 보정 벡터 복호부(611)는 보정 LSP 부호 Df를 복호하지 않고, 복호 보정 벡터 ^Uf를 생성하지 않는다.
따라서 제3 실시형태의 보정 벡터 복호부(611)는 지표 계산부(415)로 계산된 지표 Q가 소정의 역치 Th1보다 큰 경우, 및/또는 지표 Q'가 소정의 역치 Th1'보다 작은 경우에 실행된다.
<제3 실시형태의 효과>
이와 같은 구성에 의해, 제2 실시형태와 마찬가지의 효과를 얻을 수 있다. 또한 LSP 부호의 전송 오류에 기인하는 복호 정밀도의 저하의 영향의 크기에 따라 근사 정밀도를 변경함으로써, 제1 실시형태의 부호화 및 복호보다는 전체로서 부호량을 억제하면서, 제2 실시형태의 부호화 및 복호보다도 음질이 좋은 부호화 및 복호 처리를 행할 수 있다.
<변형예>
보정 벡터 부호장의 개수는 반드시 2개가 아니어도 되고, 3개 이상이어도 된다. 보정 벡터 부호장마다 상이한 비트수(비트 길이)의 보정 벡터 부호가 기억되어 있고, 그 보정 벡터 부호에 대응하는 보정 벡터가 기억되어 있다. 보정 벡터 부호장의 개수에 따라 역치를 설정하면 된다. 지표 Q에 대한 역치는 역치의 값이 커질수록, 그 역치 이상의 경우에 사용되는 보정 벡터 부호장에 기억되는 보정 벡터 부호의 비트수가 커지도록 설정하면 된다. 마찬가지로 지표 Q'에 대한 역치는 역치의 값이 작아질수록, 그 역치 이하의 경우에 사용되는 보정 벡터 부호장에 기억되는 보정 벡터 부호의 비트수가 커지도록 설정하면 된다. 이와 같은 구성으로 함으로써, 전체로서 부호량을 억제하면서, 보다 정밀도가 높은 부호화 및 복호 처리를 행할 수 있다.
<제4 실시형태에 따른 부호화 장치(700)>
제4 실시형태에 따른 부호화 장치(700)는 제1 실시형태의 선형 예측 계수 부호화 장치(100) 및 선형 예측 계수 복호 장치(200)를 주파수 영역에서의 부호화 방법인 TCX(transform coded excitation) 부호화 방법에 응용한 것이다.
도 13은 제4 실시형태의 부호화 장치(700)의 기능 블록도를, 도 14는 그 처리 플로우의 예를 나타낸다.
제4 실시형태의 부호화 장치(700)는 선형 예측 계수 부호화 장치(100)와 선형 예측 계수 복호 장치(200)와 파워 스펙트럼 포락 계열 계산부(710)와 제1 평활화 파워 스펙트럼 포락 계열 계산부(720A)와 제2 평활화 파워 스펙트럼 포락 계열 계산부(720B)와 주파수 영역 변환부(730)와 포락 정규화부(740)와 가변 길이 부호화 파라미터 계산부(750)와 가변 길이 부호화부(760)를 포함한다. 또한 선형 예측 계수 부호화 장치(100)와 선형 예측 계수 복호 장치(200) 대신에 제2, 제3 실시형태의 선형 예측 계수 부호화 장치(300, 500) 및 선형 예측 계수 복호 장치(400, 600)를 사용해도 된다.
제4 실시형태의 부호화 장치(700)는 입력 음향 신호 Xf를 수취하고, 주파수 영역 신호 부호를 출력한다.
<선형 예측 계수 부호화 장치(100)>
선형 예측 계수 부호화 장치(100)는 음향 신호 Xf를 수취하고, LSP 부호 Cf 및 보정 LSP 부호 Df를 얻어(s100) 출력한다.
<선형 예측 계수 복호 장치(200)>
선형 예측 계수 복호 장치(200)는 LSP 부호 Cf와 보정 LSP 부호 Df를 수취하고, 예측 대응 양자화 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]와 비예측 대응 양자화 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]를 얻어(s200) 출력한다.
또한 부호화 장치(700)의 선형 예측 계수 부호화 장치(100)가 LSP 부호 Cf와 보정 LSP 부호 Df를 얻을 때에, LSP 부호 Cf에 대응하는 예측 대응 양자화 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]와 LSP 부호 Cf와 보정 LSP 부호 Df에 대응하는 비예측 대응 양자화 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]를 얻는 구성으로 해도 된다. 이 경우는 부호화 장치(700)는 선형 예측 계수 복호 장치(200)를 구비하지 않아도 된다.
<파워 스펙트럼 포락 계열 계산부(710)>
파워 스펙트럼 포락 계열 계산부(710)는 비예측 대응 양자화 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]를 수취한다. 파워 스펙트럼 포락 계열 계산부(710)는 비예측 대응 양자화 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]를 사용하여, N점의 입력 음향 신호의 파워 스펙트럼 포락 계열 Z[1],…, Z[N]을 계산하여(s710) 출력한다. 예를 들면 파워 스펙트럼 포락 계열의 각 값 Z[n]은 다음 식으로 구할 수 있다.
[수 6]
Figure 112018042847121-pat00006
여기서 n은 1≤n≤N의 정수, exp(·)는 네이피어 수를 밑으로 하는 지수함수, j는 허수 단위, σ2는 예측 잔차 에너지이다.
<제1 평활화 파워 스펙트럼 포락 계열 계산부(720A)>
제1 평활화 파워 스펙트럼 포락 계열 계산부(720A)는 예측 대응 양자화 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]를 수취한다. 제1 평활화 파워 스펙트럼 포락 계열 계산부(720A)는 예측 대응 양자화 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]와 미리 주어진 1 이하의 정의 상수인 보정 계수 γi를 사용하여,
[수 7]
Figure 112018042847121-pat00007
에 의해 제1 평활화 완료 파워 스펙트럼 포락 계열 ~W[1], ~W[2],…, ~W[N]을 계산하여(s720A) 출력한다.
제1 평활화 완료 파워 스펙트럼 포락 계열 ~W[1], ~W[2],…, ~W[N]은 예측 대응 양자화 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]에 의해 구해진 파워 스펙트럼 포락 계열 W[1], W[2],…, W[N]의 진폭의 요철을 둔하게 한(평활화한) 계열에 상당한다. γi는 평활화의 정도를 정하는 정의 상수이다.
<제2 평활화 파워 스펙트럼 포락 계열 계산부(720B)>
제2 평활화 파워 스펙트럼 포락 계열 계산부(720B)는 비예측 대응 양자화 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]를 수취한다. 제2 평활화 파워 스펙트럼 포락 계열 계산부(720B)는 비예측 대응 양자화 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]와 미리 주어진 1 이하의 정의 상수인 보정 계수 γi를 사용하여,
[수 8]
Figure 112018042847121-pat00008
에 의해 제2 평활화 완료 파워 스펙트럼 포락 계열 ~Z[1], ~Z[2],…, ~Z[N]을 계산하여(s720B) 출력한다.
제2 평활화 완료 파워 스펙트럼 포락 계열 ~Z[1], ~Z[2],…, ~Z[N]은 비예측 대응 양자화 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]에 의해 구해진 파워 스펙트럼 포락 계열 Z[1], Z[2],…, Z[N]의 진폭의 요철을 둔하게 한(평활화한) 계열에 상당한다. γi는 평활화의 정도를 정하는 정의 상수이다.
<주파수 영역 변환부(730)>
주파수 영역 변환부(730)는 소정의 시간 구간인 프레임 단위로, 입력된 시간영역의 입력 음향 신호 Xf를 주파수 영역의 N점의 MDCT 계수열 X[1],…, X[N]로 변환하여(s730) 출력한다. 단, N은 정의 정수이다.
<포락 정규화부(740)>
포락 정규화부(740)는 MDCT 계수열 X[1],…, X[N]과 제1 평활화 완료 파워 스펙트럼 포락 계열 ~W[1], ~W[2],…, ~W[N]을 수취하고, MDCT 계수열 X[1],…, X[N]의 각 계수 X[i]를 제1 평활화 완료 파워 스펙트럼 포락 계열 ~W[1], ~W[2],…, ~W[N]의 각 값 ~W[i]의 제곱근으로 정규화한 계열인 정규화 완료 MDCT 계수열 XN[1],…, XN[N]을 구하여(s740) 출력한다. 즉
XN[i]=X[i]/sqrt(~W[i])
이다. 단, sqrt(·)는 1/2승을 나타내는 기호이다.
<가변 길이 부호화 파라미터 계산부(750)>
가변 길이 부호화 파라미터 계산부(750)는 파워 스펙트럼 포락 계열 Z[1],…, Z[N]과 제2 평활화 완료 파워 스펙트럼 포락 계열 ~Z[1],…, ~Z[N]과 MDCT 계수열 X[1],…, X[N]과 정규화 완료 MDCT 계수열 XN[1],…, XN[N]을 수취한다. 이들 값을 사용하여 정규화 완료 MDCT 계수열 XN[1],…, XN[N]을 가변 길이 부호화하기 위한 파라미터인 가변 길이 부호화 파라미터 ri를 계산하여(s750) 출력한다. 가변 길이 부호화 파라미터 ri는 부호화 대상의 정규화 완료 MDCT 계수열 XN[1],…, XN[N]의 진폭이 취할 수 있는 범위를 특정하는 파라미터이다. 라이스 부호화의 경우에는 라이스 파라미터가 가변 길이 부호화 파라미터에 상당하고, 산술 부호화의 경우는 부호화 대상의 진폭의 취할 수 있는 범위가 가변 길이 부호화 파라미터에 상당한다.
1샘플마다 가변 길이 부호화를 행하는 경우에는, 정규화 완료 MDCT 계수열의 각 계수 XN[i]에 대해서 가변 길이 부호화 파라미터가 계산된다. 복수의 샘플로 이루어지는 샘플군마다(예를 들면 2샘플씩) 합쳐서 가변 길이 부호화를 행하는 경우에는 샘플군마다 가변 길이 부호화 파라미터가 계산된다. 즉 가변 길이 부호화 파라미터 계산부(750)는 정규화 완료 MDCT 계수열의 일부인 정규화 완료 부분 계수열마다 가변 길이 부호화 파라미터를 계산한다. 여기서 정규화 완료 부분 계수열은 복수개 있고, 복수개의 정규화 완료 부분 계수열에는 정규화 완료 MDCT 계수열의 계수가 중복되지 않고 포함되는 것으로 한다.
이하에서는 1샘플마다 라이스 부호화를 행하는 경우를 예로 가변 길이 부호화 파라미터의 계산 방법을 설명한다.
(step1) 예를 들면 다음 식에 의해 정규화 완료 MDCT 계수열 XN[1], XN[2],…, XN[N]의 각 계수의 진폭의 평균의 대수를 기준이 되는 라이스 파라미터 sb로서 산출한다.
[수 9]
Figure 112018042847121-pat00009
sb는 프레임마다 1도만큼 부호화되어, 기준이 되는 라이스 파라미터에 대응하는 부호로서 복호 장치에 전송된다. 또는 복호 장치에 전송되는 다른 정보로부터 X[i]의 진폭을 추정할 수 있는 경우는, 부호화 장치(700)와 복호 장치에서 공통으로 X[i]의 진폭의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정해 두어도 된다. 이 경우는 sb를 부호화하고, 기준이 되는 라이스 파라미터에 대응하는 부호를 복호 장치에 출력하지 않아도 된다.
(step2) 다음 식에 의해 역치 θ를 산출한다.
[수 10]
Figure 112018042847121-pat00010
(step3) |sqrt(Z[i])/sqrt(~Z[i])|가 θ보다 클수록, 라이스 파라미터 ri를 sb보다 큰 값으로서 방법으로 결정한다. |sqrt(Z[i])/sqrt(~Z[i])|가 θ보다 작을수록, 라이스 파라미터 ri를 sb보다 작은 값으로서 결정한다.
(step4) step3의 처리를 모든 i=1,2,…, N에 대해서 반복하여, 각 정규화 완료 MDCT 계수 XN[i]에 대한 라이스 파라미터 ri를 구한다.
<가변 길이 부호화부(760)>
가변 길이 부호화부(760)는 가변 길이 부호화 파라미터 ri를 수취하고, 이 값을 사용하여 정규화 완료 계수열 XN(1),…, XN(N)을 가변 길이 부호화하고, 가변 길이 부호 CX를 출력한다(s760).
<제4 실시형태의 효과>
제4 실시형태는 MDCT 계수열 X[1], X[2],…, X[N]을 평활화 파워 스펙트럼 포락 계열로 정규화하여 얻어지는 정규화 완료 MDCT 계수열 XN[1],…, XN[N]을 가변 길이 부호화 파라미터를 사용하여 부호화하는 구성이다.
가변 길이 부호화의 대상인 정규화 완료 MDCT 계수열은 가능한 한 정확한 파워 스펙트럼 포락 계열을 사용하여 구할 필요가 있는 점에서, 포락 정규화부(740)에서는 평활화 선형 예측 계수에 의해 구해진 파워 스펙트럼 포락 계열과의 오차가 적은, 예측 대응 양자화 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]에 의해 구해진 제1 평활화 완료 파워 스펙트럼 포락 계열 ~W[1], ~W[2],…, ~W[N]을 사용하여 정규화 완료 MDCT 계수열을 생성하고 있다.
가변 길이 부호화 파라미터 계산부(750)에서는 가변 길이 부호화 파라미터를 구하기 위해서 파워 스펙트럼 포락 계열이나 평활화 파워 스펙트럼 포락 계열을 이용한다. 따라서 가변 길이 부호화 파라미터 계산부(750)에서 사용하는 파워 스펙트럼 포락 계열이나 평활화 파워 스펙트럼 포락 계열에 대해서도, 선형 예측 계수에 의해 구해진 파워 스펙트럼 포락 계열이나 평활화 선형 예측 계수에 의해 구해진 파워 스펙트럼 포락 계열과의 오차가 작은 쪽이 바람직하다. 그러나 예측 대응 양자화 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]는 현재의 프레임의 LSP 부호에 전송 오류가 생긴 경우 뿐만아니라 앞 프레임의 LSP 부호에 전송 오류가 생긴 경우에도 복호측에서 올바른 값을 얻을 수 없다. 즉 예측 대응 양자화 선형 예측 계수 ^af[1], ^af[2],…, ^af[p]로부터 구해진 파워 스펙트럼 포락 계열이나 평활화 파워 스펙트럼 포락 계열로부터 가변 길이 부호화 파라미터를 구하면, 현재의 프레임의 LSP 부호에 전송 오류가 생긴 경우 뿐만아니라 앞 프레임의 LSP 부호에 전송 오류가 생긴 경우에도 가변 길이 복호를 올바르게 행할 수 없게 되어버린다.
그래서 제4 실시형태에서는 비예측 대응 양자화 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p]로부터 구해진 파워 스펙트럼 포락 계열이나 평활화 파워 스펙트럼 포락 계열을 이용하여 가변 길이 부호화 파라미터를 구한다. 이것에 의해 앞의 프레임의 LSP 부호에 전송 오류가 생겼다고 해도, 현재의 프레임의 LSP 부호에 전송 오류가 생기지 않으면, 현재의 프레임에서는 부호화측과 동일한 비예측 대응 양자화 선형 예측 계수 ^bf[1], ^bf[2],…, ^bf[p], 파워 스펙트럼 포락 계열 Z[1], Z[2],…, Z[N] 및 제2 평활화 파워 스펙트럼 포락 계열 ~Z[1], ~Z[2],…, ~Z[N]을 얻을 수 있기 때문에, 현재의 프레임에서는 부호화측과 동일한 가변 길이 부호화 파라미터를 구할 수 있고, LSP 부호의 전송 오류에 대한 내성이 향상된다.
또한 제4 실시형태에서는 제1 평활화 파워 스펙트럼 포락 계열 ~W[1], ~W[2],…, ~W[N]을 사용하여 얻은 정규화 완료 MDCT 계수열 XN[1],…, XN[N]을 가변 길이 부호화의 대상으로 하고 있다. 그러므로 현 프레임의 LSP 부호에 전송 오류가 생긴 경우 뿐만아니라, 앞의 프레임의 LSP 부호에 전송 오류가 생긴 경우에도, 복호측에서 정규화 완료 MDCT 계수열 XN[1],…, XN[N]에 승산하는 평활화 완료 파워 스펙트럼 포락 계열의 각 값의 제곱근에 오류가 생기고, 복호에 의해 얻어지는 MDCT 계수열에 왜곡이 생긴다는 문제는 있다. 그러나 이 문제는 가변 길이 부호화 파라미터의 오류와 같이 가변 길이 복호 그 자체를 부정확하게 해버리는 것 같은 문제보다는 작다.
<변형예 1>
이상의 제1 내지 제4 실시형태에 있어서, 도 3의 선형 예측 계수 부호화 장치(100)의 비예측 대응 부호화부(110), 도 7의 선형 예측 계수 부호화 장치(300)의 비예측 대응 부호화부(310), 도 11의 선형 예측 계수 부호화 장치(500)의 비예측 대응 부호화부(510)에서 행해지는 처리(비예측 대응 부호화 처리)를 실행하는 대상을, 예측 차수 p 미만의 소정의 차수 TL 이하의 LSP 파라미터(저차의 LSP 파라미터)만으로 해도 되고, 복호측에서도 이들에 대응하는 처리를 행해도 된다.
우선 비예측 대응 부호화부(110, 310, 510)의 각 부에 대해서 설명한다.
<비예측 대응 감산부(111, 311)>
비예측 대응 감산부(111, 311)는 입력된 LSP 파라미터 벡터 Θf=(θf[1], θf[2],…, θf[p])T 중 TL차 이하의 LSP 파라미터로 이루어지는 저차 LSP 파라미터 벡터 Θ'f=(θf[1], θf[2],…, θf[TL])T로부터, 기억부(111c)에 기억된 비예측 대응 저차 평균 벡터 Y'=(y[1], y[2],…, y[TL])T와, 입력된 양자화 차분 벡터 ^Sf=(^sf[1], ^sf[2],…, ^sf[p])T 중 TL차 이하의 요소로 이루어지는 저차 양자화 차분 벡터 ^S'f=(^sf[1], ^sf[2],…, ^sf[TL])T를 감산한 벡터인 저차 보정 벡터 U'f=Θ'f-Y'-^S'f를 생성하여 출력한다. 즉 비예측 대응 감산부(111, 311)는 보정 벡터 Uf의 요소의 일부로 이루어지는 벡터인 저차 보정 벡터 U'f를 생성하여 출력한다.
여기서 비예측 대응 저차 평균 벡터 Y'=(y[1], y[2],…, y[TL])T는 미리 정한 벡터이며, 변형예 1의 복호 장치에서 사용하는 비예측 대응 평균 벡터 Y=(y[1], y[2],…, y[p])T 중 TL차 이하의 요소로 이루어지는 벡터이다.
또한 LSP 계산부(82)로부터 LSP 파라미터 벡터 Θf 중 TL차 이하의 LSP 파라미터로 이루어지는 저차 LSP 파라미터 벡터 Θ'f를 출력하여, 비예측 대응 감산부(111, 311)에 입력해도 된다. 또 벡터 부호화부(84)로부터 양자화 차분 벡터 ^Sf 중 TL차 이하의 요소로 이루어지는 저차 양자화 차분 벡터 ^S'f를 출력하여, 비예측 대응 감산부(111, 311)에 입력해도 된다.
<보정 벡터 부호화부(112, 312, 512)>
보정 벡터 부호화부(112, 312 및 512)는 보정 벡터 Uf의 요소의 일부로 이루어지는 벡터인 저차 보정 벡터 U'f를 보정 벡터 부호장(113, 513A, 513B)을 참조하여 부호화한다. 보정 벡터 부호장(113, 513A, 513B)에 기억해 두는 각 후보 보정 벡터는 TL차의 벡터로 해 두면 된다.
이어서 변형예 1의 선형 예측 계수 복호 장치(200, 400, 600)에 대해서 설명한다.
변형예 1의 선형 예측 계수 복호 장치(200)의 비예측 대응 복호부(210), 선형 예측 계수 복호 장치(400)의 비예측 대응 복호부(410), 선형 예측 계수 복호 장치(600)의 비예측 대응 복호부(610)에서 행해지는 처리(비예측 대응 복호 처리)에 대해서 설명한다.
<보정 벡터 복호부(211, 411, 611)>
보정 벡터 복호부(211, 411, 611)는 보정 LSP 부호 Df를 수취하고, 보정 벡터 부호장(212, 612A, 612B)을 참조하여, 보정 LSP 부호 Df를 복호하여 복호 저차 보정 벡터 ^U'f를 얻어 출력한다. 복호 저차 보정 벡터 ^U'f=(uf[1], uf[2],…, uf[TL])T는 TL차의 벡터이다. 보정 벡터 부호장(212, 612A, 612B)에 기억해 두는 각 후보 보정 벡터는 보정 벡터 부호장(113, 513A, 513B)과 마찬가지로, TL차의 벡터로 해 두면 된다.
<비예측 대응 가산부(213)>
비예측 대응 가산부(213)는 복호 저차 보정 벡터 ^U'f=(uf[1], uf[2],…, uf[TL])T와 비예측 대응 평균 벡터 Y=(y[1], y[2],…, y[p])T와 복호 차분 벡터 ^Sf=(^sf[1], ^sf[2],…, ^sf[p])T를 수취한다.
비예측 대응 가산부(213)는 TL차 이하의 각 차에 대해서는 복호 저차 보정 벡터 ^U'f와 복호 차분 벡터 ^Sf와 비예측 대응 평균 벡터 Y의 요소를 가산하여, p차 이하의 TL차를 넘는 각 차에 대해서는 복호 차분 벡터 ^Sf와 비예측 대응 평균 벡터 Y의 요소를 가산하여 얻어지는 복호 비예측 대응 LSP 파라미터 벡터 ^Φf를 생성하여 출력한다. 즉 복호 비예측 대응 LSP 파라미터 벡터 ^Φf는 ^Φf=(uf[1]+y[1]+^sf[1], uf[2]+y[2]+^sf[2],…, uf[TL]+y[TL]+^sf[TL], y[TL+1]+^sf[TL+1],…, y[p]+^sf[p])이다.
<비예측 대응 가산부(413)>
비예측 대응 가산부(413)는 복호 저차 보정 벡터 ^U'f=(uf[1], uf[2],…, uf[TL])T와 비예측 대응 평균 벡터 Y=(y[1], y[2],…, y[p])T와 복호 차분 벡터 ^Sf=(^sf[1], ^sf[2],…, ^sf[p])T를 수취한다.
비예측 대응 가산부(413)는 보정 복호 처리를 실행하는 것을 나타내는 제어 신호 C나, 정의 정수(또는 정의 정수를 나타내는 부호)를 제어 신호 C로서 수취한 경우, 요컨대 스펙트럼 포락의 산곡이 소정의 기준보다 큰 경우, (A-1) 및/또는 (B-1)의 경우에는, TL차 이하의 각 차에 대해서는 복호 저차 보정 벡터 ^U'f와 복호 차분 벡터 ^Sf와 비예측 대응 평균 벡터 Y의 요소를 가산하고, p차 이하의 TL차를 넘는 각 차에 대해서는 복호 차분 벡터 ^Sf와 비예측 대응 평균 벡터 Y의 요소를 가산하여 얻어지는 복호 비예측 대응 LSP 파라미터 벡터 ^Φf를 생성하여 출력한다. 즉 복호 비예측 대응 LSP 파라미터 벡터 ^Φf는 ^Φf=(uf[1]+y[1]+^sf[1], uf[2]+y[2]+^sf[2],…, uf[TL]+y[TL]+^sf[TL], y[TL+1]+^sf[TL+1],…, y[p]+^sf[p])이다.
비예측 대응 가산부(413)는 보정 복호 처리를 실행하지 않는 것을 나타내는 제어 신호 C나, 0를 제어 신호 C로서 수취한 경우, 요컨대 스펙트럼 포락의 산곡이 소정의 기준보다 크지 않은 경우, 즉 상기한 예에서는 (A-1) 및/또는 (B-1) 이외의 경우에는, 복호 차분 벡터 ^Sf와 비예측 대응 평균 벡터 Y를 가산하여 얻어지는 복호 비예측 대응 LSP 파라미터 벡터 ^Φf=Y+^Sf를 생성하여 출력한다.
이것에 의해 근사 정밀도의 높이가 후술하는 신호 처리의 효율에 의해 큰 영향을 줄 가능성이 있는 저차 LSP 파라미터를 우선하여 부호화 왜곡을 저감시킴으로써, 왜곡의 증대를 억제하면서 제1 내지 제3 실시형태의 방법보다도 부호량을 삭감할 수 있다.
<변형예 2>
제1 내지 제4 실시형태에서는 LSP 계산부의 입력을 선형 예측 계수 af[1], af[2],…, af[p]로 하고 있었지만, 예를 들면 선형 예측 계수의 각 계수 af[i]에 γ의 i승을 곱한 계수의 계열 af[1]×γ, af[2]×γ2,…, af[p]×γp를 LSP 계산부의 입력으로 해도 된다.
또 제1 내지 제4 실시형태에서는 선형 예측 계수 부호화 장치의 부호화나 선형 예측 계수 복호 장치의 복호의 대상을 LSP 파라미터로 하고 있었지만, 선형 예측 계수 그 자체나 ISP 파라미터 등의 선형 예측 계수로 변환 가능한 계수이면 어느 계수를 부호화나 복호가 대상으로 해도 된다.
<그 밖의 변형예>
본 발명은 상기한 실시형태 및 변형예에 한정되는 것은 아니다. 예를 들면 상기 서술한 각종 처리는 기재에 따라 시계열로 실행될 뿐만아니라, 처리를 실행하는 장치의 처리 능력 또는 필요에 따라 병렬적으로 또는 개별로 실행되어도 된다. 그 밖에 본 발명의 취지를 일탈하지 않는 범위에서 적당히 변경이 가능하다.
<프로그램 및 기록 매체>
또 상기한 실시형태 및 변형예에서 설명한 각 장치에 있어서의 각종 처리 기능을 컴퓨터에 의해 실현해도 된다. 그 경우, 각 장치가 가져야 할 기능의 처리 내용은 프로그램에 의해 기술된다. 그리고 이 프로그램을 컴퓨터로 실행함으로써, 상기 각 장치에 있어서의 각종 처리 기능이 컴퓨터상에서 실현된다.
이 처리 내용을 기술한 프로그램은 컴퓨터로 판독 가능한 기록 매체에 기록해 둘 수 있다. 컴퓨터로 판독 가능한 기록 매체로서는 예를 들면 자기 기록 장치, 광디스크, 광자기 기록 매체, 반도체 메모리 등 어떠한 것이어도 된다.
또 이 프로그램의 유통은 예를 들면 그 프로그램을 기록한 DVD, CD-ROM 등의 가반형 기록 매체를 판매, 양도, 대여하거나 함으로써 행한다. 또한 이 프로그램을 서버 컴퓨터의 기억 장치에 격납해 두고, 네트워크를 통하여 서버 컴퓨터로부터 다른 컴퓨터에 그 프로그램을 전송함으로써, 이 프로그램을 유통시켜도 된다.
이와 같은 프로그램을 실행하는 컴퓨터는 예를 들면 우선 가반형 기록 매체에 기록된 프로그램 혹은 서버 컴퓨터로부터 전송된 프로그램을, 일단 자기의 기억부에 격납한다. 그리고 처리의 실행시, 이 컴퓨터는 자기의 기억부에 격납된 프로그램을 판독하고, 판독한 프로그램에 따른 처리를 실행한다. 또 이 프로그램의 다른 실시형태로서, 컴퓨터가 가반형 기록 매체로부터 직접 프로그램을 판독하고, 그 프로그램에 따른 처리를 실행하는 것으로 해도 된다. 또한 이 컴퓨터에 서버 컴퓨터로부터 프로그램이 전송될 때마다, 차례로 수취한 프로그램에 따른 처리를 실행하는 것으로 해도 된다. 또 서버 컴퓨터로부터 이 컴퓨터로의 프로그램의 전송은 행하지 않고, 그 실행 지시와 결과 취득만에 의해 처리 기능을 실현하는 소위 ASP(Application Service Provider)형의 서비스에 의해 상기 서술한 처리를 실행하는 구성으로 해도 된다. 또한 프로그램에는 전자 계산기에 의한 처리용으로 제공하는 정보로서 프로그램에 준하는 것(컴퓨터에 대한 직접적인 지령은 아니지만 컴퓨터의 처리를 규정하는 성질을 가지는 데이터 등)을 포함하는 것으로 한다.
또 컴퓨터상에서 소정의 프로그램을 실행시킴으로써 각 장치를 구성하는 것으로 했지만, 이들 처리 내용의 적어도 일부를 하드웨어적으로 실현하는 것으로 해도 된다.

Claims (10)

  1. 제1 부호를 복호하여 복호 차분 벡터를 얻어, 상기 복호 차분 벡터와, 적어도 과거의 프레임으로부터의 예측을 포함하는 예측 벡터를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제1 복호 벡터를 생성하는 예측 대응 복호부와,
    (A) 상기 선형 예측 계수로 변환 가능한 계수의 복호값의 열에 대응하는 스펙트럼 포락의 산곡의 크기에 대응하는 지표 Q가 소정의 역치 Th1 이상인 경우, 및/또는 (B) 상기 스펙트럼 포락의 산곡의 작음에 대응하는 지표 Q'가 소정의 역치 Th1' 이하인 경우에, 제2 부호를 복호하여 복호 보정 벡터를 얻어, 상기 복호 보정 벡터와, 적어도 상기 복호 차분 벡터의 대응하는 차수의 요소끼리를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제2 복호 벡터를 생성하는 비예측 대응 복호부를 포함하는 것을 특징으로 하는 복호 장치.
  2. 제1 부호를 복호하여 복호 차분 벡터를 얻어, 상기 복호 차분 벡터와, 적어도 과거의 프레임으로부터의 예측과 미리 정한 벡터로 이루어지는 예측 벡터를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제1 복호 벡터를 생성하는 예측 대응 복호부와,
    (A) 상기 선형 예측 계수로 변환 가능한 계수의 복호값의 열에 대응하는 스펙트럼 포락의 산곡의 크기에 대응하는 지표 Q가 소정의 역치 Th1 이상인 경우, 및/또는 (B) 상기 스펙트럼 포락의 산곡의 작음에 대응하는 지표 Q'가 소정의 역치 Th1' 이하인 경우에, 제2 부호를 복호하여 복호 보정 벡터를 얻어, 상기 복호 보정 벡터에, 적어도 상기 복호 차분 벡터와 미리 정한 벡터를 대응하는 차수의 요소마다 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제2 복호 벡터를 생성하는 비예측 대응 복호부를 포함하는 것을 특징으로 하는 복호 장치.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 복수차의 선형 예측 계수로 변환 가능한 계수는 선 스펙트럼 쌍의 파라미터이며, 상기 지표 Q'는 상기 제1 복호 벡터인 복호된 선 스펙트럼 쌍의 파라미터의 열의 이웃하는 파라미터간의 차분과, 최저차의 복호된 선 스펙트럼 쌍의 파라미터 중 최소값인 것을 특징으로 하는 복호 장치.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 복수차의 선형 예측 계수로 변환 가능한 계수는 선 스펙트럼 쌍의 파라미터이며, 상기 지표 Q'는 상기 제1 복호 벡터인 복호된 선 스펙트럼 쌍의 파라미터의 열의 이웃하는 파라미터간의 차분의 최소값인 것을 특징으로 하는 복호 장치.
  5. 제1 부호를 복호하여 복호 차분 벡터를 얻어, 상기 복호 차분 벡터와, 적어도 과거의 프레임으로부터의 예측을 포함하는 예측 벡터를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제1 복호 벡터를 생성하는 예측 대응 복호 스텝과,
    (A) 상기 선형 예측 계수로 변환 가능한 계수의 복호값의 열에 대응하는 스펙트럼 포락의 산곡의 크기에 대응하는 지표 Q가 소정의 역치 Th1 이상인 경우, 및/또는 (B) 상기 스펙트럼 포락의 산곡의 작음에 대응하는 지표 Q'가 소정의 역치 Th1' 이하인 경우에, 제2 부호를 복호하여 복호 보정 벡터를 얻어, 상기 복호 보정 벡터와, 적어도 상기 복호 차분 벡터의 대응하는 차수의 요소끼리를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제2 복호 벡터를 생성하는 비예측 대응 복호 스텝을 포함하는 것을 특징으로 하는 복호 방법.
  6. 제1 부호를 복호하여 복호 차분 벡터를 얻어, 상기 복호 차분 벡터와, 적어도 과거의 프레임으로부터의 예측과 미리 정한 벡터로 이루어지는 예측 벡터를 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제1 복호 벡터를 생성하는 예측 대응 복호 스텝과,
    (A) 상기 선형 예측 계수로 변환 가능한 계수의 복호값의 열에 대응하는 스펙트럼 포락의 산곡의 크기에 대응하는 지표 Q가 소정의 역치 Th1 이상인 경우, 및/또는 (B) 상기 스펙트럼 포락의 산곡의 작음에 대응하는 지표 Q'가 소정의 역치 Th1' 이하인 경우에, 제2 부호를 복호하여 복호 보정 벡터를 얻어, 상기 복호 보정 벡터에, 적어도 상기 복호 차분 벡터와 미리 정한 벡터를 대응하는 차수의 요소마다 가산하여, 현재의 프레임의 복수차의 선형 예측 계수로 변환 가능한 계수의 복호값으로 이루어지는 제2 복호 벡터를 생성하는 비예측 대응 복호 스텝을 포함하는 것을 특징으로 하는 복호 방법.
  7. 제 5 항 또는 제 6 항에 있어서,
    상기 복수차의 선형 예측 계수로 변환 가능한 계수는 선 스펙트럼 쌍의 파라미터이며, 상기 지표 Q'는 상기 제1 복호 벡터인 복호된 선 스펙트럼 쌍의 파라미터의 열의 이웃하는 파라미터간의 차분과, 최저차의 복호된 선 스펙트럼 쌍의 파라미터 중 최소값인 것을 특징으로 하는 복호 방법.
  8. 제 5 항 또는 제 6 항에 있어서,
    상기 복수차의 선형 예측 계수로 변환 가능한 계수는 선 스펙트럼 쌍의 파라미터이며, 상기 지표 Q'는 상기 제1 복호 벡터인 복호된 선 스펙트럼 쌍의 파라미터의 열의 이웃하는 파라미터간의 차분의 최소값인 것을 특징으로 하는 복호 방법.
  9. 제 5 항 또는 제 6 항에 기재된 복호 방법의 각 스텝을 컴퓨터에 실행시키기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램.
  10. 제 5 항 또는 제 6 항에 기재된 복호 방법의 각 스텝을 컴퓨터에 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
KR1020187012387A 2014-05-01 2015-03-16 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체 KR101870962B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014094758 2014-05-01
JPJP-P-2014-094758 2014-05-01
PCT/JP2015/057727 WO2015166733A1 (ja) 2014-05-01 2015-03-16 符号化装置、復号装置、及びその方法、プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020167030130A Division KR101855945B1 (ko) 2014-05-01 2015-03-16 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체

Publications (2)

Publication Number Publication Date
KR20180050762A KR20180050762A (ko) 2018-05-15
KR101870962B1 true KR101870962B1 (ko) 2018-06-25

Family

ID=54358473

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020187012387A KR101870962B1 (ko) 2014-05-01 2015-03-16 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체
KR1020167030130A KR101855945B1 (ko) 2014-05-01 2015-03-16 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체
KR1020187012383A KR101870947B1 (ko) 2014-05-01 2015-03-16 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체
KR1020187012384A KR101870957B1 (ko) 2014-05-01 2015-03-16 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체

Family Applications After (3)

Application Number Title Priority Date Filing Date
KR1020167030130A KR101855945B1 (ko) 2014-05-01 2015-03-16 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체
KR1020187012383A KR101870947B1 (ko) 2014-05-01 2015-03-16 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체
KR1020187012384A KR101870957B1 (ko) 2014-05-01 2015-03-16 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체

Country Status (8)

Country Link
US (5) US10418042B2 (ko)
EP (4) EP3706121B1 (ko)
JP (4) JP6270993B2 (ko)
KR (4) KR101870962B1 (ko)
CN (4) CN106415715B (ko)
ES (4) ES2822127T3 (ko)
PL (4) PL3706121T3 (ko)
WO (1) WO2015166733A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101870962B1 (ko) 2014-05-01 2018-06-25 니폰 덴신 덴와 가부시끼가이샤 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체
US11093247B2 (en) 2017-12-29 2021-08-17 Intel Corporation Systems and methods to load a tile register pair
US11809869B2 (en) 2017-12-29 2023-11-07 Intel Corporation Systems and methods to store a tile register pair to memory
US11023235B2 (en) 2017-12-29 2021-06-01 Intel Corporation Systems and methods to zero a tile register pair
US11789729B2 (en) 2017-12-29 2023-10-17 Intel Corporation Systems and methods for computing dot products of nibbles in two tile operands
US11816483B2 (en) 2017-12-29 2023-11-14 Intel Corporation Systems, methods, and apparatuses for matrix operations
US11669326B2 (en) 2017-12-29 2023-06-06 Intel Corporation Systems, methods, and apparatuses for dot product operations
CN109688409B (zh) * 2018-12-28 2021-03-02 北京奇艺世纪科技有限公司 一种视频编码方法及装置
US11281470B2 (en) * 2019-12-19 2022-03-22 Advanced Micro Devices, Inc. Argmax use for machine learning

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
JP3255189B2 (ja) * 1992-12-01 2002-02-12 日本電信電話株式会社 音声パラメータの符号化方法および復号方法
CA2154911C (en) * 1994-08-02 2001-01-02 Kazunori Ozawa Speech coding device
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
EP2154679B1 (en) * 1997-12-24 2016-09-14 BlackBerry Limited Method and apparatus for speech coding
JP3478209B2 (ja) * 1999-11-01 2003-12-15 日本電気株式会社 音声信号復号方法及び装置と音声信号符号化復号方法及び装置と記録媒体
EP1164580B1 (en) * 2000-01-11 2015-10-28 Panasonic Intellectual Property Management Co., Ltd. Multi-mode voice encoding device and decoding device
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP3590342B2 (ja) * 2000-10-18 2004-11-17 日本電信電話株式会社 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP3472279B2 (ja) * 2001-06-04 2003-12-02 パナソニック モバイルコミュニケーションズ株式会社 音声符号化パラメータ符号化方法及び装置
KR100487719B1 (ko) * 2003-03-05 2005-05-04 한국전자통신연구원 광대역 음성 부호화를 위한 엘에스에프 계수 벡터 양자화기
CN101494460B (zh) * 2003-09-02 2012-07-11 日本电信电话株式会社 浮点信号的编码方法、解码方法及其编码器、解码器
BRPI0510303A (pt) * 2004-04-27 2007-10-02 Matsushita Electric Ind Co Ltd dispositivo de codificação escalável, dispositivo de decodificação escalável, e seu método
KR20070012832A (ko) * 2004-05-19 2007-01-29 마츠시타 덴끼 산교 가부시키가이샤 부호화 장치, 복호화 장치 및 이들의 방법
DE602006020686D1 (de) * 2005-01-12 2011-04-28 Nippon Telegraph & Telephone Kodierverfahren und dekodierverfahren mit langzeitvorhersage, vorrichtungen, programm und aufzeichnungsmedium dafür
KR20080049085A (ko) * 2005-09-30 2008-06-03 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
WO2008007698A1 (fr) * 2006-07-12 2008-01-17 Panasonic Corporation Procédé de compensation des pertes de blocs, appareil de codage audio et appareil de décodage audio
EP2102619B1 (en) * 2006-10-24 2017-03-22 Voiceage Corporation Method and device for coding transition frames in speech signals
US7813922B2 (en) * 2007-01-30 2010-10-12 Nokia Corporation Audio quantization
JP5451603B2 (ja) * 2007-06-15 2014-03-26 オランジュ デジタルオーディオ信号の符号化
JP5006774B2 (ja) * 2007-12-04 2012-08-22 日本電信電話株式会社 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
WO2009075326A1 (ja) * 2007-12-11 2009-06-18 Nippon Telegraph And Telephone Corporation 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
ES2409843T3 (es) * 2008-01-24 2013-06-28 Nippon Telegraph And Telephone Corporation Método de codificación, método de decodificación, y dispositivo y programa para los mismos, y medio o soporte de registro o grabación
JP5013293B2 (ja) * 2008-02-29 2012-08-29 日本電信電話株式会社 符号化装置、復号化装置、符号化方法、復号化方法、プログラム、記録媒体
US8576927B2 (en) * 2008-10-10 2013-11-05 Nippon Telegraph And Telephone Corporation Encoding method, encoding device, decoding method, decoding device, program, and recording medium
JP4848049B2 (ja) * 2008-12-09 2011-12-28 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP4735711B2 (ja) * 2008-12-17 2011-07-27 ソニー株式会社 情報符号化装置
JP5253518B2 (ja) * 2008-12-22 2013-07-31 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
CN101521013B (zh) * 2009-04-08 2011-08-17 武汉大学 空间音频参数双向帧间预测编解码装置
WO2010140546A1 (ja) * 2009-06-03 2010-12-09 日本電信電話株式会社 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム及びこれらの記録媒体
GB0917417D0 (en) * 2009-10-05 2009-11-18 Mitsubishi Elec R&D Ct Europe Multimedia signature coding and decoding
KR101397058B1 (ko) * 2009-11-12 2014-05-20 엘지전자 주식회사 신호 처리 방법 및 이의 장치
JP5602769B2 (ja) * 2010-01-14 2014-10-08 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
EP2556502B1 (en) * 2010-04-09 2018-12-26 Dolby International AB Mdct-based complex prediction stereo decoding
WO2012137617A1 (ja) * 2011-04-05 2012-10-11 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP6160072B2 (ja) * 2012-12-06 2017-07-12 富士通株式会社 オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
SG11201603000SA (en) * 2013-10-18 2016-05-30 Fraunhofer Ges Forschung Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
DK3511935T3 (da) * 2014-04-17 2020-11-02 Voiceage Evs Llc Fremgangsmåde, indretning og computerlæsbar ikke-flygtig hukommelse til lineær-prædiktiv kodning og afkodning af lydsignaler efter overgang mellem rammer med forskellige afsøgningshastigheder
KR101870962B1 (ko) * 2014-05-01 2018-06-25 니폰 덴신 덴와 가부시끼가이샤 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체
US9747910B2 (en) * 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FRANK K. SOONG, et al. Line spectrum pair (LSP) and speech data compression. IEEE International Conference on Acoustics, Speech, and Signal Processing(ICASSP'84), 1984. pp.37-40.
ITU-T Recommendation. G.718. Frame error robust narrow-band and wideband embedded variable bit-rate coding of speechand audio from 8-32 kbit/s. ITU-T, 2008.06.

Also Published As

Publication number Publication date
EP3859734A1 (en) 2021-08-04
CN106415715B (zh) 2019-11-01
CN110444215A (zh) 2019-11-12
CN110444216A (zh) 2019-11-12
US11670313B2 (en) 2023-06-06
ES2744904T3 (es) 2020-02-26
EP3139382B1 (en) 2019-06-26
ES2911527T3 (es) 2022-05-19
JPWO2015166733A1 (ja) 2017-04-20
EP3706121A1 (en) 2020-09-09
EP3544004B1 (en) 2020-08-19
ES2822127T3 (es) 2021-04-29
US11120809B2 (en) 2021-09-14
CN110444216B (zh) 2022-10-21
CN110444217A (zh) 2019-11-12
KR20160138533A (ko) 2016-12-05
CN106415715A (zh) 2017-02-15
PL3706121T3 (pl) 2021-11-02
JP6270993B2 (ja) 2018-01-31
EP3139382A1 (en) 2017-03-08
JP6490846B2 (ja) 2019-03-27
PL3139382T3 (pl) 2019-11-29
EP3544004A1 (en) 2019-09-25
US11694702B2 (en) 2023-07-04
CN110444215B (zh) 2022-10-21
JP6462104B2 (ja) 2019-01-30
JP2018077502A (ja) 2018-05-17
PL3544004T3 (pl) 2020-12-28
KR101855945B1 (ko) 2018-05-10
CN110444217B (zh) 2022-10-21
US20230306976A1 (en) 2023-09-28
JP2018063458A (ja) 2018-04-19
KR101870947B1 (ko) 2018-06-25
US10418042B2 (en) 2019-09-17
EP3859734B1 (en) 2022-01-26
WO2015166733A1 (ja) 2015-11-05
EP3706121B1 (en) 2021-05-12
US20190355369A1 (en) 2019-11-21
KR20180050762A (ko) 2018-05-15
PL3859734T3 (pl) 2022-04-11
JP2018084842A (ja) 2018-05-31
EP3139382A4 (en) 2017-11-22
JP6484358B2 (ja) 2019-03-13
US20210335374A1 (en) 2021-10-28
KR20180049233A (ko) 2018-05-10
KR101870957B1 (ko) 2018-06-25
KR20180049234A (ko) 2018-05-10
US20210335375A1 (en) 2021-10-28
US20170053656A1 (en) 2017-02-23
ES2876184T3 (es) 2021-11-12

Similar Documents

Publication Publication Date Title
KR101870962B1 (ko) 부호화 장치, 복호 장치 및 그 방법, 프로그램, 기록 매체
JP6495492B2 (ja) 復号装置、及びその方法、プログラム、記録媒体

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant