KR20160137615A - 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체 - Google Patents

부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체 Download PDF

Info

Publication number
KR20160137615A
KR20160137615A KR1020167029792A KR20167029792A KR20160137615A KR 20160137615 A KR20160137615 A KR 20160137615A KR 1020167029792 A KR1020167029792 A KR 1020167029792A KR 20167029792 A KR20167029792 A KR 20167029792A KR 20160137615 A KR20160137615 A KR 20160137615A
Authority
KR
South Korea
Prior art keywords
variable length
sequence
length coding
periodicity
frequency
Prior art date
Application number
KR1020167029792A
Other languages
English (en)
Other versions
KR101839016B1 (ko
Inventor
타케히로 모리야
유타카 카마모토
노보루 하라다
Original Assignee
니폰 덴신 덴와 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 니폰 덴신 덴와 가부시끼가이샤 filed Critical 니폰 덴신 덴와 가부시끼가이샤
Publication of KR20160137615A publication Critical patent/KR20160137615A/ko
Application granted granted Critical
Publication of KR101839016B1 publication Critical patent/KR101839016B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

음향 신호의 피치 주기에 기인하는 피크의 부근에서의 근사 정밀도가 좋은 주파수 영역의 포락 계열을 적은 부호량으로 재현할 수 있는 부호화 장치, 복호 장치를 제공한다. 본 발명의 부호화 장치는 주기성 통합 포락 생성부와 가변 길이 부호화부를 구비한다. 주기성 통합 포락 생성부는 입력 음향 신호로부터 구한 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성한다. 가변 길이 부호화부는 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화한다. 본 발명의 복호 장치는 주기성 통합 포락 생성부와 가변 길이 복호부를 구비한다. 주기성 통합 포락 생성부는 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성한다. 가변 길이 복호부는 가변 길이 부호를 복호하여 주파수 영역의 계열을 얻는다.

Description

부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체{ENCODING DEVICE, DECODING DEVICE, ENCODING METHOD, DECODING METHOD, ENCODING PROGRAM, DECODING PROGRAM, AND RECORDING MEDIUM}
본 발명은 음향 신호의 스펙트럼 포락을 이용하여 음향 신호를 부호화, 복호화하는 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램 및 기록매체에 관한 것이다.
저비트(예를 들면, 10kbit/s∼20kbit/s 정도)의 음성 신호나 음향 신호의 부호화 방법으로서, DFT(이산 푸리에 변환)나 MDCT(변형 이산 코사인 변환) 등의 직교 변환 계수에 대한 적응 부호화가 알려져 있다. 예를 들면, 비특허문헌 1에서 사용되고 있는 TCX(transform coded excitation: 변환 부호화 여진) 부호화 방법에서는, 입력된 음 신호의 주파수 영역 표현인 계수열(X[1],…, X[N])로부터 진폭 스펙트럼 포락의 영향을 제거한 계열(정규화 계수열(XN[1],…, XN[N]))을 구하고, 이것을 가변 길이 부호화한다. 단, [] 내의 N은 양의 정수이다.
진폭 스펙트럼 포락은 이하의 수순으로 산출된다.
(step 1) 소정의 시간 구간인 프레임 단위로, 입력된 시간 영역의 음향 디지털 신호(이하, 입력 음향 신호)에 대한 선형 예측 분석을 행하여 선형 예측 계수(α1,…, αP)를 구한다. 단, P는 예측 차수를 나타내는 양의 정수이다. 예를 들면, 전극형(全極型) 모델인 P차 자기 회귀 과정에 의해, 시각(t)에서의 입력 음향 신호(x(t))는 P 시점까지 거슬러 올라간 과거의 자기 자신의 값(x(t-1),…, x(t-P))과 예측 잔차(e(t))와 선형 예측 계수(α1,…, αP)에 의해 식 (1)로 표시된다.
x(t)=α1x(t-1)+ …+αpx(t-P)+e(t) (1)
(step 2) 선형 예측 계수(α1,…, αP)를 양자화하고, 양자화된 선형 예측 계수(^α1,…, ^αP)를 구한다. 양자화된 선형 예측 계수(^α1,…, ^αP)를 사용하여 N점의 입력 음향 신호의 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다. 예를 들면, 진폭 스펙트럼 포락 계열의 각 값(W[n])은 식 (2)로 구할 수 있다. 단, n은 1≤n≤N의 정수, exp(·)은 네이피어수를 밑으로 하는 지수함수, j는 허수 단위, σ는 예측 잔차 신호의 진폭이다.
[수1]
Figure pct00001
또한, 본 명세서에서는, 우측 어깨에 각괄호 없이 표기되어 있는 기호는 멱승 연산을 나타낸다. 즉, σ2는 σ의 2승을 나타낸다. 또한 글 중에서 사용하는 기호 「」 「^」등은 원래 직후의 문자의 바로 위에 기재되어야 할 것이지만, 텍스트기법의 제한에 의해, 당해 문자의 직전에 기재한다. 수식 중에서는 이들 기호는 본래의 위치, 즉 문자의 바로 위에 기술하고 있다.
Anthony Vetro, "MPEG Unified Speech and Audio Coding", Industry and Standards, IEEE MultiMedia, April-June, 2013.
(발명의 개요)
(발명이 해결하고자 하는 과제)
음향 신호의 부호화에서는, 복호측에서도 스펙트럼 포락의 정보를 얻기 위해, 스펙트럼 포락에 대응하는 부호를 복호측에 전달할 필요가 있다. 비특허문헌 1과 같이 선형 예측 계수에 의해 스펙트럼 포락을 구하는 경우에는, 복호측으로 보내는 「스펙트럼 포락에 대응하는 부호」는 「선형 예측 계수에 대응하는 부호」이며, 부호량이 적어도 된다고 하는 이점이 있다. 한편, 선형 예측 계수에 의해 구한 스펙트럼 포락의 정보는 입력 음향 신호의 피치 주기에 기인하는 피크의 부근에서의 근사 정밀도가 나빠지는 경우가 있고, 이것이 정규화 계수열을 가변 길이 부호화할 때의 부호화 효율의 저하로 이어지는 경우가 있다.
이러한 문제를 감안하여, 본 발명에서는, 음향 신호의 피치 주기에 기인하는 피크의 부근에서의 근사 정밀도가 좋은 주파수 영역의 포락 계열을 적은 부호량으로 재현할 수 있는 부호화 장치, 복호 장치를 제공한다.
본 발명의 부호화 장치는 주기성 통합 포락 생성부와 가변 길이 부호화부를 구비한다. 주기성 통합 포락 생성부는, 소정 시간 구간의 입력 음향 신호로부터 구한 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 입력 음향 신호로부터 구한 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성한다. 가변 길이 부호화부는 주기성 통합 포락 계열의 값이 큰 주파수일수록, 입력 음향 신호의 진폭이 큰 것을 전제로, 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화한다. 본 발명의 복호 장치는 주기성 통합 포락 생성부와 가변 길이 복호부를 구비한다. 주기성 통합 포락 생성부는 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성한다. 가변 길이 복호부는 주기성 통합 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로, 가변 길이 부호를 복호하여 주파수 영역의 계열을 얻는다.
본 발명의 부호화 장치와 복호 장치에 의하면, 입력 음향 신호의 피치 주기에 기인하는 피크 부근에서의 근사 정밀도가 좋은 주파수 영역의 포락 계열을 적은 부호량으로 재현할 수 있는 부호화, 복호를 행하므로, 음향 신호의 부호화 효율이 좋다.
도 1은 실시예 1의 주기성 통합 포락 계열 생성 장치의 기능구성예를 나타내는 도면.
도 2는 실시예 1의 주기성 통합 포락 계열 생성 장치의 처리 흐름을 나타내는 도면.
도 3은 주기성 포락 계열(P[1],…, P[N])의 예를 나타내는 도면.
도 4는 동일한 음향 신호에 대하여 생성된 계열의 차이를 설명하기 위한 예를 나타내는 도면.
도 5는 실시예 2의 부호화 장치의 기능구성예를 나타내는 도면.
도 6은 실시예 2의 부호화 장치의 처리 흐름을 나타내는 도면.
도 7은 실시예 2의 복호 장치의 기능구성예를 나타내는 도면.
도 8은 실시예 2의 복호 장치의 처리 흐름을 나타내는 도면.
도 9는 실시예 3의 부호화 장치의 기능구성예를 나타내는 도면.
도 10은 실시예 3의 부호화 장치의 처리 흐름을 나타내는 도면.
도 11은 실시예 3의 복호 장치의 기능구성예를 나타내는 도면.
도 12는 실시예 3의 복호 장치의 처리 흐름을 나타내는 도면.
(발명을 실시하기 위한 형태)
이하, 본 발명의 실시형태에 대해, 상세하게 설명한다. 또한, 동일한 기능을 갖는 구성부에는 동일한 번호를 붙이고, 중복 설명을 생략한다.
실시예 1
도 1에 본 발명의 주기성 통합 포락 계열 생성 장치의 기능구성예를, 도 2에 본 발명의 주기성 통합 포락 계열 생성 장치의 처리 흐름을 나타낸다. 주기성 통합 포락 계열 생성 장치(100)는 스펙트럼 포락 계열 계산부(120), 주파수 영역 변환부(110), 주기성 분석부(130), 주기성 포락 계열 생성부(140), 주기성 통합 포락 생성부(150)를 구비하고, 입력된 시간 영역의 음향 디지털 신호를 입력 음향 신호(x(t))로 하고, 계수열의 주파수 성분에 기초하여 진폭 스펙트럼 포락 계열을 변형한 주기성 통합 포락 계열을 생성한다.
<스펙트럼 포락 계열 계산부(120)>
스펙트럼 포락 계열 계산부(120)는, 입력 음향 신호(x(t))의 시간 영역의 선형 예측에 기초하여, 입력 음향 신호의 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 계산한다(S120). 단, N은 양의 정수이다. 스펙트럼 포락 계열 계산부(120)는 종래기술과 동일하며, 이하의 수순으로 계산하면 된다.
(step 1) 소정의 시간 구간인 프레임 단위로, 입력 음향 신호에 대한 선형 예측 분석을 행하여 선형 예측 계수(α1,…, αP)를 구한다. 단, P는 예측 차수를 나타내는 양의 정수이다. 예를 들면, 전극형 모델인 P차 자기 회귀 과정에 의해, 시각(t)에서의 입력 음향 신호(x(t))는 P 시점까지 거슬러 올라간 과거의 자기 자신의 값(x(t-1),…, x(t-P))과 예측 잔차(e(t))와 선형 예측 계수(α1,…, αP)에 의해 식 (1)로 표시된다.
(step 2) 선형 예측 계수(α1,…, αP)를 사용하여 N점의 입력 음향 신호의 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다. 예를 들면, 진폭 스펙트럼 포락 계열의 각 값(W[n])은 선형 예측 계수(α1,…, αP)에 대응하는 양자화된 선형 예측 계수(^α1,…, ^αP)를 사용하여 식 (2)로 구할 수 있다. 또는, 진폭 스펙트럼 포락 계열의 각 값(W[n])은 선형 예측 계수(α1,…, αP)를 사용하여, 식 (2)의 ^αp를 αp로 치환한 식으로 구할 수 있다.
<주파수 영역 변환부(110)>
주파수 영역 변환부(110)는, 소정의 시간 구간인 프레임 단위로, 입력된 시간 영역의 입력 음향 신호를 주파수 영역의 N점의 계수열(X[1],…, X[N])로 변환하여 출력한다(S110). 주파수 영역으로의 변환은 MDCT(변형 이산 코사인 변환)나 DFT(이산 푸리에 변환) 등의 방법으로 행하면 된다.
<주기성 분석부(130)>
주기성 분석부(130)는 계수열(X[1],…, X[N])을 입력으로 하고, 당해 계수열(X[1],…, X[N])의 주기(T)를 구하고, 주기(T)를 출력한다(S130).
주기(T)는 입력 음향 신호에 유래하는 주파수 영역의 계수열, 예를 들면, 계수열(X[1],…, X[N])의 주기성을 갖는 성분의 간격(계수열이 주기적으로 큰 값이 되는 간격)에 대응하는 정보이다. 이하에서는 주기(T)를 간격(T)으로 표현하는 경우도 있지만, 표현상의 차이뿐이며, 동일한 것이다. T는 양의 값이며, 정수이어도 되고, 소수(예를 들면, 5.0, 5.25, 5.5, 5.75)이어도 된다.
또한 주기성 분석부(130)는, 필요에 따라, 계수열(X[1],…, X[N])을 입력으로 하여, 주기성의 정도를 나타내는 지표(S)도 구하여 출력해도 된다. 이 경우, 예를 들면, 계수열(X[1],…, X[N])의 주기성을 갖는 성분의 부분의 에너지와 그 이외의 부분의 에너지와의 비 등에 기초하여 주기성의 정도를 나타내는 지표(S)를 구한다. 이 경우에는, 지표(S)는 주파수 영역의 샘플열의 주기성의 정도를 나타내는 지표가 된다. 또한, 주기성을 갖는 성분의 크기가 클수록, 즉, 주기(T)의 정수배의 샘플이나 그 근방에 있는 샘플의 진폭(샘플값의 절대값)이 클수록, 주파수 영역의 샘플열의 「주기성의 정도」는 크다.
또한, 주기성 분석부(130)는 시간 영역의 입력 음향 신호로부터 시간 영역의 주기를 구하고, 구한 시간 영역의 주기를 주파수 영역의 주기로 변환함으로써 주기(T)를 구해도 된다. 또한 시간 영역의 주기를 주파수 영역의 주기로 변환한 것의 상수배나 그 근방의 값을 주기(T)로서 구해도 된다. 마찬가지로, 주기성 분석부(130)는 시간 영역의 입력 음향 신호로부터, 예를 들면, 시간 영역의 주기분만큼 시간이 벗어난 신호열 간의 상관의 크기 등에 기초하여 주기성의 정도를 나타내는 지표(S)를 구해도 된다.
요컨대, 시간 영역의 입력 음향 신호나 그것에 유래하는 주파수 영역 계수열로부터 주기(T)나 지표(S)를 구하는 방법은, 종래부터 여러 방법이 존재하므로, 그 어느 방법을 선택하여 이용해도 된다.
<주기성 포락 계열 생성부(140)>
주기성 포락 계열 생성부(140)는 간격(T)을 입력으로 하고, 주기성 포락 계열(P[1],…, P[N])을 출력한다(S140). 주기성 포락 계열(P[1],…, P[N])은 피치 주기에 기인하는 주기로 피크를 갖는 주파수 영역의 이산 계열, 즉 조파 모델에 대응하는 이산 계열이다. 도 3에 주기성 포락 계열(P[1],…, P[N])의 예를 나타낸다. 주기성 포락 계열(P[1],…, P[N])은, 도 3에 도시된 파형과 같이, 간격(T)의 정수배 근방의 정수값인 인덱스와, 그 전후 소정수의 인덱스에 대응하는 주기성 포락의 값만 양의 값을 취하고, 그 이외는 0인 것과 같은 계열이다. 간격(T)의 정수배 근방의 정수값인 인덱스가 주기적으로 최대값(피크)을 취하고, 그 전후 소정수의 인덱스에 대응하는 P[n]의 값은 그 인덱스(n)가 피크에 대응하는 인덱스로부터 벗어남에 따라 단조 감소하는 관계에 있다. 도 3의 가로축의 1, 2,…,는 이산화 샘플점의 인덱스(이하, 「주파수 인덱스」)를 나타낸다.
예를 들면, n을 주파수 인덱스를 나타내는 변수로 하고, τ를 극대값(피크)에 대응하는 주파수 인덱스로 하여, 피크의 형상은 이하의 함수(Q(n))로 나타낼 수 있다. 단, 간격(T)의 소수점 이하의 자릿수가 L자리이며, 간격(T')을 T'=T×2L로 한다.
[수2]
Figure pct00002
h는 피크의 높이를 나타내며, 간격(T)이 클수록 피크의 높이가 높아진다. 또한 PD는 피크 부분의 폭을 나타내고, 간격(T)이 클수록 폭이 넓어진다.
U를 1부터 피크의 수까지를 나타내는 양의 정수(예를 들면, 도 4의 경우에는 1∼10)로 하고, v를 1 이상의 정수(예를 들면, 1부터 3 정도)로 하고, floor(·)를 소수점 이하를 절사하여 정수값으로 하는 함수라고 하면, 주기성 포락 계열(P[n])은, 예를 들면,
[수3]
Figure pct00003
과 같이 계산하면 된다. 단, (U×T')/2L-v≤n≤(U×T')/2L+v이다. 예를 들면, L=2의 경우, T=20.00이면 T'=80, T=20.25이면 T'=81, T=20.50이면 T'=82, T=20.75이면 T'=83이다. 또한, 주기성 포락 계열(P[n])은 소수점 첫째 자리를 사사오입하여 정수값으로 하는 함수(Round(·))를 사용하여,
[수4]
Figure pct00004
와 같이 구해도 된다.
<주기성 통합 포락 생성부(150)>
주기성 통합 포락 생성부(150)는, 적어도, 주기성 포락 계열(P[1],…, P[N]), 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 입력으로 하고, 주기성 통합 포락 계열(WM[1],…, WM[N])을 구한다(S150). 구체적으로는, 주기성 통합 포락(WM[n])을 다음 식과 같이 구한다.
[수5]
Figure pct00005
또한, δ는 주기성 통합 포락(WM[n])과 계수(X[n])의 절대값 계열의 형상이 근접하도록 결정되는 값 또는 미리 정한 값이다.
주기성 통합 포락 생성부(150)에 있어서 주기성 통합 포락(WM[n])과 계수(X[n])의 절대값 계열의 형상이 근접하도록 δ를 결정하는 경우에는, 주기성 통합 포락 생성부(150)는 계수열(X[1],…, X[N])도 입력으로 하고, 결정된 δ와 그때의 주기성 통합 포락 계열(WM[1],…, WM[N])을 출력하면 된다. 예를 들면, δ는, 몇 개의 δ의 후보, 예를 들면, 0.4와 0.8의 2개를 δ의 후보 중에서 이하의 식에 의해 정의되는 E가 최소가 되는 δ로 정하면 된다. 바꿔 말하면, 주기성 통합 포락(WM[n])과 계수(X[n])의 절대값 계열의 형상이 까까워지는 δ로 정하면 된다.
[수6]
Figure pct00006
δ는 주기성 통합 포락(WM[n])에 있어서 주기성 포락(P[n])을 어느 정도 고려할지를 정하는 값이다. 바꿔 말하면, δ는 주기성 통합 포락(WM[n])에 있어서의 진폭 스펙트럼 포락(W[n])과 주기성 포락(P[n])의 혼합비율을 정하는 값이라고 할 수 있다. 또한 식 (9)의 G는 계수열(X[1],…, X[N])의 각 계수(X[n])의 절대값의 계열과 주기성 통합 포락 계열의 역수의 계열의 내적이다. 식 (8)의 WM[n]은 주기성 통합 포락의 각 값(WM[n])을 G로 정규화한 정규화 주기성 통합 포락이다. 식 (7)에 있어서, 계수열(X[1],…, X[N])과 정규화 주기성 통합 포락 계열(WM[1],…, WM[N])의 내적의 4승을 계산하고 있는 것은, 특히 절대값이 큰 계수(X[n])를 강조하여 내적을 취한 값(거리)을 작게 하는 것을 의도하고 있다. 즉, 계수열(X[1],…, X[N]) 중에서 특히 절대값이 큰 계수(X[n])와 주기성 통합 포락(WM[n])이 가까워지도록 δ를 결정하는 것을 의미하고 있다.
또한 주기성 통합 포락 생성부(150)에 있어서 주기성의 정도에 따라 δ의 후보수를 결정하는 경우에는, 주기성 통합 포락 생성부(150)는 주기성의 정도를 나타내는 지표(S)도 입력으로 하고, 지표(S)가 주기성이 높은 것에 대응하는 프레임인 것을 나타내고 있는 경우에는 많은 후보수의 δ의 후보 중에서 식 (7)로 정의되는 E가 최소가 되는 δ를 선택하고, 지표(S)가 주기성이 낮은 것에 대응하는 프레임인 것을 나타내고 있는 경우에는 δ를 미리 정한 값으로 해도 된다. 즉, 주기성 통합 포락 생성부(150)에 있어서 주기성의 정도에 따라 δ의 후보수를 결정하는 경우에는, 주기성이 높을수록 δ의 후보의 수를 많게 하면 된다.
<실시예 1의 발명의 효과>
도 4에 동일한 음향 신호에 대해 생성된 계열의 차이를 설명하기 위한 예를 나타낸다. 도 4(a)에 계수열(X[1],…, X[N])을 보간한 곡선의 형상을, 도 4(b)에 주기성 포락 계열(P[1],…, P[N])을 보간한 곡선의 형상을, 도 4(c)에 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 보간한 곡선의 형상을, 도 4(d)에 주기성 통합 포락 계열(WM[1],…, WM[N])을 보간한 곡선의 형상을 나타낸다. 도 4에 도시하는 바와 같이, 주기성 통합 포락 계열(WM[1],…, WM[N])은 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])에 비해, 계수열(X[1],…, X[N])에 나타내는 주기적인 피크를 포함한 형상으로 되어 있다. 또한 주기성 통합 포락 계열(WM[1],…, WM[N])은 스펙트럼 포락을 나타내는 정보인 선형 예측 계수 또는 양자화된 선형 예측 계수 이외에, 간격(T), 또는, 간격(T)과 값(δ)의 정보가 있으면 생성할 수 있다. 따라서, 입력 음향 신호의 스펙트럼 포락을 나타내는 정보에 적은 정보량을 추가하는 것만으로, 입력 음향 신호의 피치 주기에 기인하는 진폭의 피크를, 선형 예측 계수에 의해 구하는 스펙트럼 포락보다 고정밀도로 표현할 수 있다. 즉, 선형 예측 계수 또는 양자화된 선형 예측 계수와, 간격(T), 또는, 간격(T)과 값(δ)의 적은 정보량으로 입력 음향 신호의 진폭을 고정밀도로 추정하는 것이 가능하게 된다. 또한, 평활화 진폭 스펙트럼 포락(W[n])은 다음 식으로 나타내는 포락이며, γ는 진폭 스펙트럼 계수를 둔하게 하기(평활화하기) 위한 1 이하의 양의 상수이다.
[수7]
Figure pct00007
또한 본 발명의 주기성 통합 포락 계열 생성 장치를 부호화 장치와 복호 장치에서 사용하는 경우에는, 부호화 장치에 포함되는 주기성 통합 포락 계열 생성 장치 이외의 처리부에서 얻어진 양자화된 선형 예측 계수(^αp)를 특정하는 부호(선형 예측 계수 부호(CL))와 주기(T)나 시간 영역의 주기를 특정하는 부호(주기 부호(CT))가 복호 장치에 입력되므로, 본 발명의 주기성 통합 포락 계열 생성 장치로부터는 δ의 정보를 나타내는 부호를 출력하면, 복호측의 주기성 통합 포락 계열 생성 장치에서도 부호화측의 주기성 통합 포락 계열 생성 장치에서 생성한 주기성 통합 포락 계열과 동일한 주기성 통합 포락 계열을 생성할 수 있다. 따라서, 부호화 장치로부터 복호 장치에 부호를 보낼 때에 증가하는 부호량은 적다.
<실시예 1의 발명의 포인트>
실시예 1의 주기성 통합 포락 계열 생성 장치(100)에서는, 주기성 통합 포락 생성부(150)가 계수열(X[1],…, X[N])의 주기성 성분에 기초하여 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 변형하여, 주기성 통합 포락 계열(WM[1],…, WM[N])로 하고 있는 점이 가장 중요한 포인트이다. 특히, 계수열(X[1],…, X[N])의 주기성의 정도가 클수록, 즉, 주기성을 갖는 성분의 크기가 클수록, 진폭 스펙트럼 포락 계열(W[1],…, W[N]) 중 간격(T)(주기)의 정수배 및 그것들 근방의 샘플의 값을 크게 변경하면, 상기의 효과를 얻기 쉽다. 「근방의 샘플」이란 간격(T)의 정수배 근방의 정수값인 인덱스로 표시되는 샘플이다. 또한 「근방」이란, 예를 들면, 식 (3)∼(5) 등의 미리 정한 방법으로 결정되는 범위로 하면 된다.
또한 계수열(X[1],…, X[N])의 주기성을 갖는 성분의 간격(T)이 넓을수록, 식 (4)와 식 (5)에 표시된 주기성 포락 계열(P[1],…, P[N])은 큰 값을 가지고, 넓은 폭에서, 즉, 간격(T)(주기)의 정수배 및 그것들 근방의 많은 샘플에서, 0 이외의 값을 갖는다. 즉, 주기성 통합 포락 생성부(150)는 계수열의 주기성을 갖는 성분의 간격(T)이 넓을수록, 진폭 스펙트럼 포락 계열 중 간격(T)(주기)의 정수배 및 그것들 근방의 샘플의 값을 크게 변경한다. 또한 주기성 통합 포락 생성부(150)는 계수열의 주기성을 갖는 성분의 간격(T)이 넓을수록, 진폭 스펙트럼 포락 계열을 넓은 폭에서, 즉, 간격(T)(주기)의 정수배 및 그것들 근방의 많은 샘플에서, 샘플값을 변경한다. 「근방의 많은 샘플에서」란 「근방」에 해당하는 범위(미리 정한 방법으로 결정되는 범위)에 존재하는 샘플을 많게 하는 것을 의미하고 있다. 즉, 주기성 통합 포락 생성부(150)는 이렇게 진폭 스펙트럼 포락 계열을 변형하면, 상기의 효과를 얻기 쉽다.
또한, 주기성 통합 포락 계열이 갖는 「입력 음향 신호의 피치 주기에 기인하는 진폭의 피크를 보다 고정밀도로 표현할 수 있다.」고 하는 특징을 효과적으로 이용하는 예로서는 부호화 장치와 복호 장치가 있으며, 이 예를 실시예 2, 3에 나타내고 있다. 단, 주기성 통합 포락 계열의 특징의 이용예는 부호화 장치와 복호 장치 이외에도, 잡음 제거 장치나 포스트 필터 등이 있을 수 있다. 따라서, 실시예 1에서는 주기성 통합 포락 계열 생성 장치를 설명하고 있다.
[변형예 1] (정규화 계수열에서 주기성 분석하는 예)
변형예 1의 주기성 통합 포락 계열 생성 장치도 도 1에 나타낸다. 또한 변형예 1의 주기성 통합 포락 계열 생성 장치의 처리 흐름도 도 2에 나타낸다. 주기성 통합 포락 계열 생성 장치(101)는 주파수 영역 계열 정규화부(111)도 구비하는 점과, 스펙트럼 포락 계열 계산부(121), 주기성 분석부(131)가 주기성 통합 포락 계열 생성 장치(100)와 다르고, 그 밖의 구성은 동일하다. 이하에서는 차이점에 대해서만 설명한다.
<스펙트럼 포락 계열 계산부(121)>
스펙트럼 포락 계열 계산부(121)는 진폭 스펙트럼 포락 계열(W[1],…, W[N])뿐만 아니라, 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])도 구한다.
구체적으로는, 스펙트럼 포락 계열 계산부(121)는 스펙트럼 포락 계열 계산부(120)에서 나타낸 (step 1), (step 2)와 더불어 이하의 수순의 처리를 행한다.
(step 3) 양자화된 선형 예측 계수(^αp)의 각각에 γp를 승산하고, 양자화된 평활화 선형 예측 계수(^α1γ, ^α2γ2,…, ^αPγP)를 구한다. γ는 평활화하기 위한 1 이하의 양의 상수이다. 그리고, 식 (10)에 의해, 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다(S121). 물론, 스펙트럼 포락 계열 계산부(120)와 마찬가지로, 양자화된 선형 예측 계수(^αp) 대신에 선형 예측 계수(αp)를 사용해도 된다.
<주파수 영역 계열 정규화부(111)>
주파수 영역 계열 정규화부(111)는 계수열(X[1],…, X[N])의 각 계수를 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])의 각 계수로 제산하여 정규화 계수열(XN[1],…, XN[N])을 얻는다.
즉, n=1,…, N에 대하여
XN[n]=X[n]/W[n] (11)
의 계산을 행하고, 정규화 계수열(XN[1],…, XN[N])을 구한다(S111).
<주기성 분석부(131)>
주기성 분석부(131)는 정규화 계수열(XN[1],…, XN[N])을 입력으로 하고, 당해 정규화 계수열(XN[1],…, XN[N])의 주기(T)를 구하고, 주기(T)를 출력한다(S131). 즉, 본 변형예에서는, 입력 음향 신호에 유래하는 주파수 영역의 계수열인 정규화 계수열(XN[1],…, XN[N])의 주기성을 갖는 성분의 간격을 주기(T)로서 구한다. 또한 주기성 분석부(131)는, 필요에 따라, 계수열(X[1],…, X[N])을 입력으로 하여, 주기성의 정도를 나타내는 지표(S)도 구하여 출력해도 된다.
그 밖의 처리는 주기성 통합 포락 계열 생성 장치(100)와 동일하다. 따라서, 실시예 1과 동일한 효과가 얻어진다. 또한, 주기성 통합 포락 계열 생성 장치(101)의 경우에는, 주기성 통합 포락 생성부(150)는 진폭 스펙트럼 포락 계열(W[1],…, W[N]) 대신에 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 사용해도 된다. 이 경우에는, 식 (6) 대신에 다음 식의 계산이 된다.
[수8]
Figure pct00008
[변형예 2] (외부로부터 정보가 입력되는 예)
본 발명의 주기성 통합 포락 계열 생성 장치를 부호화 장치나 복호 장치가 내부에 구비하고 있는 경우에는, 부호화 장치나 복호 장치에 포함되는 주기성 통합 포락 계열 생성 장치 이외의 처리부에서, 계수열(X[1],…, X[N]), 정규화 계수열(XN[1],…, XN[N]), 양자화된 선형 예측 계수(^αp), 양자화된 평활화 선형 예측 계수(^αpγp), 진폭 스펙트럼 포락(W[1],…, W[N]), 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 주기(T), 지표(S) 등이 구해지고 있는 경우가 있다. 이러한 경우에는, 주기성 통합 포락 계열 생성 장치에, 주파수 영역 변환부, 주파수 영역 정규화부, 스펙트럼 포락 계열 계산부, 주기성 분석부의 적어도 어느 하나를 구비하지 않는 구성으로 해도 된다. 이 경우에는, 부호화 장치 내의 주기성 통합 포락 계열 생성 장치 이외의 처리부로부터, 양자화된 선형 예측 계수(^αp)를 특정하는 부호(선형 예측 계수 부호(CL)), 주기(T)나 시간 영역의 주기를 특정하는 부호(주기 부호(CT)), 지표(S)를 특정하는 부호 등이 출력되고, 복호 장치에 입력된다. 따라서, 이 경우에는, 부호화 장치 내의 주기성 통합 포락 계열 생성 장치로부터는, 양자화된 선형 예측 계수(^αp)를 특정하는 부호(선형 예측 계수 부호(CL)), 주기(T)나 시간 영역의 주기를 특정하는 부호(주기 부호(CT)), 지표(S)를 특정하는 부호 등을 출력할 필요가 없다.
또한 본 발명의 주기성 통합 포락 계열 생성 장치를 부호화 장치나 복호 장치에서 사용하는 경우에는, 부호화 장치와 복호 장치와 동일한 주기성 통합 포락 계열이 얻어지도록 할 필요가 있다. 따라서, 부호화 장치가 출력하고 복호 장치에 입력되는 부호로부터 특정 가능한 정보를 사용하여 주기성 통합 포락 계열을 얻을 필요가 있다. 예를 들면, 부호화 장치에서 사용하는 주기성 통합 포락 계열 생성 장치의 스펙트럼 포락 계열 계산부에서는, 선형 예측 계수 부호(CL)에 대응하는 양자화된 선형 예측 계수를 사용하여 진폭 스펙트럼 포락 계열을 구하고, 복호 장치에서 사용하는 주기성 통합 포락 계열 생성 장치의 스펙트럼 포락 계열 계산부에서는, 부호화 장치로부터 출력되어 복호 장치에 입력되는 선형 예측 계수 부호(CL)에 대응하는 복호 선형 예측 계수를 사용하여 진폭 스펙트럼 포락 계열을 구할 필요가 있다.
또한, 부호화 장치나 복호 장치에서 주기성 통합 포락 계열을 사용하는 경우에는, 전술한 바와 같이 주기성 통합 포락 계열 생성 장치를 내부에 구비하는 것이 아니고, 주기성 통합 포락 계열 생성 장치 내의 필요한 처리부를 부호화 장치와 복호 장치에 구비하도록 하면 된다. 이러한 부호화 장치나 복호 장치는 실시예 2에서 설명한다.
실시예 2
≪부호화 장치≫
도 5에 실시예 2의 부호화 장치의 기능구성예를, 도 6에 실시예 2의 부호화 장치의 처리 흐름을 나타낸다. 부호화 장치(200)는 스펙트럼 포락 계열 계산부(221), 주파수 영역 변환부(110), 주파수 영역 계열 정규화부(111), 주기성 분석부(230), 주기성 포락 계열 생성부(140), 주기성 통합 포락 생성부(250), 가변 길이 부호화 파라미터 계산부(260), 가변 길이 부호화부(270)를 구비한다. 부호화 장치(200)는 입력된 시간 영역의 음향 디지털 신호를 입력 음향 신호(x(t))로 하고, 적어도 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 정규화 계수열(XN[1],…, XN[N])의 주기를 나타내는 간격(T)의 부호(CT), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 출력한다. 주파수 영역 계열 정규화부(111)는 실시예 1, 변형예 1과 동일하다. 주파수 영역 변환부(110)와 주기성 포락 계열 생성부(140)는 실시예 1과 동일하다. 이하에서는 다른 구성부에 대해 설명한다.
<스펙트럼 포락 계열 계산부(221)>
스펙트럼 포락 계열 계산부(221)는 입력 음향 신호(x(t))의 시간 영역의 선형 예측에 기초하여, 입력 음향 신호의 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 계산하고, 계산의 과정에서 얻은 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL)도 구한다(S221). 단, N은 양의 정수이다. 스펙트럼 포락 계열 계산부(221)는 이하의 수순으로 처리하면 된다.
(step 1) 소정의 시간 구간인 프레임 단위로, 입력 음향 신호에 대한 선형 예측 분석을 행하여 선형 예측 계수(α1,…, αP)를 구한다. 단, P는 예측 차수를 나타내는 양의 정수이다. 예를 들면, 전극형 모델인 P차 자기 회귀 과정에 의해, 시각(t)에서의 입력 음향 신호(x(t))는 P 시점까지 거슬러 올라간 과거의 자기 자신의 값(x(t-1),…, x(t-P))과 예측 잔차(e(t))와 선형 예측 계수(α1,…, αP)에 의해 식 (1)로 표시된다.
(step 2) 선형 예측 계수(α1,…, αP)를 부호화하여 부호(CL)를 얻고 출력함과 아울러, 부호(CL)에 대응하는 양자화된 선형 예측 계수(^α1,…, ^αP)를 구한다. 또한 양자화된 선형 예측 계수(^α1,…, ^αP)를 사용하여 N점의 입력 음향 신호의 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다. 예를 들면, 진폭 스펙트럼 포락 계열의 각 값(W[n])은 식 (2)로 구할 수 있다. 또한, 선형 예측 계수(α1,…, αP)를 부호화하여 부호(CL)를 얻는 방법은, 선형 예측 계수를 LSP 파라미터로 변환하고, LSP 파라미터를 부호화하여 부호(CL)를 얻는 등, 선형 예측 계수로 변환 가능한 계수의 어느 것을 부호화하여 부호(CL)를 얻는 어느 방법을 사용해도 된다.
(step 3) 양자화된 선형 예측 계수(^αp)의 각각에 γp를 승산하고, 양자화된 평활화 선형 예측 계수(^α1γ, ^α2γ2,…, ^αPγP)를 구한다. γ는 미리 정한 평활화하기 위한 1 이하의 양의 상수이다. 그리고, 식 (10)에 의해, 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다.
<주기성 분석부(230)>
주기성 분석부(230)는 정규화 계수열(XN[1],…, XN[N])을 입력으로 하여, 당해 정규화 계수열(XN[1],…, XN[N])의 간격(T)(주기적으로 큰 값이 되는 간격)을 구하고, 간격(T)과 간격(T)을 나타내는 부호(CT)를 출력한다(S230). 또한 주기성 분석부(230)는, 필요에 따라, 주기성의 정도를 나타내는 지표(S)(즉, 주파수 영역의 샘플열의 주기성의 정도를 나타내는 지표)도 구하여 출력한다. 또한 주기성 분석부(230)는, 필요에 따라, 지표(S)를 나타내는 부호(CS)도 얻어서 출력한다. 또한, 지표(S)와 간격(T) 자체는 실시예 1, 변형예 1의 주기성 분석부(131)와 동일하다.
<주기성 통합 포락 생성부(250)>
주기성 통합 포락 생성부(250)는, 적어도, 주기성 포락 계열(P[1],…, P[N]), 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 입력으로 하고, 주기성 통합 포락 계열(WM[1],…, WM[N])을 구하여 주기성 통합 포락(WM[n])을 출력한다. 또한 주기성 통합 포락 생성부(150)는 값(δ)으로서 미리 정한 1개의 값이 아니라, 미리 정한 복수의 후보값 중 어느 하나를 선택하는 경우에는, 계수열(X[1],…, X[N])도 입력으로 하고, 미리 정한 복수의 후보값 중 주기성 통합 포락(WM[n])과 계수(X[n])의 절대값 계열의 형상이 가까워지는 후보값을 값(δ)으로서 구하고, 값(δ)을 나타내는 부호(Cδ)도 출력한다(S250).
주기성 통합 포락(WM[n])과 값(δ)은 실시예 1과 동일하며, 주기성 통합 포락(WM[n])은 식 (6),…, (9)와 같이 구하면 된다. 주기성 통합 포락 생성부(150)에 있어서 주기성의 정도에 따라 δ의 후보수를 결정하는 경우에는, 주기성 통합 포락 생성부(150)는 주기성의 정도를 나타내는 지표(S)도 입력으로 하고, 지표(S)가 주기성이 높은 것에 대응하는 프레임인 경우에는 많은 후보수의 δ의 후보 중에서 식 (7)로 정의되는 E가 최소가 되는 δ를 선택하고, 지표(S)가 주기성이 낮은 것에 대응하는 프레임인 경우에는 δ를 1개의 미리 정한 값으로 해도 된다. 또한, δ를 미리 정한 값으로 하는 경우에는, 값(δ)을 나타내는 부호(Cδ)를 출력할 필요는 없다.
<가변 길이 부호화 파라미터 계산부(260)>
가변 길이 부호화 파라미터 계산부(260)는 주기성 통합 포락 계열(WM[1],…, WM[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 정규화 계수열(XN[1],…, XN[N])을 입력으로 하여, 가변 길이 부호화 파라미터(rn)를 구한다(S260). 가변 길이 부호화 파라미터 계산부(260)는 주기성 통합 포락 계열(WM[1],…, WM[N])로부터 구한 진폭값에 의존하여 가변 길이 부호화 파라미터(rn)를 계산하는 것을 특징으로 하고 있다.
가변 길이 부호화 파라미터는 부호화 대상의 신호, 즉, 정규화 계수열(XN[1],…, XN[N])의 각 계수의 진폭이 취할 수 있는 범위를 특정하는 파라미터이다. 예를 들면, 라이스 부호화의 경우에는 라이스 파라미터가 가변 길이 부호화 파라미터에 상당하고, 산술 부호화의 경우에는 부호화 대상의 신호의 진폭이 취할 수 있는 범위가 가변 길이 부호화 파라미터에 상당한다.
1샘플마다 가변 길이 부호화를 행하는 경우에는, 정규화 계수열의 각 계수(XN[n])에 대해 가변 길이 부호화 파라미터가 계산된다. 복수의 샘플로 이루어지는 샘플군마다(예를 들면, 2샘플씩) 정리하여 가변 길이 부호화를 행하는 경우에는, 샘플군마다 가변 길이 부호화 파라미터가 계산된다. 즉, 가변 길이 부호화 파라미터 계산부(260)는 정규화 계수열의 일부인 정규화 부분 계수열마다, 가변 길이 부호화 파라미터(rn)를 계산한다. 여기에서, 정규화 부분 계수열은 복수개 있고, 복수개의 정규화 부분 계수열에는 정규화 계수열의 계수가 중복되지 않고 포함되는 것으로 한다. 이하에, 1샘플마다 라이스 부호화를 행하는 경우를 예로, 가변 길이 부호화 파라미터의 계산 방법을 설명한다.
(step 1) 정규화 계수열(XN[1],…, XN[N])의 각 계수의 진폭의 평균의 로그를, 기준이 되는 라이스 파라미터(sb)(기준이 되는 가변 길이 부호화 파라미터)로 하여 다음 식과 같이 산출한다.
[수9]
Figure pct00009
sb는 프레임마다 1도만큼 부호화되어, 기준이 되는 라이스 파라미터(기준이 되는 가변 길이 부호화 파라미터)에 대응하는 부호(Csb)로서 복호 장치(400)에 전송된다. 혹은 복호 장치(400)에 전송되는 별도의 정보로부터 정규화 계수열(XN[1],…, XN[N])의 진폭의 평균값을 추정할 수 있는 경우에는, 부호화 장치(200)와 복호 장치(400)에서 공통적으로 진폭의 평균값의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정해 놓아도 된다. 예를 들면, 포락의 기울기를 나타내는 파라미터, 구분대역마다의 평균 포락의 크기를 나타내는 파라미터를 별도 사용하는 부호화의 경우에는, 복호 장치(400)에 전송되는 다른 정보로부터 진폭의 평균값을 추정할 수 있다. 이 경우에는, sb를 부호화하여, 기준이 되는 라이스 파라미터에 대응하는 부호(Csb)를 복호 장치(400)에 출력하지 않아도 된다.
(step 2) 하기 식에 의해 임계값(θ)을 산출한다.
[수10]
Figure pct00010
θ는 주기성 통합 포락 계열의 각 값(WM[n])을 평활화 진폭 스펙트럼 포락 계열의 각 값(W[n])으로 제산한 값의 진폭의 평균의 로그이다.
(step 3) |WM[n]/W[n]|이 θ보다 클수록, 정규화 계수(XN[n])를 라이스 부호화하기 위한 라이스 파라미터(rn)를 sb보다도 큰 값으로서 결정한다. |WM[n]/W[n]|이 θ보다 작을수록, 정규화 계수(XN[n])를 라이스 부호화하기 위한 라이스 파라미터(rn)를 sb보다도 작은 값으로서 결정한다.
(step 4) step 3의 처리를 모든 n=1, 2,…, N에 대해 반복하여, 각 XN[n]에 대한 라이스 파라미터(rn)를 구한다.
<가변 길이 부호화부(270)>
가변 길이 부호화부(270)는 가변 길이 부호화 파라미터 계산부(260)에서 구한 가변 길이 부호화 파라미터(rn)를 사용하여 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화하고, 가변 길이 부호(CX)를 출력한다(S270). 예를 들면, 가변 길이 부호화부(270)는 가변 길이 부호화 파라미터 계산부(260)에서 구한 라이스 파라미터(rn)를 사용하여 정규화 계수열(XN[1],…, XN[N])을 라이스 부호화하고, 얻어진 부호를 가변 길이 부호(CX)로서 출력한다. 가변 길이 부호화 파라미터 계산부(260)에서 구한 라이스 파라미터(rn)는 주기성 통합 포락 계열의 진폭값에 의존하는 가변 길이 부호화 파라미터이며, 주기성 통합 포락 계열의 값이 큰 주파수일수록 큰 값으로 되어 있다. 라이스 부호화는 진폭값에 의존하는 가변 길이 부호화의 공지기술 중 하나이며, 라이스 파라미터(rn)를 사용하여 진폭값에 의존하는 가변 길이 부호화를 행하는 것이다. 또한 주기성 통합 포락 생성부(250)에서 생성한 주기성 통합 포락 계열은 입력 음향 신호의 스펙트럼 포락을 고정밀도로 표현하는 것이다. 즉, 가변 길이 부호화부(270)는, 주기성 통합 포락 계열의 값이 큰 주파수일수록, 상기 입력 음향 신호의 주파수 영역의 계수열인 X[1],…, X[N]의 진폭이 큰 것을 전제로, 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화하고 있는 것으로 되고, 바꿔 말하면, 가변 길이 부호화 파라미터를 사용하여, 진폭값에 의존하는 가변 길이 부호화에 의해, 정규화 계수열(XN[1],…, XN[N])을 부호화하고 있는 것으로 된다. 여기에서 말하는 진폭값이란 부호화 대상의 계수열의 평균 진폭값, 계수열에 포함되는 각 계수의 진폭의 추정값, 계수열의 진폭의 포락의 추정값 등이다.
부호화 장치(200)는 이러한 처리에 의해 얻어진 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 간격(T)을 나타내는 부호(CT), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 출력한다. 또한 필요에 따라 값(δ)을 나타내는 부호(Cδ)와 기준이 되는 가변 길이 부호화 파라미터(sb)를 나타내는 부호(Csb)도 출력한다. 부호화 장치(200)로부터 출력된 부호는 복호 장치(400)에 입력된다.
[부호화 장치의 변형예 1] (외부로부터 정보가 입력되는 예)
또한, 부호화 장치로서는, 주기성 포락 계열 생성부(140)와 주기성 통합 포락 생성부(250)와 가변 길이 부호화 파라미터 계산부(260)와 가변 길이 부호화부(270)만을 구비하고, 부호화 장치의 외부에서 생성된 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과, 정규화 계수열(XN[1],…, XN[N]), 간격(T)과, 필요에 따라 진폭 스펙트럼 포락 계열(W[1],…, W[N])과, 필요에 따라 지표(S)를 입력으로 하고, 가변 길이 부호(CX)를 출력해도 된다.
[부호화 장치의 변형예 2] (계수열(X[n])로부터 간격(T)을 구하는 예)
상술의 주기성 분석부(230)에서는 정규화 계수열(XN[1],…, XN[N])을 입력으로 하여 간격(T)을 구하고 있지만, 주기성 분석부(230)에서는 주파수 영역 변환부(110)가 출력한 계수열(X[1],…, X[N])을 입력으로 하여 간격(T)을 구해도 된다. 이 경우에는, 실시예 1의 주기성 분석부(130)와 동일한 방법으로 간격(T)을 구한다.
≪복호 장치≫
도 7에 실시예 2의 복호 장치의 기능구성예를, 도 8에 실시예 2의 복호 장치의 처리 흐름을 나타낸다. 복호 장치(400)는 스펙트럼 포락 계열 계산부(421), 주기성 포락 계열 생성부(440), 주기성 통합 포락 생성부(450), 가변 길이 부호화 파라미터 계산부(460), 가변 길이 복호부(470), 주파수 영역 계열 역정규화부(411), 주파수 영역 역변환부(410)를 구비한다. 복호 장치(400)는 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 간격(T)을 나타내는 부호(CT), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 수취하고, 음향 신호를 출력한다. 또한, 필요에 따라 값(δ)을 나타내는 부호(Cδ)와 기준이 되는 가변 길이 부호화 파라미터(sb)를 나타내는 부호(Csb)와 지표(S)를 나타내는 부호(CS)도 수취한다. 이하에, 각 구성부의 상세를 나타낸다.
<스펙트럼 포락 계열 계산부(421)>
스펙트럼 포락 계열 계산부(421)는 부호(CL)를 입력으로 하고, 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 계산한다(S421). 보다 구체적으로는, 이하의 수순으로 처리하면 된다.
(step 1) 부호(CL)를 복호하여, 복호 선형 예측 계수(^α1,…, ^αP)를 얻는다.
(step 2) 복호 선형 예측 계수(^α1,…, ^αP)를 사용하여 N점의 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다. 예를 들면, 진폭 스펙트럼 포락 계열의 각 값(W[n])은 식 (2)로 구할 수 있다.
(step 3) 복호 선형 예측 계수(^αp)의 각각에 γp를 승산하여, 복호 평활화 선형 예측 계수(^α1γ, ^α2γ2,…, ^αPγP)를 구한다. γ는 미리 정한 평활화하기 위한 1 이하의 양의 상수이다. 그리고, 식 (10)에 의해, 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다.
<주기성 포락 계열 생성부(440)>
주기성 포락 계열 생성부(440)는 간격(T)을 나타내는 부호(CT)를 입력으로 하고, 부호(CT)를 복호하여, 간격(T)을 얻는다. 그리고, 부호화 장치(200)의 주기성 포락 계열 생성부(140)와 동일한 방법으로 주기성 포락 계열(P[1],…, P[N])을 구하고, 출력한다(S440).
<주기성 통합 포락 생성부(450)>
주기성 통합 포락 생성부(450)에는, 주기성 포락 계열(P[1],…, P[N]), 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 부호(Cδ), 부호(CS)가 입력된다. 단, 부호(Cδ), 부호(CS)는 입력되지 않는 경우도 있다. 주기성 통합 포락 생성부(450)는 부호(Cδ)를 복호하여, 값(δ)을 취득한다. 단, 부호(Cδ)가 입력되지 않는 경우에는, 부호(Cδ)의 복호는 행하지 않고, 주기성 통합 포락 생성부(450)에 미리 기억된 값(δ)을 취득한다. 또한, 주기성 통합 포락 생성부(450)는 부호(CS)가 입력된 경우에는, 부호(CS)를 복호하여 지표(S)를 취득하고, 취득한 지표(S)가 주기성이 높은 것에 대응하는 프레임의 경우에는 부호(Cδ)를 복호하여 값(δ)을 취득하고, 취득한 지표(S)가 주기성이 낮은 것에 대응하는 프레임인 경우에는 부호(Cδ)의 복호는 행하지 않고, 주기성 통합 포락 생성부(450)에 미리 기억된 값(δ)을 취득한다. 그리고, 주기성 통합 포락 생성부(450)는, 식 (6)에 의해, 주기성 통합 포락 계열(WM[1],…, WM[N])을 구한다(S450).
<가변 길이 부호화 파라미터 계산부(460)>
가변 길이 부호화 파라미터 계산부(460)는 주기성 통합 포락 계열(WM[1],…, WM[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 부호(Csb)를 입력으로 하여 가변 길이 부호화 파라미터(rn)를 얻는다(S460). 단, 복호 장치(400)에 전송되는 다른 정보로부터 진폭의 평균값을 추정할 수 있는 경우에는, 다른 정보로부터 추정한 진폭의 평균값의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정해 놓아도 된다. 이 경우에는, 부호(Csb)는 입력되지 않는다. 이하에, 1샘플마다 라이스 복호를 행하는 경우를 예로, 가변 길이 부호화 파라미터의 계산 방법을 설명한다.
(step 1) 부호(Csb)를 복호하여, 기준이 되는 라이스 파라미터(sb)(기준이 되는 가변 길이 부호화 파라미터)를 얻는다. 또한, 부호화 장치(200)와 복호 장치(400)에서 공통으로 진폭의 평균값의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정하고 있는 경우에는, 그 방법으로 구한다.
(step 2) 임계값(θ)을 식 (14)로 산출한다.
(step 3) |WM[n]/W[n]|이 θ보다 클수록, 라이스 파라미터(rn)를 sb보다도 큰 값으로 하여, 부호화 장치(200)의 가변 길이 부호화 파라미터 계산부(260)와 동일한 방법으로 결정한다. |WM[n]/W[n]|이 θ보다 작을수록, 라이스 파라미터(rn)를 sb보다도 작은 값으로 하여, 부호화 장치(200)의 가변 길이 부호화 파라미터 계산부(260)와 동일한 방법으로 결정한다.
(step 4) step 3의 처리를 전체의 n=1, 2,…, N에 대해 반복하여, 각 XN[n]에 대한 라이스 파라미터(rn)를 구한다.
<가변 길이 복호부(470)>
가변 길이 복호부(470)는 가변 길이 부호화 파라미터 계산부(460)에서 구한 가변 길이 부호화 파라미터(rn)를 사용하여 가변 길이 부호(CX)를 복호하여 복호 정규화 계수열(^XN[1],…, ^XN[N])을 얻는다(S470). 예를 들면, 가변 길이 복호부(470)는 가변 길이 부호화 파라미터 계산부(460)에서 구한 라이스 파라미터(rn)를 사용하여 가변 길이 부호(CX)를 복호하여 복호 정규화 계수열(^XN[1],…, ^XN[N])을 얻는다. 가변 길이 복호부(470)의 복호 방법은 가변 길이 부호화부(270)의 부호화 방법에 대응하는 것이다.
<주파수 영역 계열 역정규화부(411)>
주파수 영역 계열 역정규화부(411)는 복호 정규화 계수열(^XN[1],…, ^XN[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 입력으로 하고,
^X[n]=^XN[n] ·W[n] (15)
와 같이, 복호계수열(^X[1],…, ^X[N])을 구하고 출력한다(S411).
<주파수 영역 역변환부(410)>
주파수 영역 역변환부(410)는 복호계수열(^X[1],…, ^X[N])을 입력으로 하여, 복호계수열(^X[1],…, ^X[N])을 소정의 시간 구간인 프레임 단위의 음향 신호(시간 영역)로 변환한다(S410).
[복호 장치의 변형예 1] (외부로부터 정보가 입력되는 예)
또한, 복호 장치로서는, 주기성 포락 계열 생성부(440)와 주기성 통합 포락 생성부(450)와 가변 길이 부호화 파라미터 계산부(460)와 가변 길이 복호부(470)만을 구비하고, 복호 장치에 필요에 따라 입력되는 부호(Cδ)와 부호(Csb)와 더불어, 복호 장치의 외부에서 얻어진 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 간격(T), 필요에 따라 지표(S)도 입력으로 하여 정규화 계수열(XN[1],…, XN[N])을 출력하고, 외부에서 평활화 진폭 스펙트럼 포락 계열을 승산하여 시간 영역의 음향 신호로 변환해도 된다.
<실시예 2의 발명의 효과>
가변 길이 부호화는 부호화 대상의 입력값의 진폭이 취할 수 있는 범위에 맞추어 적절하게 부호를 결정함으로써 부호화 효율을 향상시키는 부호화 방법이다. 실시예 2에서는 주파수 영역의 계수열인 정규화 계수열(XN[1],…, XN[N])을 부호화 대상으로 하고 있지만, 부호화 대상의 계수열에 포함되는 각 계수의 진폭의 정보를 보다 정확하게 사용하여 구한 가변 길이 부호화 파라미터를 사용하여 가변 길이 부호화를 하면 부호화 장치가 행하는 가변 길이 부호화 자체의 부호화 효율은 높아진다. 그러나, 복호 장치가 가변 길이 부호화 파라미터를 구하기 위해, 부호화 장치로부터 복호 장치에 대하여 부호화 대상의 계수열에 포함되는 각 계수의 진폭의 정보를 보다 정확하게 보낼 필요가 있어, 그 분량만큼 부호화 장치로부터 복호 장치에 보내는 부호량이 증대해 버린다.
부호량의 증대를 억제하기 위해서는, 적은 부호량의 부호로부터 부호화 대상의 계수열에 포함되는 각 계수의 진폭의 추정값을 얻는 방법이 필요하다. 실시예 2의 주기성 통합 포락 계열(WM[1],…, WM[N])은 계수열(X[1],…, X[N])을 고정밀도로 근사하므로, |WM[1]/W[1]|,…, |WM[N]/W[N]|은 가변 길이 부호화 대상의 계수인 XN[1], XN[2],…, XN[N]의 진폭 포락을 고정밀도로 근사할 수 있다. 즉, |WM[1]/W[1]|,…, |WM[N]/W[N]|은 부호화 대상의 각 계수의 진폭과 정의 상관을 갖는 계열로 되어 있다.
또한 |WM[1]/W[1]|, |WM[2]/W[2]|,…, |WM[N]/W[N]|을 복호 장치측에서 복원하기 위해 필요한 정보는,
·양자화된 선형 예측 계수(^α1,…, ^αP)의 정보(부호(CL))
·간격(T)을 나타내는 정보(부호(CT))
·값(δ)을 나타내는 정보(부호(Cδ))
이다. 즉, 실시예 2의 부호화 장치와 복호 장치에 의하면, 부호화 장치에 입력된 입력 음향 신호의 피치 주기에 기인하는 진폭의 피크를 포함하는 포락을 부호(CL), 부호(CT), 부호(Cδ)만의 적은 정보량으로, 복호 장치에서 재현하는 것이 가능하게 된다.
또한, 실시예 2의 부호화 장치와 복호 장치는, 선형 예측이나 피치 예측을 동반하는 부호화 및 복호를 행하는 부호화 장치 및 복호 장치와 병용하여 사용되는 경우가 많다. 이 경우에는, 부호(CL)와 부호(CT)는 부호화 장치(200)밖에 있는 선형 예측이나 피치 예측을 수반하는 부호화를 행하는 부호화 장치로부터, 복호 장치(400)밖에 있는 선형 예측이나 피치 예측을 수반하는 복호를 행하는 복호 장치로 보내지고 있는 부호이다. 따라서, 부호화 장치측에 입력된 입력 음향 신호의 피치 주기에 기인하는 진폭의 피크를 포함하는 포락을 복호 장치측에서 복원하기 위해 부호화 장치(200)로부터 복호 장치(400)에 보낼 필요가 있는 것은 부호(Cδ)이다. 부호(Cδ)의 부호량은 작아(각각, 기껏 3비트 정도이며, 1비트이어도 효과가 얻어짐), 부호화 대상의 정규화 계수열에 포함되는 부분 계열마다의 가변 길이 부호화 파라미터에 대응하는 부호의 총부호량보다도 적다.
따라서, 실시예 2의 부호화 장치, 복호 장치에 의하면, 적은 부호량의 증가로, 부호화 효율을 향상시킬 수 있다.
<실시예 2의 발명의 포인트>
상술의 효과를 얻는다고 하는 포인트에서 실시예 2의 부호화 장치, 복호 장치를 생각하면, 부호화 장치(200)가,
·소정 시간 구간의 입력 음향 신호로부터 구한 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 입력 음향 신호로부터 구한 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성부(250)
·주기성 통합 포락 계열의 값이 큰 주파수일수록, 입력 음향 신호의 진폭이 큰 것을 전제로, 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화하는 가변 길이 부호화부(270)
를 갖고, 복호 장치(400)가,
·선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성부(450)
·주기성 통합 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로, 가변 길이 부호를 복호하여 주파수 영역의 계열을 얻는 가변 길이 복호부(470)
를 갖는 것을 특징으로 하면 된다. 또한, 「주기성 통합 포락 계열의 값이 큰 주파수일수록, 입력 음향 신호의 진폭이 큰 것을 전제로」와 「주기성 통합 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로」는 주기성 통합 포락 계열이 입력 음향 신호 또는 음향 신호의 진폭이 큰 주파수에 있어서 큰 값이 되는 것을 특징으로 하고 있는 것을 나타내고 있다. 또한 「입력 음향 신호에 유래한다」란 입력 음향 신호로부터 구해지는 것이나 입력 음향 신호에 대응하고 있는 것을 의미하고 있다. 예를 들면, 계수열(X[1],…, X[N])이나 정규화 계수열(XN[1],…, XN[N])은 입력 음향 신호에 유래하는 주파수 영역의 계열이다.
실시예 3
≪부호화 장치≫
도 9에 실시예 3의 부호화 장치의 기능구성예를, 도 10에 실시예 3의 부호화 장치의 처리 흐름을 나타낸다. 부호화 장치(300)는 스펙트럼 포락 계열 계산부(221), 주파수 영역 변환부(110), 주파수 영역 계열 정규화부(111), 주기성 분석부(330), 주기성 포락 계열 생성부(140), 주기성 통합 포락 생성부(250), 가변 길이 부호화 파라미터 계산부(260), 제2 가변 길이 부호화 파라미터 계산부(380), 가변 길이 부호화부(370)를 구비한다. 부호화 장치(300)는 입력된 시간 영역의 음향 디지털 신호를 입력 음향 신호(x(t))로 하여, 적어도 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 정규화 계수열(XN[1],…, XN[N])의 주기를 나타내는 간격(T)의 부호(CT), 계수열(X[1],…, X[N]) 또는 정규화 계수열(XN[1],…, XN[N])의 주기성의 정도를 나타내는 소정의 지표(S)와 지표(S)를 나타내는 부호(CS), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 출력한다. 주파수 영역 계열 정규화부(111)는 실시예 1, 변형예 1과 동일하다. 주파수 영역 변환부(110)와 주기성 포락 계열 생성부(140)는 실시예 1과 동일하다. 진폭 스펙트럼 포락 계열 계산부(221), 주기성 통합 포락 생성부(250), 가변 길이 부호화 파라미터 계산부(260)는 실시예 2와 동일하다. 이하에서는 다른 구성부에 대해 설명한다.
<주기성 분석부(330)>
주기성 분석부(330)는 정규화 계수열(XN[1],…, XN[N])을 입력으로 하여, 당해 정규화 계수열(XN[1],…, XN[N])의 주기성의 정도를 나타내는 지표(S)와 간격(T)(주기적으로 큰 값이 되는 간격)을 구하고, 지표(S)와 지표(S)를 나타내는 부호(CS)와 간격(T)과 간격(T)을 나타내는 부호(CT)를 출력한다(S330). 또한, 지표(S)와 간격(T) 자체는 실시예 1, 변형예 1의 주기성 분석부(131)와 동일하다.
그리고, 부호화 장치(300)에서는, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 가변 길이 부호화 파라미터 계산부(260)가 가변 길이 부호화 파라미터(rn)를 계산하고, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 제2 가변 길이 부호화 파라미터 계산부(380)가 가변 길이 부호화 파라미터(rn)를 계산한다(S390). 「미리 정한 주기성의 정도가 큰 것을 나타내는 범위」는, 예를 들면, 지표(S)가 소정의 임계값 이상일 때로 하면 된다.
<제2 가변 길이 부호화 파라미터 계산부(380)>
제2 가변 길이 부호화 파라미터 계산부(380)는 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 정규화 계수열(XN[1],…, XN[N])을 입력으로 하여, 가변 길이 부호화 파라미터(rn)를 구한다(S380). 가변 길이 부호화 파라미터 계산부(260)는 주기성 통합 포락 계열(WM[1],…, WM[N])로부터 구한 진폭값에 의존하여 가변 길이 부호화 파라미터(rn)를 계산하는 것을 특징으로 하고 있는 것에 대해, 제2 가변 길이 부호화 파라미터 계산부(380)는 진폭 스펙트럼 포락 계열로부터 구한 진폭값에 의존하여 가변 길이 부호화 파라미터를 계산하는 것을 특징으로 하고 있다. 이하에, 1샘플마다 라이스 부호화를 행하는 경우를 예로, 가변 길이 부호화 파라미터의 계산 방법을 설명한다.
(step 1) 정규화 계수열(XN[1],…, XN[N])의 각 계수의 진폭의 평균의 로그를, 기준이 되는 라이스 파라미터(sb)(기준이 되는 가변 길이 부호화 파라미터)로 하여 식 (13)과 같이 산출한다. 이 처리는 가변 길이 부호화 파라미터 계산부(260)와 동일하다.
(step 2) 하기 식에 의해 임계값(θ)을 산출한다.
[수11]
Figure pct00011
θ는 진폭 스펙트럼 포락 계열의 각 값(W[n])을 평활화 진폭 스펙트럼 포락 계열의 각 값(W[n])으로 제산한 값의 진폭의 평균의 로그이다.
(step 3) |W[n]/W[n]|이 θ보다 클수록, 정규화 계수(XN[n])를 라이스 부호화하기 위한 라이스 파라미터(rn)를 sb보다도 큰 값으로서 결정한다. |W[n]/W[n]|이 θ보다 작을수록, 정규화 계수(XN[n])를 라이스 부호화하기 위한 라이스 파라미터(rn)를 sb보다도 작은 값으로서 결정한다.
(step 4) step 3의 처리를 모든 n=1, 2,…, N에 대해 반복하여, 각 XN[n]에 대한 라이스 파라미터(rn)를 구한다.
<가변 길이 부호화부(370)>
가변 길이 부호화부(370)는 가변 길이 부호화 파라미터(rn)를 사용하여 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화하여, 가변 길이 부호(CX)를 출력한다(S370). 단, 가변 길이 부호화 파라미터(rn)는 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 가변 길이 부호화 파라미터 계산부(260)가 계산한 가변 길이 부호화 파라미터(rn)이며, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 제2 가변 길이 부호화 파라미터 계산부(380)가 계산한 가변 길이 부호화 파라미터(rn)이다.
부호화 장치(300)는 이러한 처리에 의해 얻어진 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 주기성의 정도를 나타내는 지표(S)를 나타내는 부호(CS), 간격(T)을 나타내는 부호(CT), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 출력하여, 복호측에 송신한다. 또한 필요에 따라 값(δ)을 나타내는 부호(Cδ)와 기준이 되는 가변 길이 부호화 파라미터(sb)를 나타내는 부호(Csb)도 출력하여, 복호측에 송신한다.
[부호화 장치의 변형예 1] (외부로부터 정보가 입력되는 예)
또한, 부호화 장치로서는, 주기성 포락 계열 생성부(140)와 주기성 통합 포락 생성부(250)와 가변 길이 부호화 파라미터 계산부(260)와 제2 가변 길이 부호화 파라미터 계산부(380)와 가변 길이 부호화부(370)만을 구비하고, 부호화 장치의 외부에서 생성된 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 정규화 계수열(XN[1],…, XN[N]), 간격(T)과, 필요에 따라 진폭 스펙트럼 포락 계열(W[1],…, W[N])과, 필요에 따라 지표(S)를 입력으로 하여, 가변 길이 부호(CX)를 출력해도 된다.
[부호화 장치의 변형예 2] (계수열(X[n])로부터 간격(T)을 구하는 예)
상술의 주기성 분석부(330)에서는 정규화 계수열(XN[1],…, XN[N])을 입력으로하여 간격(T)을 구하고 있지만, 주기성 분석부(330)에서는 주파수 영역 변환부(110)가 출력한 계수열(X[1],…, X[N])을 입력으로 하여 간격(T)을 구해도 된다. 이 경우에는, 실시예 1의 주기성 분석부(130)와 동일한 방법으로 간격(T)을 구한다.
≪복호 장치≫
도 11에 실시예 3의 복호 장치의 기능구성예를, 도 12에 실시예 3의 복호 장치의 처리 흐름을 나타낸다. 복호 장치(500)는 스펙트럼 포락 계열 계산부(421), 지표 복호부(530), 주기성 포락 계열 생성부(440), 주기성 통합 포락 생성부(450), 가변 길이 부호화 파라미터 계산부(460), 제2 가변 길이 부호화 파라미터 계산부(580), 가변 길이 복호부(570), 주파수 영역 계열 역정규화부(411), 주파수 영역 역변환부(410)를 구비한다. 복호 장치(500)는 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 지표(S)를 나타내는 부호(CS), 간격(T)을 나타내는 부호(CT), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 수취하고, 음향 신호를 출력한다. 또한, 필요에 따라 값(δ)을 나타내는 부호(Cδ)와 기준이 되는 가변 길이 부호화 파라미터(sb)를 나타내는 부호(Csb)도 받는다. 스펙트럼 포락 계열 계산부(421), 주기성 포락 계열 생성부(440), 주기성 통합 포락 생성부(450), 가변 길이 부호화 파라미터 계산부(460), 주파수 영역 계열 역정규화부(411), 주파수 영역 역변환부(410)는 실시예 2와 동일하다. 이하에서는 다른 구성부에 대해 설명한다.
<지표 복호부(530)>
지표 복호부(530)는 부호(CS)를 복호하여, 지표(S)를 얻는다. 복호 장치(500)에서는, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 가변 길이 부호화 파라미터 계산부(460)가 가변 길이 부호화 파라미터(rn)를 계산하고, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 제2 가변 길이 부호화 파라미터 계산부(580)가 가변 길이 부호화 파라미터(rn)를 계산한다(S590). 또한, 「미리 정한 주기성의 정도가 큰 것을 나타내는 범위」는 부호화 장치(300)와 동일한 범위이다.
<제2 가변 길이 부호화 파라미터 계산부(580)>
제2 가변 길이 부호화 파라미터 계산부(580)는 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 부호(Csb)를 입력으로 하여 가변 길이 부호화 파라미터(rn)를 구한다(S580). 단, 복호 장치(500)에 전송되는 다른 정보로부터 진폭의 평균값을 추정할 수 있는 경우에는, 다른 정보로부터 추정한 진폭의 평균값의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정해 놓아도 된다. 이 경우에는, 부호(Csb)는 입력되지 않는다. 이하에, 1샘플마다 라이스 복호를 행하는 경우를 예로, 가변 길이 부호화 파라미터의 계산 방법을 설명한다.
(step 1) 부호(Csb)를 복호하여, 기준이 되는 라이스 파라미터(sb)(기준이 되는 가변 길이 부호화 파라미터)를 얻는다. 또한, 부호화 장치(300)와 복호 장치(500)에서 공통으로 진폭의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정하고 있는 경우에는, 그 방법으로 구한다.
(step 2) 임계값(θ)을 식 (16)으로 산출한다.
(step 3) |W[n]/W[n]|이 θ보다 클수록, 라이스 파라미터(rn)를 sb보다도 큰 값으로 하여, 부호화 장치(300)의 제2 가변 길이 부호화 파라미터 계산부(380)와 동일한 방법으로 결정한다. |W[n]/W[n]|이 θ보다 작을수록, 라이스 파라미터(rn)를 sb보다도 작은 값으로 하여, 부호화 장치(300)의 제2 가변 길이 부호화 파라미터 계산부(380)와 동일한 방법으로 결정한다.
(step 4) step 3의 처리를 모든 n=1, 2,…, N에 대해 반복하여, 각 XN[n]에 대한 라이스 파라미터(rn)를 구한다.
<가변 길이 복호부(570)>
가변 길이 복호부(570)는 가변 길이 부호화 파라미터(rn)를 사용하여 가변 길이 부호(CX)를 복호하여 복호 정규화 계수열(^XN[1],…, ^XN[N])을 구한다(S570). 단, 가변 길이 부호화 파라미터(rn)는, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 가변 길이 부호화 파라미터 계산부(460)가 계산한 가변 길이 부호화 파라미터(rn)이며, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 제2 가변 길이 부호화 파라미터 계산부(580)가 계산한 가변 길이 부호화 파라미터(rn)이다.
[복호 장치의 변형예 1] (외부로부터 정보가 입력되는 예)
또한, 복호 장치로서는 주기성 포락 계열 생성부(440)와 주기성 통합 포락 생성부(450)와 가변 길이 부호화 파라미터 계산부(460)와 제2 가변 길이 부호화 파라미터 계산부(580)와 가변 길이 복호부(570)만을 구비하고, 복호 장치에 필요에 따라 입력되는 부호(Cδ)와 부호(Csb)와 더불어, 복호 장치의 외부에서 얻어진 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 간격(T), 지표(S)도 입력으로 하여, 정규화 계수열(XN[1],…, XN[N])을 출력하고, 외부에서 평활화 진폭 스펙트럼 포락 계열을 승산하여 시간 영역의 음향 신호로 변환해도 된다.
<실시예 3의 발명의 효과>
입력 음향 신호의 주기성의 정도가 작은 경우에는, 입력 음향 신호의 피치 주기에 기인하는 진폭의 피크는 작다. 그래서, 실시예 3의 부호화 장치, 복호 장치는 부호화의 대상이 되는 음향 신호의 주기성의 정도가 큰 경우에는 주기성 통합 포락 계열을 사용하여 가변 길이 부호화 파라미터를 구하고, 부호화의 대상이 되는 음향 신호의 주기성의 정도가 크지 않은 경우에는 진폭 스펙트럼 포락 계열을 사용하여 가변 길이 부호화 파라미터를 구하기 때문에, 보다 적합한 가변 길이 부호화 파라미터를 사용하여 가변 길이 부호화할 수 있어, 부호화 정밀도를 높일 수 있다고 하는 효과가 있다.
상술의 실시예 1∼3에서는, 진폭 스펙트럼 포락 계열, 평활화 진폭 스펙트럼 포락 계열, 주기성 통합 포락 계열 등에 대해 진폭의 계열을 사용하는 예를 설명했지만, 진폭의 계열 대신 파워의 계열, 즉, W[n], W[n], WM[n]으로서 파워스펙트럼 포락 계열, 평활화 파워스펙트럼 포락 계열, 파워의 계열인 주기성 통합 포락 계열을 사용해도 된다.
[프로그램, 기록매체]
상술의 각종 처리는 기재에 따라 시계열로 실행될 뿐만 아니라, 처리를 실행하는 장치의 처리능력 혹은 필요에 따라 병렬적으로 혹은 개별적으로 실행되어도 된다. 그 외에, 본 발명의 취지를 일탈하지 않는 범위에서 적당히 변경이 가능한 것은 말할 필요도 없다.
또한 상술의 구성을 컴퓨터에 의해 실현하는 경우, 각 장치가 가져야 할 기능의 처리 내용은 프로그램에 의해 기술된다. 그리고, 이 프로그램을 컴퓨터에서 실행함으로써, 상기 처리 기능이 컴퓨터 상에서 실현된다.
이 처리 내용을 기술한 프로그램은 컴퓨터로 판독 가능한 기록매체에 기록해 둘 수 있다. 컴퓨터로 판독 가능한 기록매체로서는, 예를 들면, 자기 기록 장치, 광디스크, 광자기 기록매체, 반도체 메모리 등 어떤 것이이어도 된다.
또한 이 프로그램의 유통은, 예를 들면, 그 프로그램을 기록한 DVD, CD-ROM 등의 가반형 기록매체를 판매, 양도, 대여 등 함으로써 행한다. 또한, 이 프로그램을 서버 컴퓨터의 기억 장치에 저장해 두고, 네트워크를 통해, 서버 컴퓨터로부터 다른 컴퓨터에 그 프로그램을 전송함으로써, 이 프로그램을 유통시키는 구성으로 해도 된다.
이러한 프로그램을 실행하는 컴퓨터는, 예를 들면, 우선, 가반형 기록매체에 기록된 프로그램 혹은 서버 컴퓨터로부터 전송된 프로그램을, 일단, 자신의 기억 장치에 저장한다. 그리고, 처리의 실행시, 이 컴퓨터는 자신의 기록매체에 저장된 프로그램을 판독하고, 판독한 프로그램에 따른 처리를 실행한다. 또한 이 프로그램의 다른 실행 형태로서, 컴퓨터가 가반형 기록매체로부터 직접 프로그램을 읽어내고, 그 프로그램에 따른 처리를 실행하는 것으로 해도 되고, 또한, 이 컴퓨터에 서버 컴퓨터로부터 프로그램이 전송될 때마다, 차례차례, 수취한 프로그램에 따른 처리를 실행하는 것으로 해도 된다. 또한 서버 컴퓨터로부터 이 컴퓨터로의 프로그램의 전송은 행하지 않고, 그 실행 지시와 결과 취득에 의해서만 처리 기능을 실현하는, 소위 ASP(Application Service Provider)형의 서비스에 의해, 상술의 처리를 실행하는 구성으로 해도 된다. 또한, 본 형태에 있어서의 프로그램에는, 전자계산기에 의한 처리의 용도에 제공하는 정보이며 프로그램에 준하는 것(컴퓨터에 대한 직접적인 지령은 아니지만 컴퓨터의 처리를 규정하는 성질을 갖는 데이터 등)을 포함하는 것으로 한다.
또한 이 형태에서는, 컴퓨터 상에서 소정의 프로그램을 실행시킴으로써, 본 장치를 구성하는 것으로 했지만, 이들 처리 내용의 적어도 일부를 하드웨어적으로 실현하는 것으로 해도 된다.
100, 101 주기성 통합 포락 계열 생성 장치
110 주파수 영역 변환부
111 주파수 영역 계수 정규화부
120, 121, 221, 421 스펙트럼 포락 계열 계산부
130,131, 230, 330 주기성 분석부
140, 440 주기성 포락 계열 생성부
150, 250, 450 주기성 통합 포락 생성부
200, 300 부호화 장치
260, 360, 460 가변 길이 부호화 파라미터 계산부
270, 370 가변 길이 부호화부
380, 580 제2 가변 길이 부호화 파라미터 계산부
400, 500 복호 장치
410 주파수 영역 역변환부
411 주파수 영역 계열 역정규화부
470, 570 가변 길이 복호부
530 지표 복호부

Claims (20)

  1. 소정 시간 구간의 입력 음향 신호로부터 구한 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 상기 입력 음향 신호로부터 구한 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성부와,
    상기 주기성 통합 포락 계열로부터 진폭값에 의존하는 가변 길이 부호화 파라미터를 계산하는 가변 길이 부호화 파라미터 계산부와,
    가변 길이 부호화 파라미터를 사용하여, 진폭값에 의존하는 가변 길이 부호화에 의해, 상기 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화하는 가변 길이 부호화부를 구비하는 것을 특징으로 하는 부호화 장치.
  2. 소정 시간 구간의 입력 음향 신호로부터 구한 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 상기 입력 음향 신호로부터 구한 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성부와,
    상기 주기성 통합 포락 계열의 값이 큰 주파수일수록, 상기 입력 음향 신호의 진폭이 큰 것을 전제로, 상기 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화하는 가변 길이 부호화부를 구비하는 것을 특징으로 하는 부호화 장치.
  3. 제 1 항에 있어서,
    상기 스펙트럼 포락 계열로부터 진폭값에 의존하는 가변 길이 부호화 파라미터를 계산하는 제2 가변 길이 부호화 파라미터 계산부도 구비하고,
    상기 가변 길이 부호화부는,
    상기 입력 음향 신호의 주기성의 정도를 나타내는 지표가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 상기 가변 길이 부호화 파라미터 계산부가 계산한 가변 길이 부호화 파라미터를 사용하여 부호화하고,
    상기 주기성의 정도를 나타내는 지표가 상기의 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 상기 제2 가변 길이 부호화 파라미터 계산부가 계산한 가변 길이 부호화 파라미터를 사용하여 부호화하는 것을 특징으로 하는 부호화 장치.
  4. 제 2 항에 있어서,
    상기 가변 길이 부호화부는,
    상기 입력 음향 신호의 주기성의 정도를 나타내는 지표가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 상기 주기성 통합 포락 계열의 값이 큰 주파수일수록, 상기 입력 음향 신호의 진폭이 큰 것을 전제로, 상기 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화하고,
    상기 지표가 상기의 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 상기 스펙트럼 포락 계열의 값이 큰 주파수일수록, 상기 입력 음향 신호의 진폭이 큰 것을 전제로, 상기 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화하는 것을 특징으로 하는 부호화 장치.
  5. 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성부와,
    상기 주기성 통합 포락 계열로부터 진폭값에 의존하는 가변 길이 부호화 파라미터를 계산하는 가변 길이 부호화 파라미터 계산부와,
    가변 길이 부호화 파라미터를 사용하여 복호하는 가변 길이 복호부를 구비하는 것을 특징으로 하는 복호 장치.
  6. 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성부와,
    상기 주기성 통합 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로, 가변 길이 부호를 복호하여 주파수 영역의 계열을 얻는 가변 길이 복호부를 구비하는 것을 특징으로 하는 복호 장치.
  7. 제 5 항에 있어서,
    입력된 지표 부호를 복호하여 주기성의 정도를 나타내는 지표를 얻는 지표 복호부와,
    상기 스펙트럼 포락 계열로부터 진폭값에 의존하는 가변 길이 부호화 파라미터를 계산하는 제2 가변 길이 부호화 파라미터 계산부도 구비하고,
    상기 가변 길이 복호부는,
    상기 지표가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 상기 가변 길이 부호화 파라미터 계산부가 계산한 가변 길이 부호화 파라미터를 사용하여 복호하고,
    상기 지표가 상기의 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 상기 제2 가변 길이 부호화 파라미터 계산부가 계산한 가변 길이 부호화 파라미터를 사용하여 복호하는 것을 특징으로 하는 복호 장치.
  8. 제 6 항에 있어서,
    상기 가변 길이 복호부는,
    입력된 주기성의 정도를 나타내는 지표가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 상기 주기성 통합 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로, 상기 가변 길이 부호를 복호하여 주파수 영역의 계열을 얻고,
    상기 지표가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 상기 스펙트럼 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로, 상기 가변 길이 부호를 복호하여 주파수 영역의 계열을 얻는 것을 특징으로 하는 복호 장치.
  9. 소정 시간 구간의 입력 음향 신호로부터 구한 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 상기 입력 음향 신호로부터 구한 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성 스텝과,
    상기 주기성 통합 포락 계열로부터 진폭값에 의존하는 가변 길이 부호화 파라미터를 계산하는 가변 길이 부호화 파라미터 계산 스텝과,
    가변 길이 부호화 파라미터를 사용하여, 진폭값에 의존하는 가변 길이 부호화에 의해, 상기 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화하는 가변 길이 부호화 스텝을 실행하는 것을 특징으로 하는 부호화 방법.
  10. 소정 시간 구간의 입력 음향 신호로부터 구한 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 상기 입력 음향 신호로부터 구한 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성 스텝과,
    상기 주기성 통합 포락 계열의 값이 큰 주파수일수록, 상기 입력 음향 신호의 진폭이 큰 것을 전제로, 상기 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화하는 가변 길이 부호화 스텝을 실행하는 것을 특징으로 하는 부호화 방법.
  11. 제 9 항에 있어서,
    상기 스펙트럼 포락 계열로부터 진폭값에 의존하는 가변 길이 부호화 파라미터를 계산하는 제2 가변 길이 부호화 파라미터 계산 스텝도 갖고,
    상기 가변 길이 부호화 스텝은,
    상기 입력 음향 신호의 주기성의 정도를 나타내는 지표가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 상기 가변 길이 부호화 파라미터 계산 스텝에서 계산한 가변 길이 부호화 파라미터를 사용하여 부호화하고,
    상기 주기성의 정도를 나타내는 지표가 상기의 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 상기 제2 가변 길이 부호화 파라미터 계산 스텝에서 계산한 가변 길이 부호화 파라미터를 사용하여 부호화하는 것을 특징으로 하는 부호화 방법.
  12. 제 10 항에 있어서,
    상기 가변 길이 부호화 스텝은
    상기 입력 음향 신호의 주기성의 정도를 나타내는 지표가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 상기 주기성 통합 포락 계열의 값이 큰 주파수일수록, 상기 입력 음향 신호의 진폭이 큰 것을 전제로, 상기 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화하고,
    상기 지표가 상기의 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 상기 스펙트럼 포락 계열의 값이 큰 주파수일수록, 상기 입력 음향 신호의 진폭이 큰 것을 전제로, 상기 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화하는 것을 특징으로 하는 부호화 방법.
  13. 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성 스텝과,
    상기 주기성 통합 포락 계열로부터 진폭값에 의존하는 가변 길이 부호화 파라미터를 계산하는 가변 길이 부호화 파라미터 계산 스텝과,
    가변 길이 부호화 파라미터를 사용하여 복호하는 가변 길이 복호 스텝을 실행하는 것을 특징으로 하는 복호 방법.
  14. 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성 스텝과,
    상기 주기성 통합 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로, 가변 길이 부호를 복호하여 주파수 영역의 계열을 얻는 가변 길이 복호 스텝을 실행하는 것을 특징으로 하는 복호 방법.
  15. 제 13 항에 있어서,
    입력된 지표 부호를 복호하여 주기성의 정도를 나타내는 지표를 얻는 지표 복호 스텝과,
    상기 스펙트럼 포락 계열로부터 진폭값에 의존하는 가변 길이 부호화 파라미터를 계산하는 제2 가변 길이 부호화 파라미터 계산 스텝도 갖고,
    상기 가변 길이 복호 스텝은,
    상기 지표가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 상기 가변 길이 부호화 파라미터 계산 스텝에서 계산한 가변 길이 부호화 파라미터를 사용하여 복호하고,
    상기 지표가 상기의 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 상기 제2 가변 길이 부호화 파라미터 계산 스텝에서 계산한 가변 길이 부호화 파라미터를 사용하여 복호하는 것을 특징으로 하는 복호 방법.
  16. 제 14 항에 있어서,
    상기 가변 길이 복호 스텝은,
    입력된 주기성의 정도를 나타내는 지표가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 상기 주기성 통합 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로, 상기 가변 길이 부호를 복호하여 주파수 영역의 계열을 얻고,
    상기 지표가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 상기 스펙트럼 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로, 상기 가변 길이 부호를 복호하여 주파수 영역의 계열을 얻는 것을 특징으로 하는 복호 방법.
  17. 제 1 항 내지 제 4 항 중 어느 한 항의 부호화 장치로서 컴퓨터를 기능하게 하기 위한 부호화 프로그램.
  18. 제 5 항 내지 제 8 항 중 어느 한 항의 복호 장치로서 컴퓨터를 기능하게 하기 위한 복호 프로그램.
  19. 제 1 항 내지 제 4 항 중 어느 한 항의 부호화 장치로서 컴퓨터를 기능하게 하기 위한 부호화 프로그램을 기록한 컴퓨터가 판독 가능한 기록매체.
  20. 제 5 항 내지 제 8 항 중 어느 한 항의 복호 장치로서 컴퓨터를 기능하게 하기 위한 복호 프로그램을 기록한 컴퓨터가 판독 가능한 기록매체.
KR1020167029792A 2014-05-01 2015-02-20 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체 KR101839016B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2014-094881 2014-05-01
JP2014094881 2014-05-01
PCT/JP2015/054717 WO2015166693A1 (ja) 2014-05-01 2015-02-20 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR1020187006872A Division KR101861781B1 (ko) 2014-05-01 2015-02-20 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체
KR1020187006878A Division KR101861787B1 (ko) 2014-05-01 2015-02-20 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체

Publications (2)

Publication Number Publication Date
KR20160137615A true KR20160137615A (ko) 2016-11-30
KR101839016B1 KR101839016B1 (ko) 2018-03-16

Family

ID=54358434

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020167029792A KR101839016B1 (ko) 2014-05-01 2015-02-20 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체
KR1020187006878A KR101861787B1 (ko) 2014-05-01 2015-02-20 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체
KR1020187006872A KR101861781B1 (ko) 2014-05-01 2015-02-20 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020187006878A KR101861787B1 (ko) 2014-05-01 2015-02-20 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체
KR1020187006872A KR101861781B1 (ko) 2014-05-01 2015-02-20 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체

Country Status (9)

Country Link
US (4) US10199046B2 (ko)
EP (4) EP3696812B1 (ko)
JP (4) JP6276845B2 (ko)
KR (3) KR101839016B1 (ko)
CN (3) CN112820304B (ko)
ES (4) ES2884626T3 (ko)
PL (4) PL3703051T3 (ko)
TR (1) TR201909906T4 (ko)
WO (1) WO2015166693A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101826237B1 (ko) 2014-03-24 2018-02-13 니폰 덴신 덴와 가부시끼가이샤 부호화 방법, 부호화 장치, 프로그램 및 기록 매체
KR102529747B1 (ko) * 2016-05-23 2023-05-08 삼성에스디아이 주식회사 무선 충전 장치 및 방법
JP6766264B2 (ja) * 2017-06-22 2020-10-07 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
WO2019028883A1 (en) * 2017-08-11 2019-02-14 Lenovo (Beijing) Limited ENCODING POWER RECEIVED FROM REFERENCE SIGNAL

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58168094A (ja) * 1982-03-29 1983-10-04 藤崎 博也 音声分析処理方式
JPS5994795A (ja) * 1982-11-22 1984-05-31 藤崎 博也 音声分析処理方式
JP2615862B2 (ja) * 1988-06-14 1997-06-04 日本電気株式会社 音声符号化復号化方法とその装置
KR940002854B1 (ko) * 1991-11-06 1994-04-04 한국전기통신공사 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
IT1277194B1 (it) * 1995-06-28 1997-11-05 Alcatel Italia Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato
US6345145B1 (en) * 1995-08-25 2002-02-05 Sony Corporation Signal recording/reproducing method and apparatus, signal record medium and signal transmission/reception method and apparatus
JP3259759B2 (ja) * 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
DE69932786T2 (de) * 1998-05-11 2007-08-16 Koninklijke Philips Electronics N.V. Tonhöhenerkennung
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4296753B2 (ja) * 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
US20040002859A1 (en) * 2002-06-26 2004-01-01 Chi-Min Liu Method and architecture of digital conding for transmitting and packing audio signals
CN101552007B (zh) * 2004-03-01 2013-06-05 杜比实验室特许公司 用于对编码音频信道和空间参数进行解码的方法和设备
CN101273404B (zh) * 2005-09-30 2012-07-04 松下电器产业株式会社 语音编码装置以及语音编码方法
EP1989707A2 (fr) * 2006-02-24 2008-11-12 France Telecom Procede de codage binaire d'indices de quantification d'une enveloppe d'un signal, procede de decodage d'une enveloppe d'un signal et modules de codage et decodage correspondants
US7761900B2 (en) * 2006-08-02 2010-07-20 Clarendon Foundation, Inc. Distribution of content and advertisement
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US7953595B2 (en) * 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
CN101192408A (zh) * 2006-11-24 2008-06-04 华为技术有限公司 选择导谱频率系数矢量量化的方法及装置
KR100868763B1 (ko) * 2006-12-04 2008-11-13 삼성전자주식회사 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치
US8688437B2 (en) * 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
JP5275612B2 (ja) * 2007-07-18 2013-08-28 国立大学法人 和歌山大学 周期信号処理方法、周期信号変換方法および周期信号処理装置ならびに周期信号の分析方法
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
US8665945B2 (en) * 2009-03-10 2014-03-04 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoding device, decoding device, program, and recording medium
JP5223786B2 (ja) * 2009-06-10 2013-06-26 富士通株式会社 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機
US8670990B2 (en) * 2009-08-03 2014-03-11 Broadcom Corporation Dynamic time scale modification for reduced bit rate audio coding
US8892428B2 (en) * 2010-01-14 2014-11-18 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, encoding method, and decoding method for adjusting a spectrum amplitude
CN102194458B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 频带复制方法、装置及音频解码方法、系统
JP5694751B2 (ja) * 2010-12-13 2015-04-01 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
RU2554554C2 (ru) * 2011-01-25 2015-06-27 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, кодер, способ определения величины периодического признака, устройство определения величины периодического признака, программа и носитель записи
JP5613781B2 (ja) * 2011-02-16 2014-10-29 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
RU2571561C2 (ru) * 2011-04-05 2015-12-20 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
EP2887349B1 (en) * 2012-10-01 2017-11-15 Nippon Telegraph and Telephone Corporation Coding method, coding device, program, and recording medium

Also Published As

Publication number Publication date
KR20180030243A (ko) 2018-03-21
PL3703051T3 (pl) 2021-11-22
TR201909906T4 (tr) 2019-07-22
US10629214B2 (en) 2020-04-21
ES2790278T3 (es) 2020-10-27
JP6412993B2 (ja) 2018-10-24
CN106663437B (zh) 2021-02-02
CN106663437A (zh) 2017-05-10
KR101839016B1 (ko) 2018-03-16
JP2018013795A (ja) 2018-01-25
EP3703051A1 (en) 2020-09-02
CN112820305B (zh) 2023-12-15
PL3139380T3 (pl) 2019-09-30
EP3696812B1 (en) 2021-06-09
KR101861787B1 (ko) 2018-05-28
EP3509063A2 (en) 2019-07-10
EP3139380A4 (en) 2017-11-01
CN112820304B (zh) 2024-09-13
US20170040023A1 (en) 2017-02-09
US10607616B2 (en) 2020-03-31
JPWO2015166693A1 (ja) 2017-04-20
JP6595684B2 (ja) 2019-10-23
JP2019003219A (ja) 2019-01-10
US11164589B2 (en) 2021-11-02
EP3696812A1 (en) 2020-08-19
EP3139380B1 (en) 2019-04-10
EP3703051B1 (en) 2021-06-09
US20190096414A1 (en) 2019-03-28
US10199046B2 (en) 2019-02-05
CN112820304A (zh) 2021-05-18
KR101861781B1 (ko) 2018-05-28
EP3509063A3 (en) 2019-08-07
ES2732859T3 (es) 2019-11-26
KR20180030240A (ko) 2018-03-21
JP2019215587A (ja) 2019-12-19
US20200202876A1 (en) 2020-06-25
PL3509063T3 (pl) 2020-08-24
EP3139380A1 (en) 2017-03-08
CN112820305A (zh) 2021-05-18
WO2015166693A1 (ja) 2015-11-05
JP6744471B2 (ja) 2020-08-19
ES2883848T3 (es) 2021-12-09
PL3696812T3 (pl) 2021-09-27
EP3509063B1 (en) 2020-04-22
JP6276845B2 (ja) 2018-02-07
US20190096413A1 (en) 2019-03-28
ES2884626T3 (es) 2021-12-10

Similar Documents

Publication Publication Date Title
KR101860143B1 (ko) 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
JP6744471B2 (ja) 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant