KR101860143B1 - 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체 - Google Patents

주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체 Download PDF

Info

Publication number
KR101860143B1
KR101860143B1 KR1020187006351A KR20187006351A KR101860143B1 KR 101860143 B1 KR101860143 B1 KR 101860143B1 KR 1020187006351 A KR1020187006351 A KR 1020187006351A KR 20187006351 A KR20187006351 A KR 20187006351A KR 101860143 B1 KR101860143 B1 KR 101860143B1
Authority
KR
South Korea
Prior art keywords
sequence
envelope
periodic
envelope sequence
variable length
Prior art date
Application number
KR1020187006351A
Other languages
English (en)
Other versions
KR20180029087A (ko
Inventor
타케히로 모리야
유타카 카마모토
노보루 하라다
Original Assignee
니폰 덴신 덴와 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 니폰 덴신 덴와 가부시끼가이샤 filed Critical 니폰 덴신 덴와 가부시끼가이샤
Publication of KR20180029087A publication Critical patent/KR20180029087A/ko
Application granted granted Critical
Publication of KR101860143B1 publication Critical patent/KR101860143B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Peptides Or Proteins (AREA)
  • Error Detection And Correction (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

음향 신호의 피치 주기에 기인하는 피크의 부근에서의 근사 정밀도를 높게 할 수 있는 포락 계열을 제공한다. 본 발명의 주기성 통합 포락 계열 생성 장치는, 소정의 시간 구간인 프레임 단위의 시간 영역의 음향 디지털 신호를 입력 음향 신호로 하고, 포락 계열로서, 주기성 통합 포락 계열을 생성한다. 본 발명의 주기성 통합 포락 계열 생성 장치는, 적어도, 스펙트럼 포락 계열 계산부, 주기성 통합 포락 생성부를 구비한다. 스펙트럼 포락 계열 계산부는, 입력 음향 신호의 시간 영역의 선형 예측에 기초하여, 입력 음향 신호의 스펙트럼 포락 계열을 계산한다. 주기성 통합 포락 생성부는, 입력 음향 신호의 주파수 영역에서의 주기성 성분에 기초하여 진폭 스펙트럼 포락 계열을 변형하여, 주기성 통합 포락 계열로 한다.

Description

주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체{PERIODIC-COMBINED-ENVELOPE-SEQUENCE GENERATION DEVICE, PERIODIC-COMBINED-ENVELOPE-SEQUENCE GENERATION METHOD, PERIODIC-COMBINED-ENVELOPE-SEQUENCE GENERATION PROGRAM AND RECORDING MEDIUM}
본 발명은 음향 신호의 스펙트럼 포락을 산출하는 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램 및 기록매체에 관한 것이다.
저비트(예를 들면, 10kbit/s∼20kbit/s 정도)의 음성 신호나 음향 신호의 부호화 방법으로서, DFT(이산 푸리에 변환)나 MDCT(변형 이산 코사인 변환) 등의 직교 변환 계수에 대한 적응 부호화가 알려져 있다. 예를 들면, 비특허문헌 1에서 사용되고 있는 TCX(transform coded excitation: 변환 부호화 여진) 부호화 방법에서는, 입력된 음 신호의 주파수 영역 표현인 계수열(X[1],…, X[N])로부터 진폭 스펙트럼 포락의 영향을 제거한 계열(정규화 계수열(XN[1],…, XN[N]))을 구하고, 이것을 가변 길이 부호화한다. 단, [] 내의 N은 양의 정수이다.
진폭 스펙트럼 포락은 이하의 수순으로 산출된다.
(step 1) 소정의 시간 구간인 프레임 단위로, 입력된 시간 영역의 음향 디지털 신호(이하, 입력 음향 신호)에 대한 선형 예측 분석을 행하여 선형 예측 계수(α1,…, αP)를 구한다. 단, P는 예측 차수를 나타내는 양의 정수이다. 예를 들면, 전극형(全極型) 모델인 P차 자기 회귀 과정에 의해, 시각(t)에서의 입력 음향 신호(x(t))는 P 시점까지 거슬러 올라간 과거의 자기 자신의 값(x(t-1),…, x(t-P))과 예측 잔차(e(t))와 선형 예측 계수(α1,…, αP)에 의해 식 (1)로 표시된다.
x(t)=α1x(t-1)+ …+αpx(t-P)+e(t) (1)
(step 2) 선형 예측 계수(α1,…, αP)를 양자화하고, 양자화된 선형 예측 계수(^α1,…, ^αP)를 구한다. 양자화된 선형 예측 계수(^α1,…, ^αP)를 사용하여 N점의 입력 음향 신호의 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다. 예를 들면, 진폭 스펙트럼 포락 계열의 각 값(W[n])은 식 (2)로 구할 수 있다. 단, n은 1≤n≤N의 정수, exp(·)은 네이피어수를 밑으로 하는 지수함수, j는 허수 단위, σ는 예측 잔차 신호의 진폭이다.
Figure 112018022108613-pat00001
또한, 본 명세서에서는, 우측 어깨에 각괄호 없이 표기되어 있는 기호는 멱승 연산을 나타낸다. 즉, σ2는 σ의 2승을 나타낸다. 또한 글 중에서 사용하는 기호 「」 「^」등은 원래 직후의 문자의 바로 위에 기재되어야 할 것이지만, 텍스트기법의 제한에 의해, 당해 문자의 직전에 기재한다. 수식 중에서는 이들 기호는 본래의 위치, 즉 문자의 바로 위에 기술하고 있다.
Anthony Vetro, "MPEG Unified Speech and AudioCoding", Industry and Standards, IEEE MultiMedia,April-June, 2013.
(발명의 개요)
(발명이 해결하고자 하는 과제)
음향 신호의 부호화에서는, 복호측에서도 스펙트럼 포락의 정보를 얻기 위해서, 스펙트럼 포락에 대응하는 부호를 복호측에 전달할 필요가 있다.
비특허문헌 1과 같이 선형 예측 계수에 의해 스펙트럼 포락을 요구하는 경우에는, 복호측에 전달하는 「스펙트럼 포락에 대응하는 부호」는 「선형 예측 계수에 대응하는 부호」이며, 부호량이 적어도 된다고 하는 이점이 있다. 한편, 선형 예측 계수에 의해 구한 스펙트럼 포락의 정보는 입력 음향 신호의 피치 주기에 기인하는 피크의 부근에서의 근사 정밀도가 나빠지는 경우가 있다. 그리고, 이것이 정규화 계수열을 가변 길이 부호화할 때의 부호화 효율의 저하로 이어지는 경우도 있다.
이러한 문제를 감안하여, 본 발명에서는, 음향 신호의 피치 주기에 기인하는 피크의 부근에서의 근사 정밀도를 높게 할 수 있는 포락 계열을 제공한다.
본 발명의 주기성 통합 포락 계열 생성 장치는 소정의 시간 구간인 프레임 단위의 시간 영역의 음향 디지털 신호를 입력 음향 신호로 하고, 포락 계열로서 주기성 통합 포락 계열을 생성한다. 본 발명의 주기성 통합 포락 계열 생성 장치는, 적어도, 스펙트럼 포락 계열 계산부, 주기성 통합 포락 생성부를 구비한다. 스펙트럼 포락 계열 계산부는, 입력 음향 신호의 시간 영역의 선형 예측에 기초하여, 입력 음향 신호의 스펙트럼 포락 계열을 계산한다. 주기성 통합 포락 생성부는, 입력 음향 신호의 주파수 영역에서의 주기성 성분에 기초하여 스펙트럼 포락 계열을 변형하고, 주기성 통합 포락 계열로 한다.
본 발명의 주기성 통합 포락 계열 생성 장치에 의해 생성되는 주기성 통합 포락 계열이면, 입력 음향 신호의 피치 주기에 기인하는 피크 부근에서의 근사 정밀도도 좋아진다.
도 1은 실시예 1의 주기성 통합 포락 계열 생성 장치의 기능구성예를 나타내는 도면.
도 2는 실시예 1의 주기성 통합 포락 계열 생성 장치의 처리 흐름을 나타내는 도면.
도 3은 주기성 포락 계열(P[1],…, P[N])의 예를 나타내는 도면.
도 4a는 동일한 음향 신호에 대하여 생성된 계열의 차이를 설명하기 위한 예를 도시하는 도면으로, 수열(X[1], …, X[N])을 보간한 곡선의 형상을 나타내는 도면.
도 4b는 동일한 음향 신호에 대하여 생성된 계열의 차이를 설명하기 위한 예를 도시하는 도면으로, 주기성 포락 계열(P[1], …, P[N])을 보간한 곡선의 형상을 나타내는 도면.
도 4c는 동일한 음향 신호에 대하여 생성된 계열의 차이를 설명하기 위한 예를 도시하는 도면으로, 평활화 진폭 스펙트럼 포락 계열(W[1], …, W[N])을 보간한 곡선의 형상을 나타내는 도면.
도 4d는 동일한 음향 신호에 대하여 생성된 계열의 차이를 설명하기 위한 예를 도시하는 도면으로, 주기성 통합 포락 계열(WM[1], …, WM[N])을 보간한 곡선의 형상을 도시하는 도면.
도 5는 실시예 2의 부호화 장치의 기능구성예를 나타내는 도면.
도 6은 실시예 2의 부호화 장치의 처리 흐름을 나타내는 도면.
도 7은 실시예 2의 복호 장치의 기능구성예를 나타내는 도면.
도 8은 실시예 2의 복호 장치의 처리 흐름을 나타내는 도면.
도 9는 실시예 3의 부호화 장치의 기능구성예를 나타내는 도면.
도 10은 실시예 3의 부호화 장치의 처리 흐름을 나타내는 도면.
도 11은 실시예 3의 복호 장치의 기능구성예를 나타내는 도면.
도 12는 실시예 3의 복호 장치의 처리 흐름을 나타내는 도면.
(발명을 실시하기 위한 형태)
이하, 본 발명의 실시형태에 대해, 상세하게 설명한다. 또한, 동일한 기능을 갖는 구성부에는 동일한 번호를 붙이고, 중복 설명을 생략한다.
실시예 1
도 1에 본 발명의 주기성 통합 포락 계열 생성 장치의 기능구성예를, 도 2에 본 발명의 주기성 통합 포락 계열 생성 장치의 처리 흐름을 나타낸다. 주기성 통합 포락 계열 생성 장치(100)는 스펙트럼 포락 계열 계산부(120), 주파수 영역 변환부(110), 주기성 분석부(130), 주기성 포락 계열 생성부(140), 주기성 통합 포락 생성부(150)를 구비하고, 입력된 시간 영역의 음향 디지털 신호를 입력 음향 신호(x(t))로 하고, 계수열의 주파수 성분에 기초하여 진폭 스펙트럼 포락 계열을 변형한 주기성 통합 포락 계열을 생성한다.
<스펙트럼 포락 계열 계산부(120)>
스펙트럼 포락 계열 계산부(120)는, 입력 음향 신호(x(t))의 시간 영역의 선형 예측에 기초하여, 입력 음향 신호의 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 계산한다(S120). 단, N은 양의 정수이다. 스펙트럼 포락 계열 계산부(120)는 종래기술과 동일하며, 이하의 수순으로 계산하면 된다.
(step 1) 소정의 시간 구간인 프레임 단위로, 입력 음향 신호에 대한 선형 예측 분석을 행하여 선형 예측 계수(α1,…, αP)를 구한다. 단, P는 예측 차수를 나타내는 양의 정수이다. 예를 들면, 전극형 모델인 P차 자기 회귀 과정에 의해, 시각(t)에서의 입력 음향 신호(x(t))는 P 시점까지 거슬러 올라간 과거의 자기 자신의 값(x(t-1),…, x(t-P))과 예측 잔차(e(t))와 선형 예측 계수(α1,…, αP)에 의해 식 (1)로 표시된다.
(step 2) 선형 예측 계수(α1,…, αP)를 사용하여 N점의 입력 음향 신호의 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다. 예를 들면, 진폭 스펙트럼 포락 계열의 각 값(W[n])은 선형 예측 계수(α1,…, αP)에 대응하는 양자화된 선형 예측 계수(^α1,…, ^αP)를 사용하여 식 (2)로 구할 수 있다. 또는, 진폭 스펙트럼 포락 계열의 각 값(W[n])은 선형 예측 계수(α1,…, αP)를 사용하여, 식 (2)의 ^αp를 αp로 치환한 식으로 구할 수 있다.
<주파수 영역 변환부(110)>
주파수 영역 변환부(110)는, 소정의 시간 구간인 프레임 단위로, 입력된 시간 영역의 입력 음향 신호를 주파수 영역의 N점의 계수열(X[1],…, X[N])로 변환하여 출력한다(S110). 주파수 영역으로의 변환은 MDCT(변형 이산 코사인 변환)나 DFT(이산 푸리에 변환) 등의 방법으로 행하면 된다.
<주기성 분석부(130)>
주기성 분석부(130)는 계수열(X[1],…, X[N])을 입력으로 하고, 당해 계수열(X[1],…, X[N])의 주기(T)를 구하고, 주기(T)를 출력한다(S130).
주기(T)는 입력 음향 신호에 유래하는 주파수 영역의 계수열, 예를 들면, 계수열(X[1],…, X[N])의 주기성을 갖는 성분의 간격(계수열이 주기적으로 큰 값이 되는 간격)에 대응하는 정보이다. 이하에서는 주기(T)를 간격(T)으로 표현하는 경우도 있지만, 표현상의 차이뿐이며, 동일한 것이다. T는 양의 값이며, 정수이어도 되고, 소수(예를 들면, 5.0, 5.25, 5.5, 5.75)이어도 된다.
또한 주기성 분석부(130)는, 필요에 따라, 계수열(X[1],…, X[N])을 입력으로 하여, 주기성의 정도를 나타내는 지표(S)도 구하여 출력해도 된다. 이 경우, 예를 들면, 계수열(X[1],…, X[N])의 주기성을 갖는 성분의 부분의 에너지와 그 이외의 부분의 에너지와의 비 등에 기초하여 주기성의 정도를 나타내는 지표(S)를 구한다. 이 경우에는, 지표(S)는 주파수 영역의 샘플열의 주기성의 정도를 나타내는 지표가 된다. 또한, 주기성을 갖는 성분의 크기가 클수록, 즉, 주기(T)의 정수배의 샘플이나 그 근방에 있는 샘플의 진폭(샘플값의 절대값)이 클수록, 주파수 영역의 샘플열의 「주기성의 정도」는 크다.
또한, 주기성 분석부(130)는 시간 영역의 입력 음향 신호로부터 시간 영역의 주기를 구하고, 구한 시간 영역의 주기를 주파수 영역의 주기로 변환함으로써 주기(T)를 구해도 된다. 또한 시간 영역의 주기를 주파수 영역의 주기로 변환한 것의 상수배나 그 근방의 값을 주기(T)로서 구해도 된다. 마찬가지로, 주기성 분석부(130)는 시간 영역의 입력 음향 신호로부터, 예를 들면, 시간 영역의 주기분만큼 시간이 벗어난 신호열 간의 상관의 크기 등에 기초하여 주기성의 정도를 나타내는 지표(S)를 구해도 된다.
요컨대, 시간 영역의 입력 음향 신호나 그것에 유래하는 주파수 영역 계수열로부터 주기(T)나 지표(S)를 구하는 방법은, 종래부터 여러 방법이 존재하므로, 그 어느 방법을 선택하여 이용해도 된다.
<주기성 포락 계열 생성부(140)>
주기성 포락 계열 생성부(140)는 간격(T)을 입력으로 하고, 주기성 포락 계열(P[1],…, P[N])을 출력한다(S140). 주기성 포락 계열(P[1],…, P[N])은 피치 주기에 기인하는 주기로 피크를 갖는 주파수 영역의 이산 계열, 즉 조파 모델에 대응하는 이산 계열이다. 도 3에 주기성 포락 계열(P[1],…, P[N])의 예를 나타낸다. 주기성 포락 계열(P[1],…, P[N])은, 도 3에 도시된 파형과 같이, 간격(T)의 정수배 근방의 정수값인 인덱스와, 그 전후 소정수의 인덱스에 대응하는 주기성 포락의 값만 양의 값을 취하고, 그 이외는 0인 것과 같은 계열이다. 간격(T)의 정수배 근방의 정수값인 인덱스가 주기적으로 최대값(피크)을 취하고, 그 전후 소정수의 인덱스에 대응하는 P[n]의 값은 그 인덱스(n)가 피크에 대응하는 인덱스로부터 벗어남에 따라 단조 감소하는 관계에 있다. 도 3의 가로축의 1, 2,…,는 이산화 샘플점의 인덱스(이하, 「주파수 인덱스」)를 나타낸다.
예를 들면, n을 주파수 인덱스를 나타내는 변수로 하고, τ를 극대값(피크)에 대응하는 주파수 인덱스로 하여, 피크의 형상은 이하의 함수(Q(n))로 나타낼 수 있다. 단, 간격(T)의 소수점 이하의 자릿수가 L자리이며, 간격(T')을 T'=T×2L로 한다.
Figure 112018022108613-pat00002
h는 피크의 높이를 나타내며, 간격(T)이 클수록 피크의 높이가 높아진다. 또한 PD는 피크 부분의 폭을 나타내고, 간격(T)이 클수록 폭이 넓어진다.
U를 1부터 피크의 수까지를 나타내는 양의 정수(예를 들면, 도 3의 경우에는 1∼10)로 하고, v를 1 이상의 정수(예를 들면, 1부터 3 정도)로 하고, floor(·)를 소수점 이하를 절사하여 정수값으로 하는 함수라고 하면, 주기성 포락 계열(P[n])은, 예를 들면,
Figure 112018022108613-pat00003
과 같이 계산하면 된다. 단, (U×T')/2L-v≤n≤(U×T')/2L+v이다. 예를 들면, L=2의 경우, T=20.00이면 T'=80, T=20.25이면 T'=81, T=20.50이면 T'=82, T=20.75이면 T'=83이다. 또한, 주기성 포락 계열(P[n])은 소수점 첫째 자리를 사사오입하여 정수값으로 하는 함수(Round(·))를 사용하여,
Figure 112018022108613-pat00004
와 같이 구해도 된다.
<주기성 통합 포락 생성부(150)>
주기성 통합 포락 생성부(150)는, 적어도, 주기성 포락 계열(P[1],…, P[N]), 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 입력으로 하고, 주기성 통합 포락 계열(WM[1],…, WM[N])을 구한다(S150). 구체적으로는, 주기성 통합 포락(WM[n])을 다음 식과 같이 구한다.
Figure 112018022108613-pat00005
또한, δ는 주기성 통합 포락(WM[n])과 계수(X[n])의 절대값 계열의 형상이 근접하도록 결정되는 값 또는 미리 정한 값이다.
주기성 통합 포락 생성부(150)에 있어서 주기성 통합 포락(WM[n])과 계수(X[n])의 절대값 계열의 형상이 근접하도록 δ를 결정하는 경우에는, 주기성 통합 포락 생성부(150)는 계수열(X[1],…, X[N])도 입력으로 하고, 결정된 δ와 그때의 주기성 통합 포락 계열(WM[1],…, WM[N])을 출력하면 된다. 예를 들면, δ는, 몇 개의 δ의 후보, 예를 들면, 0.4와 0.8의 2개를 δ의 후보 중에서 이하의 식에 의해 정의되는 E가 최소가 되는 δ로 정하면 된다. 바꿔 말하면, 주기성 통합 포락(WM[n])과 계수(X[n])의 절대값 계열의 형상이 까까워지는 δ로 정하면 된다.
Figure 112018022108613-pat00006
δ는 주기성 통합 포락(WM[n])에 있어서 주기성 포락(P[n])을 어느 정도 고려할지를 정하는 값이다. 바꿔 말하면, δ는 주기성 통합 포락(WM[n])에 있어서의 진폭 스펙트럼 포락(W[n])과 주기성 포락(P[n])의 혼합비율을 정하는 값이라고 할 수 있다. 또한 식 (9)의 G는 계수열(X[1],…, X[N])의 각 계수(X[n])의 절대값의 계열과 주기성 통합 포락 계열의 역수의 계열의 내적이다. 식 (8)의 WM[n]은 주기성 통합 포락의 각 값(WM[n])을 G로 정규화한 정규화 주기성 통합 포락이다. 식 (7)에 있어서, 계수열(X[1],…, X[N])과 정규화 주기성 통합 포락 계열(WM[1],…, WM[N])의 내적의 4승을 계산하고 있는 것은, 특히 절대값이 큰 계수(X[n])를 강조하여 내적을 취한 값(거리)을 작게 하는 것을 의도하고 있다. 즉, 계수열(X[1],…, X[N]) 중에서 특히 절대값이 큰 계수(X[n])와 주기성 통합 포락(WM[n])이 가까워지도록 δ를 결정하는 것을 의미하고 있다.
또한 주기성 통합 포락 생성부(150)에 있어서 주기성의 정도에 따라 δ의 후보수를 결정하는 경우에는, 주기성 통합 포락 생성부(150)는 주기성의 정도를 나타내는 지표(S)도 입력으로 하고, 지표(S)가 주기성이 높은 것에 대응하는 프레임인 것을 나타내고 있는 경우에는 많은 후보수의 δ의 후보 중에서 식 (7)로 정의되는 E가 최소가 되는 δ를 선택하고, 지표(S)가 주기성이 낮은 것에 대응하는 프레임인 것을 나타내고 있는 경우에는 δ를 미리 정한 값으로 해도 된다. 즉, 주기성 통합 포락 생성부(150)에 있어서 주기성의 정도에 따라 δ의 후보수를 결정하는 경우에는, 주기성이 높을수록 δ의 후보의 수를 많게 하면 된다.
<실시예 1의 발명의 효과>
도 4a~4d에 동일한 음향 신호에 대해 생성된 계열의 차이를 설명하기 위한 예를 나타낸다. 도 4a에 계수열(X[1],…, X[N])을 보간한 곡선의 형상을, 도 4b에 주기성 포락 계열(P[1],…, P[N])을 보간한 곡선의 형상을, 도 4c에 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 보간한 곡선의 형상을, 도 4d에 주기성 통합 포락 계열(WM[1],…, WM[N])을 보간한 곡선의 형상을 나타낸다. 도 4a~4d에 도시하는 바와 같이, 주기성 통합 포락 계열(WM[1],…, WM[N])은 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])에 비해, 계수열(X[1],…, X[N])에 나타내는 주기적인 피크를 포함한 형상으로 되어 있다. 또한 주기성 통합 포락 계열(WM[1],…, WM[N])은 스펙트럼 포락을 나타내는 정보인 선형 예측 계수 또는 양자화된 선형 예측 계수 이외에, 간격(T), 또는, 간격(T)과 값(δ)의 정보가 있으면 생성할 수 있다. 따라서, 입력 음향 신호의 스펙트럼 포락을 나타내는 정보에 적은 정보량을 추가하는 것만으로, 입력 음향 신호의 피치 주기에 기인하는 진폭의 피크를, 선형 예측 계수에 의해 구하는 스펙트럼 포락보다 고정밀도로 표현할 수 있다. 즉, 선형 예측 계수 또는 양자화된 선형 예측 계수와, 간격(T), 또는, 간격(T)과 값(δ)의 적은 정보량으로 입력 음향 신호의 진폭을 고정밀도로 추정하는 것이 가능하게 된다. 또한, 평활화 진폭 스펙트럼 포락(W[n])은 다음 식으로 나타내는 포락이며, γ는 진폭 스펙트럼 계수를 둔하게 하기(평활화하기) 위한 1 이하의 양의 상수이다.
Figure 112018022108613-pat00007
또한 본 발명의 주기성 통합 포락 계열 생성 장치를 부호화 장치와 복호 장치에서 사용하는 경우에는, 부호화 장치에 포함되는 주기성 통합 포락 계열 생성 장치 이외의 처리부에서 얻어진 양자화된 선형 예측 계수(^αp)를 특정하는 부호(선형 예측 계수 부호(CL))와 주기(T)나 시간 영역의 주기를 특정하는 부호(주기 부호(CT))가 복호 장치에 입력되므로, 본 발명의 주기성 통합 포락 계열 생성 장치로부터는 δ의 정보를 나타내는 부호를 출력하면, 복호측의 주기성 통합 포락 계열 생성 장치에서도 부호화측의 주기성 통합 포락 계열 생성 장치에서 생성한 주기성 통합 포락 계열과 동일한 주기성 통합 포락 계열을 생성할 수 있다. 따라서, 부호화 장치로부터 복호 장치에 부호를 보낼 때에 증가하는 부호량은 적다.
<실시예 1의 발명의 포인트>
실시예 1의 주기성 통합 포락 계열 생성 장치(100)에서는, 주기성 통합 포락 생성부(150)가 계수열(X[1],…, X[N])의 주기성 성분에 기초하여 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 변형하여, 주기성 통합 포락 계열(WM[1],…, WM[N])로 하고 있는 점이 가장 중요한 포인트이다. 특히, 계수열(X[1],…, X[N])의 주기성의 정도가 클수록, 즉, 주기성을 갖는 성분의 크기가 클수록, 진폭 스펙트럼 포락 계열(W[1],…, W[N]) 중 간격(T)(주기)의 정수배 및 그것들 근방의 샘플의 값을 크게 변경하면, 상기의 효과를 얻기 쉽다. 「근방의 샘플」이란 간격(T)의 정수배 근방의 정수값인 인덱스로 표시되는 샘플이다. 또한 「근방」이란, 예를 들면, 식 (3)∼(5) 등의 미리 정한 방법으로 결정되는 범위로 하면 된다.
또한 계수열(X[1],…, X[N])의 주기성을 갖는 성분의 간격(T)이 넓을수록, 식 (4)와 식 (5)에 표시된 주기성 포락 계열(P[1],…, P[N])은 큰 값을 가지고, 넓은 폭에서, 즉, 간격(T)(주기)의 정수배 및 그것들 근방의 많은 샘플에서, 0 이외의 값을 갖는다. 즉, 주기성 통합 포락 생성부(150)는 계수열의 주기성을 갖는 성분의 간격(T)이 넓을수록, 진폭 스펙트럼 포락 계열 중 간격(T)(주기)의 정수배 및 그것들 근방의 샘플의 값을 크게 변경한다. 또한 주기성 통합 포락 생성부(150)는 계수열의 주기성을 갖는 성분의 간격(T)이 넓을수록, 진폭 스펙트럼 포락 계열을 넓은 폭에서, 즉, 간격(T)(주기)의 정수배 및 그것들 근방의 많은 샘플에서, 샘플값을 변경한다. 「근방의 많은 샘플에서」란 「근방」에 해당하는 범위(미리 정한 방법으로 결정되는 범위)에 존재하는 샘플을 많게 하는 것을 의미하고 있다. 즉, 주기성 통합 포락 생성부(150)는 이렇게 진폭 스펙트럼 포락 계열을 변형하면, 상기의 효과를 얻기 쉽다.
또한, 주기성 통합 포락 계열이 갖는 「입력 음향 신호의 피치 주기에 기인하는 진폭의 피크를 보다 고정밀도로 표현할 수 있다.」고 하는 특징을 효과적으로 이용하는 예로서는 부호화 장치와 복호 장치가 있으며, 이 예를 실시예 2, 3에 나타내고 있다. 단, 주기성 통합 포락 계열의 특징의 이용예는 부호화 장치와 복호 장치 이외에도, 잡음 제거 장치나 포스트 필터 등이 있을 수 있다. 따라서, 실시예 1에서는 주기성 통합 포락 계열 생성 장치를 설명하고 있다.
[변형예 1] (정규화 계수열에서 주기성 분석하는 예)
변형예 1의 주기성 통합 포락 계열 생성 장치도 도 1에 나타낸다. 또한 변형예 1의 주기성 통합 포락 계열 생성 장치의 처리 흐름도 도 2에 나타낸다. 주기성 통합 포락 계열 생성 장치(101)는 주파수 영역 계열 정규화부(111)도 구비하는 점과, 스펙트럼 포락 계열 계산부(121), 주기성 분석부(131)가 주기성 통합 포락 계열 생성 장치(100)와 다르고, 그 밖의 구성은 동일하다. 이하에서는 차이점에 대해서만 설명한다.
<스펙트럼 포락 계열 계산부(121)>
스펙트럼 포락 계열 계산부(121)는 진폭 스펙트럼 포락 계열(W[1],…, W[N])뿐만 아니라, 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])도 구한다.
구체적으로는, 스펙트럼 포락 계열 계산부(121)는 스펙트럼 포락 계열 계산부(120)에서 나타낸 (step 1), (step 2)와 더불어 이하의 수순의 처리를 행한다.
(step 3) 양자화된 선형 예측 계수(^αp)의 각각에 γp를 승산하고, 양자화된 평활화 선형 예측 계수(^α1γ, ^α2γ2,…, ^αPγP)를 구한다. γ는 평활화하기 위한 1 이하의 양의 상수이다. 그리고, 식 (10)에 의해, 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다(S121). 물론, 스펙트럼 포락 계열 계산부(120)와 마찬가지로, 양자화된 선형 예측 계수(^αp) 대신에 선형 예측 계수(αp)를 사용해도 된다.
<주파수 영역 계열 정규화부(111)>
주파수 영역 계열 정규화부(111)는 계수열(X[1],…, X[N])의 각 계수를 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])의 각 계수로 제산하여 정규화 계수열(XN[1],…, XN[N])을 얻는다.
즉, n=1,…, N에 대하여
XN[n]=X[n]/W[n] (11)
의 계산을 행하고, 정규화 계수열(XN[1],…, XN[N])을 구한다(S111).
<주기성 분석부(131)>
주기성 분석부(131)는 정규화 계수열(XN[1],…, XN[N])을 입력으로 하고, 당해 정규화 계수열(XN[1],…, XN[N])의 주기(T)를 구하고, 주기(T)를 출력한다(S131). 즉, 본 변형예에서는, 입력 음향 신호에 유래하는 주파수 영역의 계수열인 정규화 계수열(XN[1],…, XN[N])의 주기성을 갖는 성분의 간격을 주기(T)로서 구한다. 또한 주기성 분석부(131)는, 필요에 따라, 계수열(X[1],…, X[N])을 입력으로 하여, 주기성의 정도를 나타내는 지표(S)도 구하여 출력해도 된다.
그 밖의 처리는 주기성 통합 포락 계열 생성 장치(100)와 동일하다. 따라서, 실시예 1과 동일한 효과가 얻어진다. 또한, 주기성 통합 포락 계열 생성 장치(101)의 경우에는, 주기성 통합 포락 생성부(150)는 진폭 스펙트럼 포락 계열(W[1],…, W[N]) 대신에 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 사용해도 된다. 이 경우에는, 식 (6) 대신에 다음 식의 계산이 된다.
Figure 112018022108613-pat00008
[변형예 2] (외부로부터 정보가 입력되는 예)
본 발명의 주기성 통합 포락 계열 생성 장치를 부호화 장치나 복호 장치가 내부에 구비하고 있는 경우에는, 부호화 장치나 복호 장치에 포함되는 주기성 통합 포락 계열 생성 장치 이외의 처리부에서, 계수열(X[1],…, X[N]), 정규화 계수열(XN[1],…, XN[N]), 양자화된 선형 예측 계수(^αp), 양자화된 평활화 선형 예측 계수(^αpγp), 진폭 스펙트럼 포락(W[1],…, W[N]), 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 주기(T), 지표(S) 등이 구해지고 있는 경우가 있다. 이러한 경우에는, 주기성 통합 포락 계열 생성 장치에, 주파수 영역 변환부, 주파수 영역 정규화부, 스펙트럼 포락 계열 계산부, 주기성 분석부의 적어도 어느 하나를 구비하지 않는 구성으로 해도 된다. 이 경우에는, 부호화 장치 내의 주기성 통합 포락 계열 생성 장치 이외의 처리부로부터, 양자화된 선형 예측 계수(^αp)를 특정하는 부호(선형 예측 계수 부호(CL)), 주기(T)나 시간 영역의 주기를 특정하는 부호(주기 부호(CT)), 지표(S)를 특정하는 부호 등이 출력되고, 복호 장치에 입력된다. 따라서, 이 경우에는, 부호화 장치 내의 주기성 통합 포락 계열 생성 장치로부터는, 양자화된 선형 예측 계수(^αp)를 특정하는 부호(선형 예측 계수 부호(CL)), 주기(T)나 시간 영역의 주기를 특정하는 부호(주기 부호(CT)), 지표(S)를 특정하는 부호 등을 출력할 필요가 없다.
또한 본 발명의 주기성 통합 포락 계열 생성 장치를 부호화 장치나 복호 장치에서 사용하는 경우에는, 부호화 장치와 복호 장치와 동일한 주기성 통합 포락 계열이 얻어지도록 할 필요가 있다. 따라서, 부호화 장치가 출력하고 복호 장치에 입력되는 부호로부터 특정 가능한 정보를 사용하여 주기성 통합 포락 계열을 얻을 필요가 있다. 예를 들면, 부호화 장치에서 사용하는 주기성 통합 포락 계열 생성 장치의 스펙트럼 포락 계열 계산부에서는, 선형 예측 계수 부호(CL)에 대응하는 양자화된 선형 예측 계수를 사용하여 진폭 스펙트럼 포락 계열을 구하고, 복호 장치에서 사용하는 주기성 통합 포락 계열 생성 장치의 스펙트럼 포락 계열 계산부에서는, 부호화 장치로부터 출력되어 복호 장치에 입력되는 선형 예측 계수 부호(CL)에 대응하는 복호 선형 예측 계수를 사용하여 진폭 스펙트럼 포락 계열을 구할 필요가 있다.
또한, 부호화 장치나 복호 장치에서 주기성 통합 포락 계열을 사용하는 경우에는, 전술한 바와 같이 주기성 통합 포락 계열 생성 장치를 내부에 구비하는 것이 아니고, 주기성 통합 포락 계열 생성 장치 내의 필요한 처리부를 부호화 장치와 복호 장치에 구비하도록 하면 된다. 이러한 부호화 장치나 복호 장치는 실시예 2에서 설명한다.
실시예 2
≪부호화 장치≫
도 5에 실시예 2의 부호화 장치의 기능구성예를, 도 6에 실시예 2의 부호화 장치의 처리 흐름을 나타낸다. 부호화 장치(200)는 스펙트럼 포락 계열 계산부(221), 주파수 영역 변환부(110), 주파수 영역 계열 정규화부(111), 주기성 분석부(230), 주기성 포락 계열 생성부(140), 주기성 통합 포락 생성부(250), 가변 길이 부호화 파라미터 계산부(260), 가변 길이 부호화부(270)를 구비한다. 부호화 장치(200)는 입력된 시간 영역의 음향 디지털 신호를 입력 음향 신호(x(t))로 하고, 적어도 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 정규화 계수열(XN[1],…, XN[N])의 주기를 나타내는 간격(T)의 부호(CT), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 출력한다. 주파수 영역 계열 정규화부(111)는 실시예 1, 변형예 1과 동일하다. 주파수 영역 변환부(110)와 주기성 포락 계열 생성부(140)는 실시예 1과 동일하다. 이하에서는 다른 구성부에 대해 설명한다.
<스펙트럼 포락 계열 계산부(221)>
스펙트럼 포락 계열 계산부(221)는 입력 음향 신호(x(t))의 시간 영역의 선형 예측에 기초하여, 입력 음향 신호의 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 계산하고, 계산의 과정에서 얻은 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL)도 구한다(S221). 단, N은 양의 정수이다. 스펙트럼 포락 계열 계산부(221)는 이하의 수순으로 처리하면 된다.
(step 1) 소정의 시간 구간인 프레임 단위로, 입력 음향 신호에 대한 선형 예측 분석을 행하여 선형 예측 계수(α1,…, αP)를 구한다. 단, P는 예측 차수를 나타내는 양의 정수이다. 예를 들면, 전극형 모델인 P차 자기 회귀 과정에 의해, 시각(t)에서의 입력 음향 신호(x(t))는 P 시점까지 거슬러 올라간 과거의 자기 자신의 값(x(t-1),…, x(t-P))과 예측 잔차(e(t))와 선형 예측 계수(α1,…, αP)에 의해 식 (1)로 표시된다.
(step 2) 선형 예측 계수(α1,…, αP)를 부호화하여 부호(CL)를 얻고 출력함과 아울러, 부호(CL)에 대응하는 양자화된 선형 예측 계수(^α1,…, ^αP)를 구한다. 또한 양자화된 선형 예측 계수(^α1,…, ^αP)를 사용하여 N점의 입력 음향 신호의 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다. 예를 들면, 진폭 스펙트럼 포락 계열의 각 값(W[n])은 식 (2)로 구할 수 있다. 또한, 선형 예측 계수(α1,…, αP)를 부호화하여 부호(CL)를 얻는 방법은, 선형 예측 계수를 LSP 파라미터로 변환하고, LSP 파라미터를 부호화하여 부호(CL)를 얻는 등, 선형 예측 계수로 변환 가능한 계수의 어느 것을 부호화하여 부호(CL)를 얻는 어느 방법을 사용해도 된다.
(step 3) 양자화된 선형 예측 계수(^αp)의 각각에 γp를 승산하고, 양자화된 평활화 선형 예측 계수(^α1γ, ^α2γ2,…, ^αPγP)를 구한다. γ는 미리 정한 평활화하기 위한 1 이하의 양의 상수이다. 그리고, 식 (10)에 의해, 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다.
<주기성 분석부(230)>
주기성 분석부(230)는 정규화 계수열(XN[1],…, XN[N])을 입력으로 하여, 당해 정규화 계수열(XN[1],…, XN[N])의 간격(T)(주기적으로 큰 값이 되는 간격)을 구하고, 간격(T)과 간격(T)을 나타내는 부호(CT)를 출력한다(S230). 또한 주기성 분석부(230)는, 필요에 따라, 주기성의 정도를 나타내는 지표(S)(즉, 주파수 영역의 샘플열의 주기성의 정도를 나타내는 지표)도 구하여 출력한다. 또한 주기성 분석부(230)는, 필요에 따라, 지표(S)를 나타내는 부호(CS)도 얻어서 출력한다. 또한, 지표(S)와 간격(T) 자체는 실시예 1, 변형예 1의 주기성 분석부(131)와 동일하다.
<주기성 통합 포락 생성부(250)>
주기성 통합 포락 생성부(250)는, 적어도, 주기성 포락 계열(P[1],…, P[N]), 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 입력으로 하고, 주기성 통합 포락 계열(WM[1],…, WM[N])을 구하여 주기성 통합 포락(WM[n])을 출력한다. 또한 주기성 통합 포락 생성부(250)는 값(δ)으로서 미리 정한 1개의 값이 아니라, 미리 정한 복수의 후보값 중 어느 하나를 선택하는 경우에는, 계수열(X[1],…, X[N])도 입력으로 하고, 미리 정한 복수의 후보값 중 주기성 통합 포락(WM[n])과 계수(X[n])의 절대값 계열의 형상이 가까워지는 후보값을 값(δ)으로서 구하고, 값(δ)을 나타내는 부호(Cδ)도 출력한다(S250).
주기성 통합 포락(WM[n])과 값(δ)은 실시예 1과 동일하며, 주기성 통합 포락(WM[n])은 식 (6),…, (9)와 같이 구하면 된다. 주기성 통합 포락 생성부(250)에 있어서 주기성의 정도에 따라 δ의 후보수를 결정하는 경우에는, 주기성 통합 포락 생성부(250)는 주기성의 정도를 나타내는 지표(S)도 입력으로 하고, 지표(S)가 주기성이 높은 것에 대응하는 프레임인 경우에는 많은 후보수의 δ의 후보 중에서 식 (7)로 정의되는 E가 최소가 되는 δ를 선택하고, 지표(S)가 주기성이 낮은 것에 대응하는 프레임인 경우에는 δ를 1개의 미리 정한 값으로 해도 된다. 또한, δ를 미리 정한 값으로 하는 경우에는, 값(δ)을 나타내는 부호(Cδ)를 출력할 필요는 없다.
<가변 길이 부호화 파라미터 계산부(260)>
가변 길이 부호화 파라미터 계산부(260)는 주기성 통합 포락 계열(WM[1],…, WM[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 정규화 계수열(XN[1],…, XN[N])을 입력으로 하여, 가변 길이 부호화 파라미터(rn)를 구한다(S260). 가변 길이 부호화 파라미터 계산부(260)는 주기성 통합 포락 계열(WM[1],…, WM[N])로부터 구한 진폭값에 의존하여 가변 길이 부호화 파라미터(rn)를 계산하는 것을 특징으로 하고 있다.
가변 길이 부호화 파라미터는 부호화 대상의 신호, 즉, 정규화 계수열(XN[1],…, XN[N])의 각 계수의 진폭이 취할 수 있는 범위를 특정하는 파라미터이다. 예를 들면, 라이스 부호화의 경우에는 라이스 파라미터가 가변 길이 부호화 파라미터에 상당하고, 산술 부호화의 경우에는 부호화 대상의 신호의 진폭이 취할 수 있는 범위가 가변 길이 부호화 파라미터에 상당한다.
1샘플마다 가변 길이 부호화를 행하는 경우에는, 정규화 계수열의 각 계수(XN[n])에 대해 가변 길이 부호화 파라미터가 계산된다. 복수의 샘플로 이루어지는 샘플군마다(예를 들면, 2샘플씩) 정리하여 가변 길이 부호화를 행하는 경우에는, 샘플군마다 가변 길이 부호화 파라미터가 계산된다. 즉, 가변 길이 부호화 파라미터 계산부(260)는 정규화 계수열의 일부인 정규화 부분 계수열마다, 가변 길이 부호화 파라미터(rn)를 계산한다. 여기에서, 정규화 부분 계수열은 복수개 있고, 복수개의 정규화 부분 계수열에는 정규화 계수열의 계수가 중복되지 않고 포함되는 것으로 한다. 이하에, 1샘플마다 라이스 부호화를 행하는 경우를 예로, 가변 길이 부호화 파라미터의 계산 방법을 설명한다.
(step 1) 정규화 계수열(XN[1],…, XN[N])의 각 계수의 진폭의 평균의 로그를, 기준이 되는 라이스 파라미터(sb)(기준이 되는 가변 길이 부호화 파라미터)로 하여 다음 식과 같이 산출한다.
Figure 112018022108613-pat00009
sb는 프레임마다 1도만큼 부호화되어, 기준이 되는 라이스 파라미터(기준이 되는 가변 길이 부호화 파라미터)에 대응하는 부호(Csb)로서 복호 장치(400)에 전송된다. 혹은 복호 장치(400)에 전송되는 별도의 정보로부터 정규화 계수열(XN[1],…, XN[N])의 진폭의 평균값을 추정할 수 있는 경우에는, 부호화 장치(200)와 복호 장치(400)에서 공통적으로 진폭의 평균값의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정해 놓아도 된다. 예를 들면, 포락의 기울기를 나타내는 파라미터, 구분대역마다의 평균 포락의 크기를 나타내는 파라미터를 별도 사용하는 부호화의 경우에는, 복호 장치(400)에 전송되는 다른 정보로부터 진폭의 평균값을 추정할 수 있다. 이 경우에는, sb를 부호화하여, 기준이 되는 라이스 파라미터에 대응하는 부호(Csb)를 복호 장치(400)에 출력하지 않아도 된다.
(step 2) 하기 식에 의해 임계값(θ)을 산출한다.
Figure 112018022108613-pat00010
θ는 주기성 통합 포락 계열의 각 값(WM[n])을 평활화 진폭 스펙트럼 포락 계열의 각 값(W[n])으로 제산한 값의 진폭의 평균의 로그이다.
(step 3) |WM[n]/W[n]|이 θ보다 클수록, 정규화 계수(XN[n])를 라이스 부호화하기 위한 라이스 파라미터(rn)를 sb보다도 큰 값으로서 결정한다. |WM[n]/W[n]|이 θ보다 작을수록, 정규화 계수(XN[n])를 라이스 부호화하기 위한 라이스 파라미터(rn)를 sb보다도 작은 값으로서 결정한다.
(step 4) step 3의 처리를 모든 n=1, 2,…, N에 대해 반복하여, 각 XN[n]에 대한 라이스 파라미터(rn)를 구한다.
<가변 길이 부호화부(270)>
가변 길이 부호화부(270)는 가변 길이 부호화 파라미터 계산부(260)에서 구한 가변 길이 부호화 파라미터(rn)를 사용하여 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화하고, 가변 길이 부호(CX)를 출력한다(S270). 예를 들면, 가변 길이 부호화부(270)는 가변 길이 부호화 파라미터 계산부(260)에서 구한 라이스 파라미터(rn)를 사용하여 정규화 계수열(XN[1],…, XN[N])을 라이스 부호화하고, 얻어진 부호를 가변 길이 부호(CX)로서 출력한다. 가변 길이 부호화 파라미터 계산부(260)에서 구한 라이스 파라미터(rn)는 주기성 통합 포락 계열의 진폭값에 의존하는 가변 길이 부호화 파라미터이며, 주기성 통합 포락 계열의 값이 큰 주파수일수록 큰 값으로 되어 있다. 라이스 부호화는 진폭값에 의존하는 가변 길이 부호화의 공지기술 중 하나이며, 라이스 파라미터(rn)를 사용하여 진폭값에 의존하는 가변 길이 부호화를 행하는 것이다. 또한 주기성 통합 포락 생성부(250)에서 생성한 주기성 통합 포락 계열은 입력 음향 신호의 스펙트럼 포락을 고정밀도로 표현하는 것이다. 즉, 가변 길이 부호화부(270)는, 주기성 통합 포락 계열의 값이 큰 주파수일수록, 상기 입력 음향 신호의 주파수 영역의 계수열인 X[1],…, X[N]의 진폭이 큰 것을 전제로, 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화하고 있는 것으로 되고, 바꿔 말하면, 가변 길이 부호화 파라미터를 사용하여, 진폭값에 의존하는 가변 길이 부호화에 의해, 정규화 계수열(XN[1],…, XN[N])을 부호화하고 있는 것으로 된다. 여기에서 말하는 진폭값이란 부호화 대상의 계수열의 평균 진폭값, 계수열에 포함되는 각 계수의 진폭의 추정값, 계수열의 진폭의 포락의 추정값 등이다.
부호화 장치(200)는 이러한 처리에 의해 얻어진 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 간격(T)을 나타내는 부호(CT), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 출력한다. 또한 필요에 따라 값(δ)을 나타내는 부호(Cδ)와 기준이 되는 가변 길이 부호화 파라미터(sb)를 나타내는 부호(Csb)도 출력한다. 부호화 장치(200)로부터 출력된 부호는 복호 장치(400)에 입력된다.
[부호화 장치의 변형예 1] (외부로부터 정보가 입력되는 예)
또한, 부호화 장치로서는, 주기성 포락 계열 생성부(140)와 주기성 통합 포락 생성부(250)와 가변 길이 부호화 파라미터 계산부(260)와 가변 길이 부호화부(270)만을 구비하고, 부호화 장치의 외부에서 생성된 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과, 정규화 계수열(XN[1],…, XN[N]), 간격(T)과, 필요에 따라 진폭 스펙트럼 포락 계열(W[1],…, W[N])과, 필요에 따라 지표(S)를 입력으로 하고, 가변 길이 부호(CX)를 출력해도 된다.
[부호화 장치의 변형예 2] (계수열(X[n])로부터 간격(T)을 구하는 예)
상술의 주기성 분석부(230)에서는 정규화 계수열(XN[1],…, XN[N])을 입력으로 하여 간격(T)을 구하고 있지만, 주기성 분석부(230)에서는 주파수 영역 변환부(110)가 출력한 계수열(X[1],…, X[N])을 입력으로 하여 간격(T)을 구해도 된다. 이 경우에는, 실시예 1의 주기성 분석부(130)와 동일한 방법으로 간격(T)을 구한다.
≪복호 장치≫
도 7에 실시예 2의 복호 장치의 기능구성예를, 도 8에 실시예 2의 복호 장치의 처리 흐름을 나타낸다. 복호 장치(400)는 스펙트럼 포락 계열 계산부(421), 주기성 포락 계열 생성부(440), 주기성 통합 포락 생성부(450), 가변 길이 부호화 파라미터 계산부(460), 가변 길이 복호부(470), 주파수 영역 계열 역정규화부(411), 주파수 영역 역변환부(410)를 구비한다. 복호 장치(400)는 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 간격(T)을 나타내는 부호(CT), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 수취하고, 음향 신호를 출력한다. 또한, 필요에 따라 값(δ)을 나타내는 부호(Cδ)와 기준이 되는 가변 길이 부호화 파라미터(sb)를 나타내는 부호(Csb)와 지표(S)를 나타내는 부호(CS)도 수취한다. 이하에, 각 구성부의 상세를 나타낸다.
<스펙트럼 포락 계열 계산부(421)>
스펙트럼 포락 계열 계산부(421)는 부호(CL)를 입력으로 하고, 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 계산한다(S421). 보다 구체적으로는, 이하의 수순으로 처리하면 된다.
(step 1) 부호(CL)를 복호하여, 복호 선형 예측 계수(^α1,…, ^αP)를 얻는다.
(step 2) 복호 선형 예측 계수(^α1,…, ^αP)를 사용하여 N점의 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다. 예를 들면, 진폭 스펙트럼 포락 계열의 각 값(W[n])은 식 (2)로 구할 수 있다.
(step 3) 복호 선형 예측 계수(^αp)의 각각에 γp를 승산하여, 복호 평활화 선형 예측 계수(^α1γ, ^α2γ2,…, ^αPγP)를 구한다. γ는 미리 정한 평활화하기 위한 1 이하의 양의 상수이다. 그리고, 식 (10)에 의해, 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 구한다.
<주기성 포락 계열 생성부(440)>
주기성 포락 계열 생성부(440)는 간격(T)을 나타내는 부호(CT)를 입력으로 하고, 부호(CT)를 복호하여, 간격(T)을 얻는다. 그리고, 부호화 장치(200)의 주기성 포락 계열 생성부(140)와 동일한 방법으로 주기성 포락 계열(P[1],…, P[N])을 구하고, 출력한다(S440).
<주기성 통합 포락 생성부(450)>
주기성 통합 포락 생성부(450)에는, 주기성 포락 계열(P[1],…, P[N]), 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 부호(Cδ), 부호(CS)가 입력된다. 단, 부호(Cδ), 부호(CS)는 입력되지 않는 경우도 있다. 주기성 통합 포락 생성부(450)는 부호(Cδ)를 복호하여, 값(δ)을 취득한다. 단, 부호(Cδ)가 입력되지 않는 경우에는, 부호(Cδ)의 복호는 행하지 않고, 주기성 통합 포락 생성부(450)에 미리 기억된 값(δ)을 취득한다. 또한, 주기성 통합 포락 생성부(450)는 부호(CS)가 입력된 경우에는, 부호(CS)를 복호하여 지표(S)를 취득하고, 취득한 지표(S)가 주기성이 높은 것에 대응하는 프레임의 경우에는 부호(Cδ)를 복호하여 값(δ)을 취득하고, 취득한 지표(S)가 주기성이 낮은 것에 대응하는 프레임인 경우에는 부호(Cδ)의 복호는 행하지 않고, 주기성 통합 포락 생성부(450)에 미리 기억된 값(δ)을 취득한다. 그리고, 주기성 통합 포락 생성부(450)는, 식 (6)에 의해, 주기성 통합 포락 계열(WM[1],…, WM[N])을 구한다(S450).
<가변 길이 부호화 파라미터 계산부(460)>
가변 길이 부호화 파라미터 계산부(460)는 주기성 통합 포락 계열(WM[1],…, WM[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 부호(Csb)를 입력으로 하여 가변 길이 부호화 파라미터(rn)를 얻는다(S460). 단, 복호 장치(400)에 전송되는 다른 정보로부터 진폭의 평균값을 추정할 수 있는 경우에는, 다른 정보로부터 추정한 진폭의 평균값의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정해 놓아도 된다. 이 경우에는, 부호(Csb)는 입력되지 않는다. 이하에, 1샘플마다 라이스 복호를 행하는 경우를 예로, 가변 길이 부호화 파라미터의 계산 방법을 설명한다.
(step 1) 부호(Csb)를 복호하여, 기준이 되는 라이스 파라미터(sb)(기준이 되는 가변 길이 부호화 파라미터)를 얻는다. 또한, 부호화 장치(200)와 복호 장치(400)에서 공통으로 진폭의 평균값의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정하고 있는 경우에는, 그 방법으로 구한다.
(step 2) 임계값(θ)을 식 (14)로 산출한다.
(step 3) |WM[n]/W[n]|이 θ보다 클수록, 라이스 파라미터(rn)를 sb보다도 큰 값으로 하여, 부호화 장치(200)의 가변 길이 부호화 파라미터 계산부(260)와 동일한 방법으로 결정한다. |WM[n]/W[n]|이 θ보다 작을수록, 라이스 파라미터(rn)를 sb보다도 작은 값으로 하여, 부호화 장치(200)의 가변 길이 부호화 파라미터 계산부(260)와 동일한 방법으로 결정한다.
(step 4) step 3의 처리를 전체의 n=1, 2,…, N에 대해 반복하여, 각 XN[n]에 대한 라이스 파라미터(rn)를 구한다.
<가변 길이 복호부(470)>
가변 길이 복호부(470)는 가변 길이 부호화 파라미터 계산부(460)에서 구한 가변 길이 부호화 파라미터(rn)를 사용하여 가변 길이 부호(CX)를 복호하여 복호 정규화 계수열(^XN[1],…, ^XN[N])을 얻는다(S470). 예를 들면, 가변 길이 복호부(470)는 가변 길이 부호화 파라미터 계산부(460)에서 구한 라이스 파라미터(rn)를 사용하여 가변 길이 부호(CX)를 복호하여 복호 정규화 계수열(^XN[1],…, ^XN[N])을 얻는다. 가변 길이 복호부(470)의 복호 방법은 가변 길이 부호화부(270)의 부호화 방법에 대응하는 것이다.
<주파수 영역 계열 역정규화부(411)>
주파수 영역 계열 역정규화부(411)는 복호 정규화 계수열(^XN[1],…, ^XN[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])을 입력으로 하고,
^X[n]=^XN[n] ·W[n] (15)
와 같이, 복호계수열(^X[1],…, ^X[N])을 구하고 출력한다(S411).
<주파수 영역 역변환부(410)>
주파수 영역 역변환부(410)는 복호계수열(^X[1],…, ^X[N])을 입력으로 하여, 복호계수열(^X[1],…, ^X[N])을 소정의 시간 구간인 프레임 단위의 음향 신호(시간 영역)로 변환한다(S410).
[복호 장치의 변형예 1] (외부로부터 정보가 입력되는 예)
또한, 복호 장치로서는, 주기성 포락 계열 생성부(440)와 주기성 통합 포락 생성부(450)와 가변 길이 부호화 파라미터 계산부(460)와 가변 길이 복호부(470)만을 구비하고, 복호 장치에 필요에 따라 입력되는 부호(Cδ)와 부호(Csb)와 더불어, 복호 장치의 외부에서 얻어진 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 간격(T), 필요에 따라 지표(S)도 입력으로 하여 정규화 계수열(XN[1],…, XN[N])을 출력하고, 외부에서 평활화 진폭 스펙트럼 포락 계열을 승산하여 시간 영역의 음향 신호로 변환해도 된다.
<실시예 2의 발명의 효과>
가변 길이 부호화는 부호화 대상의 입력값의 진폭이 취할 수 있는 범위에 맞추어 적절하게 부호를 결정함으로써 부호화 효율을 향상시키는 부호화 방법이다. 실시예 2에서는 주파수 영역의 계수열인 정규화 계수열(XN[1],…, XN[N])을 부호화 대상으로 하고 있지만, 부호화 대상의 계수열에 포함되는 각 계수의 진폭의 정보를 보다 정확하게 사용하여 구한 가변 길이 부호화 파라미터를 사용하여 가변 길이 부호화를 하면 부호화 장치가 행하는 가변 길이 부호화 자체의 부호화 효율은 높아진다. 그러나, 복호 장치가 가변 길이 부호화 파라미터를 구하기 위해, 부호화 장치로부터 복호 장치에 대하여 부호화 대상의 계수열에 포함되는 각 계수의 진폭의 정보를 보다 정확하게 보낼 필요가 있어, 그 분량만큼 부호화 장치로부터 복호 장치에 보내는 부호량이 증대해 버린다.
부호량의 증대를 억제하기 위해서는, 적은 부호량의 부호로부터 부호화 대상의 계수열에 포함되는 각 계수의 진폭의 추정값을 얻는 방법이 필요하다. 실시예 2의 주기성 통합 포락 계열(WM[1],…, WM[N])은 계수열(X[1],…, X[N])을 고정밀도로 근사하므로, |WM[1]/W[1]|,…, |WM[N]/W[N]|은 가변 길이 부호화 대상의 계수인 XN[1], XN[2],…, XN[N]의 진폭 포락을 고정밀도로 근사할 수 있다. 즉, |WM[1]/W[1]|,…, |WM[N]/W[N]|은 부호화 대상의 각 계수의 진폭과 정의 상관을 갖는 계열로 되어 있다.
또한 |WM[1]/W[1]|, |WM[2]/W[2]|,…, |WM[N]/W[N]|을 복호 장치측에서 복원하기 위해 필요한 정보는,
·양자화된 선형 예측 계수(^α1,…, ^αP)의 정보(부호(CL))
·간격(T)을 나타내는 정보(부호(CT))
·값(δ)을 나타내는 정보(부호(Cδ))
이다. 즉, 실시예 2의 부호화 장치와 복호 장치에 의하면, 부호화 장치에 입력된 입력 음향 신호의 피치 주기에 기인하는 진폭의 피크를 포함하는 포락을 부호(CL), 부호(CT), 부호(Cδ)만의 적은 정보량으로, 복호 장치에서 재현하는 것이 가능하게 된다.
또한, 실시예 2의 부호화 장치와 복호 장치는, 선형 예측이나 피치 예측을 동반하는 부호화 및 복호를 행하는 부호화 장치 및 복호 장치와 병용하여 사용되는 경우가 많다. 이 경우에는, 부호(CL)와 부호(CT)는 부호화 장치(200)밖에 있는 선형 예측이나 피치 예측을 수반하는 부호화를 행하는 부호화 장치로부터, 복호 장치(400)밖에 있는 선형 예측이나 피치 예측을 수반하는 복호를 행하는 복호 장치로 보내지고 있는 부호이다. 따라서, 부호화 장치측에 입력된 입력 음향 신호의 피치 주기에 기인하는 진폭의 피크를 포함하는 포락을 복호 장치측에서 복원하기 위해 부호화 장치(200)로부터 복호 장치(400)에 보낼 필요가 있는 것은 부호(Cδ)이다. 부호(Cδ)의 부호량은 작아(각각, 기껏 3비트 정도이며, 1비트이어도 효과가 얻어짐), 부호화 대상의 정규화 계수열에 포함되는 부분 계열마다의 가변 길이 부호화 파라미터에 대응하는 부호의 총부호량보다도 적다.
따라서, 실시예 2의 부호화 장치, 복호 장치에 의하면, 적은 부호량의 증가로, 부호화 효율을 향상시킬 수 있다.
<실시예 2의 발명의 포인트>
상술의 효과를 얻는다고 하는 포인트에서 실시예 2의 부호화 장치, 복호 장치를 생각하면, 부호화 장치(200)가,
·소정 시간 구간의 입력 음향 신호로부터 구한 선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 입력 음향 신호로부터 구한 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성부(250)
·주기성 통합 포락 계열의 값이 큰 주파수일수록, 입력 음향 신호의 진폭이 큰 것을 전제로, 입력 음향 신호에 유래하는 주파수 영역의 계열을 부호화하는 가변 길이 부호화부(270)
를 갖고, 복호 장치(400)가,
·선형 예측 계수 부호에 대응하는 주파수 영역의 계열인 스펙트럼 포락 계열과, 주기 부호에 대응하는 주파수 영역의 주기에 기초하는 주파수 영역의 계열인 주기성 통합 포락 계열을 생성하는 주기성 통합 포락 생성부(450)
·주기성 통합 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로, 가변 길이 부호를 복호하여 주파수 영역의 계열을 얻는 가변 길이 복호부(470)
를 갖는 것을 특징으로 하면 된다. 또한, 「주기성 통합 포락 계열의 값이 큰 주파수일수록, 입력 음향 신호의 진폭이 큰 것을 전제로」와 「주기성 통합 포락 계열의 값이 큰 주파수일수록, 음향 신호의 진폭이 큰 것을 전제로」는 주기성 통합 포락 계열이 입력 음향 신호 또는 음향 신호의 진폭이 큰 주파수에 있어서 큰 값이 되는 것을 특징으로 하고 있는 것을 나타내고 있다. 또한 「입력 음향 신호에 유래한다」란 입력 음향 신호로부터 구해지는 것이나 입력 음향 신호에 대응하고 있는 것을 의미하고 있다. 예를 들면, 계수열(X[1],…, X[N])이나 정규화 계수열(XN[1],…, XN[N])은 입력 음향 신호에 유래하는 주파수 영역의 계열이다.
실시예 3
≪부호화 장치≫
도 9에 실시예 3의 부호화 장치의 기능구성예를, 도 10에 실시예 3의 부호화 장치의 처리 흐름을 나타낸다. 부호화 장치(300)는 스펙트럼 포락 계열 계산부(221), 주파수 영역 변환부(110), 주파수 영역 계열 정규화부(111), 주기성 분석부(330), 주기성 포락 계열 생성부(140), 주기성 통합 포락 생성부(250), 가변 길이 부호화 파라미터 계산부(260), 제2 가변 길이 부호화 파라미터 계산부(380), 가변 길이 부호화부(370)를 구비한다. 부호화 장치(300)는 입력된 시간 영역의 음향 디지털 신호를 입력 음향 신호(x(t))로 하여, 적어도 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 정규화 계수열(XN[1],…, XN[N])의 주기를 나타내는 간격(T)의 부호(CT), 계수열(X[1],…, X[N]) 또는 정규화 계수열(XN[1],…, XN[N])의 주기성의 정도를 나타내는 소정의 지표(S)와 지표(S)를 나타내는 부호(CS), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 출력한다. 주파수 영역 계열 정규화부(111)는 실시예 1, 변형예 1과 동일하다. 주파수 영역 변환부(110)와 주기성 포락 계열 생성부(140)는 실시예 1과 동일하다. 진폭 스펙트럼 포락 계열 계산부(221), 주기성 통합 포락 생성부(250), 가변 길이 부호화 파라미터 계산부(260)는 실시예 2와 동일하다. 이하에서는 다른 구성부에 대해 설명한다.
<주기성 분석부(330)>
주기성 분석부(330)는 정규화 계수열(XN[1],…, XN[N])을 입력으로 하여, 당해 정규화 계수열(XN[1],…, XN[N])의 주기성의 정도를 나타내는 지표(S)와 간격(T)(주기적으로 큰 값이 되는 간격)을 구하고, 지표(S)와 지표(S)를 나타내는 부호(CS)와 간격(T)과 간격(T)을 나타내는 부호(CT)를 출력한다(S330). 또한, 지표(S)와 간격(T) 자체는 실시예 1, 변형예 1의 주기성 분석부(131)와 동일하다.
그리고, 부호화 장치(300)에서는, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 가변 길이 부호화 파라미터 계산부(260)가 가변 길이 부호화 파라미터(rn)를 계산하고, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 제2 가변 길이 부호화 파라미터 계산부(380)가 가변 길이 부호화 파라미터(rn)를 계산한다(S390). 「미리 정한 주기성의 정도가 큰 것을 나타내는 범위」는, 예를 들면, 지표(S)가 소정의 임계값 이상일 때로 하면 된다.
<제2 가변 길이 부호화 파라미터 계산부(380)>
제2 가변 길이 부호화 파라미터 계산부(380)는 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 정규화 계수열(XN[1],…, XN[N])을 입력으로 하여, 가변 길이 부호화 파라미터(rn)를 구한다(S380). 가변 길이 부호화 파라미터 계산부(260)는 주기성 통합 포락 계열(WM[1],…, WM[N])로부터 구한 진폭값에 의존하여 가변 길이 부호화 파라미터(rn)를 계산하는 것을 특징으로 하고 있는 것에 대해, 제2 가변 길이 부호화 파라미터 계산부(380)는 진폭 스펙트럼 포락 계열로부터 구한 진폭값에 의존하여 가변 길이 부호화 파라미터를 계산하는 것을 특징으로 하고 있다. 이하에, 1샘플마다 라이스 부호화를 행하는 경우를 예로, 가변 길이 부호화 파라미터의 계산 방법을 설명한다.
(step 1) 정규화 계수열(XN[1],…, XN[N])의 각 계수의 진폭의 평균의 로그를, 기준이 되는 라이스 파라미터(sb)(기준이 되는 가변 길이 부호화 파라미터)로 하여 식 (13)과 같이 산출한다. 이 처리는 가변 길이 부호화 파라미터 계산부(260)와 동일하다.
(step 2) 하기 식에 의해 임계값(θ)을 산출한다.
Figure 112018022108613-pat00011
θ는 진폭 스펙트럼 포락 계열의 각 값(W[n])을 평활화 진폭 스펙트럼 포락 계열의 각 값(W[n])으로 제산한 값의 진폭의 평균의 로그이다.
(step 3) |W[n]/W[n]|이 θ보다 클수록, 정규화 계수(XN[n])를 라이스 부호화하기 위한 라이스 파라미터(rn)를 sb보다도 큰 값으로서 결정한다. |W[n]/W[n]|이 θ보다 작을수록, 정규화 계수(XN[n])를 라이스 부호화하기 위한 라이스 파라미터(rn)를 sb보다도 작은 값으로서 결정한다.
(step 4) step 3의 처리를 모든 n=1, 2,…, N에 대해 반복하여, 각 XN[n]에 대한 라이스 파라미터(rn)를 구한다.
<가변 길이 부호화부(370)>
가변 길이 부호화부(370)는 가변 길이 부호화 파라미터(rn)를 사용하여 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화하여, 가변 길이 부호(CX)를 출력한다(S370). 단, 가변 길이 부호화 파라미터(rn)는 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 가변 길이 부호화 파라미터 계산부(260)가 계산한 가변 길이 부호화 파라미터(rn)이며, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 제2 가변 길이 부호화 파라미터 계산부(380)가 계산한 가변 길이 부호화 파라미터(rn)이다.
부호화 장치(300)는 이러한 처리에 의해 얻어진 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 주기성의 정도를 나타내는 지표(S)를 나타내는 부호(CS), 간격(T)을 나타내는 부호(CT), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 출력하여, 복호측에 송신한다. 또한 필요에 따라 값(δ)을 나타내는 부호(Cδ)와 기준이 되는 가변 길이 부호화 파라미터(sb)를 나타내는 부호(Csb)도 출력하여, 복호측에 송신한다.
[부호화 장치의 변형예 1] (외부로부터 정보가 입력되는 예)
또한, 부호화 장치로서는, 주기성 포락 계열 생성부(140)와 주기성 통합 포락 생성부(250)와 가변 길이 부호화 파라미터 계산부(260)와 제2 가변 길이 부호화 파라미터 계산부(380)와 가변 길이 부호화부(370)만을 구비하고, 부호화 장치의 외부에서 생성된 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 정규화 계수열(XN[1],…, XN[N]), 간격(T)과, 필요에 따라 진폭 스펙트럼 포락 계열(W[1],…, W[N])과, 필요에 따라 지표(S)를 입력으로 하여, 가변 길이 부호(CX)를 출력해도 된다.
[부호화 장치의 변형예 2] (계수열(X[n])로부터 간격(T)을 구하는 예)
상술의 주기성 분석부(330)에서는 정규화 계수열(XN[1],…, XN[N])을 입력으로하여 간격(T)을 구하고 있지만, 주기성 분석부(330)에서는 주파수 영역 변환부(110)가 출력한 계수열(X[1],…, X[N])을 입력으로 하여 간격(T)을 구해도 된다. 이 경우에는, 실시예 1의 주기성 분석부(130)와 동일한 방법으로 간격(T)을 구한다.
≪복호 장치≫
도 11에 실시예 3의 복호 장치의 기능구성예를, 도 12에 실시예 3의 복호 장치의 처리 흐름을 나타낸다. 복호 장치(500)는 스펙트럼 포락 계열 계산부(421), 지표 복호부(530), 주기성 포락 계열 생성부(440), 주기성 통합 포락 생성부(450), 가변 길이 부호화 파라미터 계산부(460), 제2 가변 길이 부호화 파라미터 계산부(580), 가변 길이 복호부(570), 주파수 영역 계열 역정규화부(411), 주파수 영역 역변환부(410)를 구비한다. 복호 장치(500)는 양자화된 선형 예측 계수(^α1,…, ^αP)를 나타내는 부호(CL), 지표(S)를 나타내는 부호(CS), 간격(T)을 나타내는 부호(CT), 정규화 계수열(XN[1],…, XN[N])을 가변 길이 부호화한 가변 길이 부호(CX)를 수취하고, 음향 신호를 출력한다. 또한, 필요에 따라 값(δ)을 나타내는 부호(Cδ)와 기준이 되는 가변 길이 부호화 파라미터(sb)를 나타내는 부호(Csb)도 받는다. 스펙트럼 포락 계열 계산부(421), 주기성 포락 계열 생성부(440), 주기성 통합 포락 생성부(450), 가변 길이 부호화 파라미터 계산부(460), 주파수 영역 계열 역정규화부(411), 주파수 영역 역변환부(410)는 실시예 2와 동일하다. 이하에서는 다른 구성부에 대해 설명한다.
<지표 복호부(530)>
지표 복호부(530)는 부호(CS)를 복호하여, 지표(S)를 얻는다. 복호 장치(500)에서는, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 가변 길이 부호화 파라미터 계산부(460)가 가변 길이 부호화 파라미터(rn)를 계산하고, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 제2 가변 길이 부호화 파라미터 계산부(580)가 가변 길이 부호화 파라미터(rn)를 계산한다(S590). 또한, 「미리 정한 주기성의 정도가 큰 것을 나타내는 범위」는 부호화 장치(300)와 동일한 범위이다.
<제2 가변 길이 부호화 파라미터 계산부(580)>
제2 가변 길이 부호화 파라미터 계산부(580)는 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N])과 부호(Csb)를 입력으로 하여 가변 길이 부호화 파라미터(rn)를 구한다(S580). 단, 복호 장치(500)에 전송되는 다른 정보로부터 진폭의 평균값을 추정할 수 있는 경우에는, 다른 정보로부터 추정한 진폭의 평균값의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정해 놓아도 된다. 이 경우에는, 부호(Csb)는 입력되지 않는다. 이하에, 1샘플마다 라이스 복호를 행하는 경우를 예로, 가변 길이 부호화 파라미터의 계산 방법을 설명한다.
(step 1) 부호(Csb)를 복호하여, 기준이 되는 라이스 파라미터(sb)(기준이 되는 가변 길이 부호화 파라미터)를 얻는다. 또한, 부호화 장치(300)와 복호 장치(500)에서 공통으로 진폭의 추정값으로부터 sb를 근사적으로 결정하는 방법을 정하고 있는 경우에는, 그 방법으로 구한다.
(step 2) 임계값(θ)을 식 (16)으로 산출한다.
(step 3) |W[n]/W[n]|이 θ보다 클수록, 라이스 파라미터(rn)를 sb보다도 큰 값으로 하여, 부호화 장치(300)의 제2 가변 길이 부호화 파라미터 계산부(380)와 동일한 방법으로 결정한다. |W[n]/W[n]|이 θ보다 작을수록, 라이스 파라미터(rn)를 sb보다도 작은 값으로 하여, 부호화 장치(300)의 제2 가변 길이 부호화 파라미터 계산부(380)와 동일한 방법으로 결정한다.
(step 4) step 3의 처리를 모든 n=1, 2,…, N에 대해 반복하여, 각 XN[n]에 대한 라이스 파라미터(rn)를 구한다.
<가변 길이 복호부(570)>
가변 길이 복호부(570)는 가변 길이 부호화 파라미터(rn)를 사용하여 가변 길이 부호(CX)를 복호하여 복호 정규화 계수열(^XN[1],…, ^XN[N])을 구한다(S570). 단, 가변 길이 부호화 파라미터(rn)는, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위인 경우에는, 가변 길이 부호화 파라미터 계산부(460)가 계산한 가변 길이 부호화 파라미터(rn)이며, 지표(S)가 미리 정한 주기성의 정도가 큰 것을 나타내는 범위가 아닌 경우에는, 제2 가변 길이 부호화 파라미터 계산부(580)가 계산한 가변 길이 부호화 파라미터(rn)이다.
[복호 장치의 변형예 1] (외부로부터 정보가 입력되는 예)
또한, 복호 장치로서는 주기성 포락 계열 생성부(440)와 주기성 통합 포락 생성부(450)와 가변 길이 부호화 파라미터 계산부(460)와 제2 가변 길이 부호화 파라미터 계산부(580)와 가변 길이 복호부(570)만을 구비하고, 복호 장치에 필요에 따라 입력되는 부호(Cδ)와 부호(Csb)와 더불어, 복호 장치의 외부에서 얻어진 평활화 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 진폭 스펙트럼 포락 계열(W[1],…, W[N]), 간격(T), 지표(S)도 입력으로 하여, 정규화 계수열(XN[1],…, XN[N])을 출력하고, 외부에서 평활화 진폭 스펙트럼 포락 계열을 승산하여 시간 영역의 음향 신호로 변환해도 된다.
<실시예 3의 발명의 효과>
입력 음향 신호의 주기성의 정도가 작은 경우에는, 입력 음향 신호의 피치 주기에 기인하는 진폭의 피크는 작다. 그래서, 실시예 3의 부호화 장치, 복호 장치는 부호화의 대상이 되는 음향 신호의 주기성의 정도가 큰 경우에는 주기성 통합 포락 계열을 사용하여 가변 길이 부호화 파라미터를 구하고, 부호화의 대상이 되는 음향 신호의 주기성의 정도가 크지 않은 경우에는 진폭 스펙트럼 포락 계열을 사용하여 가변 길이 부호화 파라미터를 구하기 때문에, 보다 적합한 가변 길이 부호화 파라미터를 사용하여 가변 길이 부호화할 수 있어, 부호화 정밀도를 높일 수 있다고 하는 효과가 있다.
상술의 실시예 1∼3에서는, 진폭 스펙트럼 포락 계열, 평활화 진폭 스펙트럼 포락 계열, 주기성 통합 포락 계열 등에 대해 진폭의 계열을 사용하는 예를 설명했지만, 진폭의 계열 대신 파워의 계열, 즉, W[n], W[n], WM[n]으로서 파워스펙트럼 포락 계열, 평활화 파워스펙트럼 포락 계열, 파워의 계열인 주기성 통합 포락 계열을 사용해도 된다.
[프로그램, 기록매체]
상술의 각종 처리는 기재에 따라 시계열로 실행될 뿐만 아니라, 처리를 실행하는 장치의 처리능력 혹은 필요에 따라 병렬적으로 혹은 개별적으로 실행되어도 된다. 그 외에, 본 발명의 취지를 일탈하지 않는 범위에서 적당히 변경이 가능한 것은 말할 필요도 없다.
또한 상술의 구성을 컴퓨터에 의해 실현하는 경우, 각 장치가 가져야 할 기능의 처리 내용은 프로그램에 의해 기술된다. 그리고, 이 프로그램을 컴퓨터에서 실행함으로써, 상기 처리 기능이 컴퓨터 상에서 실현된다.
이 처리 내용을 기술한 프로그램은 컴퓨터로 판독 가능한 기록매체에 기록해 둘 수 있다. 컴퓨터로 판독 가능한 기록매체로서는, 예를 들면, 자기 기록 장치, 광디스크, 광자기 기록매체, 반도체 메모리 등 어떤 것이이어도 된다.
또한 이 프로그램의 유통은, 예를 들면, 그 프로그램을 기록한 DVD, CD-ROM 등의 가반형 기록매체를 판매, 양도, 대여 등 함으로써 행한다. 또한, 이 프로그램을 서버 컴퓨터의 기억 장치에 저장해 두고, 네트워크를 통해, 서버 컴퓨터로부터 다른 컴퓨터에 그 프로그램을 전송함으로써, 이 프로그램을 유통시키는 구성으로 해도 된다.
이러한 프로그램을 실행하는 컴퓨터는, 예를 들면, 우선, 가반형 기록매체에 기록된 프로그램 혹은 서버 컴퓨터로부터 전송된 프로그램을, 일단, 자신의 기억 장치에 저장한다. 그리고, 처리의 실행시, 이 컴퓨터는 자신의 기록매체에 저장된 프로그램을 판독하고, 판독한 프로그램에 따른 처리를 실행한다. 또한 이 프로그램의 다른 실행 형태로서, 컴퓨터가 가반형 기록매체로부터 직접 프로그램을 읽어내고, 그 프로그램에 따른 처리를 실행하는 것으로 해도 되고, 또한, 이 컴퓨터에 서버 컴퓨터로부터 프로그램이 전송될 때마다, 차례차례, 수취한 프로그램에 따른 처리를 실행하는 것으로 해도 된다. 또한 서버 컴퓨터로부터 이 컴퓨터로의 프로그램의 전송은 행하지 않고, 그 실행 지시와 결과 취득에 의해서만 처리 기능을 실현하는, 소위 ASP(Application Service Provider)형의 서비스에 의해, 상술의 처리를 실행하는 구성으로 해도 된다. 또한, 본 형태에 있어서의 프로그램에는, 전자계산기에 의한 처리의 용도에 제공하는 정보이며 프로그램에 준하는 것(컴퓨터에 대한 직접적인 지령은 아니지만 컴퓨터의 처리를 규정하는 성질을 갖는 데이터 등)을 포함하는 것으로 한다.
또한 이 형태에서는, 컴퓨터 상에서 소정의 프로그램을 실행시킴으로써, 본 장치를 구성하는 것으로 했지만, 이들 처리 내용의 적어도 일부를 하드웨어적으로 실현하는 것으로 해도 된다.
100, 101 주기성 통합 포락 계열 생성 장치
110 주파수 영역 변환부
111 주파수 영역 계열 정규화부
120, 121, 221, 421 스펙트럼 포락 계열 계산부
130,131, 230, 330 주기성 분석부
140, 440 주기성 포락 계열 생성부
150, 250, 450 주기성 통합 포락 생성부
200, 300 부호화 장치
260, 360, 460 가변 길이 부호화 파라미터 계산부
270, 370 가변 길이 부호화부
380, 580 제2 가변 길이 부호화 파라미터 계산부
400, 500 복호 장치
410 주파수 영역 역변환부
411 주파수 영역 계열 역정규화부
470, 570 가변 길이 복호부
530 지표 복호부

Claims (4)

  1. 소정의 시간 구간인 프레임 단위의 시간 영역의 음향 디지털 신호를 입력 음향 신호로 하고,
    상기 입력 음향 신호로부터 구한 선형 예측 계수로부터 상기 입력 음향 신호의 스펙트럼 포락 계열을 계산하는 스펙트럼 포락 계열 계산부와,
    상기 입력 음향 신호의 주기성의 정도가 큰 경우에는, 상기 스펙트럼 포락 계열 중 적어도 상기 입력 음향 신호의 주파수 영역에서의 주기의 정수배 및 주기의 정수배 근방의 샘플값을, 상기 입력 음향 신호에 대응하는 주파수 영역의 계수의 절대값 계열의 형상과 가까워지도록 변경하여 얻어지는 계열을 주기성 통합 포락 계열로 하는 주기성 통합 포락 생성부를 구비하는 것을 특징으로 하는 주기성 통합 포락 계열 생성 장치.
  2. 소정의 시간 구간인 프레임 단위의 시간 영역의 음향 디지털 신호를 입력 음향 신호로 하고,
    상기 입력 음향 신호로부터 구한 선형 예측 계수로부터 상기 입력 음향 신호의 스펙트럼 포락 계열을 계산하는 스펙트럼 포락 계열 계산 스텝과,
    상기 입력 음향 신호의 주기성의 정도가 큰 경우에는, 상기 스펙트럼 포락 계열 중 적어도 상기 입력 음향 신호의 주파수 영역에서의 주기의 정수배 및 주기의 정수배 근방의 샘플값을, 상기 입력 음향 신호에 대응하는 주파수 영역의 계수의 절대값 계열의 형상과 가까워지도록 변경하여 얻어지는 계열을 주기성 통합 포락 계열로 하는 주기성 통합 포락 생성 스텝을 실행하는 주기성 통합 포락 계열 생성 방법.
  3. 제 2 항에 기재된 주기성 통합 포락 계열 생성 방법의 각 스텝을 컴퓨터에 실행시키기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램.
  4. 제 2 항에 기재된 주기성 통합 포락 계열 생성 방법의 각 스텝을 컴퓨터에 실행시키기 위한 주기성 통합 포락 계열 생성 프로그램을 기록한 컴퓨터가 판독 가능한 기록매체.
KR1020187006351A 2014-05-01 2015-02-20 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체 KR101860143B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014094880 2014-05-01
JPJP-P-2014-094880 2014-05-01
PCT/JP2015/054718 WO2015166694A1 (ja) 2014-05-01 2015-02-20 周期性統合包絡系列生成装置、周期性統合包絡系列生成方法、周期性統合包絡系列生成プログラム、記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020167029936A Division KR101837153B1 (ko) 2014-05-01 2015-02-20 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체

Publications (2)

Publication Number Publication Date
KR20180029087A KR20180029087A (ko) 2018-03-19
KR101860143B1 true KR101860143B1 (ko) 2018-05-23

Family

ID=54358435

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020187006351A KR101860143B1 (ko) 2014-05-01 2015-02-20 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
KR1020167029936A KR101837153B1 (ko) 2014-05-01 2015-02-20 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
KR1020187006347A KR101860139B1 (ko) 2014-05-01 2015-02-20 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
KR1020187006358A KR101860146B1 (ko) 2014-05-01 2015-02-20 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체

Family Applications After (3)

Application Number Title Priority Date Filing Date
KR1020167029936A KR101837153B1 (ko) 2014-05-01 2015-02-20 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
KR1020187006347A KR101860139B1 (ko) 2014-05-01 2015-02-20 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
KR1020187006358A KR101860146B1 (ko) 2014-05-01 2015-02-20 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체

Country Status (9)

Country Link
US (6) US10204633B2 (ko)
EP (4) EP3696816B1 (ko)
JP (4) JP6276846B2 (ko)
KR (4) KR101860143B1 (ko)
CN (4) CN110289008B (ko)
ES (4) ES2738723T3 (ko)
PL (4) PL3699910T3 (ko)
TR (1) TR201910806T4 (ko)
WO (1) WO2015166694A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2768090T3 (es) 2014-03-24 2020-06-19 Nippon Telegraph & Telephone Método de codificación, codificador, programa y soporte de registro
WO2017125840A1 (en) * 2016-01-19 2017-07-27 Hua Kanru Method for analysis and synthesis of aperiodic signals
US10475471B2 (en) * 2016-10-11 2019-11-12 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications using a neural network
US10242696B2 (en) 2016-10-11 2019-03-26 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications
KR102643277B1 (ko) 2022-03-10 2024-03-05 주식회사 메사쿠어컴퍼니 얼굴인식을 이용한 비밀번호 입력 방법 및 시스템
KR20230136288A (ko) 2022-03-18 2023-09-26 주식회사 메사쿠어컴퍼니 얼굴의 부분영역으로 얼굴인증을 수행하는 방법

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58168094A (ja) * 1982-03-29 1983-10-04 藤崎 博也 音声分析処理方式
JPS5994795A (ja) * 1982-11-22 1984-05-31 藤崎 博也 音声分析処理方式
US5528723A (en) * 1990-12-28 1996-06-18 Motorola, Inc. Digital speech coder and method utilizing harmonic noise weighting
BE1007617A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US7092881B1 (en) * 1999-07-26 2006-08-15 Lucent Technologies Inc. Parametric speech codec for representing synthetic speech in the presence of background noise
WO2002029782A1 (en) * 2000-10-02 2002-04-11 The Regents Of The University Of California Perceptual harmonic cepstral coefficients as the front-end for speech recognition
US7013269B1 (en) * 2001-02-13 2006-03-14 Hughes Electronics Corporation Voicing measure for a speech CODEC system
WO2003019530A1 (fr) * 2001-08-31 2003-03-06 Kenwood Corporation Dispositif et procede de generation d'un signal a forme d'onde affecte d'un pas ; programme
US7027980B2 (en) * 2002-03-28 2006-04-11 Motorola, Inc. Method for modeling speech harmonic magnitudes
KR101001170B1 (ko) * 2002-07-16 2010-12-15 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
JP4977472B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 スケーラブル復号化装置
KR20060067016A (ko) * 2004-12-14 2006-06-19 엘지전자 주식회사 음성 부호화 장치 및 방법
US7580910B2 (en) 2005-04-06 2009-08-25 Content Analyst Company, Llc Perturbing latent semantic indexing spaces
TWI279774B (en) * 2005-04-14 2007-04-21 Ind Tech Res Inst Adaptive pulse allocation mechanism for multi-pulse CELP coder
CN101138274B (zh) * 2005-04-15 2011-07-06 杜比国际公司 用于处理去相干信号或组合信号的设备和方法
US7930176B2 (en) * 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
US7596231B2 (en) 2005-05-23 2009-09-29 Hewlett-Packard Development Company, L.P. Reducing noise in an audio signal
US20070011001A1 (en) * 2005-07-11 2007-01-11 Samsung Electronics Co., Ltd. Apparatus for predicting the spectral information of voice signals and a method therefor
KR100770839B1 (ko) * 2006-04-04 2007-10-26 삼성전자주식회사 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치
KR100762596B1 (ko) * 2006-04-05 2007-10-01 삼성전자주식회사 음성 신호 전처리 시스템 및 음성 신호 특징 정보 추출방법
US8688437B2 (en) * 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
US8255222B2 (en) * 2007-08-10 2012-08-28 Panasonic Corporation Speech separating apparatus, speech synthesizing apparatus, and voice quality conversion apparatus
JP4327241B2 (ja) * 2007-10-01 2009-09-09 パナソニック株式会社 音声強調装置および音声強調方法
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
WO2009109050A1 (en) * 2008-03-05 2009-09-11 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
JP5038995B2 (ja) * 2008-08-25 2012-10-03 株式会社東芝 声質変換装置及び方法、音声合成装置及び方法
EP3975587A1 (en) * 2009-02-03 2022-03-30 Cochlear Limited Enhanced envelope encoded tone sound processor and system
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8902997B2 (en) * 2009-06-03 2014-12-02 Nippon Telegraph And Telephone Corporation PARCOR coefficient quantization method, PARCOR coefficient quantization apparatus, program and recording medium
JP5223786B2 (ja) * 2009-06-10 2013-06-26 富士通株式会社 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機
KR101381272B1 (ko) * 2010-01-08 2014-04-07 니뽄 덴신 덴와 가부시키가이샤 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
WO2011086923A1 (ja) * 2010-01-14 2011-07-21 パナソニック株式会社 符号化装置、復号装置、スペクトル変動量算出方法及びスペクトル振幅調整方法
JP5749462B2 (ja) * 2010-08-13 2015-07-15 株式会社Nttドコモ オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム
BR112013011312A2 (pt) * 2010-11-10 2019-09-24 Koninl Philips Electronics Nv método para estimar um padrão em um sinal (s) tendo um componente periódico, semiperiódico ou virtualmente periódico, dispositivo para estimar um padrão em um sinal (s) tendo um componente periódico, semiperiódico ou virtualmente periódico e programa de computador
US9711158B2 (en) * 2011-01-25 2017-07-18 Nippon Telegraph And Telephone Corporation Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium
PL2676266T3 (pl) * 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
WO2012111512A1 (ja) * 2011-02-16 2012-08-23 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
EP3441967A1 (en) * 2011-04-05 2019-02-13 Nippon Telegraph and Telephone Corporation Decoding method, decoder, program, and recording medium
US8620646B2 (en) * 2011-08-08 2013-12-31 The Intellisis Corporation System and method for tracking sound pitch across an audio signal using harmonic envelope
MY168806A (en) * 2012-06-28 2018-12-04 Fraunhofer Ges Forschung Linear prediction based audio coding using improved probability distribution estimation
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
CN103827964B (zh) * 2012-07-05 2018-01-16 松下知识产权经营株式会社 编解码系统、解码装置、编码装置以及编解码方法
WO2014053261A1 (en) * 2012-10-05 2014-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for encoding a speech signal employing acelp in the autocorrelation domain
RU2740690C2 (ru) * 2013-04-05 2021-01-19 Долби Интернешнл Аб Звуковые кодирующее устройство и декодирующее устройство
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
JP6385433B2 (ja) * 2013-10-18 2018-09-05 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号のスペクトルのスペクトル係数のコード化
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ISO/IEC FDIS 23003-3:2011(E), Information technology - MPEG audio technologies - Part 3: Unified speech and audio coding. ISO/IEC JTC 1/SC 29/WG 11. 2011.09.20.
Suat Yeldener, et al. A mixed sinusoidally excited linear prediction coder at 4 kb/s and below. Proceedings of the 1998 IEEE International Conference on Acoustics, Speech and Signal Processing, 1998.
Universal Mobile Telecommunications System (UMTS); Mandatory Speech Codec speech processing functions AMR Wideband speech codec;Transcoding functions. 3GPP TS 26.190 version 5.1.0 Release 5. 2001.12.

Also Published As

Publication number Publication date
CN110289008B (zh) 2022-10-21
KR20180029087A (ko) 2018-03-19
JP6276846B2 (ja) 2018-02-07
CN110491402B (zh) 2022-10-21
ES2878061T3 (es) 2021-11-18
EP3696816B1 (en) 2021-05-12
CN110491402A (zh) 2019-11-22
PL3537439T3 (pl) 2020-10-19
PL3699910T3 (pl) 2021-11-02
KR20160138509A (ko) 2016-12-05
JPWO2015166694A1 (ja) 2017-04-20
US11100938B2 (en) 2021-08-24
CN110491401A (zh) 2019-11-22
CN106537500B (zh) 2019-09-13
KR20180029089A (ko) 2018-03-19
US20170025132A1 (en) 2017-01-26
ES2738723T3 (es) 2020-01-24
TR201910806T4 (tr) 2019-08-21
EP3139381A1 (en) 2017-03-08
JP2018200492A (ja) 2018-12-20
WO2015166694A1 (ja) 2015-11-05
EP3139381A4 (en) 2017-11-08
EP3537439A1 (en) 2019-09-11
ES2884034T3 (es) 2021-12-10
KR101837153B1 (ko) 2018-03-09
KR101860139B1 (ko) 2018-05-23
US10734009B2 (en) 2020-08-04
ES2805275T3 (es) 2021-02-11
PL3696816T3 (pl) 2021-10-25
JP6867528B2 (ja) 2021-04-28
US20230021878A1 (en) 2023-01-26
KR20180027645A (ko) 2018-03-14
US20210312933A1 (en) 2021-10-07
KR101860146B1 (ko) 2018-05-23
US20200273474A1 (en) 2020-08-27
EP3699910B1 (en) 2021-05-26
US20240062767A1 (en) 2024-02-22
EP3139381B1 (en) 2019-04-24
PL3139381T3 (pl) 2019-10-31
JP2020098366A (ja) 2020-06-25
US20190115036A1 (en) 2019-04-18
US10204633B2 (en) 2019-02-12
US11501788B2 (en) 2022-11-15
EP3537439B1 (en) 2020-05-13
JP6412994B2 (ja) 2018-10-24
CN106537500A (zh) 2017-03-22
EP3699910A1 (en) 2020-08-26
US11848021B2 (en) 2023-12-19
CN110289008A (zh) 2019-09-27
CN110491401B (zh) 2022-10-21
EP3696816A1 (en) 2020-08-19
JP6674992B2 (ja) 2020-04-01
JP2018005247A (ja) 2018-01-11

Similar Documents

Publication Publication Date Title
KR101860143B1 (ko) 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
JP6744471B2 (ja) 符号化装置、復号装置、符号化方法、復号方法、符号化プログラム、復号プログラム、記録媒体

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant