KR101993828B1 - 부호화 방법, 장치, 프로그램 및 기록 매체 - Google Patents

부호화 방법, 장치, 프로그램 및 기록 매체 Download PDF

Info

Publication number
KR101993828B1
KR101993828B1 KR1020177002231A KR20177002231A KR101993828B1 KR 101993828 B1 KR101993828 B1 KR 101993828B1 KR 1020177002231 A KR1020177002231 A KR 1020177002231A KR 20177002231 A KR20177002231 A KR 20177002231A KR 101993828 B1 KR101993828 B1 KR 101993828B1
Authority
KR
South Korea
Prior art keywords
encoding
coefficient
unit
acoustic signal
frequency domain
Prior art date
Application number
KR1020177002231A
Other languages
English (en)
Other versions
KR20170024030A (ko
Inventor
타케히로 모리야
유타카 카마모토
노보루 하라다
Original Assignee
니폰 덴신 덴와 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 니폰 덴신 덴와 가부시끼가이샤 filed Critical 니폰 덴신 덴와 가부시끼가이샤
Publication of KR20170024030A publication Critical patent/KR20170024030A/ko
Application granted granted Critical
Publication of KR101993828B1 publication Critical patent/KR101993828B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectroscopy & Molecular Physics (AREA)

Abstract

입력 음향 신호의 특성에 따르지 않고 효율이 좋게 부호화하고, 또한 수청자가 부자연스럽게 느끼는 일이 적은 복호 음향 신호가 얻어지도록 하는 부호화 기술을 제공하는 것을 목적으로 한다. 입력 음향 신호를 소정 시간 구간의 프레임마다 주파수 영역에서의 복수의 부호화 처리 중 결정된 부호화 처리로 부호화하는 부호화 방법으로서, 결정부(380)가 앞 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와 현 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기의 적어도 어느 하나가 소정의 역치 이하인 경우에, 앞 프레임과 상이한 부호화 처리를 현 프레임의 부호화 처리로서 결정하는 것을 가능하게 한다.

Description

부호화 방법, 장치, 프로그램 및 기록 매체{CODING METHOD, DEVICE, PROGRAM, AND RECORDING MEDIUM}
본 발명은 음향 신호의 부호화 기술에 관한 것이다. 특히 음향 신호를 주파수 영역으로 변환하여 부호화하는 부호화 기술에 관한 것이다.
음성이나 음악 등의 음향 신호의 부호화에는 입력 음향 신호를 주파수 영역에서 부호화하는 수법이 널리 사용되고 있다. 음향 신호의 주파수 영역에서의 부호화 방법으로서는 예를 들면 비특허문헌 1이나 비특허문헌 2의 방법이 있다.
비특허문헌 1에 기재된 부호화 방법은 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리를 행하는 것이다. 구체적으로는 비특허문헌 1에 기재된 부호화 방법은 입력 음향 신호로부터 얻어지는 선형 예측 계수로 변환 가능한 계수를 부호화하여 선형 예측 계수 부호를 얻어, 선형 예측 계수 부호에 대응하는 양자화 완료의 선형 예측 계수로 변환 가능한 계수에 대응하는 스펙트럼 포락 계수열로 입력 음향 신호에 대응하는 주파수 영역 계수열을 정규화하여 얻어지는 정규화 계수열을 부호화하여 정규화 계수 부호를 얻는 것이다. 선형 예측 계수로 변환 가능한 계수는 선형 예측 계수 그 자체, PARCOR 계수(편자기 상관 계수) 또는 LSP 파라미터 등이다.
비특허문헌 2에 기재된 부호화 방법은 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값을 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분을 취하고, 차분값 가변 길이 부호화를 수반하는 부호화 처리를 행하는 것이다. 구체적으로는 비특허문헌 2에 기재된 부호화 방법은 입력 음향 신호에 대응하는 주파수 영역 계수열을 저역일수록 샘플수가 적고 고역일수록 샘플수가 많은 주파수 영역으로 구분하고, 구분한 주파수 영역마다의 평균 에너지를 얻어, 그 평균 에너지를 대수축으로 양자화한다. 양자화한 값을 인접하는 주파수 영역의 평균 에너지를 마찬가지로 대수축으로 양자화한 값과의 차분을 가변 길이 부호화한다. 구분한 주파수 영역마다의 대수축으로 양자화된 평균 에너지를 사용하여, 각 주파수 영역 계수의 양자화 비트수나 각 주파수 영역 계수의 양자화 스텝 폭을 적응적으로 결정하고, 그것에 따라 각 주파수 영역 계수를 양자화하고, 또한 그것을 가변 길이 부호화하는 것이다.
Anthony Vetro, "MPEG Unified Speech and Audio Coding", Industry and Standards, IEEE MultiMedia, April-June, 2013. M. Bosi and R.E. Goldberg, "Introduction to Digital Audio Coding and Standards", Kluwer Academic Publishers, 2003.
비특허문헌 2의 부호화 방법에 의하면, 입력 음향 신호의 스펙트럼 포락의 기복이 크지 않은 경우나 스펙트럼의 집중도가 높지 않은 경우에는, 평균 에너지의 차분을 가변 길이 부호화함으로써 평균 에너지 부호의 부호량을 적게 할 수 있기 때문에, 입력 음향 신호를 효율 좋게 부호화할 수 있다. 그러나 입력 음향 신호의 스펙트럼 포락의 기복이 큰 경우나 스펙트럼의 집중도가 높은 경우에는, 평균 에너지의 차분을 가변 길이 부호화하여 얻어지는 평균 에너지 부호의 부호량이 많아진다.
이에 대해, 비특허문헌 1의 부호화 방법에 의하면, 선형 예측 계수로 변환 가능한 계수에 의해 스펙트럼 포락을 효율 좋게 부호화할 수 있기 때문에, 입력 음향 신호의 스펙트럼 포락의 기복이 큰 경우나 스펙트럼의 집중도가 높은 경우에는, 비특허문헌 2의 부호화 방법보다 입력 음향 신호를 효율 좋게 부호화할 수 있다. 그러나 입력 음향 신호의 스펙트럼 포락의 기복이 크지 않은 경우나 스펙트럼의 집중도가 높지 않은 경우에는, 비특허문헌 2의 부호화 방법만큼은 효율 좋게 부호화할 수는 없다.
이와 같이 종래의 부호화 방법에는 입력 음향 신호의 특성에 따라서는 효율 좋게 부호화할 수 없는 경우가 있다.
본 발명은 입력 음향 신호의 특성에 따르지 않고 효율 좋게 부호화하고, 또한 수청자(受聽者)가 부자연스럽게 느끼는 일이 적은 복호 음향 신호를 얻을 수 있도록 한 부호화 방법, 장치, 프로그램 및 기록 매체를 제공하는 것을 목적으로 한다.
본 발명의 하나의 태양의 부호화 방법은 입력 음향 신호를 소정 시간 구간의 프레임마다 주파수 영역에서의 복수의 부호화 처리 중 결정된 부호화 처리로 부호화하는 부호화 방법으로서, 앞 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와 현 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기의 적어도 어느 하나가 소정의 역치 이하인 경우에, 앞 프레임과 상이한 부호화 처리를 현 프레임의 부호화 처리로서 결정하는 것을 가능하게 하는 결정 스텝을 포함한다.
본 발명의 하나의 태양의 부호화 방법은 입력 음향 신호를 소정 시간 구간의 프레임마다 주파수 영역에서의 복수의 부호화 처리 중 결정된 부호화 처리로 부호화하는 부호화 방법으로서, 앞 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와 현 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기의 적어도 어느 하나가 소정의 역치 이하인 경우에는, 앞 프레임과 상이한 부호화 처리를 현 프레임의 부호화 처리로서 결정하는 것을 가능하게 하고, 그렇지 않은 경우에는, 입력 음향 신호의 고역 성분이 희소한 상태에 따라, 앞 프레임과 상이한 부호화 처리를 현 프레임의 부호화 처리로서 결정하는 것을 가능하게 할지, 앞 프레임과 동일한 부호화 처리를 현 프레임의 부호화 처리로서 결정할지를 결정하는 결정 스텝을 포함한다.
본 발명의 하나의 태양의 부호화 방법은 입력 음향 신호를 소정 시간 구간의 프레임마다 주파수 영역에서의 복수의 부호화 처리 중 결정된 부호화 처리로 부호화하는 부호화 방법으로서, 입력 음향 신호에 대응하는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용하여, 입력 음향 신호에 대응하는 주파수 영역의 계수열을 부호화하는 제1 부호화 스텝과, 입력 음향 신호에 대응하는 주파수 영역의 계수열에 대해서, 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값을 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하여 부호화하는 제2 부호화 스텝과, 현 프레임의 입력 음향 신호의 스펙트럼의 기복이 큰 경우 또는 집중도가 높은 경우에는, 현 프레임을 제1 부호화 스텝에서 부호화하는 것을 결정 가능하게 하고, 현 프레임의 입력 음향 신호의 스펙트럼의 기복이 작은 경우 또는 집중도가 낮은 경우에는, 현 프레임을 제2 부호화 스텝에서 부호화하는 것을 결정 가능하게 하는 결정 스텝을 포함한다.
프레임마다 주파수 영역에서 부호화를 행하는 복수의 부호화 처리의 어느 하나를 선택 가능한 구성에 의해, 수청자가 부자연스럽게 느끼는 일이 적은 복호 음향 신호를 얻는 것이 가능해진다.
도 1은 부호화 장치의 구성을 예시한 블록도.
도 2는 복호 장치의 구성을 예시한 블록도.
도 3은 부호화 방법의 처리의 흐름의 예를 나타내는 도면.
도 4는 결정부(380)의 처리의 흐름의 예를 나타내는 도면.
도 5는 적합 부호화 처리 판정부(382)의 처리의 흐름의 예를 나타내는 도면.
도 6은 제2 실시형태의 전환 결정부(383)의 처리의 흐름의 예를 나타내는 도면.
도 7은 제3 실시형태의 적합 부호화 처리 판정부(382)의 처리의 흐름의 예를 나타내는 도면.
도 8은 제1 부호화 처리 및 제2 부호화 처리의 개념도.
[제1 실시형태]
이하, 본 발명의 제1 실시형태에 대해서 설명한다. 제1 실시형태는 주파수 영역에서의 부호화 처리를 행하는 복수의 상이한 부호화 처리의 어느 하나로 프레임마다의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 부호화하는 구성에 있어서, 입력 음향 신호 또는/및 입력 음향 신호에 대응하는 주파수 영역의 계수열의 고역 성분의 에너지가 작은 경우에만, 부호화 처리의 전환을 행하는 구성이다. 입력 음향 신호의 고역 성분의 에너지는 입력 음향 신호의 고역 성분의 에너지의 크기 그 자체나, 입력 음향 신호에 차지하는 고역 성분의 에너지의 크기 등이다.
<부호화 장치(300)>
부호화 장치(300)의 구성을 도 1에 나타낸다. 부호화 장치(300)는 주파수 영역 변환부(110), 결정부(380), 제1 부호화부(101), 제2 부호화부(201)를 구비하고 있다. 제1 부호화부(101)는 예를 들면 선형 예측 분석 부호화부(120), 스펙트럼 포락 계수열 생성부(130), 포락 정규화부(140), 정규화 계수 부호화부(150)를 구비하고 있다. 제2 부호화부(201)는 예를 들면 영역 분할부(220), 평균 대수 에너지 차분 가변 길이 부호화부(240), 계수 부호화부(250)를 구비하고 있다. 부호화 장치(300)에는 소정의 시간 구간인 프레임 단위로, 시간 영역의 음성 음향 디지털 신호(이하, 입력 음향 신호로 한다.)가 입력되어, 프레임마다 이하의 처리가 행해진다. 이하에서는 현재의 입력 음향 신호가 f번째의 프레임인 것으로 하여, 각 부의 구체 처리를 설명한다. f번째의 프레임의 입력 음향 신호를 xf(n)(n=1,...,Nt)로 한다. 여기서 Nt는 프레임당 샘플수이다.
이하, 부호화 장치(300)의 동작에 대해서 설명한다. 부호화 장치(300)에 의해 도 3에 예시하는 부호화 방법의 각 스텝의 처리가 실행된다.
<주파수 영역 변환부(110)>
주파수 영역 변환부(110)는 입력 음향 신호 xf(n)(n=1,...,Nt)를 주파수 영역의 계수열, 예를 들면 N점의 MDCT 계수열 Xf(n)(n=1,...,N)로 변환하여 출력한다(스텝 S110). 단 N은 주파수 영역에서의 샘플수이며, 정의 정수이다. 주파수 영역으로의 변환은 MDCT가 아닌 공지의 변환 방법에 의해 행해도 된다.
또 제1 부호화부(101), 제2 부호화부(201), 결정부(380)로 복수의 정밀도나 방법에 의해 얻어진 주파수 영역의 계수열이 필요한 경우에는, 주파수 영역 변환부(110)로 복수의 정밀도나 방법에 의해 주파수 영역의 계수열을 얻으면 된다. 예를 들면 제1 부호화부(101)와 제2 부호화부(201)가 MDCT 계수열을 주파수 영역의 계수열로서 사용하고, 결정부(380)가 파워 스펙트럼 계열을 주파수 영역의 계수열로서 사용하는 경우에는, 주파수 영역 변환부(110)가 입력 음향 신호로부터 MDCT 계수열과 파워 스펙트럼 계열을 구하면 된다. 또 예를 들면 제1 부호화부(101)와 제2 부호화부(201)가 MDCT 계수열을 주파수 영역의 계수열로서 사용하고, 결정부(380)가 주파수 대역마다의 에너지의 계열을 주파수 영역의 계수열로서 사용하는 경우에는, 주파수 영역 변환부(110)가 입력 음향 신호로부터 MDCT 계수열과 주파수 대역마다의 에너지의 계열을 구하면 된다. 또 예를 들면 제1 부호화부(101)와 제2 부호화부(201)가 MDCT 계수열을 주파수 영역의 계수열로서 사용하고, 결정부(380)의 전환 가부 판정부(381)가 주파수 대역마다의 에너지의 계열을 주파수 영역의 계수열로서 사용하고, 결정부(380)의 적합 부호화 처리 판정부(382)가 파워 스펙트럼 계열을 주파수 영역의 계수열로서 사용하는 경우에는, 주파수 영역 변환부(110)가 입력 음향 신호로부터 MDCT 계수열과 주파수 대역마다의 에너지의 계열과 파워 스펙트럼 계열을 구하면 된다.
<결정부(380)>
결정부(380)는 앞 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와, 현 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와의 적어도 어느 하나가 소정의 역치보다 작은 경우에, 앞 프레임과 상이한 부호화 처리를 현 프레임의 부호화 처리로서 결정하는 것을 가능하게 한다(스텝 S380).
바꾸어 말하면, 결정부(380)는 적어도 입력 음향 신호의 고역 성분의 에너지가 작은 경우에는, 앞 프레임의 주파수 영역의 계수열을 부호화한 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용하고, 그렇지 않은 경우에는 앞 프레임의 주파수 영역의 계수열을 부호화한 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용하지 않는 판정을 행하고, 그 판정 결과에 따라 현 프레임의 주파수 영역의 계수열을 부호화하도록 전환 제어한다.
결정부(380)는 예를 들면 전환 가부 판정부(381), 적합 부호화 처리 판정부(382), 전환 결정부(383), 전환부(384)를 구비하고 있다. 이하, 결정부(380)의 일례에 대해서 설명한다. 결정부(380)는 도 4에 예시하는 각 스텝의 처리를 행한다.
<전환 가부 판정부(381)>
전환 가부 판정부(381)는 앞 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와, 현 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와의 적어도 어느 하나가 소정의 역치보다 작은 경우에는, 전환 가능 즉 앞 프레임의 주파수 영역의 계수열을 부호화한 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 가능하게 한다고 판정하고, 그렇지 않은 경우에는 전환 불가 즉 앞 프레임의 주파수 영역의 계수열을 부호화한 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용하지 않는다고 판정하고, 판정 결과를 출력한다(스텝 S381).
이하, 전환 가부 판정부(381)의 동작의 예를 설명한다. 우선 입력 음향 신호의 고역 성분의 에너지의 크기로서, MDCT 계수열의 고역의 에너지를 사용하는 예를 설명한다.
전환 가부 판정부(381)는 우선 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)의 고역의 에너지 Ehf - 1를 하기의 식(1)에 의해, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)의 고역의 에너지 Ehf를 하기의 식(2)에 의해 각각 구한다(스텝 S3811). 식(1)과 식(2)에 있어서, M은 N보다 작은 미리 정한 정의 정수이다.
[수 1]
Figure 112017008541921-pct00001
전환 가부 판정부(381)는 이어서 앞 프레임의 고역의 에너지 Ehf - 1와 현 프레임의 고역의 에너지 Ehf의 적어도 어느 하나가 미리 정한 역치 TH1보다 작은 경우, 즉 Ehf -1<TH1 및/또는 Ehf<TH1인 경우에는 전환 가능이라고 판정하고, 그렇지 않은 경우에는 전환 불가라고 판정하고, 전환 가부의 정보를 출력한다(스텝 S3812).
또한 현 프레임의 스텝 S3811에서 구해진 앞 프레임의 고역의 에너지 Ehf-1는 앞 프레임의 스텝 S3811에서 구한 현 프레임의 고역의 에너지 Ehf와 동일하다. 이 때문에 계산한 고역의 에너지 Ehf를 적어도 직후의 프레임까지 전환 가부 판정부(381) 내에 기억해 두면, 앞 프레임의 고역의 에너지 Ehf-1을 계산할 필요는 없다.
이어서 입력 음향 신호의 고역 성분의 에너지의 크기로서, MDCT 계수열의 전체 에너지에 대한 고역의 에너지의 비율을 사용하는 예를 설명한다.
전환 가부 판정부(381)는 우선 앞 프레임의 MDCT 계수열 Xf-1(n)(n=1,...,N)의 전체 에너지에 대한 고역의 에너지의 비율 Ehf-1을 하기의 식(1A)에 의해, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)의 전체 에너지에 대한 고역의 에너지의 비율 Ehf를 하기의 식(2A)에 의해 각각 구한다(스텝 S3811). 식(1A)과 식(2A)에 있어서, M은 미리 정한 정의 정수이다.
[수 2]
Figure 112017008541921-pct00002
전환 가부 판정부(381)는 이어서 앞 프레임의 전체 에너지에 대한 고역의 에너지의 비율 Ehf -1과 현 프레임의 전체 에너지에 대한 고역의 에너지의 비율 Ehf의 적어도 어느 하나가 미리 정한 역치 TH1보다 작은 경우, 즉 Ehf -1<TH1 및/또는 Ehf<TH1인 경우에는 전환 가능이라고 판정하고, 그렇지 않은 경우에는 전환 불가라고 판정하고, 전환 가부의 정보를 출력한다(스텝 S3812).
또한 현 프레임의 스텝 S3811에서 구한 앞 프레임의 전체 에너지에 대한 고역의 에너지의 비율 Ehf -1은 앞 프레임의 스텝 S3811에서 구한 현 프레임의 전체 에너지에 대한 고역의 에너지의 비율 Ehf과 동일하다. 이 때문에 계산한 전체 에너지에 대한 고역의 에너지의 비율 Ehf을 적어도 직후의 프레임까지 전환 가부 판정부(381) 내에 기억해 두면, 앞 프레임의 전체 에너지에 대한 고역의 에너지의 비율 Ehf-1을 계산할 필요는 없다.
또한 상기 서술한 2가지의 예에서는 Ehf -1<TH1 및/또는 Ehf<TH1인 경우에는 전환 가능이라고 판정하고, 그렇지 않은 경우에는 전환 불가라고 판정하고 있지만, Ehf-1<TH1 또한 Ehf<TH1인 경우에는 전환 가능이라고 판정하고, 그렇지 않은 경우에는 전환 불가라고 판정해도 된다. 즉 앞 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와 현 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와의 쌍방이 소정의 역치보다 작은 경우에는, 전환 가능 즉 앞 프레임의 주파수 영역의 계수열을 부호화한 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 가능하게 한다고 판정하고, 그렇지 않은 경우에는 전환 불가 즉 앞 프레임의 주파수 영역의 계수열을 부호화한 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용하지 않는다고 판정해도 된다.
또 상기 서술한 예에서는 MDCT 계수열을 사용하여 고역의 에너지나 전체 에너지에 대한 고역의 에너지의 비율을 구하고 있지만, 파워 스펙트럼 계열이나 주파수 대역마다의 에너지의 계열을 사용하여 고역의 에너지나 전체 에너지에 대한 고역의 에너지의 비율을 구해도 된다.
<적합 부호화 처리 판정부(382)>
적합 부호화 처리 판정부(382)는 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 것에 적합한지를 판정하고, 판정 결과를 출력한다(스텝 S382).
이하, 적합 부호화 처리 판정부(382)의 동작의 일례를 설명한다. 적합 부호화 처리 판정부(382)는 도 5에 예시하는 각 스텝의 처리를 행한다. 이하의 예에서는 제1 부호화부(101)의 부호화 처리가 비특허문헌 1에 예시되는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리이며, 제2 부호화부(201)의 부호화 처리가 비특허문헌 2에 예시되는 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값을 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하는 부호화 처리이다.
이 예에서는 입력 음향 신호의 스펙트럼 포락의 기복이 큰 또는/및 집중도가 높은 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리에 적합하다고 판정하고, 입력 음향 신호의 스펙트럼 포락의 기복이 작은 또는/및 집중도가 낮은 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)의 부호화 처리에 적합하다고 판정하고, 판정 결과를 출력한다.
스펙트럼의 기복이나 집중도를 추정하는 방법으로서는 어느 방법을 채용해도 되지만, 이하의 예에서는 스펙트럼 또는 그 포락의 골짜기의 깊이를 추정하는 구성에 대해서 설명한다. 이 구성에서는 스펙트럼 또는 그 포락의 골짜기가 얕을 때에는 스펙트럼의 기복이 작고 집중도가 낮다고 판정되고, 스펙트럼 또는 그 포락의 골짜기가 깊을 때에는 스펙트럼의 기복이 크고 집중도가 높다고 판정된다. 스펙트럼 또는 그 포락의 골짜기가 얕다는 것은 노이즈 플로어가 높다고도 할 수 있다. 또 스펙트럼 또는 그 포락의 골짜기가 깊다는 것은 노이즈 플로어가 낮다고도 할 수 있다.
적합 부호화 처리 판정부(382)는 우선 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)을 P샘플마다의 Q개의 부분 계수열 XSf(1)(n)(n=1,...,P), XSf(2)(n)(n=1,...,P),...,XSf(Q)(n)(n=1,...,P)로 나눈다(스텝 S3821). P 및 Q는 P×Q=N의 관계를 만족하는 정의 정수이다. P=1이어도 된다. 또 여기서는 제1 부호화부(101) 또는 제2 부호화부(201)에서 부호화 처리의 대상이 되는 주파수 영역의 계수열인 MDCT 계수열 Xf(n)(n=1,...,N)을 적합 부호화 처리 판정부(382)에서도 사용하는 구성으로 하고 있지만, MDCT 계수열 Xf(n)(n=1,...,N)과는 다른 정밀도나 방법으로 주파수 영역으로 변환하여 얻어진 주파수 영역의 계수열, 예를 들면 파워 스펙트럼 계열을 적합 부호화 처리 판정부(382)에 의한 처리의 대상으로 해도 된다.
적합 부호화 처리 판정부(382)는 이어서 부분 계수열 XSf(1)(n)(n=1,...,P), XSf(2)(n)(n=1,...,P),...,XSf(Q)(n)(n=1,...,P)마다의 파워의 평균값 또는 그 대수값에 의한 계열 AVEXS(q)(q=1,…, Q)을 구한다(스텝 S3822). 파워의 평균값은 식(3)에 의해 구한 AVEXS(q)이다. 또 파워의 평균값의 대수값은 식(3A)에 의해 구해진 AVEXS(q)이다.
[수 3]
Figure 112017008541921-pct00003
적합 부호화 처리 판정부(382)는 이어서 파워의 평균값 또는 파워의 평균값의 대수값에 의한 계열 AVEXS(1),AVEXS(2),...,AVEXS(Q)의 각 요소에 대해서, 인접하는 2개의 요소 중 어느 것보다 작은지 여부를 판정하고, 판정된 요소수를 구한다(스텝 S3823). 즉 식(4)을 만족하는 q의 개수 Vally를 구한다.
[수 4]
Figure 112017008541921-pct00004
적합 부호화 처리 판정부(382)는 이어서 식(4)을 만족하는 q에 대응하는 Vally개의 AVEXS(q)의 평균값 EV, 즉 골짜기의 부분 영역의 평균값 EV를 구한다(스텝 S3824). AVEXS(q)가 파워의 평균값인 경우에는, 스텝 S3824에서 구해진 EV는 골짜기의 부분에 있어서의 부분 영역의 파워의 평균값이다. AVEXS(q)가 파워의 평균값의 대수값인 경우에는, 스텝 S3824에서 구해진 EV는 부분 영역의 파워의 평균값의 대수값의 골짜기의 부분에 있어서의 평균값이다. 적합 부호화 처리 판정부(382)는 또 모든 부분 영역의 파워의 평균값 또는 파워의 평균값의 대수값을 구한다(스텝 S3825). 모든 부분 영역의 파워의 평균값은 MDCT 계수열 Xf(n)(n=1,...,N)의 파워의 평균값이며, 식(11)에 의해 구해진 E이다. 모든 부분 영역의 파워의 평균값의 대수값은 MDCT 계수열 Xf(n)(n=1,...,N)의 파워의 평균값의 대수값이며, 식(11A)에 의해 구해진 E이다.
[수 5]
Figure 112017008541921-pct00005
적합 부호화 처리 판정부(382)는 이어서 모든 부분 영역의 AVEXS(q)의 평균값 E와 골짜기의 부분 영역의 AVEXS(q)의 평균값 EV의 차가 소정의 역치 TH2 이하인 경우에는, 스펙트럼의 골짜기가 얕고, 스펙트럼 포락의 기복이 적거나 집중도가 낮은 스펙트럼이라고 추정되는 점에서, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)의 부호화 처리에 적합하다고 판정한다. 반대로 모든 부분 영역의 AVEXS(q)의 평균값 E와 골짜기의 부분 영역의 AVEXS(q)의 평균값 EV의 차가 역치 TH2보다 큰 경우에는, 스펙트럼의 골짜기가 깊고, 스펙트럼 포락의 기복이 크거나 집중도가 높은 스펙트럼이라고 추정되는 점에서, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리가 적합하다고 판정한다. 적합 부호화 처리 판정부(382)는 어느 부호화 처리가 적합한지의 정보를 출력한다(스텝 S3826). 적합한 부호화 처리의 정보는 적합 정보라고도 부른다.
또 스텝 S3821에서는 부분 계수열마다 상이한 샘플수로 해도 된다. 예를 들면 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)을 Q개의 부분 계수열 XSf(1)(n)(n=1,...,P1), XSf(2)(n)(n=1,...,P2),..., XSf(Q)(n)(n=1,...,PQ)로 나누어도 된다. P1,P2,...,PQ는 P1+P2+...+PQ=N을 만족하는 정의 정수이다. 또 P1,P2,...,PQ는 P1≤P2≤...≤PQ를 만족시키는 것이 바람직하다. 또 Q는 정의 정수이다.
<전환 결정부(383)>
전환 결정부(383)는 전환 가부 판정부(381)가 얻은 전환 가부의 정보와, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보로부터, 현 프레임의 주파수 영역의 계수열을 제1 부호화부(101)로 부호화할지 제2 부호화부(201)로 부호화할지를 결정하고, 결정한 부호화 처리를 특정 가능한 부호인 전환 부호를 출력한다(스텝 S383). 출력한 전환 부호는 복호 장치(400)에 입력된다. 여기서 전환 결정부(383)는 전환 불가인 경우에는, 현 프레임이 적합한 부호화 처리가 어느 부호화 처리였다고 해도, 앞 프레임과 동일한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 결정한다. 또 전환 가능한 경우에는, 앞 프레임의 부호화 처리가 어느 부호화 처리였다고 해도, 현 프레임이 적합한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 결정한다. 단, 전환 가능한 경우여도 현 프레임이 적합한 부호화 처리가 아니라 앞 프레임과 동일한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화한다고 결정하는 경우가 포함되어 있어도 된다.
이하, 전환 결정부(383)의 동작의 일례를 설명한다. 이하의 예에서는 제1 부호화부(101)의 부호화 처리가 비특허문헌 1에 예시되는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리이며, 제2 부호화부(201)의 부호화 처리가 비특허문헌 2에 예시되는 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값의 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하는 부호화 처리이다.
전환 결정부(383)는 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 불가를 나타내는 경우, 및/또는 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보가 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)의 부호화 처리와 동일한 부호화 처리를 나타내는 경우에는, 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)의 부호화 처리와 동일한 부호화 처리를 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)의 부호화 처리로서 결정한다.
즉 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제1 부호화부(101)로 부호화된 경우로서, 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 불가를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)도 제1 부호화부(101)로 부호화한다고 결정한다. 또 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제1 부호화부(101)로 부호화된 경우로서, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보가 제1 부호화부(101)의 부호화 처리를 나타내는 경우에도, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)도 제1 부호화부(101)로 부호화한다고 결정한다.
또 앞 프레임의 MDCT 계수열 Xf-1(n)(n=1,...,N)이 제2 부호화부(201)로 부호화된 경우로서, 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 불가를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)도 제2 부호화부(201)로 부호화한다고 결정한다. 또 앞 프레임의 MDCT 계수열 Xf-1(n)(n=1,...,N)이 제2 부호화부(201)로 부호화된 경우로서, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보가 제2 부호화부(201)의 부호화 처리를 나타내는 경우에도, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)도 제2 부호화부(201)로 부호화한다고 결정한다.
전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 가능을 나타내는 경우, 또한 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보가 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)의 부호화 처리와 상이한 부호화 처리를 나타내는 경우에는, 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)의 부호화 처리와 상이한 부호화 처리를 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)의 부호화 처리로서 결정한다. 즉 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제1 부호화부(101)로 부호화된 경우로서, 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 가능을 나타내고, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보가 제2 부호화부(201)의 부호화 처리를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)은 제2 부호화부(201)로 부호화한다고 결정한다. 또 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제2 부호화부(201)로 부호화된 경우로서, 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 가능을 나타내고, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보가 제1 부호화부(101)의 부호화 처리를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)은 제1 부호화부(101)로 부호화한다고 결정한다.
<전환부(384)>
전환부(384)는 전환 결정부(383)로 결정한 부호화 처리로 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)이 부호화되도록, 주파수 영역 변환부(110)가 출력한 MDCT 계수열 Xf(n)(n=1,...,N)을 제1 부호화부(101) 또는 제2 부호화부(201)에 입력하도록 제어를 행한다(스텝 S384). 또 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)의 부호화를 위해, 현 프레임의 입력 음향 신호 xf(n)(n=1,...,Nt)도 필요한 경우에는, 현 프레임의 입력 음향 신호 xf(n)(n=1,...,Nt)도 제1 부호화부(101) 또는/및 제2 부호화부(201)에 입력한다.
예를 들면 제1 부호화부(101)의 부호화 처리가 비특허문헌 1에 예시되는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리이며, 제2 부호화부(201)의 부호화 처리가 비특허문헌 2에 예시되는 구분한 주파수 영역마다의 계수의 평균 에너지를 인접하는 주파수 영역의 평균 에너지와의 차분의 가변 길이 부호화를 수반하는 부호화 처리인 경우에는, 제1 부호화부(101)만에서 현 프레임의 입력 음향 신호 xf(n)(n=1,...,Nt)가 필요하게 되기 때문에, MDCT 계수열 Xf(n)(n=1,...,N)을 제1 부호화부(101)에 입력하는 경우에는 현 프레임의 입력 음향 신호 xf(n)(n=1,...,Nt)도 제1 부호화부(101)에 입력한다.
<제1 부호화부(101), 제2 부호화부(201)>
제1 부호화부(101)와 제2 부호화부(201)는 모두 주파수 영역의 계수열을 부호화하는 부호화 처리를 행하는 것이지만, 행하는 부호화 처리는 서로 상이하다. 즉 제1 부호화부(101)는 제2 부호화부(201)와는 상이한 부호화 처리에 의해 현 프레임의 주파수 영역의 계수열을 부호화하고, 얻어진 부호인 제1 부호를 출력한다(스텝 S101). 또 제2 부호화부(201)는 제1 부호화부(101)와는 상이한 부호화 처리에 의해 현 프레임의 주파수 영역의 계수열을 부호화하고, 얻어진 부호인 제2 부호를 출력한다(스텝 S201). 예를 들면 제1 부호화부(101)는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리를 행하고, 제2 부호화부(201)는 구분한 주파수 영역마다의 계수의 평균 에너지를 사용한 부호화 처리를 행한다.
이하, 제1 부호화부(101)와 제2 부호화부(201)의 동작의 일례를 설명한다. 이하의 예에서는 제1 부호화부(101)의 부호화 처리가 비특허문헌 1에 예시되는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리이며, 제2 부호화부(201)의 부호화 처리가 비특허문헌 2에 예시되는 구분한 주파수 영역마다의 계수의 평균 에너지를 인접하는 주파수 영역의 평균 에너지와의 차분의 가변 길이 부호화를 수반하는 부호화 처리이다.
이 예에서는 제1 부호화부(101)에 의한 제1 부호화 처리는 도 8의 좌측에 예시하는 바와 같이 선형 예측 계수로 변환 가능한 계수로 주파수 영역의 스펙트럼 포락 형상을 표현하는 것이다. 한편, 제2 부호화부(201)에 의한 제2 부호화 처리는 도 8의 우측에 예시하는 바와 같이 스케일·팩터·밴드(주파수 영역 계수열의 복수의 영역으로의 구분)로 포락 형상을 표현하는 것이다. 제2 부호화 처리에 의하면, 각 영역의 평균의 높이의 차분값의 가변 길이 부호화를 사용하기 때문에, 평균값이 매끄럽게 변화하는 경우에 매우 효율이 좋다고 할 수 있다.
결정부(380)의 결정 또는 선택의 결과에 기초하여, 주파수 영역에서의 복수의 부호화 처리인 제1 부호화부(101)의 처리 및 제2 부호화부(201)의 처리 중 일방이 행해진다.
<제1 부호화부(101)>
제1 부호화부(101)는 선형 예측 분석 부호화부(120), 스펙트럼 포락 계수열 생성부(130), 포락 정규화부(140), 정규화 계수 부호화부(150)를 구비하고 있다. 제1 부호화부(101)에는 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)과 입력 음향 신호 xf(n)(n=1,...,Nt)가 입력되고, 선형 예측 계수 부호 CLf와 정규화 계수 부호 CNf를 포함하는 제1 부호가 출력된다. 출력된 제1 부호는 복호 장치(400)에 입력된다. 또한 제1 부호화부(101)는 비특허문헌 1에 기재된 부호화 처리로부터 입력 음향 신호를 주파수 영역의 계수열로 변환하는 부분을 제외한 것이다. 즉 주파수 영역 변환부(110)와 제1 부호화부(101)에서 행해지는 부호화 처리는 비특허문헌 1에 기재된 부호화 처리와 마찬가지이다.
<선형 예측 분석 부호화부(120)>
선형 예측 분석 부호화부(120)는 입력 음향 신호 xf(n)(n=1,...,Nt)를 선형 예측 분석하여 선형 예측 계수로 변환 가능한 계수를 구하고, 선형 예측 계수로 변환 가능한 계수를 부호화하여, 선형 예측 계수 부호 CLf와, 선형 예측 계수 부호 CLf에 대응하는 양자화된 선형 예측 계수로 변환 가능한 계수를 얻어 출력한다(스텝 S120). 선형 예측 계수로 변환 가능한 계수는 선형 예측 계수 그 자체, PARCOR 계수(편자기 상관 계수) 또는 LSP 파라미터 등이다.
<스펙트럼 포락 계수열 생성부(130)>
스펙트럼 포락 계수열 생성부(130)는 선형 예측 분석 부호화부(120)가 얻은 양자화된 선형 예측 계수로 변환 가능한 계수에 대응하는 파워 스펙트럼 포락 계수열 Wf(n)(n=1,...,N)을 얻어 출력한다(스텝 S130).
<포락 정규화부(140)>
포락 정규화부(140)는 스펙트럼 포락 계수열 생성부(130)가 얻은 파워 스펙트럼 포락 계수열 Wf(n)(n=1,...,N)을 사용하여, 주파수 영역 변환부(110)가 얻은 MDCT 계수열의 각 계수 Xf(n)(n=1,...,N)를 정규화하고, 정규화 MDCT 계수열 XNf(n)(n=1,...,N)을 출력한다(스텝 S140). 즉 MDCT 계수열 Xf(n)(n=1,...,N)의 각 계수를 파워 스펙트럼 포락 계수열 Wf(n)(n=1,...,N)에 포함되는 대응하는 계수로 나눈 값에 의한 계열을 정규화 MDCT 계수열 XNf(n)(n=1,...,N)로서 구한다.
<정규화 계수 부호화부(150)>
정규화 계수 부호화부(150)는 포락 정규화부(140)가 얻은 정규화 MDCT 계수열 XNf(n)(n=1,...,N)을 부호화하여 정규화 계수 부호 CNf를 얻는다(스텝 S150).
<제2 부호화부(201)>
또 제2 부호화부(201)는 영역 분할부(220), 평균 대수 에너지 차분 가변 길이 부호화부(240), 계수 부호화부(250)를 구비하고 있다. 제2 부호화부(201)에는 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)이 입력되고, 평균 에너지 부호 CAf와 계수 부호 CDf를 포함하는 제2 부호가 출력된다. 출력된 제2 부호는 복호 장치(400)에 입력된다. 또한 제2 부호화부(201)는 비특허문헌 2에 기재된 부호화 처리로부터 입력 음향 신호를 주파수 영역의 계수열로 변환하는 부분을 제외한 것이다. 즉 주파수 영역 변환부(110)와 제2 부호화부(201)에서 행해지는 부호화 처리는 비특허문헌 2에 기재된 부호화 처리와 마찬가지이다.
<영역 분할부(220)>
영역 분할부(220)는 주파수 영역 변환부(110)가 얻은 MDCT 계수열 Xf(n)(n=1,...,N)을 저역의 부분 영역일수록 샘플수가 적고 고역의 부분 영역일수록 샘플수가 많은 복수의 부분 영역으로 나눈다(스텝 S220). 부분 영역의 개수를 R이라고 하고, 각 부분 영역에 포함되는 샘플수를 S1,...,SR로 하면, MDCT 계수열의 각 계수 Xf(n)(n=1,...,N)는 최저역의 샘플로부터 순서대로 각 부분 영역에 XBf(1)(n)(n=1,...,S1), XBf(2)(n)(n=1,...,S2),...,XBf(R)(n)(n=1,...,SR)로 나뉘게 된다. R 및 S1,...,SR은 정의 정수이다. S1,...,SR은 S1≤S2≤...≤SR의 관계를 만족하는 것으로 한다. XBf(1)(n)(n=1,...,S1), XBf(2)(n)(n=1,...,S2),..., XBf(R)(n)(n=1,...,SR)을 부분 영역 계수열이라고 부른다.
<평균 대수 에너지 차분 가변 길이 부호화부(240)>
평균 대수 에너지 차분 가변 길이 부호화부(240)는 영역 분할부(220)가 얻은 각 부분 영역에 대해서, 부분 영역에 포함되는 계수의 평균 에너지를 구하고, 부분 영역의 평균 에너지 각각에 대해서 대수축에서 양자화하고, 인접하는 부분 영역의 평균 에너지의 대수축에서의 양자화값과의 차를 가변 길이 부호화하고, 평균 에너지 부호 CAf를 얻는다(스텝 S240).
평균 대수 에너지 차분 가변 길이 부호화부(240)는 우선 각 부분 영역 r(r=1,...,R)의 평균 에너지 EXB(r)(r=1,...,R)를 식(5)에 의해 구한다(스텝 S2401).
[수 6]
Figure 112017008541921-pct00006
평균 대수 에너지 차분 가변 길이 부호화부(240)는 이어서 각 부분 영역에 대해서, 평균 에너지 EXB(r)(r=1,...,R)의 대수 영역에서의 스칼라 양자화를 행하여 평균 에너지의 대수 영역에서의 양자화값 Q(log(EXB(r)))(r=1,...,R)을 얻는다(스텝 S2402). 평균 대수 에너지 차분 가변 길이 부호화부(240)는 이어서 각 부분 영역에 대해서, 평균 에너지의 대수 영역에서의 양자화값 Q(log(EXB(r)))과 인접하는 부분 영역에 포함되는 계수의 평균 에너지의 대수 영역에서의 양자화값 Q(log(EXB(r-1)))과의 차 DiffEXB(r)를 구한다(스텝 S2403). 단 r=1인 경우는, 평균 에너지 EXB( 1)의 대수값의 스칼라 양자화값 Q(log(EXB(r))) 그 자체를 DiffEXB(1)로 한다. DiffEXB(r)(r=1,...,R)을 평균 대수 에너지 차분이라고 부른다. 즉 DiffEXB(r)(r=1,...,R)은 식(6)에 의해 구해진다. 단, Q()를 스칼라 양자화 함수로 하고, 입력을 미리 정한 값으로 정규화(제산)하여 얻어진 값의 소수 부분을 사사 오입하여 얻어지는 정수값을 출력하는 함수로 한다.
[수 7]
Figure 112017008541921-pct00007
평균 대수 에너지 차분 가변 길이 부호화부(240)는 이어서 평균 대수 에너지 차분 DiffEXB(r)(r=1,...,R)을 가변 길이 부호화하여 평균 에너지 부호 CAf를 얻는다(스텝 S2404). 또한 평균 대수 에너지 차분 DiffEXB(r)의 절대값이 작은 경우 쪽이 통계적인 출현 빈도가 높으므로, 가변 길이 부호는 절대값이 큰 경우보다 부호량이 적어지도록 미리 결정되어 있다. 즉 평균 대수 에너지의 영역마다의 변동이 작은 경우, 즉 스펙트럼 포락의 기복이 작은 경우, 스펙트럼 포락의 집중도가 낮은 경우에는, 평균 에너지 부호 CAf의 부호의 길이를 짧게 할 수 있는 경향이 있다.
<계수 부호화부(250)>
계수 부호화부(250)는 영역 분할부(220)가 얻은 부분 영역 계수열 XBf(1)(n)(n=1,...,S1), XBf(2)(n)(n=1,...,S2),..., XBf(R)(n)(n=1,...,SR)의 각 계수를 평균 대수 에너지 차분 가변 길이 부호화부(240)가 얻은 평균 에너지의 대수 영역에서의 양자화값 Q(log(EXB(r))(r=1,...,R)을 사용하여, 예를 들면 스칼라 양자화하여, 계수 부호 CDf를 얻는다(스텝 S250). 이 스칼라 양자화에 사용하는 양자화 스텝 폭이나 양자화 비트수는 영역 분할부(220)가 얻은 부분 영역 계수열 XBf(1)(n)(n=1,...,S1), XBf(2)(n)(n=1,...,S2),..., XBf(R)(n)(n=1,...,SR)마다 평균 에너지의 양자화값 Q(EXB(r))(r=1,...,R)로부터 결정한다. 또한 평균 에너지의 양자화값 Q(EXB(r))(r=1,...,R)은 평균 에너지의 대수 영역에서의 양자화값 Q(log(EXB(r))(r=1,...,R)을 식(7)에 의해 선형 영역의 값으로 함으로써 구해진다.
[수 8]
Figure 112017008541921-pct00008
계수 부호화부(250)는 우선 각 영역에 대응하는 평균 에너지의 대수 영역에서의 양자화값 Q(log(EXB(r))(r=1,...,R)과 그 값과 주파수로 추정되는 청각상 식별할 수 없는 스펙트럼 레벨의 에너지의 대수값의 차의 값을 고려하여, 계수 부호 CDf의 부호량으로서 주어진 비트수를 각 부분 영역 계수열의 각 계수에 배분한다(스텝 S2501).
계수 부호화부(250)는 이어서 각 부분 영역의 평균 에너지의 양자화값 Q(EXB(r))(r=1,...,R)과 배분된 비트수로부터, 각 부분 영역 계수열의 각 계수의 스칼라 양자화의 스텝 폭을 구한다(스텝 S2502).
계수 부호화부(250)는 이어서 각 부분 영역 계수열의 각 계수를 결정된 스텝 폭과 비트수로 양자화하고, 또한 양자화된 각 계수의 정수값을 가변 길이 부호화하여, 계수 부호 CDf를 얻는다(스텝 S2503).
<복호 장치(400)>
복호 장치(400)의 구성을 도 2에 나타낸다. 복호 장치(400)는 전환부(480), 제1 복호부(401) 및 제2 복호부(501)를 구비하고 있다. 제1 복호부(401)는 예를 들면 선형 예측 복호부(420), 스펙트럼 포락 계수열 생성부(430), 정규화 계수 복호부(450) 및 포락 역정규화부(440)를 구비하고 있다. 제2 복호부(501)는 예를 들면 평균 대수 에너지 차분 가변 길이 복호부(540) 및 계수 복호부(550)를 구비하고 있다. 복호 장치(400)에는 소정의 시간 구간인 프레임 단위로, 전환 부호와 입력 부호를 포함하는 부호가 입력된다. 제1 부호화부(101)로 부호화된 프레임의 경우에는 입력 부호는 선형 예측 계수 부호 CLf와 정규화 계수 부호 CNf를 포함하고, 제2 부호화부(201)로 부호화된 프레임의 경우에는 입력 부호는 평균 에너지 부호 CAf와 계수 부호 CDf를 포함한다. 이하에서는 현재 처리의 대상으로 되어 있는 프레임이 f번째의 프레임인 것으로 하여, 각 부의 구체 처리를 설명한다.
이하, 복호 장치(400)의 동작에 대해서 설명한다.
<전환부(480)>
전환부(480)는 입력된 전환 부호로부터, 현 프레임의 입력 부호를 제1 복호부(401)로 복호할지 제2 복호부(501)로 복호할지를 결정하고, 결정한 복호 처리를 행할 수 있도록, 입력 부호를 제1 복호부(401) 또는 제2 복호부(501)에 입력하도록 제어를 행한다(스텝 S480).
구체적으로는 전환부(480)는 입력된 전환 부호가 제1 부호화부(101)의 부호화 처리를 특정하는 부호, 즉 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리를 특정하는 부호인 경우에는, 제1 부호화부(101)의 부호화 처리에 대응하는 복호 처리를 행하는 제1 복호부(401)에 입력 부호를 입력하도록 제어한다. 또 입력된 전환 부호가 제2 부호화부(201)의 부호화 처리를 특정하는 부호, 즉 구분한 주파수 영역마다의 계수의 평균 에너지를 인접하는 주파수 영역의 평균 에너지와의 차분의 가변 길이 부호화를 수반하는 부호화 처리를 특정하는 부호인 경우에는, 제2 부호화부(201)의 부호화 처리에 대응하는 복호 처리를 행하는 제2 복호부(501)에 입력 부호를 입력하도록 제어한다.
<제1 복호부(401)>
제1 복호부(401)는 선형 예측 복호부(420), 스펙트럼 포락 계수열 생성부(430), 정규화 계수 복호부(450), 포락 역정규화부(440)를 구비하고 있다. 제1 복호부(401)에는 현 프레임의 선형 예측 계수 부호 CLf와 정규화 계수 부호 CNf가 입력되고, 주파수 영역의 계수열 Xf(n)(n=1,...,N)이 출력된다.
<선형 예측 복호부(420)>
선형 예측 복호부(420)는 입력 부호에 포함되는 선형 예측 계수 부호 CLf를 복호하여 복호된 선형 예측 계수로 변환 가능한 계수를 얻는다. 복호된 선형 예측 계수로 변환 가능한 계수는 부호화 장치(300)의 선형 예측 분석 부호화부(120)가 얻은 양자화된 선형 예측 계수로 변환 가능한 계수와 동일한 것이다. 또 선형 예측 복호부(420)가 행하는 복호 처리는 부호화 장치(300)의 선형 예측 분석 부호화부(120)는 행하는 부호화 처리와 대응하는 것이다. 또한 선형 예측 계수로 변환 가능한 계수는 선형 예측 계수 그 자체, PARCOR 계수(편자기 상관 계수) 또는 LSP 파라미터 등이다.
<스펙트럼 포락 계수열 생성부(430)>
스펙트럼 포락 계수열 생성부(430)는 선형 예측 복호부(420)가 얻은 복호된 선형 예측 계수로 변환 가능한 계수에 대응하는 파워 스펙트럼 포락 계수열 Wf(n)(n=1,...,N)을 얻어 출력한다. 단 N은 주파수 영역에서의 샘플수이며, 정의 정수이다.
<정규화 계수 복호부(450)>
정규화 계수 복호부(450)는 입력된 정규화 계수 부호 CNf를 복호하여 복호 정규화 MDCT 계수열 ^XNf(n)(n=1,...,N)을 얻는다(스텝 S450). 여기서 정규화 계수 복호부(450)가 행하는 복호 처리는 부호화 장치(300)의 정규화 계수 부호화부(150)가 행하는 부호화 처리와 대응하는 것이다. 즉 부호화 장치(300)로 MDCT가 아닌 주파수 영역으로의 변환 처리가 행해진 경우에는, ^XNf(n)(n=1,...,N)은 부호화 장치(300)의 주파수 영역으로의 변환 처리에 대응하는 MDCT가 아닌 영역의 주파수 영역의 계수열이다. 또한 복호 정규화 MDCT 계수열 ^XNf(n)(n=1,...,N)은 부호화 장치(300)의 정규화 계수 부호화부(150)에 입력된 정규화 MDCT 계수열 XNf(n)(n=1,...,N)에 대응하는 것이지만, 각각의 계수에는 양자화 오차가 포함되기 때문에, XNf(n)에 "^"을 붙인 ^XNf(n)로 되어 있다.
<포락 역정규화부(440)>
포락 역정규화부(440)는 스펙트럼 포락 계수열 생성부(430)가 얻은 파워 스펙트럼 포락 계수열 Wf(n)(n=1,...,N)을 사용하여, 정규화 계수 복호부(450)가 얻은 복호 정규화 MDCT 계수열의 각 계수 ^XNf(n)(n=1,...,N)를 역정규화하고, 복호 MDCT 계수열 ^XNf(n)(n=1,...,N)을 출력한다(스텝 S440). 즉 복호 정규화 MDCT 계수열 XNf(n)(n=1,...,N)의 각 계수와 파워 스펙트럼 포락 계수열 Wf(n)(n=1,...,N)의 각 계수를 대응하는 계수끼리를 승산하여 얻어지는 값에 의한 계열을 복호 MDCT 계수열 ^Xf(n)(n=1,...,N)로서 구한다.
<제2 복호부(501)>
제2 복호부(501)는 평균 대수 에너지 차분 가변 길이 복호부(540), 계수 복호부(550)를 구비하고 있다. 제2 복호부(501)에는 현 프레임의 평균 에너지 부호 CAf와 계수 부호 CDf가 입력되고, 주파수 영역의 계수열 Xf(n)(n=1,...,N)이 출력된다.
<평균 대수 에너지 차분 가변 길이 복호부(540)>
평균 대수 에너지 차분 가변 길이 복호부(540)는 입력된 평균 에너지 부호 CAf를 복호하여 부분 영역의 복호 평균 에너지 Q(EXB(r))(r=1,...,R)를 얻는다(스텝 S540). 또한 복호 평균 에너지는 부호화 장치(300)의 계수 부호화부(250)로 얻어지는 평균 에너지의 양자화값과 동일한 것이므로, 동일한 기호 Q(EXB(r))를 사용하고 있다.
평균 대수 에너지 차분 가변 길이 복호부(540)는 우선 평균 에너지 부호 CAf를 복호하여 각 부분 영역의 대수 영역에서의 에너지의 차 DiffEXB(r)(r=1,...,R)를 얻는다(스텝 S5401). 여기서 평균 대수 에너지 차분 가변 길이 복호부(540)가 행하는 복호 처리는 부호화 장치(300)의 평균 대수 에너지 차분 가변 길이 부호화부(240)는 행하는 부호화 처리와 대응하는 것이다. 또한 각 부분 영역의 대수 영역에서의 에너지의 차는 부호화 장치(300)의 평균 대수 에너지 차분 가변 길이 부호화부(240)로 얻어지는 각 부분 영역의 대수 영역에서의 에너지의 차와 동일한 것이므로, 동일한 기호 DiffEXB(r)를 사용하고 있다.
평균 대수 에너지 차분 가변 길이 복호부(540)는 이어서 부분 영역마다 대수 영역에서의 에너지의 차 DiffEXB(r)(r=1,...,R)를 인접하는 부분 영역의 평균 에너지의 대수 영역에서의 복호값 Q(log(EXB(r-1)))에 가산하여 평균 에너지의 대수 영역에서의 복호값 Q(log(EXB(r))을 얻는다(스텝 S5402). 또한 평균 에너지의 대수 영역에서의 복호값은 부호화 장치(300)의 평균 대수 에너지 차분 가변 길이 부호화부(240)로 얻어지는 평균 에너지의 대수 영역에서의 양자화값과 동일한 것이므로, 동일한 기호 Q(log(EXB(r))를 사용하고 있다.
[수 9]
Figure 112017008541921-pct00009
평균 대수 에너지 차분 가변 길이 복호부(540)는 이어서 평균 에너지의 대수 영역에서의 복호값 Q(log(EXB(r-1)))(r=1,...,R)을 선형 영역의 값으로 한 것을 복호 평균 에너지 Q(EXB(r))(r=1,...,R)로서 얻는다(스텝 S5403).
<계수 복호부(550)>
계수 복호부(550)는 평균 대수 에너지 차분 가변 길이 복호부(540)로 얻어진 복호 평균 에너지 Q(EXB(r))(r=1,...,R)를 사용하고, 계수 부호 CDf를 복호하여 복호 계수열 ^Xf(n)(n=1,...,N)을 얻는다(스텝 S550). 여기서 계수 복호부(550)가 행하는 복호 처리는 부호화 장치(300)의 계수 부호화부(250)가 행하는 부호화 처리와 대응하는 것이다. 입력된 계수 부호 CDf는 부호화 장치(300)의 계수 부호화부(250)로 각 부분 영역 계수열의 각 계수를 가변 길이 부호화하여 얻어진 것이므로, 계수 부호 CDf 중 각 계수에 대응하는 부호 부분의 부호 길이는 자동적으로 복원할 수 있다. 또 평균 대수 에너지 차분 가변 길이 복호부(540)로 얻어진 복호 평균 에너지 Q(EXB(r))로부터 각 영역의 양자화 스텝 폭이 구해진다. 이들에 의해 계수 부호 CDf로부터 주파수 영역의 복호 MDCT 계수열 ^Xf(n)(n=1,...,N)을 얻을 수 있다.
<시간 영역 변환부(410)>
시간 영역 변환부(410)는 N점의 복호 MDCT 계수열 ^Xf(n)(n=1,...,N)을 시간 영역으로 변환하여 복호 음향 신호 ^xf(n)(n=1,...,Nt)를 얻어 출력한다(스텝 S410). 단 Nt는 시간 영역에서의 샘플수이며, 정의 정수이다. 부호화 장치(300)의 주파수 영역 변환부(110)로 MDCT가 아닌 주파수 영역으로의 변환이 행해진 경우에는 그 변환 처리에 대응하는 시간 영역으로의 변환 처리를 행하면 된다.
제1 실시형태에 의하면, 입력 음향 신호의 고역의 에너지가 작은 경우에만 부호화 처리 및 복호 처리의 전환을 행할 수 있기 때문에, 고역 성분의 양자화 특성이 상이한 복수의 부호화 처리 및 복호 처리가 실장되어 있는 경우여도, 수청자가 부자연스럽게 느끼는 일이 적은 복호 음향 신호를 얻는 것이 가능해진다.
제1 실시형태에 의하면, 또 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리와 구분한 주파수 영역마다의 계수의 평균 에너지를 사용한 부호화 처리 중 입력 음향 신호에 적합한 부호화 처리를 실제로 부호화해보지 않고 선택할 수 있기 때문에, 적은 연산 처리량으로 입력 음향 신호에 적합한 부호화 처리를 행하는 것이 가능해진다.
제1 실시형태에 의하면, 또한 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리와 구분한 주파수 영역마다의 계수의 평균 에너지를 사용한 부호화 처리 중에서 부호화 처리를 선택하여 부호화할 수 있기 때문에, 입력 음향 신호의 스펙트럼의 기복이 큰 경우나 집중도가 높은 경우에도 그렇지 않은 경우에도, 입력 음향 신호의 특성에 따르지 않고 효율이 좋은 부호화 처리를 행하는 것이 가능해진다.
[제2 실시형태]
제1 실시형태에서는 입력 음향 신호의 고역 성분의 에너지의 크기가 큰 경우에는 반드시 앞 프레임의 부호화 처리와 동일한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하고 있었지만, 제2 실시형태는 입력 음향 신호의 고역 성분의 에너지의 크기가 큰 경우에도, 입력 음향 신호의 고역 성분이 희소한 상태에 따라서는 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용하는 것이다.
제2 실시형태의 부호화 장치는 입력 음향 신호의 고역 성분의 에너지가 작은 경우에는, 앞 프레임과 상이한 부호화 처리를 현 프레임의 부호화 처리로서 결정하는 것을 가능하게 하고, 그렇지 않은 경우에는, 입력 음향 신호의 고역 성분이 희소한 상태에 따라, 앞 프레임과 상이한 부호화 처리를 현 프레임의 부호화 처리로서 결정하는 것을 가능하게 할지, 앞 프레임과 동일한 부호화 처리를 현 프레임의 부호화 처리로서 결정할지를 결정하는 것이다.
제2 실시형태의 부호화 장치의 구성은 제1 실시형태와 동일한 도 1이다. 제2 실시형태의 부호화 장치(300)는 결정부(380) 내의 전환 가부 판정부(381)와 전환 결정부(383)의 처리가 상이한 부분 이외는 제1 실시형태의 부호화 장치(300)와 동일하다. 제2 실시형태의 복호 장치의 구성은 제1 실시형태와 동일한 도 2이며, 각 부의 처리도 제1 실시형태의 복호 장치와 동일하다. 이하에서는 제1 실시형태의 부호화 장치(300)와 상이한 처리를 행하는 결정부(380) 내의 전환 가부 판정부(381)와 전환 결정부(383)에 대해서 설명한다.
<전환 가부 판정부(381)>
전환 가부 판정부(381)는 앞 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와, 현 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와의 적어도 어느 하나가 소정의 역치보다 작은 경우에는, 전환 가능 즉 앞 프레임의 주파수 영역의 계수열을 부호화한 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 가능하게 한다고 판정하고, 판정 결과를 출력한다(스텝 S381). 상기 이외의 경우에는, 전환 가능이라고도 전환 불가라고도 판정하지 않고, 어느 것이라고도 판정하지 않은 것을 나타내는 정보를 판정 결과로서 출력하거나, 판정 결과를 출력하지 않는다. 입력 음향 신호의 고역 성분의 에너지의 크기로서는 고역의 에너지를 사용해도 되고, 전체 에너지에 대한 고역의 에너지의 비율을 사용해도 되는 것은 제1 실시형태와 마찬가지이다.
<전환 결정부(383)>
전환 결정부(383)는 전환 가부 판정부(381)가 얻은 전환 가부의 정보와, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보와, 입력 음향 신호로부터 구해지는 입력 음향 신호의 고역 성분이 희소한지 여부의 상태로부터, 현 프레임의 주파수 영역의 계수열을 제1 부호화부(101)로 부호화할지 제2 부호화부(201)로 부호화할지를 결정하고, 결정한 부호화 처리를 특정 가능한 부호인 전환 부호를 출력한다(스텝 S383B). 출력한 전환 부호는 복호 장치(400)에 입력된다.
전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 가능인 경우에는, 즉 입력 음향 신호의 고역 성분의 에너지가 작은 경우에는, 전환 결정부(383)는 제1 실시형태의 전환 결정부(383)와 동일한 처리를 행한다. 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 어느 것이라고도 판정하지 않은 것을 나타내는 경우, 또는 전환 가부 판정부(381)에 판정 결과가 입력되지 않은 경우, 즉 입력 음향 신호의 고역 성분의 에너지가 큰 경우에는, 입력 음향 신호로부터 구해지는 입력 음향 신호의 고역 성분이 희소한지 여부의 상태에 기초하여, 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용할지 여부를 결정한다.
이하, 전환 결정부(383)의 동작 중 제1 실시형태의 전환 결정부(383)와 상이한 부분, 즉 입력 음향 신호의 고역 성분의 에너지가 큰 경우의 전환 결정부(383)의 동작의 일례를 설명한다. 이하의 예에서는 제1 실시형태와 마찬가지로 제1 부호화부(101)의 부호화 처리가 비특허문헌 1에 예시되는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리이며, 제2 부호화부(201)의 부호화 처리가 비특허문헌 2에 예시되는 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값의 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하는 부호화 처리이다. 전환 결정부(383)는 예를 들면 도 6의 스텝 S3831B 내지 S3836B의 처리를 행한다.
전환 결정부(383)는 우선 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)을 P샘플마다의 Q개의 부분 계수열 XSf(1)(n)(n=1,...,P), XSf(2)(n)(n=1,...,P),..., XSf(Q)(n)(n=1,...,P)로 나눈다(스텝 S3831B). P 및 Q는 P×Q=N의 관계를 만족하는 정의 정수이다. P=1이어도 된다. 또 여기서는 제1 부호화부(101) 또는 제2 부호화부(201)로 부호화 처리의 대상이 되는 주파수 영역의 계수열인 MDCT 계수열 Xf(n)(n=1,...,N)을 전환 결정부(383)에서도 사용하는 구성으로 하고 있지만, MDCT 계수열 Xf(n)(n=1,...,N)과는 다른 정밀도나 방법으로 주파수 영역으로 변환하여 얻어진 주파수 영역의 계수열, 예를 들면 파워 스펙트럼 계열을 전환 결정부(383)에 의한 처리의 대상으로 해도 된다.
전환 결정부(383)는 이어서 부분 계수열 XSf(1)(n)(n=1,...,P), XSf(2)(n)(n=1,...,P),..., XSf(Q)(n)(n=1,...,P)마다의 파워의 평균값의 대수값에 의한 계열 AVEXS(q)(q=1,…,Q)을 구한다(스텝 S3832B). 부분 계수열마다의 파워의 평균값의 대수값은 식(3A)에 의해 구해지는 AVEXS(q)이다.
전환 결정부(383)는 또 MDCT 계수열 Xf(n)(n=1,...,N)의 파워의 평균값의 대수값을 구한다(스텝 S3833B). MDCT 계수열의 파워의 평균값의 대수값은 식(9)에 의해 구해지는 AVETotal이다.
[수 10]
Figure 112017008541921-pct00010
전환 결정부(383)는 이어서 q가 미리 설정한 QLow(단 1<QLow)로부터 QHigh(단 QLow≤QHigh≤Q)의 범위 내, 즉 미리 정한 고역측에 있는 1개 또는 복수의 부분 영역의 범위 내에서 식(10)을 만족하는 AVEXS(q)의 개수, 즉 피크의 영역의 개수를 구한다(스텝 S3834B). μ 및 λ는 정의 상수이다.
[수 11]
Figure 112017008541921-pct00011
전환 결정부(383)는 이어서 피크의 영역의 개수가 역치 TH3 이하인 경우에는, 현 프레임의 입력 음향 신호의 고역 성분이 희소하다고 판정하고, 피크의 영역의 개수가 역치 TH3을 넘는 경우에는, 현 프레임의 입력 음향 신호의 고역 성분이 희소하지 않다고 판정한다(스텝 S3835B). 여기서 역치 TH3은 현 프레임에 가까운 과거의 프레임의 입력 음향 신호의 고역 성분이 희소한 경우에는 현 프레임에 가까운 과거의 프레임의 입력 음향 신호의 고역 성분이 희소하지 않은 경우보다 큰 값이 되도록 미리 정해진 규칙에 의해 결정되는 값이다. 예를 들면 현 프레임에 가까운 과거의 프레임의 입력 음향 신호의 고역 성분이 희소한 경우에는 미리 정한 TH3_1을 역치 TH3으로 하고, 현 프레임에 가까운 과거의 프레임의 입력 음향 신호의 고역 성분이 희소하지 않은 경우는 TH3_1보다 작은 값인 미리 정한 TH3_2를 역치 TH3으로 한다. 여기서 현 프레임에 가까운 과거의 프레임은 예를 들면 앞 프레임이나 2개 앞의 프레임 등이다. 현 프레임의 입력 음향 신호의 고역 성분이 희소한지 여부의 판정 결과는 적어도 2프레임 후까지 전환 결정부(383) 내에 기억된다.
전환 결정부(383)는 이어서 앞 프레임의 부호화 처리와, 현 프레임 및 현 프레임에 가까운 과거의 프레임에 대한 입력 음향 신호의 고역 성분이 희소한지 여부의 판정 결과에 기초하여, 현 프레임의 주파수 영역의 계수열을 제1 부호화부(101)와 제2 부호화부(201)의 어느 것으로 부호화할지를 결정한다(스텝 S3836B). 즉 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용할지 여부를 결정한다.
예를 들면 전환 결정부(383)는 앞의 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제1 부호화부(101)로 부호화된 경우에 대해서는, 현 프레임의 고역 성분이 희소하지 않고, 또한 앞 프레임과 2개 앞의 프레임의 적어도 어느 하나에서 고역 성분이 희소한 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)을 제2 부호화부(201)로 부호화하는 것을 결정 가능하게 하고, 그 이외의 경우에는 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)을 제1 부호화부(101)로 부호화하는 것을 결정한다. 즉 전환 결정부(383)는 앞의 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제1 부호화부(101)로 부호화된 경우에 대해서는, 현 프레임의 고역 성분이 희소하지 않고, 또한 앞 프레임과 2개 앞의 프레임의 적어도 어느 하나에서 고역 성분이 희소한 경우에는, 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용하고, 그 이외의 경우에는 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용하지 않는다.
또 전환 결정부(383)는 앞의 프레임의 MDCT 계수열 Xf-1(n)(n=1,...,N)이 제2 부호화부(201)로 부호화된 경우에 대해서는, (1) 현 프레임의 고역 성분이 희소하고 또한 앞 프레임의 고역 성분이 희소하지 않은 경우, 또는 (2) 현 프레임의 고역 성분이 희소하고 또한 앞 프레임의 고역 성분이 희소하고 또한 2개 앞의 프레임의 고역 성분이 희소하지 않은 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)을 제1 부호화부(101)로 부호화하는 것을 결정 가능하게 하고, 그 이외의 경우에는 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)을 제2 부호화부(201)로 부호화하는 것을 결정한다. 즉 전환 결정부(383)는 앞의 프레임의 MDCT 계수열 Xf-1(n)(n=1,...,N)이 제2 부호화부(201)로 부호화된 경우에 대해서는, (1) 현 프레임의 고역 성분이 희소하고 또한 앞 프레임의 고역 성분이 희소하지 않은 경우, 또는 (2) 현 프레임의 고역 성분이 희소하고 또한 앞 프레임의 고역 성분이 희소하고 또한 2개 앞의 프레임의 고역 성분이 희소하지 않은 경우에는, 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용하고, 그 이외의 경우에는 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용하지 않는다.
또한 전환 결정부(383)는 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용한 경우에는, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보에 기초하여 현 프레임의 주파수 영역의 계수열의 부호화 처리를 결정한다. 예를 들면 전환 결정부(383)는 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용한 경우에는, 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제2 부호화부(201)로 부호화된 경우에도, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보가 제1 부호화부(101)의 부호화 처리를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)은 제1 부호화부(101)로 부호화한다고 결정한다. 또 전환 결정부(383)는 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용한 경우에는, 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제1 부호화부(101)로 부호화된 경우에도, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보가 제2 부호화부(201)의 부호화 처리를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)은 제2 부호화부(201)로 부호화한다고 결정한다.
또한 전환 결정부(383)는 앞 프레임의 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 허용한 경우에도, 부호화 장치(300)에 도시하지 않는 수단이 얻은 다른 정보에 의해 앞 프레임의 부호화 처리와 동일한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화해야 한다고 판정된 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 앞 프레임의 부호화 처리와 동일한 부호화 처리로 부호화해도 된다.
또 스텝 S3831B에서는 부분 계수열마다 상이한 샘플수로 해도 된다. 예를 들면 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)을 Q개의 부분 계수열 XSf(1)(n)(n=1,...,P1), XSf(2)(n)(n=1,...,P2),..., XSf(Q)(n)(n=1,...,PQ)로 나누어도 된다. P1,P2,...,PQ는 P1+P2+...+PQ=N을 만족하는 정의 정수이다. 또 P1,P2,...,PQ는 P1≤P2≤...≤PQ를 만족시키는 것이 바람직하다. 또 Q는 정의 정수이다.
또 스텝 S3831B나 스텝 S3832B나 스텝 S3833B의 처리와 동일한 처리를 적합 부호화 처리 판정부(382)가 행한 경우에는, 전환 결정부(383)는 스텝 S3831B나 스텝 S3832B나 스텝 S3833B는 행하지 않고, 적합 부호화 처리 판정부(382)가 행한 처리 결과를 사용해도 된다.
[제3 실시형태]
제1 실시형태 및 제2 실시형태에서는 1개의 역치를 사용하여 현 프레임이 적합한 부호화 처리를 판정하고 있었지만, 제3 실시형태는 2개의 역치를 사용한 판정을 행하는 것이다.
제3 실시형태의 부호화 장치의 구성은 제1 실시형태와 동일한 도 1이다. 제3 실시형태의 부호화 장치(300)는 결정부(380) 내의 적합 부호화 처리 판정부(382)와 전환 결정부(383)의 처리가 상이한 부분 이외에는 제1 실시형태 또는 제2 실시형태의 부호화 장치(300)와 동일하다. 제3 실시형태의 복호 장치의 구성은 제1 실시형태와 동일한 도 2이며, 각 부의 처리도 제1 실시형태의 복호 장치와 동일하다. 이하에서는 제1 실시형태의 부호화 장치(300)와 상이한 처리를 행하는 결정부(380) 내의 적합 부호화 처리 판정부(382)와 전환 결정부(383)에 대해서 설명한다.
<적합 부호화 처리 판정부(382)>
적합 부호화 처리 판정부(382)는 도 7에 예시하는 각 스텝의 처리를 행한다. 적합 부호화 처리 판정부(382)는 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 것에 적합한지, 바꾸어 말하면 어느 부호화 처리를 행해도 되는 것인지를 판정하고, 판정 결과를 출력한다(스텝 S382A).
이하, 적합 부호화 처리 판정부(382)의 동작의 일례를 설명한다. 적합 부호화 처리 판정부(382)는 도 7에 예시하는 각 스텝의 처리를 행한다. 이하의 예에서는 제1 부호화부(101)의 부호화 처리가 비특허문헌 1에 예시되는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리이며, 제2 부호화부(201)의 부호화 처리가 비특허문헌 2에 예시되는 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값을 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하는 부호화 처리이다.
이 예에서는 적합 부호화 처리 판정부(382)는 입력 음향 신호의 스펙트럼 포락의 기복이 큰 또는/및 집중도가 높은 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리에 적합하다고 판정하고, 입력 음향 신호의 스펙트럼 포락의 기복이 작은 또는/및 집중도가 낮은 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)의 부호화 처리에 적합하다고 판정하고, 입력 음향 신호의 스펙트럼 포락의 기복이 중간 정도 또는/및 집중도가 중간 정도인 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리를 행해도 되는 것인, 즉 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리에도 적합하다고 판정하고, 판정 결과를 출력한다.
입력 음향 신호의 스펙트럼 포락의 기복이 중간 정도 또는/및 집중도가 중간 정도인 경우에는, 후술하는 바와 같이 전환 결정부(383)로 앞 프레임과 동일한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 결정한다. 즉 전환 결정부(383)에서는 앞 프레임과 현 프레임 사이에서 부호화 처리가 전환됨으로써 수청자가 부자연스럽게 느끼는 일이 적도록 현 프레임의 부호화 처리가 결정된다. 따라서, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리를 행해도 되는 것인 경우나, 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리에도 적합한 경우에 한정되지 않고, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리가 적합하다고도 하기 어려운 경우나, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합하지 않을 가능성이 있는 경우가, 입력 음향 신호의 스펙트럼 포락의 기복이 중간 정도 또는/및 집중도가 중간 정도인 경우에 포함되어 있어도 된다. 즉 상기 서술한 「제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리에도 적합하다」라는 판정을, 「제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리에 대한 적성도 판별할 수 없다」라는 판정으로 바꾸어 읽어도 된다.
스펙트럼의 기복이나 집중도를 추정하는 방법으로서는 어느 방법을 채용해도 되는데, 스펙트럼 포락의 골짜기의 깊이를 추정하는 구성에 대해서 설명한다. 이 구성에서는 스펙트럼 포락의 골짜기가 얕을 때에는 스펙트럼의 기복이 작고 집중도가 낮다고 판정되고, 스펙트럼 포락의 골짜기가 깊을 때에는 스펙트럼의 기복이 크고 집중도가 높다고 판정되며, 스펙트럼 포락의 골짜기의 깊이가 중간 정도일 때에는 스펙트럼의 기복이 중간 정도이며 집중도가 중간 정도라고 판정된다.
적합 부호화 처리 판정부(382)는 제1 실시형태의 적합 부호화 처리 판정부(382)와 동일한 스텝 S3821 내지 S3825와, 제1 실시형태의 적합 부호화 처리 판정부(382)와는 상이한 스텝 S3826A를 행한다. 이하에서는 제1 실시형태의 적합 부호화 처리 판정부(382)와 상이한 부분에 대해서 설명한다.
적합 부호화 처리 판정부(382)는 스텝 S3825 다음에 역치 TH2_1,TH2_2를 사용한 이하의 판정 처리 및 후술하는 적합 정보의 출력을 행한다(스텝 S3826A).
적합 부호화 처리 판정부(382)는 모든 부분 영역의 AVEXS(q)의 평균값 E와 골짜기의 부분 영역의 AVEXS(q)의 평균값 EV의 차가 소정의 역치 TH2_1보다 작은 경우에는, 스펙트럼의 골짜기가 얕고, 스펙트럼 포락의 기복이 적거나 집중도가 낮은 스펙트럼이라고 추정되는 점에서, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)의 부호화 처리에 적합하다고 판정한다.
또 적합 부호화 처리 판정부(382)는 모든 부분 영역의 AVEXS(q)의 평균값 E와 골짜기의 부분 영역의 AVEXS(q)의 평균값 EV의 차가 역치 TH2_1보다 큰 값인 소정의 역치 TH2_2보다 큰 경우에는, 스펙트럼의 골짜기가 깊고, 스펙트럼 포락의 기복이 크거나 집중도가 높은 스펙트럼이라고 추정되는 점에서, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리가 적합하다고 판정한다.
또 적합 부호화 처리 판정부(382)는 모든 부분 영역의 AVEXS(q)의 평균값 E와 골짜기의 부분 영역의 AVEXS(q)의 평균값 EV의 차가 역치 TH2_1 이상 역치 TH2_2 이하인 경우에는, 스펙트럼의 골짜기의 깊이가 중간 정도이며, 스펙트럼 포락의 기복이 중간 정도이거나 집중도가 중간 정도의 스펙트럼이라고 추정되는 점에서, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리를 행해도 되는 것이다. 즉 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리에도 적합하다고 판정한다.
그 후, 적합 부호화 처리 판정부(382)는 적합한 부호화 처리의 정보인 적합 정보를 출력한다. 적합 정보는 적합 부호화 처리 판정부(382)의 판정 결과이며, 어느 것 또는 쌍방의 부호화 처리가 적합한지의 정보라고도 할 수 있다.
또한 적합 부호화 처리 판정부(382)는 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 하나에 적합하다고 판정된 경우에만 제1 부호화부(101)의 부호화 처리에 적합한 것을 나타내는 정보 또는 제2 부호화부(201)의 부호화 처리에 적합한 것을 나타내는 정보를 출력하고, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리를 행해도 되는 것인, 즉 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리에도 적합하다고 판정된 경우에는, 판정 결과를 출력하지 않는 구성으로 해도 된다.
<전환 결정부(383)>
전환 결정부(383)는 전환 가부 판정부(381)가 얻은 전환 가부의 정보와, 적합 부호화 처리 판정부(382)가 얻은 어느 것 또는 쌍방의 부호화 처리가 적합한지의 정보 즉 적합한 부호화 처리의 정보(적합 정보)로부터, 현 프레임의 주파수 영역의 계수열을 제1 부호화부(101)로 부호화할지 제2 부호화부(201)로 부호화할지를 결정하고, 결정한 부호화 처리를 특정 가능한 부호인 전환 부호를 출력한다(스텝 S383A). 출력한 전환 부호는 복호 장치(400)에 입력된다. 여기서 전환 결정부(383)는 전환 불가인 경우에는, 현 프레임이 적합한 부호화 처리가 어느 부호화 처리였다고 해도, 앞 프레임과 동일한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 결정한다. 또 전환 결정부(383)는 전환 가능하며, 또한 현 프레임이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합한 경우에는, 앞 프레임과 동일한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 결정한다. 또 전환 결정부(383)는 전환 가능하며, 또한 현 프레임이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 일방에 적합한 경우에는, 앞 프레임의 부호화 처리가 어느 부호화 처리였다고 해도, 현 프레임이 적합한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 결정한다.
이하, 전환 결정부(383)의 동작의 일례를 설명한다. 이하의 예에서는 제1 부호화부(101)의 부호화 처리가 비특허문헌 1에 예시되는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리이며, 제2 부호화부(201)의 부호화 처리가 비특허문헌 2에 예시되는 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값의 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하는 부호화 처리이다.
전환 결정부(383)는 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 불가를 나타내는 경우, 및/또는 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보(적합 정보)가 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)의 부호화 처리와 동일한 부호화 처리를 나타내는 경우 또는 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합한 것을 나타내는 경우에는, 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)의 부호화 처리와 동일한 부호화 처리를 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)의 부호화 처리로서 결정한다.
즉 전환 결정부(383)는 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제1 부호화부(101)로 부호화된 경우로서, 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 불가를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)도 제1 부호화부(101)로 부호화한다고 결정한다. 또 전환 결정부(383)는 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제1 부호화부(101)로 부호화된 경우로서, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보(적합 정보)가 제1 부호화부(101)의 부호화 처리를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)도 제1 부호화부(101)로 부호화한다고 결정한다. 또 전환 결정부(383)는 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제1 부호화부(101)로 부호화된 경우로서, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보(적합 정보)가 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합한 것을 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)도 제1 부호화부(101)로 부호화한다고 결정한다.
또 전환 결정부(383)는 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제2 부호화부(201)로 부호화된 경우로서, 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 불가를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)도 제2 부호화부(201)로 부호화한다고 결정한다. 또 전환 결정부(383)는 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제2 부호화부(201)로 부호화된 경우로서, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보(적합 정보)가 제2 부호화부(201)의 부호화 처리를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)도 제2 부호화부(201)로 부호화한다고 결정한다. 또 전환 결정부(383)는 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제2 부호화부(201)로 부호화된 경우로서, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보(적합 정보)가 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합한 것을 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)도 제2 부호화부(201)로 부호화한다고 결정한다.
전환 결정부(383)는 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 가능을 나타내는 경우, 또한 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보(적합 정보)가 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)의 부호화 처리와 상이한 부호화 처리를 나타내는 경우에는, 앞 프레임의 MDCT 계수열 Xf-1(n)(n=1,...,N)의 부호화 처리와 상이한 부호화 처리를 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)의 부호화 처리로서 결정한다. 즉 전환 결정부(383)는 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제1 부호화부(101)로 부호화된 경우로서, 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 가능을 나타내고, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보(적합 정보)가 제2 부호화부(201)의 부호화 처리를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)은 제2 부호화부(201)로 부호화한다고 결정한다. 또 전환 결정부(383)는 앞 프레임의 MDCT 계수열 Xf -1(n)(n=1,...,N)이 제2 부호화부(201)로 부호화된 경우로서, 전환 가부 판정부(381)가 얻은 전환 가부의 정보가 전환 가능을 나타내고, 적합 부호화 처리 판정부(382)가 얻은 어느 부호화 처리가 적합한지의 정보(적합 정보)가 제1 부호화부(101)의 부호화 처리를 나타내는 경우에는, 현 프레임의 MDCT 계수열 Xf(n)(n=1,...,N)은 제1 부호화부(101)로 부호화한다고 결정한다.
또한 적합 부호화 처리 판정부(382)를 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리에도 적합하다고 판정된 경우에 판정 결과를 출력하지 않는 구성으로 한 경우에는, 전환 결정부(383)는 적합한 부호화 처리의 정보가 입력되지 않은 경우에, 상기 서술한 어느 부호화 처리가 적합한지의 정보(적합 정보)가 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합한 것을 나타내는 경우의 처리를 행하면 된다.
[제1 변형예]
현 프레임의 입력 음향 신호가 비특허문헌 1에 예시되는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용한 부호화 처리와, 비특허문헌 2에 예시되는 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값의 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하는 부호화 처리의 어느 부호화 처리가 적합한지의 판정에는, 입력 음향 신호의 스펙트럼 포락의 기복의 크기나 집중도 뿐만아니라, 그 밖의 정보를 포함한 판정을 행해도 된다.
예를 들면 앞 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)에 의해 부호화되고, 전환 가부 판정부(381)가 전환 가능이라고 판정하고, 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)의 부호화 처리에 적합하다고 판정한 경우에도, 부호화 장치(300)에 도시하지 않는 수단이 얻은 다른 정보에 의해 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)의 부호화 처리로 부호화해야 한다고 판정된 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)에 의해 부호화해도 된다. 즉 부호화 장치(300)는 앞 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)에 의해 부호화되고, 전환 가부 판정부(381)가 전환 가능이라고 판정하고, 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)의 부호화 처리에 적합하다고 판정한 경우에, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)에 의해 부호화하는 것을 결정 가능하게 하는 구성이면 된다.
또 반대로 앞 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)에 의해 부호화되고, 전환 가부 판정부(381)가 전환 가능이라고 판정하고, 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리에 적합하다고 판정한 경우에도, 부호화 장치(300)에 도시하지 않는 수단이 얻은 다른 정보에 의해 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)의 부호화 처리로 부호화해야 한다고 판정된 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)에 의해 부호화해도 된다. 즉 부호화 장치(300)는 앞 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)에 의해 부호화되고, 전환 가부 판정부(381)가 전환 가능이라고 판정하고, 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리에 적합하다고 판정한 경우에, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)에 의해 부호화하는 것을 결정 가능하게 하는 구성이면 된다.
또 예를 들면 제3 실시형태의 부호화 장치(300)에서는, 앞 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)에 의해 부호화되고, 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합하다고 판정한 경우에도, 전환 가부 판정부(381)가 전환 가능이라고 판정하고, 부호화 장치(300)에 도시하지 않는 수단이 얻은 다른 정보에 의해 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)의 부호화 처리로 부호화해야 한다고 판정된 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)에 의해 부호화해도 된다.
또 반대로 앞 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)에 의해 부호화되고, 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합하다고 판정한 경우에도, 전환 가부 판정부(381)가 전환 가능이라고 판정하고, 부호화 장치(300)에 도시하지 않는 수단이 얻은 다른 정보에 의해 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)의 부호화 처리로 부호화해야 한다고 판정된 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)에 의해 부호화해도 된다.
즉 제3 실시형태의 부호화 장치(300)는 전환 가부 판정부(381)가 전환 가능이라고 판정하고, 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합하다고 판정한 경우에, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 앞 프레임과 동일한 부호화 처리로 부호화하는 것을 결정 가능하게 하는 구성이면 된다.
[제2 변형예]
현 프레임의 주파수 영역의 계수열을 제1 부호화부(101)로 부호화할지 제2 부호화부(201)로 부호화할지의 결정에는, 전환 가부 판정부(381)가 얻은 전환 가부의 정보를 사용하지 않아도 된다. 이 경우는 결정부(380) 내에 전환 가부 판정부(381)를 구비하지 않아도 된다.
이 경우는 전환 결정부(383)는 전환 가부 판정부(381)가 얻은 전환 가부의 정보를 사용하지 않고, 적합 부호화 처리 판정부(382)가 얻은 적합 정보로부터, 현 프레임의 주파수 영역의 계수열을 제1 부호화부(101)로 부호화할지 제2 부호화부(201)로 부호화할지를 결정하고, 결정한 부호화 처리를 특정 가능한 부호인 전환 부호를 출력한다.
예를 들면 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리에 적합하다고 판정한 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)에 의해 부호화하고, 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)의 부호화 처리에 적합하다고 판정한 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)에 의해 부호화하면 된다.
이 경우도 제1 변형예와 마찬가지로, 그 밖의 정보를 포함한 판정을 행해도 된다. 예를 들면 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리에 적합하다고 판정한 경우에도, 부호화 장치(300)에 도시하지 않는 수단이 얻은 다른 정보에 의해 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)의 부호화 처리로 부호화해야 한다고 판정된 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)에 의해 부호화해도 된다.
반대로 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)의 부호화 처리에 적합하다고 판정한 경우에도, 부호화 장치(300)에 도시하지 않는 수단이 얻은 다른 정보에 의해 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)의 부호화 처리로 부호화해야 한다고 판정된 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)에 의해 부호화해도 된다.
즉 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리에 적합하다고 판정한 경우에, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)의 부호화 처리로 부호화하는 것을 결정 가능하게 하는 구성이면 된다. 또 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)의 부호화 처리에 적합하다고 판정한 경우에, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)의 부호화 처리로 부호화하는 것을 결정 가능하게 하는 구성이면 된다.
또 예를 들면 제3 실시형태의 부호화 장치(300)에서는, 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합하다고 판정한 경우 중, 부호화 장치(300)에 도시하지 않는 수단이 얻은 다른 정보에 의해 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)의 부호화 처리로 부호화해야 한다고 판정된 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제1 부호화부(101)에 의해 부호화해도 된다.
또 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합하다고 판정한 경우 중, 부호화 장치(300)에 도시하지 않는 수단이 얻은 다른 정보에 의해 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)의 부호화 처리로 부호화해야 한다고 판정된 경우에는, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 제2 부호화부(201)에 의해 부호화해도 된다.
즉 제3 실시형태의 부호화 장치(300)는 적합 부호화 처리 판정부(382)가 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리도 적합하다고 판정한 경우에, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열을 앞 프레임과 동일한 부호화 처리로 부호화하는 것을 결정 가능하게 하는 구성이면 된다.
또한 상기한 각 실시형태에 있어서의 산출한 값과 역치의 비교에 있어서는, 산출한 값과 역치와 동일한 값인 경우에는, 역치를 경계로 하여 인접하는 2가지의 경우의 어느 일방의 경우로 나뉘도록 설정하면 된다. 즉 어떤 역치 이상인 경우로 되어 있는 것을 당해 역치보다 큰 경우로 함과 아울러, 당해 역치보다 작은 경우로 되어 있는 것을 당해 역치 이하인 경우로 해도 된다. 또 어떠한 역치보다 큰 경우로 되어 있는 것을 당해 역치 이상인 경우로 함과 아울러, 당해 역치 이하인 경우로 되어 있는 것을 당해 역치보다 작은 경우로 해도 된다.
예를 들면 제1 실시형태에 있어서, 결정부(380)는 앞 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와, 현 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기의 적어도 어느 하나가 소정의 역치 이하인 경우에, 앞 프레임과 상이한 부호화 처리를 현 프레임의 부호화 처리로서 결정하는 것을 가능하게 해도 된다(스텝 S380).
또 제2 실시형태에 있어서, 전환 가부 판정부(381)는 앞 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기와, 현 프레임의 입력 음향 신호의 고역 성분의 에너지의 크기의 적어도 어느 하나가 소정의 역치 이하인 경우에는, 전환 가능 즉 앞 프레임의 주파수 영역의 계수열을 부호화한 부호화 처리와 상이한 부호화 처리로 현 프레임의 주파수 영역의 계수열을 부호화하는 것을 가능하게 한다고 판정하고, 판정 결과를 출력해도 된다.
또 제1 실시형태에 있어서, 적합 부호화 처리 판정부(382)는 모든 부분 영역의 AVEXS(q)의 평균값 E와 골짜기의 부분 영역의 AVEXS(q)의 평균값 EV의 차가 소정의 역치 TH2보다 작은 경우에는, 스펙트럼의 골짜기가 얕고, 스펙트럼 포락의 기복이 적거나 집중도가 낮은 스펙트럼이라고 추정되는 점에서, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제2 부호화부(201)의 부호화 처리에 적합하다고 판정해도 된다. 반대로 모든 부분 영역의 AVEXS(q)의 평균값 E와 골짜기의 부분 영역의 AVEXS(q)의 평균값 EV의 차가 역치 TH2 이상인 경우에는, 스펙트럼의 골짜기가 깊고, 스펙트럼 포락의 기복이 크거나 집중도가 높은 스펙트럼이라고 추정되는 점에서, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리가 적합하다고 판정해도 된다.
또 제3 실시형태에 있어서, 적합 부호화 처리 판정부(382)는 모든 부분 영역의 AVEXS(q)의 평균값 E와 골짜기의 부분 영역의 AVEXS(q)의 평균값 EV의 차가 역치 TH2_1보다 큰 값인 소정의 역치 TH2_2 이상인 경우에는, 스펙트럼의 골짜기가 깊고, 스펙트럼 포락의 기복이 크거나 집중도가 높은 스펙트럼이라고 추정되는 점에서, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리가 적합하다고 판정해도 된다. 이 경우, 적합 부호화 처리 판정부(382)는 모든 부분 영역의 AVEXS(q)의 평균값 E와 골짜기의 부분 영역의 AVEXS(q)의 평균값 EV의 차가 역치 TH2_1 이상이며 역치 TH2_2보다 작은 경우에는, 스펙트럼의 골짜기의 깊이가 중간 정도이며, 스펙트럼 포락의 기복이 중간 정도이거나 집중도가 중간 정도의 스펙트럼이라고 추정되는 점에서, 현 프레임의 입력 음향 신호에 대응하는 주파수 영역의 계수열이 제1 부호화부(101)의 부호화 처리와 제2 부호화부(201)의 부호화 처리의 어느 부호화 처리를 행해도 되는 것으로 한다.
부호화 장치 및 부호화 방법에 있어서 설명한 처리는 기재의 순서에 따라 시계열로 실행될 뿐만아니라, 처리를 실행하는 장치의 처리 능력 또는 필요에 따라서 병렬적으로 또는 개별로 실행되어도 된다.
또 부호화 방법에 있어서의 각 스텝을 컴퓨터에 의해 실현하는 경우, 부호화 방법이 가져야 할 기능의 처리 내용은 프로그램에 의해 기술된다. 그리고 이 프로그램을 컴퓨터로 실행함으로써, 그 각 스텝이 컴퓨터 상에서 실현된다.
이 처리 내용을 기술한 프로그램은 컴퓨터로 판독 가능한 기록 매체에 기록해둘 수 있다. 컴퓨터로 판독 가능한 기록 매체로서는 예를 들면 자기 기록 장치, 광디스크, 광자기 기록 매체, 반도체 메모리 등 어떠한 것이어도 된다.
또 각 처리 수단은 컴퓨터 상에서 소정의 프로그램을 실행시킴으로써 구성하는 것으로 해도 되고, 이들 처리 내용의 적어도 일부를 하드웨어적으로 실현하는 것으로 해도 된다.
그 밖에 본 발명의 취지를 일탈하지 않는 범위에서 적당히 변경이 가능한 것은 말할 필요도 없다.

Claims (18)

  1. 입력 음향 신호를 소정 시간 구간의 프레임마다 주파수 영역에서의 복수의 부호화 처리 중 결정된 부호화 처리로 부호화하는 부호화 방법으로서,
    상기 입력 음향 신호에 대응하는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용하여, 상기 입력 음향 신호에 대응하는 주파수 영역의 계수열을 부호화하는 제1 부호화 스텝과,
    상기 입력 음향 신호에 대응하는 주파수 영역의 계수열에 대해서, 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값을 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하여 부호화하는 제2 부호화 스텝과,
    현 프레임의 상기 입력 음향 신호의 스펙트럼 포락의 기복의 크기 또는 집중도의 높이를 나타내는 지표가 소정의 역치보다 큰 경우에는, 현 프레임을 제1 부호화 스텝에서 부호화하는 것을 결정 가능하게 하고, 현 프레임의 상기 입력 음향 신호의 스펙트럼 포락의 기복의 크기 또는 집중도의 높이를 나타내는 지표가 상기 역치 이하인 경우에는, 현 프레임을 제2 부호화 스텝에서 부호화하는 것을 결정 가능하게 하는 결정 스텝
    을 포함하는 것을 특징으로 하는 부호화 방법.
  2. 입력 음향 신호를 소정 시간 구간의 프레임마다 주파수 영역에서의 복수의 부호화 처리 중 결정된 부호화 처리로 부호화하는 부호화 방법으로서,
    상기 입력 음향 신호에 대응하는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용하여, 상기 입력 음향 신호에 대응하는 주파수 영역의 계수열을 부호화하는 제1 부호화 스텝과,
    상기 입력 음향 신호에 대응하는 주파수 영역의 계수열에 대해서, 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값을 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하여 부호화하는 제2 부호화 스텝과,
    현 프레임의 상기 입력 음향 신호의 스펙트럼 포락의 기복의 크기 또는 집중도의 높이를 나타내는 지표가 소정의 제1 역치보다 큰 경우에는, 현 프레임을 제1 부호화 스텝에서 부호화하는 것을 결정 가능하게 하고, 현 프레임의 상기 입력 음향 신호의 스펙트럼 포락의 기복의 크기 또는 집중도의 높이를 나타내는 지표가 상기 제1 역치보다 작은 소정의 제2 역치 이하인 경우에는, 현 프레임을 제2 부호화 스텝에서 부호화하는 것을 결정 가능하게 하는 결정 스텝
    을 포함하는 것을 특징으로 하는 부호화 방법.
  3. 제 2 항에 있어서, 상기 결정 스텝은 또한 현 프레임의 상기 입력 음향 신호의 스펙트럼 포락의 기복의 크기 또는 집중도의 높이를 나타내는 지표가 상기 제1 역치 이하이며 또한 상기 제2 역치보다 큰 경우에는, 앞 프레임과 동일한 부호화 처리를 현 프레임의 부호화 처리로서 결정 가능하게 하는
    것을 특징으로 하는 부호화 방법.
  4. 입력 음향 신호를 소정 시간 구간의 프레임마다 주파수 영역에서의 복수의 부호화 처리 중 결정된 부호화 처리로 부호화하는 부호화 장치로서,
    상기 입력 음향 신호에 대응하는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용하여, 상기 입력 음향 신호에 대응하는 주파수 영역의 계수열을 부호화하는 제1 부호화부와,
    상기 입력 음향 신호에 대응하는 주파수 영역의 계수열에 대해서, 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값을 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하여 부호화하는 제2 부호화부와,
    현 프레임의 상기 입력 음향 신호의 스펙트럼 포락의 기복의 크기 또는 집중도의 높이를 나타내는 지표가 소정의 역치보다 큰 경우에는, 현 프레임을 제1 부호화부로 부호화하는 것을 결정 가능하게 하고, 현 프레임의 상기 입력 음향 신호의 스펙트럼 포락의 기복의 크기 또는 집중도의 높이를 나타내는 지표가 상기 역치 이하인 경우에는, 현 프레임을 제2 부호화부로 부호화하는 것을 결정 가능하게 하는 결정부
    를 포함하는 것을 특징으로 하는 부호화 장치.
  5. 입력 음향 신호를 소정 시간 구간의 프레임마다 주파수 영역에서의 복수의 부호화 처리 중 결정된 부호화 처리로 부호화하는 부호화 장치로서,
    상기 입력 음향 신호에 대응하는 선형 예측 계수로 변환 가능한 계수에 기초하는 스펙트럼 포락을 사용하여, 상기 입력 음향 신호에 대응하는 주파수 영역의 계수열을 부호화하는 제1 부호화부와,
    상기 입력 음향 신호에 대응하는 주파수 영역의 계수열에 대해서, 구분한 주파수 영역마다의 계수의 평균 에너지의 대수값을 인접하는 주파수 영역의 평균 에너지의 대수값과의 차분의 가변 길이 부호화를 수반하여 부호화하는 제2 부호화부와,
    현 프레임의 상기 입력 음향 신호의 스펙트럼 포락의 기복의 크기 또는 집중도의 높이를 나타내는 지표가 소정의 제1 역치보다 큰 경우에는, 현 프레임을 제1 부호화부로 부호화하는 것을 결정 가능하게 하고, 현 프레임의 상기 입력 음향 신호의 스펙트럼 포락의 기복의 크기 또는 집중도의 높이를 나타내는 지표가 상기 제1 역치보다 작은 소정의 제2 역치 이하인 경우에는, 현 프레임을 제2 부호화부로 부호화하는 것을 결정 가능하게 하는 결정부
    를 포함하는 것을 특징으로 하는 부호화 장치.
  6. 제 5 항에 있어서, 상기 결정부는 또한 현 프레임의 상기 입력 음향 신호의 스펙트럼 포락의 기복의 크기 또는 집중도의 높이를 나타내는 지표가 상기 제1 역치 이하이며 또한 상기 제2 역치보다 큰 경우에는, 앞 프레임과 동일한 부호화 처리를 현 프레임의 부호화 처리로서 결정 가능하게 하는
    것을 특징으로 하는 부호화 장치.
  7. 제 1 항 내지 제 3 항 중 어느 한 항에 기재된 부호화 방법의 각 스텝을 컴퓨터에 실행시키기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램.
  8. 제 1 항내지 제 3 항 중 어느 한 항에 기재된 부호화 방법의 각 스텝을 컴퓨터에 실행시키기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체.
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
KR1020177002231A 2014-07-28 2015-05-15 부호화 방법, 장치, 프로그램 및 기록 매체 KR101993828B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2014-152958 2014-07-28
JP2014152958 2014-07-28
PCT/JP2015/063989 WO2016017238A1 (ja) 2014-07-28 2015-05-15 符号化方法、装置、プログラム及び記録媒体

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR1020197011029A Division KR102049294B1 (ko) 2014-07-28 2015-05-15 부호화 방법, 장치, 프로그램 및 기록 매체
KR1020197018004A Division KR102061316B1 (ko) 2014-07-28 2015-05-15 부호화 방법, 장치, 프로그램 및 기록 매체

Publications (2)

Publication Number Publication Date
KR20170024030A KR20170024030A (ko) 2017-03-06
KR101993828B1 true KR101993828B1 (ko) 2019-06-27

Family

ID=55217142

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020197011029A KR102049294B1 (ko) 2014-07-28 2015-05-15 부호화 방법, 장치, 프로그램 및 기록 매체
KR1020197018004A KR102061316B1 (ko) 2014-07-28 2015-05-15 부호화 방법, 장치, 프로그램 및 기록 매체
KR1020177002231A KR101993828B1 (ko) 2014-07-28 2015-05-15 부호화 방법, 장치, 프로그램 및 기록 매체

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020197011029A KR102049294B1 (ko) 2014-07-28 2015-05-15 부호화 방법, 장치, 프로그램 및 기록 매체
KR1020197018004A KR102061316B1 (ko) 2014-07-28 2015-05-15 부호화 방법, 장치, 프로그램 및 기록 매체

Country Status (8)

Country Link
US (4) US10304472B2 (ko)
EP (3) EP3614382B1 (ko)
JP (3) JP6411509B2 (ko)
KR (3) KR102049294B1 (ko)
CN (4) CN106796801B (ko)
ES (3) ES2838006T3 (ko)
PL (2) PL3163571T3 (ko)
WO (1) WO2016017238A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3614382B1 (en) * 2014-07-28 2020-10-07 Nippon Telegraph And Telephone Corporation Coding of a sound signal
CN114898761A (zh) * 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
CN110868220B (zh) * 2018-08-28 2021-09-07 株洲中车时代电气股份有限公司 车辆设备的身份标识的配置及异常检测方法
CN113948085B (zh) * 2021-12-22 2022-03-25 中国科学院自动化研究所 语音识别方法、系统、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050154584A1 (en) * 2002-05-31 2005-07-14 Milan Jelinek Method and device for efficient frame erasure concealment in linear predictive based speech codecs
US20080027717A1 (en) * 2006-07-31 2008-01-31 Vivek Rajendran Systems, methods, and apparatus for wideband encoding and decoding of inactive frames

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450490A (en) * 1994-03-31 1995-09-12 The Arbitron Company Apparatus and methods for including codes in audio signals and decoding
HU219256B (en) * 1994-03-31 2001-03-28 Arbitron Co Apparatus and method for including a code having at least one code frequency component with an audio signal having a plurality of audio signal frequency components
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JP3317470B2 (ja) * 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
JP3612260B2 (ja) * 2000-02-29 2005-01-19 株式会社東芝 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP3453116B2 (ja) * 2000-09-26 2003-10-06 パナソニック モバイルコミュニケーションズ株式会社 音声符号化方法及び装置
JP3426207B2 (ja) * 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
EP1292036B1 (en) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Digital signal decoding methods and apparatuses
JP3960932B2 (ja) * 2002-03-08 2007-08-15 日本電信電話株式会社 ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
US7599835B2 (en) * 2002-03-08 2009-10-06 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
US7379864B2 (en) * 2003-05-06 2008-05-27 Lucent Technologies Inc. Method and apparatus for the detection of previous packet loss in non-packetized speech
EP3118849B1 (en) * 2004-05-19 2020-01-01 Fraunhofer Gesellschaft zur Förderung der Angewand Encoding device, decoding device, and method thereof
US7752039B2 (en) * 2004-11-03 2010-07-06 Nokia Corporation Method and device for low bit rate speech coding
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
CN101496097A (zh) * 2006-07-31 2009-07-29 高通股份有限公司 用于在与语音信号相关联的包中包含识别符的系统及方法
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US8483854B2 (en) * 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
CN101763856B (zh) * 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码系统
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
CN101552006B (zh) * 2009-05-12 2011-12-28 武汉大学 加窗信号mdct域的能量及相位调整方法及其装置
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
BR112012032746A2 (pt) * 2010-06-21 2016-11-08 Panasonic Corp dispositivo de descodificação, dispositivo de codificação, e métodos para os mesmos.
CN102446508B (zh) * 2010-10-11 2013-09-11 华为技术有限公司 语音音频统一编码窗型选择方法及装置
JP5694751B2 (ja) * 2010-12-13 2015-04-01 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
US9711158B2 (en) * 2011-01-25 2017-07-18 Nippon Telegraph And Telephone Corporation Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
KR102070429B1 (ko) * 2011-10-21 2020-01-28 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치
CN103366750B (zh) * 2012-03-28 2015-10-21 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
KR101841380B1 (ko) * 2014-01-13 2018-03-22 노키아 테크놀로지스 오와이 다중-채널 오디오 신호 분류기
BR112016025850B1 (pt) * 2014-05-08 2022-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Métodos para codificar um sinal de áudio e para discriminação de sinal de áudio, codificador para codificação de um sinal de áudio, discriminador de sinal de áudio, dispositivo de comunicação, e, meio de armazenamento legível por computador
GB2526128A (en) * 2014-05-15 2015-11-18 Nokia Technologies Oy Audio codec mode selector
MX368572B (es) * 2014-05-15 2019-10-08 Ericsson Telefon Ab L M Clasificacion y codificacion de señal de audio.
EP3614382B1 (en) * 2014-07-28 2020-10-07 Nippon Telegraph And Telephone Corporation Coding of a sound signal
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050154584A1 (en) * 2002-05-31 2005-07-14 Milan Jelinek Method and device for efficient frame erasure concealment in linear predictive based speech codecs
US20080027717A1 (en) * 2006-07-31 2008-01-31 Vivek Rajendran Systems, methods, and apparatus for wideband encoding and decoding of inactive frames

Also Published As

Publication number Publication date
US11037579B2 (en) 2021-06-15
CN112992163A (zh) 2021-06-18
US20170178659A1 (en) 2017-06-22
US11043227B2 (en) 2021-06-22
ES2908564T3 (es) 2022-05-03
ES2770704T3 (es) 2020-07-02
PL3796314T3 (pl) 2022-03-28
US20190206414A1 (en) 2019-07-04
WO2016017238A1 (ja) 2016-02-04
US10304472B2 (en) 2019-05-28
KR20190077115A (ko) 2019-07-02
ES2838006T3 (es) 2021-07-01
CN106796801B (zh) 2021-02-26
KR102049294B1 (ko) 2019-11-27
CN106796801A (zh) 2017-05-31
KR20170024030A (ko) 2017-03-06
EP3163571A4 (en) 2017-11-29
JP6608993B2 (ja) 2019-11-20
JPWO2016017238A1 (ja) 2017-06-01
CN112992164A (zh) 2021-06-18
EP3614382A1 (en) 2020-02-26
US10629217B2 (en) 2020-04-21
PL3163571T3 (pl) 2020-05-18
EP3163571A1 (en) 2017-05-03
US20200176007A1 (en) 2020-06-04
EP3796314B1 (en) 2021-12-22
EP3163571B1 (en) 2019-11-20
JP2018139004A (ja) 2018-09-06
EP3796314A1 (en) 2021-03-24
KR20190042773A (ko) 2019-04-24
US20200176006A1 (en) 2020-06-04
KR102061316B1 (ko) 2019-12-31
JP2019215558A (ja) 2019-12-19
JP6739604B2 (ja) 2020-08-12
CN112992165A (zh) 2021-06-18
JP6411509B2 (ja) 2018-10-24
EP3614382B1 (en) 2020-10-07

Similar Documents

Publication Publication Date Title
JP6739604B2 (ja) 符号化方法、装置、プログラム及び記録媒体
US8665945B2 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
KR101860146B1 (ko) 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
KR101861787B1 (ko) 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 부호화 프로그램, 복호 프로그램, 기록매체

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
A107 Divisional application of patent
AMND Amendment
X701 Decision to grant (after re-examination)