KR20140050044A - 부호화 장치 및 방법, 복호 장치 및 방법과 프로그램 - Google Patents

부호화 장치 및 방법, 복호 장치 및 방법과 프로그램 Download PDF

Info

Publication number
KR20140050044A
KR20140050044A KR1020147003279A KR20147003279A KR20140050044A KR 20140050044 A KR20140050044 A KR 20140050044A KR 1020147003279 A KR1020147003279 A KR 1020147003279A KR 20147003279 A KR20147003279 A KR 20147003279A KR 20140050044 A KR20140050044 A KR 20140050044A
Authority
KR
South Korea
Prior art keywords
signal
frame
band
pass
subband
Prior art date
Application number
KR1020147003279A
Other languages
English (en)
Inventor
유키 야마모토
도루 치넨
Original Assignee
소니 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 주식회사 filed Critical 소니 주식회사
Publication of KR20140050044A publication Critical patent/KR20140050044A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 기술은, 보다 적은 부호량으로 음질이 좋은 음성을 얻을 수 있게 하는 부호화 장치 및 방법, 복호 장치 및 방법과 프로그램에 관한 것이다. 부호화 장치는 입력 신호의 저역 성분을 부호화하여 얻어진 저역 부호화 데이터와, 입력 신호의 고역 성분을 추정에 의해 구하기 위한 추정 계수를 포함하는 데이터를 부호화하여 얻어지는 고역 부호화 데이터를 다중화하여 출력한다. 입력 신호의 부호화 시에는, 산출부는 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수와, 입력 신호의 고역 성분으로부터 고역 성분의 파워의 추정값인 의사 고역 서브 밴드 파워를 산출한다. 그리고, 판정부는 산출된 의사 고역 서브 밴드 파워와, 실제의 고역 성분의 파워의 비교 결과에 기초하여, 처리 대상의 프레임에서, 직전의 프레임의 추정 계수의 재이용이 가능한지 여부를 판정한다. 본 기술은, 부호화 장치에 적용할 수 있다.

Description

부호화 장치 및 방법, 복호 장치 및 방법과 프로그램{ENCODING DEVICE AND METHOD, DECODING DEVICE AND METHOD, AND PROGRAM}
본 기술은 부호화 장치 및 방법, 복호 장치 및 방법과 프로그램에 관한 것으로, 특히, 보다 적은 부호량으로 음질이 좋은 음성을 얻을 수 있게 한 부호화 장치 및 방법, 복호 장치 및 방법과 프로그램에 관한 것이다.
종래, 음성 신호의 부호화 방법으로서, HE-AAC[High Efficiency MPEG(Moving Picture Experts Group) 4 AAC(Advanced Audio Coding)](국제 표준 규격 ISO/IEC14496-3)이나, AAC(MPEG2 AAC)(국제 표준 규격 ISO/IEC13818-7) 등이 알려져 있다.
예를 들어 음성 신호의 부호화 방법으로서, 저역 성분을 부호화하여 얻어진 저역 부호화 정보와, 저역 성분 및 고역 성분으로부터 생성된, 고역 성분의 추정값을 얻기 위한 고역 부호화 정보를 부호화로 얻어진 부호로서 출력하는 방법이 제안되어 있다(예를 들어, 특허문헌 1 참조). 이 방법에서는, 고역 부호화 정보에는 고역의 주파수 성분을 얻기 위한 스케일 팩터, 진폭 조정 계수, 스펙트럼 잔차(殘差) 등, 고역 성분의 추정값을 산출하기 위해 필요하게 되는 정보가 포함되어 있다.
또한, 복호 시에는 저역 부호화 정보를 복호하여 얻어지는 저역 성분과, 고역 부호화 정보를 복호하여 얻어지는 정보에 기초하여 고역 성분이 추정되고, 추정에 의해 얻어진 고역 성분과, 복호로 얻어진 저역 성분이 합성되어 복호로 얻어진 음성 신호가 된다.
이와 같은 부호화 방법에서는, 고역 성분의 추정값을 얻기 위한 정보만을 고역의 신호 성분에 관한 정보로서 부호화하므로, 음질의 열화를 억제하면서, 부호화 효율을 향상시킬 수 있다.
국제 공개 WO2006/049205호
그러나, 상술한 기술에서는 복호 시에 음질이 좋은 음성을 얻을 수는 있지만, 음성 신호의 처리 단위마다 고역 성분의 추정값을 산출하기 위한 정보를 생성해야 하여, 고역 부호화 정보의 부호량이 충분히 적다고는 할 수 없었다.
본 기술은, 이와 같은 상황을 감안하여 이루어진 것이며, 보다 적은 부호량으로 음질이 좋은 음성을 얻을 수 있게 하는 것이다.
본 기술의 제1 측면의 부호화 장치는, 입력 신호의 대역 분할을 행하여, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하는 서브 밴드 분할부와, 상기 입력 신호의 저역 신호로부터 얻어진 특징량과, 미리 준비된 복수의 추정 계수 중 상기 입력 신호의 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수에 기초하여, 상기 처리 대상의 프레임의 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사(擬似) 고역 서브 밴드 파워를 산출하는 산출부와, 상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 신호로부터 얻어진 상기 고역 서브 밴드 파워에 기초하여, 상기 처리 대상의 프레임에서, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하게 된 경우, 상기 재이용 가능하게 된 상기 추정 계수를 얻기 위한 데이터를 생성하는 생성부와, 상기 저역 신호를 부호화하여 저역 부호화 데이터를 생성하는 저역 부호화부와, 상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는 다중화부를 구비한다.
부호화 장치에는, 상기 복수의 추정 계수마다, 상기 특징량과 상기 추정 계수에 기초하여 상기 의사 고역 서브 밴드 파워를 산출하는 의사 고역 서브 밴드 파워 산출부와, 상기 의사 고역 서브 밴드 파워 산출부에 의해 산출된 상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 파워를 비교하고, 상기 복수의 추정 계수 중 어느 하나를 선택하는 선택부를 또한 설치하고, 상기 생성부에는, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하지 않게 된 경우, 상기 선택부에 의해 선택된 상기 추정 계수를 얻기 위한 상기 데이터를 생성시킬 수 있다.
부호화 장치에는, 상기 데이터를 부호화하여 고역 부호화 데이터를 생성하는 고역 부호화부를 더 설치하고, 상기 다중화부에는, 상기 고역 부호화 데이터와 상기 저역 부호화 데이터를 다중화시켜 상기 출력 부호열을 생성시킬 수 있다.
고역측의 서브 밴드의 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워의 차분의 제곱합이 소정의 임계값 이하인 경우, 상기 추정 계수가 재이용 가능하다고 할 수 있다.
고역측의 서브 밴드의 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여 산출된, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워의 유사한 정도를 나타내는 평가값과 소정의 임계값의 비교 결과에 따라서, 상기 추정 계수가 재이용 가능하다고 할 수 있다.
상기 생성부에는, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에 대하여, 하나의 상기 데이터를 생성시킬 수 있다.
상기 데이터에는, 상기 처리 대상 구간에서, 동일한 상기 추정 계수가 선택된 연속하는 프레임을 포함하는 구간을 특정하기 위한 정보가 포함되어 있도록 할 수 있다.
상기 데이터에는, 상기 추정 계수를 특정하기 위한 정보가 상기 구간에 대하여 하나 포함되어 있도록 할 수 있다.
본 기술의 제1 측면의 부호화 방법 또는 프로그램은 입력 신호의 대역 분할을 행하여, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하고, 상기 입력 신호의 저역 신호로부터 얻어진 특징량과, 미리 준비된 복수의 추정 계수 중 상기 입력 신호의 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수에 기초하여, 상기 처리 대상의 프레임의 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하고, 상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 신호로부터 얻어진 상기 고역 서브 밴드 파워에 기초하여, 상기 처리 대상의 프레임에서, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하게 된 경우, 상기 재이용 가능하게 된 상기 추정 계수를 얻기 위한 데이터를 생성하고, 상기 저역 신호를 부호화하여 저역 부호화 데이터를 생성하고, 상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는 스텝을 포함한다.
본 기술의 제1 측면에 있어서는, 입력 신호의 대역 분할이 행해져, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호가 생성되고, 상기 입력 신호의 저역 신호로부터 얻어진 특징량과, 미리 준비된 복수의 추정 계수 중 상기 입력 신호의 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수에 기초하여, 상기 처리 대상의 프레임의 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워가 산출되고, 상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 신호로부터 얻어진 상기 고역 서브 밴드 파워에 기초하여, 상기 처리 대상의 프레임에서, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하게 된 경우, 상기 재이용 가능하게 된 상기 추정 계수를 얻기 위한 데이터가 생성되고, 상기 저역 신호를 부호화하여 저역 부호화 데이터가 생성되고, 상기 데이터와 상기 저역 부호화 데이터가 다중화되어 출력 부호열이 생성된다.
본 기술의 제2 측면의 복호 장치는 입력 신호의 처리 대상의 프레임에서의 고역 서브 밴드 파워와, 미리 준비된 복수의 추정 계수 중 상기 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수 및 상기 입력 신호의 특징량에 기초하여 산출된 상기 처리 대상의 프레임의 상기 고역 서브 밴드 파워의 추정값에 기초하여, 상기 처리 대상의 프레임에서 상기 직전의 프레임의 상기 추정 계수가 재이용 가능한지 여부가 판정되고, 그 판정 결과에 따라서 생성된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하는 비다중화부와, 상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하는 저역 복호부와, 상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하는 고역 신호 생성부와, 상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는 합성부를 구비한다.
상기 직전의 프레임의 상기 추정 계수가 재이용 가능하지 않다고 판정된 경우, 상기 입력 부호열에 포함되는 상기 데이터는, 상기 복수의 추정 계수마다 상기 고역 서브 밴드 파워의 상기 추정값이 산출되고, 산출된 상기 추정값과 상기 고역 서브 밴드 파워의 비교에 의해, 상기 복수의 추정 계수 중에서 선택된 상기 추정 계수를 얻기 위한 상기 데이터가 되도록 할 수 있다.
복호 장치에는, 상기 데이터를 복호하는 데이터 복호부를 더 설치할 수 있다.
상기 추정값과 상기 고역 서브 밴드 파워의 차분의 제곱합이 소정의 임계값 이하인 경우, 상기 추정 계수가 재이용 가능하다고 판정되도록 할 수 있다.
상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에 대하여, 하나의 상기 데이터가 생성되도록 할 수 있다.
상기 데이터에는, 상기 처리 대상 구간에서, 동일한 상기 추정 계수가 선택된 연속하는 프레임을 포함하는 구간을 특정하기 위한 정보가 포함되어 있도록 할 수 있다.
상기 데이터에는, 상기 추정 계수를 특정하기 위한 정보가 상기 구간에 대하여 하나 포함되어 있도록 할 수 있다.
본 기술의 제2 측면의 복호 방법 또는 프로그램은, 입력 신호의 처리 대상의 프레임에서의 고역 서브 밴드 파워와, 미리 준비된 복수의 추정 계수 중 상기 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수 및 상기 입력 신호의 특징량에 기초하여 산출된 상기 처리 대상의 프레임의 상기 고역 서브 밴드 파워의 추정값에 기초하여, 상기 처리 대상의 프레임에서 상기 직전의 프레임의 상기 추정 계수가 재이용 가능한지 여부가 판정되고, 그 판정 결과에 따라서 생성된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하고, 상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하고, 상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하고, 상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는 스텝을 포함한다.
본 기술의 제2 측면에 있어서는, 입력 신호의 처리 대상의 프레임에서의 고역 서브 밴드 파워와, 미리 준비된 복수의 추정 계수 중 상기 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수 및 상기 입력 신호의 특징량에 기초하여 산출된 상기 처리 대상의 프레임의 상기 고역 서브 밴드 파워의 추정값에 기초하여, 상기 처리 대상의 프레임에서 상기 직전의 프레임의 상기 추정 계수가 재이용 가능한지 여부가 판정되고, 그 판정 결과에 따라서 생성된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열이 비다중화되고, 상기 저역 부호화 데이터가 복호되어 저역 신호가 생성되고, 상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호가 생성되고, 상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호가 생성된다.
본 기술의 제1 측면 및 제2 측면에 따르면, 보다 적은 부호량으로 음질이 좋은 음성을 얻을 수 있다.
도 1은 입력 신호의 서브 밴드에 대해서 설명하기 위한 도면이다.
도 2는 가변 길이 방식에 의한 고역 성분의 부호화에 대해서 설명하는 도면이다.
도 3은 고정 길이 방식에 의한 고역 성분의 부호화에 대해서 설명하는 도면이다.
도 4는 계수 인덱스의 재이용에 대해서 설명하는 도면이다.
도 5는 본 기술을 적용한 부호화 장치의 구성예를 나타내는 도면이다.
도 6은 부호화 처리에 대해서 설명하는 흐름도이다.
도 7은 부호화 처리에 대해서 설명하는 흐름도이다.
도 8은 복호 장치의 구성예를 나타내는 도면이다.
도 9는 컴퓨터의 구성예를 나타내는 도면이다.
이하, 도면을 참조하여, 본 기술을 적용한 실시 형태에 대해서 설명한다.
<본 기술의 개요>
[입력 신호의 부호화에 대해서]
본 기술은, 예를 들어 음악 신호 등의 음성 신호를 입력 신호로서, 입력 신호의 부호화를 행하는 것이다.
입력 신호의 부호화를 행하는 부호화 장치에서는, 부호화 시에 있어서 도 1에 도시하는 바와 같이, 입력 신호는 소정의 대역 폭의 복수의 주파수 대역(이하, 서브 밴드라고 칭함)의 서브 밴드 신호로 분할된다. 또한, 도 1에 있어서, 종축은 입력 신호의 각 주파수의 파워를 나타내고 있고, 횡축은 입력 신호의 각 주파수를 나타내고 있다. 또한, 곡선 C11은 입력 신호의 각 주파수 성분의 파워를 나타내고 있고, 도면 중, 세로 방향의 점선은 각 서브 밴드의 경계 위치를 나타내고 있다.
입력 신호가 각 서브 밴드의 서브 밴드 신호로 분할되면, 입력 신호의 주파수 성분 중, 미리 정해진 주파수 이하의 저역측의 성분이, 소정의 부호화 방식에 의해 부호화되고, 저역 부호화 데이터가 생성된다.
도 1의 예에서는, 각 서브 밴드를 특정하는 인덱스가 sb인 서브 밴드 sb의 상한의 주파수 이하의 주파수의 서브 밴드가 입력 신호의 저역 성분으로 되어 있고, 서브 밴드 sb의 상한의 주파수보다도 높은 주파수의 서브 밴드가 입력 신호의 고역 성분으로 되어 있다.
저역 부호화 데이터가 얻어지면, 다음에 입력 신호의 저역 성분과 고역 성분에 기초하여, 고역 성분의 각 서브 밴드의 서브 밴드 신호를 재현하기 위한 정보가 생성되고, 그 정보가, 적절히, 소정의 부호화 방식에 의해 부호화되어 고역 부호화 데이터가 생성된다.
구체적으로는, 주파수 방향으로 연속해서 배열하는 저역측의 가장 주파수가 높은 4개의 서브 밴드 sb-3 내지 서브 밴드 sb의 성분과, 고역측의 연속해서 배열하는 (eb-(sb+1)+1)개의 서브 밴드 sb+1 내지 서브 밴드 eb의 성분으로부터, 고역 부호화 데이터가 생성된다.
여기서, 서브 밴드 sb+1은 서브 밴드 sb에 인접하는, 가장 저역측에 위치하는 고역의 서브 밴드이며, 서브 밴드 eb는, 연속해서 배열하는 서브 밴드 sb+1 내지 서브 밴드 eb 중 가장 주파수가 높은 서브 밴드이다.
고역 성분의 부호화로 얻어지는 고역 부호화 데이터는, 고역측의 서브 밴드 ib(단, sb+1≤ib≤eb)의 서브 밴드 신호를 추정에 의해 생성하기 위한 정보이며, 고역 부호화 데이터에는, 각 서브 밴드 신호의 추정에 사용되는 추정 계수를 얻기 위한 계수 인덱스가 포함되어 있다.
즉, 서브 밴드 ib의 서브 밴드 신호의 추정에는, 저역측의 서브 밴드 kb(단, sb-3≤kb≤sb)의 서브 밴드 신호의 파워에 승산되는 계수 Aib(kb)와, 상수항인 계수 Bib를 포함하는 추정 계수가 사용된다. 고역 부호화 데이터에 포함되는 계수 인덱스는, 각 서브 밴드 ib의 계수 Aib(kb)와 계수 Bib를 포함하는 추정 계수의 세트를 얻기 위한 정보, 예를 들어 추정 계수의 세트를 특정하는 정보이다.
이상과 같이 하여 저역 부호화 데이터와 고역 부호화 데이터가 얻어지면, 그들의 저역 부호화 데이터와 고역 부호화 데이터가 다중화되어 출력 부호열로 되고, 출력된다.
이와 같이 고역 부호화 데이터에, 추정 계수를 얻기 위한 계수 인덱스를 포함하게 함으로써, 프레임마다 고역 성분을 산출하기 위한 스케일 팩터나 진폭 조정 계수 등을 포함하는 경우와 비교하여, 고역 부호화 데이터의 부호량을 대폭 삭감할 수 있다.
또한, 출력 부호열의 공급을 받은 복호 장치는, 저역 부호화 데이터를 복호하여 저역측의 각 서브 밴드의 서브 밴드 신호를 포함하는 복호 저역 신호를 얻음과 함께, 복호 저역 신호와, 고역 부호화 데이터를 복호하여 얻어진 정보로부터 고역측의 각 서브 밴드의 서브 밴드 신호를 추정에 의해 생성한다. 그리고, 복호 장치는, 추정에 의해 얻어진 고역측의 각 서브 밴드의 서브 밴드 신호를 포함하는 복호 고역 신호와, 복호 저역 신호로부터 출력 신호를 생성한다. 이와 같이 하여 얻어진 출력 신호는, 부호화된 입력 신호를 복호함으로써 얻어진 음성 신호이다.
[출력 부호열에 대해서]
그런데, 입력 신호의 부호화에서는 입력 신호의 소정의 시간 길이의 구간마다, 즉 프레임마다, 미리 준비된 복수의 추정 계수 중에서, 처리 대상으로 되어 있는 프레임에 대하여 적절한 추정 계수(계수 인덱스)가 선택된다.
부호화 장치에서는, 각 프레임의 계수 인덱스를 그대로 고역 부호화 데이터에 포함하는 것이 아니라, 시간 방향에 있어서 계수 인덱스가 변화되는 시간 정보와, 변화된 계수 인덱스의 값을 고역 부호화 데이터에 포함함으로써 한층 더한 부호량의 삭감이 도모되고 있다.
특히, 입력 신호가, 각 주파수 성분의 시간 방향으로의 변동이 적은 정상 신호인 경우에는, 선택된 추정 계수, 즉 계수 인덱스는 시간 방향으로 동일한 것이 연속해서 이어지는 경우가 많다. 따라서, 고역 부호화 데이터에 포함되는 계수 인덱스의 시간 방향의 정보량을 삭감하기 위해, 적절히, 가변 길이 방식과 고정 길이 방식이 전환되면서, 입력 신호의 고역 성분의 부호화가 행해진다.
[가변 길이 방식에 대해서]
이하, 가변 길이 방식과 고정 길이 방식에 의한 고역 성분의 부호화에 대해서 설명한다.
고역 성분의 부호화 시에는, 미리 정해진 소정의 프레임 길이의 구간마다, 가변 길이 방식과 고정 길이 방식의 전환이 행해진다. 예를 들어, 이하에서는 16프레임마다 가변 길이 방식과 고정 길이 방식의 전환이 행해지는 것으로서 설명을 계속하기로 하고, 입력 신호의 16프레임분의 구간을 처리 대상 구간이라고도 칭하기로 한다. 즉, 부호화 장치에서는, 처리 대상 구간인 16프레임을 단위로 하여, 출력 부호열이 출력된다.
우선, 가변 길이 방식에 대해서 설명한다. 가변 길이 방식에 의한 고역 성분의 부호화에서는, 방식 플래그, 계수 인덱스, 구간 정보 및 개수 정보를 포함하는 데이터가 부호화되고, 고역 부호화 데이터가 된다.
또한, 방식 플래그는, 고역 부호화 데이터를 생성하는 방식을 나타내는 정보, 즉 고역 성분의 부호화 시에 가변 길이 방식과 고정 길이 방식의 어떤 방식이 선택되었는지를 나타내는 정보이다.
또한, 구간 정보란, 처리 대상 구간에 포함되는 연속하는 프레임을 포함하는 구간이며, 동일한 계수 인덱스가 선택된 프레임을 포함하는 구간(이하, 연속 프레임 구간이라고도 칭함)의 길이를 나타내는 정보이다. 또한, 개수 정보란, 처리 대상 구간에 포함되는 연속 프레임 구간의 개수를 나타내는 정보이다.
예를 들어, 가변 길이 방식에서는 도 2에 도시하는 바와 같이 위치 FST1로부터 위치 FSE1까지의 사이에 포함되는 16프레임의 구간이 하나의 처리 대상 구간이 된다. 또한, 도 2에 있어서, 도면 중, 가로 방향은 시간을 나타내고 있고, 하나의 사각형은 하나의 프레임을 나타내고 있다. 또한, 프레임을 나타내는 사각형 내의 수치는, 그 프레임에 대해서 선택된 추정 계수를 특정하는 계수 인덱스의 값을 나타내고 있다.
가변 길이 방식에 의한 고역 성분의 부호화에서는, 우선, 처리 대상 구간이, 동일한 계수 인덱스가 선택된, 연속하는 프레임을 포함하는 연속 프레임 구간으로 분할된다. 즉, 다른 계수 인덱스가 선택된, 서로 인접하는 프레임의 경계 위치가, 각 연속 프레임 구간의 경계 위치로 된다.
이 예에서는, 처리 대상 구간은, 위치 FST1로부터 위치 FC1의 구간, 위치 FC1로부터 위치 FC2의 구간 및 위치 FC2로부터 위치 FSE1의 구간의 3개의 구간으로 분할된다. 예를 들어, 위치 FST1로부터 위치 FC1까지의 연속 프레임 구간에서는, 각 프레임에 있어서, 동일한 계수 인덱스 「2」가 선택되어 있다.
이와 같이 하여 처리 대상 구간이 연속 프레임 구간으로 분할되면, 처리 대상 구간 내의 연속 프레임 구간수를 나타내는 개수 정보, 각 연속 프레임 구간에서 선택된 계수 인덱스, 각 연속 프레임 구간의 길이를 나타내는 구간 정보 및 방식 플래그를 포함하는 데이터가 생성된다.
여기서는, 처리 대상 구간은 3개의 연속 프레임 구간으로 분할되어 있으므로, 연속 프레임 구간수 「3」을 나타내는 정보가 개수 정보가 된다. 도 2에서는 개수 정보가 「num_length=3」으로 나타내어져 있다.
또한, 예를 들어 처리 대상 구간 내의 최초의 연속 프레임 구간의 구간 정보는, 그 연속 프레임 구간의 프레임을 단위로 하는 길이 「5」로 되고, 도 2에서는 「length0=5」로 나타내어져 있다. 또한, 각 구간 정보는, 처리 대상 구간의 선두로부터 몇 번째에 있는 연속 프레임 구간의 구간 정보인지를 특정할 수 있게 되어 있다. 바꾸어 말하면, 구간 정보에는, 처리 대상 구간 내에서의 연속 프레임 구간의 위치를 특정하기 위한 정보도 포함되어 있다.
이와 같이 하여, 처리 대상 구간에 대해서 개수 정보, 계수 인덱스, 구간 정보 및 방식 플래그를 포함하는 데이터가 생성되면, 이 데이터가 부호화되어 고역 부호화 데이터가 된다. 이때, 부호화되는 데이터에는 연속 프레임 구간마다 계수 인덱스가 포함되게 된다. 이 경우, 복수 프레임에서 연속해서 동일한 계수 인덱스가 선택될 때에는, 프레임마다 계수 인덱스를 송신할 필요가 없어지므로, 전송하는 출력 부호열의 데이터량을 삭감하여, 보다 효율적으로 부호화, 복호를 행할 수 있다.
[고정 길이 방식에 대해서]
다음에, 고정 길이 방식에 의한 고역 성분의 부호화에 대해서 설명한다.
고정 길이 방식에서는 도 3에 도시하는 바와 같이, 16프레임을 포함하는 처리 대상 구간이, 소정의 프레임수를 포함하는 구간(이하, 고정 길이 구간이라고 칭함)으로 등분할된다. 또한, 도 3에 있어서, 가로 방향은 시간을 나타내고 있고, 하나의 사각형은 하나의 프레임을 나타내고 있다. 또한, 프레임을 나타내는 사각형 내의 수치는, 그 프레임에 대해서 선택된 추정 계수를 특정하는 계수 인덱스의 값을 나타내고 있다. 또한, 도 3에 있어서, 도 2에 있어서의 경우와 대응하는 부분에는 동일한 부호를 부여하고 있고, 그 설명은 적절히 생략한다.
고정 길이 방식에 있어서는, 처리 대상 구간이 몇 개의 고정 길이 구간으로 분할된다. 이때, 고정 길이 구간의 길이는, 고정 길이 구간 내의 각 프레임에서 선택되어 있는 계수 인덱스가 동일하고, 또한 고정 길이 구간의 길이가 가장 길어지도록 정해진다.
도 3의 예에서는, 고정 길이 구간의 길이(이하, 간단히 고정 길이라고도 칭함)는, 4프레임으로 되어 있고, 처리 대상 구간은 4개의 고정 길이 구간으로 등분되어 있다. 즉, 처리 대상 구간은 위치 FST1로부터 위치 FC21까지의 구간, 위치 FC21로부터 위치 FC22까지의 구간, 위치 FC22로부터 위치 FC23까지의 구간 및 위치 FC23으로부터 위치 FSE1까지의 구간으로 분할된다. 이들의 고정 길이 구간에서의 계수 인덱스는, 처리 대상 구간의 선두의 고정 길이 구간으로부터 순서대로, 계수 인덱스 「1」, 「2」, 「2」, 「3」으로 되어 있다.
이와 같이 하여, 처리 대상 구간이 몇 개의 고정 길이 구간으로 분할되면, 처리 대상 구간 내의 고정 길이 구간의 고정 길이를 나타내는 고정 길이 인덱스, 계수 인덱스, 전환 플래그 및 방식 플래그를 포함하는 데이터가 생성된다.
여기서, 전환 플래그란, 고정 길이 구간의 경계 위치, 즉 소정의 고정 길이 구간의 마지막의 프레임과, 그 고정 길이 구간의 다음의 고정 길이 구간의 선두의 프레임에서, 계수 인덱스가 변화되었는지 여부를 나타내는 정보이다. 예를 들어, i번째(i=0, 1, 2, …)의 전환 플래그 gridflg_i는, 처리 대상 구간의 선두로부터 (i+1)번째와 (i+2)번째의 고정 길이 구간의 경계 위치에서, 계수 인덱스가 변화된 경우 「1」로 되고, 변화되지 않은 경우 「0」이 된다.
도 3의 예에서는, 처리 대상 구간의 1번째의 고정 길이 구간의 경계 위치(위치 FC21)의 전환 플래그 gridflg_0은, 1번째의 고정 길이 구간의 계수 인덱스 「1」과, 2번째의 고정 길이 구간의 계수 인덱스 「2」가 다르므로 「1」로 되어 있다. 또한, 위치 FC22의 전환 플래그 gridflg_1은, 2번째의 고정 길이 구간의 계수 인덱스 「2」와, 3번째의 고정 길이 구간의 계수 인덱스 「2」가 동일하므로 「0」으로 되어 있다.
또한, 고정 길이 인덱스의 값은, 고정 길이로부터 구해지는 값 등으로 된다. 구체적으로는, 예를 들어 고정 길이 인덱스 length_id는, 고정 길이 fixed_length=16/2length_id를 만족하는 값이 된다. 도 3의 예에서는, 고정 길이 fixed_length=4이므로, 고정 길이 인덱스 length_id=2로 되어 있다.
처리 대상 구간이 고정 길이 구간으로 분할되고, 고정 길이 인덱스, 계수 인덱스, 전환 플래그 및 방식 플래그를 포함하는 데이터가 생성되면, 이 데이터가 부호화되어 고역 부호화 데이터가 된다.
도 3의 예에서는, 위치 FC21 내지 위치 FC23에 있어서의 전환 플래그 gridflg_0=1, gridflg_1=0 및 gridflg_2=1과, 고정 길이 인덱스 length_id=2, 각 고정 길이 구간의 계수 인덱스 「1」, 「2」, 「3」 및 고정 길이 방식인 취지의 방식 플래그를 포함하는 데이터가 부호화되어, 고역 부호화 데이터가 된다.
여기서, 각 고정 길이 구간의 경계 위치의 전환 플래그는, 처리 대상 구간의 선두로부터 몇 번째에 있는 경계 위치의 전환 플래그인지를 특정할 수 있게 되어 있다. 바꾸어 말하면, 전환 플래그에는, 처리 대상 구간 내에서의 고정 길이 구간의 경계 위치를 특정하기 위한 정보도 포함되어 있다.
또한, 고역 부호화 데이터에 포함되는 각 계수 인덱스는, 그들의 계수 인덱스가 선택된 순번, 즉 고정 길이 구간이 늘어선 순서대로 배열되어 있다. 예를 들어, 도 3의 예에서는, 계수 인덱스 「1」, 「2」, 「3」의 순서로 배열되어, 그들의 계수 인덱스가 부호화 데이터에 포함된다.
또한, 도 3의 예에서는, 처리 대상 구간의 선두로부터 2번째와 3번째의 고정 길이 구간의 계수 인덱스가 「2」이지만, 고역 부호화 데이터에는, 계수 인덱스 「2」가 하나만 포함되게 된다. 연속하는 고정 길이 구간의 계수 인덱스가 동일한 경우, 즉 연속하는 고정 길이 구간의 경계 위치에 있어서의 전환 플래그가 0인 경우에는, 그들의 고정 길이 구간의 수만큼 동일한 계수 인덱스가 고역 부호화 데이터에 포함되는 것이 아니라, 하나의 계수 인덱스가 고역 부호화 데이터에 포함되게 된다.
이와 같이, 고정 길이 인덱스, 계수 인덱스, 전환 플래그 및 방식 플래그를 포함하는 데이터로부터 고역 부호화 데이터를 생성하면, 프레임마다 계수 인덱스를 송신할 필요가 없어지므로, 전송하는 출력 부호열의 데이터량을 삭감할 수 있다. 이에 의해, 보다 효율적으로 부호화, 복호를 행할 수 있다.
[추정 계수의 재이용에 대해서]
또한, 입력 신호의 부호화 시에 있어서는, 처리 대상으로 되어 있는 프레임의 추정 계수, 즉 계수 인덱스를 선택할 때에, 처리 대상의 프레임 직전의 프레임에서 선택된 계수 인덱스가 재이용 가능한지 여부가 판정되고, 적절히 재이용이 행해진다.
즉, 예를 들어 도 4에 도시하는 바와 같이, 처리 대상 구간 내의 최초의 프레임에서 계수 인덱스 「2」가 선택되었다고 하자. 또한, 도 4에 있어서, 가로 방향은 시간을 나타내고 있고, 하나의 사각형은 하나의 프레임을 나타내고 있다. 또한, 프레임을 나타내는 사각형 내의 수치는, 그 프레임의 추정 계수를 특정하는 계수 인덱스를 나타내고 있다.
처리 대상 구간 내의 최초의 프레임에서 계수 인덱스 「2」가 선택되면, 다음의 프레임의 계수 인덱스의 선택이 행해지지만, 이때 직전의 프레임의 계수 인덱스 「2」의 재이용이 가능한지 여부가 판정된다.
예를 들어, 현시점에서 처리 대상으로 되어 있는 처리 대상 구간의 2번째의 프레임에 대해서, 계수 인덱스 「2」에 의해 특정되는 추정 계수가 사용되고, 2번째의 프레임의 고역 성분이 추정되고, 그 추정 결과와 실제의 고역 성분이 비교된다.
그리고, 비교의 결과, 계수 인덱스 「2」에 의해 특정되는 추정 계수를 사용하여, 충분한 추정 정밀도로 고역 성분이 얻어지는 경우에는, 그 추정 계수의 계수 인덱스의 재이용이 가능하다고 판정되고, 2번째의 프레임의 계수 인덱스가 「2」로 된다. 도 4의 예에서는, 처리 대상 구간의 선두로부터 2번째의 프레임의 계수 인덱스는, 그 직전의 프레임의 계수 인덱스와 동일한 「2」로 되어 있다.
이에 반해, 추정에 의해 얻어진 고역 성분과, 실제의 고역 성분의 비교의 결과, 충분한 추정 정밀도로 고역 성분이 얻어지지 못한 경우에는, 미리 준비된 복수의 추정 계수 중 가장 적합한 추정 계수의 계수 인덱스가 선택된다.
예를 들어, 처리 대상 구간 내의 선두로부터 4번째의 프레임에서는, 그 직전의 프레임의 계수 인덱스의 재이용이 가능하지 않다고 판정되었으므로, 3번째의 프레임의 계수 인덱스 「2」와는 다른 계수 인덱스 「3」이 선택되어 있다.
이와 같이, 각 프레임에 대해서, 직전의 프레임의 계수 인덱스에 의해 특정되는 추정 계수를 사용해서 고역 성분의 추정을 행한 경우에, 충분한 추정 정밀도가 얻어질 때에는, 직전의 프레임의 계수 인덱스가 재이용된다. 이와 같은 계수 인덱스의 재이용에 의해, 프레임마다 선택되는 계수 인덱스가, 시간 방향으로 필요 이상으로 변화되는 것을 방지할 수 있다.
이에 의해, 연속 프레임 구간이 보다 길어지므로, 처리 대상 구간의 고역 부호화 데이터에 포함되는 계수 인덱스의 수 등을 보다 적게 할 수 있어, 고역 부호화 데이터의 데이터량을 보다 적게 할 수 있다.
또한, 추정 계수에 의해 고역 성분의 추정 오차 등의 특성이 다르므로, 계수 인덱스의 시간 방향에서의 변동이 필요 이상으로 많으면, 복호로 얻어지는 음성 신호에는 복호 전의 입력 신호에는 없는 부자연스러운 주파수 포락의 시간 변동이 발생하고, 청감상, 음질이 열화되어 버린다. 이와 같은 음질의 열화는, 고역 성분의 시간 변동이 적은 정상적인 음성 신호일수록 현저하다.
그러나, 본 기술과 같이, 충분한 추정 정밀도가 얻어지는 경우에 계수 인덱스를 재이용하면, 계수 인덱스가 필요 이상으로 변동하는 것을 방지할 수 있으므로, 복호로 얻어지는 음성의 고역 성분이 부자연스러운 변동을 억제하여, 음질을 향상시킬 수 있다.
<제1 실시 형태>
[부호화 장치의 구성예]
다음에, 이상에서 설명한 입력 신호의 부호화 기술의 구체적인 실시 형태에 대해서 설명한다. 우선, 입력 신호의 부호화를 행하는 부호화 장치의 구성에 대해서 설명한다. 도 5는, 부호화 장치의 구성예를 나타내는 도면이다.
부호화 장치(11)는 저역 통과 필터(31), 저역 부호화 회로(32), 서브 밴드 분할 회로(33), 특징량 산출 회로(34), 의사 고역 서브 밴드 파워 산출 회로(35), 의사 고역 서브 밴드 파워 차분 산출 회로(36), 고역 부호화 회로(37) 및 다중화 회로(38)로 구성된다. 부호화 장치(11)에서는, 부호화 대상의 입력 신호가 저역 통과 필터(31) 및 서브 밴드 분할 회로(33)에 공급된다.
저역 통과 필터(31)는 공급된 입력 신호를 소정의 차단 주파수에서 필터링하고, 그 결과 얻어진, 차단 주파수보다 저역의 신호(이하, 저역 신호라고 칭함)를, 저역 부호화 회로(32) 및 서브 밴드 분할 회로(33)에 공급한다.
저역 부호화 회로(32)는 저역 통과 필터(31)로부터의 저역 신호를 부호화하고, 그 결과 얻어진 저역 부호화 데이터를 다중화 회로(38)에 공급한다.
서브 밴드 분할 회로(33)는 저역 통과 필터(31)로부터의 저역 신호를 복수의 서브 밴드의 서브 밴드 신호(이하, 저역 서브 밴드 신호라고도 칭함)로 등분할하고, 이에 의해 얻어진 저역 서브 밴드 신호를 특징량 산출 회로(34)에 공급한다. 저역 서브 밴드 신호는 입력 신호의 저역측의 각 서브 밴드의 신호이다.
또한, 서브 밴드 분할 회로(33)는 공급된 입력 신호를 복수의 서브 밴드의 서브 밴드 신호로 등분할하고, 이에 의해 얻어진 서브 밴드 신호 중, 고역측의 소정의 대역에 포함되는 각 서브 밴드의 서브 밴드 신호를, 의사 고역 서브 밴드 파워 차분 산출 회로(36)에 공급한다. 또한, 이하, 서브 밴드 분할 회로(33)로부터 의사 고역 서브 밴드 파워 차분 산출 회로(36)에 공급되는 각 서브 밴드의 서브 밴드 신호를, 고역 서브 밴드 신호라고도 칭한다.
특징량 산출 회로(34)는 서브 밴드 분할 회로(33)로부터의 저역 서브 밴드 신호에 기초하여 특징량을 산출하고, 의사 고역 서브 밴드 파워 산출 회로(35) 및 의사 고역 서브 밴드 파워 차분 산출 회로(36)에 공급한다.
의사 고역 서브 밴드 파워 산출 회로(35)는 특징량 산출 회로(34)로부터의 특징량에 기초하여, 고역 서브 밴드 신호의 파워의 추정값(이하, 의사 고역 서브 밴드 파워라고도 칭함)을 산출하고, 의사 고역 서브 밴드 파워 차분 산출 회로(36)에 공급한다. 또한, 의사 고역 서브 밴드 파워 산출 회로(35)에는 통계 학습에 의해 얻어진 추정 계수의 세트가 복수 기록되어 있고, 의사 고역 서브 밴드 파워는 추정 계수와 특징량에 기초하여 산출된다.
의사 고역 서브 밴드 파워 차분 산출 회로(36)는 서브 밴드 분할 회로(33)로부터 공급된 고역 서브 밴드 신호의 파워(이하, 고역 서브 밴드 파워라고도 칭함)를 산출하고, 이것과, 의사 고역 서브 밴드 파워의 차분을 나타내는 의사 고역 서브 밴드 파워 차분의 제곱합을 산출한다.
의사 고역 서브 밴드 파워 차분 산출 회로(36)는 산출부(51), 판정부(52) 및 생성부(53)를 구비하고 있다.
산출부(51)는 처리 대상의 프레임 직전의 프레임에서 선택된 계수 인덱스에 의해 특정되는 추정 계수를 의사 고역 서브 밴드 파워 산출 회로(35)로부터 취득하고, 취득한 추정 계수와, 특징량 산출 회로(34)로부터의 특징량에 기초하여 의사 고역 서브 밴드 파워를 산출한다. 의사 고역 서브 밴드 파워 차분 산출 회로(36)는, 적절히, 산출부(51)에 의해 산출된 의사 고역 서브 밴드 파워 또는 의사 고역 서브 밴드 파워 산출 회로(35)로부터 공급된 의사 고역 서브 밴드 파워 중 어느 하나를 사용하여, 의사 고역 서브 밴드 파워 차분의 제곱합을 산출한다.
판정부(52)는 산출부(51)에 의해 산출된 의사 고역 서브 밴드 파워가 사용되어 산출된 의사 고역 서브 밴드 파워 차분의 제곱합에 기초하여, 계수 인덱스의 재이용이 가능한지 여부를 판정한다. 의사 고역 서브 밴드 파워 차분 산출 회로(36)는 의사 고역 서브 밴드 파워 차분의 제곱합과, 판정부(52)에 의한 판정 결과에 기초하여, 입력 신호의 프레임마다 계수 인덱스를 선택한다.
생성부(53)는 입력 신호의 처리 대상 구간의 각 프레임에서의 계수 인덱스의 선택 결과에 기초하여, 가변 길이 방식 또는 고정 길이 방식의 전환을 행하고, 선택된 방식에 의해 고역 부호화 데이터를 얻기 위한 데이터를 생성하고, 고역 부호화 회로(37)에 공급한다.
고역 부호화 회로(37)는 의사 고역 서브 밴드 파워 차분 산출 회로(36)로부터 공급된 데이터를 부호화하고, 그 결과 얻어지는 고역 부호화 데이터를 다중화 회로(38)에 공급한다. 다중화 회로(38)는 저역 부호화 회로(32)로부터의 저역 부호화 데이터와, 고역 부호화 회로(37)로부터의 고역 부호화 데이터를 다중화하고, 출력 부호열로서 출력한다.
[부호화 처리의 설명]
도 5에 도시한 부호화 장치(11)는 입력 신호가 공급되어, 입력 신호의 부호화가 지시되면 부호화 처리를 행하여, 복호 장치에 출력 부호열을 출력한다. 이하, 도 6 및 도 7의 흐름도를 참조하여, 부호화 장치(11)에 의한 부호화 처리에 대해서 설명한다. 또한, 이 부호화 처리는, 미리 정해진 프레임수, 즉 처리 대상 구간마다 행해진다.
스텝 S11에 있어서, 저역 통과 필터(31)는 공급된 처리 대상의 프레임의 입력 신호를 소정의 차단 주파수에서 필터링하고, 그 결과 얻어진 저역 신호를 저역 부호화 회로(32) 및 서브 밴드 분할 회로(33)에 공급한다.
스텝 S12에 있어서, 저역 부호화 회로(32)는 저역 통과 필터(31)로부터 공급된 저역 신호를 부호화하고, 그 결과 얻어진 저역 부호화 데이터를 다중화 회로(38)에 공급한다.
스텝 S13에 있어서, 서브 밴드 분할 회로(33)는 입력 신호 및 저역 신호를 소정의 대역 폭의 복수의 서브 밴드 신호로 등분할한다.
즉, 서브 밴드 분할 회로(33)는 공급된 입력 신호를 각 서브 밴드의 서브 밴드 신호로 분할하고, 이에 의해 얻어진 고역측의 서브 밴드 sb+1 내지 서브 밴드 eb의 각 서브 밴드 신호를 의사 고역 서브 밴드 파워 차분 산출 회로(36)에 공급한다.
또한, 서브 밴드 분할 회로(33)는 저역 통과 필터(31)로부터 공급된 저역 신호를 각 서브 밴드의 서브 밴드 신호로 분할하고, 이에 의해 얻어진 저역측의 서브 밴드 sb-3 내지 서브 밴드 sb의 각 서브 밴드 신호를 특징량 산출 회로(34)에 공급한다.
스텝 S14에 있어서, 특징량 산출 회로(34)는 서브 밴드 분할 회로(33)로부터 공급된 저역 서브 밴드 신호에 기초하여 특징량을 산출하고, 의사 고역 서브 밴드 파워 산출 회로(35) 및 의사 고역 서브 밴드 파워 차분 산출 회로(36)에 공급한다.
예를 들어, 특징량으로서 각 저역 서브 밴드 신호의 파워가 산출된다. 또한, 이하, 저역 서브 밴드 신호의 파워를 특히 저역 서브 밴드 파워라고도 칭하기로 한다. 또한, 저역 서브 밴드 신호나 고역 서브 밴드 신호 등, 각 서브 밴드의 서브 밴드 신호의 파워를, 적절히, 서브 밴드 파워라고도 칭하기로 한다.
구체적으로는, 특징량 산출 회로(34)는, 다음의 수학식 1을 계산함으로써, 데시벨로 표현되는 처리 대상의 프레임 J의 서브 밴드 ib(단, sb-3≤ib≤sb)의 서브 밴드 파워 power(ib, J)를 산출한다.
Figure pct00001
또한, 수학식 1에 있어서 x(ib, n)은, 서브 밴드 ib의 서브 밴드 신호의 값(샘플의 샘플값)을 나타내고 있고, x(ib, n)에 있어서의 n은, 이산 시간의 인덱스를 나타내고 있다. 또한, 수학식 1에 있어서의 FSIZE는, 1프레임을 구성하는 서브 밴드 신호의 샘플수를 나타내고 있다.
따라서, 프레임 J의 저역 서브 밴드 파워 power(ib, J)는, 프레임 J를 구성하는 저역 서브 밴드 신호의 각 샘플의 샘플값의 제곱 평균값을 대수화함으로써 산출된다. 또한, 이하에서는, 특징량 산출 회로(34)에 있어서, 특징량으로서 저역 서브 밴드 파워가 산출되는 것으로서 설명을 계속한다.
스텝 S15에 있어서, 산출부(51)는 특징량 산출 회로(34)로부터 공급된 특징량으로서의 저역 서브 밴드 파워와, 처리 대상으로 되어 있는 프레임 J의 직전의 프레임(J-1)에서 선택된 계수 인덱스에 기초하여, 의사 고역 서브 밴드 파워를 산출한다.
예를 들어, 산출부(51)는, 직전의 프레임(J-1)에서 선택된 계수 인덱스에 의해 특정되는 추정 계수의 세트를 의사 고역 서브 밴드 파워 산출 회로(35)로부터 취득한다.
그리고, 산출부(51)는, 취득한 추정 계수와, 저역 서브 밴드 파워 power(ib, J)로부터 다음의 수학식 2를 계산하고, 고역측의 각 서브 밴드의 의사 고역 서브 밴드 파워 powerest(ib, J)(단, sb+1≤ib≤eb)를 산출한다.
Figure pct00002
또한, 수학식 2에 있어서, 계수 Aib(kb) 및 계수 Bib는, 고역측의 서브 밴드 ib에 대해서 준비된 추정 계수의 세트를 나타내고 있다. 즉, 계수 Aib(kb)는, 서브 밴드 kb(단, sb-3≤kb≤sb)의 저역 서브 밴드 파워 power(kb, J)에 승산되는 계수이며, 계수 Bib는, 서브 밴드 kb의 서브 밴드 파워를 선형 결합할 때에 사용되는 상수항이다.
따라서, 고역측의 서브 밴드 ib의 의사 고역 서브 밴드 파워 powerest(ib, J)는, 저역측의 각 서브 밴드의 저역 서브 밴드 파워에, 서브 밴드마다의 계수 Aib(kb)를 승산하고, 계수가 승산된 저역 서브 밴드 파워의 합에, 또한 계수 Bib를 가산함으로써 얻어진다.
스텝 S16에 있어서, 의사 고역 서브 밴드 파워 차분 산출 회로(36)는, 서브 밴드 분할 회로(33)로부터 공급된 고역 서브 밴드 신호와, 산출부(51)에 의해 산출된 의사 고역 서브 밴드 파워에 기초하여, 의사 고역 서브 밴드 파워 차분을 산출한다.
보다 구체적으로는 의사 고역 서브 밴드 파워 차분 산출 회로(36)는, 서브 밴드 분할 회로(33)로부터의 고역 서브 밴드 신호에 대해서, 상술한 수학식 1과 마찬가지의 연산을 행하고, 프레임 J에 있어서의 고역 서브 밴드 파워 power(ib, J)(단, sb+1≤ib≤eb)를 산출한다.
그리고, 의사 고역 서브 밴드 파워 차분 산출 회로(36)는, 다음의 수학식 3을 계산함으로써, 고역 서브 밴드 파워 power(ib, J)와, 의사 고역 서브 밴드 파워 powerest(ib, J)의 차분인 의사 고역 서브 밴드 파워 차분 powerdiff(ib, J)를 산출한다.
Figure pct00003
스텝 S17에 있어서, 의사 고역 서브 밴드 파워 차분 산출 회로(36)는, 고역측의 각 서브 밴드 ib(단, sb+1≤ib≤eb)에 대해서 구한 의사 고역 서브 밴드 파워 차분을 사용해서 다음의 수학식 4를 계산하고, 의사 고역 서브 밴드 파워 차분의 제곱합을 산출한다.
Figure pct00004
또한, 수학식 4에 있어서, 차분 제곱합 E(J, id(J-1))은, 처리 대상의 프레임 J의 직전의 프레임(J-1)에서 선택된 계수 인덱스 id(J-1)에 의해 특정되는 추정 계수에 대해서 구해진, 프레임 J의 의사 고역 서브 밴드 파워 차분의 제곱합을 나타내고 있다.
또한, 수학식 4에 있어서, powerdiff(ib, J, id(J-1))은, 계수 인덱스 id(J-1)에 의해 특정되는 추정 계수에 대해서 구해진, 프레임 J의 고역측의 서브 밴드 ib의 의사 고역 서브 밴드 파워 차분 powerdiff(ib, J)를 나타내고 있다.
이와 같이 하여 얻어진 차분 제곱합 E(J, id(J-1))은, 실제의 고역 서브 밴드 신호로부터 산출된 프레임 J의 고역 서브 밴드 파워와, 직전의 프레임(J-1)에서 선택된 계수 인덱스에 의해 특정되는 추정 계수를 사용해서 산출된 의사 고역 서브 밴드 파워의 유사한 정도를 나타내고 있다.
즉, 고역 서브 밴드 파워의 참값에 대한 추정값의 오차를 나타내고 있다. 따라서, 차분 제곱합 E(J, id(J-1))이 작을수록, 추정 계수를 사용한 연산에 의해, 실제의 입력 신호의 고역 성분에, 보다 가까운 신호가 얻어지게 된다.
따라서, 프레임 J에 대해서 산출된 차분 제곱합 E(J, id(J-1))이 어느 정도 작은 경우에는, 프레임 J에 있어서, 직전의 프레임(J-1)에서 선택된 추정 계수를 사용해도 충분한 정밀도로 고역 성분의 추정을 행할 수 있을 것이다. 즉, 직전의 프레임(J-1)의 추정 계수(계수 인덱스)의 재이용이 가능하다.
이에 반해, 차분 제곱합 E(J, id(J-1))이 크면, 실제의 입력 신호의 고역 성분과, 추정에 의해 얻어진 고역 성분의 오차가 크고, 복호 시에 청감상의 음질의 열화가 발생할 우려가 있다. 따라서 이와 같은 경우, 계수 인덱스의 재이용은 해서는 안 된다.
스텝 S18에 있어서, 판정부(52)는, 스텝 S17의 처리에서 산출된 차분 제곱합 E(J, id(J-1))에 기초하여, 계수 인덱스를 재이용하는지 여부를 판정한다. 예를 들어, 차분 제곱합 E(J, id(J-1))이 소정의 임계값 이하인 경우, 재이용한다고 판정된다. 예를 들어, 임계값은 「3」 등의 미리 정해진 값이 된다.
스텝 S18에 있어서, 계수 인덱스의 재이용이 가능하다고 판정된 경우, 스텝 S19에 있어서, 의사 고역 서브 밴드 파워 차분 산출 회로(36)는, 직전의 프레임(J-1)에서 선택된 계수 인덱스를, 프레임 J의 계수 인덱스로서 선택한다. 즉, 계수 인덱스(추정 계수)가 재이용되게 된다.
프레임 J의 계수 인덱스가 선택되면, 그 후, 처리는 스텝 S24로 진행한다. 또한, 스텝 S19에 있어서 선택된 프레임 J의 계수 인덱스는, 다음의 프레임(J+1)에 대해서 행해지는 스텝 S15의 처리에 있어서, 처리 대상의 프레임 직전의 프레임에서 선택된 계수 인덱스로서 사용된다.
이에 반해, 스텝 S18에 있어서, 계수 인덱스를 재이용하지 않는다고 판정된 경우, 스텝 S20에 있어서, 의사 고역 서브 밴드 파워 산출 회로(35)는 특징량 산출 회로(34)로부터 공급된 특징량에 기초하여, 의사 고역 서브 밴드 파워를 산출한다.
구체적으로는 의사 고역 서브 밴드 파워 산출 회로(35)는, 미리 기록하고 있는 추정 계수마다, 상술한 수학식 2의 연산을 행해서 의사 고역 서브 밴드 파워 powerest(ib, J)를 산출하고, 의사 고역 서브 밴드 파워 차분 산출 회로(36)에 공급한다. 예를 들어, 계수 인덱스가 1 내지 K(단, 2≤K)의 K개의 추정 계수의 세트가 미리 준비되어 있는 경우, K개의 추정 계수의 세트에 대해서, 각 서브 밴드의 의사 고역 서브 밴드 파워가 산출된다.
스텝 S21에 있어서, 의사 고역 서브 밴드 파워 차분 산출 회로(36)는 서브 밴드 분할 회로(33)로부터의 고역 서브 밴드 신호와, 의사 고역 서브 밴드 파워 산출 회로(35)로부터의 의사 고역 서브 밴드 파워에 기초하여, 의사 고역 서브 밴드 파워 차분을 산출한다. 그리고, 스텝 S22에 있어서, 의사 고역 서브 밴드 파워 차분 산출 회로(36)는 추정 계수마다 의사 고역 서브 밴드 파워 차분의 제곱합을 산출한다.
또한, 스텝 S21 및 스텝 S22에서는, 상술한 스텝 S16 및 스텝 S17과 마찬가지의 처리가 행해진다. 이에 의해, K개의 추정 계수의 세트마다 의사 고역 서브 밴드 파워 차분의 제곱합(차분 제곱합)이 산출된다.
스텝 S23에 있어서, 의사 고역 서브 밴드 파워 차분 산출 회로(36)는, K개의 추정 계수의 세트마다의 차분 제곱합 중, 값이 최소가 되는 차분 제곱합에 대응하는 추정 계수를 나타내는 계수 인덱스를, 프레임 J의 계수 인덱스로서 선택한다.
여기서, 값이 최소가 되는 차분 제곱합의 산출에 사용된 추정 계수는, 실제의 입력 신호의 고역 성분과, 추정 계수를 사용한 추정에 의해 얻어지는 고역 성분의 오차가 최소가 되는 추정 계수이다. 이와 같이, 추정 계수(계수 인덱스)를 재이용할 수 없는 경우에는, 미리 기록되어 있는 추정 계수의 세트 중, 처리 대상의 프레임에 가장 적합한 추정 계수의 세트가 선택된다. 계수 인덱스가 선택되면, 그 후, 처리는 스텝 S24로 진행한다.
스텝 S19 또는 스텝 S23에 있어서, 처리 대상의 프레임 J에 대한 계수 인덱스가 선택되면, 스텝 S24에 있어서, 의사 고역 서브 밴드 파워 차분 산출 회로(36)는, 소정 프레임 길이만큼 처리를 행하였는지 여부를 판정한다. 즉, 처리 대상 구간을 구성하는 모든 프레임에 대해서, 계수 인덱스가 선택되었는지 여부가 판정된다.
스텝 S24에 있어서, 소정 프레임 길이만큼 처리를 행하지 않았다고 판정된 경우, 처리는 스텝 S11로 복귀되고, 상술한 처리가 반복된다. 즉, 처리 대상 구간의 아직 처리 대상으로 되지 않은 프레임이, 다음의 처리 대상이 프레임으로 되어, 그 프레임의 계수 인덱스가 선택된다.
이에 반해 스텝 S24에 있어서, 소정 프레임 길이만큼 처리를 행하였다고 판정된 경우, 처리는 스텝 S25로 진행한다.
스텝 S25에 있어서, 생성부(53)는 고역 부호화 데이터를 생성하는 방식을, 고정 길이 방식으로 할 것인지 여부를 판정한다.
즉, 생성부(53)는 처리 대상 구간에서의 각 프레임의 계수 인덱스의 선택 결과에 기초하여, 고정 길이 방식에 의해 생성하였을 때의 고역 부호화 데이터와, 가변 길이 방식에 의해 생성하였을 때의 고역 부호화 데이터의 부호량을 비교한다. 그리고, 생성부(53)는 고정 길이 방식의 고역 부호화 데이터의 부호량이, 가변 길이 방식의 고역 부호화 데이터의 부호량보다도 적은 경우, 고정 길이 방식으로 한다고 판정한다.
스텝 S25에 있어서, 고정 길이 방식으로 한다고 판정된 경우, 처리는 스텝 S26으로 진행한다. 스텝 S26에 있어서, 생성부(53)는 고정 길이 방식이 선택된 취지의 방식 플래그, 고정 길이 인덱스, 계수 인덱스 및 전환 플래그를 포함하는 데이터를 생성하고, 고역 부호화 회로(37)에 공급한다.
예를 들어, 도 3의 예에서는, 생성부(53)는 고정 길이를 4프레임으로서, 위치 FST1로부터 위치 FSE1까지의 처리 대상 구간을, 4개의 고정 길이 구간으로 분할한다. 그리고, 생성부(53)는 고정 길이 인덱스 「2」, 계수 인덱스 「1」, 「2」, 「3」, 전환 플래그 「1」, 「0」, 「1」 및 방식 플래그를 포함하는 데이터를 생성한다.
또한, 도 3에서는 처리 대상 구간의 선두로부터 2번째와 3번째의 고정 길이 구간의 계수 인덱스는 모두 「2」이지만, 이들의 고정 길이 구간은 연속해서 배열되어 있으므로, 생성부(53)로부터 출력되는 데이터에는, 계수 인덱스 「2」가 하나만 포함되게 된다.
스텝 S27에 있어서, 고역 부호화 회로(37)는 생성부(53)로부터 공급된, 방식 플래그, 고정 길이 인덱스, 계수 인덱스 및 전환 플래그를 포함하는 데이터를 부호화하고, 고역 부호화 데이터를 생성한다. 예를 들어, 필요에 따라서, 방식 플래그, 고정 길이 인덱스, 계수 인덱스 및 전환 플래그 중 일부 또는 전부의 정보에 대하여 엔트로피 부호화 등이 행해진다.
고역 부호화 회로(37)는 생성한 고역 부호화 데이터를 다중화 회로(38)에 공급하고, 그 후, 처리는 스텝 S30으로 진행한다.
이에 반해, 스텝 S25에 있어서, 고정 길이 방식으로 하지 않는다고 판정된 경우, 즉 가변 길이 방식으로 한다고 판정된 경우, 처리는 스텝 S28로 진행한다. 스텝 S28에 있어서, 생성부(53)는 가변 길이 방식이 선택된 취지의 방식 플래그, 계수 인덱스, 구간 정보 및 개수 정보를 포함하는 데이터를 생성하고, 고역 부호화 회로(37)에 공급한다.
예를 들어, 도 2의 예에서는, 생성부(53)는 위치 FST1로부터 위치 FSE1까지의 처리 대상 구간을, 3개의 연속 프레임 구간으로 분할한다. 그리고, 생성부(53)는 가변 길이 방식이 선택된 취지의 방식 플래그 및 연속 프레임 구간의 개수 「3」을 나타내는 개수 정보 「num_length=3」과, 각 연속 프레임 구간의 길이를 나타내는 구간 정보 「length0=5」 및 「length1=7」 및 그들의 연속 프레임 구간의 계수 인덱스 「2」, 「5」 및 「1」를 포함하는 데이터를 생성한다.
또한, 각 연속 프레임 구간의 계수 인덱스는 구간 정보와 대응지어져, 어느 연속 프레임 구간의 계수 인덱스인지를 특정할 수 있게 된다. 또한, 도 2의 예에서는, 처리 대상 구간의 선두와, 그 다음의 연속 프레임 구간의 구간 정보로부터, 처리 대상 구간의 마지막의 연속 프레임 구간을 구성하는 프레임수가 특정 가능하므로, 마지막의 연속 프레임 구간에 대해서는 구간 정보가 생성되어 있지 않다.
스텝 S29에 있어서, 고역 부호화 회로(37)는 생성부(53)로부터 공급된, 방식 플래그, 계수 인덱스, 구간 정보 및 개수 정보를 포함하는 데이터를 부호화하고, 고역 부호화 데이터를 생성한다.
예를 들어, 스텝 S29에서는, 방식 플래그, 계수 인덱스, 구간 정보 및 개수 정보 중 일부 또는 전부의 정보에 대하여 엔트로피 부호화 등이 행해진다. 또한, 고역 부호화 데이터는, 최적의 추정 계수가 얻어지는 정보이면, 어떤 정보이어도 좋고, 예를 들어 방식 플래그, 계수 인덱스, 구간 정보 및 개수 정보를 포함하는 데이터가 그대로 고역 부호화 데이터로 되어도 좋다. 마찬가지로, 상술한 스텝 S27에 있어서도, 계수 인덱스 등의 데이터가 그대로 고역 부호화 데이터로 되어도 좋다.
고역 부호화 회로(37)는 생성한 고역 부호화 데이터를 다중화 회로(38)에 공급하고, 그 후, 처리는 스텝 S30으로 진행한다.
스텝 S27 또는 스텝 S29에 있어서, 고역 부호화 데이터가 생성되면, 스텝 S30에 있어서, 다중화 회로(38)는 저역 부호화 회로(32)로부터 공급된 저역 부호화 데이터와, 고역 부호화 회로(37)로부터 공급된 고역 부호화 데이터를 다중화한다. 그리고, 다중화 회로(38)는 다중화에 의해 얻어진 출력 부호열을 출력하고, 부호화 처리는 종료한다.
이상과 같이 하여 부호화 장치(11)는, 각 프레임의 계수 인덱스를 선택하는 경우에, 직전의 프레임의 계수 인덱스가 재이용 가능한지 여부를 판정하고, 그 판정 결과에 따라서 계수 인덱스를 재이용한다. 또한, 부호화 장치(11)는 선택된 계수 인덱스를 포함하는 데이터를 부호화하고, 고역 부호화 데이터로 한다.
이와 같이, 계수 인덱스를 포함하는 데이터를 부호화하고, 고역 부호화 데이터로 함으로써, 스케일 팩터 등의 고역의 추정 연산에 사용되는 데이터 그 자체를 부호화하는 경우와 비교하여, 고역 부호화 데이터의 부호량을 보다 적게 할 수 있다.
게다가, 필요에 따라서 계수 인덱스의 재이용을 행함으로써, 계수 인덱스가 시간 방향으로 필요 이상으로 변화되는 것을 방지할 수 있어, 고역 부호화 데이터의 부호량을 더 적게 할 수 있음과 함께, 복호로 얻어지는 음성의 음질을 향상시킬 수 있다.
또한, 고정 길이 방식과 가변 길이 방식 중, 보다 부호량이 적어지는 방식을 처리 대상 구간마다 선택하여 고역 부호화 데이터를 생성함으로써, 보다 출력 부호열의 부호량을 저감시킬 수 있어, 보다 효율적으로 음성의 부호화나 복호를 행할 수 있다.
또한, 이상에서는, 계수 인덱스의 재이용이 가능한지 여부를 판정하기 위해, 차분 제곱합 E(J, id(J-1))을 이용하는 예에 대해서 설명하였지만, 실제의 고역 성분과 추정에 의해 얻어진 고역 성분의 비교 결과를 나타내는 것이면, 어떠한 것이 사용되어도 좋다.
예를 들어, 고역측의 각 서브 밴드 ib(단, sb+1≤ib≤eb)에 대해서, 고역 서브 밴드 파워 power(ib, J)와, 의사 고역 서브 밴드 파워 powerest(ib, J)의 차분을 구하고, 그들 차분의 제곱 평균값인 잔차 제곱 평균값 Resstd가 재이용 가능한지 여부의 판정에 사용되어도 좋다.
또한, 고역측의 각 서브 밴드 ib의 고역 서브 밴드 파워와, 의사 고역 서브 밴드 파워의 차분의 절댓값 중 최대값인 잔차 최대값 Resmax나, 각 서브 밴드 ib의 고역 서브 밴드 파워와, 의사 고역 서브 밴드 파워의 차분의 평균값의 절댓값인 잔차 평균값 Resave가 이용되어도 좋다.
그 외, 상술한 잔차 제곱 평균값 Resstd, 잔차 최대값 Resmax 및 잔차 평균값 Resave를 소정의 가중치(중량)로 가중치 부여 가산(선형 결합)하여 얻어지는 평가값 Res가, 계수 인덱스의 재이용이 가능한지 여부의 판정에 이용되어도 좋다. 이 평가값 Res는, 그 값이 클수록, 실제의 고역 성분과, 추정 계수에 의한 추정에 의해 얻어진 고역 성분의 오차가 작게 된다.
이 경우, 의사 고역 서브 밴드 파워 차분 산출 회로(36)는 처리 대상의 프레임 J에 있어서, 직전의 프레임(J-1)에서 선택된 계수 인덱스에 의해 특정되는 추정 계수를 사용해서 평가값 Res를 산출한다. 그리고, 판정부(52)는 얻어진 평가값 Res와 임계값(예를 들어, 10 등)을 비교하고, 평가값 Res가 임계값 이하인 경우, 계수 인덱스의 재이용이 가능하다고 한다. 이 경우, 프레임(J-1)의 계수 인덱스가, 프레임 J의 계수 인덱스로서도 선택(채용)되게 된다.
[복호 장치의 구성]
다음에 부호화 장치(11)로부터 출력된 출력 부호열의 공급을 받아, 출력 부호열의 복호를 행하는 복호 장치에 대해서 설명한다.
그와 같은 복호 장치는, 예를 들어 도 8에 도시하는 바와 같이 구성된다.
복호 장치(81)는 비다중화 회로(91), 저역 복호 회로(92), 서브 밴드 분할 회로(93), 특징량 산출 회로(94), 고역 복호 회로(95), 복호 고역 서브 밴드 파워 산출 회로(96), 복호 고역 신호 생성 회로(97) 및 합성 회로(98)로 구성된다.
비다중화 회로(91)는 부호화 장치(11)로부터 수신한 출력 부호열을 입력 부호열로서, 입력 부호열을 고역 부호화 데이터와 저역 부호화 데이터로 비다중화한다. 또한, 비다중화 회로(91)는 비다중화에 의해 얻어진 저역 부호화 데이터를 저역 복호 회로(92)에 공급하고, 비다중화에 의해 얻어진 고역 부호화 데이터를 고역 복호 회로(95)에 공급한다.
저역 복호 회로(92)는 비다중화 회로(91)로부터의 저역 부호화 데이터를 복호하고, 그 결과 얻어진 입력 신호의 복호 저역 신호를, 서브 밴드 분할 회로(93) 및 합성 회로(98)에 공급한다.
서브 밴드 분할 회로(93)는 저역 복호 회로(92)로부터의 복호 저역 신호를, 소정의 대역 폭을 갖는 복수의 저역 서브 밴드 신호로 등분할하고, 얻어진 저역 서브 밴드 신호를 특징량 산출 회로(94) 및 복호 고역 신호 생성 회로(97)에 공급한다.
특징량 산출 회로(94)는 서브 밴드 분할 회로(93)로부터의 저역 서브 밴드 신호에 기초하여, 저역측의 각 서브 밴드의 저역 서브 밴드 파워를 특징량으로서 산출하고, 복호 고역 서브 밴드 파워 산출 회로(96)에 공급한다.
고역 복호 회로(95)는 비다중화 회로(91)로부터의 고역 부호화 데이터를 복호하고, 그 결과 얻어진 데이터와, 그 데이터에 포함되는 계수 인덱스에 의해 특정되는 추정 계수를 복호 고역 서브 밴드 파워 산출 회로(96)에 공급한다. 즉, 고역 복호 회로(95)에는 미리 복수의 계수 인덱스와, 그 계수 인덱스에 의해 특정되는 추정 계수가 대응지어져 기록되어 있고, 고역 복호 회로(95)는 고역 부호화 데이터에 포함되는 계수 인덱스에 대응하는 추정 계수를 출력한다.
복호 고역 서브 밴드 파워 산출 회로(96)는 고역 복호 회로(95)로부터의 데이터 및 추정 계수와, 특징량 산출 회로(94)로부터의 저역 서브 밴드 파워에 기초하여, 프레임마다 고역측의 각 서브 밴드의 서브 밴드 파워의 추정값인 복호 고역 서브 밴드 파워를 산출한다. 예를 들어, 상술한 수학식 2와 마찬가지의 연산이 행해져, 복호 고역 서브 밴드 파워가 산출된다. 복호 고역 서브 밴드 파워 산출 회로(96)는 산출한 각 서브 밴드의 복호 고역 서브 밴드 파워를 복호 고역 신호 생성 회로(97)에 공급한다.
복호 고역 신호 생성 회로(97)는 서브 밴드 분할 회로(93)로부터의 저역 서브 밴드 신호와, 복호 고역 서브 밴드 파워 산출 회로(96)로부터의 복호 고역 서브 밴드 파워에 기초하여 복호 고역 신호를 생성하고, 합성 회로(98)에 공급한다.
구체적으로는, 복호 고역 신호 생성 회로(97)는 저역 서브 밴드 신호의 저역 서브 밴드 파워를 산출하고, 복호 고역 서브 밴드 파워와 저역 서브 밴드 파워의 비에 따라서 저역 서브 밴드 신호를 진폭 변조한다. 또한, 복호 고역 신호 생성 회로(97)는 진폭 변조된 저역 서브 밴드 신호를 주파수 변조함으로써, 고역측의 각 서브 밴드의 복호 고역 서브 밴드 신호를 생성한다. 이와 같이 하여 얻어진 복호 고역 서브 밴드 신호는 입력 신호의 고역측의 각 서브 밴드의 고역 서브 밴드 신호의 추정값이다. 복호 고역 신호 생성 회로(97)는 얻어진 각 서브 밴드의 복호 고역 서브 밴드 신호로 이루어지는 복호 고역 신호를 합성 회로(98)에 공급한다.
합성 회로(98)는 저역 복호 회로(92)로부터의 복호 저역 신호와, 복호 고역 신호 생성 회로(97)로부터의 복호 고역 신호를 합성하고, 출력 신호로서 출력한다. 이 출력 신호는 부호화된 입력 신호를 복호하여 얻어지는 신호이며, 고역 성분과 저역 성분으로 이루어지는 신호이다.
또한, 상술한 일련의 처리는, 하드웨어에 의해 실행할 수도 있고, 소프트웨어에 의해 실행할 수도 있다. 일련의 처리를 소프트웨어에 의해 실행하는 경우에는, 그 소프트웨어를 구성하는 프로그램이, 전용의 하드웨어에 내장되어 있는 컴퓨터, 또는, 각종의 프로그램을 인스톨함으로써, 각종의 기능을 실행하는 것이 가능한, 예를 들어 범용의 퍼스널 컴퓨터 등에, 프로그램 기록 매체로부터 인스톨된다.
도 9는, 상술한 일련의 처리를 프로그램에 의해 실행하는 컴퓨터의 하드웨어의 구성예를 나타내는 블록도이다.
컴퓨터에 있어서, CPU(Central Processing Unit)(301), ROM(Read Only Memory)(302), RAM(Random Access Memory)(303)은 버스(304)에 의해 서로 접속되어 있다.
버스(304)에는, 또한, 입출력 인터페이스(305)가 접속되어 있다. 입출력 인터페이스(305)에는 키보드, 마우스, 마이크로폰 등으로 이루어지는 입력부(306), 디스플레이, 스피커 등으로 이루어지는 출력부(307), 하드 디스크나 불휘발성이 메모리 등으로 이루어지는 기록부(308), 네트워크 인터페이스 등으로 이루어지는 통신부(309), 자기 디스크, 광디스크, 광자기 디스크, 혹은 반도체 메모리 등의 리무버블 미디어(311)를 구동하는 드라이브(310)가 접속되어 있다.
이상과 같이 구성되는 컴퓨터에서는, CPU(301)가, 예를 들어 기록부(308)에 기록되어 있는 프로그램을, 입출력 인터페이스(305) 및 버스(304)를 통하여, RAM(303)에 로드하여 실행함으로써, 상술한 일련의 처리가 행해진다.
컴퓨터[CPU(301)]가 실행하는 프로그램은, 예를 들어 자기 디스크(플렉시블 디스크를 포함함), 광디스크[CD-ROM(Compact Disc-Read Only Memory), DVD(Digital Versatile Disc) 등], 광자기 디스크, 혹은 반도체 메모리 등으로 이루어지는 패키지 미디어인 리무버블 미디어(311)에 기록하거나, 혹은, 근거리 네트워크, 인터넷, 디지털 위성 방송 등의, 유선 또는 무선의 전송 매체를 통하여 제공된다.
그리고, 프로그램은 리무버블 미디어(311)를 드라이브(310)에 장착함으로써, 입출력 인터페이스(305)를 통하여, 기록부(308)에 인스톨할 수 있다. 또한, 프로그램은 유선 또는 무선의 전송 매체를 통하여, 통신부(309)에서 수신하고, 기록부(308)에 인스톨할 수 있다. 그 외, 프로그램은 ROM(302)이나 기록부(308)에, 미리 인스톨해 둘 수 있다.
또한, 컴퓨터가 실행하는 프로그램은, 본 명세서에서 설명하는 순서를 따라서 시계열로 처리가 행해지는 프로그램이어도 좋고, 병렬로, 혹은 호출이 행해졌을 때 등의 필요한 타이밍에 처리가 행해지는 프로그램이어도 좋다.
또한, 본 기술의 실시 형태는, 상술한 실시 형태에 한정되는 것이 아니라, 본 기술의 요지를 일탈하지 않는 범위에서 다양한 변경이 가능하다.
또한, 본 기술은, 이하가 구성으로 하는 것도 가능하다.
[1]
입력 신호의 대역 분할을 행하여, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하는 서브 밴드 분할부와,
상기 입력 신호의 저역 신호로부터 얻어진 특징량과, 미리 준비된 복수의 추정 계수 중 상기 입력 신호의 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수에 기초하여, 상기 처리 대상의 프레임의 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하는 산출부와,
상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 신호로부터 얻어진 상기 고역 서브 밴드 파워에 기초하여, 상기 처리 대상의 프레임에서, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하게 된 경우, 상기 재이용 가능하게 된 상기 추정 계수를 얻기 위한 데이터를 생성하는 생성부와,
상기 저역 신호를 부호화하여 저역 부호화 데이터를 생성하는 저역 부호화부와,
상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는 다중화부
를 구비하는 부호화 장치.
[2]
상기 복수의 추정 계수마다, 상기 특징량과 상기 추정 계수에 기초하여 상기 의사 고역 서브 밴드 파워를 산출하는 의사 고역 서브 밴드 파워 산출부와,
상기 의사 고역 서브 밴드 파워 산출부에 의해 산출된 상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 파워를 비교하고, 상기 복수의 추정 계수 중 어느 하나를 선택하는 선택부를 더 구비하고,
상기 생성부는, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하지 않게 된 경우, 상기 선택부에 의해 선택된 상기 추정 계수를 얻기 위한 상기 데이터를 생성하는
[1]에 기재된 부호화 장치.
[3]
상기 데이터를 부호화하여 고역 부호화 데이터를 생성하는 고역 부호화부를 더 구비하고,
상기 다중화부는, 상기 고역 부호화 데이터와 상기 저역 부호화 데이터를 다중화하여 상기 출력 부호열을 생성하는
[1] 또는 [2]에 기재된 부호화 장치.
[4]
고역측의 서브 밴드의 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워의 차분의 제곱합이 소정의 임계값 이하인 경우, 상기 추정 계수가 재이용 가능하게 되는
[1] 내지 [3] 중 어느 하나에 기재된 부호화 장치.
[5]
고역측의 서브 밴드의 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여 산출된, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워의 유사한 정도를 나타내는 평가값과 소정의 임계값의 비교 결과에 따라서, 상기 추정 계수가 재이용 가능하게 되는
[1] 내지 [3] 중 어느 하나에 기재된 부호화 장치.
[6]
상기 생성부는, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에 대하여, 하나의 상기 데이터를 생성하는
[1] 내지 [5] 중 어느 하나에 기재된 부호화 장치.
[7]
상기 데이터에는, 상기 처리 대상 구간에서, 동일한 상기 추정 계수가 선택된 연속하는 프레임을 포함하는 구간을 특정하기 위한 정보가 포함되어 있는
[6]에 기재된 부호화 장치.
[8]
상기 데이터에는, 상기 추정 계수를 특정하기 위한 정보가 상기 구간에 대하여 하나 포함되어 있는
[7]에 기재된 부호화 장치.
[9]
입력 신호의 대역 분할을 행하여, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하고,
상기 입력 신호의 저역 신호로부터 얻어진 특징량과, 미리 준비된 복수의 추정 계수 중 상기 입력 신호의 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수에 기초하여, 상기 처리 대상의 프레임의 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하고,
상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 신호로부터 얻어진 상기 고역 서브 밴드 파워에 기초하여, 상기 처리 대상의 프레임에서, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하게 된 경우, 상기 재이용 가능하게 된 상기 추정 계수를 얻기 위한 데이터를 생성하고,
상기 저역 신호를 부호화하여 저역 부호화 데이터를 생성하고,
상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는
스텝을 포함하는 부호화 방법.
[10]
입력 신호의 대역 분할을 행하여, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하고,
상기 입력 신호의 저역 신호로부터 얻어진 특징량과, 미리 준비된 복수의 추정 계수 중 상기 입력 신호의 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수에 기초하여, 상기 처리 대상의 프레임의 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하고,
상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 신호로부터 얻어진 상기 고역 서브 밴드 파워에 기초하여, 상기 처리 대상의 프레임에서, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하게 된 경우, 상기 재이용 가능하게 된 상기 추정 계수를 얻기 위한 데이터를 생성하고,
상기 저역 신호를 부호화하여 저역 부호화 데이터를 생성하고,
상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는
스텝을 포함하는 처리를 컴퓨터에 실행시키는 프로그램.
[11]
입력 신호의 처리 대상의 프레임에서의 고역 서브 밴드 파워와, 미리 준비된 복수의 추정 계수 중 상기 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수 및 상기 입력 신호의 특징량에 기초하여 산출된 상기 처리 대상의 프레임의 상기 고역 서브 밴드 파워의 추정값에 기초하여, 상기 처리 대상의 프레임에서 상기 직전의 프레임의 상기 추정 계수가 재이용 가능한지 여부가 판정되고, 그 판정 결과에 따라서 생성된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하는 비다중화부와,
상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하는 저역 복호부와,
상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하는 고역 신호 생성부와,
상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는 합성부
를 구비하는 복호 장치.
[12]
상기 직전의 프레임의 상기 추정 계수가 재이용 가능하지 않다고 판정된 경우, 상기 입력 부호열에 포함되는 상기 데이터는, 상기 복수의 추정 계수마다 상기 고역 서브 밴드 파워의 상기 추정값이 산출되고, 산출된 상기 추정값과 상기 고역 서브 밴드 파워의 비교에 의해, 상기 복수의 추정 계수 중에서 선택된 상기 추정 계수를 얻기 위한 상기 데이터가 되는
[11]에 기재된 복호 장치.
[13]
상기 데이터를 복호하는 데이터 복호부를 더 구비하는
[11] 또는 [12]에 기재된 복호 장치.
[14]
상기 추정값과 상기 고역 서브 밴드 파워의 차분의 제곱합이 소정의 임계값 이하인 경우, 상기 추정 계수가 재이용 가능하다고 판정되는
[11] 내지 [13] 중 어느 하나에 기재된 복호 장치.
[15]
상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에 대하여, 하나의 상기 데이터가 생성되는
[11] 내지 [14] 중 어느 하나에 기재된 복호 장치.
[16]
상기 데이터에는, 상기 처리 대상 구간에서, 동일한 상기 추정 계수가 선택된 연속하는 프레임을 포함하는 구간을 특정하기 위한 정보가 포함되어 있는
[15]에 기재된 복호 장치.
[17]
상기 데이터에는, 상기 추정 계수를 특정하기 위한 정보가 상기 구간에 대하여 하나 포함되어 있는
[16]에 기재된 복호 장치.
[18]
입력 신호의 처리 대상의 프레임에서의 고역 서브 밴드 파워와, 미리 준비된 복수의 추정 계수 중 상기 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수 및 상기 입력 신호의 특징량에 기초하여 산출된 상기 처리 대상의 프레임의 상기 고역 서브 밴드 파워의 추정값에 기초하여, 상기 처리 대상의 프레임에서 상기 직전의 프레임의 상기 추정 계수가 재이용 가능한지 여부가 판정되고, 그 판정 결과에 따라서 생성된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하고,
상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하고,
상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하고,
상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는
스텝을 포함하는 복호 방법.
[19]
입력 신호의 처리 대상의 프레임에서의 고역 서브 밴드 파워와, 미리 준비된 복수의 추정 계수 중 상기 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수 및 상기 입력 신호의 특징량에 기초하여 산출된 상기 처리 대상의 프레임의 상기 고역 서브 밴드 파워의 추정값에 기초하여, 상기 처리 대상의 프레임에서 상기 직전의 프레임의 상기 추정 계수가 재이용 가능한지 여부가 판정되고, 그 판정 결과에 따라서 생성된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하고,
상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하고,
상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하고,
상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는
스텝을 포함하는 처리를 컴퓨터에 실행시키는 프로그램.
11 : 부호화 장치
32 : 저역 부호화 회로
33 : 서브 밴드 분할 회로
34 : 특징량 산출 회로
35 : 의사 고역 서브 밴드 파워 산출 회로
36 : 의사 고역 서브 밴드 파워 차분 산출 회로
37 : 고역 부호화 회로
38 : 다중화 회로
51 : 산출부
52 : 판정부
53 : 생성부

Claims (19)

  1. 입력 신호의 대역 분할을 행하여, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하는 서브 밴드 분할부와,
    상기 입력 신호의 저역 신호로부터 얻어진 특징량과, 미리 준비된 복수의 추정 계수 중 상기 입력 신호의 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수에 기초하여, 상기 처리 대상의 프레임의 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사(擬似) 고역 서브 밴드 파워를 산출하는 산출부와,
    상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 신호로부터 얻어진 상기 고역 서브 밴드 파워에 기초하여, 상기 처리 대상의 프레임에서, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하게 된 경우, 상기 재이용 가능하게 된 상기 추정 계수를 얻기 위한 데이터를 생성하는 생성부와,
    상기 저역 신호를 부호화하여 저역 부호화 데이터를 생성하는 저역 부호화부와,
    상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는 다중화부를 구비하는, 부호화 장치.
  2. 제1항에 있어서,
    상기 복수의 추정 계수마다, 상기 특징량과 상기 추정 계수에 기초하여 상기 의사 고역 서브 밴드 파워를 산출하는 의사 고역 서브 밴드 파워 산출부와,
    상기 의사 고역 서브 밴드 파워 산출부에 의해 산출된 상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 파워를 비교하고, 상기 복수의 추정 계수 중 어느 하나를 선택하는 선택부를 더 구비하고,
    상기 생성부는, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하지 않게 된 경우, 상기 선택부에 의해 선택된 상기 추정 계수를 얻기 위한 상기 데이터를 생성하는, 부호화 장치.
  3. 제2항에 있어서,
    상기 데이터를 부호화하여 고역 부호화 데이터를 생성하는 고역 부호화부를 더 구비하고,
    상기 다중화부는, 상기 고역 부호화 데이터와 상기 저역 부호화 데이터를 다중화하여 상기 출력 부호열을 생성하는, 부호화 장치.
  4. 제3항에 있어서,
    고역측의 서브 밴드의 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워의 차분의 제곱합이 소정의 임계값 이하인 경우, 상기 추정 계수가 재이용 가능하게 되는, 부호화 장치.
  5. 제3항에 있어서,
    고역측의 서브 밴드의 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워에 기초하여 산출된, 상기 의사 고역 서브 밴드 파워와 상기 고역 서브 밴드 파워의 유사한 정도를 나타내는 평가값과 소정의 임계값의 비교 결과에 따라서, 상기 추정 계수가 재이용 가능하게 되는, 부호화 장치.
  6. 제3항에 있어서,
    상기 생성부는, 상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에 대하여, 하나의 상기 데이터를 생성하는, 부호화 장치.
  7. 제6항에 있어서,
    상기 데이터에는, 상기 처리 대상 구간에서, 동일한 상기 추정 계수가 선택된 연속하는 프레임을 포함하는 구간을 특정하기 위한 정보가 포함되어 있는, 부호화 장치.
  8. 제7항에 있어서,
    상기 데이터에는, 상기 추정 계수를 특정하기 위한 정보가 상기 구간에 대하여 하나 포함되어 있는, 부호화 장치.
  9. 입력 신호의 대역 분할을 행하여, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하고,
    상기 입력 신호의 저역 신호로부터 얻어진 특징량과, 미리 준비된 복수의 추정 계수 중 상기 입력 신호의 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수에 기초하여, 상기 처리 대상의 프레임의 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하고,
    상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 신호로부터 얻어진 상기 고역 서브 밴드 파워에 기초하여, 상기 처리 대상의 프레임에서, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하게 된 경우, 상기 재이용 가능하게 된 상기 추정 계수를 얻기 위한 데이터를 생성하고,
    상기 저역 신호를 부호화하여 저역 부호화 데이터를 생성하고,
    상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는
    스텝을 포함하는, 부호화 방법.
  10. 입력 신호의 대역 분할을 행하여, 상기 입력 신호의 고역측의 서브 밴드의 고역 서브 밴드 신호를 생성하고,
    상기 입력 신호의 저역 신호로부터 얻어진 특징량과, 미리 준비된 복수의 추정 계수 중 상기 입력 신호의 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수에 기초하여, 상기 처리 대상의 프레임의 상기 고역 서브 밴드 신호의 고역 서브 밴드 파워의 추정값인 의사 고역 서브 밴드 파워를 산출하고,
    상기 의사 고역 서브 밴드 파워와, 상기 고역 서브 밴드 신호로부터 얻어진 상기 고역 서브 밴드 파워에 기초하여, 상기 처리 대상의 프레임에서, 상기 직전의 프레임의 상기 추정 계수가 재이용 가능하게 된 경우, 상기 재이용 가능하게 된 상기 추정 계수를 얻기 위한 데이터를 생성하고,
    상기 저역 신호를 부호화하여 저역 부호화 데이터를 생성하고,
    상기 데이터와 상기 저역 부호화 데이터를 다중화하여 출력 부호열을 생성하는
    스텝을 포함하는 처리를 컴퓨터에 실행시키는, 프로그램.
  11. 입력 신호의 처리 대상의 프레임에서의 고역 서브 밴드 파워와, 미리 준비된 복수의 추정 계수 중 상기 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수 및 상기 입력 신호의 특징량에 기초하여 산출된 상기 처리 대상의 프레임의 상기 고역 서브 밴드 파워의 추정값에 기초하여, 상기 처리 대상의 프레임에서 상기 직전의 프레임의 상기 추정 계수가 재이용 가능한지 여부가 판정되고, 그 판정 결과에 따라서 생성된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하는 비다중화부와,
    상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하는 저역 복호부와,
    상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하는 고역 신호 생성부와,
    상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는 합성부를 구비하는, 복호 장치.
  12. 제11항에 있어서,
    상기 직전의 프레임의 상기 추정 계수가 재이용 가능하지 않다고 판정된 경우, 상기 입력 부호열에 포함되는 상기 데이터는, 상기 복수의 추정 계수마다 상기 고역 서브 밴드 파워의 상기 추정값이 산출되고, 산출된 상기 추정값과 상기 고역 서브 밴드 파워의 비교에 의해, 상기 복수의 추정 계수 중에서 선택된 상기 추정 계수를 얻기 위한 상기 데이터가 되는, 복호 장치.
  13. 제11항에 있어서,
    상기 데이터를 복호하는 데이터 복호부를 더 구비하는, 복호 장치.
  14. 제11항에 있어서,
    상기 추정값과 상기 고역 서브 밴드 파워의 차분의 제곱합이 소정의 임계값 이하인 경우, 상기 추정 계수가 재이용 가능하다고 판정되는, 복호 장치.
  15. 제11항에 있어서,
    상기 입력 신호의 복수 프레임을 포함하는 처리 대상 구간에 대하여, 하나의 상기 데이터가 생성되는, 복호 장치.
  16. 제15항에 있어서,
    상기 데이터에는, 상기 처리 대상 구간에서, 동일한 상기 추정 계수가 선택된 연속하는 프레임을 포함하는 구간을 특정하기 위한 정보가 포함되어 있는, 복호 장치.
  17. 제16항에 있어서,
    상기 데이터에는, 상기 추정 계수를 특정하기 위한 정보가 상기 구간에 대하여 하나 포함되어 있는, 복호 장치.
  18. 입력 신호의 처리 대상의 프레임에서의 고역 서브 밴드 파워와, 미리 준비된 복수의 추정 계수 중 상기 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수 및 상기 입력 신호의 특징량에 기초하여 산출된 상기 처리 대상의 프레임의 상기 고역 서브 밴드 파워의 추정값에 기초하여, 상기 처리 대상의 프레임에서 상기 직전의 프레임의 상기 추정 계수가 재이용 가능한지 여부가 판정되고, 그 판정 결과에 따라서 생성된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하고,
    상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하고,
    상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하고,
    상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는
    스텝을 포함하는, 복호 방법.
  19. 입력 신호의 처리 대상의 프레임에서의 고역 서브 밴드 파워와, 미리 준비된 복수의 추정 계수 중 상기 처리 대상의 프레임 직전의 프레임에서 선택된 추정 계수 및 상기 입력 신호의 특징량에 기초하여 산출된 상기 처리 대상의 프레임의 상기 고역 서브 밴드 파워의 추정값에 기초하여, 상기 처리 대상의 프레임에서 상기 직전의 프레임의 상기 추정 계수가 재이용 가능한지 여부가 판정되고, 그 판정 결과에 따라서 생성된 상기 추정 계수를 얻기 위한 데이터와, 상기 입력 신호의 저역 신호를 부호화하여 얻어진 저역 부호화 데이터에, 입력 부호열을 비다중화하고,
    상기 저역 부호화 데이터를 복호하여 저역 신호를 생성하고,
    상기 데이터로부터 얻어진 상기 추정 계수와, 상기 복호로 얻어진 저역 신호에 기초하여 고역 신호를 생성하고,
    상기 고역 신호와 상기 복호로 얻어진 저역 신호에 기초하여 출력 신호를 생성하는
    스텝을 포함하는 처리를 컴퓨터에 실행시키는, 프로그램.
KR1020147003279A 2011-08-24 2012-08-14 부호화 장치 및 방법, 복호 장치 및 방법과 프로그램 KR20140050044A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011182448A JP5942358B2 (ja) 2011-08-24 2011-08-24 符号化装置および方法、復号装置および方法、並びにプログラム
JPJP-P-2011-182448 2011-08-24
PCT/JP2012/070682 WO2013027629A1 (ja) 2011-08-24 2012-08-14 符号化装置および方法、復号装置および方法、並びにプログラム

Publications (1)

Publication Number Publication Date
KR20140050044A true KR20140050044A (ko) 2014-04-28

Family

ID=47746376

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147003279A KR20140050044A (ko) 2011-08-24 2012-08-14 부호화 장치 및 방법, 복호 장치 및 방법과 프로그램

Country Status (7)

Country Link
US (1) US9390717B2 (ko)
EP (1) EP2750132A4 (ko)
JP (1) JP5942358B2 (ko)
KR (1) KR20140050044A (ko)
CN (1) CN103733258B (ko)
BR (1) BR112014003676A2 (ko)
WO (1) WO2013027629A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017164606A3 (ko) * 2016-03-21 2018-08-02 한국전자통신연구원 블록 기반의 오디오 부호화/복호화 장치 및 그 방법

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) * 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
US10083700B2 (en) 2012-07-02 2018-09-25 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序
EP3288031A1 (en) * 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
CN114898761A (zh) 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
CN109509465B (zh) * 2017-09-15 2023-07-25 阿里巴巴集团控股有限公司 语音信号的处理方法、组件、设备及介质
JP7017960B2 (ja) 2018-03-19 2022-02-09 株式会社エクセディ ボールベアリングの保持構造
CN113518227B (zh) * 2020-04-09 2023-02-10 于江鸿 数据处理的方法和系统

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03254223A (ja) 1990-03-02 1991-11-13 Eastman Kodak Japan Kk アナログデータ伝送方式
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
US5809173A (en) * 1995-04-18 1998-09-15 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression using previous frame DCT coefficients
JPH1020888A (ja) 1996-07-02 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化・復号化装置
JP3926726B2 (ja) 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
DE60214027T2 (de) 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
EP1470550B1 (en) * 2002-01-30 2008-09-03 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
JP2003255973A (ja) 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7555434B2 (en) 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
JP4728568B2 (ja) 2002-09-04 2011-07-20 マイクロソフト コーポレーション レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
KR20050027179A (ko) 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
KR100587953B1 (ko) 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
WO2006000842A1 (en) 2004-05-28 2006-01-05 Nokia Corporation Multichannel audio extension
KR100608062B1 (ko) 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
RU2404506C2 (ru) 2004-11-05 2010-11-20 Панасоник Корпорэйшн Устройство масштабируемого декодирования и устройство масштабируемого кодирования
BRPI0517716B1 (pt) 2004-11-05 2019-03-12 Panasonic Intellectual Property Management Co., Ltd. Aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação.
JP5224017B2 (ja) 2005-01-11 2013-07-03 日本電気株式会社 オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
NZ562183A (en) 2005-04-01 2010-09-30 Qualcomm Inc Systems, methods, and apparatus for highband excitation generation
US20070005351A1 (en) 2005-06-30 2007-01-04 Sathyendra Harsha M Method and system for bandwidth expansion for voice communications
BRPI0520729B1 (pt) 2005-11-04 2019-04-02 Nokia Technologies Oy Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital.
JP4876574B2 (ja) 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7590523B2 (en) 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
ATE501505T1 (de) 2006-04-27 2011-03-15 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
US8010352B2 (en) * 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8295507B2 (en) 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
CN101868823B (zh) 2007-10-23 2011-12-07 歌乐株式会社 高频插值装置和高频插值方法
US8422569B2 (en) 2008-01-25 2013-04-16 Panasonic Corporation Encoding device, decoding device, and method thereof
JP5203077B2 (ja) * 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US8532983B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US8600749B2 (en) 2009-12-08 2013-12-03 At&T Intellectual Property I, L.P. System and method for training adaptation-specific acoustic models for automatic speech recognition
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8560330B2 (en) 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017164606A3 (ko) * 2016-03-21 2018-08-02 한국전자통신연구원 블록 기반의 오디오 부호화/복호화 장치 및 그 방법

Also Published As

Publication number Publication date
JP5942358B2 (ja) 2016-06-29
US20140205101A1 (en) 2014-07-24
JP2013044921A (ja) 2013-03-04
WO2013027629A1 (ja) 2013-02-28
EP2750132A4 (en) 2015-05-13
BR112014003676A2 (pt) 2017-03-21
CN103733258A (zh) 2014-04-16
CN103733258B (zh) 2016-09-14
US9390717B2 (en) 2016-07-12
EP2750132A1 (en) 2014-07-02

Similar Documents

Publication Publication Date Title
KR20140050044A (ko) 부호화 장치 및 방법, 복호 장치 및 방법과 프로그램
KR102055022B1 (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
US10546594B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
KR20140050050A (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
AU2018204110B2 (en) Signal processing apparatus and method, and program
KR102048672B1 (ko) 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체
JP5704397B2 (ja) 符号化装置および方法、並びにプログラム
JP2005148539A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application