KR20120082476A - 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체 - Google Patents

음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체 Download PDF

Info

Publication number
KR20120082476A
KR20120082476A KR1020127016477A KR20127016477A KR20120082476A KR 20120082476 A KR20120082476 A KR 20120082476A KR 1020127016477 A KR1020127016477 A KR 1020127016477A KR 20127016477 A KR20127016477 A KR 20127016477A KR 20120082476 A KR20120082476 A KR 20120082476A
Authority
KR
South Korea
Prior art keywords
high frequency
temporal envelope
envelope
linear prediction
bitstream
Prior art date
Application number
KR1020127016477A
Other languages
English (en)
Other versions
KR101530296B1 (ko
Inventor
고스케 쓰지노
게이 기쿠이리
노부히코 나카
Original Assignee
가부시키가이샤 엔.티.티.도코모
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 엔.티.티.도코모 filed Critical 가부시키가이샤 엔.티.티.도코모
Publication of KR20120082476A publication Critical patent/KR20120082476A/ko
Application granted granted Critical
Publication of KR101530296B1 publication Critical patent/KR101530296B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Abstract

주파수 영역으로 표현된 신호에 대하여, 공분산법(covariance method) 또는 자기 상관법(autocorrelation method)에 의해 주파수 방향으로 선형 예측 분석을 행하여 선형 예측 계수를 구하고, 또한 구해진 선형 예측 계수에 대하여 필터 강도의 조정을 행한 후, 조정 후의 계수에 의해 신호를 주파수 방향으로 필터 처리함으로써, 신호의 시간 포락선을 변형시킨다. 이로써, SBR로 대표되는 주파수 영역에서의 대역 확장 기술에 있어서, 비트레이트를 현저하게 증대시키지 않고, 발생하는 프리 에코?포스트 에코를 경감하여 복호 신호의 주관적 품질을 향상시킨다.

Description

음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체{SPEECH DECODING DEVICE, SPEECH DECODING METHOD, AND A COMPUTER READABLE RECORDING MEDIUM THEREON A SPEECH DECODING PROGRAM}
본 발명은, 음성 부호화 장치, 음성 복호 장치, 음성 부호화 방법, 음성 복호 방법, 음성 부호화 프로그램 및 음성 복호 프로그램에 관한 것이다.
청각(聽覺) 심리(心理)를 이용하여 인간의 지각에 불필요한 정보를 제거함으로써 신호의 데이터량을 수십분의 1로 압축하는 음성 음향 부호화 기술은, 신호의 전송?축적에 있어서 극히 중요한 기술이다. 널리 이용되고 있는 지각적(知覺的) 오디오 부호화 기술의 예로서, "ISO/IEC MPEG"로 표준화된 "MPEG4 AAC" 등이 있다.
음성 부호화의 성능을 더욱 향상시키고, 낮은 비트레이트로 높은 음성 품질을 얻는 방법으로서, 음성의 저주파 성분을 사용하여 고주파 성분을 생성하는 대역 확장 기술이 최근 널리 사용되고 있다. 대역 확장 기술의 대표적인 예는 "MPEG4 AAC"에서 이용되는 SBR(Spectral Band Replication) 기술이다. SBR에서는, QMF(Quadrature Mirror Filter) 필터 뱅크에 의해 주파수 영역으로 변환된 신호에 대하여, 저주파 대역으로부터 고주파 대역으로의 스펙트럼 계수의 복사(複寫)를 행함으로써 고주파 성분을 생성한 후, 복사된 계수의 스펙트럼 포락(包絡)과 조성(調性)(tonality)을 조정함으로써 고주파 성분의 조정을 행한다. 대역 확장 기술을 이용한 음성 부호화 방식은, 신호의 고주파 성분을 소량의 보조 정보만을 사용하여 재생할 수 있으므로 음성 부호화의 저비트레이트화를 위해 유효하다.
SBR로 대표되는 주파수 영역에서의 대역 확장 기술은, 주파수 영역으로 표현된 스펙트럼 계수에 대하여 스펙트럼 포락과 조성의 조정을, 스펙트럼 계수에 대한 게인의 조정, 시간 방향의 선형 예측 역(逆)필터 처리, 노이즈의 중첩에 의해 행한다. 이 조정 처리에 의해, 스피치 신호나 박수, 캐스터네츠와 같은 시간 포락선(包絡線)의 변화가 큰 신호를 부호화했을 때는 복호 신호에 있어서 프리 에코 또는 포스트 에코로 불리는 잔향상(殘響狀)의 잡음이 지각(知覺)되는 경우가 있다. 이 문제는, 조정 처리의 과정에서 고주파 성분의 시간 포락선이 변형되고, 대부분의 경우에는 조정 전보다 평탄한 형상이 되는 것에 기인한다. 조정 처리에 의해 평탄하게 된 고주파 성분의 시간 포락선은 부호 전의 원(原) 신호에 있어서의 고주파 성분의 시간 포락선과 일치하지 않고, 프리 에코?포스트 에코의 원인이 된다.
마찬가지의 프리 에코?포스트 에코의 문제는, "MPEG Surround" 및 파라메트릭 스테레오로 대표되는, 파라메트릭 처리를 사용한 멀티 채널 음향 부호화에 있어서도 발생한다. 멀티 채널 음향 부호화에 있어서의 복호기는 복호 신호에 잔향 필터에 의한 무상관화(無相關化) 처리를 행하는 수단을 포함하지만, 무상관화 처리의과정에 있어서 신호의 시간 포락선이 변형되고, 프리 에코?포스트 에코와 동일한 재생 신호의 열화가 생긴다. 이 과제에 대한 해결법으로서 TES(Temporal Envelope Shaping) 기술이 존재한다(특허 문헌 1). TES 기술에서는, QMF 영역으로 표현된 무상관화 처리 전의 신호에 대하여 주파수 방향으로 선형 예측 분석을 행하고, 선형 예측 계수를 얻은 후, 얻어진 선형 예측 계수를 사용하여 무상관화 처리 후의 신호에 대하여 주파수 방향으로 선형 예측 합성 필터 처리를 행한다. 이 처리에 의해, TES 기술은 무상관화 처리 전의 신호가 가지는 시간 포락선을 추출하고, 거기에 맞추어 무상관화 처리 후의 신호의 시간 포락선을 조정한다. 무상관화 처리 전의 신호는 불균일이 적은 시간 포락선을 가지기 때문에, 이상의 처리에 의해, 무상관화 처리 후의 신호의 시간 포락선을 불균일이 적은 형상으로 조정하여, 프리 에코?포스트 에코가 개선된 재생 신호를 얻을 수 있다.
미국 특허 출원 공개 제2006/0239473호 명세서
이상으로 나타낸 TES 기술은, 무상관화 처리 전의 신호가 불균일이 적은 시간 포락선을 가지는 점을 이용한 것이다. 그러나, SBR 복호기에서는 신호의 고주파 성분을 저주파 성분으로부터의 신호 복사에 의해 복제(複製)하므로, 고주파 성분에 관한 불균일이 적은 시간 포락선을 얻을 수 없다. 이 문제에 대한 해결법의 하나로서, SBR 부호기에 있어서 입력 신호의 고주파 성분을 분석하고, 분석 결과 얻어진 선형 예측 계수를 양자화하고, 비트스트림으로 다중화하여 전송하는 방법을 고려할 수 있다. 이로써, SBR 복호기에 있어서 고주파 성분의 시간 포락선에 관한 불균일이 적은 정보를 포함하는 선형 예측 계수를 얻을 수 있다. 그러나, 이 경우, 양자화된 선형 예측 계수의 전송에 많은 정보량이 필요해 지므로, 부호화 비트스트림 전체의 비트레이트가 현저하게 증대하는 문제를 수반한다. 그래서, 본 발명의 목적은, SBR로 대표되는 주파수 영역에서의 대역 확장 기술에 있어서, 비트레이트를 현저하게 증대시키지 않고, 발생하는 프리 에코?포스트 에코를 경감하여 복호 신호의 주관적 품질을 향상시키는 데 있다.
본 발명의 음성 부호화 장치는, 음성 신호를 부호화하는 음성 부호화 장치로서, 상기 음성 신호의 저주파 성분을 부호화하는 코어 부호화 수단과, 상기 음성 신호의 저주파 성분의 시간 포락선을 사용하여, 상기 음성 신호의 고주파 성분의 시간 포락선의 근사(近似)를 얻기 위한 시간 포락선 보조 정보를 산출하는 시간 포락선 보조 정보 산출 수단과, 적어도, 상기 코어 부호화 수단에 의해 부호화된 상기 저주파 성분과, 상기 시간 포락선 보조 정보 산출 수단에 의해 산출된 상기 시간 포락선 보조 정보가 다중화된 비트스트림을 생성하는 비트스트림 다중화 수단을 구비하는 것을 특징으로 한다.
본 발명의 음성 부호화 장치에서는, 상기 시간 포락선 보조 정보는, 소정의 해석 구간 내에 있어서 상기 음성 신호의 고주파 성분에서의 시간 포락선의 변화의 급격함을 나타내는 파라미터로 나타내는 것이 바람직하다.
본 발명의 음성 부호화 장치에서는, 상기 음성 신호를 주파수 영역으로 변환하는 주파수 변환 수단을 더 포함하고, 상기 시간 포락선 보조 정보 산출 수단은, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 음성 신호의 고주파측 계수에 대하여 주파수 방향으로 선형 예측 분석을 행하여 취득된 고주파 선형 예측 계수에 기초하여, 상기 시간 포락선 보조 정보를 산출하는 것이 바람직하다.
본 발명의 음성 부호화 장치에서는, 상기 시간 포락선 보조 정보 산출 수단은, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 음성 신호의 저주파측 계수에 대하여 주파수 방향으로 선형 예측 분석을 행하여 저주파 선형 예측 계수를 취득하고, 상기 저주파 선형 예측 계수와 상기 고주파 선형 예측 계수에 기초하여, 상기 시간 포락선 보조 정보를 산출하는 것이 바람직하다.
본 발명의 음성 부호화 장치에서는, 상기 시간 포락선 보조 정보 산출 수단은, 상기 저주파 선형 예측 계수 및 상기 고주파 선형 예측 계수의 각각으로부터 예측 게인을 취득하고, 상기 2개의 예측 게인의 대소(大小)에 기초하여, 상기 시간 포락선 보조 정보를 산출하는 것이 바람직하다.
본 발명의 음성 부호화 장치에서는, 상기 시간 포락선 보조 정보 산출 수단은, 상기 음성 신호로부터 고주파 성분을 분리하고, 시간 영역으로 표현된 시간 포락선 정보를 상기 고주파 성분으로부터 취득하고, 상기 시간 포락선 정보의 시간적 변화의 크기에 기초하여, 상기 시간 포락선 보조 정보를 산출하는 것이 바람직하다.
본 발명의 음성 부호화 장치에서는, 상기 시간 포락선 보조 정보는, 상기 음성 신호의 저주파 성분에 대하여 주파수 방향으로의 선형 예측 분석을 행하여 얻어지는 저주파 선형 예측 계수를 사용하여 고주파 선형 예측 계수를 취득하기 위한 차분(差分) 정보를 포함하는 것이 바람직하다.
본 발명의 음성 부호화 장치에서는, 상기 음성 신호를 주파수 영역으로 변환하는 주파수 변환 수단을 더 포함하고, 상기 시간 포락선 보조 정보 산출 수단은, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 음성 신호의 저주파 성분 및 고주파측 계수의 각각에 대하여 주파수 방향으로 선형 예측 분석을 행하여 저주파 선형 예측 계수와 고주파 선형 예측 계수를 취득하고, 상기 저주파 선형 예측 계수 및 고주파 선형 예측 계수의 차분을 취득함으로써 상기 차분 정보를 취득하는 것이 바람직하다.
본 발명의 음성 부호화 장치에서는, 상기 차분 정보는, LSP(Linear Spectrum Pair), ISP(Immittance Spectrum Pair), LSF(Linear Spectrum Frequency), ISF(Immittance Spectrum Frequency), PARCOR 계수 중 어느 하나의 영역에서의 선형 예측 계수의 차분을 나타내는 것이 바람직하다.
본 발명의 음성 부호화 장치는, 음성 신호를 부호화하는 음성 부호화 장치로서, 상기 음성 신호의 저주파 성분을 부호화하는 코어 부호화 수단과, 상기 음성 신호를 주파수 영역으로 변환하는 주파수 변환 수단과, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 음성 신호의 고주파측 계수에 대하여 주파수 방향으로 선형 예측 분석을 행하여 고주파 선형 예측 계수를 취득하는 선형 예측 분석 수단과, 상기 선형 예측 분석 수단에 의해 취득된 상기 고주파 선형 예측 계수를 시간 방향으로 솎아내는 예측 계수 솎아냄 수단과, 상기 예측 계수 솎아냄 수단에 의해 솎아내어진 후의 상기 고주파 선형 예측 계수를 양자화하는 예측 계수 양자화 수단과, 적어도 상기 코어 부호화 수단에 의한 부호화 후의 상기 저주파 성분과 상기 예측 계수 양자화 수단에 의한 양자화 후의 상기 고주파 선형 예측 계수가 다중화된 비트스트림을 생성하는 비트스트림 다중화 수단을 구비하는 것을 특징으로 한다.
본 발명의 음성 복호 장치는, 부호화된 음성 신호를 복호하는 음성 복호 장치로서, 상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을, 부호화 비트스트림과 시간 포락선 보조 정보로 분리하는 비트스트림 분리 수단과, 상기 비트스트림 분리 수단에 의해 분리된 상기 부호화 비트스트림을 복호하여 저주파 성분을 얻는 코어 복호 수단과, 상기 코어 복호 수단에 의해 얻어진 상기 저주파 성분을 주파수 영역으로 변환하는 주파수 변환 수단과, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 저주파 대역으로부터 고주파 대역에 복사함으로써 고주파 성분을 생성하는 고주파 생성 수단과, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 분석하여 시간 포락선 정보를 취득하는 저주파 시간 포락선 분석 수단과, 상기 저주파 시간 포락선 분석 수단에 의해 취득된 상기 시간 포락선 정보를, 상기 시간 포락선 보조 정보를 사용하여 조정하는 시간 포락선 조정 수단과, 상기 시간 포락선 조정 수단에 의한 조정 후의 상기 시간 포락선 정보를 사용하여, 상기 고주파 생성 수단에 의해 생성된 상기 고주파 성분의 시간 포락선을 변형시키는 시간 포락선 변형 수단을 구비하는 것을 특징으로 한다.
본 발명의 음성 복호 장치에서는, 상기 고주파 성분을 조정하는 고주파 조정 수단을 더 포함하고, 상기 주파수 변환 수단은, 실수(實數) 또는 복소수(複素數)의 계수를 가지는 64분할 QMF 필터 뱅크이며, 상기 주파수 변환 수단, 상기 고주파 생성 수단, 상기 고주파 조정 수단은 "ISO/IEC 14496-3"에 규정되는 "MPEG4 AAC"에 있어서의 SBR 복호기(SBR: Spectral Band Replication)에 준거한 동작을 행하는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 저주파 시간 포락선 분석 수단은, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분에 주파수 방향의 선형 예측 분석을 행하여 저주파 선형 예측 계수를 취득하고, 상기 시간 포락선 조정 수단은, 상기 시간 포락선 보조 정보를 사용하여 상기 저주파 선형 예측 계수를 조정하고, 상기 시간 포락선 변형 수단은, 상기 고주파 생성 수단에 의해 생성된 주파수 영역의 상기 고주파 성분에 대하여 상기 시간 포락선 조정 수단에 의해 조정된 선형 예측 계수를 사용하여 주파수 방향의 선형 예측 필터 처리를 행하여 음성 신호의 시간 포락선을 변형시키는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 저주파 시간 포락선 분석 수단은, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분의 시간 슬롯마다의 전력을 취득함으로써 음성 신호의 시간 포락선 정보를 취득하고, 상기 시간 포락선 조정 수단은, 상기 시간 포락선 보조 정보를 사용하여 상기 시간 포락선 정보를 조정하고, 상기 시간 포락선 변형 수단은, 상기 고주파 생성 수단에 의해 생성된 주파수 영역의 고주파 성분에 상기 조정 후의 시간 포락선 정보를 중첩시키는 것에 의해 고주파 성분의 시간 포락선을 변형시키는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 저주파 시간 포락선 분석 수단은, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분의 QMF 서브 밴드 샘플마다의 전력을 취득함으로써 음성 신호의 시간 포락선 정보를 취득하고, 상기 시간 포락선 조정 수단은, 상기 시간 포락선 보조 정보를 사용하여 상기 시간 포락선 정보를 조정하고, 상기 시간 포락선 변형 수단은, 상기 고주파 생성 수단에 의해 생성된 주파수 영역의 고주파 성분에 상기 조정 후의 시간 포락선 정보를 승산(乘算)함으로써 고주파 성분의 시간 포락선을 변형시키는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 시간 포락선 보조 정보는, 선형 예측 계수의 강도의 조정에 사용하기 위한 필터 강도 파라미터로 나타내는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 시간 포락선 보조 정보는, 상기 시간 포락선 정보의 시간 변화의 크기를 나타내는 파라미터로 나타내는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 시간 포락선 보조 정보는, 상기 저주파 선형 예측 계수에 대한 선형 예측 계수의 차분 정보를 포함하는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 차분 정보는, LSP(Linear Spectrum Pair), ISP(Immittance Spectrum Pair), LSF(Linear Spectrum Frequency), ISF(Immittance Spectrum Frequency), PARCOR 계수 중 어느 하나의 영역에 있어서의 선형 예측 계수의 차분을 나타내는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 저주파 시간 포락선 분석 수단은, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분에 대하여 주파수 방향의 선형 예측 분석을 행하여 상기 저주파 선형 예측 계수를 취득하고, 또한 상기 주파수 영역의 상기 저주파 성분의 시간 슬롯마다의 전력을 취득함으로써 음성 신호의 시간 포락선 정보를 취득하고, 상기 시간 포락선 조정 수단은, 상기 시간 포락선 보조 정보를 사용하여 상기 저주파 선형 예측 계수를 조정하고, 또한 상기 시간 포락선 보조 정보를 사용하여 상기 시간 포락선 정보를 조정하고, 상기 시간 포락선 변형 수단은, 상기 고주파 생성 수단에 의해 생성된 주파수 영역의 고주파 성분에 대하여 상기 시간 포락선 조정 수단에 의해 조정된 선형 예측 계수를 사용하여 주파수 방향의 선형 예측 필터 처리를 행하여 음성 신호의 시간 포락선을 변형시키고, 또한 상기 주파수 영역의 상기 고주파 성분에 상기 시간 포락선 조정 수단에 의한 조정 후의 상기 시간 포락선 정보를 중첩시키는 것에 의해 상기 고주파 성분의 시간 포락선을 변형시키는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 저주파 시간 포락선 분석 수단은, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분에 대하여 주파수 방향의 선형 예측 분석을 행하여 상기 저주파 선형 예측 계수를 취득하고, 또한 상기 주파수 영역의 상기 저주파 성분의 QMF 서브 밴드 샘플마다의 전력을 취득함으로써 음성 신호의 시간 포락선 정보를 취득하고, 상기 시간 포락선 조정 수단은, 상기 시간 포락선 보조 정보를 사용하여 상기 저주파 선형 예측 계수를 조정하고, 또한 상기 시간 포락선 보조 정보를 사용하여 상기 시간 포락선 정보를 조정하고, 상기 시간 포락선 변형 수단은, 상기 고주파 생성 수단에 의해 생성된 주파수 영역의 고주파 성분에 대하여 상기 시간 포락선 조정 수단에 의한 조정 후의 선형 예측 계수를 사용하여 주파수 방향의 선형 예측 필터 처리를 행하여 음성 신호의 시간 포락선을 변형시키고, 또한 상기 주파수 영역의 상기 고주파 성분에 상기 시간 포락선 조정 수단에 의한 조정 후의 상기 시간 포락선 정보를 승산함으로써 상기 고주파 성분의 시간 포락선을 변형시키는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 시간 포락선 보조 정보는, 선형 예측 계수의 필터 강도와, 상기 시간 포락선 정보의 시간 변화의 크기의 양쪽을 나타내는 파라미터로 나타내는 것이 바람직하다.
본 발명의 음성 복호 장치는, 부호화된 음성 신호를 복호하는 음성 복호 장치로서, 상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을, 부호화 비트스트림과 선형 예측 계수로 분리하는 비트스트림 분리 수단과, 상기 선형 예측 계수를 시간 방향으로 보간(補間) 또는 보외(補外)하는 선형 예측 계수 보간?보외 수단과, 상기 선형 예측 계수 보간?보외 수단에 의해 보간 또는 보외된 선형 예측 계수를 사용하여 주파수 영역으로 표현된 고주파 성분에 주파수 방향의 선형 예측 필터 처리를 행하여 음성 신호의 시간 포락선을 변형시키는 시간 포락선 변형 수단을 구비하는 것을 특징으로 한다.
본 발명의 음성 부호화 방법은, 음성 신호를 부호화하는 음성 부호화 장치를 사용한 음성 부호화 방법으로서, 상기 음성 부호화 장치가, 상기 음성 신호의 저주파 성분을 부호화하는 코어 부호화 단계와, 상기 음성 부호화 장치가, 상기 음성 신호의 저주파 성분의 시간 포락선을 사용하여, 상기 음성 신호의 고주파 성분의 시간 포락선의 근사를 얻기 위한 시간 포락선 보조 정보를 산출하는 시간 포락선 보조 정보 산출 단계와, 상기 음성 부호화 장치가, 적어도, 상기 코어 부호화 단계에 있어서 부호화된 상기 저주파 성분과, 상기 시간 포락선 보조 정보 산출 단계에 있어서 산출된 상기 시간 포락선 보조 정보가 다중화된 비트스트림을 생성하는 비트스트림 다중화 단계를 포함하는 것을 특징으로 한다.
본 발명의 음성 부호화 방법은, 음성 신호를 부호화하는 음성 부호화 장치를 사용한 음성 부호화 방법으로서, 상기 음성 부호화 장치가, 상기 음성 신호의 저주파 성분을 부호화하는 코어 부호화 단계와, 상기 음성 부호화 장치가, 상기 음성 신호를 주파수 영역으로 변환하는 주파수 변환 단계와, 상기 음성 부호화 장치가, 상기 주파수 변환 단계에 있어서 주파수 영역으로 변환된 상기 음성 신호의 고주파측 계수에 대하여 주파수 방향으로 선형 예측 분석을 행하여 고주파 선형 예측 계수를 취득하는 선형 예측 분석 단계와, 상기 음성 부호화 장치가, 상기 선형 예측 분석 단계에 있어서 취득한 상기 고주파 선형 예측 계수를 시간 방향으로 솎아내는 예측 계수 솎아냄 단계와, 상기 음성 부호화 장치가, 상기 예측 계수 솎아냄 단계에 있어서의 솎아낸 후의 상기 고주파 선형 예측 계수를 양자화하는 예측 계수 양자화 단계와, 상기 음성 부호화 장치가, 적어도 상기 코어 부호화 단계에 있어서의 부호화 후의 상기 저주파 성분과 상기 예측 계수 양자화 단계에 있어서의 양자화 후의 상기 고주파 선형 예측 계수가 다중화된 비트스트림을 생성하는 비트스트림 다중화 단계를 포함하는 것을 특징으로 한다.
본 발명의 음성 복호 방법은, 부호화된 음성 신호를 복호하는 음성 복호 장치를 사용한 음성 복호 방법으로서, 상기 음성 복호 장치가, 상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을, 부호화 비트스트림과 시간 포락선 보조 정보로 분리하는 비트스트림 분리 단계와, 상기 음성 복호 장치가, 상기 비트스트림 분리 단계에 있어서 분리한 상기 부호화 비트스트림을 복호하여 저주파 성분을 얻는 코어 복호 단계와, 상기 음성 복호 장치가, 상기 코어 복호 단계에 있어서 얻은 상기 저주파 성분을 주파수 영역으로 변환하는 주파수 변환 단계와, 상기 음성 복호 장치가, 상기 주파수 변환 단계에 있어서 주파수 영역으로 변환된 상기 저주파 성분을 저주파 대역으로부터 고주파 대역에 복사함으로써 고주파 성분을 생성하는 고주파 생성 단계와, 상기 음성 복호 장치가, 상기 주파수 변환 단계에 있어서 주파수 영역으로 변환된 상기 저주파 성분을 분석하여 시간 포락선 정보를 취득하는 저주파 시간 포락선 분석 단계와, 상기 음성 복호 장치가, 상기 저주파 시간 포락선 분석 단계에 있어서 취득한 상기 시간 포락선 정보를, 상기 시간 포락선 보조 정보를 사용하여 조정하는 시간 포락선 조정 단계와, 상기 음성 복호 장치가, 상기 시간 포락선 조정 단계에 있어서의 조정 후의 상기 시간 포락선 정보를 사용하여, 상기 고주파 생성 단계에 있어서 생성된 상기 고주파 성분의 시간 포락선을 변형시키는 시간 포락선 변형 단계를 포함한 것을 특징으로 한다.
본 발명의 음성 복호 방법은, 부호화된 음성 신호를 복호하는 음성 복호 장치를 사용한 음성 복호 방법으로서, 상기 음성 복호 장치가, 상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을, 부호화 비트스트림과 선형 예측 계수로 분리하는 비트스트림 분리 단계와, 상기 음성 복호 장치가, 상기 선형 예측 계수를 시간 방향으로 보간 또는 보외하는 선형 예측 계수 보간?보외 단계와, 상기 음성 복호 장치가, 상기 선형 예측 계수 보간?보외 단계에 있어서 보간 또는 보외된 상기 선형 예측 계수를 사용하여, 주파수 영역으로 표현된 고주파 성분에 주파수 방향의 선형 예측 필터 처리를 행하여 음성 신호의 시간 포락선을 변형시키는 시간 포락선 변형 단계를 포함하는 것을 특징으로 한다.
본 발명의 음성 부호화 프로그램은, 음성 신호를 부호화하기 위하여, 컴퓨터 장치를, 상기 음성 신호의 저주파 성분을 부호화하는 코어 부호화 수단, 상기 음성 신호의 저주파 성분의 시간 포락선을 사용하여, 상기 음성 신호의 고주파 성분의 시간 포락선의 근사를 얻기 위한 시간 포락선 보조 정보를 산출하는 시간 포락선 보조 정보 산출 수단, 및 적어도, 상기 코어 부호화 수단에 의해 부호화된 상기 저주파 성분과 상기 시간 포락선 보조 정보 산출 수단에 의해 산출된 상기 시간 포락선 보조 정보가 다중화된 비트스트림을 생성하는 비트스트림 다중화 수단으로서 기능시키는 것을 특징으로 한다.
본 발명의 음성 부호화 프로그램은, 음성 신호를 부호화하기 위하여, 컴퓨터 장치를, 상기 음성 신호의 저주파 성분을 부호화하는 코어 부호화 수단, 상기 음성 신호를 주파수 영역으로 변환하는 주파수 변환 수단, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 음성 신호의 고주파측 계수에 대하여 주파수 방향으로 선형 예측 분석을 행하여 고주파 선형 예측 계수를 취득하는 선형 예측 분석 수단, 상기 선형 예측 분석 수단에 의해 취득된 상기 고주파 선형 예측 계수를 시간 방향으로 솎아내는 예측 계수 솎아냄 수단, 상기 예측 계수 솎아냄 수단에 의해 솎아내어진 후의 상기 고주파 선형 예측 계수를 양자화하는 예측 계수 양자화 수단, 및 적어도 상기 코어 부호화 수단에 의한 부호화 후의 상기 저주파 성분과 상기 예측 계수 양자화 수단에 의한 양자화 후의 상기 고주파 선형 예측 계수가 다중화된 비트스트림을 생성하는 비트스트림 다중화 수단으로서 기능시키는 것을 특징으로 한다.
본 발명의 음성 복호 프로그램은, 부호화된 음성 신호를 복호하기 위하여, 컴퓨터 장치를, 상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을, 부호화 비트스트림과 시간 포락선 보조 정보로 분리하는 비트스트림 분리 수단, 상기 비트스트림 분리 수단에 의해 분리된 상기 부호화 비트스트림을 복호하여 저주파 성분을 얻는 코어 복호 수단, 상기 코어 복호 수단에 의해 얻어진 상기 저주파 성분을 주파수 영역으로 변환하는 주파수 변환 수단, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 저주파 대역으로부터 고주파 대역에 복사함으로써 고주파 성분을 생성하는 고주파 생성 수단, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 분석하여 시간 포락선 정보를 취득하는 저주파 시간 포락선 분석 수단, 상기 저주파 시간 포락선 분석 수단에 의해 취득된 상기 시간 포락선 정보를, 상기 시간 포락선 보조 정보를 사용하여 조정하는 시간 포락선 조정 수단, 및 상기 시간 포락선 조정 수단에 의한 조정 후의 상기 시간 포락선 정보를 사용하여, 상기 고주파 생성 수단에 의해 생성된 상기 고주파 성분의 시간 포락선을 변형시키는 시간 포락선 변형 수단으로서 기능시키는 것을 특징으로 한다.
본 발명의 음성 복호 프로그램은, 부호화된 음성 신호를 복호하기 위하여, 컴퓨터 장치를, 상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을, 부호화 비트스트림과 선형 예측 계수로 분리하는 비트스트림 분리 수단, 상기 선형 예측 계수를 시간 방향으로 보간 또는 보외하는 선형 예측 계수 보간?보외 수단, 및 상기 선형 예측 계수 보간?보외 수단에 의해 보간 또는 보외된 선형 예측 계수를 사용하여 주파수 영역으로 표현된 고주파 성분에 주파수 방향의 선형 예측 필터 처리를 행하여 음성 신호의 시간 포락선을 변형시키는 시간 포락선 변형 수단으로서 기능시키는 것을 특징으로 한다.
본 발명의 음성 복호 장치에서는, 상기 시간 포락선 변형 수단은, 상기 고주파 생성 수단에 의해 생성된 주파수 영역의 상기 고주파 성분에 대하여 주파수 방향의 선형 예측 필터 처리를 행한 후, 상기 선형 예측 필터 처리의 결과 얻어진 고주파 성분의 전력을 상기 선형 예측 필터 처리 전과 같은 값으로 조정하는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 시간 포락선 변형 수단은, 상기 고주파 생성 수단에 의해 생성된 주파수 영역의 상기 고주파 성분에 대하여 주파수 방향의 선형 예측 필터 처리를 행한 후, 상기 선형 예측 필터 처리의 결과 얻어진 고주파 성분의 임의의 주파수 범위 내의 전력을 상기 선형 예측 필터 처리 전과 같은 값으로 조정하는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 시간 포락선 보조 정보는, 상기 조정 후의 상기 시간 포락선 정보에서의 최소값과 평균값의 비율인 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 시간 포락선 변형 수단은, 상기 주파수 영역의 고주파 성분의 SBR 포락선 시간 세그먼트 내에서의 전력이 시간 포락선의 변형 전과 후에, 동등하게 되도록 상기 조정 후의 시간 포락선의 이득(gain)을 제어한 후에, 상기 주파수 영역의 고주파 성분에 상기 이득 제어된 시간 포락선을 승산함으로써 고주파 성분의 시간 포락선을 변형시키는 것이 바람직하다.
본 발명의 음성 복호 장치에서는, 상기 저주파 시간 포락선 분석 수단은, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분의 QMF 서브 밴드 샘플마다의 전력을 취득하고, 또한 SBR 포락선 시간 세그먼트 내에서의 평균 전력을 사용하여 상기 QMF 서브 밴드 샘플마다의 전력을 정규화함으로써, 각 QMF 서브 밴드 샘플에 승산될 게인 계수로서 표현된 시간 포락선 정보를 취득하는 것이 바람직하다.
본 발명의 음성 복호 장치는, 부호화된 음성 신호를 복호하는 음성 복호 장치로서, 상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을 복호하여 저주파 성분을 얻는 코어 복호 수단과, 상기 코어 복호 수단에 의해 얻어진 상기 저주파 성분을 주파수 영역으로 변환하는 주파수 변환 수단과, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 저주파 대역으로부터 고주파 대역에 복사함으로써 고주파 성분을 생성하는 고주파 생성 수단과, 상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 분석하여 시간 포락선 정보를 취득하는 저주파 시간 포락선 분석 수단과, 상기 비트스트림을 분석하여 시간 포락선 보조 정보를 생성하는 시간 포락선 보조 정보 생성부와, 상기 저주파 시간 포락선 분석 수단에 의해 취득된 상기 시간 포락선 정보를, 상기 시간 포락선 보조 정보를 사용하여 조정하는 시간 포락선 조정 수단과, 상기 시간 포락선 조정 수단에 의한 조정 후의 상기 시간 포락선 정보를 사용하여, 상기 고주파 생성 수단에 의해 생성된 상기 고주파 성분의 시간 포락선을 변형시키는 시간 포락선 변형 수단을 구비하는 것을 특징으로 한다.
본 발명의 음성 복호 장치에서는, 상기 고주파 조정 수단에 상당하는, 1차 고주파 조정 수단과 2차 고주파 조정 수단을 구비하고, 상기 1차 고주파 조정 수단은, 상기 고주파 조정 수단에 상당하는 처리의 일부를 포함하는 처리를 실행하고, 상기 시간 포락선 변형 수단은, 상기 1차 고주파 조정 수단의 출력 신호에 대하여 시간 포락선의 변형을 행하고, 상기 2차 고주파 조정 수단은, 상기 시간 포락선 변형 수단의 출력 신호에 대하여, 상기 고주파 조정 수단에 상당하는 처리 중 상기 1차 고주파 조정 수단에 의해 실행되지 않는 처리를 실행하는 것이 바람직하고, 상기 2차 고주파 조정 수단은, SBR의 복호 과정에 있어서의 정현파(sine wave)의 부가 처리인 것이 바람직하다.
본 발명에 의하면, SBR로 대표되는 주파수 영역에서의 대역 확장 기술에 있어서, 비트레이트를 현저하게 증대시키지 않고, 발생하는 프리 에코?포스트 에코를 경감시켜 복호 신호의 주관적 품질을 향상시킬 수 있다.
도 1은 제1 실시예에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
도 2는 제1 실시예에 따른 음성 부호화 장치의 동작을 설명하기 위한 흐름도이다.
도 3은 제1 실시예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 4는 제1 실시예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 5는 제1 실시예의 변형예 1에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
도 6은 제2 실시예에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
도 7은 제2 실시예에 따른 음성 부호화 장치의 동작을 설명하기 위한 흐름도이다.
도 8은 제2 실시예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 9는 제2 실시예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 10은 제3 실시예에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
도 11은 제3 실시예에 따른 음성 부호화 장치의 동작을 설명하기 위한 흐름도이다.
도 12는 제3 실시예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 13은 제3 실시예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 14는 제4 실시예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 15는 제4 실시예의 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 16은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 17은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 18은 제1 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 19는 제1 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 20은 제1 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 21은 제1 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 22는 제2 실시예의 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 23은 제2 실시예의 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 24는 제2 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 25는 제2 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 26은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 27은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 28은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 29는 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 30은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 31은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 32는 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 33은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 34는 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 35는 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 36은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 37은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 38은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 39는 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 40은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 41은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 42는 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 구성을 나타낸 도면이다.
도 43은 제4 실시예의 다른 변형예에 따른 음성 복호 장치의 동작을 설명하기 위한 흐름도이다.
도 44는 제1 실시예의 다른 변형예에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
도 45는 제1 실시예의 다른 변형예에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
도 46은 제2 실시예의 변형예에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
도 47은 제2 실시예의 다른 변형예에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
도 48은 제4 실시예에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
도 49는 제4 실시예의 변형예에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
도 50은 제4 실시예의 다른 변형예에 따른 음성 부호화 장치의 구성을 나타낸 도면이다.
이하, 도면을 참조하여, 본 발명에 따른 바람직한 실시예에 대하여 상세하게 설명한다. 그리고, 도면의 설명에 있어서, 가능한 경우에는, 동일 요소에는 동일 부호를 부여하고, 중복되는 설명을 생략한다.
(제1 실시예)
도 1은, 제1 실시예에 따른 음성 부호화 장치(11)의 구성을 나타낸 도면이다. 음성 부호화 장치(11)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(11)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 2의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 부호화 장치(11)를 통괄적으로 제어한다. 음성 부호화 장치(11)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다.
음성 부호화 장치(11)는, 기능적으로는, 주파수 변환부(1a)(주파수 변환 수단), 주파수 역변환부(1b), 코어 코덱 부호화부(1c)(코어 부호화 수단), SBR 부호화부(1d), 선형 예측 분석부(1e)(시간 포락선 보조 정보 산출 수단), 필터 강도 파라미터 산출부(1f)(시간 포락선 보조 정보 산출 수단) 및 비트스트림 다중화부(1g)(비트스트림 다중화 수단)를 구비한다. 도 1에 나타내는 음성 부호화 장치(11)의 주파수 변환부(1a)?비트스트림 다중화부(1g)는, 음성 부호화 장치(11)의 CPU가 음성 부호화 장치(11)의 내장 메모리에 저장된 컴퓨터 프로그램을 실행함으로써 실현되는 기능이다. 음성 부호화 장치(11)의 CPU는, 이 컴퓨터 프로그램을 실행함으로써[도 1에 나타내는 주파수 변환부(1a)?비트스트림 다중화부(1g)를 사용하여], 도 2의 흐름도에 나타내는 처리(단계 Sa1?단계 Sa7의 처리)를 차례로 실행한다. 이 컴퓨터 프로그램의 실행에 필요한 각종 데이터, 및 이 컴퓨터 프로그램의 실행에 의해 생성된 각종 데이터는, 모두, 음성 부호화 장치(11)의 ROM이나 RAM 등의 내장 메모리에 저장되는 것으로 한다.
주파수 변환부(1a)는, 음성 부호화 장치(11)의 통신 장치를 통하여 수신된 외부로부터의 입력 신호를 다분할 QMF 필터 뱅크에 의해 분석하고, QMF 영역의 신호 q(k, r)을 얻는다(단계 Sa1의 처리). 다만, k(0≤k≤63)는 주파수 방향의 인덱스이며, r은 시간 슬롯을 나타내는 인덱스이다. 주파수 역(逆)변환부(1b)는, 주파수 변환부(1a)로부터 얻어진 QMF 영역의 신호 중, 저주파 측의 반수(半數)의 계수를 QMF 필터 뱅크에 의해 합성하고, 입력 신호의 저주파 성분만을 포함하는, 다운 샘플링된 시간 영역 신호를 얻는다(단계 Sa2의 처리). 코어 코덱 부호화부(1c)는, 다운 샘플링된 시간 영역 신호를 부호화하여, 부호화 비트스트림을 얻는다(단계 Sa3의 처리). 코어 코덱 부호화부(1c)에 있어서의 부호화는 CELP 방식으로 대표되는 음성 부호화 방식에 기초해도 되고, 또한 AAC로 대표되는 변환 부호화나 TCX(Transform Coded Excitation) 방식 등의 음향 부호화에 기초해도 된다.
SBR 부호화부(1d)는, 주파수 변환부(1a)로부터 QMF 영역의 신호를 수취하고, 고주파 성분의 전력?신호 변화?조성 등의 분석에 기초하여, SBR 부호화를 행하여, SBR 보조 정보를 얻는다(단계 Sa4의 처리). 주파수 변환부(1a)에 있어서의 QMF 분석 방법 및 SBR 부호화부(1d)에 있어서의 SBR 부호화 방법은, 예를 들면, 문헌 "3GPP TS 26.404; Enhanced aacPlus encoder SBR part"에 상세하게 설명되어 있다.
선형 예측 분석부(1e)는, 주파수 변환부(1a)로부터 QMF 영역의 신호를 수취하고, 이 신호의 고주파 성분에 대하여 주파수 방향으로 선형 예측 분석을 행하여 고주파 선형 예측 계수 aH(n, r)(1≤n≤N)를 취득한다(단계 Sa5의 처리). 단 N은 선형 예측 차수이다. 또한, 인덱스 r은, QMF 영역의 신호의 서브 샘플에 관한 시간 방향의 인덱스이다. 신호 선형 예측 분석에는, 공분산법(covariance method) 또는 자기 상관법(autocorrelation method)을 이용할 수 있다. aH(n, r)을 취득할 때의 선형 예측 분석은, q(k, r) 중 kx<k≤63을 만족시키는 고주파 성분에 대하여 행한다. 단 kx는 코어 코덱 부호화부(1c)에 의해 부호화되는 주파수 대역의 상한 주파수에 대응하는 주파수 인덱스이다. 또한, 선형 예측 분석부(1e)는, aH(n, r)을 취득할 때 분석한 것과는 별개의 저주파 성분에 대하여 선형 예측 분석을 행하고, aH(n, r)와는 별개의 저주파 선형 예측 계수 aL(n, r)을 취득해도 된다(이와 같은 저주파 성분에 관한 선형 예측 계수는 시간 포락선 정보에 대응하고 있고, 이하, 제1 실시예에 있어서는 동일함). aL(n, r)을 취득할 때의 선형 예측 분석은, 0≤k<kx를 만족시키는 저주파 성분에 대한 것이다. 또한, 이 선형 예측 분석은 0≤k<kx의 구간에 포함되는 일부 주파수 대역에 대한 것이라도 된다.
필터 강도 파라미터 산출부(1f)는, 예를 들면, 선형 예측 분석부(1e)에 의해 취득된 선형 예측 계수를 사용하여 필터 강도 파라미터(필터 강도 파라미터는 시간 포락선 보조 정보에 대응하고 있고, 이하, 제1 실시예에 있어서는 동일함)를 산출한다(단계 Sa6의 처리). 먼저, aH(n, r)로부터 예측 게인 GH(r)가 산출된다. 예측 게인의 산출 방법은, 예를 들면, "음성 부호화, 모리야 다케히로 저, 전자 정보 통신 학회편"에 상세히 설명되어 있다. 또한, aL(n, r)이 산출되어 있는 경우에는 마찬가지로 예측 게인 GL(r)이 산출된다. 필터 강도 파라미터 K(r)는, GH(r)가 클수록 커지게 되는 파라미터이며, 예를 들면, 다음의 수식 1에 따라 취득할 수 있다. 단, max(a, b)는 a와 b의 최대값, min(a, b)은 a와 b의 최소값을 나타낸다.
[수식 1]
Figure pat00001
또한, GL(r)이 산출되어 있는 경우에는, K(r)는 GH(r)가 클수록 커지고, GL(r)이 커질수록 작아지는 파라미터로서 취득할 수 있다. 이 경우의 K는, 예를 들면, 다음의 수식 2에 따라 취득할 수 있다.
[수식 2]
Figure pat00002
K(r)은, SBR 복호 시에 고주파 성분의 시간 포락선을 조정하는 강도를 나타내는 파라미터이다. 주파수 방향의 선형 예측 계수에 대한 예측 게인은, 분석 구간의 신호의 시간 포락선이 급격한 변화를 나타낼수록 큰 값이 된다. K(r)은, 그 값이 클수록, SBR에 의해 생성된 고주파 성분의 시간 포락선의 변화를 급격하게 하는 처리를 강하게 하도록 복호기에 지시하기 위한 파라미터이다. 그리고, K(r)은, 그 값이 작을수록, SBR에 의해 생성된 고주파 성분의 시간 포락선을 급격하게 하는 처리를 약하게 하도록 복호기[예를 들면, 음성 복호 장치(21) 등]에 지시하기 위한 파라미터라도 되고, 시간 포락선을 급격하게 하는 처리를 실행하지 않는 것을 나타내는 값을 포함해도 된다. 또한, 각 시간 슬롯의 K(r)을 전송하지 않고, 복수의 시간 슬롯에 대하여 대표하는 K(r)을 전송해도 된다. 동일한 K(r)의 값을 공유하는 시간 슬롯의 구간을 결정하기 위해서는, SBR 보조 정보에 포함되는 SBR 포락선의 시간 경계(SBR envelope time border) 정보를 사용하는 것이 바람직하다.
K(r)은, 양자화된 후에 비트스트림 다중화부(1g)에 송신된다. 양자화 전에 복수의 시간 슬롯 r에 대하여, 예를 들면, K(r)의 평균을 취함으로써, 복수의 시간 슬롯에 대하여 대표하는 K(r)을 계산하는 것이 바람직하다. 또한, 복수의 시간 슬롯을 대표하는 K(r)을 전송하는 경우에는, K(r)의 산출을 수식 2와 같이 개개의 시간 슬롯을 분석한 결과로부터 독립적으로 행하지 않고, 복수의 시간 슬롯으로 이루어지는 구간 전체의 분석 결과로부터 이들을 대표하는 K(r)을 취득해도 된다. 이 경우의 K(r)의 산출은, 예를 들면, 다음의 수식 3에 따라 행할 수 있다. 단, mean(?)은, K(r)에 의해 대표되는 시간 슬롯의 구간 내에서의 평균값을 나타낸다.
[수식 3]
Figure pat00003
그리고, K(r)을 전송할 때는, "ISO/IEC 14496-3 subpart 4 General Audio Coding"에 기재된 SBR 보조 정보에 포함되는 역필터 모드 정보와 배타적으로 전송해도 된다. 즉, SBR 보조 정보의 역필터 모드 정보를 전송하는 시간 슬롯에 대하여는 K(r)을 전송하지 않고, K(r)을 전송하는 시간 슬롯에 대하여는 SBR 보조 정보의 역필터 모드 정보("ISO/IEC 14496-3 subpart 4 General Audio Coding"에 있어서의 bs#invf#mode)를 전송하지 않아도 된다. 그리고, K(r) 또는 SBR 보조 정보에 포함되는 역필터 모드 정보의 어느 것을 전송하거나를 나타내는 정보를 부가해도 된다. 또한, K(r)과 SBR 보조 정보에 포함되는 역필터 모드 정보를 조합하여 하나의 벡터 정보로서 취급하고, 이 벡터를 엔트로피 부호화해도 된다. 이 때, K(r)과 SBR 보조 정보에 포함되는 역필터 모드 정보의 값의 조합에 제약을 가해도 된다.
비트스트림 다중화부(1g)는, 코어 코덱 부호화부(1c)에 의해 산출된 부호화 비트스트림과, SBR 부호화부(1d)에 의해 산출된 SBR 보조 정보와, 필터 강도 파라미터 산출부(1f)에 의해 산출된 K(r)을 다중화하고, 다중화 비트스트림(부호화된 다중화 비트스트림)을, 음성 부호화 장치(11)의 통신 장치를 통하여 출력한다(단계 Sa7의 처리).
도 3은, 제1 실시예에 따른 음성 복호 장치(21)의 구성을 나타낸 도면이다. 음성 복호 장치(21)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(21)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 4의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(21)를 통괄적으로 제어한다. 음성 복호 장치(21)의 통신 장치는, 음성 부호화 장치(11), 후술하는 변형예 1의 음성 부호화 장치(11a), 또는 후술하는 변형예 2의 음성 부호화 장치로부터 출력되는 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(21)는, 도 3에 나타낸 바와 같이, 기능적으로는, 비트스트림 분리부(2a)(비트스트림 분리 수단), 코어 코덱 복호부(2b)(코어 복호 수단), 주파수 변환부(2c)(주파수 변환 수단), 저주파 선형 예측 분석부(2d)(저주파 시간 포락선 분석 수단), 신호 변화 검출부(2e), 필터 강도 조정부(2f)(시간 포락선 조정 수단), 고주파 생성부(2g)(고주파 생성 수단), 고주파 선형 예측 분석부(2h), 선형 예측 역필터부(2i), 고주파 조정부(2j)(고주파 조정 수단), 선형 예측 필터부(2k)(시간 포락선 변형 수단), 계수 가산부(2m) 및 주파수 역변환부(2n)를 구비한다. 도 3에 나타내는 음성 복호 장치(21)의 비트스트림 분리부(2a)?주파수 역변환부(2n)는, 음성 복호 장치(21)의 CPU가 음성 복호 장치(21)의 내장 메모리에 저장된 컴퓨터 프로그램을 실행함으로써 실현되는 기능이다. 음성 복호 장치(21)의 CPU는, 이 컴퓨터 프로그램을 실행함으로써[도 3에 나타내는 비트스트림 분리부(2a)?포락선 형상 파라미터 산출부(1n)를 사용하여], 도 4의 흐름도에 나타내는 처리(단계 Sb1?단계 Sb11의 처리)를 차례로 실행한다. 이 컴퓨터 프로그램의 실행에 필요한 각종 데이터, 및 이 컴퓨터 프로그램의 실행에 의해 생성된 각종 데이터는, 모두, 음성 복호 장치(21)의 ROM이나 RAM 등의 내장 메모리에 저장되는 것으로 한다.
비트스트림 분리부(2a)는, 음성 복호 장치(21)의 통신 장치를 통하여 입력된 다중화 비트스트림을, 필터 강도 파라미터와, SBR 보조 정보와, 부호화 비트스트림으로 분리한다. 코어 코덱 복호부(2b)는, 비트스트림 분리부(2a)로부터 주어진 부호화 비트스트림을 복호하여, 저주파 성분만을 포함하는 복호 신호를 얻는다(단계 Sb1의 처리). 이 때, 복호의 방식은, CELP 방식으로 대표되는 음성 부호화 방식에 기초해도 되고, 또한 AAC나 TCX(Transform Coded Excitation) 방식 등의 음향 부호화에 기초해도 된다.
주파수 변환부(2c)는, 코어 코덱 복호부(2b)로부터 주어진 복호 신호를 다분할 QMF 필터 뱅크에 의해 분석하여, QMF 영역의 신호 qdec(k, r)을 얻는다(단계 Sb2의 처리). 단, k(0≤k≤63)는 주파수 방향의 인덱스이며, r은 QMF 영역의 신호의 서브 샘플에 관한 시간 방향의 인덱스를 나타내는 인덱스이다.
저주파 선형 예측 분석부(2d)는, 주파수 변환부(2c)로부터 얻어진 qdec(k, r)을 시간 슬롯 r의 각각에 관하여 주파수 방향으로 선형 예측 분석하고, 저주파 선형 예측 계수 adec(n, r)을 취득한다(단계 Sb3의 처리). 선형 예측 분석은, 코어 코덱 복호부(2b)로부터 얻어진 복호 신호의 신호 대역에 대응하는 0≤k<kx의 범위에 대하여 행한다. 또한, 이 선형 예측 분석은 0≤k<kx의 구간에 포함되는 일부 주파수 대역에 대한 것이라도 된다.
신호 변화 검출부(2e)는, 주파수 변환부(2c)로부터 얻어진 QMF 영역의 신호의 시간 변화를 검출하여, 검출 결과 T(r)로서 출력한다. 신호 변화의 검출은, 예를 들면, 이하에 나타내는 방법에 따라 행할 수 있다.
1. 시간 슬롯 r에 있어서의 신호의 단시간 전력 p(r)을 다음 수식 4에 의해 취득한다.
[수식 4]
Figure pat00004
2. p(r)을 평활화한 포락선 penv(r)을 다음 수식 5에 의해 취득한다. 다만, α는 0<α<1을 만족시키는 상수이다.
[수식 5]
Figure pat00005
3. p(r)과 penv(r)을 사용하여 T(r)을 다음의 수식 6에 따라 취득한다. 다만, β는 상수이다.
[수식 6]
Figure pat00006
이상으로 나타낸 방법은 전력의 변화에 따른 신호 변화 검출의 단순한 예이며, 좀 더 세련된 다른 방법에 의해 신호 변화 검출을 행해도 된다. 또한, 신호 변화 검출부(2e)는 생략해도 된다.
필터 강도 조정부(2f)는, 저주파 선형 예측 분석부(2d)로부터 얻어진 adec(n, r)에 대하여 필터 강도의 조정을 행하여, 조정된 선형 예측 계수 aadj(n, r)을 얻는다(단계 Sb4의 처리). 필터 강도의 조정은, 비트스트림 분리부(2a)를 통하여 수신된 필터 강도 파라미터 K를 사용하여, 예를 들면, 다음 수식 7에 따라 행할 수 있다.
[수식 7]
Figure pat00007
또한, 신호 변화 검출부(2e)의 출력 T(r)을 얻을 수 있는 경우에는, 강도의 조정은 다음 수식 8에 따라 행해도 된다.
[수식 8]
Figure pat00008
고주파 생성부(2g)는, 주파수 변환부(2c)로부터 얻어진 QMF 영역의 신호를 저주파 대역으로부터 고주파 대역에 복사하고, 고주파 성분의 QMF 영역의 신호 qexp(k, r)을 생성한다(단계 Sb5의 처리). 고주파의 생성은, "MPEG4 AAC"의 SBR에 있어서의 HF generation의 방법에 따라 행한다("ISO/IEC 14496-3 subpart 4 General Audio Coding").
고주파 선형 예측 분석부(2h)는, 고주파 생성부(2g)에 의해 생성된 qexp(k, r)을 시간 슬롯 r의 각각에 관하여 주파수 방향으로 선형 예측 분석하여, 고주파 선형 예측 계수 aexp(n, r)을 취득한다(단계 Sb6의 처리). 선형 예측 분석은, 고주파 생성부(2g)에 의해 생성된 고주파 성분에 대응하는 kx≤k≤63의 범위에 대하여 행한다.
선형 예측 역필터부(2i)는, 고주파 생성부(2g)에 의해 생성된 고주파 대역의 QMF 영역의 신호를 대상으로, 주파수 방향으로 aexp(n, r)을 계수로 하는 선형 예측 역필터 처리를 행한다(단계 Sb7의 처리). 선형 예측 역필터의 전달 함수는 다음 수식 9에 나타낸 바와 같다.
[수식 9]
Figure pat00009
이 선형 예측 역필터 처리는, 저주파 측의 계수로부터 고주파 측의 계수로 향하여 행해져도 되고, 그 역이라도 된다. 선형 예측 역필터 처리는, 후단에 있어서 시간 포락선 변형을 행하기 전에 고주파 성분의 시간 포락선을 일단 평탄화해 두기 위한 처리이며, 선형 예측 역필터부(2i)는 생략되어도 된다. 또한, 고주파 생성부(2g)로부터의 출력에 대하여 고주파 성분으로의 선형 예측 분석과 역필터 처리를 행하는 대신, 후술하는 고주파 조정부(2j)로부터의 출력에 대하여 고주파 선형 예측 분석부(2h)에 의한 선형 예측 분석과 선형 예측 역필터부(2i)에 의한 역필터 처리를 행해도 된다. 또한, 선형 예측 역필터 처리에 사용하는 선형 예측 계수는, aexp(n, r)이 아니라, adec(n, r) 또는 aadj(n, r)이라도 된다. 또한, 선형 예측 역필터 처리에 사용되는 선형 예측 계수는, aexp(n, r)에 대하여 필터 강도 조정을 행하여 취득되는 선형 예측 계수 aexp, adj(n, r)이라도 된다. 강도 조정은, aadj(n, r)을 취득할 때와 마찬가지로, 예를 들면, 다음 수식 10에 따라 행해진다.
[수식 10]
Figure pat00010
고주파 조정부(2j)는, 선형 예측 역필터부(2i)로부터의 출력에 대하여 고주파 성분의 주파수 특성 및 조성의 조정을 행한다(단계 Sb8의 처리). 이 조정은 비트스트림 분리부(2a)로부터 주어진 SBR 보조 정보에 따라 행해진다. 고주파 조정부(2j)에 의한 처리는, "MPEG4 AAC"의 SBR에 있어서의 "HF adjustment" 단계에 따라 행해지는 것으로서, 고주파 대역의 QMF 영역의 신호에 대하여, 시간 방향의 선형 예측 역필터 처리, 게인의 조정 및 노이즈의 중첩을 행하는 것에 의한 조정이다. 이상의 단계에 있어서의 처리에 대하여는 "ISO/IEC 14496-3 subpart 4 General Audio Coding"에 상세하게 기술되어 있다. 그리고, 전술한 바와 같이, 주파수 변환부(2c), 고주파 생성부(2g) 및 고주파 조정부(2j)는, 모두, "ISO/IEC 14496-3"에 규정되는 "MPEG4 AAC"에 있어서의 SBR 복호기에 준거한 동작을 행한다.
선형 예측 필터부(2k)는, 고주파 조정부(2j)로부터 출력된 QMF 영역의 신호의 고주파 성분 qadj(n, r)에 대하여, 필터 강도 조정부(2f)로부터 얻어진 aadj(n, r)을 사용하여 주파수 방향으로 선형 예측 합성 필터 처리를 행한다(단계 Sb9의 처리). 선형 예측 합성 필터 처리에서의 전달 함수는 다음 수식 11에 나타낸 바와 같다.
[수식 11]
Figure pat00011
이 선형 예측 합성 필터 처리에 의해, 선형 예측 필터부(2k)는, SBR에 기초하여 생성된 고주파 성분의 시간 포락선을 변형시킨다.
계수 가산부(2m)는, 주파수 변환부(2c)로부터 출력된 저주파 성분을 포함하는 QMF 영역의 신호와, 선형 예측 필터부(2k)로부터 출력된 고주파 성분을 포함하는 QMF 영역의 신호를 가산하여, 저주파 성분과 고주파 성분의 양쪽을 포함하는 QMF 영역의 신호를 출력한다(단계 Sb10의 처리).
주파수 역변환부(2n)는, 계수 가산부(2m)로부터 얻어진 QMF 영역의 신호를 QMF 합성 필터 뱅크에 의해 처리한다. 이로써, 코어 코덱의 복호에 의해 얻어진 저주파 성분과, SBR에 의해 생성된 선형 예측 필터에 의해 시간 포락선이 변형된 고주파 성분의 양쪽을 포함하는 시간 영역의 복호한 음성 신호를 취득하고, 이 취득한 음성 신호를, 내장하는 통신 장치를 통하여 외부에 출력한다(단계 Sb11의 처리). 그리고, 주파수 역변환부(2n)는, K(r)과 "ISO/IEC 14496-3 subpart 4 General Audio Coding"에 기재된 SBR 보조 정보의 역필터 모드 정보가 배타적으로 전송되었을 경우, K(r)이 전송되는 SBR 보조 정보의 역필터 모드 정보의 전송되지 않는 시간 슬롯에 대하여는, 상기 시간 슬롯의 전후에 있어서의 시간 슬롯 중 적어도 1개의 시간 슬롯에 대한 SBR 보조 정보의 역필터 모드 정보를 사용하여, 상기 시간 슬롯의 SBR 보조 정보의 역필터 모드 정보를 생성해도 되고, 상기 시간 슬롯의 SBR 보조 정보의 역필터 모드 정보를 미리 결정된 소정의 모드로 설정해도 된다. 한편, 주파수 역변환부(2n)는, SBR 보조 정보의 역필터 데이터가 전송되고 K(r)이 전송되지 않는 시간 슬롯에 대하여는, 상기 시간 슬롯의 전후에 있어서의 시간 슬롯 중 적어도 1개의 시간 슬롯에 대한 K(r)을 사용하여, 상기 시간 슬롯의 K(r)을 생성해도 되고, 상기 시간 슬롯의 K(r)을 미리 결정된 소정값으로 설정해도 된다. 그리고, 주파수 역변환부(2n)는, K(r) 또는 SBR 보조 정보의 역필터 모드 정보 중 어느 것을 전송했는지를 나타내는 정보에 기초하여, 전송된 정보가, K(r)인가, 혹은 SBR 보조 정보의 역필터 모드 정보인가를 판단해도 된다.
(제1 실시예의 변형예 1)
도 5는, 제1 실시예에 따른 음성 부호화 장치의 변형예[음성 부호화 장치(11a)]의 구성을 나타낸 도면이다. 음성 부호화 장치(11a)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(11a)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드 하여 실행함으로써 음성 부호화 장치(11a)를 통괄적으로 제어한다. 음성 부호화 장치(11a)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다.
음성 부호화 장치(11a)는, 도 5에 나타낸 바와 같이, 기능적으로는, 음성 부호화 장치(11)의 선형 예측 분석부(1e), 필터 강도 파라미터 산출부(1f) 및 비트스트림 다중화부(1g) 대신, 고주파 주파수 역변환부(1h), 단시간 전력 산출부(1i)(시간 포락선 보조 정보 산출 수단), 필터 강도 파라미터 산출부(1f1)(시간 포락선 보조 정보 산출 수단) 및 비트스트림 다중화부(1g1)(비트스트림 다중화 수단)를 구비한다. 비트스트림 다중화부(1g1)는 비트스트림 다중화부(1g)와 동일한 기능을 가진다. 도 5에 나타내는 음성 부호화 장치(11a)의 주파수 변환부(1a)?SBR 부호화부(1d), 고주파 주파수 역변환부(1h), 단시간 전력 산출부(1i), 필터 강도 파라미터 산출부(1f1) 및 비트스트림 다중화부(1g1)는, 음성 부호화 장치(11a)의 CPU가 음성 부호화 장치(11a)의 내장 메모리에 저장된 컴퓨터 프로그램을 실행함으로써 실현되는 기능이다. 이 컴퓨터 프로그램의 실행에 필요한 각종 데이터, 및 이 컴퓨터 프로그램의 실행에 의해 생성된 각종 데이터는, 모두, 음성 부호화 장치(11a)의 ROM이나 RAM 등의 내장 메모리에 저장되는 것으로 한다.
고주파 주파수 역변환부(1h)는, 주파수 변환부(1a)로부터 얻어진 QMF 영역의 신호 중, 코어 코덱 부호화부(1c)에 의해 부호화되는 저주파 성분에 대응하는 계수를 "0"으로 치환하여 후에 QMF 합성 필터 뱅크를 사용하여 처리하여, 고주파 성분만이 포함된 시간 영역 신호를 얻는다. 단시간 전력 산출부(1i)는, 고주파 주파수 역변환부(1h)로부터 얻어진 시간 영역의 고주파 성분을 짧은 구간으로 구획하여 그 전력을 산출하여, p(r)을 산출한다. 그리고, 대체할 수 있는 방법으로서, QMF 영역의 신호를 사용하여 다음 수식 12에 따라 단시간 전력을 산출해도 된다.
[수식 12]
Figure pat00012
필터 강도 파라미터 산출부(1f1)는, p(r)의 변화 부분을 검출하고, 변화가 클수록 K(r)가 커지도록, K(r)의 값을 결정한다. K(r)의 값은, 예를 들면, 음성 복호 장치(21)의 신호 변화 검출부(2e)에 있어서의 T(r)의 산출과 동일한 방법으로 행해도 된다. 또한, 좀 더 세련된 다른 방법에 의해 신호 변화 검출을 행해도 된다. 또한, 필터 강도 파라미터 산출부(1f1)는, 저주파 성분과 고주파 성분 각각에 대하여 단시간 전력을 취득한 후에 음성 복호 장치(21)의 신호 변화 검출부(2e)에 있어서의 T(r)의 산출과 동일한 방법에 의해 저주파 성분 및 고주파 성분 각각의 신호 변화 Tr(r), Th(r)을 취득하고, 이들을 사용하여 K(r)의 값을 결정해도 된다. 이 경우, K(r)은, 예를 들면, 다음 수식 13에 따라 취득할 수 있다. 단, ε는, 예를 들면, 3.0 등의 상수이다.
[수식 13]
Figure pat00013
(제1 실시예의 변형예 2)
제1 실시예의 변형예 2의 음성 부호화 장치(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 변형예 2의 음성 부호화 장치의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 변형예 2의 음성 부호화 장치를 통괄적으로 제어한다. 변형예 2의 음성 부호화 장치의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다.
변형예 2의 음성 부호화 장치는, 기능적으로는, 음성 부호화 장치(11)의 필터 강도 파라미터 산출부(1f) 및 비트스트림 다중화부(1g) 대신, 도시하지 않은 선형 예측 계수 차분 부호화부(시간 포락선 보조 정보 산출 수단)와, 이 선형 예측 계수 차분 부호화부로부터의 출력을 받는 비트스트림 다중화부(비트스트림 다중화 수단)를 구비한다. 변형예 2의 음성 부호화 장치의 주파수 변환부(1a)?선형 예측 분석부(1e), 선형 예측 계수 차분 부호화부, 및 비트스트림 다중화부는, 변형예 2의 음성 부호화 장치의 CPU가 변형예 2의 음성 부호화 장치의 내장 메모리에 저장된 컴퓨터 프로그램을 실행함으로써 실현되는 기능이다. 이 컴퓨터 프로그램의 실행에 필요한 각종 데이터, 및 이 컴퓨터 프로그램의 실행에 의해 생성된 각종 데이터는, 모두, 변형예 2의 음성 부호화 장치의 ROM이나 RAM 등의 내장 메모리에 저장되는 것으로 한다.
선형 예측 계수 차분 부호화부는, 입력 신호의 aH(n, r)과 입력 신호의 aL(n, r)을 사용하여, 다음 수식 14에 따라 선형 예측 계수의 차분값 aD(n, r)을 산출한다.
[수식 14]
Figure pat00014
선형 예측 계수 차분 부호화부는, 또한 aD(n, r)을 양자화하고, 비트스트림 다중화부[비트스트림 다중화부(1g)에 대응하는 구성]에 송신한다. 이 비트스트림 다중화부는, K(r) 대신 aD(n, r)을 비트스트림으로 다중화하고, 이 다중화 비트스트림을 내장하는 통신 장치를 통하여 외부에 출력한다.
제1 실시예의 변형예 2의 음성 복호 장치(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 변형예 2의 음성 복호 장치의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 변형예 2의 음성 복호 장치를 통괄적으로 제어한다. 변형예 2의 음성 복호 장치의 통신 장치는, 음성 부호화 장치(11), 변형예 1에 따른 음성 부호화 장치(11a), 또는 변형예 2에 따른 음성 부호화 장치로부터 출력되는 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다.
변형예 2의 음성 복호 장치는, 기능적으로는, 음성 복호 장치(21)의 필터 강도 조정부(2f) 대신, 도시하지 않은 선형 예측 계수 차분 복호부를 구비한다. 변형예 2의 음성 복호 장치의 비트스트림 분리부(2a)?신호 변화 검출부(2e), 선형 예측 계수 차분 복호부, 및 고주파 생성부(2g)?주파수 역변환부(2n)는, 변형예 2의 음성 복호 장치의 CPU가 변형예 2의 음성 복호 장치의 내장 메모리에 저장된 컴퓨터 프로그램을 실행함으로써 실현되는 기능이다. 이 컴퓨터 프로그램의 실행에 필요한 각종 데이터, 및 이 컴퓨터 프로그램의 실행에 의해 생성된 각종 데이터는, 모두, 변형예 2의 음성 복호 장치의 ROM이나 RAM 등의 내장 메모리에 저장되는 것으로 한다.
선형 예측 계수 차분 복호부는, 저주파 선형 예측 분석부(2d)로부터 얻어진 aL(n, r)과 비트스트림 분리부(2a)로부터 주어진 aD(n, r)을 이용하여, 다음 수식 15에 따라 차분 복호된 aadj(n, r)을 얻는다.
[수식 15]
Figure pat00015
선형 예측 계수 차분 복호부는, 이와 같이 하여 차분 복호된 aadj(n, r)을 선형 예측 필터부(2k)에 송신한다. aD(n, r)은, 수식 14에 나타낸 바와 같이 예측 계수의 영역에서의 차분값이라도 되지만, 예측 계수를 LSP(Linear Spectrum Pair), ISP(Immittance Spectrum Pair), LSF(Linear Spectrum Frequency), ISF(Immittance Spectrum Frequency), PARCOR 계수 등의 다른 표현 형식으로 변환한 후에 차분을 취한 값이라도 된다. 이 경우, 차분 복호도 마찬가지로 이 표현의 양식과 동일하게 된다.
(제2 실시예)
도 6은, 제2 실시예에 따른 음성 부호화 장치(12)의 구성을 나타낸 도면이다. 음성 부호화 장치(12)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(12)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 7의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 부호화 장치(12)를 통괄적으로 제어한다. 음성 부호화 장치(12)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다.
음성 부호화 장치(12)는, 기능적으로는, 음성 부호화 장치(11)의 필터 강도 파라미터 산출부(1f) 및 비트스트림 다중화부(1g) 대신, 선형 예측 계수 솎아냄부(1j)(예측 계수 솎아냄 수단), 선형 예측 계수 양자화부(1k)(예측 계수 양자화 수단) 및 비트스트림 다중화부(1g2)(비트스트림 다중화 수단)를 구비한다. 도 6에 나타내는 음성 부호화 장치(12)의 주파수 변환부(1a)?선형 예측 분석부(1e)(선형 예측 분석 수단), 선형 예측 계수 솎아냄부(1j), 선형 예측 계수 양자화부(1k) 및 비트스트림 다중화부(1g2)는, 음성 부호화 장치(12)의 CPU가 음성 부호화 장치(12)의 내장 메모리에 저장된 컴퓨터 프로그램을 실행함으로써 실현되는 기능이다. 음성 부호화 장치(12)의 CPU는, 이 컴퓨터 프로그램을 실행함으로써[도 6에 나타내는 음성 부호화 장치(12)의 주파수 변환부(1a)?선형 예측 분석부(1e), 선형 예측 계수 솎아냄부(1j), 선형 예측 계수 양자화부(1k) 및 비트스트림 다중화부(1g2)를 사용하여], 도 7의 흐름도에 나타내는 처리(단계 Sa1?단계 Sa5, 및 단계 Sc1?단계 Sc3의 처리)를 차례로 실행한다. 이 컴퓨터 프로그램의 실행에 필요한 각종 데이터, 및 이 컴퓨터 프로그램의 실행에 의해 생성된 각종 데이터는, 모두, 음성 부호화 장치(12)의 ROM이나 RAM 등의 내장 메모리에 저장되는 것으로 한다.
선형 예측 계수 솎아냄부(1j)는, 선형 예측 분석부(1e)로부터 얻어진 aH(n, r)을 시간 방향으로 솎아내고, aH(n, r) 중 일부 시간 슬롯 ri에 대한 값과 대응하는 ri의 값을 선형 예측 계수 양자화부(1k)에 송신한다(단계 Sc1의 처리). 단, 0≤i<Nts이며, Nts는 프레임 중 aH(n, r)의 전송이 행해지는 시간 슬롯의 수이다. 선형 예측 계수의 솎아냄은, 일정한 시간 간격에 의한 것이라도 되고, 또한, aH(n, r)의 성질에 기초한 부등 시간 간격의 솎아냄이라도 된다. 예를 들면, 소정 길이를 가지는 프레임 중에서 aH(n, r)의 GH(r)을 비교하여, GH(r)이 일정한 값을 초과했을 경우에 aH(n, r)을 양자화의 대상으로 하는 등의 방법을 고려할 수 있다. 선형 예측 계수의 솎아냄 간격을 aH(n, r)의 성질에 의하지 않고 일정한 간격으로 하는 경우에는, 전송의 대상이 되지 않는 시간 슬롯에 대하여는 aH(n, r)을 산출할 필요가 없다.
선형 예측 계수 양자화부(1k)는, 선형 예측 계수 솎아냄부(1j)로부터 주어진 솎아냄 후의 고주파 선형 예측 계수 aH(n, ri)와 대응하는 시간 슬롯의 인덱스 ri를 양자화하고, 비트스트림 다중화부(1g2)에 송신한다(단계 Sc2의 처리). 그리고, 대체할 수 있는 구성으로서, aH(n, ri)를 양자화하는 대신, 제1 실시예의 변형예 2에 따른 음성 부호화 장치와 마찬가지로, 선형 예측 계수의 차분값 aD(n, ri)를 양자화의 대상으로 해도 된다.
비트스트림 다중화부(1g2)는, 코어 코덱 부호화부(1c)에서 산출된 부호화 비트스트림과, SBR 부호화부(1d)에서 산출된 SBR 보조 정보와, 선형 예측 계수 양자화부(1k)로부터 주어진 양자화 후의 aH(n, ri)에 대응하는 시간 슬롯의 인덱스 {ri}를 비트스트림으로 다중화하여, 이 다중화 비트스트림을, 음성 부호화 장치(12)의 통신 장치를 통하여 출력한다(단계 Sc3의 처리).
도 8은, 제2 실시예에 따른 음성 복호 장치(22)의 구성을 나타낸 도면이다. 음성 복호 장치(22)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(22)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 9의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(22)를 통괄적으로 제어한다. 음성 복호 장치(22)의 통신 장치는, 음성 부호화 장치(12)로부터 출력되는 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다.
음성 복호 장치(22)는, 기능적으로는, 음성 복호 장치(21)의 비트스트림 분리부(2a), 저주파 선형 예측 분석부(2d), 신호 변화 검출부(2e), 필터 강도 조정부(2f) 및 선형 예측 필터부(2k) 대신, 비트스트림 분리부(2a1)(비트스트림 분리 수단), 선형 예측 계수 보간?보외부(2p)(선형 예측 계수 보간?보외 수단) 및 선형 예측 필터부(2k1)(시간 포락선 변형 수단)를 구비한다. 도 8에 나타내는 음성 복호 장치(22)의 비트스트림 분리부(2a1), 코어 코덱 복호부(2b), 주파수 변환부(2c), 고주파 생성부(2g)?고주파 조정부(2j), 선형 예측 필터부(2k1), 계수 가산부(2m), 주파수 역변환부(2n), 및 선형 예측 계수 보간?보외부(2p)는, 음성 복호 장치(22)의 CPU가 음성 복호 장치(22)의 내장 메모리에 저장된 컴퓨터 프로그램을 실행함으로써 실현되는 기능이다. 음성 복호 장치(22)의 CPU는, 이 컴퓨터 프로그램을 실행함으로써[도 8에 나타내는 비트스트림 분리부(2a1), 코어 코덱 복호부(2b), 주파수 변환부(2c), 고주파 생성부(2g)?고주파 조정부(2j), 선형 예측 필터부(2k1), 계수 가산부(2m), 주파수 역변환부(2n), 및 선형 예측 계수 보간?보외부(2p)를 사용하여], 도 9의 흐름도에 나타내는 처리(단계 Sb1?단계 Sb2, 단계 Sd1, 단계 Sb5?단계 Sb8, 단계 Sd2, 및 단계 Sb10?단계 Sb11의 처리)를 차례로 실행한다. 이 컴퓨터 프로그램의 실행에 필요한 각종 데이터, 및 이 컴퓨터 프로그램의 실행에 의해 생성된 각종 데이터는, 모두, 음성 복호 장치(22)의 ROM이나 RAM 등의 내장 메모리에 저장되는 것으로 한다.
음성 복호 장치(22)는, 음성 복호 장치(22)의 비트스트림 분리부(2a), 저주파 선형 예측 분석부(2d), 신호 변화 검출부(2e), 필터 강도 조정부(2f) 및 선형 예측 필터부(2k) 대신, 비트스트림 분리부(2a1), 선형 예측 계수 보간?보외부(2p) 및 선형 예측 필터부(2k1)를 구비한다.
비트스트림 분리부(2a1)는, 음성 복호 장치(22)의 통신 장치를 통하여 입력된 다중화 비트스트림을, 양자화된 aH(n, ri)에 대응하는 시간 슬롯의 인덱스 ri와 SBR 보조 정보와, 부호화 비트스트림으로 분리한다.
선형 예측 계수 보간?보외부(2p)는, 양자화된 aH(n, ri)에 대응하는 시간 슬롯의 인덱스 ri를 비트스트림 분리부(2a1)로부터 수취하고, 선형 예측 계수의 전송되고 있지 않은 시간 슬롯에 대응하는 aH(n, r)을, 보간 또는 보외에 의해 취득한다(단계 Sd1의 처리). 선형 예측 계수 보간?보외부(2p)는, 선형 예측 계수의 보외를, 예를 들면, 다음 수식 16에 따라 행할 수 있다.
[수식 16]
Figure pat00016
단, ri0는 선형 예측 계수가 전송되고 있는 시간 슬롯 {ri} 중 r에 가장 가까운 것으로 한다. 또한, δ는 0<δ<1을 만족시키는 상수이다.
또한, 선형 예측 계수 보간?보외부(2p)는, 선형 예측 계수의 보간을, 예를 들면, 다음 수식 17에 따라 행할 수 있다. 단, ri0<r<ri0 +1을 만족시킨다.
[수식 17]
Figure pat00017
그리고, 선형 예측 계수 보간?보외부(2p)는, 선형 예측 계수를 LSP(Linear Spectrum Pair), ISP(Immittance Spectrum Pair), LSF(Linear Spectrum Frequency), ISF(Immittance Spectrum Frequency), PARCOR 계수 등의 다른 표현 양식으로 변환한 후에 보간?보외하여, 얻어진 값을 선형 예측 계수로 변환하여 사용해도 된다. 보간 또는 보외 후의 aH(n, r)은 선형 예측 필터부(2k1)에 송신되고, 선형 예측 합성 필터 처리에 있어서의 선형 예측 계수로서 이용되지만, 선형 예측 역필터부(2i)에 있어서의 선형 예측 계수로서 이용되어도 된다. 비트스트림에 aH(n, r)이 아니라 aD(n, ri)가 다중화되어 있는 경우, 선형 예측 계수 보간?보외부(2p)는, 상기 보간 또는 보외 처리에 앞서, 제1 실시예의 변형예 2에 따른 음성 복호 장치와 마찬가지의 차분 복호 처리를 행한다.
선형 예측 필터부(2k1)는, 고주파 조정부(2j)로부터 출력된 qadj(n, r)에 대하여, 선형 예측 계수 보간?보외부(2p)로부터 얻어진, 보간 또는 보외된 aH(n, r)을 사용하여 주파수 방향으로 선형 예측 합성 필터 처리를 행한다(단계 Sd2의 처리). 선형 예측 필터부(2k1)의 전달 함수는 다음 수식 18에 나타낸 바와 같다. 선형 예측 필터부(2k1)는, 음성 복호 장치(21)의 선형 예측 필터부(2k)와 마찬가지로, 선형 예측 합성 필터 처리를 행함으로써, SBR에 의해 생성된 고주파 성분의 시간 포락선을 변형시킨다.
[수식 18]
Figure pat00018
(제3 실시예)
도 10은, 제3 실시예에 따른 음성 부호화 장치(13)의 구성을 나타낸 도면이다. 음성 부호화 장치(13)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(13)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 11의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 부호화 장치(13)를 통괄적으로 제어한다. 음성 부호화 장치(13)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다.
음성 부호화 장치(13)는, 기능적으로는, 음성 부호화 장치(11)의 선형 예측 분석부(1e), 필터 강도 파라미터 산출부(1f) 및 비트스트림 다중화부(1g) 대신, 시간 포락선 산출부(1m)(시간 포락선 보조 정보 산출 수단), 포락선 형상 파라미터 산출부(1n)(시간 포락선 보조 정보 산출 수단) 및 비트스트림 다중화부(1g3)(비트스트림 다중화 수단)를 구비한다. 도 10에 나타내는 음성 부호화 장치(13)의 주파수 변환부(1a)?SBR 부호화부(1d), 시간 포락선 산출부(1m), 포락선 형상 파라미터 산출부(1n), 및 비트스트림 다중화부(1g3)는, 음성 부호화 장치(13)의 CPU가 음성 부호화 장치(13)의 내장 메모리에 저장된 컴퓨터 프로그램을 실행함으로써 실현되는 기능이다. 음성 부호화 장치(13)의 CPU는, 이 컴퓨터 프로그램을 실행함으로써[도 10에 나타내는 음성 부호화 장치(13)의 주파수 변환부(1a)?SBR 부호화부(1d), 시간 포락선 산출부(1m), 포락선 형상 파라미터 산출부(1n), 및 비트스트림 다중화부(1g3)를 사용하여], 도 11의 흐름도에 나타내는 처리(단계 Sa1?단계 Sa4, 및 단계 Se1?단계 Se3의 처리)를 차례로 실행한다. 이 컴퓨터 프로그램의 실행에 필요한 각종 데이터, 및 이 컴퓨터 프로그램의 실행에 의해 생성된 각종 데이터는, 모두, 음성 부호화 장치(13)의 ROM이나 RAM 등의 내장 메모리에 저장되는 것으로 한다.
시간 포락선 산출부(1m)는, q(k, r)을 수취하고, 예를 들면, q(k, r)의 시간 슬롯마다의 전력을 취득함으로써, 신호의 고주파 성분의 시간 포락선 정보 e(r)을 취득한다(단계 Se1의 처리). 이 경우, e(r)은 다음 수식 19에 따라 취득된다.
[수식 19]
Figure pat00019
포락선 형상 파라미터 산출부(1n)는, 시간 포락선 산출부(1m)로부터 e(r)을 수취하고, 또한 SBR 부호화부(1d)로부터 SBR 포락선의 시간 경계 {bi}를 수취한다. 단, 0≤i≤Ne이며, Ne는 부호화 프레임 내의 SBR 포락선의 수이다. 포락선 형상 파라미터 산출부(1n)는, 부호화 프레임 내의 SBR 포락선 각각에 대하여, 예를 들면, 다음 수식 20에 따라 포락선 형상 파라미터 s(i)(0≤i<Ne)를 취득한다(단계 Se2의 처리). 그리고, 포락선 형상 파라미터 s(i)는 시간 포락선 보조 정보에 대응하고 있고, 제3 실시예에 있어서 마찬가지로 한다.
[수식 20]
Figure pat00020
단,
[수식 21]
Figure pat00021
상기 수식에 있어서의 s(i)는 bi≤r<bi +1을 만족시키는 i번째의 SBR 포락선 내에 있어서의 e(r)의 변화의 크기를 나타내는 파라미터이며, 시간 포락선의 변화가 클수록 e(r)은 큰 값을 취한다. 상기의 수식 20 및 21은, s(i)의 산출 방법의 일례이며, 예를 들면, e(r)의 SMF(Spectral Flatness Measure)나, 최대값과 최소값의 비 등을 사용하여 s(i)를 취득해도 된다. 이 후, s(i)는 양자화되어 비트스트림 다중화부(1g3)에 전송된다.
비트스트림 다중화부(1g3)는, 코어 코덱 부호화부(1c)에 의해 산출된 부호화 비트스트림과, SBR 부호화부(1d)에 의해 산출된 SBR 보조 정보와, s(i)를 비트스트림으로 다중화하고, 이 다중화된 비트스트림을, 음성 부호화 장치(13)의 통신 장치를 통하여 출력한다(단계 Se3의 처리).
도 12는, 제3 실시예에 따른 음성 복호 장치(23)의 구성을 나타낸 도면이다. 음성 복호 장치(23)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(23)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 13의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(23)을 통괄적으로 제어한다. 음성 복호 장치(23)의 통신 장치는, 음성 부호화 장치(13)로부터 출력되는 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다.
음성 복호 장치(23)는, 기능적으로는, 음성 복호 장치(21)의 비트스트림 분리부(2a), 저주파 선형 예측 분석부(2d), 신호 변화 검출부(2e), 필터 강도 조정부(2f), 고주파 선형 예측 분석부(2h), 선형 예측 역필터부(2i) 및 선형 예측 필터부(2k) 대신, 비트스트림 분리부(2a2)(비트스트림 분리 수단), 저주파 시간 포락선 산출부(2r)(저주파 시간 포락선 분석 수단), 포락선 형상 조정부(2s)(시간 포락선 조정 수단), 고주파 시간 포락선 산출부(2t), 시간 포락선 평탄화부(2u) 및 시간 포락선 변형부(2v)(시간 포락선 변형 수단)를 구비한다. 도 12에 나타내는 음성 복호 장치(23)의 비트스트림 분리부(2a2), 코어 코덱 복호부(2b)?주파수 변환부(2c), 고주파 생성부(2g), 고주파 조정부(2j), 계수 가산부(2m), 주파수 역변환부(2n), 및 저주파 시간 포락선 산출부(2r)?시간 포락선 변형부(2v)는, 음성 복호 장치(23)의 CPU가 음성 복호 장치(23)의 내장 메모리에 저장된 컴퓨터 프로그램을 실행함으로써 실현되는 기능이다. 음성 복호 장치(23)의 CPU는, 이 컴퓨터 프로그램을 실행함으로써[도 12에 나타내는 음성 복호 장치(23)의 비트스트림 분리부(2a2), 코어 코덱 복호부(2b)?주파수 변환부(2c), 고주파 생성부(2g), 고주파 조정부(2j), 계수 가산부(2m), 주파수 역변환부(2n), 및 저주파 시간 포락선 산출부(2r)?시간 포락선 변형부(2v)를 사용하여], 도 13의 흐름도에 나타내는 처리(단계 Sb1?단계 Sb2, 단계 Sf1?단계 Sf2, 단계 Sb5, 단계 Sf3?단계 Sf4, 단계 Sb8, 단계 Sf5, 및 단계 Sb10?단계 Sb11의 처리)를 차례로 실행한다. 이 컴퓨터 프로그램의 실행에 필요한 각종 데이터, 및 이 컴퓨터 프로그램의 실행에 의해 생성된 각종 데이터는, 모두, 음성 복호 장치(23)의 ROM이나 RAM 등의 내장 메모리에 저장되는 것으로 한다.
비트스트림 분리부(2a2)는, 음성 복호 장치(23)의 통신 장치를 통하여 입력된 다중화 비트스트림을, s(i)와, SBR 보조 정보와, 부호화 비트스트림으로 분리한다. 저주파 시간 포락선 산출부(2r)는, 주파수 변환부(2c)로부터 저주파 성분을 포함하는 qdec(k, r)을 수취하고, e(r)을 다음 수식 22에 따라 취득한다(단계 Sf1의 처리).
[수식 22]
Figure pat00022
포락선 형상 조정부(2s)는, s(i)를 사용하여 e(r)을 조정하고, 조정 후의 시간 포락선 정보 eadj(r)을 취득한다(단계 Sf2의 처리). 이 e(r)에 대한 조정은, 예를 들면, 다음 수식 23?25에 따라 행할 수 있다.
[수식 23]
Figure pat00023
단,
[수식 24]
Figure pat00024
[수식 25]
Figure pat00025
이다.
상기 수식 23?25는 조정 방법의 일례이며, eadj(r)의 형상이 s(i)에 의해 나타내는 형상에 근접하도록 한 다른 조정 방법을 사용해도 된다.
고주파 시간 포락선 산출부(2t)는, 고주파 생성부(2g)로부터 얻어진 qexp(k, r)을 사용하여 시간 포락선 eexp(r)을 다음 수식 26에 따라 산출한다(단계 Sf3의 처리).
[수식 26]
Figure pat00026
시간 포락선 평탄화부(2u)는, 고주파 생성부(2g)로부터 얻어진 qexp(k, r)의 시간 포락선을 다음 수식 27에 따라 평탄화하여, 얻어진 QMF 영역의 신호 qflat(k, r)을 고주파 조정부(2j)에 송신한다(단계 Sf4의 처리).
[수식 27]
Figure pat00027
시간 포락선 평탄화부(2u)에 있어서의 시간 포락선의 평탄화는 생략되어도 된다. 또한, 고주파 생성부(2g)로부터의 출력에 대하여, 고주파 성분의 시간 포락선 산출과 시간 포락선의 평탄화 처리를 행하는 대신, 고주파 조정부(2j)로부터의 출력에 대하여, 고주파 성분의 시간 포락선 산출과 시간 포락선의 평탄화 처리를 행해도 된다. 또한, 시간 포락선 평탄화부(2u)에 있어서 사용하는 시간 포락선은, 고주파 시간 포락선 산출부(2t)로부터 얻어진 eexp(r)이 아니라, 포락선 형상 조정부(2s)로부터 얻어진 eadj(r)이라도 된다.
시간 포락선 변형부(2v)는, 고주파 조정부(2j)로부터 얻어진 qadj(k, r)을 시간 포락선 변형부(2v)로부터 얻어진 eadj(r)을 사용하여 변형시켜, 시간 포락선이 변형된 QMF 영역의 신호 qenvadj(k, r)을 취득한다(단계 Sf5의 처리). 이 변형은, 다음 수식 28에 따라 행해진다. qenvadj(k, r)은 고주파 성분에 대응하는 QMF 영역의 신호로서 계수 가산부(2m)에 송신된다.
[수식 28]
Figure pat00028
(제4 실시예)
도 14는, 제4 실시예에 따른 음성 복호 장치(24)의 구성을 나타낸 도면이다. 음성 복호 장치(24)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 복호 장치(24)를 통괄적으로 제어한다. 음성 복호 장치(24)의 통신 장치는, 음성 부호화 장치(11) 또는 음성 부호화 장치(13)로부터 출력되는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다.
음성 복호 장치(24)는, 기능적으로는, 음성 복호 장치(21)의 구성[코어 코덱 복호부(2b), 주파수 변환부(2c), 저주파 선형 예측 분석부(2d), 신호 변화 검출부(2e), 필터 강도 조정부(2f), 고주파 생성부(2g), 고주파 선형 예측 분석부(2h), 선형 예측 역필터부(2i), 고주파 조정부(2j), 선형 예측 필터부(2k), 계수 가산부(2m) 및 주파수 역변환부(2n)]과, 음성 복호 장치(23)의 구성[저주파 시간 포락선 산출부(2r), 포락선 형상 조정부(2s) 및 시간 포락선 변형부(2v)]을 구비한다. 또한, 음성 복호 장치(24)는, 비트스트림 분리부(2a3)(비트스트림 분리 수단) 및 보조 정보 변환부(2w)를 구비한다. 선형 예측 필터부(2k)와 시간 포락선 변형부(2v)의 순서는 도 14에 나타내는 것과 역이라도 된다. 그리고, 음성 복호 장치(24)는, 음성 부호화 장치(11) 또는 음성 부호화 장치(13)에 의해 부호화된 비트스트림을 입력으로 하는 것이 바람직하다. 도 14에 나타내는 음성 복호 장치(24)의 구성은, 음성 복호 장치(24)의 CPU가 음성 복호 장치(24)의 내장 메모리에 저장된 컴퓨터 프로그램을 실행함으로써 실현되는 기능이다. 이 컴퓨터 프로그램의 실행에 필요한 각종 데이터, 및 이 컴퓨터 프로그램의 실행에 의해 생성된 각종 데이터는, 모두, 음성 복호 장치(24)의 ROM이나 RAM 등의 내장 메모리에 저장되는 것으로 한다.
비트스트림 분리부(2a3)는, 음성 복호 장치(24)의 통신 장치를 통하여 입력된 다중화 비트스트림을, 시간 포락선 보조 정보와, SBR 보조 정보와, 부호화 비트스트림으로 분리한다. 시간 포락선 보조 정보는, 제1 실시예에 있어서 설명한 K(r), 또는 제3 실시예에 있어서 설명한 s(i)라도 된다. 또한, K(r), s(i)이 아니라, 다른 파라미터 X(r)이라도 된다.
보조 정보 변환부(2w)는, 입력된 시간 포락선 보조 정보를 변환하여, K(r)과 s(i)를 얻는다. 시간 포락선 보조 정보가 K(r)인 경우, 보조 정보 변환부(2w)는, K(r)을 s(i)로 변환한다. 보조 정보 변환부(2w)는, 이 변환을, 예를 들면, bi≤r<bi+1의 구간 내에서의 K(r)의 평균값
[수식 29]
Figure pat00029
를 취득한 후에, 소정의 테이블을 사용하여, 이 수식 29로 나타내는 평균값을 s(i)로 변환함으로써 행해도 된다. 또한, 시간 포락선 보조 정보가 s(i)인 경우, 보조 정보 변환부(2w)는, s(i)를 K(r)로 변환한다. 보조 정보 변환부(2w)는, 이 변환을, 예를 들면, 소정의 테이블을 사용하여 s(i)를 K(r)로 변환함으로써 행해도 된다. 단, i와 r은 bi≤r<bi +1의 관계를 만족시키도록 대응된 것으로 한다.
시간 포락선 보조 정보가 s(i)도 K(r)도 아닌 파라미터 X(r)인 경우, 보조 정보 변환부(2w)는, X(r)을, K(r)과 s(i)로 변환한다. 보조 정보 변환부(2w)는, 이 변환을, 예를 들면, 소정의 테이블을 사용하여 X(r)을 K(r) 및 s(i)로 변환함으로써 행하는 것이 바람직하다. 또한, 보조 정보 변환부(2w)는, X(r)을 SBR 포락선마다 1개의 대표값을 전송하는 것이 바람직하다. X(r)을 K(r) 및 s(i)로 변환하는 테이블은 서로 상이해도 된다.
(제1 실시예의 변형예 3)
제1 실시예의 음성 복호 장치(21)에 있어서, 음성 복호 장치(21)의 선형 예측 필터부(2k)는, 자동 이득 제어 처리를 포함할 수 있다. 이 자동 이득 제어 처리는, 선형 예측 필터부(2k)의 출력의 QMF 영역의 신호의 전력을 입력된 QMF 영역의 신호 전력에 맞추는 처리이다. 이득 제어 후의 QMF 영역 신호 qsyn , pow(n, r)은, 일반적으로는, 다음 식에 의해 실현된다.
[수식 30]
Figure pat00030
여기서, P0(r), P1(r)은 각각 이하의 수식 31 및 수식 32에 의해 나타내어진다.
[수식 31]
Figure pat00031
[수식 32]
Figure pat00032
이 자동 이득 제어 처리에 의해, 선형 예측 필터부(2k)의 출력 신호의 고주파 성분의 전력은 선형 예측 필터 처리 전과 같은 값으로 조정된다. 그 결과, SBR에 기초하여 생성된 고주파 성분의 시간 포락선을 변형시킨 선형 예측 필터부(2k)의 출력 신호에 있어서, 고주파 조정부(2j)에서 행해진 고주파 신호의 전력의 조정의 효과가 유지된다. 그리고, 이 자동 이득 제어 처리는, QMF 영역의 신호의 임의의 주파수 범위에 대하여 개별적으로 행하는 것도 가능하다. 개개의 주파수 범위에 대한 처리는, 각각, 수식 30, 수식 31, 수식 32의 n을 어떤 주파수 범위로 한정함으로써 실현할 수 있다. 예를 들면, i번째의 주파수 범위는 Fi≤n<Fi +1로 나타낼 수 있다(이 경우의 i는, QMF 영역의 신호의 임의의 주파수 범위의 번호를 나타내는 인덱스임). Fi는 주파수 범위의 경계를 나타내고, "MPEG4 AAC"의 SBR에 있어서 규정되는 포락선 스케일 팩터의 주파수 경계 테이블인 것이 바람직하다. 주파수 경계 테이블은 "MPEG4 AAC"의 SBR의 규정에 따라, 고주파 생성부(2g)에 있어서 결정된다. 이 자동 이득 제어 처리에 의해, 선형 예측 필터부(2k)의 출력 신호의 고주파 성분의 임의의 주파수 범위 내의 전력은 선형 예측 필터 처리 전과 같은 값으로 조정된다. 그 결과, SBR에 기초하여 생성된 고주파 성분의 시간 포락선을 변형시킨 선형 예측 필터부(2k)의 출력 신호에서, 고주파 조정부(2j)에 있어서 행해진 고주파 신호의 전력의 조정의 효과가 주파수 범위의 단위로 유지된다. 또한, 제1 실시예의 본 변형예 3과 마찬가지의 변경을 제4 실시예에 있어서의 선형 예측 필터부(2k)에 가해도 된다.
(제3 실시예의 변형예 1)
제3 실시예의 음성 부호화 장치(13)에 있어서의 포락선 형상 파라미터 산출부(1n)는, 다음과 같은 처리로 실현할 수도 있다. 포락선 형상 파라미터 산출부(1n)는, 부호화 프레임 내의 SBR 포락선 각각에 대하여, 다음 수식 33에 따라 포락선 형상 파라미터 s(i)(0≤i<Ne)를 취득한다.
[수식 33]
Figure pat00033
단,
[수식 34]
Figure pat00034
는 e(r)의 SBR 포락선 내에서의 평균값이며, 그 산출 방법은 수식 21에 따른다. 단, SBR 포락선은, bi≤r<bi +1을 만족시키는 시간 범위를 나타낸다. 또한, {bi}는, SBR 보조 정보에 정보로서 포함되어 있는, SBR 포락선의 시간 경계이며, 임의의 시간 범위, 임의의 주파수 범위의 평균 신호 에너지를 나타내는 SBR 포락선 스케일 팩터가 대상으로 하는 시간 범위의 경계이다. 또한, min(?)은 bi≤r<bi +1의 범위에 있어서의 최소값을 나타낸다. 따라서, 이 경우에는, 포락선 형상 파라미터 s(i)는, 조정 후의 시간 포락선 정보의 SBR 포락선 내에서의 최소값과 평균값의 비율을 지시하는 파라미터이다. 또한, 제3 실시예의 음성 복호 장치(23)에 있어서의 포락선 형상 조정부(2s)는, 다음과 같은 처리로 실현할 수도 있다. 포락선 형상 조정부(2s)는, s(i)를 사용하여 e(r)을 조정하고, 조정 후의 시간 포락선 정보 eadj(r)을 취득한다. 조정 방법은 다음 수식 35 또는 수식 36에 따른다.
[수식 35]
Figure pat00035
[수식 36]
Figure pat00036
수식 35는, 조정 후의 시간 포락선 정보 eadj(r)의 SBR 포락선 내에서의 최소값과 평균값의 비율이, 포락선 형상 파라미터 s(i)의 값과 같아지도록 포락선 형상을 조정하는 것이다. 또한, 상기 제3 실시예의 본 변형예 1과 마찬가지의 변경을 제4 실시예에 가해도 된다.
(제3 실시예의 변형예 2)
시간 포락선 변형부(2v)는, 수식 28 대신, 다음의 수식을 이용할 수도 있다. 수식 37에 나타낸 바와 같이 eadj , scaled(r)은, qadj(k, r)과 qenvadj(k, r)의 SBR 포락선 내에서의 전력이 같아지도록 조정 후의 시간 포락선 정보 eadj(r)의 이득을 제어한 것이다. 또한, 수식 38에 나타낸 바와 같이 제3 실시예의 본 변형예 2에서는, eadj(r)이 아니라 eadj , scaled(r)을 QMF 영역의 신호 qadj(k, r)에 승산하여 qenvadj(k, r)을 얻는다. 따라서, 시간 포락선 변형부(2v)는, SBR 포락선 내에서의 신호 전력이 시간 포락선의 변형 전과 후에, 같아지도록 QMF 영역의 신호 qadj(k, r)의 시간 포락선의 변형을 행할 수 있다. 단, SBR 포락선이란, bi≤r<bi +1을 만족시키는 시간 범위를 나타낸다. 또한, {bi}는, SBR 보조 정보에 정보로서 포함되어 있는, SBR 포락선의 시간 경계이며, 임의의 시간 범위, 임의의 주파수 범위의 평균 신호 에너지를 나타내는 SBR 포락선 스케일 팩터가 대상으로 하는 시간 범위의 경계이다. 또한, 본 발명의 실시예 중에서의 용어 "SBR 포락선"은 "ISO/IEC 14496-3"에 규정되는 "MPEG4 AAC"에 있어서의 용어 "SBR 포락선 시간 세그먼트"에 상당하며, 실시예 전체를 통하여 "SBR 포락선"은 "SBR 포락선 시간 세그먼트"와 동일한 내용을 의미한다.
[수식 37]
Figure pat00037
[수식 38]
Figure pat00038
또한, 상기 제3 실시예의 본 변형예 2와 마찬가지의 변경을 제4 실시예에 가해도 된다.
(제3 실시예의 변형예 3)
수식 19는 하기의 수식 39라도 된다.
[수식 39]
Figure pat00039
수식 22는 하기의 수식 40이라도 된다.
[수식 40]
Figure pat00040
수식 26은 하기의 수식 41이라도 된다.
[수식 41]
Figure pat00041
수식 39 및 수식 40에 따를 경우, 시간 포락선 정보 e(r)은, QMF 서브 밴드 샘플마다의 전력을 SBR 포락선 내에서의 평균 전력으로 정규화하고, 또한 그 제곱근을 구한 것이 된다. 단, QMF 서브 밴드 샘플은, QMF 영역 신호에 있어서, 동일한 시간 인덱스 "r"에 대응하는 신호 벡터이며, QMF 영역에 있어서의 1개의 서브 샘플을 의미한다. 또한, 본 발명의 실시예 전체에 있어서, 용어 "시간 슬롯"은 QMF 서브 밴드 샘플"과 동일한 내용을 의미한다. 이 경우, 시간 포락선 정보 e(r)은, 각 QMF 서브 밴드 샘플에 승산되는 게인 계수를 의미하게 되고, 조정 후의 시간 포락선 정보 eadj(r)도 마찬가지이다.
(제4 실시예의 변형예 1)
제4 실시예의 변형예 1의 음성 복호 장치(24a)(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24a)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 복호 장치(24a)를 통괄적으로 제어한다. 음성 복호 장치(24a)의 통신 장치는, 음성 부호화 장치(11) 또는 음성 부호화 장치(13)로부터 출력되는 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24a)는, 기능적으로는, 음성 복호 장치(24)의 비트스트림 분리부(2a3) 대신, 비트스트림 분리부(2a4)(도시하지 않음)를 구비하고, 또한 보조 정보 변환부(2w) 대신, 시간 포락선 보조 정보 생성부(2y)(도시하지 않음)를 구비한다. 비트스트림 분리부(2a4)는, 다중화 비트스트림을, SBR 보조 정보와, 부호화 비트스트림으로 분리한다. 시간 포락선 보조 정보 생성부(2y)는, 부호화 비트스트림 및 SBR 보조 정보에 포함되는 정보에 기초하여, 시간 포락선 보조 정보를 생성한다.
어느 하나의 SBR 포락선에 있어서의 시간 포락선 보조 정보의 생성에는, 예를 들면, 상기 SBR 포락선의 시간 폭(bi +1 - bi), 프레임 클래스, 역필터의 강도 파라미터, 노이즈 플로어, 고주파 전력의 크기, 고주파 전력과 저주파 전력의 비율, QMF 영역으로 표현된 저주파 신호를 주파수 방향으로 선형 예측 분석한 결과의 자기 상관 계수 또는 예측 게인 등을 사용할 수 있다. 이들 파라미터 중 하나, 또는 복수의 값에 기초하여 K(r) 또는 s(i)를 결정함으로써, 시간 포락선 보조 정보를 생성할 수 있다. 예를 들면, SBR 포락선의 시간 폭(bi +1 - bi)이 넓을수록 K(r) 또는 s(i)가 작아지도록, 또는 SBR 포락선의 시간 폭(bi +1 - bi)이 넓을수록 K(r) 또는 s(i)가 커지도록 (bi +1 - bi)에 기초하여, K(r) 또는 s(i)를 결정함으로써, 시간 포락선 보조 정보를 생성할 수 있다. 또한, 마찬가지의 변경을 제1 실시예 및 제3 실시예에 가해도 된다.
(제4 실시예의 변형예 2)
제4 실시예의 변형예 2의 음성 복호 장치(24b)(도 15 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24b)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 복호 장치(24b)를 통괄적으로 제어한다. 음성 복호 장치(24b)의 통신 장치는, 음성 부호화 장치(11) 또는 음성 부호화 장치(13)로부터 출력되는 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24b)는, 도 15에 나타낸 바와 같이 고주파 조정부(2j) 대신, 1차 고주파 조정부(2j1)와 2차 고주파 조정부(2j2)를 구비한다.
여기서, 1차 고주파 조정부(2j1)는, "MPEG4 AAC"의 SBR에 있어서의 "HF adjustment" 단계에 있는, 고주파 대역의 QMF 영역의 신호에 대한 시간 방향의 선형 예측 역필터 처리, 게인의 조정 및 노이즈의 중첩 처리에 의한 조정을 행한다. 이 때, 1차 고주파 조정부(2j1)의 출력 신호는, "ISO/IEC 14496-3: 2005"의 SBR tool" 내, 4.6.18.7.6절 "Assembling HF signals"의 기술(記述) 내에 있어서의 신호 W2에 상당하는 것이 된다. 선형 예측 필터부(2k)[또는, 선형 예측 필터부(2k1)] 및 시간 포락선 변형부(2v)는, 1차 고주파 조정부의 출력 신호를 대상으로 시간 포락선의 변형을 행한다. 2차 고주파 조정부(2j2)는, 시간 포락선 변형부(2v)로부터 출력된 QMF 영역의 신호에 대하여, "MPEG4 AAC"의 SBR에 있어서의 "HF adjustment" 단계에 있는 정현파의 부가 처리를 행한다. 2차 고주파 조정부의 처리는, "ISO/IEC 14496-3: 2005"의 SBR tool" 내, 4.6.18.7.6절 "Assembling HF signals"의 기술 내에 있어서의, 신호 W2로부터 신호 Y를 생성하는 처리에 있어서, 신호 W2를 시간 포락선 변형부(2v)의 출력 신호로 치환한 처리에 상당한다.
그리고, 상기 설명에서는 정현파 부가 처리만을 2차 고주파 조정부(2j2)의 처리로 했지만, "HF adjustment" 단계에 있는 처리 중 어느 하나를 2차 고주파 조정부(2j2)의 처리로 해도 된다. 또한, 마찬가지의 변형은, 제1 실시예, 제2 실시예, 제3 실시예에 가해도 된다. 이 때, 제1 실시예 및 제2 실시예는 선형 예측 필터부[선형 예측 필터부(2k, 2k1)]를 구비하고, 시간 포락선 변형부를 구비하지 않으므로, 1차 고주파 조정부(2j1)의 출력 신호에 대하여 선형 예측 필터부에서의 처리를 행한 후, 선형 예측 필터부의 출력 신호를 대상으로 2차 고주파 조정부(2j2)에서의 처리를 행한다.
또한, 제3 실시예는 시간 포락선 변형부(2v)를 구비하고, 선형 예측 필터부를 구비하지 않으므로, 1차 고주파 조정부(2j1)의 출력 신호에 대하여 시간 포락선 변형부(2v)에서의 처리를 행한 후, 시간 포락선 변형부(2v)의 출력 신호를 대상으로 2차 고주파 조정부에서의 처리를 행한다.
또한, 제4 실시예의 음성 복호 장치[음성 복호 장치(24, 24a, 24b)]에 있어서, 선형 예측 필터부(2k)와 시간 포락선 변형부(2v)의 처리의 순서는 역이라도 된다. 즉, 고주파 조정부(2j) 또는 1차 고주파 조정부(2j1)의 출력 신호에 대하여, 시간 포락선 변형부(2v)의 처리를 먼저 행하고, 다음으로, 시간 포락선 변형부(2v)의 출력 신호에 대하여 선형 예측 필터부(2k)의 처리를 행해도 된다.
또한, 시간 포락선 보조 정보는 선형 예측 필터부(2k) 또는 시간 포락선 변형부(2v)에서의 처리를 행할 것인지의 여부를 지시하는 2치의 제어 정보를 포함하고, 이 제어 정보가 선형 예측 필터부(2k) 또는 시간 포락선 변형부(2v)에서의 처리를 행하는 것을 지시하고 있는 경우에 한해서, 필터 강도 파라미터 K(r), 포락선 형상 파라미터 s(i), 또는 K(r)과 s(i)의 양쪽을 결정하는 파라미터인 X(r) 중 어느 하나 이상을 정보로서 더욱 포함하는 형식을 취해도 된다.
(제4 실시예의 변형예 3)
제4 실시예의 변형예 3의 음성 복호 장치(24c)(도 16 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24c)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 17의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24c)를 통괄적으로 제어한다. 음성 복호 장치(24c)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24c)는, 도 16에 나타낸 바와 같이 고주파 조정부(2j) 대신, 1차 고주파 조정부(2j3)와 2차 고주파 조정부(2j4)를 구비하고, 또한 선형 예측 필터부(2k)와 시간 포락선 변형부(2v) 대신, 개별 신호 성분 조정부(2z1, 2z2, 2z3)를 구비한다(개별 신호 성분 조정부는, 시간 포락선 변형 수단에 상당함).
1차 고주파 조정부(2j3)는, 고주파 대역의 QMF 영역의 신호를, 복사 신호 성분으로서 출력한다. 1차 고주파 조정부(2j3)는, 고주파 대역의 QMF 영역의 신호에 대하여, 비트스트림 분리부(2a3)로부터 부여되는 SBR 보조 정보를 이용하여 시간 방향의 선형 예측 역필터 처리 및 게인의 조정(주파수 특성의 조정) 중 적어도 한쪽을 행한 신호를 복사 신호 성분으로서 출력해도 된다. 또한, 1차 고주파 조정부(2j3)는, 비트스트림 분리부(2a3)로부터 부여되는 SBR 보조 정보를 이용하여 노이즈 신호 성분 및 정현파 신호 성분을 생성하고, 복사 신호 성분, 노이즈 신호 성분 및 정현파 신호 성분을 분리된 형태로 각각 출력한다(단계 Sg1의 처리). 노이즈 신호 성분 및 정현파 신호 성분은, SBR 보조 정보의 내용에 의존하며, 생성되지 않을 경우가 있어도 된다.
개별 신호 성분 조정부(2z1, 2z2, 2z3)는, 상기 1차 고주파 조정부의 출력에 포함되는 복수의 신호 성분 각각에 대하여 처리를 행한다(단계 Sg2의 처리). 개별 신호 성분 조정부(2z1, 2z2, 2z3)에 있어서의 처리는, 선형 예측 필터부(2k)와 마찬가지의, 필터 강도 조정부(2f)로부터 얻어진 선형 예측 계수를 사용한 주파수 방향의 선형 예측 합성 필터 처리라도 된다(처리 1). 또한, 개별 신호 성분 조정부(2z1, 2z2, 2z3)에 있어서의 처리는, 시간 포락선 변형부(2v)와 마찬가지의, 포락선 형상 조정부(2s)로부터 얻어진 시간 포락선을 사용하여 각 QMF 서브 밴드 샘플에 게인 계수를 승산하는 처리라도 된다(처리 2). 또한, 개별 신호 성분 조정부(2z1, 2z2, 2z3)에 있어서의 처리는, 입력 신호에 대하여 선형 예측 필터부(2k)와 마찬가지의, 필터 강도 조정부(2f)로부터 얻어진 선형 예측 계수를 사용한 주파수 방향의 선형 예측 합성 필터 처리를 행한 후, 그 출력 신호에 대하여 또한 시간 포락선 변형부(2v)와 마찬가지의, 포락선 형상 조정부(2s)로부터 얻어진 시간 포락선을 사용하여 각 QMF 서브 밴드 샘플에 게인 계수를 승산하는 처리를 행하는 것이라도 된다(처리 3). 또한, 개별 신호 성분 조정부(2z1, 2z2, 2z3)에 있어서의 처리는, 입력 신호에 대하여 시간 포락선 변형부(2v)와 마찬가지의, 포락선 형상 조정부(2s)로부터 얻어진 시간 포락선을 사용하여 각 QMF 서브 밴드 샘플에 게인 계수를 승산하는 처리를 행한 후, 그 출력 신호에 대하여 또한, 선형 예측 필터부(2k)와 마찬가지의, 필터 강도 조정부(2f)로부터 얻어진 선형 예측 계수를 사용한 주파수 방향의 선형 예측 합성 필터 처리를 행하는 것이라도 된다(처리 4). 또한, 개별 신호 성분 조정부(2z1, 2z2, 2z3)는 입력 신호에 대하여 시간 포락선 변형 처리를 행하지 않고, 입력 신호를 그대로 출력하는 것이라도 된다(처리 5). 또한, 개별 신호 성분 조정부(2z1, 2z2, 2z3)에 있어서의 처리는, 처리 1?5 이외의 방법으로 입력 신호의 시간 포락선을 변형하기 위한 어떠한 처리를 행하는 것이라도 된다(처리 6). 또한, 개별 신호 성분 조정부(2z1, 2z2, 2z3)에 있어서의 처리는, 처리 1?6 중 복수의 처리를 임의의 순서로 조합한 처리라도 된다(처리 7).
개별 신호 성분 조정부(2z1, 2z2, 2z3)에 있어서의 처리는 서로 같아도 되지만, 개별 신호 성분 조정부(2z1, 2z2, 2z3)는, 1차 고주파 조정부의 출력에 포함되는 복수의 신호 성분 각각에 대하여 서로 상이한 방법으로 시간 포락선의 변형을 행해도 된다. 예를 들면, 개별 신호 성분 조정부(2z1)는 입력된 복사 신호에 대하여 처리 2를 행하고, 개별 신호 성분 조정부(2z2)는 입력된 노이즈 신호 성분에 대하여 처리 3을 행하고, 개별 신호 성분 조정부(2z3)는 입력된 정현파 신호에 대하여 처리 5를 행하는 것과 같이, 복사 신호, 노이즈 신호, 정현파 신호 각각에 대하여 서로 상이한 처리를 행해도 된다. 또한, 이 때, 필터 강도 조정부(2f)와 포락선 형상 조정부(2s)는, 개별 신호 성분 조정부(2z1, 2z2, 2z3) 각각에 대하여 서로 같은 선형 예측 계수나 시간 포락선을 송신해도 되지만, 서로 상이한 선형 예측 계수나 시간 포락선을 송신해도 되고, 또한 개별 신호 성분 조정부(2z1, 2z2, 2z3) 중 어느 하나 이상에 대하여 동일한 선형 예측 계수나 시간 포락선을 송신해도 된다. 개별 신호 성분 조정부(2z1, 2z2, 2z3)의 하나 이상은, 시간 포락선 변형 처리를 행하지 않고, 입력 신호를 그대로 출력할 수도 있으므로(처리 5), 개별 신호 성분 조정부(2z1, 2z2, 2z3)는 전체적으로, 1차 고주파 조정부(2j3)로부터 출력된 복수의 신호 성분 중 적어도 하나에 대하여 시간 포락선 처리를 행하는 것이다[개별 신호 성분 조정부(2z1, 2z2, 2z3) 모두가 처리 5인 경우에는, 어느 신호 성분에 대해서도 시간 포락선 변형 처리가 행해지지 않으므로 본 발명의 효과를 가지지 않는다].
개별 신호 성분 조정부(2z1, 2z2, 2z3)의 각각에 있어서의 처리는, 처리 1 내지 처리 7 중 어느 하나에 고정되어 있어도 되지만, 외부로부터 부여되는 제어 정보에 기초하여, 처리 1 내지 처리 7 중 어느 것을 행할 것인지는 동적으로 결정되어도 된다. 이 때, 상기 제어 정보는 다중화 비트스트림에 포함되는 것이 바람직하다. 또한, 상기 제어 정보는, 특정 SBR 포락선 시간 세그먼트, 부호화 프레임, 또는 그 외의 시간 범위에 있어서 처리 1 내지 처리 7 중 어느 것을 행할 것인지를 지시하는 것일 수도 있고, 또한, 제어의 시간 범위를 특정하지 않고, 처리 1 내지 처리 7 중 어느 것을 행할 것인지를 지시하는 것일 수도 있다.
2차 고주파 조정부(2j4)는, 개별 신호 성분 조정부(2z1, 2z2, 2z3)로부터 출력된 처리 후의 신호 성분을 합하여, 계수 가산부에 출력한다(단계 Sg3의 처리). 또한, 2차 고주파 조정부(2j4)는, 복사 신호 성분에 대하여, 비트스트림 분리부(2a3)로부터 부여되는 SBR 보조 정보를 이용하여 시간 방향의 선형 예측 역필터 처리 및 게인의 조정(주파수 특성의 조정) 중 적어도 한쪽을 행해도 된다.
개별 신호 성분 조정부(2z1, 2z2, 2z3)는 서로 협조하여 동작하고, 처리 1?7 중 어느 하나의 처리를 행한 후의 2개 이상의 신호 성분을 서로 합하고, 합쳐진 신호에 대하여 또한 처리 1?7 중 어느 하나의 처리를 행하여 도중 단계의 출력 신호를 생성해도 된다. 이 때는, 2차 고주파 조정부(2j4)는, 상기 도중 단계의 출력 신호와, 상기 도중 단계의 출력 신호에 아직 합해져 있지 않은 신호 성분을 합하여 계수 가산부에 출력한다. 구체적으로는, 복사 신호 성분에 처리 5를 행하고, 잡음 성분에 처리 1을 행한 후에 이들 2개의 신호 성분을 합하고, 합해진 신호에 대하여, 또한, 처리 2를 행하여 도중 단계의 출력 신호를 생성하는 것이 바람직하다. 이 때는, 2차 고주파 조정부(2j4)는, 상기 도중 단계의 출력 신호에 정현파 신호 성분을 합하여, 계수 가산부에 출력한다.
1차 고주파 조정부(2j3)는, 복사 신호 성분, 노이즈 신호 성분, 정현파 신호 성분의 3개의 신호 성분으로 한정되지 않고, 임의의 복수의 신호 성분을 서로 분리한 형태로 출력해도 된다. 이 경우의 신호 성분은, 복사 신호 성분, 노이즈 신호 성분, 정현파 신호 성분 중 2개 이상을 합한 것이라도 된다. 또한, 복사 신호 성분, 노이즈 신호 성분, 정현파 신호 성분 중 어느 하나를 대역 분할한 신호라도 된다. 신호 성분의 수는 3 이외라도 되며, 이 경우에는 개별 신호 성분 조정부의 수는 3 이외라도 된다.
SBR에 의해 생성되는 고주파 신호는, 저주파 대역을 고주파 대역에 복사해 얻어진 복사 신호 성분과, 노이즈 신호, 정현파 신호의 3개의 요소로 구성된다. 복사 신호, 노이즈 신호, 정현파 신호의 각각은, 서로 상이한 시간 포락선을 가지기 때문에, 본 변형예의 개별 신호 성분 조정부가 행하도록, 각각의 신호 성분에 대하여 서로 상이한 방법으로 시간 포락선의 변형을 행함으로써, 본 발명의 다른 실시예와 비교하여, 복호 신호의 주관 품질을 더욱 향상시킬 수 있다. 특히, 노이즈 신호는 일반적으로 평탄한 시간 포락선을 가지며, 복사 신호는 저주파 대역의 신호에 가까운 시간 포락선을 가지기 때문에, 이들을 분리하여 취급하여, 서로 상이한 처리를 행함으로써, 복사 신호와 노이즈 신호의 시간 포락선을 독립적으로 제어할 수 있고, 이는 복호 신호의 주관 품질 향상에 유효하다. 구체적으로는, 노이즈 신호에 대하여는 시간 포락선을 변형시키는 처리(처리 3 또는 처리 4)를 행하고, 복사 신호에 대하여는, 노이즈 신호에 대한 처리와는 상이한 처리(처리 1 또는 처리 2)를 행하고, 또한 정현파 신호에 대하여는, 처리 5를 행하는 것(즉, 시간 포락선 변형 처리를 행하지 않음)이 바람직하다. 또는, 노이즈 신호에 대하여는 시간 포락선의 변형 처리(처리 3 또는 처리 4)를 행하고, 복사 신호와 정현파 신호에 대하여는, 처리 5를 행하는 것(즉, 시간 포락선 변형 처리를 행하지 않음)이 바람직하다.
(제1 실시예의 변형예 4)
제1 실시예의 변형예 4의 음성 부호화 장치(11b)(도 44)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(11b)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 부호화 장치(11b)를 통괄적으로 제어한다. 음성 부호화 장치(11b)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 음성 부호화 장치(11b)는, 음성 부호화 장치(11)의 선형 예측 분석부(1e) 대신 선형 예측 분석부(1e1)를 구비하고, 시간 슬롯 선택부(1p)를 더 구비한다.
시간 슬롯 선택부(1p)는, 주파수 변환부(1a)로부터 QMF 영역의 신호를 수취하고, 선형 예측 분석부(1e1)에서의 선형 예측 분석 처리를 행하는 시간 슬롯을 선택한다. 선형 예측 분석부(1e1)는, 시간 슬롯 선택부(1p)로부터 통지된 선택 결과에 기초하여, 선택된 시간 슬롯의 QMF 영역 신호를 선형 예측 분석부(1e)와 마찬가지로 선형 예측 분석하고, 고주파 선형 예측 계수, 저주파 선형 예측 계수 중 적어도 하나를 취득한다. 필터 강도 파라미터 산출부(1f)는, 선형 예측 분석부(1e1)에 있어서 얻어진, 시간 슬롯 선택부(1p)에서 선택된 시간 슬롯의 선형 예측 계수를 사용하여 필터 강도 파라미터를 산출한다. 시간 슬롯 선택부(1p)에서의 시간 슬롯의 선택에서는, 예를 들면, 후술하는 본 변형예의 복호 장치(21a)에 있어서의 시간 슬롯 선택부(3a)와 마찬가지의 고주파 성분의 QMF 영역 신호의 신호 전력을 사용한 선택 방법 중 적어도 하나를 사용해도 된다. 이 때, 시간 슬롯 선택부(1p)에 있어서의 고주파 성분의 QMF 영역 신호는, 주파수 변환부(1a)로부터 수취하는 QMF 영역의 신호 중, SBR 부호화부(1d)에 있어서 부호화되는 주파수 성분인 것이 바람직하다. 시간 슬롯의 선택 방법은, 전술한 방법을 적어도 하나 사용해도 되고, 또한 전술한 것과는 상이한 방법을 적어도 하나 사용해도 되고, 또한 이들을 조합하여 사용해도 된다.
제1 실시예의 변형예 4의 음성 복호 장치(21a)(도 18 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(21a)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 19의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(21a)를 통괄적으로 제어한다. 음성 복호 장치(21a)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(21a)는, 도 18에 나타낸 바와 같이 음성 복호 장치(21)의 저주파 선형 예측 분석부(2d), 신호 변화 검출부(2e), 고주파 선형 예측 분석부(2h), 및 선형 예측 역필터부(2i), 및 선형 예측 필터부(2k) 대신, 저주파 선형 예측 분석부(2d1), 신호 변화 검출부(2e1), 고주파 선형 예측 분석부(2h1), 선형 예측 역필터부(2i1), 및 선형 예측 필터부(2k3)를 구비하고, 시간 슬롯 선택부(3a)를 더 구비한다.
시간 슬롯 선택부(3a)는, 고주파 생성부(2g)에 의해 생성된 시간 슬롯 r의 고주파 성분의 QMF 영역의 신호 qexp(k, r)에 대하여, 선형 예측 필터부(2k)에 있어서 선형 예측 합성 필터 처리를 행하는지의 여부를 판단하여, 선형 예측 합성 필터 처리를 행하는 시간 슬롯을 선택한다(단계 Sh1의 처리). 시간 슬롯 선택부(3a)는, 시간 슬롯의 선택 결과를, 저주파 선형 예측 분석부(2d1), 신호 변화 검출부(2e1), 고주파 선형 예측 분석부(2h1), 선형 예측 역필터부(2i1), 및 선형 예측 필터부(2k3)에 통지한다. 저주파 선형 예측 분석부(2d1)에서는, 시간 슬롯 선택부(3a)로부터 통지된 선택 결과에 기초하여, 선택된 시간 슬롯 r1의 QMF 영역 신호를, 저주파 선형 예측 분석부(2d)와 마찬가지로 선형 예측 분석하여, 저주파 선형 예측 계수를 취득한다(단계 Sh2의 처리). 신호 변화 검출부(2e1)에서는, 시간 슬롯 선택부(3a)로부터 통지된 선택 결과에 기초하여, 선택된 시간 슬롯의 QMF 영역 신호의 시간 변화를, 신호 변화 검출부(2e)와 마찬가지로 검출하고, 검출 결과 T(r1)를 출력한다.
필터 강도 조정부(2f)에서는, 저주파 선형 예측 분석부(2d1)에 있어서 얻어진, 시간 슬롯 선택부(3a)에서 선택된 시간 슬롯의 저주파 선형 예측 계수에 대하여 필터 강도 조정을 행하여, 조정된 선형 예측 계수 adec(n, r1)를 얻는다. 고주파 선형 예측 분석부(2h1)에서는, 고주파 생성부(2g)에 의해 생성된 고주파 성분의 QMF 영역 신호를, 시간 슬롯 선택부(3a)로부터 통지된 선택 결과에 기초하여, 선택된 시간 슬롯 r1에 관하여, 고주파 선형 예측 분석부(2h)와 마찬가지로, 주파수 방향으로 선형 예측 분석하고, 고주파 선형 예측 계수 aexp(n, r1)을 취득한다(단계 Sh3의 처리). 선형 예측 역필터부(2i1)에서는, 시간 슬롯 선택부(3a)로부터 통지된 선택 결과에 기초하여, 선택된 시간 슬롯 r1의 고주파 성분의 QMF 영역의 신호 qexp(k, r)을, 선형 예측 역필터부(2i)와 마찬가지로 주파수 방향으로 aexp(n, r1)을 계수로 하는 선형 예측 역필터 처리를 행한다(단계 Sh4의 처리).
선형 예측 필터부(2k3)에서는, 시간 슬롯 선택부(3a)로부터 통지된 선택 결과에 기초하여, 선택된 시간 슬롯 r1의 고주파 조정부(2j)로부터 출력된 고주파 성분의 QMF 영역의 신호 qadj(k, r1)에 대하여, 선형 예측 필터부(2k)와 마찬가지로, 필터 강도 조정부(2f)로부터 얻어진 aadj(n, r1)을 사용하여, 주파수 방향으로 선형 예측 합성 필터 처리를 행한다(단계 Sh5의 처리). 또한, 변형예 3에 기재된 선형 예측 필터부(2k)로의 변경을, 선형 예측 필터부(2k3)에 가해도 된다. 시간 슬롯 선택부(3a)에서의 선형 예측 합성 필터 처리를 행하는 시간 슬롯의 선택에서는, 예를 들면, 고주파 성분의 QMF 영역 신호 qexp(k, r)의 신호 전력이 소정값 Pexp , Th보다 큰 시간 슬롯 r을 하나 이상 선택해도 된다. qexp(k, r)의 신호 전력은 다음의 수식에서 구하는 것이 바람직하다.
[수식 42]
Figure pat00042
단, M은 고주파 생성부(2g)에 의해 생성되는 고주파 성분의 하한 주파수 kx 보다 높은 주파수의 범위를 나타내는 값이며, 또한 고주파 생성부(2g)에 의해 생성되는 고주파 성분의 주파수 범위를 kx<= k <kx + M과 같이 나타내어도 된다. 또한, 소정값 Pexp , Th는 시간 슬롯 r을 포함하는 소정 시간 폭의 Pexp(r)의 평균값이라도 된다. 또한, 소정 시간 폭은 SBR 포락선이라도 된다.
또한, 고주파 성분의 QMF 영역 신호의 신호 전력이 피크로 되는 시간 슬롯이 포함되도록 선택해도 된다. 신호 전력의 피크는, 예를 들면, 신호 전력의 이동 평균값
[수식 43]
Figure pat00043
에 대하여
[수식 44]
Figure pat00044
이 플러스의 값으로부터 마이너스의 값으로 바뀌는 시간 슬롯 r의 고주파 성분의 QMF 영역의 신호 전력을 피크라도 된다. 신호 전력의 이동 평균값
[수식 45]
Figure pat00045
은, 예를 들면, 다음의 식에서 구할 수 있다.
[수식 46]
Figure pat00046
단, c는 평균값을 구하는 범위를 정하는 소정값이다. 또한, 신호 전력의 피크는, 전술한 방법으로 구해도 되고, 상이한 방법에 의해 구해도 된다.
또한, 고주파 성분의 QMF 영역 신호의 신호 전력의 변동이 작은 정상(定常) 상태로부터 변동이 큰 과도(過度) 상태로 될 때까지의 시간 폭 t가 소정값 tth보다 작고, 상기 시간 폭에 포함되는 시간 슬롯을 적어도 하나 선택해도 된다. 또한, 고주파 성분의 QMF 영역 신호의 신호 전력의 변동이 큰 과도 상태로부터 변동이 작은 정상 상태가 될 때까지의 시간 폭 t가 소정값 tth보다 작고, 상기 시간 폭에 포함되는 시간 슬롯을 적어도 하나 선택해도 된다. |Pexp(r+1) - Pexp(r)|이 소정값보다 작은(또는, 소정값과 같거나 작은) 시간 슬롯 r을 상기 정상 상태로 하고, |Pexp(r+1) - Pexp(r)|이 소정값과 같거나 큰(또는, 소정값보다 큰) 시간 슬롯 r을 상기 과도 상태로 해도 되고, |Pexp , MA(r+1) - Pexp , MA(r)|이 소정값보다 작은(또는, 소정값과 같거나 작은) 시간 슬롯 r을 상기 정상 상태로 하고, |Pexp , MA(r+1) - Pexp , MA(r)|이 소정값과 같거나 큰(또는, 소정값보다 큰) 시간 슬롯 r을 상기 과도 상태로 해도 된다. 또한, 과도 상태, 정상 상태는 전술한 방법으로 정의해도 되고, 상이한 방법으로 정의해도 된다. 시간 슬롯의 선택 방법은, 전술한 방법을 적어도 하나 사용해도 되고, 또한 전술한 것과는 상이한 방법을 적어도 하나 사용해도 되고, 또한 이들을 조합해도 된다.
(제1 실시예의 변형예 5)
제1 실시예의 변형예 5의 음성 부호화 장치(11c)(도 45)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(11c)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 부호화 장치(11c)를 통괄적으로 제어한다. 음성 부호화 장치(11c)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 음성 부호화 장치(11c)는, 변형예 4의 음성 부호화 장치(11b)의 시간 슬롯 선택부(1p), 및 비트스트림 다중화부(1g) 대신, 시간 슬롯 선택부(1p1), 및 비트스트림 다중화부(1g4)를 구비한다.
시간 슬롯 선택부(1p1)는, 제1 실시예의 변형예 4에 기재된 시간 슬롯 선택부(1p)와 마찬가지로 시간 슬롯을 선택하고, 시간 슬롯 선택 정보를 비트스트림 다중화부(1g4)에 송신한다. 비트스트림 다중화부(1g4)는, 코어 코덱 부호화부(1c)에 의해 산출된 부호화 비트스트림과, SBR 부호화부(1d)에 의해 산출된 SBR 보조 정보와, 필터 강도 파라미터 산출부(1f)에 의해 산출된 필터 강도 파라미터를, 비트스트림 다중화부(1g)와 마찬가지로 다중화하여, 또한 시간 슬롯 선택부(1p1)로부터 수취한 시간 슬롯 선택 정보를 다중화하여, 다중화 비트스트림을, 음성 부호화 장치(11c)의 통신 장치를 통하여 출력한다. 상기 시간 슬롯 선택 정보는, 후술하는 음성 복호 장치(21b)에서의 시간 슬롯 선택부(3a1)가 수취하는 시간 슬롯 선택 정보이며, 예를 들면, 선택하는 시간 슬롯의 인덱스 r1을 포함해도 된다. 또한, 예를 들면, 시간 슬롯 선택부(3a1)의 시간 슬롯 선택 방법에 이용되는 파라미터라도 된다. 제1 실시예의 변형예 5의 음성 복호 장치(21b)(도 20 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(21b)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 21의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(21b)를 통괄적으로 제어한다. 음성 복호 장치(21b)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다.
음성 복호 장치(21b)는, 도 20에 나타낸 바와 같이 변형예 4의 음성 복호 장치(21a)의 비트스트림 분리부(2a), 및 시간 슬롯 선택부(3a) 대신, 비트스트림 분리부(2a5), 및 시간 슬롯 선택부(3a1)를 구비하고, 시간 슬롯 선택부(3a1)에 시간 슬롯 선택 정보가 입력된다. 비트스트림 분리부(2a5)에서는, 다중화 비트스트림을, 비트스트림 분리부(2a)와 마찬가지로, 필터 강도 파라미터와, SBR 보조 정보와, 부호화 비트스트림으로 분리하고, 또한 시간 슬롯 선택 정보를 분리한다. 시간 슬롯 선택부(3a1)에서는, 비트스트림 분리부(2a5)로부터 보내진 시간 슬롯 선택 정보에 기초하여 시간 슬롯을 선택한다(단계 Si1의 처리). 시간 슬롯 선택 정보는, 시간 슬롯의 선택에 사용하는 정보이며, 예를 들면, 선택하는 시간 슬롯의 인덱스 r1을 포함해도 된다. 또한, 예를 들면, 변형예 4에 기재된 시간 슬롯 선택 방법으로 이용되는 파라미터라도 된다. 이 경우, 시간 슬롯 선택부(3a1)에는, 시간 슬롯 선택 정보에 더하여, 도시하지 않지만 고주파 생성부(2g)에 의해 생성된 고주파 성분의 QMF 영역 신호도 입력된다. 상기 파라미터는, 예를 들면, 상기 시간 슬롯의 선택을 위해 사용하는 소정값(예를 들면, Pexp , Th, tTh 등)이라도 된다.
(제1 실시예의 변형예 6)
제1 실시예의 변형예 6의 음성 부호화 장치(11d)(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(11d)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 부호화 장치(11d)를 통괄적으로 제어한다. 음성 부호화 장치(11d)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 음성 부호화 장치(11d)는, 변형예 1의 음성 부호화 장치(11a)의 단시간 전력 산출부(1i) 대신, 도시하지 않은 단시간 전력 산출부(1i1)를 구비하고, 시간 슬롯 선택부(1p2)를 더 구비한다.
시간 슬롯 선택부(1p2)는, 주파수 변환부(1a)로부터 QMF 영역의 신호를 수취하고, 단시간 전력 산출부(1i)에서의 단시간 전력 산출 처리를 행하는 시간 구간에 대응하는 시간 슬롯을 선택한다. 단시간 전력 산출부(1i1)는, 시간 슬롯 선택부(1p2)로부터 통지된 선택 결과에 기초하여, 선택된 시간 슬롯에 대응하는 시간 구간의 단시간 전력을, 변형예 1의 음성 부호화 장치(11a)의 단시간 전력 산출부(1i)와 마찬가지로 산출한다.
(제1 실시예의 변형예 7)
제1 실시예의 변형예 7의 음성 부호화 장치(11e)(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(11e)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 부호화 장치(11e)를 통괄적으로 제어한다. 음성 부호화 장치(11e)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 음성 부호화 장치(11e)는, 변형예 6의 음성 부호화 장치(11d)의 시간 슬롯 선택부(1p2) 대신, 도시하지 않은 시간 슬롯 선택부(1p3)를 구비한다. 또한, 비트스트림 다중화부(1g1) 대신, 시간 슬롯 선택부(1p3)로부터의 출력을, 받는 비트스트림 다중화부를 더 구비한다. 시간 슬롯 선택부(1p3)는, 제1 실시예의 변형예 6에 기재된 시간 슬롯 선택부(1p2)와 마찬가지로 시간 슬롯을 선택하고, 시간 슬롯 선택 정보를 비트스트림 다중화부에 보낸다.
(제1 실시예의 변형예 8)
제1 실시예의 변형예 8의 음성 부호화 장치(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 변형예 8의 음성 부호화 장치의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 변형예 8의 음성 부호화 장치를 통괄적으로 제어한다. 변형예 8의 음성 부호화 장치의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 변형예 8의 음성 부호화 장치는, 변형예 2에 기재된 음성 부호화 장치에 더하여, 시간 슬롯 선택부(1p)를 더 구비한다.
제1 실시예의 변형예 8의 음성 복호 장치(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 변형예 8의 음성 복호 장치의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 변형예 8의 음성 복호 장치를 통괄적으로 제어한다. 변형예 8의 음성 복호 장치의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 변형예 8의 음성 복호 장치는, 변형예 2에 기재된 음성 복호 장치의 저주파 선형 예측 분석부(2d), 신호 변화 검출부(2e), 고주파 선형 예측 분석부(2h), 및 선형 예측 역필터부(2i), 및 선형 예측 필터부(2k) 대신, 고주파 선형 예측 분석부(2h1), 선형 예측 역필터부(2i1), 및 선형 예측 필터부(2k3)를 구비하고, 시간 슬롯 선택부(3a)를 더 구비한다.
(제1 실시예의 변형예 9)
제1 실시예의 변형예 9의 음성 부호화 장치(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 변형예 9의 음성 부호화 장치의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 변형예 9의 음성 부호화 장치를 통괄적으로 제어한다. 변형예 9의 음성 부호화 장치의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 변형예 9의 음성 부호화 장치는, 변형예 8에 기재된 음성 부호화 장치의 시간 슬롯 선택부(1p) 대신, 시간 슬롯 선택부(1p1)를 구비한다. 또한, 변형예 8에 기재된 비트스트림 다중화부 대신, 변형예 8에 기재된 비트스트림 다중화부로의 입력에 더하여 시간 슬롯 선택부(1p1)로부터의 출력을 더 받는 비트스트림 다중화부를 구비한다.
제1 실시예의 변형예 9의 음성 복호 장치(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 변형예 9의 음성 복호 장치의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 변형예 9의 음성 복호 장치를 통괄적으로 제어한다. 변형예 9의 음성 복호 장치의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 변형예 9의 음성 복호 장치는, 변형예 8에 기재된 음성 복호 장치의 시간 슬롯 선택부(3a) 대신, 시간 슬롯 선택부(3a1)를 구비한다. 또한, 비트스트림 분리부(2a) 대신, 비트스트림 분리부(2a5)의 필터 강도 파라미터 대신 상기 변형예 2에 기재된 aD(n, r)을 분리하는 비트스트림 분리 부를 구비한다.
(제2 실시예의 변형예 1)
제2 실시예의 변형예 1의 음성 부호화 장치(12a)(도 46)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(12a)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 부호화 장치(12a)를 통괄적으로 제어한다. 음성 부호화 장치(12a)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 음성 부호화 장치(12a)는, 음성 부호화 장치(12)의 선형 예측 분석부(1e) 대신, 선형 예측 분석부(1e1)를 구비하고, 시간 슬롯 선택부(1p)를 더 구비한다.
제2 실시예의 변형예 1의 음성 복호 장치(22a)(도 22참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(22a)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 23의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(22a)를 통괄적으로 제어한다. 음성 복호 장치(22a)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(22a)는, 도 22에 나타낸 바와 같이 제2 실시예의 음성 복호 장치(22)의 고주파 선형 예측 분석부(2h), 선형 예측 역필터부(2i), 선형 예측 필터부(2k1), 및 선형 예측 보간?보외부(2p) 대신, 저주파 선형 예측 분석부(2d1), 신호 변화 검출부(2e1), 고주파 선형 예측 분석부(2h1), 선형 예측 역필터부(2i1), 선형 예측 필터부(2k2), 및 선형 예측 보간?보외부(2p1)를 구비하고, 시간 슬롯 선택부(3a)를 더 구비한다.
시간 슬롯 선택부(3a)는, 시간 슬롯의 선택 결과를, 고주파 선형 예측 분석부(2h1), 선형 예측 역필터부(2i1), 선형 예측 필터부(2k2), 선형 예측 계수 보간?보외부(2p1)에 통지한다. 선형 예측 계수 보간?보외부(2p1)에서는, 시간 슬롯 선택부(3a)로부터 통지된 선택 결과에 기초하여, 선택된 시간 슬롯이며 선형 예측 계수의 전송되어 있지 않은 시간 슬롯 r1에 대응하는 aH(n, r)을, 선형 예측 계수 보간?보외부(2p)와 마찬가지로, 보간 또는 보외에 의해 취득한다(단계 Sj1의 처리). 선형 예측 필터부(2k2)에서는, 시간 슬롯 선택부(3a)로부터 통지된 선택 결과에 기초하여, 선택된 시간 슬롯 r1에 관하여, 고주파 조정부(2j)로부터 출력된 qadj(n, r1)에 대하여, 선형 예측 계수 보간?보외부(2p1)로부터 얻어진, 보간 또는 보외된 aH(n, r1)을 사용하여, 선형 예측 필터부(2k1)와 마찬가지로, 주파수 방향으로 선형 예측 합성 필터 처리를 행한다(단계 Sj2의 처리). 또한, 제1 실시예의 변형예 3에 기재된 선형 예측 필터부(2k)로의 변경을, 선형 예측 필터부(2k2)에 가해도 된다.
(제2 실시예의 변형예 2)
제2 실시예의 변형예 2의 음성 부호화 장치(12b)(도 47)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(12b)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 부호화 장치(11b)를 통괄적으로 제어한다. 음성 부호화 장치(12b)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 음성 부호화 장치(12b)는, 변형예 1의 음성 부호화 장치(12a)의 시간 슬롯 선택부(1p), 및 비트스트림 다중화부(1g2) 대신, 시간 슬롯 선택부(1p1), 및 비트스트림 다중화부(1g5)를 구비한다. 비트스트림 다중화부(1g5)는, 비트스트림 다중화부(1g2)와 마찬가지로, 코어 코덱 부호화부(1c)에서 산출된 부호화 비트스트림과, SBR 부호화부(1d)에서 산출된 SBR 보조 정보와, 선형 예측 계수 양자화부(1k)로부터 주어진 양자화 후의 선형 예측 계수에 대응하는 시간 슬롯의 인덱스를 다중화하고, 또한 시간 슬롯 선택부(1p1)로부터 수취하는 시간 슬롯 선택 정보를 비트스트림으로 다중화하고, 다중화 비트스트림을, 음성 부호화 장치(12b)의 통신 장치를 통하여 출력한다.
제2 실시예의 변형예 2의 음성 복호 장치(22b)(도 24 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(22b)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 25의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(22b)를 통괄적으로 제어한다. 음성 복호 장치(22b)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(22b)는, 도 24에 나타낸 바와 같이 변형예 1에 기재된 음성 복호 장치(22a)의 비트스트림 분리부(2a1), 및 시간 슬롯 선택부(3a) 대신, 비트스트림 분리부(2a6), 및 시간 슬롯 선택부(3a1)를 구비하고, 시간 슬롯 선택부(3a1)에 시간 슬롯 선택 정보가 입력된다. 비트스트림 분리부(2a6)에서는, 비트스트림 분리부(2a1)와 마찬가지로, 다중화 비트스트림을, 양자화된 aH(n, ri)와, 이에 대응하는 시간 슬롯의 인덱스 ri와, SBR 보조 정보와, 부호화 비트스트림으로 분리하고, 시간 슬롯 선택 정보를 더욱 분리한다.
(제3 실시예의 변형예 4)
제3 실시예의 변형예 1에 기재된
[수식 47]
Figure pat00047
는, e(r)의 SBR 포락선 내에서의 평균값이라도 되고, 또한 별도로 정하는 값이라도 된다.
(제3 실시예의 변형예 5)
포락선 형상 조정부(2s)는, 상기 제3 실시예의 변형예 3에 기재된 바와 같이, 조정 후의 시간 포락선 eadj(r)이, 예를 들면, 수식 28, 수식 37 및 38과 같이, QMF 서브 밴드 샘플에 승산되는 게인 계수인 것을 감안하여, eadj(r)을 소정값 eadj , Th(r)에 의해 이하와 같이 제한하는 것이 바람직하다.
[수식 48]
Figure pat00048
(제4 실시예)
제4 실시예의 음성 부호화 장치(14)(도 48)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(14)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 부호화 장치(14)를 통괄적으로 제어한다. 음성 부호화 장치(14)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 음성 부호화 장치(14)는, 제1 실시예의 변형예 4의 음성 부호화 장치(11b)의 비트스트림 다중화부(1g) 대신, 비트스트림 다중화부(1g7)를 구비하고, 또한 음성 부호화 장치(13)의 시간 포락선 산출부(1m), 및 포락선 형상 파라미터 산출부(1n)를 구비한다.
비트스트림 다중화부(1g7)는, 비트스트림 다중화부(1g)와 마찬가지로, 코어 코덱 부호화부(1c)에 의해 산출된 부호화 비트스트림과, SBR 부호화부(1d)에 의해 산출된 SBR 보조 정보를 다중화하고, 또한 필터 강도 파라미터 산출부에 의해 산출된 필터 강도 파라미터와, 포락선 형상 파라미터 산출부(1n)에 의해 산출된 포락선 형상 파라미터를 시간 포락선 보조 정보로 변환하여 다중화하고, 다중화 비트스트림(부호화된 다중화 비트스트림)을, 음성 부호화 장치(14)의 통신 장치를 통하여 출력한다.
(제4 실시예의 변형예 4)
제4 실시예의 변형예 4의 음성 부호화 장치(14a)(도 49)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(14a)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 부호화 장치(14a)를 통괄적으로 제어한다. 음성 부호화 장치(14a)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 음성 부호화 장치(14a)는, 제4 실시예의 음성 부호화 장치(14)의 선형 예측 분석부(1e) 대신, 선형 예측 분석부(1e1)를 구비하고, 시간 슬롯 선택부(1p)를 더 구비한다.
제4 실시예의 변형예 4의 음성 복호 장치(24d)(도 26 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24d)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 27의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24d)를 통괄적으로 제어한다. 음성 복호 장치(24d)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24d)는, 도 26에 나타낸 바와 같이 음성 복호 장치(24)의 저주파 선형 예측 분석부(2d), 신호 변화 검출부(2e), 고주파 선형 예측 분석부(2h), 선형 예측 역필터부(2i), 및 선형 예측 필터부(2k) 대신, 저주파 선형 예측 분석부(2d1), 신호 변화 검출부(2e1), 고주파 선형 예측 분석부(2h1), 선형 예측 역필터부(2i1), 및 선형 예측 필터부(2k3)를 구비하고, 시간 슬롯 선택부(3a)를 더 구비한다. 시간 포락선 변형부(2v)는, 선형 예측 필터부(2k3)로부터 얻어진 QMF 영역의 신호를, 포락선 형상 조정부(2s)로부터 얻어진 시간 포락선 정보를 사용하여, 제3 실시예, 제4 실시예, 및 이들의 변형예의 시간 포락선 변형부(2v)와 마찬가지로 변형된다(단계 Sk1의 처리).
(제4 실시예의 변형예 5)
제4 실시예의 변형예 5의 음성 복호 장치(24e)(도 28 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24e)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 29의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24e)를 통괄적으로 제어한다. 음성 복호 장치(24e)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24e)는, 도 28에 나타낸 바와 같이 변형예 5에 있어서는, 제1 실시예와 마찬가지로 제4 실시예의 전체를 통하여 생략 가능한, 변형예 4에 기재된 음성 복호 장치(24d)의 고주파 선형 예측 분석부(2h1)와, 선형 예측 역필터부(2i1)를 생략하고, 음성 복호 장치(24d)의 시간 슬롯 선택부(3a), 및 시간 포락선 변형부(2v) 대신, 시간 슬롯 선택부(3a2), 및 시간 포락선 변형부(2v1)를 구비한다. 또한, 제4 실시예의 전체를 통하여 처리 순서를 바꿀 수 있는 선형 예측 필터부(2k3)의 선형 예측 합성 필터 처리와 시간 포락선 변형부(2v1)에서의 시간 포락선의 변형 처리의 순서를 바꾼다.
시간 포락선 변형부(2v1)는, 시간 포락선 변형부(2v)와 마찬가지로, 고주파 조정부(2j)로부터 얻어진 qadj(k, r)을 포락선 형상 조정부(2s)로부터 얻어진 eadj(r)을 사용하여 변형시키고, 시간 포락선이 변형된 QMF 영역의 신호 qenvadj(k, r)을 취득한다. 또한, 시간 포락선 변형 처리 시에 얻어진 파라미터, 또는 적어도 시간 포락선 변형 처리 시에 얻어진 파라미터를 사용하여 산출한 파라미터를 시간 슬롯 선택 정보로서, 시간 슬롯 선택부(3a2)에 통지한다. 시간 슬롯 선택 정보로서는, 수식 22, 수식 40의 e(r) 또는 그 산출 과정에 의해 제곱근 연산을 행하지 않는 |e(r)|2이라도 되며, 또한 어떤 복수 시간 슬롯 구간(예를 들면, SBR 포락선)
[수식 49]
Figure pat00049
에서의 이들의 평균값인 수식 24의
[수식 50]
Figure pat00050
도 아울러 시간 슬롯 선택 정보로 해도 된다. 단,
[수식 51]
Figure pat00051
이다.
또한, 시간 슬롯 선택 정보로서는, 수식 26, 수식 41의 eexp(r) 또는 그 산출과정에 의해 제곱근 연산을 행하지 않는 |eexp(r)|2이라도 되고, 또한 어떤 복수 시간 슬롯 구간(예를 들면, SBR 포락선)
[수식 52]
Figure pat00052
에서의 이들의 평균값인
[수식 53]
Figure pat00053
도 아울러 시간 슬롯 선택 정보로 해도 된다. 단,
[수식 54]
Figure pat00054
[수식 55]
Figure pat00055
이다. 또한, 시간 슬롯 선택 정보로서는, 수식 23, 수식 35, 수식 36의 eadj(r) 또는 그 산출 과정에서 제곱근 연산을 행하지 않는 |eadj(r)|2이라도 되고, 또한 어떤 복수 시간 슬롯 구간(예를 들면, SBR 포락선)
[수식 56]
Figure pat00056
에서의 이들의 평균값인
[수식 57]
Figure pat00057
도 아울러 시간 슬롯 선택 정보로 해도 된다. 단,
[수식 58]
Figure pat00058
[수식 59]
Figure pat00059
이다. 또한, 시간 슬롯 선택 정보로서는, 수식 37의 eadj , scaled(r) 또는 그 산출 과정에서 제곱근 연산을 행하지 않는 |eadj , scaled(r)|2이라도 되고, 또한 어떤 복수 시간 슬롯 구간(예를 들면, SBR 포락선)
[수식 60]
Figure pat00060
에서의 이들의 평균값인
[수식 61]
Figure pat00061
도 아울러 시간 슬롯 선택 정보로 해도 된다. 단,
[수식 62]
Figure pat00062
[수식 63]
Figure pat00063
이다. 또한, 시간 슬롯 선택 정보로서는, 시간 포락선이 변형된 고주파 성분에 대응하는 QMF 영역 신호의 시간 슬롯 r의 신호 전력 Penvadj(r) 또는 그것의 제곱근 연산을 행한 신호 진폭값
[수식 64]
Figure pat00064
이라도 되고, 또한 어떤 복수 시간 슬롯 구간(예를 들면, SBR 포락선)
[수식 65]
Figure pat00065
에서의 이들의 평균값인
[수식 66]
*
Figure pat00066
도 아울러 시간 슬롯 선택 정보로 해도 된다. 단,
[수식 67]
Figure pat00067
[수식 68]
Figure pat00068
이다. 단, M은 고주파 생성부(2g)에 의해 생성되는 고주파 성분의 하한 주파수 kx보다 높은 주파수의 범위를 나타내는 값이며, 또한 고주파 생성부(2g)에 의해 생성되는 고주파 성분의 주파수 범위를 kx≤ k <kx+M과 같이 나타내어도 된다.
시간 슬롯 선택부(3a2)는, 시간 포락선 변형부(2v1)로부터 통지된 시간 슬롯 선택 정보에 기초하여, 시간 포락선 변형부(2v1)에 의해 시간 포락선이 변형된 시간 슬롯 r의 고주파 성분의 QMF 영역의 신호 qenvadj(k, r)에 대하여, 선형 예측 필터부(2k)에 있어서 선형 예측 합성 필터 처리를 행하는지의 여부를 판단하여, 선형 예측 합성 필터 처리를 행하는 시간 슬롯을 선택한다(단계 Sp1의 처리).
본 변형예에 있어서의 시간 슬롯 선택부(3a2)에서의 선형 예측 합성 필터 처리를 행하는 시간 슬롯의 선택에서는, 시간 포락선 변형부(2v1)로부터 통지된 시간 슬롯 선택 정보에 포함되는 파라미터 u(r)아 소정값 uTh보다 큰 시간 슬롯 r을 하나 이상 선택해도 되고, u(r)이 소정값 uTh보다 큰거나 같은 시간 슬롯 r을 하나 이상 선택해도 된다. u(r)은, 상기 e(r), |e(r)|2, eexp(r), |eexp(r)|2, eadj(r), |eadj(r)|2, eadj , scaled(r), |eadj , scaled(r)|2, Penvadj(r), 그리고,
[수식 69]
Figure pat00069
중 적어도 하나를 포함해도 되고, uTh는, 상기
[수식 70]
Figure pat00070
중 적어도 하나를 포함해도 된다. 또한, uTh는, 시간 슬롯 r을 포함하는 소정 시간 폭(예를 들면, SBR 포락선)의 u(r)의 평균값이라도 된다. 또한, u(r)이 피크로 되는 시간 슬롯이 포함되도록 선택해도 된다. u(r)의 피크는, 상기 제1 실시예의 변형예 4에 있어서의 고주파 성분의 QMF 영역 신호의 신호 전력의 피크의 산출과 마찬가지로 산출할 수 있다. 또한, 상기 제1 실시예의 변형예 4에 있어서의 정상 상태와 과도 상태를, u(r)을 사용하여 상기 제1 실시예의 변형예 4와 마찬가지로 판단하고, 그에 따라 시간 슬롯을 선택해도 된다. 시간 슬롯의 선택 방법은, 전술한 방법을 적어도 하나 사용해도 되고, 또한 전술한 것과는 상이한 방법을 적어도 하나 사용해도 되고, 또한 이들을 조합해도 된다.
(제4 실시예의 변형예 6)
제4 실시예의 변형예 6의 음성 복호 장치(24f)(도 30 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24f)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 29의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24f)를 통괄적으로 제어한다. 음성 복호 장치(24f)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24f)는, 도 30에 나타낸 바와 같이 변형예 6에 있어서는, 제1 실시예와 마찬가지로 제4 실시예의 전체를 통해 생략 가능한, 변형예 4에 기재된 음성 복호 장치(24d)의 신호 변화 검출부(2e1)와, 고주파 선형 예측 분석부(2h1)와, 선형 예측 역필터부(2i1)를 생략하고, 음성 복호 장치(24d)의 시간 슬롯 선택부(3a), 및 시간 포락선 변형부(2v) 대신, 시간 슬롯 선택부(3a2), 및 시간 포락선 변형부(2v1)를 구비한다. 또한, 제4 실시예의 전체를 통하여 처리 순서를 바꿀 수 있는 선형 예측 필터부(2k3)의 선형 예측 합성 필터 처리와 시간 포락선 변형부(2v1)에서의 시간 포락선의 변형 처리의 순서를 바꾼다.
시간 슬롯 선택부(3a2)는, 시간 포락선 변형부(2v1)로부터 통지된 시간 슬롯 선택 정보에 기초하여, 시간 포락선 변형부(2v1)에 의해 시간 포락선이 변형된 시간 슬롯 r의 고주파 성분의 QMF 영역의 신호 qenvadj(k, r)에 대하여, 선형 예측 필터부(2k3)에 있어서 선형 예측 합성 필터 처리를 행하는지의 여부를 판단하여, 선형 예측 합성 필터 처리를 행하는 시간 슬롯을 선택하고, 선택된 시간 슬롯을 저주파 선형 예측 분석부(2d1)와 선형 예측 필터부(2k3)에 통지한다.
(제4 실시예의 변형예 7)
제4 실시예의 변형예 7의 음성 부호화 장치(14b)(도 50)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 부호화 장치(14b)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 부호화 장치(14b)를 통괄적으로 제어한다. 음성 부호화 장치(14b)의 통신 장치는, 부호화의 대상이 되는 음성 신호를 외부로부터 수신하고, 또한 부호화된 다중화 비트스트림을 외부에 출력한다. 음성 부호화 장치(14b)는, 변형예 4의 음성 부호화 장치(14a)의 비트스트림 다중화부(1g7), 및 시간 슬롯 선택부(1p) 대신, 비트스트림 다중화부(1g6), 및 시간 슬롯 선택부(1p1)를 구비한다.
비트스트림 다중화부(1g6)는, 비트스트림 다중화부(1g7)와 마찬가지로, 코어 코덱 부호화부(1c)에 의해 산출된 부호화 비트스트림과, SBR 부호화부(1d)에 의해 산출된 SBR 보조 정보와, 필터 강도 파라미터 산출부에 의해 산출된 필터 강도 파라미터와, 포락선 형상 파라미터 산출부(1n)에 의해 산출된 포락선 형상 파라미터를 변환한 시간 포락선 보조 정보를 다중화하고, 또한 시간 슬롯 선택부(1p1)로부터 수취한 시간 슬롯 선택 정보를 다중화하여, 다중화 비트스트림(부호화된 다중화 비트스트림)을, 음성 부호화 장치(14b)의 통신 장치를 통하여 출력한다.
제4 실시예의 변형예 7의 음성 복호 장치(24g)(도 31 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24g)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 32의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24g)를 통괄적으로 제어한다. 음성 복호 장치(24g)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24g)는, 도 31에 나타낸 바와 같이 변형예 4에 기재된 음성 복호 장치(24d)의 비트스트림 분리부(2a3), 및 시간 슬롯 선택부(3a) 대신, 비트스트림 분리부(2a7), 및 시간 슬롯 선택부(3a1)를 구비한다.
비트스트림 분리부(2a7)는, 음성 복호 장치(24g)의 통신 장치를 통하여 입력된 다중화 비트스트림을, 비트스트림 분리부(2a3)와 마찬가지로, 시간 포락선 보조 정보와, SBR 보조 정보와, 부호화 비트스트림으로 분리하고, 또한 시간 슬롯 선택 정보로 분리한다.
(제4 실시예의 변형예 8)
제4 실시예의 변형예 8의 음성 복호 장치(24h)(도 33 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24h)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 34의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24h)를 통괄적으로 제어한다. 음성 복호 장치(24h)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24h)는, 도 33에 나타낸 바와 같이 변형예 2의 음성 복호 장치(24b)의 저주파 선형 예측 분석부(2d), 신호 변화 검출부(2e), 고주파 선형 예측 분석부(2h), 선형 예측 역필터부(2i), 및 선형 예측 필터부(2k) 대신, 저주파 선형 예측 분석부(2d1), 신호 변화 검출부(2e1), 고주파 선형 예측 분석부(2h1), 선형 예측 역필터부(2i1), 및 선형 예측 필터부(2k3)를 구비하고, 시간 슬롯 선택부(3a)를 더 구비한다. 1차 고주파 조정부(2j1)는, 제4 실시예의 변형예 2에 있어서의 1차 고주파 조정부(2j1)와 마찬가지로, 상기 "MPEG-4 AAC"의 SBR에 있어서의 "HF Adjustment" 단계에 있는 처리 중 어느 하나 이상을 행한다(단계 Sm1의 처리). 2차 고주파 조정부(2j2)는, 제4 실시예의 변형예 2에 있어서의 2차 고주파 조정부(2j2)와 마찬가지로, 상기 "MPEG-4 AAC"의 SBR에 있어서의 "HF Adjustment" 단계에 있는 처리 중 어느 하나 이상을 행한다(단계 Sm2의 처리). 2차 고주파 조정부(2j2)에서 행하는 처리는, 상기 "MPEG-4 AAC"의 SBR에서의 "HF Adjustment" 단계에 있는 처리 중, 1차 고주파 조정부(2j1)에서 행해지지 않은 처리로 하는 것이 바람직하다.
(제4 실시예의 변형예 9)
제4 실시예의 변형예 9의 음성 복호 장치(24i)(도 35 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24i)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 36의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24i)를 통괄적으로 제어한다. 음성 복호 장치(24i)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24i)는, 도 35에 나타낸 바와 같이 제1 실시예와 마찬가지로 제4 실시예의 전체를 통하여 생략할 수 있는, 변형예 8의 음성 복호 장치(24h)의 고주파 선형 예측 분석부(2h1), 및 선형 예측 역필터부(2i1)를 생략하고, 변형예 8의 음성 복호 장치(24h)의 시간 포락선 변형부(2v), 및 시간 슬롯 선택부(3a) 대신, 시간 포락선 변형부(2v1), 및 시간 슬롯 선택부(3a2)를 구비한다. 또한, 제4 실시예의 전체를 통하여 처리 순서를 바꿀 수 있는 선형 예측 필터부(2k3)의 선형 예측 합성 필터 처리와 시간 포락선 변형부(2v1)에서의 시간 포락선의 변형 처리의 순서를 바꾼다.
(제4 실시예의 변형예 10)
제4 실시예의 변형예 10의 음성 복호 장치(24j)(도 37 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24j)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 36의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24j)를 통괄적으로 제어한다. 음성 복호 장치(24j)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24j)는, 도 37에 나타낸 바와 같이 제1 실시예와 마찬가지로 제4 실시예의 전체를 통해 생략할 수 있는, 변형예 8의 음성 복호 장치(24h)의 신호 변화 검출부(2e1), 고주파 선형 예측 분석부(2h1), 및 선형 예측 역필터부(2i1)를 생략하고, 변형예 8의 음성 복호 장치(24h)의 시간 포락선 변형부(2v), 및 시간 슬롯 선택부(3a) 대신, 시간 포락선 변형부(2v1), 및 시간 슬롯 선택부(3a2)를 구비한다. 또한, 제4 실시예의 전체를 통하여 처리 순서를 바꿀 수 있는 선형 예측 필터부(2k3)의 선형 예측 합성 필터 처리와 시간 포락선 변형부(2v1)에서의 시간 포락선의 변형 처리의 순서를 바꾼다.
(제4 실시예의 변형예 11)
제4 실시예의 변형예 11의 음성 복호 장치(24k)(도 38 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24k)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 39의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24k)를 통괄적으로 제어한다. 음성 복호 장치(24k)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24k)는, 도 38에 나타낸 바와 같이 변형예 8의 음성 복호 장치(24h)의 비트스트림 분리부(2a3), 및 시간 슬롯 선택부(3a) 대신, 비트스트림 분리부(2a7), 및 시간 슬롯 선택부(3a1)를 구비한다.
(제4 실시예의 변형예 12)
제4 실시예의 변형예 12의 음성 복호 장치(24q)(도 40 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24q)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 41의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24q)를 통괄적으로 제어한다. 음성 복호 장치(24q)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24q)는, 도 40에 나타낸 바와 같이 변형예 3의 음성 복호 장치(24c)의 저주파 선형 예측 분석부(2d), 신호 변화 검출부(2e), 고주파 선형 예측 분석부(2h), 선형 예측 역필터부(2i), 및 개별 신호 성분 조정부(2z1, 2z2, 2z3) 대신, 저주파 선형 예측 분석부(2d1), 신호 변화 검출부(2e1), 고주파 선형 예측 분석부(2h1), 선형 예측 역필터부(2i1), 및 개별 신호 성분 조정부(2z4, 2z5, 2z6)를 구비하고(개별 신호 성분 조정부는, 시간 포락선 변형 수단에 상당함), 시간 슬롯 선택부(3a)를 더 구비한다.
개별 신호 성분 조정부(2z4, 2z5, 2z6) 중 적어도 하나는, 상기 1차 고주파 조정부의 출력에 포함되는 신호 성분에 관하여, 시간 슬롯 선택부(3a)로부터 통지된 선택 결과에 기초하여, 선택된 시간 슬롯의 QMF 영역 신호에 대하여, 개별 신호 성분 조정부(2z1, 2z2, 2z3)와 마찬가지로, 처리를 행한다(단계 Sn1의 처리). 시간 슬롯 선택 정보를 사용하여 행하는 처리는, 상기 제4 실시예의 변형예 3에 기재된 개별 신호 성분 조정부(2z1, 2z2, 2z3)에 있어서의 처리 중, 주파수 방향의 선형 예측 합성 필터 처리를 포함하는 처리 중 적어도 하나를 포함하는 것이 바람직하다.
개별 신호 성분 조정부(2z4, 2z5, 2z6)에 있어서의 처리는, 상기 제4 실시예의 변형예 3에 기재된 개별 신호 성분 조정부(2z1, 2z2, 2z3)의 처리와 마찬가지로, 서로 같아도 되지만, 개별 신호 성분 조정부(2z4, 2z5, 2z6)는, 1차 고주파 조정부의 출력에 포함되는 복수의 신호 성분 각각에 대하여 서로 상이한 방법으로 시간 포락선의 변형을 행해도 된다. [개별 신호 성분 조정부(2z4, 2z5, 2z6) 모두가 시간 슬롯 선택부(3a)로부터 통지된 선택 결과에 기초하여 처리하지 않는 경우에는, 본 발명의 제4 실시예의 변형예 3과 동등하게 된다].
시간 슬롯 선택부(3a)로부터 개별 신호 성분 조정부(2z4, 2z5, 2z6) 각각에 통지되는 시간 슬롯의 선택 결과는, 반드시 모두가 동일할 필요는 없고, 모두 또는 일부가 상이해도 된다.
또한, 도 40에서는 하나의 시간 슬롯 선택부(3a)로부터 개별 신호 성분 조정부(2z4, 2z5, 2z6) 각각에 시간 슬롯의 선택 결과를 통지하는 구성으로 되어 있지만, 개별 신호 성분 조정부(2z4, 2z5, 2z6)의 각각, 또는 일부에 대하여 상이한 시간 슬롯의 선택 결과를 통지하는 시간 슬롯 선택부를 복수개 가져도 된다. 또한, 이 때, 개별 신호 성분 조정부(2z4, 2z5, 2z6) 중, 제4 실시예의 변형예 3에 기재된 처리(4)[입력 신호에 대하여 시간 포락선 변형부(2v)와 마찬가지의, 포락선 형상 조정부(2s)로부터 얻어진 시간 포락선을 사용하여 각 QMF 서브 밴드 샘플에 게인 계수를 승산하는 처리를 행한 후, 그 출력 신호에 대하여, 또한 선형 예측 필터부(2k)와 마찬가지의, 필터 강도 조정부(2f)로부터 얻어진 선형 예측 계수를 사용한 주파수 방향의 선형 예측 합성 필터 처리]를 행하는 개별 신호 성분 조정부에 대한 시간 슬롯 선택부는, 시간 포락선 변형부로부터 시간 슬롯 선택 정보를 입력하여 시간 슬롯의 선택 처리를 행해도 된다.
(제4 실시예의 변형예 13)
제4 실시예의 변형예 13의 음성 복호 장치(24m)(도 42 참조)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24m)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 43의 흐름도에 나타내는 처리를 행하기 위한 컴퓨터 프로그램)을 RAM에 로드하여 실행함으로써 음성 복호 장치(24m)를 통괄적으로 제어한다. 음성 복호 장치(24m)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24m)는, 도 42에 나타낸 바와 같이 변형예 12의 음성 복호 장치(24q)의 비트스트림 분리부(2a3), 및 시간 슬롯 선택부(3a) 대신, 비트스트림 분리부(2a7), 및 시간 슬롯 선택부(3a1)를 구비한다.
(제4 실시예의 변형예 14)
제4 실시예의 변형예 14의 음성 복호 장치(24n)(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24n)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 복호 장치(24n)를 통괄적으로 제어한다. 음성 복호 장치(24n)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24n)는, 기능적으로는, 변형예 1의 음성 복호 장치(24a)의 저주파 선형 예측 분석부(2d), 신호 변화 검출부(2e), 고주파 선형 예측 분석부(2h), 선형 예측 역필터부(2i), 및 선형 예측 필터부(2k) 대신, 저주파 선형 예측 분석부(2d1), 신호 변화 검출부(2e1), 고주파 선형 예측 분석부(2h1), 선형 예측 역필터부(2i1), 및 선형 예측 필터부(2k3)를 구비하고, 시간 슬롯 선택부(3a)를 더 구비한다.
(제4 실시예의 변형예 15)
제4 실시예의 변형예 15의 음성 복호 장치(24p)(도시하지 않음)는, 물리적으로는 도시하지 않은 CPU, ROM, RAM 및 통신 장치 등을 구비하고, 이 CPU는, ROM 등의 음성 복호 장치(24p)의 내장 메모리에 저장된 소정의 컴퓨터 프로그램을 RAM에 로드하여 실행함으로써 음성 복호 장치(24p)를 통괄적으로 제어한다. 음성 복호 장치(24p)의 통신 장치는, 부호화된 다중화 비트스트림을 수신하고, 또한 복호한 음성 신호를 외부에 출력한다. 음성 복호 장치(24p)는, 기능적으로는, 변형예 14의 음성 복호 장치(24n)의 시간 슬롯 선택부(3a) 대신, 시간 슬롯 선택부(3a1)를 구비한다. 또한, 비트스트림 분리부(2a4) 대신, 비트스트림 분리부(2a8)(도시하지 않음)를 구비한다.
비트스트림 분리부(2a8)는, 비트스트림 분리부(2a4)와 마찬가지로, 다중화 비트스트림을, SBR 보조 정보와, 부호화 비트스트림으로 분리하고, 또한 시간 슬롯 선택 정보로 분리한다.
[산업상 이용 가능성]
SBR로 대표되는 주파수 영역에서의 대역 확장 기술에 있어서 적용되는 기술로서, 비트레이트를 현저하게 증대시키지 않고, 발생하는 프리 에코?포스트 에코를 경감하여, 복호 신호의 주관적 품질을 향상시키기 위한 기술에 이용할 수 있다.
11, 11a, 11b, 11c, 12, 12a, 12b, 13, 14, 14a, 14b: 음성 부호화 장치
1a: 주파수 변환부 1b: 주파수 역변환부
1c: 코어 코덱 부호화부 1d: SBR 부호화부
1e, 1e1: 선형 예측 분석부 1f: 필터 강도 파라미터 산출부
1f1: 필터 강도 파라미터 산출부
1g, 1g1, 1g2, 1g3, 1g4, 1g5, 1g6, 1g7: 비트스트림 다중화부
1h: 고주파 주파수 역변환부 1i: 단시간 전력 산출부
1j: 선형 예측 계수 솎아냄부 1k: 선형 예측 계수 양자화부
1m: 시간 포락선 산출부 1n: 포락선 형상 파라미터 산출부
1p, 1p1: 시간 슬롯 선택부
21, 22, 23, 24, 24b, 24c: 음성 복호 장치
2a, 2a1, 2a2, 2a3, 2a5, 2a6, 2a7: 비트스트림 분리부
2b: 코어 코덱 복호부 2c: 주파수 변환부
2d, 2d1: 저주파 선형 예측 분석부 2e, 2e1: 신호 변화 검출부
2f: 필터 강도 조정부 2g: 고주파 생성부
2h, 2h1: 고주파 선형 예측 분석부 2i, 2i1: 선형 예측 역필터부
2j, 2j1, 2j2, 2j3, 2j4: 고주파 조정부
2k, 2k1, 2k2, 2k3: 선형 예측 필터부
2m: 계수 가산부 2n: 주파수 역변환부
2p, 2p1: 선형 예측 계수 보간?보외부
2r: 저주파 시간 포락선 계산부 2s: 포락선 형상 조정부
2t: 고주파 시간 포락선 산출부 2u: 시간 포락선 평탄화부
2v, 2v1: 시간 포락선 변형부 2w: 보조 정보 변환부
2z1, 2z2, 2z3, 2z4, 2z5, 2z6: 개별 신호 성분 조정부
3a, 3a1, 3a2: 시간 슬롯 선택부

Claims (6)

  1. 부호화된 음성 신호를 복호하는 음성 복호 장치로서,
    상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을, 부호화 비트스트림과 시간 포락선 보조 정보로 분리하는 비트스트림 분리 수단;
    상기 비트스트림 분리 수단에 의해 분리된 상기 부호화 비트스트림을 복호하여 저주파 성분을 얻는 코어 복호 수단;
    상기 코어 복호 수단에 의해 얻어진 상기 저주파 성분을 주파수 영역으로 변환하는 주파수 변환 수단;
    상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 저주파 대역으로부터 고주파 대역에 복사(複寫)함으로써 고주파 성분을 생성하는 고주파 생성 수단;
    상기 고주파 생성 수단에 의해 생성된 상기 고주파 성분을 조정하여, 조정된 고주파 성분을 생성하는 고주파 조정 수단;
    상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 분석하여 시간 포락선 정보를 취득하는 저주파 시간 포락선 분석 수단;
    상기 시간 포락선 보조 정보를, 상기 시간 포락선 정보를 조정하기 위한 파라미터로 변환하는 보조 정보 변환 수단;
    상기 저주파 시간 포락선 분석 수단에 의해 취득된 상기 시간 포락선 정보를 상기 파라미터를 사용하여 조정하여, 조정된 시간 포락선 정보를 생성하고, 상기 조정된 시간 포락선 정보의 이득(利得)을, 상기 주파수 영역의 고주파 성분의 SBR 포락선 시간 세그먼트 내에서의 전력(電力)이 시간 포락선의 변형 전과 변형 후에서 동등하게 되도록 제어하여, 추가로 조정된 시간 포락선 정보를 생성하는 시간 포락선 조정 수단; 및
    상기 조정된 고주파 성분에 상기 추가로 조정된 시간 포락선 정보를 승산(乘算)하여, 상기 조정된 고주파 성분의 시간 포락선을 변형하는 시간 포락선 변형 수단
    을 포함하는 음성 복호 장치.
  2. 부호화된 음성 신호를 복호하는 음성 복호 장치로서,
    상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을 복호하여 저주파 성분을 얻는 코어 복호 수단;
    상기 코어 복호 수단에 의해 얻어진 상기 저주파 성분을 주파수 영역으로 변환하는 주파수 변환 수단;
    상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 저주파 대역으로부터 고주파 대역에 복사(複寫)함으로써 고주파 성분을 생성하는 고주파 생성 수단;
    상기 고주파 생성 수단에 의해 생성된 상기 고주파 성분을 조정하여, 조정된 고주파 성분을 생성하는 고주파 조정 수단;
    상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 분석하여 시간 포락선 정보를 취득하는 저주파 시간 포락선 분석 수단;
    상기 비트스트림을 분석하여 상기 시간 포락선 정보를 조정하기 위한 파라미터를 생성하는 시간 포락선 보조 정보 생성 수단;
    상기 저주파 시간 포락선 분석 수단에 의해 취득된 상기 시간 포락선 정보를 상기 파라미터를 사용하여 조정하여, 조정된 시간 포락선 정보를 생성하고, 상기 조정된 시간 포락선 정보의 이득(利得)을, 상기 주파수 영역의 고주파 성분의 SBR 포락선 시간 세그먼트 내에서의 전력(電力)이 시간 포락선의 변형 전과 변형 후에서 동등하게 되도록 제어하여, 추가로 조정된 시간 포락선 정보를 생성하는 시간 포락선 조정 수단; 및
    상기 조정된 고주파 성분에 상기 추가로 조정된 시간 포락선 정보를 승산(乘算)하여, 상기 조정된 고주파 성분의 시간 포락선을 변형하는 시간 포락선 변형 수단
    을 포함하는 음성 복호 장치.
  3. 부호화된 음성 신호를 복호하는 음성 복호 장치를 사용한 음성 복호 방법으로서,
    상기 음성 복호 장치가, 상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을, 부호화 비트스트림과 시간 포락선 보조 정보로 분리하는 비트스트림 분리 단계;
    상기 음성 복호 장치가, 상기 비트스트림 분리 단계에서 분리한 상기 부호화 비트스트림을 복호하여 저주파 성분을 얻는 코어 복호 단계;
    상기 음성 복호 장치가, 상기 코어 복호 단계에서 얻은 상기 저주파 성분을 주파수 영역으로 변환하는 주파수 변환 단계;
    상기 음성 복호 장치가, 상기 주파수 변환 단계에서 주파수 영역으로 변환한 상기 저주파 성분을 저주파 대역으로부터 고주파 대역에 복사(複寫)함으로써 고주파 성분을 생성하는 고주파 생성 단계;
    상기 음성 복호 장치가, 상기 고주파 생성 단계에서 생성된 상기 고주파 성분을 조정하여, 조정된 고주파 성분을 생성하는 고주파 조정 단계;
    상기 음성 복호 장치가, 상기 주파수 변환 단계에서 주파수 영역으로 변환한 상기 저주파 성분을 분석하여 시간 포락선 정보를 취득하는 저주파 시간 포락선 분석 단계;
    상기 음성 복호 장치가, 상기 시간 포락선 보조 정보를, 상기 시간 포락선 정보를 조정하기 위한 파라미터로 변환하는 보조 정보 변환 단계;
    상기 음성 복호 장치가, 상기 저주파 시간 포락선 분석 단계에서 취득된 상기 시간 포락선 정보를 상기 파라미터를 사용하여 조정하고, 조정된 시간 포락선 정보를 생성하고, 상기 조정된 시간 포락선 정보의 이득(利得)을, 상기 주파수 영역의 고주파 성분의 SBR 포락선 시간 세그먼트 내에서의 전력(電力)이 시간 포락선의 변형 전과 변형 후에서 동등하게 되도록 제어하여, 추가로 조정된 시간 포락선 정보를 생성하는 시간 포락선 조정 단계; 및
    상기 음성 복호 장치가, 상기 조정된 고주파 성분에 상기 추가로 조정된 시간 포락선 정보를 승산(乘算)하여, 상기 조정된 상기 고주파 성분의 시간 포락선을 변형하는 시간 포락선 변형 단계
    를 포함하는 음성 복호 방법.
  4. 부호화된 음성 신호를 복호하는 음성 복호 장치를 사용한 음성 복호 방법으로서,
    상기 음성 복호 장치가, 상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을 복호하여 저주파 성분을 얻는 코어 복호 단계;
    상기 음성 복호 장치가, 상기 코어 복호 단계에서 얻은 상기 저주파 성분을 주파수 영역으로 변환하는 주파수 변환 단계;
    상기 음성 복호 장치가, 상기 주파수 변환 단계에서 주파수 영역으로 변환한 상기 저주파 성분을 저주파 대역으로부터 고주파 대역에 복사(複寫)함으로써 고주파 성분을 생성하는 고주파 생성 단계;
    상기 음성 복호 장치가, 상기 고주파 생성 단계에서 생성된 상기 고주파 성분을 조정하여, 조정된 고주파 성분을 생성하는 고주파 조정 단계;
    상기 음성 복호 장치가, 상기 주파수 변환 단계에서 주파수 영역으로 변환한 상기 저주파 성분을 분석하여 시간 포락선 정보를 취득하는 저주파 시간 포락선 분석 단계;
    상기 음성 복호 장치가, 상기 비트스트림을 분석하여 상기 시간 포락선 정보를 조정하기 위한 파라미터를 생성하는 시간 포락선 보조 정보 생성 단계;
    상기 음성 복호 장치가, 상기 저주파 시간 포락선 분석 단계에서 취득된 상기 시간 포락선 정보를 상기 파라미터를 사용하여 조정하고, 조정된 시간 포락선 정보를 생성하고, 상기 조정된 시간 포락선 정보의 이득(利得)을, 상기 주파수 영역의 고주파 성분의 SBR 포락선 시간 세그먼트 내에서의 전력(電力)이 시간 포락선의 변형 전과 변형 후에서 동등하게 되도록 제어하여, 추가로 조정된 시간 포락선 정보를 생성하는 시간 포락선 조정 단계; 및
    상기 음성 복호 장치가, 상기 조정된 고주파 성분에 상기 추가로 조정된 시간 포락선 정보를 승산(乘算)하여, 상기 조정된 상기 고주파 성분의 시간 포락선을 변형하는 시간 포락선 변형 단계
    를 포함하는 음성 복호 방법.
  5. 부호화된 음성 신호를 복호하기 위하여, 컴퓨터 장치를,
    상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을, 부호화 비트스트림과 시간 포락선 보조 정보로 분리하는 비트스트림 분리 수단;
    상기 비트스트림 분리 수단에 의해 분리된 상기 부호화 비트스트림을 복호하여 저주파 성분을 얻는 코어 복호 수단;
    상기 코어 복호 수단에 의해 얻어진 상기 저주파 성분을 주파수 영역으로 변환하는 주파수 변환 수단;
    상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 저주파 대역으로부터 고주파 대역에 복사(複寫)함으로써 고주파 성분을 생성하는 고주파 생성 수단;
    상기 고주파 생성 수단에 의해 생성된 상기 고주파 성분을 조정하여, 조정된 고주파 성분을 생성하는 고주파 조정 수단;
    상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 분석하여 시간 포락선 정보를 취득하는 저주파 시간 포락선 분석 수단;
    상기 시간 포락선 보조 정보를, 상기 시간 포락선 정보를 조정하기 위한 파라미터로 변환하는 보조 정보 변환 수단;
    상기 저주파 시간 포락선 분석 수단에 의해 취득된 상기 시간 포락선 정보를 상기 파라미터를 사용하여 조정하여, 조정된 시간 포락선 정보를 생성하고, 상기 조정된 시간 포락선 정보의 이득(利得)을, 상기 주파수 영역의 고주파 성분의 SBR 포락선 시간 세그먼트 내에서의 전력(電力)이 시간 포락선의 변형 전과 변형 후에서 동등하게 되도록 제어하여, 추가로 조정된 시간 포락선 정보를 생성하는 시간 포락선 조정 수단; 및
    상기 조정된 고주파 성분에 상기 추가로 조정된 시간 포락선 정보를 승산(乘算)하여, 상기 조정된 고주파 성분의 시간 포락선을 변형하는 시간 포락선 변형 수단
    으로서 기능시키는 음성 복호 프로그램이 기록된, 컴퓨터로 판독 가능한 기록 매체.
  6. 부호화된 음성 신호를 복호하기 위하여, 컴퓨터 장치를,
    상기 부호화된 음성 신호를 포함하는 외부로부터의 비트스트림을 복호하여 저주파 성분을 얻는 코어 복호 수단;
    상기 코어 복호 수단에 의해 얻어진 상기 저주파 성분을 주파수 영역으로 변환하는 주파수 변환 수단;
    상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 저주파 대역으로부터 고주파 대역에 복사(複寫)함으로써 고주파 성분을 생성하는 고주파 생성 수단;
    상기 고주파 생성 수단에 의해 생성된 상기 고주파 성분을 조정하여, 조정된 고주파 성분을 생성하는 고주파 조정 수단;
    상기 주파수 변환 수단에 의해 주파수 영역으로 변환된 상기 저주파 성분을 분석하여 시간 포락선 정보를 취득하는 저주파 시간 포락선 분석 수단;
    상기 비트스트림을 분석하여 상기 시간 포락선 정보를 조정하기 위한 파라미터를 생성하는 시간 포락선 보조 정보 생성 수단;
    상기 저주파 시간 포락선 분석 수단에 의해 취득된 상기 시간 포락선 정보를 상기 파라미터를 사용하여 조정하여, 조정된 시간 포락선 정보를 생성하고, 상기 조정된 시간 포락선 정보의 이득(利得)을, 상기 주파수 영역의 고주파 성분의 SBR 포락선 시간 세그먼트 내에서의 전력(電力)이 시간 포락선의 변형 전과 변형 후에서 동등하게 되도록 제어하여, 추가로 조정된 시간 포락선 정보를 생성하는 시간 포락선 조정 수단; 및
    상기 조정된 고주파 성분에 상기 추가로 조정된 시간 포락선 정보를 승산(乘算)하여, 상기 조정된 고주파 성분의 시간 포락선을 변형하는 시간 포락선 변형 수단
    으로서 기능시키는 음성 복호 프로그램이 기록된, 컴퓨터로 판독 가능한 기록 매체.
KR1020127016477A 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체 KR101530296B1 (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP2009091396 2009-04-03
JPJP-P-2009-091396 2009-04-03
JPJP-P-2009-146831 2009-06-19
JP2009146831 2009-06-19
JP2009162238 2009-07-08
JPJP-P-2009-162238 2009-07-08
JP2010004419A JP4932917B2 (ja) 2009-04-03 2010-01-12 音声復号装置、音声復号方法、及び音声復号プログラム
JPJP-P-2010-004419 2010-01-12
PCT/JP2010/056077 WO2010114123A1 (ja) 2009-04-03 2010-04-02 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020117023208A Division KR101172325B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체

Publications (2)

Publication Number Publication Date
KR20120082476A true KR20120082476A (ko) 2012-07-23
KR101530296B1 KR101530296B1 (ko) 2015-06-19

Family

ID=42828407

Family Applications (7)

Application Number Title Priority Date Filing Date
KR1020127016476A KR101530295B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
KR1020127016477A KR101530296B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
KR1020127016475A KR101530294B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
KR1020117023208A KR101172325B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
KR1020127016467A KR101172326B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
KR1020167032541A KR101702415B1 (ko) 2009-04-03 2010-04-02 음성 부호화 장치 및 음성 부호화 방법
KR1020127016478A KR101702412B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020127016476A KR101530295B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체

Family Applications After (5)

Application Number Title Priority Date Filing Date
KR1020127016475A KR101530294B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
KR1020117023208A KR101172325B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
KR1020127016467A KR101172326B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
KR1020167032541A KR101702415B1 (ko) 2009-04-03 2010-04-02 음성 부호화 장치 및 음성 부호화 방법
KR1020127016478A KR101702412B1 (ko) 2009-04-03 2010-04-02 음성 복호 장치

Country Status (21)

Country Link
US (5) US8655649B2 (ko)
EP (5) EP2503547B1 (ko)
JP (1) JP4932917B2 (ko)
KR (7) KR101530295B1 (ko)
CN (6) CN102737640B (ko)
AU (1) AU2010232219B8 (ko)
BR (1) BRPI1015049B1 (ko)
CA (4) CA2757440C (ko)
CY (1) CY1114412T1 (ko)
DK (2) DK2509072T3 (ko)
ES (5) ES2587853T3 (ko)
HR (1) HRP20130841T1 (ko)
MX (1) MX2011010349A (ko)
PH (4) PH12012501118B1 (ko)
PL (2) PL2503548T3 (ko)
PT (3) PT2503548E (ko)
RU (6) RU2498421C2 (ko)
SG (2) SG10201401582VA (ko)
SI (1) SI2503548T1 (ko)
TW (6) TWI478150B (ko)
WO (1) WO2010114123A1 (ko)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
WO2011048798A1 (ja) * 2009-10-20 2011-04-28 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
KR101430118B1 (ko) * 2010-04-13 2014-08-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 또는 비디오 인코더, 오디오 또는 비디오 디코더 그리고 가변적인 예상 방향을 이용하여 멀티-채널 오디오 또는 비디오 신호들을 프로세싱하기 위한 관련 방법들
MX2013007489A (es) * 2010-12-29 2013-11-20 Samsung Electronics Co Ltd Aparato y metodo para codificacion/decodificacion para extension de ancho de banda de alta frecuencia.
CA3147525A1 (en) * 2011-02-18 2012-08-23 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
CN103918029B (zh) * 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
JP6200034B2 (ja) * 2012-04-27 2017-09-20 株式会社Nttドコモ 音声復号装置
CN102737647A (zh) * 2012-07-23 2012-10-17 武汉大学 双声道音频音质增强编解码方法及装置
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
CN103730125B (zh) * 2012-10-12 2016-12-21 华为技术有限公司 一种回声抵消方法和设备
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
PL2939235T3 (pl) 2013-01-29 2017-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adaptacyjna względem tonalności kwantyzacja o niskiej złożoności sygnału audio
MX346945B (es) * 2013-01-29 2017-04-06 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de refuerzo de frecuencia mediante una operacion de limitacion de energia.
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
KR102148407B1 (ko) * 2013-02-27 2020-08-27 한국전자통신연구원 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법
TWI477789B (zh) * 2013-04-03 2015-03-21 Tatung Co 資訊擷取裝置及其發送頻率調整方法
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN110070877B (zh) * 2013-07-18 2022-11-11 日本电信电话株式会社 线性预测分析装置、线性预测分析方法以及记录介质
EP2830059A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
WO2015017223A1 (en) * 2013-07-29 2015-02-05 Dolby Laboratories Licensing Corporation System and method for reducing temporal artifacts for transient signals in a decorrelator circuit
CN105761723B (zh) 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
CN104517610B (zh) 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
AU2014336356B2 (en) 2013-10-18 2017-04-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
EP3779982A1 (en) 2013-10-18 2021-02-17 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Concept of encoding an audio signal and decoding an audio signal using deterministic and noise like information
CN105706166B (zh) * 2013-10-31 2020-07-14 弗劳恩霍夫应用研究促进协会 对比特流进行解码的音频解码器设备和方法
KR20160087827A (ko) * 2013-11-22 2016-07-22 퀄컴 인코포레이티드 고대역 코딩에서의 선택적 위상 보상
JP6319753B2 (ja) 2013-12-02 2018-05-09 華為技術有限公司Huawei Technologies Co.,Ltd. 符号化方法および装置
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
RU2662693C2 (ru) * 2014-02-28 2018-07-26 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство декодирования, устройство кодирования, способ декодирования и способ кодирования
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
RU2673691C1 (ru) 2014-04-25 2018-11-29 Нтт Докомо, Инк. Устройство преобразования коэффициентов линейного предсказания и способ преобразования коэффициентов линейного предсказания
CN110491401B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 周期性综合包络序列生成装置、方法、记录介质
WO2016024853A1 (ko) * 2014-08-15 2016-02-18 삼성전자 주식회사 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기
US9659564B2 (en) * 2014-10-24 2017-05-23 Sestek Ses Ve Iletisim Bilgisayar Teknolojileri Sanayi Ticaret Anonim Sirketi Speaker verification based on acoustic behavioral characteristics of the speaker
US9455732B2 (en) * 2014-12-19 2016-09-27 Stmicroelectronics S.R.L. Method and device for analog-to-digital conversion of signals, corresponding apparatus
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
CA2982017A1 (en) * 2015-04-10 2016-10-13 Thomson Licensing Method and device for encoding multiple audio signals, and method and device for decoding a mixture of multiple audio signals with improved separation
PT3443557T (pt) * 2016-04-12 2020-08-27 Fraunhofer Ges Forschung Codificador de áudio para codificar um sinal de áudio, método para codificar um sinal de áudio e programa de computador sob consideração de uma região espectral de pico detetada numa banda de frequência superior
WO2017196382A1 (en) * 2016-05-11 2017-11-16 Nuance Communications, Inc. Enhanced de-esser for in-car communication systems
DE102017204181A1 (de) 2017-03-14 2018-09-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sender zum Emittieren von Signalen und Empfänger zum Empfangen von Signalen
EP3382701A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483880A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
US11275556B2 (en) * 2018-02-27 2022-03-15 Zetane Systems Inc. Method, computer-readable medium, and processing unit for programming using transforms on heterogeneous data
US10810455B2 (en) 2018-03-05 2020-10-20 Nvidia Corp. Spatio-temporal image metric for rendered animations
CN109243485B (zh) * 2018-09-13 2021-08-13 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
KR102603621B1 (ko) * 2019-01-08 2023-11-16 엘지전자 주식회사 신호 처리 장치 및 이를 구비하는 영상표시장치
CN113192523A (zh) * 2020-01-13 2021-07-30 华为技术有限公司 一种音频编解码方法和音频编解码设备
JP6872056B2 (ja) * 2020-04-09 2021-05-19 株式会社Nttドコモ 音声復号装置および音声復号方法
CN113190508B (zh) * 2021-04-26 2023-05-05 重庆市规划和自然资源信息中心 一种面向管理的自然语言识别方法

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
DE19747132C2 (de) 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US8782254B2 (en) * 2001-06-28 2014-07-15 Oracle America, Inc. Differentiated quality of service context assignment and propagation
EP1444688B1 (en) * 2001-11-14 2006-08-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
US7469206B2 (en) * 2001-11-29 2008-12-23 Coding Technologies Ab Methods for improving high frequency reconstruction
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
JP3646939B1 (ja) * 2002-09-19 2005-05-11 松下電器産業株式会社 オーディオ復号装置およびオーディオ復号方法
US7519538B2 (en) * 2003-10-30 2009-04-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
US7668711B2 (en) * 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US7045799B1 (en) 2004-11-19 2006-05-16 Varian Semiconductor Equipment Associates, Inc. Weakening focusing effect of acceleration-deceleration column of ion implanter
TWI319565B (en) * 2005-04-01 2010-01-11 Qualcomm Inc Methods, and apparatus for generating highband excitation signal
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
US9043214B2 (en) * 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
JP4339820B2 (ja) * 2005-05-30 2009-10-07 太陽誘電株式会社 光情報記録装置および方法および信号処理回路
US20070006716A1 (en) * 2005-07-07 2007-01-11 Ryan Salmond On-board electric guitar tuner
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
JP4921365B2 (ja) 2005-07-15 2012-04-25 パナソニック株式会社 信号処理装置
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
JP5457171B2 (ja) * 2006-03-20 2014-04-02 オランジュ オーディオデコーダ内で信号を後処理する方法
KR100791846B1 (ko) * 2006-06-21 2008-01-07 주식회사 대우일렉트로닉스 오디오 복호기
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
JP4918841B2 (ja) 2006-10-23 2012-04-18 富士通株式会社 符号化システム
WO2009029037A1 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive transition frequency between noise fill and bandwidth extension
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
KR101413967B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
KR101475724B1 (ko) * 2008-06-09 2014-12-30 삼성전자주식회사 오디오 신호 품질 향상 장치 및 방법
KR20100007018A (ko) * 2008-07-11 2010-01-22 에스앤티대우(주) 피스톤밸브 어셈블리 및 이를 포함하는 연속 감쇠력 가변형댐퍼
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension

Also Published As

Publication number Publication date
TWI476763B (zh) 2015-03-11
US9064500B2 (en) 2015-06-23
CA2844441C (en) 2016-03-15
CA2844635A1 (en) 2010-10-07
TW201126515A (en) 2011-08-01
SG10201401582VA (en) 2014-08-28
TW201243833A (en) 2012-11-01
PL2503546T4 (pl) 2017-01-31
RU2011144573A (ru) 2013-05-10
EP2503548A1 (en) 2012-09-26
RU2012130461A (ru) 2014-02-10
CN102737640A (zh) 2012-10-17
CN102737640B (zh) 2014-08-27
TW201243831A (en) 2012-11-01
KR101702412B1 (ko) 2017-02-03
US20130138432A1 (en) 2013-05-30
SG174975A1 (en) 2011-11-28
EP2503547A1 (en) 2012-09-26
CN102779522A (zh) 2012-11-14
EP2416316A1 (en) 2012-02-08
TWI379288B (ko) 2012-12-11
RU2595915C2 (ru) 2016-08-27
CA2844438C (en) 2016-03-15
CN102779520A (zh) 2012-11-14
EP2509072B1 (en) 2016-10-19
MX2011010349A (es) 2011-11-29
TW201243830A (en) 2012-11-01
PH12012501116A1 (en) 2015-08-03
CY1114412T1 (el) 2016-08-31
TW201243832A (en) 2012-11-01
KR101702415B1 (ko) 2017-02-03
CA2844441A1 (en) 2010-10-07
ES2428316T3 (es) 2013-11-07
EP2503547B1 (en) 2016-05-11
US9779744B2 (en) 2017-10-03
KR101172325B1 (ko) 2012-08-14
PT2509072T (pt) 2016-12-13
EP2416316B1 (en) 2014-01-08
PL2503548T3 (pl) 2013-11-29
AU2010232219B2 (en) 2012-11-22
ES2453165T9 (es) 2014-05-06
KR20160137668A (ko) 2016-11-30
EP2503548B1 (en) 2013-06-19
PH12012501116B1 (en) 2015-08-03
EP2416316A4 (en) 2012-09-12
KR101172326B1 (ko) 2012-08-14
EP2503546A1 (en) 2012-09-26
RU2498420C1 (ru) 2013-11-10
ES2453165T3 (es) 2014-04-04
PT2503548E (pt) 2013-09-20
US20140163972A1 (en) 2014-06-12
DK2503548T3 (da) 2013-09-30
RU2595914C2 (ru) 2016-08-27
AU2010232219B8 (en) 2012-12-06
EP2503546B1 (en) 2016-05-11
CN102379004A (zh) 2012-03-14
PH12012501119B1 (en) 2015-05-18
RU2012130472A (ru) 2013-09-10
CN102779523B (zh) 2015-04-01
PH12012501118A1 (en) 2015-05-11
CN102779521A (zh) 2012-11-14
KR20120079182A (ko) 2012-07-11
RU2012130462A (ru) 2013-09-10
PH12012501117B1 (en) 2015-05-11
RU2498422C1 (ru) 2013-11-10
CA2757440C (en) 2016-07-05
PH12012501119A1 (en) 2015-05-18
PH12012501118B1 (en) 2015-05-11
AU2010232219A1 (en) 2011-11-03
EP2509072A1 (en) 2012-10-10
TWI479479B (zh) 2015-04-01
JP2011034046A (ja) 2011-02-17
HRP20130841T1 (hr) 2013-10-25
US10366696B2 (en) 2019-07-30
KR101530295B1 (ko) 2015-06-19
ES2586766T3 (es) 2016-10-18
US9460734B2 (en) 2016-10-04
TWI478150B (zh) 2015-03-21
PH12012501117A1 (en) 2015-05-11
CN102779522B (zh) 2015-06-03
KR20120080258A (ko) 2012-07-16
BRPI1015049B1 (pt) 2020-12-08
CA2844438A1 (en) 2010-10-07
RU2498421C2 (ru) 2013-11-10
PT2416316E (pt) 2014-02-24
CN102379004B (zh) 2012-12-12
TWI479480B (zh) 2015-04-01
CA2757440A1 (en) 2010-10-07
KR101530294B1 (ko) 2015-06-19
US20160365098A1 (en) 2016-12-15
ES2587853T3 (es) 2016-10-27
KR20110134442A (ko) 2011-12-14
PL2503546T3 (pl) 2016-11-30
TWI384461B (zh) 2013-02-01
TW201246194A (en) 2012-11-16
US20120010879A1 (en) 2012-01-12
KR20120082475A (ko) 2012-07-23
RU2595951C2 (ru) 2016-08-27
RU2012130466A (ru) 2014-01-27
KR101530296B1 (ko) 2015-06-19
JP4932917B2 (ja) 2012-05-16
US20160358615A1 (en) 2016-12-08
CN102779521B (zh) 2015-01-28
CN102779520B (zh) 2015-01-28
SI2503548T1 (sl) 2013-10-30
US8655649B2 (en) 2014-02-18
CN102779523A (zh) 2012-11-14
RU2012130470A (ru) 2014-01-27
KR20120080257A (ko) 2012-07-16
DK2509072T3 (en) 2016-12-12
ES2610363T3 (es) 2017-04-27
WO2010114123A1 (ja) 2010-10-07
CA2844635C (en) 2016-03-29

Similar Documents

Publication Publication Date Title
KR101172326B1 (ko) 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
JP5588547B2 (ja) 音声復号装置、音声復号方法、及び音声復号プログラム

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180530

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190530

Year of fee payment: 5