KR101175553B1 - 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램 - Google Patents

소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램 Download PDF

Info

Publication number
KR101175553B1
KR101175553B1 KR1020127017742A KR20127017742A KR101175553B1 KR 101175553 B1 KR101175553 B1 KR 101175553B1 KR 1020127017742 A KR1020127017742 A KR 1020127017742A KR 20127017742 A KR20127017742 A KR 20127017742A KR 101175553 B1 KR101175553 B1 KR 101175553B1
Authority
KR
South Korea
Prior art keywords
decoding
encoding
frame
linear prediction
internal state
Prior art date
Application number
KR1020127017742A
Other languages
English (en)
Other versions
KR20120084339A (ko
Inventor
고스케 쓰지노
게이 기쿠이리
노부히코 나카
Original Assignee
가부시키가이샤 엔.티.티.도코모
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 엔.티.티.도코모 filed Critical 가부시키가이샤 엔.티.티.도코모
Publication of KR20120084339A publication Critical patent/KR20120084339A/ko
Application granted granted Critical
Publication of KR101175553B1 publication Critical patent/KR101175553B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

선형 예측 부호화 방식에 기초한 제1 부호화부(13)에 의해 부호화되는 부호 대상 프레임의 앞의 부호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화부(14)에 의해 부호화된 경우, 제1 부호화부(13)의 내부 상태를 초기화함으로써, 부호 대상 프레임의 부호화를 선형 예측 부호화 방식에 의해 행한다. 이에 따라, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리를 실현할 수 있다.

Description

소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램{SOUND SIGNAL CODING METHOD, SOUND SIGNAL DECODING METHOD, CODING DEVICE, DECODING DEVICE, SOUND SIGNAL PROCESSING SYSTEM, SOUND SIGNAL CODING PROGRAM, AND SOUND SIGNAL DECODING PROGRAM}
본 발명은, 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램 및 소리 신호 복호 프로그램에 관한 것이다.
음성?음악 신호(소리 신호)를 낮은 비트레이트로 압축하는 부호화 기술은, 음성?음악 신호의 통신?방송?축적에 필요로 하는 비용을 낮추기 위해서 중요하다. 음성 신호와 음악 신호의 양쪽을 효율적으로 부호화하기 위해서는, 음성 신호에 적합한 부호화 방식과 음악 신호에 적합한 부호화 방식을 전환하여 이용하는 복합형의 부호화 방식이 유효하다. 복합형의 부호화 방식을 이용하는 경우, 음성 계 열의 도중에 부호화 방식의 전환을 행함으로써, 입력 신호의 성질이 시간적으로 변화되는 경우에도 효율적으로 부호화할 수 있다.
복합형의 부호화 방식은, 통상적으로, 음성 신호의 부호화에 적합한 CELP 방식(CELP: Code Excited Linear Prediction Coding, 코드 여진(勵振) 선형 예측 부호화)의 부호화를 구성 요소로서 포함한다. 일반적으로, CELP 방식의 부호기는, 입력 신호에 선형 예측 역(逆) 필터를 적용함으로써 얻어지는 잔차(殘差) 신호를 부호화하기 위하여, 과거의 잔차 신호에 관한 정보를 적응 부호장(符號帳)으로서 내부에 유지한다. 이 적응 부호장이 부호화에 이용되므로, 높은 부호화 효율이 달성된다.
음성 신호 및 음악 신호를 부호화하는 기술은, 예를 들면, 하기 특허 문헌 1 등에 기재되어 있다. 하기 특허 문헌 1에는, 음성 신호 및 음악 신호의 양쪽을 부호화하는 부호화 알고리즘 등이 기재되어 있다. 하기 특허 문헌 1의 기술은, 음성 신호 및 음악 신호의 양쪽에 공통인 선형 예측(LP) 합성 필터를 사용한다. LP 합성 필터는, 음성 신호 또는 음악 신호의 부호화에 따라, 각각 음성 여진 제네레이터와 변환 여진 제네레이터를 전환한다. 음성 신호의 부호화에는, 종래의 CELP 기술을 사용하고, 음악 신호의 부호화에는, 신규의 비대칭 중복 가산 변환 기술을 응용한다. 공통의 LP 합성 필터링을 행할 때, 중복 가산 조작 영역의 신호에 LP 계수의 보간을 행한다.
CELP 방식 이외의 다른 부호화 방식으로부터 CELP 방식에 기초한 부호화 방식으로의 전환이 음성 계열의 도중에 행해지는 경우, 전환 전의 음성에 대응하는 잔차 신호의 정보가 적응 부호장으로서 부호기에 유지되어 있지 않으므로, 부호화 방식의 전환 직후의 프레임에 있어서 부호화 효율이 저하되고, 따라서, 음성 품질의 열화를 초래하는 문제가 발생할 수 있다. CELP 방식 이외의 다른 부호화 방식에 의한 부호화 결과를 이용하여 CELP 방식에 있어서의 부호기의 내부 상태를 초기화하는 방법에 관한 선행 기술로서, 3rd Generation Partnership Project(3GPP)에 있어서 표준화된 음성 부호화 방식인 Adaptive MultiRate Wideband plus(AMR-WB+, 비특허 문헌 1)가 알려져 있다. AMR-WB+의 부호기는, 입력 신호에 선형 예측 역필터 처리를 행하여 얻어지는 잔차 신호를 구하고, 그 후, CELP 방식과 Transform Coded Excitation(TCX) 방식의 2개의 부호화 방식을 전환하여 이용함으로써, 잔차 신호의 부호화를 행한다. AMR-WB+의 부호기는, TCX 방식으로부터 CELP 방식으로의 전환이 행해지는 경우, TCX 방식에 있어서의 여기 신호를 사용하여 CELP 방식에서의 적응 부호장을 갱신한다.
일본 특허출원 공개번호 2003-44097호 공보
3GPP TS 26.290 "Audio codec processing functions; Extended Adaptive Multi-Rate-Wideband(AMR-WB+) codec; Transcoding functions". [online]. [retrieved on 5 March 2009] Retrieved from the Internet: <URL: http://www.3gpp.org/ftp/Specs/html-info/26290.htm>
그러나, CELP 방식에 기초한 부호화 방식과, 선형 예측 부호화를 이용하지 않는 부호화 방식을 전환하여 이용하는 복합형의 부호화 방식을 이용하는 경우, 선형 예측 부호화를 이용하지 않는 부호화 방식에 의한 부호화의 과정에 있어서 여기 신호를 얻기가 곤란하다. 그러므로, 선형 예측 부호화를 이용하지 않는 부호화 방식으로부터 CELP 방식에 기초한 부호화 방식으로의 전환을 행하는 경우에, CELP 방식에 있어서의 적응 부호장을, 전환 전의 음성에 대응하는 여기 신호에 의해 초기화하는 것이 곤란하게 된다. 본 발명의 목적은, 선형 예측을 이용하지 않는 부호화 방식으로부터 선형 예측 부호화에 기초한 부호화 방식으로의 전환을 행하는 경우에, 선형 예측 부호화에 기초한 부호화 방식의 부호 수단 또는 복호 수단의 내부 상태의 초기값을 적절한 값으로 설정하여, 전환 직후의 프레임에 있어서의 음성 품질을 개선하는 것이다.
본 발명의 소리 신호 부호화 방법은, 선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단을 사용하여, 복수의 프레임으로 이루어지는 소리 신호를 부호화하는 소리 신호 부호화 방법으로서, 상기 소리 신호의 제1 프레임이 상기 제2 부호화 수단에 의해 부호화된 후에, 상기 제1 프레임의 직후에 있는 제2 프레임을 부호화하는 부호화 수단을 상기 제2 부호화 수단으로부터 상기 제1 부호화 수단으로 전환하는 전환 단계와, 상기 전환 단계 후에, 상기 제1 부호화 수단의 내부 상태를 소정의 방법에 의해 초기화하는 초기화 단계를 포함하는 것을 특징으로 한다.
본 발명의 소리 신호 부호화 방법에 의하면, 선형 예측 부호화 방식에 의해 부호화하는 제2 프레임의 앞의 제1 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식으로 부호화된 경우라도, 선형 예측 부호화 방식에 기초한 제1 부호화 수단의 내부 상태를 초기화함으로써, 제2 프레임의 부호화를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리를 실현할 수 있다.
또한, 본 발명에 있어서, 상기 제1 부호화 수단의 상기 내부 상태는, 적응 부호장의 내용 또는 영(0) 입력 응답을 요구하기 위한 선형 예측 합성 필터의 지연 요소를 유지하는 값인 것이 바람직하고, 상기 초기화 단계에서는, 상기 제1 프레임을 사용하여 상기 제1 부호화 수단의 내부 상태를 초기화하는 것이 바람직하고, 상기 초기화 단계에서는, 상기 제2 부호화 수단에 의한 부호화 전의 상기 제1 프레임, 또는 상기 제2 부호화 수단에 의한 부호화 후에 복호하여 얻어지는 상기 제1 프레임 중 어느 하나에 상기 선형 예측 역필터를 적용하여 얻어지는 잔차 신호를 사용하여, 상기 제1 부호화 수단의 초기화를 행하는 것이 바람직하고, 상기 초기화 단계에서는, 상기 제1 프레임보다 앞에 있는 제3 프레임에 상기 제1 부호화 수단에 의한 부호화를 행했을 때의 선형 예측 계수를 사용하여, 상기 제2 부호화 수단에 의한 부호화 전의 상기 제1 프레임, 또는 상기 제2 부호화 수단에 의한 부호화 후에 복호하여 얻어지는 상기 제1 프레임 중 어느 하나에 상기 선형 예측 역필터를 적용하는 것이 바람직하다. 또는, 상기 초기화 단계에서는, 상기 제1 프레임에서의 선형 예측 계수가 상기 제2 프레임의 부호에 포함되는 경우에는, 상기 제2 프레임의 부호에 포함되어 있는 선형 예측 계수를 사용하여, 상기 제2 부호화 수단에 의한 부호화 전의 상기 제1 프레임, 또는 상기 제2 부호화 수단에 의한 부호화 후에 복호하여 얻어지는 상기 제1 프레임 중 어느 하나에 상기 선형 예측 역필터를 적용하는 것이 바람직하다. 그리고, 본 발명에 있어서, 상기 초기화 단계에서는, 상기 제1 프레임보다 앞에 있는 프레임에 상기 제1 부호화 수단에 의한 부호화를 행했을 때의 상기 제1 부호화 수단의 내부 상태를 사용하여, 상기 제1 부호화 수단의 내부 상태를 초기화해도 된다. 또한, 영 입력 응답을 요구하기 위한 선형 예측 합성 필터에서의 선형 예측 계수로서도, 상기 제1 프레임보다 앞에 있는 제3 프레임에 상기 제1 부호화 수단에 의한 부호화를 행했을 때의 선형 예측 계수, 또는 상기 제1 프레임에서의 선형 예측 계수가 상기 제2 프레임의 부호에 포함되는 경우에는, 상기 제2 프레임의 부호화 시에 계산되는 상기 제1 프레임에서의 선형 예측 계수, 또는 그들에 청각 가중치 부여 필터를 적용한 것을 사용하는 것이 바람직하다.
본 발명의 소리 신호 복호 방법은, 선형 예측 부호화 방식에 기초한 제1 복호 수단과, 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단을 사용하여, 복수의 프레임으로 이루어지는 부호화 소리 신호를 복호하는 소리 신호 복호 방법으로서, 상기 부호화 소리 신호의 제1 프레임이 상기 제2 복호 수단에 의해 복호된 후에, 상기 제1 프레임의 직후에 있는 제2 프레임을 복호하는 복호 수단을 상기 제2 복호 수단으로부터 상기 제1 복호 수단으로 전환하는 전환 단계와, 상기 전환 단계 후에, 상기 제1 복호 수단의 내부 상태를 소정의 방법에 의해 초기화하는 초기화 단계를 포함하는 것을 특징으로 한다.
본 발명의 소리 신호 복호 방법에 의하면, 선형 예측 부호화 방식을 사용하여 복호하는 제2 프레임의 앞의 제1 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 의해 복호된 경우라도, 선형 예측 부호화 방식에 기초한 제1 복호 수단의 내부 상태를 초기화함으로써, 제2 프레임의 복호를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 복호 처리를 실현할 수 있다.
또한, 본 발명에 있어서, 상기 제1 복호 수단의 상기 내부 상태는, 적응 부호장의 내용 또는 선형 예측 합성 필터의 지연 요소를 유지하는 값인 것이 바람직하고, 상기 초기화 단계에서는, 상기 제1 프레임을 사용하여 상기 제1 복호 수단의 내부 상태를 초기화하는 것이 바람직하고, 상기 초기화 단계에서는, 상기 제2 복호 수단에 의한 복호 후의 상기 제1 프레임에 상기 선형 예측 역필터를 적용하여 얻어지는 잔차 신호를 사용하여, 상기 제1 복호 수단의 초기화를 행하는 것이 바람직하고, 상기 초기화 단계에서는, 상기 제1 프레임보다 앞에 있는 제3 프레임에 상기 제1 복호 수단에 의한 복호를 행했을 때의 선형 예측 계수를 사용하여, 상기 제2 복호 수단에 의한 복호 후의 상기 제1 프레임에 상기 선형 예측 역필터를 적용하는 것이 바람직하다. 또는, 상기 초기화 단계에서는, 상기 제1 프레임에서의 선형 예측 계수가 상기 제2 프레임의 부호에 포함되어 있는 경우에는, 상기 제2 프레임의 부호에 포함되어 있는 선형 예측 계수를 사용하여, 상기 제2 복호 수단에 의한 복호 후의 상기 제1 프레임에 상기 선형 예측 역필터를 적용하는 것이 바람직하다. 그리고, 본 발명에 있어서, 상기 초기화 단계에서는, 상기 제1 프레임보다 앞에 있는 프레임에 상기 제1 복호 수단에 의한 복호를 행했을 때의 상기 제1 복호 수단의 내부 상태를 사용하여, 상기 제1 복호 수단의 내부 상태를 초기화해도 된다.
본 발명의 부호화 장치는, 선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 상기 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단을 구비하고, 상기 제1 부호화 수단 및 상기 제2 부호화 수단을 사용하여 소리 신호를 부호화하는 부호화 장치로서, 상기 소리 신호에 포함되어 있고 부호화의 대상으로 되는 부호 대상 프레임을, 상기 제1 부호화 수단 또는 상기 제2 부호화 수단 중 어느 쪽에 의해 부호화할 것인지를 판정하는 제1 부호 판정 수단과, 상기 부호 대상 프레임을 상기 제1 부호화 수단에 의해 부호화할 것으로 상기 제1 부호 판정 수단에 의해 판정된 경우에, 상기 부호 대상 프레임의 직전에 있는 부호 직전 프레임이 상기 제1 부호화 수단에 의해 부호화되어 있는지, 또는 상기 제2 부호화 수단에 의해 부호화되어 있는지를 판정하는 제2 부호 판정 수단과, 상기 부호 직전 프레임이 상기 제2 부호화 수단에 의해 부호화되어 있는 것으로 상기 제2 부호 판정 수단에 의해 판정된 경우에, 상기 부호 직전 프레임의 부호화 결과를 복호하고, 이 복호 결과를 사용하여 상기 제1 부호화 수단의 내부 상태를 산출하는 부호 내부 상태 계산 수단과, 상기 부호 내부 상태 계산 수단에 의해 산출된 상기 내부 상태를 사용하여 상기 제1 부호화 수단의 내부 상태를 초기화하는 부호 초기화 수단을 구비하고, 상기 제1 부호화 수단은, 상기 부호 초기화 수단에 의한 상기 내부 상태의 초기화 후에 상기 부호 대상 프레임을 부호화하는 것을 특징으로 한다.
본 발명의 부호화 장치에 의하면, 선형 예측 부호화 방식에 기초한 제1 부호화 수단에 의해 부호화되는 부호 대상 프레임의 앞의 부호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단에 의해 부호화된 경우라도, 제1 부호화 수단의 내부 상태를 초기화함으로써, 부호 대상 프레임의 부호화를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리를 실현할 수 있다.
본 발명의 복호 장치는, 선형 예측 부호화 방식에 기초한 제1 복호 수단과, 상기 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단을 구비하고, 상기 제1 복호 수단 및 상기 제2 복호 수단을 사용하여 부호화 소리 신호를 복호하는 복호 장치로서, 상기 부호화 소리 신호에 포함되어 있고 복호의 대상으로 되는 복호 대상 프레임을, 상기 제1 복호 수단 또는 상기 제2 복호 수단 중 어느 쪽에 의해 복호할 것인지를 판정하는 제1 복호 판정 수단과, 상기 복호 대상 프레임을 상기 제1 복호 수단에 의해 복호할 것으로 상기 제1 복호 판정 수단에 의해 판정된 경우에, 상기 복호 대상 프레임의 직전에 있는 복호 직전 프레임이 상기 제1 복호 수단에 의해 복호되었는지, 또는 상기 제2 복호 수단에 의해 복호되었는지를 판정하는 제2 복호 판정 수단과, 상기 복호 직전 프레임이 상기 제2 복호 수단에 의해 복호된 것으로 상기 제2 복호 판정 수단에 의해 판정된 경우에, 상기 복호 직전 프레임의 복호 결과를 사용하여 상기 제1 복호 수단의 내부 상태를 산출하는 복호 내부 상태 계산 수단과, 상기 복호 내부 상태 계산 수단에 의해 산출된 상기 내부 상태를 사용하여 상기 제1 복호 수단의 내부 상태를 초기화하는 복호 초기화 수단을 구비하고, 상기 제1 복호 수단은, 상기 복호 초기화 수단에 의한 상기 내부 상태의 초기화 후에 상기 복호 대상 프레임을 복호하는 것을 특징으로 한다.
본 발명의 복호 장치에 의하면, 선형 예측 부호화 방식에 기초한 제1 복호 수단을 사용하여 복호하는 복호 대상 프레임의 앞의 복호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단에 의해 복호된 경우라도, 제1 복호 수단의 내부 상태를 초기화함으로써, 복호 대상 프레임의 복호를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 복호 처리를 실현할 수 있다.
본 발명의 소리 신호 처리 시스템은, 상기 부호화 장치와 상기 복호 장치를 구비하고, 상기 복호 장치는, 상기 부호화 장치에 의해 부호화된 부호화 소리 신호를 복호하는 것을 특징으로 한다.
본 발명의 소리 신호 처리 시스템에 의하면, 선형 예측 부호화 방식에 기초한 제1 부호화 수단에 의해 부호화되는 부호 대상 프레임의 앞의 부호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단에 의해 부호화된 경우라도, 제1 부호화 수단의 내부 상태를 초기화함으로써, 부호 대상 프레임의 부호화를 선형 예측 부호화 방식에 의해 행할 수 있다. 선형 예측 부호화 방식에 기초한 제1 복호 수단을 사용하여 복호하는 복호 대상 프레임의 앞의 복호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단에 의해 복호된 경우라도, 제1 복호 수단의 내부 상태를 초기화함으로써, 복호 대상 프레임의 복호를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리 및 복호 처리를 실현할 수 있다.
본 발명의 소리 신호 부호화 프로그램은, 선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 상기 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단을 사용하여 소리 신호를 부호화하기 위하여, 컴퓨터 장치를, 상기 소리 신호에 포함되어 있고 부호화의 대상으로 되는 부호 대상 프레임을 상기 제1 부호화 수단 또는 상기 제2 부호화 수단 중 어느 쪽에 의해 부호할 것인지를 판정하는 제1 부호 판정 수단, 상기 부호 대상 프레임을 상기 제1 부호화 수단에 의해 부호화할 것으로 상기 제1 부호 판정 수단에 의해 판정된 경우에, 상기 부호 대상 프레임의 직전에 있는 부호 직전 프레임이 상기 제1 부호화 수단에 의해 부호화되어 있는지, 또는 상기 제2 부호화 수단에 의해 부호화되어 있는지를 판정하는 제2 부호 판정 수단, 상기 부호 직전 프레임이 상기 제2 부호화 수단에 의해 부호화되어 있는 것으로 상기 제2 부호 판정 수단에 의해 판정된 경우에, 상기 부호 직전 프레임의 부호화 결과를 복호하고, 이 복호 결과를 사용하여 상기 제1 부호화 수단의 내부 상태를 산출하는 부호 내부 상태 계산 수단, 상기 부호 내부 상태 계산 수단에 의해 산출된 상기 내부 상태를 사용하여 상기 제1 부호화 수단의 내부 상태를 초기화하는 부호 초기화 수단, 및 상기 부호 초기화 수단에 의해 상기 내부 상태의 초기화를 행한 후에 상기 제1 부호화 수단이 상기 부호 대상 프레임을 부호화하는 부호화 수단으로서 기능하게 하는 것을 특징으로 한다.
본 발명의 소리 신호 부호화 프로그램에 의하면, 선형 예측 부호화 방식에 기초한 제1 부호화 수단에 의해 부호화되는 부호 대상 프레임의 앞의 부호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단에 의해 부호화된 경우라도, 제1 부호화 수단의 내부 상태를 초기화함으로써, 부호 대상 프레임의 부호화를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리를 실현할 수 있다.
본 발명의 소리 신호 복호 프로그램은, 선형 예측 부호화 방식에 기초한 제1 복호 수단과, 상기 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단을 사용하여 부호화 소리 신호를 복호하기 위하여, 컴퓨터 장치를, 상기 부호화 소리 신호에 포함되어 있고 복호의 대상으로 되는 복호 대상 프레임을 상기 제1 복호 수단 또는 상기 제2 복호 수단 중 어느 쪽에 의해 복호할 것인지 판정하는 제1 복호 판정 수단, 상기 복호 대상 프레임을 상기 제1 복호 수단에 의해 복호할 것으로 상기 제1 복호 판정 수단에 의해 판정된 경우에, 상기 복호 대상 프레임의 직전에 있는 복호 직전 프레임이 상기 제1 복호 수단에 의해 복호되었는지, 또는 상기 제2 복호 수단에 의해 복호되었는지를 판정하는 제2 복호 판정 수단, 상기 복호 직전 프레임이 상기 제2 복호 수단에 의해 복호된 것으로 상기 제2 복호 판정 수단에 의해 판정된 경우에, 상기 복호 직전 프레임의 복호 결과를 사용하여 상기 제1 복호 수단의 내부 상태를 산출하는 복호 내부 상태 계산 수단, 상기 복호 내부 상태 계산 수단에 의해 산출된 상기 내부 상태를 사용하여 상기 제1 복호 수단의 내부 상태를 초기화하는 복호 초기화 수단, 및 상기 복호 초기화 수단에 의해 상기 내부 상태의 초기화를 행한 후에 상기 제1 복호 수단이 상기 복호 대상 프레임을 복호하는 복호 수단으로서 기능하게 하는 것을 특징으로 한다.
본 발명의 소리 신호 복호 프로그램에 의하면, 선형 예측 부호화 방식에 기초한 제1 복호 수단을 사용하여 복호하는 복호 대상 프레임의 앞의 복호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단에 의해 복호된 경우라도, 제1 복호 수단의 내부 상태를 초기화함으로써, 복호 대상 프레임의 복호를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 복호 처리를 실현할 수 있다.
본 발명에 의하면, 선형 예측을 사용하지 않는 부호화 방식으로부터 선형 예측 부호화에 기초한 부호화 방식으로의 전환을 행하는 경우에, 선형 예측 부호화에 기초한 부호화 방식의 부호 수단 또는 복호 수단의 내부 상태의 초기값을 적절한 값으로 설정하여, 전환 직후의 프레임에서의 음성 품질을 개선할 수 있다.
도 1은 실시예에 따른 부호화 장치 및 복호 장치의 구성을 나타낸 도면이다.
도 2는 실시예에 따른 부호화 장치의 구성을 나타낸 도면이다.
도 3은 실시예에 따른 부호화 장치의 동작을 설명하기 위한 흐름도이다.
도 4는 실시예에 따른 복호 장치의 구성을 나타낸 도면이다.
도 5는 실시예에 따른 복호 장치의 동작을 설명하기 위한 흐름도이다.
이하, 도면을 참조하여, 본 발명에 따른 바람직한 실시예에 대하여 상세하게 설명한다. 그리고, 도면의 설명에 있어서, 가능한 경우에는, 동일 요소에는 동일 부호를 부여하고, 중복되는 설명을 생략한다. 실시예에 따른 소리 신호 처리 시스템은, 입력한 소리 신호를 부호화하는 부호화 장치(10)와, 부호화 장치(10)에 의해 부호화된 부호화 소리 신호를 복호하는 복호 장치(20)를 구비한다. 도 1 및 도 2는, 실시예에 따른 부호화 장치(10)의 구성을 나타낸 도면이다. 부호화 장치(10)는, 입력된 음성?음악 신호(소리 신호)를 부호화하여 출력한다. 음성?음악 신호는, 유한한 길이를 가지는 프레임으로 미리 분할된 후에, 부호화 장치(10)에 입력되는 것으로 한다. 부호화 장치(10)는, 음성?음악 신호가 음성 신호인 경우에, 제1 부호화 방식에 따라 부호화하고, 음성?음악 신호가 음악 신호인 경우에는, 제2 부호화 방식에 따라 부호화한다. 제1 부호화 방식은 적응 부호장을 가지는 선형 예측 부호화에 기초한 ACELP 등의 CELP 방식이다. 제2 부호화 방식은 제1 부호화 방식과는 상이하며, 선형 예측을 이용하지 않는 부호화 방식이다. 제2 부호화 방식은, 예를 들면, AAC 등의 변환 부호화를 상정(想定)한다.
부호화 장치(10)는, 물리적으로는 CPU(10a), ROM(10b), RAM(10c), 기억 장치(10d) 및 통신 장치(10e) 등을 포함하는 컴퓨터 장치를 가지고 있고, 이들 CPU(10a) ~ 통신 장치(10e)는, 버스(10f)에 접속되어 있다. CPU(10a)는, ROM(10b) 등의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 3에 나타내는 흐름도의 처리를 실행하기 위한 소리 신호 부호화 프로그램)을 RAM(10c)에 로딩하여 실행함으로써, 부호화 장치(10)를 통괄적으로 제어한다. 기억 장치(10d)는, 기록/판독이 가능한 메모리로서, 각종 컴퓨터 프로그램이나, 컴퓨터 프로그램의 실행에 필요한 각종 데이터 등(예를 들면, 제1 부호화 방식의 부호화에 사용하는 적응 부호장 및 선형 예측 계수나, 그 밖에 제1 부호화 방식 및 제2 부호화 방식에 의한 부호화에 필요한 다양한 파라미터, 소정 개수의 부호화 전후의 프레임 등)을 저장한다. 기억 장치(10d)는, 적어도 최후에(직전에) 부호화된 하나의 프레임의 음성?음악 신호를 저장한다.
또한, 부호화 장치(10)는, 기능적으로는, 부호화 방식 전환부(12)(제1 부호 판정 수단, 제2 부호 판정 수단), 제1 부호화부(13)(제1 부호화 수단), 제2 부호화부(14)(제2 부호화 수단), 부호 다중화부(15), 내부 상태 계산부(16)(부호 내부 상태 계산 수단) 및 내부 상태 초기화법 특정부(17)(부호 초기화 수단)를 가진다. 이들 부호화 방식 전환부(12)~내부 상태 초기화법 특정부(17)는, CPU(10a)가 ROM(10b) 등의 부호화 장치(10)의 내장 메모리에 저장된 상기 컴퓨터 프로그램을 실행하여, 도 1에 나타내는 부호화 장치(10)의 각 구성부를 동작시킴으로써 실현되는 기능이다. CPU(10a)는, 상기 소리 신호 부호화 프로그램을 실행함으로써[부호화 방식 전환부(12) ~ 내부 상태 초기화법 특정부(17)를 사용하여], 도 3의 흐름도에 나타내는 처리를 실행한다.
다음으로, 도 3을 참조하여, 부호화 장치(10)의 동작을 설명한다. 음성?음악 신호는, 유한한 길이를 가지는 프레임으로 미리 분할된 후에, 부호화 장치(10)의 통신 장치(10e)에 입력되는 것으로 한다. 부호화 방식 전환부(12)는, 음성?음악 신호가 통신 장치(10e)를 통하여 입력되면, 이 음성?음악 신호의 부호 대상 프레임(부호화의 대상으로 되어 있는 프레임)을, 이 부호 대상 프레임에 기초하여, 제1 부호화 방식 또는 제2 부호화 방식 중 어느 쪽의 부호화 방식에 의해 부호화할 것인지를 판정하고, 이 판정 결과에 따라, 제1 부호화 방식에 의해 음성?음악 신호를 부호화하는 제1 부호화부(13), 또는 제2 부호화 방식에 의해 음성?음악 신호를 부호화하는 제2 부호화부(14) 중 어느 하나에 부호 대상 프레임을 송신한다(단계 S11: 제1 전환 단계). 단계 S11에 있어서, 부호화 방식 전환부(12)는, 부호 대상 프레임이 음성 신호인 경우에는, 제1 부호화 방식에 의해 부호화할 것으로 판정하고, 부호 대상 프레임이 음악 신호인 경우에는, 제2 부호화 방식에 의해 부호화할 것으로 판정한다. 그리고, 이 제1 전환 단계 후에, 제1 부호화부(13)의 내부 상태(적응 부호장의 내용 또는 영 입력 응답을 요구하기 위한 선형 예측 합성 필터의 지연 요소를 유지하는 값 등이며, 이하 동일함)를 초기화하기 위한 제1 초기화 단계(단계 S12~S18)가 행해진다.
부호화 방식 전환부(12)는, 부호 대상 프레임이 음악 신호이며, 제2 부호화 방식에 의해 부호 대상 프레임을 부호화할 것으로 단계 S11에 있어서 판정한 경우(단계 S11: 제2 부호화부), 부호 대상 프레임을 제2 부호화부(14)에 송신하고, 제2 부호화부(14)는, 이 부호화 방식 전환부(12)로부터 송신된 부호 대상 프레임을 제2 부호화 방식에 의해 부호화하고, 이 부호화된 부호 대상 프레임(부호화 음성?음악 신호)을 통신 장치(10e)를 통하여 출력한다(단계 S18). 부호화 방식 전환부(12)는, 부호 대상 프레임이 음성 신호이며, 제1 부호화 방식에 의해 부호 대상 프레임을 부호화할 것으로 단계 S11에 있어서 판정한 경우(단계 S11: 제1 부호화부), 기억 장치(10d)의 내용을 참조하여, 부호 대상 프레임의 직전의 프레임(부호 직전 프레임)이 제1 부호화부(13)에 의해 부호화되었는지, 또는 제2 부호화부(14)에 의해 부호화되었는지를 판정한다(단계 S12). 부호 대상 프레임의 앞에 있는 소정수의 프레임(부호 직전 프레임을 포함함)의 부호화 결과, 및 부호화 앞의 프레임 자체는, 모두 기억 장치(10d)에 저장되어 있다.
부호화 방식 전환부(12)는, 부호 직전 프레임이 제1 부호화부(13)에 의해 부호화된 것으로 단계 S12에 있어서 판정한 경우(단계 S12: YES), 부호 대상 프레임을 제1 부호화부(13)에 송신하고, 제1 부호화부(13)는, 이 부호화 방식 전환부(12)로부터 송신된 부호 대상 프레임을 제1 부호화 방식에 의해 부호화하고, 이 부호화된 부호 대상 프레임(부호화 음성?음악 신호)을 통신 장치(10e)를 통하여 출력한다(단계 S17). 부호화 방식 전환부(12)는, 부호 직전 프레임이 제2 부호화부(14)에 의해 부호화된 것으로 단계 S12에 있어서 판정한 경우(단계 S12: NO), 내부 상태 계산부(16)는, 기억 장치(10d)에 저장되어 있는 부호 직전 프레임의 부호화 결과를 복호하여, 부호 직전 프레임의 복호 결과를 얻는다(단계 S13). 부호화 장치(10)가 사용하는 복호 결과는, 부호화 장치(10)에 내장된 복호기(도시 생략) 또는 후술하는 복호 장치(20)에 의해 얻어진다. 그리고, 복호에 필요한 연산을 생략하기 위하여, 부호 직전 프레임의 부호화 결과를 복호한 복호 결과 대신, 제2 부호화부(14)에 의한 부호화 전의 부호 직전 프레임을 사용해도 된다. 이 부호화 전의 부호 직전 프레임은, 기억 장치(10d)에 저장되어 있다.
단계 S13 후에, 내부 상태 계산부(16)는, 부호 직전 프레임의 복호 결과를 사용하여 제1 부호화부(13)의 내부 상태를 산출한다(단계 S14). 내부 상태 계산부(16)가 행하는 제1 부호화부(13)의 내부 상태의 산출 처리는, 부호 직전 프레임의 복호 결과를 처리하여 내부 상태를 산출하는 예로서, 부호 직전 프레임의 복호 결과[또는, 제2 부호화부(14)에 의한 부호화 전의 부호 직전 프레임]로부터 공분산법 등의 방법을 사용하여 선형 예측 계수를 구하고, 그리고, 이 구한 선형 예측 계수를 사용하여 복호 결과에 선형 예측 역필터를 적용함으로써 잔차 신호를 구하는 처리가 있다.
그리고, 부호 직전 프레임의 복호 결과로부터 선형 예측 계수를 구하는 처리는 연산량이 크기 때문에, 내부 상태 계산부(16)는, 선형 예측 계수를 부호 직전 프레임의 복호 결과로부터 구하는 대신, 부호 직전 프레임의 인접한, 제1 부호화 방식에 의해 부호화된 프레임(부호 직전 프레임보다 앞에 있는 프레임)에서의 선형 예측 계수[기억 장치(10d)에 저장되어 있음]를 상기 처리[제1 부호화부(13)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 되고, 또는 이 선형 예측 계수를 프레임 사이에서 내삽(內揷)한 값을 상기 처리[제1 부호화부(13)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 또한, 내부 상태 계산부(16)는, 부호 직전 프레임의 인접한, 제1 부호화 방식에 의해 부호화된 프레임에서의 선형 예측 계수를 사용하여 외삽(外揷)에 의해 얻어지는 값, 또는 이들 선형 예측 계수를 프레임 사이에서 내삽한 값을 사용하여 외삽에 의해 얻어지는 값을, 상기 처리[제1 부호화부(13)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 내부 상태 계산부(16)는, 선형 예측 계수를 선스펙트럼 주파수로 변환한 값에 대하여 외삽을 행하고, 이 외삽 결과를 선형 예측 계수로 재변환해도 된다. 또한, 내부 상태 계산부(16)는, 부호 직전 프레임에서의 선형 예측 계수가, 부호 대상 프레임의 부호에 포함되는 경우에는, 이 부호 대상 프레임의 부호에 포함되어 있는 선형 예측 계수를 상기 처리[제1 부호화부(13)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 또한, 내부 상태 계산부(16)는, 선형 예측 계수를 계산하지 않고, 부호 직전 프레임의 복호 결과를 그대로 잔차 신호의 대용으로서 사용해도 된다. 또한, 부호 직전 프레임에 인접해 있고, 제1 부호화 방식에 의해 부호화된 프레임(부호 직전 프레임의 앞에 있는 프레임)에 대한 부호화의 과정에서 얻어진 내부 상태[이 내부 상태를 나타낸 정보는 기억 장치(10d)에 저장되어 있음]를 사용하여, 제1 부호화부(13)의 내부 상태를 초기화해도 된다. 또한, 부호 직전 프레임의 복호 결과에 대하여 선형 예측 역필터를 적용하는 처리는, 프레임 전체에 대한 것이 아니고, 프레임의 일부분 만에 대한 것이라도 된다.
단계 S14 후에, 내부 상태 초기화법 특정부(17)는, 내부 상태 계산부(16)에 의해 산출된 내부 상태를 사용하여 제1 부호화부(13)의 내부 상태를 초기화하거나, 또는 "0"으로 초기화하는 등의 미리 정해진 초기화 방법 중 어느 하나의 초기화 방법을, 부호 대상 프레임에 기초하여, 또는, 부호 직전 프레임의 복호 결과에 기초하여, 특정한다(단계 S15). 그리고, 내부 상태 초기화법 특정부(17)는, 단계 S15에 있어서 특정한 초기화 방법에 따라, 제1 부호화부(13)의 내부 상태를 초기화한다(단계 S16). 내부 상태 초기화법 특정부(17)에 의해 행해지는 제1 부호화부(13)의 내부 상태의 초기화는, 내부 상태 계산부(16)에 의해 산출된 내부 상태를 사용하여, 제1 부호화부(13)의 내부 상태를 초기화하는 처리이지만, 제1 부호화 방식에서의 잔차 신호의 산출에 사용하는 제1 부호화부(13)의 선형 예측 합성 필터의 내부 상태(지연 요소를 유지하는 값)를 초기화하는 처리를 포함해도 된다. 또한, 내부 상태 초기화법 특정부(17)는, 제1 부호화부(13)의 내부 상태의 초기화 방법을 특정하는 경우, 예를 들면, 전술한 2가지 초기화 방법을 포함하는 복수의 초기화 방법을 사용하여, 각각 부호 대상 프레임에 대하여 제1 부호화 방식에 의한 부호화를 시도하고, 그 결과, 제곱 오차, 또는 청각 가중치 중 오차가 작은 초기화 방법을 선택해도 된다.
단계 S16에 있어서 내부 상태 초기화법 특정부(17)가 제1 부호화부(13)의 내부 상태를 초기화한 후에, 제1 부호화부(13)는, 제1 부호화 방식에 의해 부호 대상 프레임을 부호화하고, 이 부호화한 부호 대상 프레임(부호화 음성?음악 신호)을 통신 장치(10e)를 통하여 출력한다(단계 S17).
그리고, 내부 상태 초기화법 특정부(17)가 단계 S15에 있어서 선택한 초기화 방법의 정보를, 부호 다중화부(15)가, 보조 정보로서 제1 부호화 방식에 의한 부호화 결과로 다중화하도록 구성할 수도 있다. 또한, 제1 부호화부(13) 및 제2 부호화부(14)와 복호기[부호화 장치(10)에 내장되는 복호기 또는 복호 장치(20)]와의 사이에서 공통으로 얻어지는 정보(하기 참조)에 기초하여, 제1 부호화부(13)의 내부 상태의 초기화 방식을 특정하도록 구성할 수도 있으며, 이 경우, 부호 다중화부(15)는, 제1 부호화부(13)의 내부 상태의 초기화 방법을 나타내는 보조 정보를 부호화 결과로 다중화하지 않는다. 예를 들면, 제1 부호화 방식에서의 부호 대상 프레임의 적응 부호장 게인이 큰 경우, 또는 부호 직전 프레임에서의 복호 결과의 주기성이 높은 경우 등에, 내부 상태 초기화법 특정부(17)는, 내부 상태 계산부(16)에 의해 산출된 내부 상태를 사용하여 제1 부호화부(13)의 내부 상태를 초기화할 수 있다.
또한, 내부 상태 초기화법 특정부(17)를 생략하고, 항상, 내부 상태 계산부(16)에 의해 산출된 내부 상태를 사용하여 제1 부호화부(13)가 자체의 내부 상태를 초기화하도록 구성할 수도 있다. 또한, 부호화 방식 전환부(12)에 의해 제2 부호화 방식으로부터 제1 부호화 방식으로 전환된 직후에(제1 전환 단계 후에), 내부 상태 계산부(16)와 내부 상태 초기화법 특정부(17)가 부호 대상 프레임에 대하여 상기 처리(제1 초기화 단계)를 행하도록 구성하고 있지만, 이것으로 한정되지 않고, 부호화 방식 전환부(12)에 의해 제2 부호화 방식으로부터 제1 부호화 방식으로 전환되지 직전(부호 대상 프레임의 직전)의 부호 직전 프레임이 부호화될 때 내부 상태 계산부(16)와 내부 상태 초기화법 특정부(17)가 상기 처리를 행하도록 구성해도 된다. 또한, 제1 부호화 방식[제1 부호화부(13)]과 제2 부호화 방식[제2 부호화부(14)]의 2가지 부호화 방식 사이에서 전환이 행해지는 구성을 예시했지만, 제1 부호화 방식과는 상이한 부호화 방식이 복수 존재하고, 3가지 이상의 부호화 방식 사이에서 전환이 행해지도록 구성해도 된다.
도 1 및 도 4는, 실시예에 따른 복호 장치(20)의 구성을 나타낸 도면이다. 복호 장치(20)는, 물리적으로는 CPU(20a), ROM(20b), RAM(20c), 기억 장치(20d) 및 통신 장치(20e) 등을 포함하는 컴퓨터 장치를 가지고 있고, 이들 CPU(20a) ~ 통신 장치(20e)는, 버스(20f)에 접속되어 있다. CPU(20a)는, ROM(20b) 등의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 5에 나타내는 흐름도의 처리를 실행하기 위한 소리 신호 복호 프로그램)을 RAM(20c)에 로딩하여 실행함으로써, 복호 장치(20)를 통괄적으로 제어한다. 기억 장치(20d)는, 기록/판독이 가능한 메모리로서, 각종 컴퓨터 프로그램이나, 컴퓨터 프로그램의 실행에 필요한 각종 데이터 등(예를 들면, 제1 부호화 방식의 복호에 사용하는 적응 부호장 및 선형 예측 계수나, 그 외에 제1 부호화 방식 및 제2 부호화 방식에 의한 복호에 필요한 다양한 파라미터, 소정수의 복호 전후의 프레임 등)을 저장한다. 기억 장치(20d)는, 적어도 최후에(직전에) 복호된 하나의 프레임의 음성?음악 신호를 저장한다.
또한, 복호 장치(20)는, 기능적으로는, 부호화 방식 판정부(22)(제1 복호 판정 수단, 제2 복호 판정 수단), 부호 분리부(23), 제1 복호부(24)(제1 복호 수단), 제2 복호부(25)(제2 복호 수단), 내부 상태 초기화법 특정부(26)(복호 초기화 수단) 및 내부 상태 계산부(27)(복호 내부 상태 계산 수단)를 가진다. 이들 부호화 방식 판정부(22) ~ 내부 상태 계산부(27)는, CPU(20a)가 ROM(20b) 등의 복호 장치(20)의 내장 메모리에 저장된 상기 컴퓨터 프로그램을 실행하여, 도 1에 나타낸 복호 장치(20)의 각 구성부를 동작시킴으로써 실현되는 기능이다. CPU(20a)는, 상기 소리 신호 복호 프로그램을 실행함으로써[부호화 방식 판정부(22) ~ 내부 상태 계산부(27)를 사용하여], 도 5의 흐름도에 나타내는 처리를 실행한다.
다음으로, 도 5를 참조하여, 복호 장치(20)의 동작을 설명한다. 부호화 방식 판정부(22)는, 부호화되고 통신 장치(20e)를 통하여 입력된 부호화 음성?음악 신호의 복호 대상 프레임이 제1 부호화 방식과 제2 부호화 방식 중 어느 쪽을 사용하여 부호화되어 있는지를 판정하고, 이 판정 결과에 따라, 제1 부호화 방식에 의해 복호하는 제1 복호부(24), 또는 제2 부호화 방식에 의해 복호하는 제2 복호부(25) 중 어느 하나에 복호 대상 프레임을 송신한다(단계 S21: 제2 전환 단계). 단계 S21에 있어서, 부호화 방식 판정부(22)는, 복호 대상 프레임이 제1 부호화 방식에 의해 부호화되어 있는 경우에는, 제1 복호부(24)에 의해 복호하고, 복호 대상 프레임이 제2 부호화 방식에 의해 부호화되어 있는 경우에는, 제2 복호부(25)에 의해 복호할 것으로 판정한다. 그리고, 이 제2 전환 단계 후에, 제1 복호부(24)의 내부 상태(적응 부호장의 내용 또는 선형 예측 합성 필터의 지연 요소를 유지하는 값 등이며, 이하 동일함)를 초기화하기 위한 제2 초기화 단계(단계 S22~S27)가 행해진다.
부호화 방식 판정부(22)는, 복호 대상 프레임이 제2 부호화 방식에 의해 부호화되어 있는 것으로[즉, 제2 복호부(25)에 의해 복호함] 단계 S21에 있어서 판정한 경우(단계 S21: 제2 복호부), 복호 대상 프레임을 제2 복호부(25)에 송신하고, 제2 복호부(25)는, 이 부호화 방식 판정부(22)로부터 송신된 복호 대상 프레임을 제2 부호화 방식에 의해 복호하고, 이 복호한 복호 대상 프레임(복호 음성?음악 신호)을 통신 장치(20e)를 통하여 출력한다(단계 S27). 부호화 방식 판정부(22)는, 복호 대상 프레임이 제1 부호화 방식에 의해 부호화되어 있는 것으로[즉, 제1 복호부(24)에 의해 복호함] 단계 S21에 있어서 판정한 경우(단계 S21: 제1 복호부), 기억 장치(20d)의 내용을 참조하여, 복호 대상 프레임의 직전의 프레임(복호 직전 프레임)이 제1 부호화 방식에 의해 부호화되어 있었는지[즉, 제1 복호부(24)에 의해 복호되어 있었는지], 또는 제2 부호화 방식에 의해 부호화되어 있었는지[즉, 제2 복호부(25)에 의해 복호되어 있었는지]를 판정한다(단계 S22). 복호 대상 프레임의 전에 있는 소정수의 프레임(복호 직전 프레임을 포함함)의 복호 결과, 및 복호 전후의 프레임 자체는, 모두, 기억 장치(20d)에 저장되어 있다.
부호화 방식 판정부(22)는, 복호 직전 프레임이 제1 부호화 방식에 의해 부호화되어 있는 것으로[즉, 제1 복호부(24)에 의해 복호되어 있음], 단계 S22에 있어서 판정한 경우(단계 S22: YES), 복호 대상 프레임을 제1 복호부(24)에 송신하고, 제1 복호부(24)는, 이 부호화 방식 판정부(22)로부터 송신된 복호 대상 프레임을 제1 부호화 방식에 의해 복호하고, 이 복호한 복호 대상 프레임(복호 음성?음악 신호)을 통신 장치(20e)를 통하여 출력한다(단계 S26).
부호화 방식 판정부(22)는, 복호 직전 프레임이 제2 부호화 방식에 의해 부호화되어 있는 것으로[즉, 제2 복호부(25)에 의해 복호되어 있음], 단계 S22에 있어서 판정한 경우(단계 S22: NO), 복호 직전 프레임을 부호 분리부(23)에 송신하고, 부호 분리부(23)는, 복호 직전 프레임의 다중화된 부호를 제1 부호화 방식에 의한 부호와 제1 복호부(24)의 내부 상태의 초기화 방법을 나타내는 보조 정보[예를 들면, 내부 상태 초기화법 특정부(17)에 의해 특정된 제1 부호화부(13)의 내부 상태의 초기화 방법으로서, 복호 직전 프레임을 부호화할 때 이용된 초기화 방법을 나타내는 정보]로 분리한다. 그리고, 내부 상태 계산부(27)는, 복호 직전 프레임의 복호 결과를 사용하여 제1 복호부(24)의 내부 상태를 계산한다(단계 S23). 내부 상태 계산부(27)가 행하는 제1 복호부(24)의 내부 상태의 산출 처리는, 부호 직전 프레임의 복호 결과를 처리하여 내부 상태를 산출하는 예로서, 복호 직전 프레임의 복호 결과로부터 공분산법 등의 방법으로 선형 예측 계수를 구하고, 그리고, 이 구한 선형 예측 계수를 사용하여 복호 결과에 선형 예측 역필터를 적용함으로써, 잔차 신호를 구하는 처리가 있다.
그리고, 복호 직전 프레임의 복호 결과로부터 선형 예측 계수를 구하는 처리는 연산량이 크기 때문에, 내부 상태 계산부(27)는, 선형 예측 계수를 복호 직전 프레임의 복호 결과로부터 구하는 대신, 복호 직전 프레임의 인접한, 제1 부호화 방식에 의해 부호화된 프레임(복호 직전 프레임보다 앞에 있는 프레임)에서의 선형 예측 계수[제1 복호부(24)에 의해 복호되었을 때의 선형 예측 계수이며, 기억 장치(20d)에 저장되어 있음]를 상기 처리[제1 복호부(24)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 되고, 또는 이 선형 예측 계수를 프레임 사이에서 내삽한 값을 상기 처리[제1 복호부(24)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 또한, 내부 상태 계산부(27)는, 복호 직전 프레임의 인접한, 제1 부호화 방식에 의해 부호화된 프레임에서의 선형 예측 계수를 사용하여 외삽에 의해 얻어지는 값, 또는 이들 선형 예측 계수를 프레임 사이에서 내삽한 값을 사용하여 외삽에 의해 얻어지는 값을, 상기 처리[제1 복호부(24)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 내부 상태 계산부(27)는, 선형 예측 계수를 선스펙트럼 주파수로 변환한 값에 대하여 외삽을 행하고, 이 외삽 결과를 선형 예측 계수로 재변환해도 된다. 또한, 내부 상태 계산부(27)는, 복호 직전 프레임에서의 선형 예측 계수가, 복호 대상 프레임의 부호에 포함되는 경우, 이 복호 대상 프레임의 부호에 포함되어 있는 선형 예측 계수를 상기 처리[제1 복호부(24)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 또는, 선형 예측 역필터의 적용을 생략함으로써 선형 예측 계수의 계산을 생략해도 된다. 또한, 복호 직전 프레임의 인접한, 제1 부호화 방식에 의해 부호화된 프레임(복호 직전 프레임의 전에 있는 프레임)에 대한 복호 과정에서 얻어진 내부 상태[이 내부 상태를 나타낸 정보는 기억 장치(20d)에 저장되어 있음]를 사용하여, 제1 복호부(24)의 내부 상태를 초기화해도 된다. 또한, 복호 직전 프레임의 복호 결과에 대하여 선형 예측 역필터를 적용하는 처리는, 프레임 전체에 대한 것이 아니고, 프레임의 일부분 만에 대한 것이라도 된다.
단계 S23 후에, 내부 상태 초기화법 특정부(26)는, 내부 상태 계산부(27)에 의해 산출된 내부 상태를 사용하여 제1 복호부(24)의 내부 상태를 초기화하거나, 또는 "0"으로 초기화하는 등의 미리 결정된 방법 중 어느 하나의 초기화 방법을, 복호 직전 프레임의 다중화된 부호에 포함되고 제1 복호부(24)의 내부 상태의 초기화 방법을 나타내는 보조 정보에 기초하여 특정한다(단계 S24). 그리고, 내부 상태 초기화법 특정부(26)는, 단계 S24에 있어서 특정한 초기화 방법에 따라, 제1 복호부(24)의 내부 상태를 초기화한다(단계 S25). 내부 상태 초기화법 특정부(26)에 의해 행해지는 제1 복호부(24)의 내부 상태의 초기화는, 내부 상태 계산부(27)에 의해 산출된 내부 상태를 사용하여, 제1 복호부(24)의 내부 상태를 초기화하는 처리이지만, 제1 부호화 방식에서의 잔차 신호로부터 출력 신호를 산출하는 제1 복호부(24)의 선형 예측 합성 필터의 내부 상태(지연 요소를 유지하는 값)를 초기화하는 처리를 포함해도 된다.
단계 S25에 있어서 내부 상태 초기화법 특정부(26)가 제1 복호부(24)의 내부 상태를 초기화한 후에, 제1 복호부(24)는, 제1 부호화 방식에 의해 복호 대상 프레임을 복호하고, 이 복호한 복호 대상 프레임(복호 음성?음악 신호)을 통신 장치(20e)를 통하여 출력한다(단계 S26).
그리고, 제1 복호부(24)의 내부 상태의 초기화 방법을 나타내는 보조 정보를 복호 직전 프레임의 부호로 다중화하지 않고, 제1 부호화 방식에서의 대상 부호화 프레임의 고정 부호장 게인, 또는 복호 직전 프레임에서의 복호 결과의 주기성을 분석한 결과 등을 사용하여[제1 복호부(24) 및 제2 복호부(25)와 부호기(복호 장치(20)에 내장되는 부호기 또는 제1 부호화부(13))와의 사이에서 공통으로 얻어지는 정보를 사용하여], 제1 복호부(24)의 내부 상태의 초기화 방법을 특정해도 된다. 또한, 내부 상태 초기화법 특정부(26)를 생략하고, 항상, 내부 상태 계산부(27)에 의해 산출된 내부 상태를 사용하여 제1 복호부(24)가 자체의 내부 상태를 초기화하는 구성이라도 된다. 이 경우, 초기화 방법을 나타내고 복호 직전 프레임의 부호로 다중화된 보조 정보를 사용할 필요는 없다. 또한, 내부 상태 계산부(27)의 동작과 내부 상태 초기화법 특정부(26)의 동작은, 복호 직전 프레임이 제2 부호화 방식에 의해 부호화되고, 복호 대상 프레임이 제1 부호화 방식에 의해 부호화된 경우의 동작으로 하고 있지만, 이것으로 한정되지 않고, 복호 대상 프레임이 제2 부호화 방식에 의해 부호화되고, 복호 대상 프레임의 직후의 프레임이 제1 부호화 방식에 의해 부호화되어 있는 것이 예측에 의해 이미 결정되어 있는 경우에, 내부 상태 계산부(27)와 내부 상태 초기화법 특정부(26)는, 각각, 제1 복호부(24)에 대한 내부 상태의 산출과 내부 상태 초기화 방법의 선택을 예측 정보에 기초하여 행해도 된다. 또한, 제1 부호화 방식과 제2 부호화 방식의 2가지 부호화 방식 사이에서 전환이 행해지는 구성을 예시했지만, 제1 부호화 방식과는 상이한 부호화 방식이 복수 존재하고, 3가지 이상의 부호화 방식 사이에서 전환이 행해지도록 구성해도 된다.
다음으로, 실시예에 따른 부호화 장치(10)의 작용 효과를 설명한다. 부호화 장치(10)는, 선형 예측 부호화 방식에 기초한 제1 부호화부(13)와, 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화부(14)를 구비하고, 제1 부호화부(13) 및 제2 부호화부(14)를 사용하여 소리 신호를 부호화한다. 부호화 장치(10)는, 또한 부호화 방식 전환부(12), 내부 상태 계산부(16) 및 내부 상태 초기화법 특정부(17)를 구비한다. 부호화 방식 전환부(12)는, 소리 신호에 포함되어 있고 부호화의 대상으로 되는 부호 대상 프레임을, 제1 부호화부(13) 또는 제2 부호화부(14) 중에서 어느 쪽에 의해 부호화할 것인지를 판정한다. 또한, 부호화 방식 전환부(12)는, 부호 대상 프레임을 제1 부호화부(13)에 의해 부호화할 것으로 판정한 경우에, 부호 대상 프레임의 직전에 있는 부호 직전 프레임이 제1 부호화부(13)에 의해 부호화되어 있는지, 또는 제2 부호화부(14)에 의해 부호화되어 있는지를 판정한다. 내부 상태 계산부(16)는, 부호 직전 프레임이 제2 부호화부(14)에 의해 부호화되어 있는 것으로 부호화 방식 전환부(12)에 의해 판정된 경우에, 부호 직전 프레임의 부호화 결과를 복호하고, 이 복호 결과를 사용하여 제1 부호화부(13)의 내부 상태를 산출한다. 내부 상태 초기화법 특정부(17)는, 내부 상태 계산부(16)에 의해 산출된 내부 상태를 사용하여 제1 부호화부(13)의 내부 상태를 초기화한다. 그리고, 제1 부호화부(13)는, 내부 상태 초기화법 특정부(17)에 의하여 내부 상태가 초기화된 후에 부호 대상 프레임을 부호화한다.
부호화 장치(10)에 의하면, 선형 예측 부호화 방식에 기초한 제1 부호화부(13)에 의해 부호화되는 부호 대상 프레임의 앞의 부호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화부(14)에 의해 부호화된 경우라도, 제1 부호화부(13)의 내부 상태를 초기화함으로써, 부호 대상 프레임의 부호화를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리를 실현할 수 있다.
다음으로, 실시예에 따른 복호 장치(20)의 작용 효과를 설명한다. 복호 장치(20)는, 선형 예측 부호화 방식에 기초한 제1 복호부(24)와, 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호부(25)를 구비하고, 제1 복호부(24) 및 제2 복호부(25)를 사용하여 부호화 소리 신호를 복호한다. 복호 장치(20)는, 또한 부호화 방식 판정부(22), 내부 상태 계산부(27) 및 내부 상태 초기화법 특정부(26)를 구비한다. 부호화 방식 판정부(22)는, 부호화 소리 신호에 포함되어 있고 복호의 대상으로 되는 복호 대상 프레임을, 제1 복호부(24) 또는 제2 복호부(25) 중 어느 쪽에 의해 복호할 것인지를 판정한다. 또한, 부호화 방식 판정부(22)는, 복호 대상 프레임을 제1 복호부(24)에 의해 복호할 것으로 부호화 방식 판정부(22)에 의해 판정된 경우에, 복호 대상 프레임의 직전에 있는 복호 직전 프레임이 제1 복호부(24)에 의해 복호되었는지, 또는 제2 복호부(25)에 의해 복호되었는지를 판정한다. 복호 직전 프레임이 제2 복호부(25)에 의해 복호된 것으로 부호화 방식 판정부(22)에 의해 판정된 경우에, 복호 직전 프레임의 복호 결과를 사용하여 제1 복호부(24)의 내부 상태를 산출한다. 내부 상태 계산부(27)에 의해 산출된 내부 상태를 사용하여 제1 복호부(24)의 내부 상태를 초기화한다. 그리고, 제1 복호부(24)는, 내부 상태 초기화법 특정부(26)에 의하여 내부 상태를 초기화한 후에 복호 대상 프레임을 복호한다.
복호 장치(20)에 의하면, 선형 예측 부호화 방식에 기초한 제1 복호부(24)를 사용하여 복호하는 복호 대상 프레임의 앞의 복호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호부(25)에 의해 복호된 경우라도, 제1 복호부(24)의 내부 상태를 초기화함으로써, 복호 대상 프레임의 복호를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 복호 처리를 실현할 수 있다.
[산업상 이용 가능성]
선형 예측을 사용하지 않는 부호화 방식으로부터 선형 예측 부호화에 기초한 부호화 방식으로의 전환을 행하는 경우에, 선형 예측 부호화에 기초한 부호화 방식의 부호 수단 또는 복호 수단의 내부 상태의 초기값을 적절한 값으로 설정하고, 전환 직후의 프레임에서의 음성 품질을 개선할 수 있다.
10: 부호화 장치 10a, 20a: CPU
10b, 20b: ROM 10c, 20c: RAM
10d, 20d: 기억 장치 10e, 20e: 통신 장치
10f, 20f: 버스 12: 부호화 방식 전환부
13: 제1 부호화부 14: 제2 부호화부
15: 부호 다중화부 16, 27: 내부 상태 계산부
17, 26: 내부 상태 초기화법 특정부
20: 복호 장치 22: 부호화 방식 판정부
23: 부호 분리부 24: 제1 복호부
25: 제2 복호부

Claims (7)

  1. 선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 부호화 수단을 사용하여, 복수의 프레임으로 이루어지는 소리 신호를 부호화하는 소리 신호 부호화 방법으로서,
    상기 소리 신호의 제1 프레임이 상기 제2 부호화 수단에 의해 부호화된 후에, 상기 제1 프레임의 직후에 있는 제2 프레임을 부호화하는 부호화 수단을 상기 제2 부호화 수단으로부터 상기 제1 부호화 수단으로 전환하는 전환 단계; 및
    상기 전환 단계 후에, 상기 제1 부호화 수단의 내부 상태를 소정의 방법에 의해 초기화하는 초기화 단계
    를 포함하고,
    상기 초기화 단계에서, 상기 제2 부호화 수단에 의한 부호화 전의 상기 제1 프레임, 또는 상기 제2 부호화 수단에 의한 상기 제1 프레임의 부호화 결과를 복호하여 얻어지는 신호에 대하여 선형 예측 역(逆)필터를 적용하여 얻어지는 잔차(殘差) 신호를 상기 제1 부호화 수단의 적응 부호장(符號帳)의 내용으로서 설정하는 것에 의해, 상기 제1 부호화 수단의 내부 상태를 초기화하고,
    상기 제2 프레임의 부호에는, 상기 제1 프레임의 선형 예측 계수가 포함되어 있고, 상기 초기화 단계에서 상기 선형 예측 계수를 상기 선형 예측 역필터에 사용하는, 소리 신호 부호화 방법.
  2. 복수의 프레임으로 이루어지는 소리 신호로부터 생성된 복수의 부호화 프레임으로 이루어지는 부호화 소리 신호를, 선형 예측 부호화 방식에 기초한 제1 복호 수단과, 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 복호 수단을 사용하여 복호하는 소리 신호 복호 방법으로서,
    상기 소리 신호의 제1 프레임으로부터 생성된 상기 부호화 소리 신호의 제1 부호화 프레임이 상기 제2 복호 수단에 의해 복호된 후에, 상기 소리 신호에 있어서 상기 제1 프레임의 직후에 있는 제2 프레임으로부터 생성된, 상기 제1 부호화 프레임의 직후에 있는 제2 부호화 프레임을 복호하는 복호 수단을 상기 제2 복호 수단으로부터 상기 제1 복호 수단으로 전환하는 전환 단계; 및
    상기 전환 단계 후에, 상기 제1 복호 수단의 내부 상태를 소정의 방법에 의해 초기화하는 초기화 단계
    를 포함하고,
    상기 초기화 단계에서, 상기 제2 복호화 수단에 의해 상기 제1 부호화 프레임을 복호하여 얻어지는 신호에 대하여 선형 예측 역(逆)필터를 적용하여 얻어지는 잔차(殘差) 신호를 상기 제1 복호 수단의 적응 부호장(符號帳)의 내용으로서 설정하는 것에 의해, 상기 제1 복호 수단의 내부 상태를 초기화하고,
    상기 제2 부호화 프레임의 부호에는, 상기 제1 프레임의 선형 예측 계수가 포함되어 있고, 상기 초기화 단계에서 상기 선형 예측 계수를 상기 선형 예측 역필터에 사용하는, 소리 신호 복호 방법.
  3. 선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 상기 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 부호화 수단을 구비하고, 상기 제1 부호화 수단 및 상기 제2 부호화 수단을 사용하여 소리 신호를 부호화하는 부호화 장치로서,
    상기 소리 신호에 포함되어 있고 부호화의 대상으로 되는 대상 프레임을, 상기 제1 부호화 수단 또는 상기 제2 부호화 수단 중 어느 쪽에 의해 부호화할 것인지를 판정하는 제1 판정 수단;
    상기 대상 프레임을 상기 제1 부호화 수단에 의해 부호화할 것으로 상기 제1 판정 수단에 의해 판정된 경우에, 상기 대상 프레임의 직전에 있는 직전 프레임이 상기 제1 부호화 수단에 의해 부호화되어 있는지, 또는 상기 제2 부호화 수단에 의해 부호화되어 있는지를 판정하는 제2 판정 수단;
    상기 직전 프레임이 상기 제2 부호화 수단에 의해 부호화되어 있는 것으로 상기 제2 판정 수단에 의해 판정된 경우에, 상기 직전 프레임의 부호화 결과를 복호하여 얻어지는 신호에 대하여 선형 예측 역(逆)필터를 적용하여 잔차(殘差) 신호를 구하는 것에 의해, 상기 제1 부호화 수단의 내부 상태를 산출하는 내부 상태 계산 수단; 및
    상기 내부 상태 계산 수단에 의해 산출된 상기 잔차 신호를 상기 제1 부호화 수단의 적응 부호장(符號帳)의 내용으로서 설정하는 것에 의해 상기 제1 부호화 수단의 내부 상태를 초기화하는 초기화 수단
    을 포함하고,
    상기 대상 프레임의 부호에는, 상기 직전 프레임의 선형 예측 계수가 포함되어 있고, 상기 내부 상태 계산 수단은 상기 선형 예측 계수를 상기 선형 예측 역필터에 사용하고,
    상기 제1 부호화 수단은, 상기 초기화 수단에 의한 상기 내부 상태의 초기화 후에 상기 대상 프레임을 부호화하는, 부호화 장치.
  4. 선형 예측 부호화 방식에 기초한 제1 복호 수단과, 상기 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 복호 수단을 구비하고, 소리 신호로부터 생성된 부호화 소리 신호를 상기 제1 복호 수단 및 상기 제2 복호 수단을 사용하여 복호하는 복호 장치로서,
    상기 부호화 소리 신호에 포함되어 있고 복호의 대상으로 되는 대상 부호화 프레임을, 상기 제1 복호 수단 또는 상기 제2 복호 수단 중 어느 쪽에 의해 복호할 것인지를 판정하는 제1 판정 수단;
    상기 대상 부호화 프레임을 상기 제1 복호 수단에 의해 복호하는 것으로 상기 제1 판정 수단에 의해 판정된 경우에, 상기 대상 부호화 프레임의 직전에 있는 직전 부호화 프레임이 상기 제1 복호 수단에 의해 복호되었는지, 또는 상기 제2 복호 수단에 의해 복호되었는지를 판정하는 제2 판정 수단;
    상기 직전 부호화 프레임이 상기 제2 복호 수단에 의해 복호된 것으로 상기 제2 판정 수단에 의해 판정된 경우에, 상기 직전 부호화 프레임을 복호하여 얻어지는 신호에 대하여 선형 예측 역(逆)필터를 적용하여 잔차(殘差) 신호를 산출하는 것에 의해, 상기 제1 복호 수단의 내부 상태를 산출하는 내부 상태 계산 수단; 및
    상기 내부 상태 계산 수단에 의해 산출된 상기 잔차 신호를 상기 제1 복호 수단의 적응 부호장(符號帳)의 내용으로서 설정하는 것에 의해, 상기 제1 복호 수단의 내부 상태를 초기화하는 초기화 수단
    을 포함하고,
    상기 직전 부호화 프레임 및 상기 대상 부호화 프레임은, 상기 소리 신호의 제1 프레임 및 상기 소리 신호에 있어서 상기 제1 프레임의 직후에 있는 제1 프레임으로부터 각각 생성되고, 상기 대상 부호화 프레임의 부호에는, 상기 제1 프레임의 선형 예측 계수가 포함되어 있고, 상기 내부 상태 계산 수단은, 상기 선형 예측 계수를 상기 선형 예측 역필터에 사용하고,
    상기 제1 복호 수단은, 상기 초기화 수단에 의한 상기 내부 상태의 초기화 후에 상기 대상 부호화 프레임을 복호하는, 복호 장치.
  5. 제3항에 기재된 부호화 장치와, 제4항에 기재된 복호 장치를 구비하고,
    상기 복호 장치는, 상기 부호화 장치에 의해 부호화된 부호화 소리 신호를 복호하는, 소리 신호 처리 시스템.
  6. 선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 상기 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 부호화 수단을 사용하여 소리 신호를 부호화하기 위하여, 컴퓨터 장치를,
    상기 제1 부호화 수단;
    상기 제2 부호화 수단;
    상기 소리 신호에 포함되어 있고 부호화의 대상으로 되는 대상 프레임을 상기 제1 부호화 수단 또는 상기 제2 부호화 수단 중 어느 쪽에 의해 부호화할 것인지를 판정하는 제1 판정 수단;
    상기 대상 프레임을 상기 제1 부호화 수단에 의해 부호화할 것으로 상기 제1 판정 수단에 의해 판정된 경우에, 상기 대상 프레임의 직전에 있는 직전 프레임이 상기 제1 부호화 수단에 의해 부호화되어 있는지, 또는 상기 제2 부호화 수단에 의해 부호화되어 있는지를 판정하는 제2 판정 수단;
    상기 직전 프레임이 상기 제2 부호화 수단에 의해 부호화되어 있는 것으로 상기 제2 판정 수단에 의해 판정된 경우에, 상기 직전 프레임의 부호화 결과를 복호하여 얻어지는 신호에 대하여 선형 예측 역(逆)필터를 적용하여 잔차(殘差) 신호를 구하는 것에 의해, 상기 제1 부호화 수단의 내부 상태를 산출하는 내부 상태 계산 수단;
    상기 내부 상태 계산 수단에 의해 산출된 상기 잔차 신호를 상기 제1 부호화 수단의 적응 부호장(符號帳)의 내용으로서 설정하는 것에 의해, 상기 제1 부호화 수단의 내부 상태를 초기화하는 초기화 수단;
    으로서 기능하게 하고,
    상기 대상 프레임의 부호에는, 상기 직전 프레임의 선형 예측 계수가 포함되어 있고, 상기 내부 상태 계산 수단은 상기 선형 예측 계수를 상기 선형 예측 역필터에 사용하는, 소리 신호 부호화 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
  7. 소리 신호로부터 생성된 부호화 소리 신호를, 선형 예측 부호화 방식에 기초한 제1 복호 수단과, 상기 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 복호 수단을 사용하여 복호하기 위하여, 컴퓨터 장치를,
    상기 제1 복호 수단;
    상기 제2 복호 수단;
    상기 부호화 소리 신호에 포함되어 있고 복호의 대상으로 되는 대상 부호화 프레임을 상기 제1 복호 수단 또는 상기 제2 복호 수단 중 어느 쪽에 의해 복호할 것인지를 판정하는 제1 판정 수단;
    상기 대상 부호화 프레임을 상기 제1 복호 수단에 의해 복호할 것으로 상기 제1 판정 수단에 의해 판정된 경우에, 상기 대상 부호화 프레임의 직전에 있는 직전 부호화 프레임이 상기 제1 복호 수단에 의해 복호되었는지, 또는 상기 제2 복호 수단에 의해 복호되었는지를 판정하는 제2 판정 수단;
    상기 직전 부호화 프레임이 상기 제2 복호 수단에 의해 복호된 것으로 상기 제2 판정 수단에 의해 판정된 경우에, 상기 직전 부호화 프레임을 복호하여 얻어지는 신호에 대하여 선형 예측 역(逆)필터를 적용하여 잔차(殘差) 신호를 산출하는 것에 의해, 상기 제1 복호 수단의 내부 상태를 산출하는 내부 상태 계산 수단;
    상기 내부 상태 계산 수단에 의해 산출된 상기 잔차 신호를 상기 제1 복호 수단의 적응 부호장(符號帳)의 내용으로서 설정하는 것에 의해, 상기 제1 복호 수단의 내부 상태를 초기화하는 초기화 수단;
    으로서 기능하게 하고,
    상기 직전 부호화 프레임 및 상기 대상 부호화 프레임은, 상기 소리 신호를 제1 프레임 및 상기 소리 신호에 있어서 상기 제1 프레임의 직후에 있는 제1 프레임으로부터 각각 생성되고, 상기 대상 부호화 프레임의 부호에는, 상기 제1 프레임의 선형 예측 계수가 포함되어 있고, 상기 내부 상태 계산 수단은, 상기 선형 예측 계수를 상기 선형 예측 역필터에 사용하는, 소리 신호 복호 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
KR1020127017742A 2009-03-06 2010-03-03 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램 KR101175553B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2009-053693 2009-03-06
JP2009053693A JP4977157B2 (ja) 2009-03-06 2009-03-06 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
PCT/JP2010/053454 WO2010101190A1 (ja) 2009-03-06 2010-03-03 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020117020793A Division KR101256542B1 (ko) 2009-03-06 2010-03-03 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 및 소리 신호 부호화 프로그램 및 소리 신호 복호 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체

Publications (2)

Publication Number Publication Date
KR20120084339A KR20120084339A (ko) 2012-07-27
KR101175553B1 true KR101175553B1 (ko) 2012-08-23

Family

ID=42709745

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020117020793A KR101256542B1 (ko) 2009-03-06 2010-03-03 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 및 소리 신호 부호화 프로그램 및 소리 신호 복호 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체
KR1020127017742A KR101175553B1 (ko) 2009-03-06 2010-03-03 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램
KR1020127017741A KR101175555B1 (ko) 2009-03-06 2010-03-03 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020117020793A KR101256542B1 (ko) 2009-03-06 2010-03-03 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 및 소리 신호 부호화 프로그램 및 소리 신호 복호 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020127017741A KR101175555B1 (ko) 2009-03-06 2010-03-03 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램

Country Status (22)

Country Link
US (3) US8751245B2 (ko)
EP (3) EP2511906A1 (ko)
JP (1) JP4977157B2 (ko)
KR (3) KR101256542B1 (ko)
CN (3) CN102737642B (ko)
AU (1) AU2010219643C1 (ko)
BR (3) BR122013014741B1 (ko)
CA (1) CA2754404C (ko)
CY (1) CY1114649T1 (ko)
DK (1) DK2405426T3 (ko)
ES (1) ES2434125T3 (ko)
HR (1) HRP20131056T1 (ko)
MX (1) MX2011009333A (ko)
PH (2) PH12012501446B1 (ko)
PL (1) PL2405426T3 (ko)
PT (1) PT2405426E (ko)
RU (3) RU2482554C1 (ko)
SG (1) SG174241A1 (ko)
SI (1) SI2405426T1 (ko)
SM (1) SMT201400025B (ko)
TW (3) TWI385648B (ko)
WO (1) WO2010101190A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5395649B2 (ja) * 2009-12-24 2014-01-22 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置及びプログラム
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
CN103477388A (zh) * 2011-10-28 2013-12-25 松下电器产业株式会社 声音信号混合解码器、声音信号混合编码器、声音信号解码方法及声音信号编码方法
US9043201B2 (en) * 2012-01-03 2015-05-26 Google Technology Holdings LLC Method and apparatus for processing audio frames to transition between different codecs
TWI648730B (zh) * 2012-11-13 2019-01-21 南韓商三星電子股份有限公司 決定編碼模式的裝置以及音訊編碼裝置
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
US11589172B2 (en) 2014-01-06 2023-02-21 Shenzhen Shokz Co., Ltd. Systems and methods for suppressing sound leakage
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980797A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
CN104485112B (zh) * 2014-12-08 2017-12-08 福建联迪商用设备有限公司 一种基于音频通讯中的音频解码方法及其装置
EP3231393B1 (de) 2016-04-13 2023-06-21 Christian Vallbracht Minimal-invasiv implantierbare mitral- und trikuspidalklappe
CN109215667B (zh) * 2017-06-29 2020-12-22 华为技术有限公司 时延估计方法及装置
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
EP3834200A4 (en) 2018-09-12 2021-08-25 Shenzhen Voxtech Co., Ltd. SIGNAL PROCESSING DEVICE INCLUDING MULTIPLE ELECTROACOUSTIC TRANSDUCERS
CN115881140A (zh) * 2021-09-29 2023-03-31 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序产品

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004053676A (ja) 2002-07-16 2004-02-19 Mitsubishi Electric Corp 音声符号化装置および復号装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0352899A (ja) * 1989-07-20 1991-03-07 Asahi Glass Co Ltd カルシトニン類似体
SE504010C2 (sv) * 1995-02-08 1996-10-14 Ericsson Telefon Ab L M Förfarande och anordning för prediktiv kodning av tal- och datasignaler
JP2904083B2 (ja) * 1995-11-29 1999-06-14 日本電気株式会社 音声符号化切替えシステム
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
JP4216364B2 (ja) * 1997-08-29 2009-01-28 株式会社東芝 音声符号化/復号化方法および音声信号の成分分離方法
JP3487158B2 (ja) * 1998-02-26 2004-01-13 三菱電機株式会社 音声符号化伝送システム
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP4551555B2 (ja) * 2000-11-29 2010-09-29 株式会社東芝 符号化データ伝送装置
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
US20050228648A1 (en) * 2002-04-22 2005-10-13 Ari Heikkinen Method and device for obtaining parameters for parametric speech coding of frames
US7876966B2 (en) * 2003-03-11 2011-01-25 Spyder Navigations L.L.C. Switching between coding schemes
WO2005112005A1 (ja) * 2004-04-27 2005-11-24 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
ATE371926T1 (de) * 2004-05-17 2007-09-15 Nokia Corp Audiocodierung mit verschiedenen codierungsmodellen
ES2338117T3 (es) * 2004-05-17 2010-05-04 Nokia Corporation Codificacion de audio con diferentes longitudes de trama de codificacion.
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
RU2007139784A (ru) 2005-04-28 2009-05-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство кодирования звука и способ кодирования звука
EP1883067A1 (en) * 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
PL2311034T3 (pl) * 2008-07-11 2016-04-29 Fraunhofer Ges Forschung Koder i dekoder audio do kodowania ramek próbkowanego sygnału audio
CN102884574B (zh) * 2009-10-20 2015-10-14 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004053676A (ja) 2002-07-16 2004-02-19 Mitsubishi Electric Corp 音声符号化装置および復号装置

Also Published As

Publication number Publication date
PH12012501446A1 (en) 2015-07-20
WO2010101190A1 (ja) 2010-09-10
AU2010219643A1 (en) 2011-10-06
AU2010219643C1 (en) 2013-03-14
EP2405426A1 (en) 2012-01-11
SMT201400025B (it) 2014-05-07
CN102737642B (zh) 2014-07-30
TWI385649B (zh) 2013-02-11
PL2405426T3 (pl) 2014-01-31
AU2010219643B2 (en) 2012-10-25
RU2011140533A (ru) 2013-05-10
US9214161B2 (en) 2015-12-15
PH12012501446B1 (en) 2015-07-20
PT2405426E (pt) 2013-10-17
KR101175555B1 (ko) 2012-08-21
TW201126513A (en) 2011-08-01
TWI385648B (zh) 2013-02-11
CN102737641B (zh) 2014-07-02
RU2482554C1 (ru) 2013-05-20
JP2010210680A (ja) 2010-09-24
CY1114649T1 (el) 2016-12-14
BR122013014739A2 (pt) 2016-05-24
US20130185085A1 (en) 2013-07-18
CN102341851B (zh) 2013-09-04
PH12012501447A1 (en) 2014-08-27
KR101256542B1 (ko) 2013-04-19
DK2405426T3 (da) 2013-11-11
RU2493620C1 (ru) 2013-09-20
KR20120084338A (ko) 2012-07-27
CA2754404A1 (en) 2010-09-10
TWI390504B (zh) 2013-03-21
TW201246192A (en) 2012-11-16
PH12012501447B1 (en) 2014-08-27
BR122013014741A2 (pt) 2016-05-24
BRPI1016262A2 (pt) 2016-05-03
KR20120084339A (ko) 2012-07-27
CN102737641A (zh) 2012-10-17
US8666754B2 (en) 2014-03-04
EP2511906A1 (en) 2012-10-17
EP2405426A4 (en) 2012-10-17
CA2754404C (en) 2016-04-26
JP4977157B2 (ja) 2012-07-18
SG174241A1 (en) 2011-10-28
CN102341851A (zh) 2012-02-01
CN102737642A (zh) 2012-10-17
SI2405426T1 (sl) 2013-12-31
HRP20131056T1 (hr) 2013-12-06
US20110320212A1 (en) 2011-12-29
KR20110124279A (ko) 2011-11-16
MX2011009333A (es) 2011-09-29
BR122013014739B1 (pt) 2020-10-13
TW201246191A (en) 2012-11-16
US8751245B2 (en) 2014-06-10
EP2511907A1 (en) 2012-10-17
RU2493619C1 (ru) 2013-09-20
BRPI1016262B1 (pt) 2020-11-10
ES2434125T3 (es) 2013-12-13
BR122013014741B1 (pt) 2020-10-27
US20130185075A1 (en) 2013-07-18
EP2405426B1 (en) 2013-08-28

Similar Documents

Publication Publication Date Title
KR101175553B1 (ko) 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램
KR102171293B1 (ko) 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
JP5197838B2 (ja) 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
JP4977268B2 (ja) 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
A302 Request for accelerated examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150716

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160720

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170720

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180719

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190722

Year of fee payment: 8