KR20120084338A

KR20120084338A - 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램

Info

Publication number: KR20120084338A
Application number: KR1020127017741A
Authority: KR
Inventors: 고스케 쓰지노; 게이 기쿠이리; 노부히코 나카
Original assignee: 가부시키가이샤 엔.티.티.도코모
Priority date: 2009-03-06
Filing date: 2010-03-03
Publication date: 2012-07-27
Also published as: US20130185075A1; CN102737642B; EP2405426A1; SI2405426T1; KR101175555B1; CN102341851A; CN102737641A; KR101175553B1; PH12012501446A1; US9214161B2; TW201246191A; US8751245B2; BR122013014741A2; KR101256542B1; KR20110124279A; SMT201400025B; CN102341851B; EP2405426A4; CA2754404C; CA2754404A1

Abstract

선형 예측 부호화 방식에 기초한 제1 부호화부(13)에 의해 부호화되는 부호 대상 프레임의 앞의 부호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화부(14)에 의해 부호화된 경우, 제1 부호화부(13)의 내부 상태를 초기화함으로써, 부호 대상 프레임의 부호화를 선형 예측 부호화 방식에 의해 행한다. 이에 따라, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리를 실현할 수 있다.

Description

소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램, 및 소리 신호 복호 프로그램{SOUND SIGNAL CODING METHOD, SOUND SIGNAL DECODING METHOD, CODING DEVICE, DECODING DEVICE, SOUND SIGNAL PROCESSING SYSTEM, SOUND SIGNAL CODING PROGRAM, AND SOUND SIGNAL DECODING PROGRAM}

본 발명은, 소리 신호 부호화 방법, 소리 신호 복호 방법, 부호화 장치, 복호 장치, 소리 신호 처리 시스템, 소리 신호 부호화 프로그램 및 소리 신호 복호 프로그램에 관한 것이다.

음성?음악 신호(소리 신호)를 낮은 비트레이트로 압축하는 부호화 기술은, 음성?음악 신호의 통신?방송?축적에 필요로 하는 비용을 낮추기 위해서 중요하다. 음성 신호와 음악 신호의 양쪽을 효율적으로 부호화하기 위해서는, 음성 신호에 적합한 부호화 방식과 음악 신호에 적합한 부호화 방식을 전환하여 이용하는 복합형의 부호화 방식이 유효하다. 복합형의 부호화 방식을 이용하는 경우, 음성 계 열의 도중에 부호화 방식의 전환을 행함으로써, 입력 신호의 성질이 시간적으로 변화되는 경우에도 효율적으로 부호화할 수 있다.

복합형의 부호화 방식은, 통상적으로, 음성 신호의 부호화에 적합한 CELP 방식(CELP: Code Excited Linear Prediction Coding, 코드 여진(勵振) 선형 예측 부호화)의 부호화를 구성 요소로서 포함한다. 일반적으로, CELP 방식의 부호기는, 입력 신호에 선형 예측 역(逆) 필터를 적용함으로써 얻어지는 잔차(殘差) 신호를 부호화하기 위하여, 과거의 잔차 신호에 관한 정보를 적응 부호장(符號帳)으로서 내부에 유지한다. 이 적응 부호장이 부호화에 이용되므로, 높은 부호화 효율이 달성된다.

음성 신호 및 음악 신호를 부호화하는 기술은, 예를 들면, 하기 특허 문헌 1 등에 기재되어 있다. 하기 특허 문헌 1에는, 음성 신호 및 음악 신호의 양쪽을 부호화하는 부호화 알고리즘 등이 기재되어 있다. 하기 특허 문헌 1의 기술은, 음성 신호 및 음악 신호의 양쪽에 공통인 선형 예측(LP) 합성 필터를 사용한다. LP 합성 필터는, 음성 신호 또는 음악 신호의 부호화에 따라, 각각 음성 여진 제네레이터와 변환 여진 제네레이터를 전환한다. 음성 신호의 부호화에는, 종래의 CELP 기술을 사용하고, 음악 신호의 부호화에는, 신규의 비대칭 중복 가산 변환 기술을 응용한다. 공통의 LP 합성 필터링을 행할 때, 중복 가산 조작 영역의 신호에 LP 계수의 보간을 행한다.

CELP 방식 이외의 다른 부호화 방식으로부터 CELP 방식에 기초한 부호화 방식으로의 전환이 음성 계열의 도중에 행해지는 경우, 전환 전의 음성에 대응하는 잔차 신호의 정보가 적응 부호장으로서 부호기에 유지되어 있지 않으므로, 부호화 방식의 전환 직후의 프레임에 있어서 부호화 효율이 저하되고, 따라서, 음성 품질의 열화를 초래하는 문제가 발생할 수 있다. CELP 방식 이외의 다른 부호화 방식에 의한 부호화 결과를 이용하여 CELP 방식에 있어서의 부호기의 내부 상태를 초기화하는 방법에 관한 선행 기술로서, 3rd Generation Partnership Project(3GPP)에 있어서 표준화된 음성 부호화 방식인 Adaptive MultiRate Wideband plus(AMR-WB+, 비특허 문헌 1)가 알려져 있다. AMR-WB+의 부호기는, 입력 신호에 선형 예측 역필터 처리를 행하여 얻어지는 잔차 신호를 구하고, 그 후, CELP 방식과 Transform Coded Excitation(TCX) 방식의 2개의 부호화 방식을 전환하여 이용함으로써, 잔차 신호의 부호화를 행한다. AMR-WB+의 부호기는, TCX 방식으로부터 CELP 방식으로의 전환이 행해지는 경우, TCX 방식에 있어서의 여기 신호를 사용하여 CELP 방식에서의 적응 부호장을 갱신한다.

일본 특허출원 공개번호 2003-44097호 공보

3GPP TS 26.290 "Audio codec processing functions; Extended Adaptive Multi-Rate-Wideband(AMR-WB+) codec; Transcoding functions". [online]. [retrieved on 5 March 2009] Retrieved from the Internet: <URL: http://www.3gpp.org/ftp/Specs/html-info/26290.htm>

그러나, CELP 방식에 기초한 부호화 방식과, 선형 예측 부호화를 이용하지 않는 부호화 방식을 전환하여 이용하는 복합형의 부호화 방식을 이용하는 경우, 선형 예측 부호화를 이용하지 않는 부호화 방식에 의한 부호화의 과정에 있어서 여기 신호를 얻기가 곤란하다. 그러므로, 선형 예측 부호화를 이용하지 않는 부호화 방식으로부터 CELP 방식에 기초한 부호화 방식으로의 전환을 행하는 경우에, CELP 방식에 있어서의 적응 부호장을, 전환 전의 음성에 대응하는 여기 신호에 의해 초기화하는 것이 곤란하게 된다. 본 발명의 목적은, 선형 예측을 이용하지 않는 부호화 방식으로부터 선형 예측 부호화에 기초한 부호화 방식으로의 전환을 행하는 경우에, 선형 예측 부호화에 기초한 부호화 방식의 부호 수단 또는 복호 수단의 내부 상태의 초기값을 적절한 값으로 설정하여, 전환 직후의 프레임에 있어서의 음성 품질을 개선하는 것이다.

본 발명의 소리 신호 부호화 방법은, 선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단을 사용하여, 복수의 프레임으로 이루어지는 소리 신호를 부호화하는 소리 신호 부호화 방법으로서, 상기 소리 신호의 제1 프레임이 상기 제2 부호화 수단에 의해 부호화된 후에, 상기 제1 프레임의 직후에 있는 제2 프레임을 부호화하는 부호화 수단을 상기 제2 부호화 수단으로부터 상기 제1 부호화 수단으로 전환하는 전환 단계와, 상기 전환 단계 후에, 상기 제1 부호화 수단의 내부 상태를 소정의 방법에 의해 초기화하는 초기화 단계를 포함하는 것을 특징으로 한다.

본 발명의 소리 신호 부호화 방법에 의하면, 선형 예측 부호화 방식에 의해 부호화하는 제2 프레임의 앞의 제1 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식으로 부호화된 경우라도, 선형 예측 부호화 방식에 기초한 제1 부호화 수단의 내부 상태를 초기화함으로써, 제2 프레임의 부호화를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리를 실현할 수 있다.

또한, 본 발명에 있어서, 상기 제1 부호화 수단의 상기 내부 상태는, 적응 부호장의 내용 또는 영(0) 입력 응답을 요구하기 위한 선형 예측 합성 필터의 지연 요소를 유지하는 값인 것이 바람직하고, 상기 초기화 단계에서는, 상기 제1 프레임을 사용하여 상기 제1 부호화 수단의 내부 상태를 초기화하는 것이 바람직하고, 상기 초기화 단계에서는, 상기 제2 부호화 수단에 의한 부호화 전의 상기 제1 프레임, 또는 상기 제2 부호화 수단에 의한 부호화 후에 복호하여 얻어지는 상기 제1 프레임 중 어느 하나에 상기 선형 예측 역필터를 적용하여 얻어지는 잔차 신호를 사용하여, 상기 제1 부호화 수단의 초기화를 행하는 것이 바람직하고, 상기 초기화 단계에서는, 상기 제1 프레임보다 앞에 있는 제3 프레임에 상기 제1 부호화 수단에 의한 부호화를 행했을 때의 선형 예측 계수를 사용하여, 상기 제2 부호화 수단에 의한 부호화 전의 상기 제1 프레임, 또는 상기 제2 부호화 수단에 의한 부호화 후에 복호하여 얻어지는 상기 제1 프레임 중 어느 하나에 상기 선형 예측 역필터를 적용하는 것이 바람직하다. 또는, 상기 초기화 단계에서는, 상기 제1 프레임에서의 선형 예측 계수가 상기 제2 프레임의 부호에 포함되는 경우에는, 상기 제2 프레임의 부호에 포함되어 있는 선형 예측 계수를 사용하여, 상기 제2 부호화 수단에 의한 부호화 전의 상기 제1 프레임, 또는 상기 제2 부호화 수단에 의한 부호화 후에 복호하여 얻어지는 상기 제1 프레임 중 어느 하나에 상기 선형 예측 역필터를 적용하는 것이 바람직하다. 그리고, 본 발명에 있어서, 상기 초기화 단계에서는, 상기 제1 프레임보다 앞에 있는 프레임에 상기 제1 부호화 수단에 의한 부호화를 행했을 때의 상기 제1 부호화 수단의 내부 상태를 사용하여, 상기 제1 부호화 수단의 내부 상태를 초기화해도 된다. 또한, 영 입력 응답을 요구하기 위한 선형 예측 합성 필터에서의 선형 예측 계수로서도, 상기 제1 프레임보다 앞에 있는 제3 프레임에 상기 제1 부호화 수단에 의한 부호화를 행했을 때의 선형 예측 계수, 또는 상기 제1 프레임에서의 선형 예측 계수가 상기 제2 프레임의 부호에 포함되는 경우에는, 상기 제2 프레임의 부호화 시에 계산되는 상기 제1 프레임에서의 선형 예측 계수, 또는 그들에 청각 가중치 부여 필터를 적용한 것을 사용하는 것이 바람직하다.

본 발명의 소리 신호 복호 방법은, 선형 예측 부호화 방식에 기초한 제1 복호 수단과, 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단을 사용하여, 복수의 프레임으로 이루어지는 부호화 소리 신호를 복호하는 소리 신호 복호 방법으로서, 상기 부호화 소리 신호의 제1 프레임이 상기 제2 복호 수단에 의해 복호된 후에, 상기 제1 프레임의 직후에 있는 제2 프레임을 복호하는 복호 수단을 상기 제2 복호 수단으로부터 상기 제1 복호 수단으로 전환하는 전환 단계와, 상기 전환 단계 후에, 상기 제1 복호 수단의 내부 상태를 소정의 방법에 의해 초기화하는 초기화 단계를 포함하는 것을 특징으로 한다.

본 발명의 소리 신호 복호 방법에 의하면, 선형 예측 부호화 방식을 사용하여 복호하는 제2 프레임의 앞의 제1 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 의해 복호된 경우라도, 선형 예측 부호화 방식에 기초한 제1 복호 수단의 내부 상태를 초기화함으로써, 제2 프레임의 복호를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 복호 처리를 실현할 수 있다.

또한, 본 발명에 있어서, 상기 제1 복호 수단의 상기 내부 상태는, 적응 부호장의 내용 또는 선형 예측 합성 필터의 지연 요소를 유지하는 값인 것이 바람직하고, 상기 초기화 단계에서는, 상기 제1 프레임을 사용하여 상기 제1 복호 수단의 내부 상태를 초기화하는 것이 바람직하고, 상기 초기화 단계에서는, 상기 제2 복호 수단에 의한 복호 후의 상기 제1 프레임에 상기 선형 예측 역필터를 적용하여 얻어지는 잔차 신호를 사용하여, 상기 제1 복호 수단의 초기화를 행하는 것이 바람직하고, 상기 초기화 단계에서는, 상기 제1 프레임보다 앞에 있는 제3 프레임에 상기 제1 복호 수단에 의한 복호를 행했을 때의 선형 예측 계수를 사용하여, 상기 제2 복호 수단에 의한 복호 후의 상기 제1 프레임에 상기 선형 예측 역필터를 적용하는 것이 바람직하다. 또는, 상기 초기화 단계에서는, 상기 제1 프레임에서의 선형 예측 계수가 상기 제2 프레임의 부호에 포함되어 있는 경우에는, 상기 제2 프레임의 부호에 포함되어 있는 선형 예측 계수를 사용하여, 상기 제2 복호 수단에 의한 복호 후의 상기 제1 프레임에 상기 선형 예측 역필터를 적용하는 것이 바람직하다. 그리고, 본 발명에 있어서, 상기 초기화 단계에서는, 상기 제1 프레임보다 앞에 있는 프레임에 상기 제1 복호 수단에 의한 복호를 행했을 때의 상기 제1 복호 수단의 내부 상태를 사용하여, 상기 제1 복호 수단의 내부 상태를 초기화해도 된다.

본 발명의 부호화 장치는, 선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 상기 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단을 구비하고, 상기 제1 부호화 수단 및 상기 제2 부호화 수단을 사용하여 소리 신호를 부호화하는 부호화 장치로서, 상기 소리 신호에 포함되어 있고 부호화의 대상으로 되는 부호 대상 프레임을, 상기 제1 부호화 수단 또는 상기 제2 부호화 수단 중 어느 쪽에 의해 부호화할 것인지를 판정하는 제1 부호 판정 수단과, 상기 부호 대상 프레임을 상기 제1 부호화 수단에 의해 부호화할 것으로 상기 제1 부호 판정 수단에 의해 판정된 경우에, 상기 부호 대상 프레임의 직전에 있는 부호 직전 프레임이 상기 제1 부호화 수단에 의해 부호화되어 있는지, 또는 상기 제2 부호화 수단에 의해 부호화되어 있는지를 판정하는 제2 부호 판정 수단과, 상기 부호 직전 프레임이 상기 제2 부호화 수단에 의해 부호화되어 있는 것으로 상기 제2 부호 판정 수단에 의해 판정된 경우에, 상기 부호 직전 프레임의 부호화 결과를 복호하고, 이 복호 결과를 사용하여 상기 제1 부호화 수단의 내부 상태를 산출하는 부호 내부 상태 계산 수단과, 상기 부호 내부 상태 계산 수단에 의해 산출된 상기 내부 상태를 사용하여 상기 제1 부호화 수단의 내부 상태를 초기화하는 부호 초기화 수단을 구비하고, 상기 제1 부호화 수단은, 상기 부호 초기화 수단에 의한 상기 내부 상태의 초기화 후에 상기 부호 대상 프레임을 부호화하는 것을 특징으로 한다.

본 발명의 부호화 장치에 의하면, 선형 예측 부호화 방식에 기초한 제1 부호화 수단에 의해 부호화되는 부호 대상 프레임의 앞의 부호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단에 의해 부호화된 경우라도, 제1 부호화 수단의 내부 상태를 초기화함으로써, 부호 대상 프레임의 부호화를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리를 실현할 수 있다.

본 발명의 복호 장치는, 선형 예측 부호화 방식에 기초한 제1 복호 수단과, 상기 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단을 구비하고, 상기 제1 복호 수단 및 상기 제2 복호 수단을 사용하여 부호화 소리 신호를 복호하는 복호 장치로서, 상기 부호화 소리 신호에 포함되어 있고 복호의 대상으로 되는 복호 대상 프레임을, 상기 제1 복호 수단 또는 상기 제2 복호 수단 중 어느 쪽에 의해 복호할 것인지를 판정하는 제1 복호 판정 수단과, 상기 복호 대상 프레임을 상기 제1 복호 수단에 의해 복호할 것으로 상기 제1 복호 판정 수단에 의해 판정된 경우에, 상기 복호 대상 프레임의 직전에 있는 복호 직전 프레임이 상기 제1 복호 수단에 의해 복호되었는지, 또는 상기 제2 복호 수단에 의해 복호되었는지를 판정하는 제2 복호 판정 수단과, 상기 복호 직전 프레임이 상기 제2 복호 수단에 의해 복호된 것으로 상기 제2 복호 판정 수단에 의해 판정된 경우에, 상기 복호 직전 프레임의 복호 결과를 사용하여 상기 제1 복호 수단의 내부 상태를 산출하는 복호 내부 상태 계산 수단과, 상기 복호 내부 상태 계산 수단에 의해 산출된 상기 내부 상태를 사용하여 상기 제1 복호 수단의 내부 상태를 초기화하는 복호 초기화 수단을 구비하고, 상기 제1 복호 수단은, 상기 복호 초기화 수단에 의한 상기 내부 상태의 초기화 후에 상기 복호 대상 프레임을 복호하는 것을 특징으로 한다.

본 발명의 복호 장치에 의하면, 선형 예측 부호화 방식에 기초한 제1 복호 수단을 사용하여 복호하는 복호 대상 프레임의 앞의 복호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단에 의해 복호된 경우라도, 제1 복호 수단의 내부 상태를 초기화함으로써, 복호 대상 프레임의 복호를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 복호 처리를 실현할 수 있다.

본 발명의 소리 신호 처리 시스템은, 상기 부호화 장치와 상기 복호 장치를 구비하고, 상기 복호 장치는, 상기 부호화 장치에 의해 부호화된 부호화 소리 신호를 복호하는 것을 특징으로 한다.

본 발명의 소리 신호 처리 시스템에 의하면, 선형 예측 부호화 방식에 기초한 제1 부호화 수단에 의해 부호화되는 부호 대상 프레임의 앞의 부호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단에 의해 부호화된 경우라도, 제1 부호화 수단의 내부 상태를 초기화함으로써, 부호 대상 프레임의 부호화를 선형 예측 부호화 방식에 의해 행할 수 있다. 선형 예측 부호화 방식에 기초한 제1 복호 수단을 사용하여 복호하는 복호 대상 프레임의 앞의 복호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단에 의해 복호된 경우라도, 제1 복호 수단의 내부 상태를 초기화함으로써, 복호 대상 프레임의 복호를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리 및 복호 처리를 실현할 수 있다.

본 발명의 소리 신호 부호화 프로그램은, 선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 상기 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단을 사용하여 소리 신호를 부호화하기 위하여, 컴퓨터 장치를, 상기 소리 신호에 포함되어 있고 부호화의 대상으로 되는 부호 대상 프레임을 상기 제1 부호화 수단 또는 상기 제2 부호화 수단 중 어느 쪽에 의해 부호할 것인지를 판정하는 제1 부호 판정 수단, 상기 부호 대상 프레임을 상기 제1 부호화 수단에 의해 부호화할 것으로 상기 제1 부호 판정 수단에 의해 판정된 경우에, 상기 부호 대상 프레임의 직전에 있는 부호 직전 프레임이 상기 제1 부호화 수단에 의해 부호화되어 있는지, 또는 상기 제2 부호화 수단에 의해 부호화되어 있는지를 판정하는 제2 부호 판정 수단, 상기 부호 직전 프레임이 상기 제2 부호화 수단에 의해 부호화되어 있는 것으로 상기 제2 부호 판정 수단에 의해 판정된 경우에, 상기 부호 직전 프레임의 부호화 결과를 복호하고, 이 복호 결과를 사용하여 상기 제1 부호화 수단의 내부 상태를 산출하는 부호 내부 상태 계산 수단, 상기 부호 내부 상태 계산 수단에 의해 산출된 상기 내부 상태를 사용하여 상기 제1 부호화 수단의 내부 상태를 초기화하는 부호 초기화 수단, 및 상기 부호 초기화 수단에 의해 상기 내부 상태의 초기화를 행한 후에 상기 제1 부호화 수단이 상기 부호 대상 프레임을 부호화하는 부호화 수단으로서 기능하게 하는 것을 특징으로 한다.

본 발명의 소리 신호 부호화 프로그램에 의하면, 선형 예측 부호화 방식에 기초한 제1 부호화 수단에 의해 부호화되는 부호 대상 프레임의 앞의 부호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화 수단에 의해 부호화된 경우라도, 제1 부호화 수단의 내부 상태를 초기화함으로써, 부호 대상 프레임의 부호화를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리를 실현할 수 있다.

본 발명의 소리 신호 복호 프로그램은, 선형 예측 부호화 방식에 기초한 제1 복호 수단과, 상기 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단을 사용하여 부호화 소리 신호를 복호하기 위하여, 컴퓨터 장치를, 상기 부호화 소리 신호에 포함되어 있고 복호의 대상으로 되는 복호 대상 프레임을 상기 제1 복호 수단 또는 상기 제2 복호 수단 중 어느 쪽에 의해 복호할 것인지 판정하는 제1 복호 판정 수단, 상기 복호 대상 프레임을 상기 제1 복호 수단에 의해 복호할 것으로 상기 제1 복호 판정 수단에 의해 판정된 경우에, 상기 복호 대상 프레임의 직전에 있는 복호 직전 프레임이 상기 제1 복호 수단에 의해 복호되었는지, 또는 상기 제2 복호 수단에 의해 복호되었는지를 판정하는 제2 복호 판정 수단, 상기 복호 직전 프레임이 상기 제2 복호 수단에 의해 복호된 것으로 상기 제2 복호 판정 수단에 의해 판정된 경우에, 상기 복호 직전 프레임의 복호 결과를 사용하여 상기 제1 복호 수단의 내부 상태를 산출하는 복호 내부 상태 계산 수단, 상기 복호 내부 상태 계산 수단에 의해 산출된 상기 내부 상태를 사용하여 상기 제1 복호 수단의 내부 상태를 초기화하는 복호 초기화 수단, 및 상기 복호 초기화 수단에 의해 상기 내부 상태의 초기화를 행한 후에 상기 제1 복호 수단이 상기 복호 대상 프레임을 복호하는 복호 수단으로서 기능하게 하는 것을 특징으로 한다.

본 발명의 소리 신호 복호 프로그램에 의하면, 선형 예측 부호화 방식에 기초한 제1 복호 수단을 사용하여 복호하는 복호 대상 프레임의 앞의 복호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호 수단에 의해 복호된 경우라도, 제1 복호 수단의 내부 상태를 초기화함으로써, 복호 대상 프레임의 복호를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 복호 처리를 실현할 수 있다.

본 발명에 의하면, 선형 예측을 사용하지 않는 부호화 방식으로부터 선형 예측 부호화에 기초한 부호화 방식으로의 전환을 행하는 경우에, 선형 예측 부호화에 기초한 부호화 방식의 부호 수단 또는 복호 수단의 내부 상태의 초기값을 적절한 값으로 설정하여, 전환 직후의 프레임에서의 음성 품질을 개선할 수 있다.

도 1은 실시예에 따른 부호화 장치 및 복호 장치의 구성을 나타낸 도면이다.
도 2는 실시예에 따른 부호화 장치의 구성을 나타낸 도면이다.
도 3은 실시예에 따른 부호화 장치의 동작을 설명하기 위한 흐름도이다.
도 4는 실시예에 따른 복호 장치의 구성을 나타낸 도면이다.
도 5는 실시예에 따른 복호 장치의 동작을 설명하기 위한 흐름도이다.

이하, 도면을 참조하여, 본 발명에 따른 바람직한 실시예에 대하여 상세하게 설명한다. 그리고, 도면의 설명에 있어서, 가능한 경우에는, 동일 요소에는 동일 부호를 부여하고, 중복되는 설명을 생략한다. 실시예에 따른 소리 신호 처리 시스템은, 입력한 소리 신호를 부호화하는 부호화 장치(10)와, 부호화 장치(10)에 의해 부호화된 부호화 소리 신호를 복호하는 복호 장치(20)를 구비한다. 도 1 및 도 2는, 실시예에 따른 부호화 장치(10)의 구성을 나타낸 도면이다. 부호화 장치(10)는, 입력된 음성?음악 신호(소리 신호)를 부호화하여 출력한다. 음성?음악 신호는, 유한한 길이를 가지는 프레임으로 미리 분할된 후에, 부호화 장치(10)에 입력되는 것으로 한다. 부호화 장치(10)는, 음성?음악 신호가 음성 신호인 경우에, 제1 부호화 방식에 따라 부호화하고, 음성?음악 신호가 음악 신호인 경우에는, 제2 부호화 방식에 따라 부호화한다. 제1 부호화 방식은 적응 부호장을 가지는 선형 예측 부호화에 기초한 ACELP 등의 CELP 방식이다. 제2 부호화 방식은 제1 부호화 방식과는 상이하며, 선형 예측을 이용하지 않는 부호화 방식이다. 제2 부호화 방식은, 예를 들면, AAC 등의 변환 부호화를 상정(想定)한다.

부호화 장치(10)는, 물리적으로는 CPU(10a), ROM(10b), RAM(10c), 기억 장치(10d) 및 통신 장치(10e) 등을 포함하는 컴퓨터 장치를 가지고 있고, 이들 CPU(10a) ? 통신 장치(10e)는, 버스(10f)에 접속되어 있다. CPU(10a)는, ROM(10b) 등의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 3에 나타내는 흐름도의 처리를 실행하기 위한 소리 신호 부호화 프로그램)을 RAM(10c)에 로딩하여 실행함으로써, 부호화 장치(10)를 통괄적으로 제어한다. 기억 장치(10d)는, 기록/판독이 가능한 메모리로서, 각종 컴퓨터 프로그램이나, 컴퓨터 프로그램의 실행에 필요한 각종 데이터 등(예를 들면, 제1 부호화 방식의 부호화에 사용하는 적응 부호장 및 선형 예측 계수나, 그 밖에 제1 부호화 방식 및 제2 부호화 방식에 의한 부호화에 필요한 다양한 파라미터, 소정 개수의 부호화 전후의 프레임 등)을 저장한다. 기억 장치(10d)는, 적어도 최후에(직전에) 부호화된 하나의 프레임의 음성?음악 신호를 저장한다.

또한, 부호화 장치(10)는, 기능적으로는, 부호화 방식 전환부(12)(제1 부호 판정 수단, 제2 부호 판정 수단), 제1 부호화부(13)(제1 부호화 수단), 제2 부호화부(14)(제2 부호화 수단), 부호 다중화부(15), 내부 상태 계산부(16)(부호 내부 상태 계산 수단) 및 내부 상태 초기화법 특정부(17)(부호 초기화 수단)를 가진다. 이들 부호화 방식 전환부(12)?내부 상태 초기화법 특정부(17)는, CPU(10a)가 ROM(10b) 등의 부호화 장치(10)의 내장 메모리에 저장된 상기 컴퓨터 프로그램을 실행하여, 도 1에 나타내는 부호화 장치(10)의 각 구성부를 동작시킴으로써 실현되는 기능이다. CPU(10a)는, 상기 소리 신호 부호화 프로그램을 실행함으로써[부호화 방식 전환부(12) ? 내부 상태 초기화법 특정부(17)를 사용하여], 도 3의 흐름도에 나타내는 처리를 실행한다.

다음으로, 도 3을 참조하여, 부호화 장치(10)의 동작을 설명한다. 음성?음악 신호는, 유한한 길이를 가지는 프레임으로 미리 분할된 후에, 부호화 장치(10)의 통신 장치(10e)에 입력되는 것으로 한다. 부호화 방식 전환부(12)는, 음성?음악 신호가 통신 장치(10e)를 통하여 입력되면, 이 음성?음악 신호의 부호 대상 프레임(부호화의 대상으로 되어 있는 프레임)을, 이 부호 대상 프레임에 기초하여, 제1 부호화 방식 또는 제2 부호화 방식 중 어느 쪽의 부호화 방식에 의해 부호화할 것인지를 판정하고, 이 판정 결과에 따라, 제1 부호화 방식에 의해 음성?음악 신호를 부호화하는 제1 부호화부(13), 또는 제2 부호화 방식에 의해 음성?음악 신호를 부호화하는 제2 부호화부(14) 중 어느 하나에 부호 대상 프레임을 송신한다(단계 S11: 제1 전환 단계). 단계 S11에 있어서, 부호화 방식 전환부(12)는, 부호 대상 프레임이 음성 신호인 경우에는, 제1 부호화 방식에 의해 부호화할 것으로 판정하고, 부호 대상 프레임이 음악 신호인 경우에는, 제2 부호화 방식에 의해 부호화할 것으로 판정한다. 그리고, 이 제1 전환 단계 후에, 제1 부호화부(13)의 내부 상태(적응 부호장의 내용 또는 영 입력 응답을 요구하기 위한 선형 예측 합성 필터의 지연 요소를 유지하는 값 등이며, 이하 동일함)를 초기화하기 위한 제1 초기화 단계(단계 S12?S18)가 행해진다.

부호화 방식 전환부(12)는, 부호 대상 프레임이 음악 신호이며, 제2 부호화 방식에 의해 부호 대상 프레임을 부호화할 것으로 단계 S11에 있어서 판정한 경우(단계 S11: 제2 부호화부), 부호 대상 프레임을 제2 부호화부(14)에 송신하고, 제2 부호화부(14)는, 이 부호화 방식 전환부(12)로부터 송신된 부호 대상 프레임을 제2 부호화 방식에 의해 부호화하고, 이 부호화된 부호 대상 프레임(부호화 음성?음악 신호)을 통신 장치(10e)를 통하여 출력한다(단계 S18). 부호화 방식 전환부(12)는, 부호 대상 프레임이 음성 신호이며, 제1 부호화 방식에 의해 부호 대상 프레임을 부호화할 것으로 단계 S11에 있어서 판정한 경우(단계 S11: 제1 부호화부), 기억 장치(10d)의 내용을 참조하여, 부호 대상 프레임의 직전의 프레임(부호 직전 프레임)이 제1 부호화부(13)에 의해 부호화되었는지, 또는 제2 부호화부(14)에 의해 부호화되었는지를 판정한다(단계 S12). 부호 대상 프레임의 앞에 있는 소정수의 프레임(부호 직전 프레임을 포함함)의 부호화 결과, 및 부호화 앞의 프레임 자체는, 모두 기억 장치(10d)에 저장되어 있다.

부호화 방식 전환부(12)는, 부호 직전 프레임이 제1 부호화부(13)에 의해 부호화된 것으로 단계 S12에 있어서 판정한 경우(단계 S12: YES), 부호 대상 프레임을 제1 부호화부(13)에 송신하고, 제1 부호화부(13)는, 이 부호화 방식 전환부(12)로부터 송신된 부호 대상 프레임을 제1 부호화 방식에 의해 부호화하고, 이 부호화된 부호 대상 프레임(부호화 음성?음악 신호)을 통신 장치(10e)를 통하여 출력한다(단계 S17). 부호화 방식 전환부(12)는, 부호 직전 프레임이 제2 부호화부(14)에 의해 부호화된 것으로 단계 S12에 있어서 판정한 경우(단계 S12: NO), 내부 상태 계산부(16)는, 기억 장치(10d)에 저장되어 있는 부호 직전 프레임의 부호화 결과를 복호하여, 부호 직전 프레임의 복호 결과를 얻는다(단계 S13). 부호화 장치(10)가 사용하는 복호 결과는, 부호화 장치(10)에 내장된 복호기(도시 생략) 또는 후술하는 복호 장치(20)에 의해 얻어진다. 그리고, 복호에 필요한 연산을 생략하기 위하여, 부호 직전 프레임의 부호화 결과를 복호한 복호 결과 대신, 제2 부호화부(14)에 의한 부호화 전의 부호 직전 프레임을 사용해도 된다. 이 부호화 전의 부호 직전 프레임은, 기억 장치(10d)에 저장되어 있다.

단계 S13 후에, 내부 상태 계산부(16)는, 부호 직전 프레임의 복호 결과를 사용하여 제1 부호화부(13)의 내부 상태를 산출한다(단계 S14). 내부 상태 계산부(16)가 행하는 제1 부호화부(13)의 내부 상태의 산출 처리는, 부호 직전 프레임의 복호 결과를 처리하여 내부 상태를 산출하는 예로서, 부호 직전 프레임의 복호 결과[또는, 제2 부호화부(14)에 의한 부호화 전의 부호 직전 프레임]로부터 공분산법 등의 방법을 사용하여 선형 예측 계수를 구하고, 그리고, 이 구한 선형 예측 계수를 사용하여 복호 결과에 선형 예측 역필터를 적용함으로써 잔차 신호를 구하는 처리가 있다.

그리고, 부호 직전 프레임의 복호 결과로부터 선형 예측 계수를 구하는 처리는 연산량이 크기 때문에, 내부 상태 계산부(16)는, 선형 예측 계수를 부호 직전 프레임의 복호 결과로부터 구하는 대신, 부호 직전 프레임의 인접한, 제1 부호화 방식에 의해 부호화된 프레임(부호 직전 프레임보다 앞에 있는 프레임)에서의 선형 예측 계수[기억 장치(10d)에 저장되어 있음]를 상기 처리[제1 부호화부(13)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 되고, 또는 이 선형 예측 계수를 프레임 사이에서 내삽(內揷)한 값을 상기 처리[제1 부호화부(13)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 또한, 내부 상태 계산부(16)는, 부호 직전 프레임의 인접한, 제1 부호화 방식에 의해 부호화된 프레임에서의 선형 예측 계수를 사용하여 외삽(外揷)에 의해 얻어지는 값, 또는 이들 선형 예측 계수를 프레임 사이에서 내삽한 값을 사용하여 외삽에 의해 얻어지는 값을, 상기 처리[제1 부호화부(13)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 내부 상태 계산부(16)는, 선형 예측 계수를 선스펙트럼 주파수로 변환한 값에 대하여 외삽을 행하고, 이 외삽 결과를 선형 예측 계수로 재변환해도 된다. 또한, 내부 상태 계산부(16)는, 부호 직전 프레임에서의 선형 예측 계수가, 부호 대상 프레임의 부호에 포함되는 경우에는, 이 부호 대상 프레임의 부호에 포함되어 있는 선형 예측 계수를 상기 처리[제1 부호화부(13)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 또한, 내부 상태 계산부(16)는, 선형 예측 계수를 계산하지 않고, 부호 직전 프레임의 복호 결과를 그대로 잔차 신호의 대용으로서 사용해도 된다. 또한, 부호 직전 프레임에 인접해 있고, 제1 부호화 방식에 의해 부호화된 프레임(부호 직전 프레임의 앞에 있는 프레임)에 대한 부호화의 과정에서 얻어진 내부 상태[이 내부 상태를 나타낸 정보는 기억 장치(10d)에 저장되어 있음]를 사용하여, 제1 부호화부(13)의 내부 상태를 초기화해도 된다. 또한, 부호 직전 프레임의 복호 결과에 대하여 선형 예측 역필터를 적용하는 처리는, 프레임 전체에 대한 것이 아니고, 프레임의 일부분 만에 대한 것이라도 된다.

단계 S14 후에, 내부 상태 초기화법 특정부(17)는, 내부 상태 계산부(16)에 의해 산출된 내부 상태를 사용하여 제1 부호화부(13)의 내부 상태를 초기화하거나, 또는 "0"으로 초기화하는 등의 미리 정해진 초기화 방법 중 어느 하나의 초기화 방법을, 부호 대상 프레임에 기초하여, 또는, 부호 직전 프레임의 복호 결과에 기초하여, 특정한다(단계 S15). 그리고, 내부 상태 초기화법 특정부(17)는, 단계 S15에 있어서 특정한 초기화 방법에 따라, 제1 부호화부(13)의 내부 상태를 초기화한다(단계 S16). 내부 상태 초기화법 특정부(17)에 의해 행해지는 제1 부호화부(13)의 내부 상태의 초기화는, 내부 상태 계산부(16)에 의해 산출된 내부 상태를 사용하여, 제1 부호화부(13)의 내부 상태를 초기화하는 처리이지만, 제1 부호화 방식에서의 잔차 신호의 산출에 사용하는 제1 부호화부(13)의 선형 예측 합성 필터의 내부 상태(지연 요소를 유지하는 값)를 초기화하는 처리를 포함해도 된다. 또한, 내부 상태 초기화법 특정부(17)는, 제1 부호화부(13)의 내부 상태의 초기화 방법을 특정하는 경우, 예를 들면, 전술한 2가지 초기화 방법을 포함하는 복수의 초기화 방법을 사용하여, 각각 부호 대상 프레임에 대하여 제1 부호화 방식에 의한 부호화를 시도하고, 그 결과, 제곱 오차, 또는 청각 가중치 중 오차가 작은 초기화 방법을 선택해도 된다.

단계 S16에 있어서 내부 상태 초기화법 특정부(17)가 제1 부호화부(13)의 내부 상태를 초기화한 후에, 제1 부호화부(13)는, 제1 부호화 방식에 의해 부호 대상 프레임을 부호화하고, 이 부호화한 부호 대상 프레임(부호화 음성?음악 신호)을 통신 장치(10e)를 통하여 출력한다(단계 S17).

그리고, 내부 상태 초기화법 특정부(17)가 단계 S15에 있어서 선택한 초기화 방법의 정보를, 부호 다중화부(15)가, 보조 정보로서 제1 부호화 방식에 의한 부호화 결과로 다중화하도록 구성할 수도 있다. 또한, 제1 부호화부(13) 및 제2 부호화부(14)와 복호기[부호화 장치(10)에 내장되는 복호기 또는 복호 장치(20)]와의 사이에서 공통으로 얻어지는 정보(하기 참조)에 기초하여, 제1 부호화부(13)의 내부 상태의 초기화 방식을 특정하도록 구성할 수도 있으며, 이 경우, 부호 다중화부(15)는, 제1 부호화부(13)의 내부 상태의 초기화 방법을 나타내는 보조 정보를 부호화 결과로 다중화하지 않는다. 예를 들면, 제1 부호화 방식에서의 부호 대상 프레임의 적응 부호장 게인이 큰 경우, 또는 부호 직전 프레임에서의 복호 결과의 주기성이 높은 경우 등에, 내부 상태 초기화법 특정부(17)는, 내부 상태 계산부(16)에 의해 산출된 내부 상태를 사용하여 제1 부호화부(13)의 내부 상태를 초기화할 수 있다.

또한, 내부 상태 초기화법 특정부(17)를 생략하고, 항상, 내부 상태 계산부(16)에 의해 산출된 내부 상태를 사용하여 제1 부호화부(13)가 자체의 내부 상태를 초기화하도록 구성할 수도 있다. 또한, 부호화 방식 전환부(12)에 의해 제2 부호화 방식으로부터 제1 부호화 방식으로 전환된 직후에(제1 전환 단계 후에), 내부 상태 계산부(16)와 내부 상태 초기화법 특정부(17)가 부호 대상 프레임에 대하여 상기 처리(제1 초기화 단계)를 행하도록 구성하고 있지만, 이것으로 한정되지 않고, 부호화 방식 전환부(12)에 의해 제2 부호화 방식으로부터 제1 부호화 방식으로 전환되지 직전(부호 대상 프레임의 직전)의 부호 직전 프레임이 부호화될 때 내부 상태 계산부(16)와 내부 상태 초기화법 특정부(17)가 상기 처리를 행하도록 구성해도 된다. 또한, 제1 부호화 방식[제1 부호화부(13)]과 제2 부호화 방식[제2 부호화부(14)]의 2가지 부호화 방식 사이에서 전환이 행해지는 구성을 예시했지만, 제1 부호화 방식과는 상이한 부호화 방식이 복수 존재하고, 3가지 이상의 부호화 방식 사이에서 전환이 행해지도록 구성해도 된다.

도 1 및 도 4는, 실시예에 따른 복호 장치(20)의 구성을 나타낸 도면이다. 복호 장치(20)는, 물리적으로는 CPU(20a), ROM(20b), RAM(20c), 기억 장치(20d) 및 통신 장치(20e) 등을 포함하는 컴퓨터 장치를 가지고 있고, 이들 CPU(20a) ? 통신 장치(20e)는, 버스(20f)에 접속되어 있다. CPU(20a)는, ROM(20b) 등의 내장 메모리에 저장된 소정의 컴퓨터 프로그램(예를 들면, 도 5에 나타내는 흐름도의 처리를 실행하기 위한 소리 신호 복호 프로그램)을 RAM(20c)에 로딩하여 실행함으로써, 복호 장치(20)를 통괄적으로 제어한다. 기억 장치(20d)는, 기록/판독이 가능한 메모리로서, 각종 컴퓨터 프로그램이나, 컴퓨터 프로그램의 실행에 필요한 각종 데이터 등(예를 들면, 제1 부호화 방식의 복호에 사용하는 적응 부호장 및 선형 예측 계수나, 그 외에 제1 부호화 방식 및 제2 부호화 방식에 의한 복호에 필요한 다양한 파라미터, 소정수의 복호 전후의 프레임 등)을 저장한다. 기억 장치(20d)는, 적어도 최후에(직전에) 복호된 하나의 프레임의 음성?음악 신호를 저장한다.

또한, 복호 장치(20)는, 기능적으로는, 부호화 방식 판정부(22)(제1 복호 판정 수단, 제2 복호 판정 수단), 부호 분리부(23), 제1 복호부(24)(제1 복호 수단), 제2 복호부(25)(제2 복호 수단), 내부 상태 초기화법 특정부(26)(복호 초기화 수단) 및 내부 상태 계산부(27)(복호 내부 상태 계산 수단)를 가진다. 이들 부호화 방식 판정부(22) ? 내부 상태 계산부(27)는, CPU(20a)가 ROM(20b) 등의 복호 장치(20)의 내장 메모리에 저장된 상기 컴퓨터 프로그램을 실행하여, 도 1에 나타낸 복호 장치(20)의 각 구성부를 동작시킴으로써 실현되는 기능이다. CPU(20a)는, 상기 소리 신호 복호 프로그램을 실행함으로써[부호화 방식 판정부(22) ? 내부 상태 계산부(27)를 사용하여], 도 5의 흐름도에 나타내는 처리를 실행한다.

다음으로, 도 5를 참조하여, 복호 장치(20)의 동작을 설명한다. 부호화 방식 판정부(22)는, 부호화되고 통신 장치(20e)를 통하여 입력된 부호화 음성?음악 신호의 복호 대상 프레임이 제1 부호화 방식과 제2 부호화 방식 중 어느 쪽을 사용하여 부호화되어 있는지를 판정하고, 이 판정 결과에 따라, 제1 부호화 방식에 의해 복호하는 제1 복호부(24), 또는 제2 부호화 방식에 의해 복호하는 제2 복호부(25) 중 어느 하나에 복호 대상 프레임을 송신한다(단계 S21: 제2 전환 단계). 단계 S21에 있어서, 부호화 방식 판정부(22)는, 복호 대상 프레임이 제1 부호화 방식에 의해 부호화되어 있는 경우에는, 제1 복호부(24)에 의해 복호하고, 복호 대상 프레임이 제2 부호화 방식에 의해 부호화되어 있는 경우에는, 제2 복호부(25)에 의해 복호할 것으로 판정한다. 그리고, 이 제2 전환 단계 후에, 제1 복호부(24)의 내부 상태(적응 부호장의 내용 또는 선형 예측 합성 필터의 지연 요소를 유지하는 값 등이며, 이하 동일함)를 초기화하기 위한 제2 초기화 단계(단계 S22?S27)가 행해진다.

부호화 방식 판정부(22)는, 복호 대상 프레임이 제2 부호화 방식에 의해 부호화되어 있는 것으로[즉, 제2 복호부(25)에 의해 복호함] 단계 S21에 있어서 판정한 경우(단계 S21: 제2 복호부), 복호 대상 프레임을 제2 복호부(25)에 송신하고, 제2 복호부(25)는, 이 부호화 방식 판정부(22)로부터 송신된 복호 대상 프레임을 제2 부호화 방식에 의해 복호하고, 이 복호한 복호 대상 프레임(복호 음성?음악 신호)을 통신 장치(20e)를 통하여 출력한다(단계 S27). 부호화 방식 판정부(22)는, 복호 대상 프레임이 제1 부호화 방식에 의해 부호화되어 있는 것으로[즉, 제1 복호부(24)에 의해 복호함] 단계 S21에 있어서 판정한 경우(단계 S21: 제1 복호부), 기억 장치(20d)의 내용을 참조하여, 복호 대상 프레임의 직전의 프레임(복호 직전 프레임)이 제1 부호화 방식에 의해 부호화되어 있었는지[즉, 제1 복호부(24)에 의해 복호되어 있었는지], 또는 제2 부호화 방식에 의해 부호화되어 있었는지[즉, 제2 복호부(25)에 의해 복호되어 있었는지]를 판정한다(단계 S22). 복호 대상 프레임의 전에 있는 소정수의 프레임(복호 직전 프레임을 포함함)의 복호 결과, 및 복호 전후의 프레임 자체는, 모두, 기억 장치(20d)에 저장되어 있다.

부호화 방식 판정부(22)는, 복호 직전 프레임이 제1 부호화 방식에 의해 부호화되어 있는 것으로[즉, 제1 복호부(24)에 의해 복호되어 있음], 단계 S22에 있어서 판정한 경우(단계 S22: YES), 복호 대상 프레임을 제1 복호부(24)에 송신하고, 제1 복호부(24)는, 이 부호화 방식 판정부(22)로부터 송신된 복호 대상 프레임을 제1 부호화 방식에 의해 복호하고, 이 복호한 복호 대상 프레임(복호 음성?음악 신호)을 통신 장치(20e)를 통하여 출력한다(단계 S26).

부호화 방식 판정부(22)는, 복호 직전 프레임이 제2 부호화 방식에 의해 부호화되어 있는 것으로[즉, 제2 복호부(25)에 의해 복호되어 있음], 단계 S22에 있어서 판정한 경우(단계 S22: NO), 복호 직전 프레임을 부호 분리부(23)에 송신하고, 부호 분리부(23)는, 복호 직전 프레임의 다중화된 부호를 제1 부호화 방식에 의한 부호와 제1 복호부(24)의 내부 상태의 초기화 방법을 나타내는 보조 정보[예를 들면, 내부 상태 초기화법 특정부(17)에 의해 특정된 제1 부호화부(13)의 내부 상태의 초기화 방법으로서, 복호 직전 프레임을 부호화할 때 이용된 초기화 방법을 나타내는 정보]로 분리한다. 그리고, 내부 상태 계산부(27)는, 복호 직전 프레임의 복호 결과를 사용하여 제1 복호부(24)의 내부 상태를 계산한다(단계 S23). 내부 상태 계산부(27)가 행하는 제1 복호부(24)의 내부 상태의 산출 처리는, 부호 직전 프레임의 복호 결과를 처리하여 내부 상태를 산출하는 예로서, 복호 직전 프레임의 복호 결과로부터 공분산법 등의 방법으로 선형 예측 계수를 구하고, 그리고, 이 구한 선형 예측 계수를 사용하여 복호 결과에 선형 예측 역필터를 적용함으로써, 잔차 신호를 구하는 처리가 있다.

그리고, 복호 직전 프레임의 복호 결과로부터 선형 예측 계수를 구하는 처리는 연산량이 크기 때문에, 내부 상태 계산부(27)는, 선형 예측 계수를 복호 직전 프레임의 복호 결과로부터 구하는 대신, 복호 직전 프레임의 인접한, 제1 부호화 방식에 의해 부호화된 프레임(복호 직전 프레임보다 앞에 있는 프레임)에서의 선형 예측 계수[제1 복호부(24)에 의해 복호되었을 때의 선형 예측 계수이며, 기억 장치(20d)에 저장되어 있음]를 상기 처리[제1 복호부(24)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 되고, 또는 이 선형 예측 계수를 프레임 사이에서 내삽한 값을 상기 처리[제1 복호부(24)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 또한, 내부 상태 계산부(27)는, 복호 직전 프레임의 인접한, 제1 부호화 방식에 의해 부호화된 프레임에서의 선형 예측 계수를 사용하여 외삽에 의해 얻어지는 값, 또는 이들 선형 예측 계수를 프레임 사이에서 내삽한 값을 사용하여 외삽에 의해 얻어지는 값을, 상기 처리[제1 복호부(24)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 내부 상태 계산부(27)는, 선형 예측 계수를 선스펙트럼 주파수로 변환한 값에 대하여 외삽을 행하고, 이 외삽 결과를 선형 예측 계수로 재변환해도 된다. 또한, 내부 상태 계산부(27)는, 복호 직전 프레임에서의 선형 예측 계수가, 복호 대상 프레임의 부호에 포함되는 경우, 이 복호 대상 프레임의 부호에 포함되어 있는 선형 예측 계수를 상기 처리[제1 복호부(24)의 내부 상태의 산출 처리]의 선형 예측 계수로서 사용해도 된다. 또는, 선형 예측 역필터의 적용을 생략함으로써 선형 예측 계수의 계산을 생략해도 된다. 또한, 복호 직전 프레임의 인접한, 제1 부호화 방식에 의해 부호화된 프레임(복호 직전 프레임의 전에 있는 프레임)에 대한 복호 과정에서 얻어진 내부 상태[이 내부 상태를 나타낸 정보는 기억 장치(20d)에 저장되어 있음]를 사용하여, 제1 복호부(24)의 내부 상태를 초기화해도 된다. 또한, 복호 직전 프레임의 복호 결과에 대하여 선형 예측 역필터를 적용하는 처리는, 프레임 전체에 대한 것이 아니고, 프레임의 일부분 만에 대한 것이라도 된다.

단계 S23 후에, 내부 상태 초기화법 특정부(26)는, 내부 상태 계산부(27)에 의해 산출된 내부 상태를 사용하여 제1 복호부(24)의 내부 상태를 초기화하거나, 또는 "0"으로 초기화하는 등의 미리 결정된 방법 중 어느 하나의 초기화 방법을, 복호 직전 프레임의 다중화된 부호에 포함되고 제1 복호부(24)의 내부 상태의 초기화 방법을 나타내는 보조 정보에 기초하여 특정한다(단계 S24). 그리고, 내부 상태 초기화법 특정부(26)는, 단계 S24에 있어서 특정한 초기화 방법에 따라, 제1 복호부(24)의 내부 상태를 초기화한다(단계 S25). 내부 상태 초기화법 특정부(26)에 의해 행해지는 제1 복호부(24)의 내부 상태의 초기화는, 내부 상태 계산부(27)에 의해 산출된 내부 상태를 사용하여, 제1 복호부(24)의 내부 상태를 초기화하는 처리이지만, 제1 부호화 방식에서의 잔차 신호로부터 출력 신호를 산출하는 제1 복호부(24)의 선형 예측 합성 필터의 내부 상태(지연 요소를 유지하는 값)를 초기화하는 처리를 포함해도 된다.

단계 S25에 있어서 내부 상태 초기화법 특정부(26)가 제1 복호부(24)의 내부 상태를 초기화한 후에, 제1 복호부(24)는, 제1 부호화 방식에 의해 복호 대상 프레임을 복호하고, 이 복호한 복호 대상 프레임(복호 음성?음악 신호)을 통신 장치(20e)를 통하여 출력한다(단계 S26).

그리고, 제1 복호부(24)의 내부 상태의 초기화 방법을 나타내는 보조 정보를 복호 직전 프레임의 부호로 다중화하지 않고, 제1 부호화 방식에서의 대상 부호화 프레임의 고정 부호장 게인, 또는 복호 직전 프레임에서의 복호 결과의 주기성을 분석한 결과 등을 사용하여[제1 복호부(24) 및 제2 복호부(25)와 부호기(복호 장치(20)에 내장되는 부호기 또는 제1 부호화부(13))와의 사이에서 공통으로 얻어지는 정보를 사용하여], 제1 복호부(24)의 내부 상태의 초기화 방법을 특정해도 된다. 또한, 내부 상태 초기화법 특정부(26)를 생략하고, 항상, 내부 상태 계산부(27)에 의해 산출된 내부 상태를 사용하여 제1 복호부(24)가 자체의 내부 상태를 초기화하는 구성이라도 된다. 이 경우, 초기화 방법을 나타내고 복호 직전 프레임의 부호로 다중화된 보조 정보를 사용할 필요는 없다. 또한, 내부 상태 계산부(27)의 동작과 내부 상태 초기화법 특정부(26)의 동작은, 복호 직전 프레임이 제2 부호화 방식에 의해 부호화되고, 복호 대상 프레임이 제1 부호화 방식에 의해 부호화된 경우의 동작으로 하고 있지만, 이것으로 한정되지 않고, 복호 대상 프레임이 제2 부호화 방식에 의해 부호화되고, 복호 대상 프레임의 직후의 프레임이 제1 부호화 방식에 의해 부호화되어 있는 것이 예측에 의해 이미 결정되어 있는 경우에, 내부 상태 계산부(27)와 내부 상태 초기화법 특정부(26)는, 각각, 제1 복호부(24)에 대한 내부 상태의 산출과 내부 상태 초기화 방법의 선택을 예측 정보에 기초하여 행해도 된다. 또한, 제1 부호화 방식과 제2 부호화 방식의 2가지 부호화 방식 사이에서 전환이 행해지는 구성을 예시했지만, 제1 부호화 방식과는 상이한 부호화 방식이 복수 존재하고, 3가지 이상의 부호화 방식 사이에서 전환이 행해지도록 구성해도 된다.

다음으로, 실시예에 따른 부호화 장치(10)의 작용 효과를 설명한다. 부호화 장치(10)는, 선형 예측 부호화 방식에 기초한 제1 부호화부(13)와, 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화부(14)를 구비하고, 제1 부호화부(13) 및 제2 부호화부(14)를 사용하여 소리 신호를 부호화한다. 부호화 장치(10)는, 또한 부호화 방식 전환부(12), 내부 상태 계산부(16) 및 내부 상태 초기화법 특정부(17)를 구비한다. 부호화 방식 전환부(12)는, 소리 신호에 포함되어 있고 부호화의 대상으로 되는 부호 대상 프레임을, 제1 부호화부(13) 또는 제2 부호화부(14) 중에서 어느 쪽에 의해 부호화할 것인지를 판정한다. 또한, 부호화 방식 전환부(12)는, 부호 대상 프레임을 제1 부호화부(13)에 의해 부호화할 것으로 판정한 경우에, 부호 대상 프레임의 직전에 있는 부호 직전 프레임이 제1 부호화부(13)에 의해 부호화되어 있는지, 또는 제2 부호화부(14)에 의해 부호화되어 있는지를 판정한다. 내부 상태 계산부(16)는, 부호 직전 프레임이 제2 부호화부(14)에 의해 부호화되어 있는 것으로 부호화 방식 전환부(12)에 의해 판정된 경우에, 부호 직전 프레임의 부호화 결과를 복호하고, 이 복호 결과를 사용하여 제1 부호화부(13)의 내부 상태를 산출한다. 내부 상태 초기화법 특정부(17)는, 내부 상태 계산부(16)에 의해 산출된 내부 상태를 사용하여 제1 부호화부(13)의 내부 상태를 초기화한다. 그리고, 제1 부호화부(13)는, 내부 상태 초기화법 특정부(17)에 의하여 내부 상태가 초기화된 후에 부호 대상 프레임을 부호화한다.

부호화 장치(10)에 의하면, 선형 예측 부호화 방식에 기초한 제1 부호화부(13)에 의해 부호화되는 부호 대상 프레임의 앞의 부호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 부호화부(14)에 의해 부호화된 경우라도, 제1 부호화부(13)의 내부 상태를 초기화함으로써, 부호 대상 프레임의 부호화를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 부호화 처리를 실현할 수 있다.

다음으로, 실시예에 따른 복호 장치(20)의 작용 효과를 설명한다. 복호 장치(20)는, 선형 예측 부호화 방식에 기초한 제1 복호부(24)와, 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호부(25)를 구비하고, 제1 복호부(24) 및 제2 복호부(25)를 사용하여 부호화 소리 신호를 복호한다. 복호 장치(20)는, 또한 부호화 방식 판정부(22), 내부 상태 계산부(27) 및 내부 상태 초기화법 특정부(26)를 구비한다. 부호화 방식 판정부(22)는, 부호화 소리 신호에 포함되어 있고 복호의 대상으로 되는 복호 대상 프레임을, 제1 복호부(24) 또는 제2 복호부(25) 중 어느 쪽에 의해 복호할 것인지를 판정한다. 또한, 부호화 방식 판정부(22)는, 복호 대상 프레임을 제1 복호부(24)에 의해 복호할 것으로 부호화 방식 판정부(22)에 의해 판정된 경우에, 복호 대상 프레임의 직전에 있는 복호 직전 프레임이 제1 복호부(24)에 의해 복호되었는지, 또는 제2 복호부(25)에 의해 복호되었는지를 판정한다. 복호 직전 프레임이 제2 복호부(25)에 의해 복호된 것으로 부호화 방식 판정부(22)에 의해 판정된 경우에, 복호 직전 프레임의 복호 결과를 사용하여 제1 복호부(24)의 내부 상태를 산출한다. 내부 상태 계산부(27)에 의해 산출된 내부 상태를 사용하여 제1 복호부(24)의 내부 상태를 초기화한다. 그리고, 제1 복호부(24)는, 내부 상태 초기화법 특정부(26)에 의하여 내부 상태를 초기화한 후에 복호 대상 프레임을 복호한다.

복호 장치(20)에 의하면, 선형 예측 부호화 방식에 기초한 제1 복호부(24)를 사용하여 복호하는 복호 대상 프레임의 앞의 복호 직전 프레임이, 이 선형 예측 부호화 방식과는 상이한 부호화 방식에 기초한 제2 복호부(25)에 의해 복호된 경우라도, 제1 복호부(24)의 내부 상태를 초기화함으로써, 복호 대상 프레임의 복호를 선형 예측 부호화 방식에 의해 행할 수 있다. 따라서, 선형 예측 부호화 방식과, 선형 예측 부호화 방식과는 상이한 부호화 방식을 포함하는 복호 처리를 실현할 수 있다.

[산업상 이용 가능성]

선형 예측을 사용하지 않는 부호화 방식으로부터 선형 예측 부호화에 기초한 부호화 방식으로의 전환을 행하는 경우에, 선형 예측 부호화에 기초한 부호화 방식의 부호 수단 또는 복호 수단의 내부 상태의 초기값을 적절한 값으로 설정하고, 전환 직후의 프레임에서의 음성 품질을 개선할 수 있다.

10: 부호화 장치 10a, 20a: CPU
10b, 20b: ROM 10c, 20c: RAM
10d, 20d: 기억 장치 10e, 20e: 통신 장치
10f, 20f: 버스 12: 부호화 방식 전환부
13: 제1 부호화부 14: 제2 부호화부
15: 부호 다중화부 16, 27: 내부 상태 계산부
17, 26: 내부 상태 초기화법 특정부
20: 복호 장치 22: 부호화 방식 판정부
23: 부호 분리부 24: 제1 복호부
25: 제2 복호부

Claims

선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 부호화 수단을 사용하여, 복수의 프레임으로 이루어지는 소리 신호를 부호화하는 소리 신호 부호화 방법으로서,
상기 소리 신호의 제1 프레임이 상기 제2 부호화 수단에 의해 부호화된 후에, 상기 제1 프레임의 직후에 있는 제2 프레임을 부호화하는 부호화 수단을 상기 제2 부호화 수단으로부터 상기 제1 부호화 수단으로 전환하는 전환 단계; 및
상기 전환 단계의 후에만, 상기 제1 부호화 수단의 내부 상태를 소정의 방법에 의해 초기화하는 초기화 단계
를 포함하고,
상기 초기화 단계에서는, 상기 제2 부호화 수단에 의한 상기 제1 프레임의 부호화 결과를 복호하여 복호 결과를 구하고, 상기 복호 결과로부터 잔차(殘差) 신호를 구하고, 상기 잔차 신호에 의해 상기 제1 부호화 수단의 내부 상태로서 상기 제1 부호화 수단의 적응 부호장(符號帳)을 초기화 하는, 소리 신호 부호화 방법.
선형 예측 부호화 방식에 기초한 제1 복호 수단과, 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 복호 수단을 사용하여, 복수의 프레임으로 이루어지는 부호화 소리 신호를 복호하는 소리 신호 복호 방법으로서,
상기 부호화 소리 신호의 제1 프레임이 상기 제2 복호 수단에 의해 복호된 후에, 상기 제1 프레임의 직후에 있는 제2 프레임을 복호하는 복호 수단을 상기 제2 복호 수단으로부터 상기 제1 복호 수단으로 전환하는 전환 단계; 및
상기 전환 단계의 후에만, 상기 제1 복호 수단의 내부 상태를 소정의 방법에 의해 초기화하는 초기화 단계
를 포함하고,
상기 초기화 단계에서는, 상기 제1 프레임의 복호 결과로부터 잔차(殘差) 신호를 구하고, 상기 잔차 신호에 의해 상기 제1 복호 수단의 내부 상태로서 상기 제1 복호 수단의 적응 부호장(符號帳)을 초기화하는, 소리 신호 복호 방법.
선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 상기 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 부호화 수단을 구비하고, 상기 제1 부호화 수단 및 상기 제2 부호화 수단을 사용하여 소리 신호를 부호화하는 부호화 장치로서,
상기 소리 신호에 포함되어 있고 부호화의 대상으로 되는 대상 프레임을, 상기 제1 부호화 수단 또는 상기 제2 부호화 수단 중 어느 쪽에 의해 부호화할 것인지를 판정하는 제1 판정 수단;
상기 대상 프레임을 상기 제1 부호화 수단에 의해 부호화할 것으로 상기 제1 판정 수단에 의해 판정된 경우에, 상기 대상 프레임의 직전에 있는 직전 프레임이 상기 제1 부호화 수단에 의해 부호화되어 있는지, 또는 상기 제2 부호화 수단에 의해 부호화되어 있는지를 판정하는 제2 판정 수단;
상기 직전 프레임이 상기 제2 부호화 수단에 의해 부호화되어 있는 것으로 상기 제2 판정 수단에 의해 판정된 경우에만, 상기 직전 프레임의 부호화 결과를 복호하고, 이 복호 결과로부터 잔차(殘差) 신호를 산출하는 내부 상태 계산 수단; 및
상기 내부 상태 계산 수단에 의해 산출된 상기 잔차 신호를 사용하여 상기 제1 부호화 수단의 적응 부호장(符號帳)을 초기화하는 초기화 수단
을 포함하고,
상기 제1 부호화 수단은, 상기 초기화 수단에 의한 상기 적응 부호장의 초기화 후에 상기 대상 프레임을 부호화하는, 부호화 장치.
선형 예측 부호화 방식에 기초한 제1 복호 수단과, 상기 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 복호 수단을 구비하고, 상기 제1 복호 수단 및 상기 제2 복호 수단을 사용하여 부호화 소리 신호를 복호하는 복호 장치로서,
상기 부호화 소리 신호에 포함되어 있고 복호의 대상으로 되는 대상 프레임을, 상기 제1 복호 수단 또는 상기 제2 복호 수단 중 어느 쪽에 의해 복호할 것인지를 판정하는 제1 판정 수단;
상기 대상 프레임을 상기 제1 복호 수단에 의해 복호하는 것으로 상기 제1 판정 수단에 의해 판정된 경우에, 상기 대상 프레임의 직전에 있는 직전 프레임이 상기 제1 복호 수단에 의해 복호되었는지, 또는 상기 제2 복호 수단에 의해 복호되었는지를 판정하는 제2 판정 수단;
상기 직전 프레임이 상기 제2 복호 수단에 의해 복호된 것으로 상기 제2 판정 수단에 의해 판정된 경우에만, 상기 직전 프레임의 복호 결과로부터 잔차(殘差) 신호를 산출하는 내부 상태 계산 수단; 및
상기 내부 상태 계산 수단에 의해 산출된 상기 잔차 신호를 사용하여 상기 제1 복호 수단의 적응 부호장(符號帳)을 초기화하는 초기화 수단
을 포함하고,
상기 제1 복호 수단은, 상기 초기화 수단에 의한 상기 적응 부호장의 초기화 후에 상기 대상 프레임을 복호하는, 복호 장치.
제3항에 기재된 부호화 장치와, 제4항에 기재된 복호 장치를 구비하고,
상기 복호 장치는, 상기 부호화 장치에 의해 부호화된 부호화 소리 신호를 복호하는, 소리 신호 처리 시스템.
선형 예측 부호화 방식에 기초한 제1 부호화 수단과, 상기 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 부호화 수단을 사용하여 소리 신호를 부호화하기 위하여, 컴퓨터 장치를,
상기 소리 신호에 포함되어 있고 부호화의 대상으로 되는 대상 프레임을 상기 제1 부호화 수단 또는 상기 제2 부호화 수단 중 어느 쪽에 의해 부호화할 것인지를 판정하는 제1 판정 수단;
상기 대상 프레임을 상기 제1 부호화 수단에 의해 부호화할 것으로 상기 제1 판정 수단에 의해 판정된 경우에, 상기 대상 프레임의 직전에 있는 직전 프레임이 상기 제1 부호화 수단에 의해 부호화되어 있는지, 또는 상기 제2 부호화 수단에 의해 부호화되어 있는지를 판정하는 제2 판정 수단;
상기 직전 프레임이 상기 제2 부호화 수단에 의해 부호화되어 있는 것으로 상기 제2 판정 수단에 의해 판정된 경우에만, 상기 직전 프레임의 부호화 결과를 복호하고, 이 복호 결과로부터 잔차(殘差) 신호를 산출하는 내부 상태 계산 수단;
상기 내부 상태 계산 수단에 의해 산출된 상기 잔차 신호를 사용하여 상기 제1 부호화 수단의 적응 부호장(符號帳)을 초기화하는 초기화 수단; 및
상기 초기화 수단에 의해 상기 적응 부호장의 초기화를 행한 후에 상기 제1 부호화 수단이 상기 대상 프레임을 부호화하는 부호화 수단
으로서 기능하게 하는, 소리 신호 부호화 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
선형 예측 부호화 방식에 기초한 제1 복호 수단과, 상기 선형 예측 부호화 방식과 상이한 부호화 방식에 기초한 제2 복호 수단을 사용하여 부호화 소리 신호를 복호하기 위하여, 컴퓨터 장치를,
상기 부호화 소리 신호에 포함되어 있고 복호의 대상으로 되는 대상 프레임을 상기 제1 복호 수단 또는 상기 제2 복호 수단 중 어느 쪽에 의해 복호할 것인지를 판정하는 제1 판정 수단;
상기 대상 프레임을 상기 제1 복호 수단에 의해 복호할 것으로 상기 제1 판정 수단에 의해 판정된 경우에, 상기 대상 프레임의 직전에 있는 직전 프레임이 상기 제1 복호 수단에 의해 복호되었는지, 또는 상기 제2 복호 수단에 의해 복호되었는지를 판정하는 제2 판정 수단;
상기 직전 프레임이 상기 제2 복호 수단에 의해 복호된 것으로 상기 제2 판정 수단에 의해 판정된 경우에만, 상기 직전 프레임의 복호 결과로부터 잔차(殘差) 신호를 산출하는 내부 상태 계산 수단;
상기 내부 상태 계산 수단에 의해 산출된 상기 잔차 신호를 사용하여 상기 제1 복호 수단의 적응 부호장(符號帳)을 초기화하는 초기화 수단; 및
상기 초기화 수단에 의해 상기 적응 부호장의 초기화를 행한 후에 상기 제1 복호 수단이 상기 대상 프레임을 복호하는 복호 수단
으로서 기능하게 하는, 소리 신호 복호 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.