KR20060105493A

KR20060105493A - 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용프로그램을 기록하는 기록 매체

Info

Publication number: KR20060105493A
Application number: KR1020060027942A
Authority: KR
Inventors: 아쯔시 무라시마
Original assignee: 닛본 덴끼 가부시끼가이샤
Priority date: 2005-03-29
Filing date: 2006-03-28
Publication date: 2006-10-11
Also published as: KR100796836B1; EP1708174A2; DE602006001889D1; US20060222084A1; CN1841499A; EP1708174A3; JP2006276476A; JP4793539B2; CA2539675A1; US8374852B2; EP1708174B1

Abstract

제1 음성 코딩 방식을 따르는 제1 코드 시퀀스를 제2 음성 코딩 방식을 따르는 제2 코드 시퀀스로 변환시키는 코드 변환 방법이 개시된다. 이 방법은 다음의 단계들을 포함한다. 제1 단계는 제1 코드 시퀀스가 음성부에 대응하는지 비-음성부에 대응하는지를 식별하고, 이 식별 결과를 제어 플래그로서 나타내는 수치를 생성한다. 제2 단계는 제어 플래그의 값이 음성부에 대응한다면 제1 코드 시퀀스를 제2 코드 시퀀스로 변환하고 상기 제2 코드 시퀀스를 출력한다. 제3 단계는 제어 플래그의 값이 비-음성부에 대응한다면, 제어 플래그의 값에 대응하는 제2 코드 시퀀스를 출력한다.

음성 코딩 방식, 코드 변환 장치, 인코더

Description

코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램을 기록하는 기록 매체{APPARATUS AND METHOD OF CODE CONVERSION AND RECORDING MEDIUM THAT RECORDS PROGRAM FOR COMPUTER TO EXECUTE THE METHOD}

도 1은 관련 기술의 코드 변환 장치를 도시하는 블럭도.

도 2는 본 발명의 코드 변환 장치의 제1 실시예를 도시하는 블럭도.

도 3은 AMR 음성 코딩 방식에 따른 페이로드 유형, 페이로드 사이즈 및 프레임 유형 간의 관계를 도시하는 도면.

도 4는 본 발명의 코드 변환 장치의 제2 실시예를 도시하는 블럭도.

도 5는 본 발명의 코드 변환 장치의 제3 실시예를 도시하는 블럭도.

도 6은 본 발명의 코드 변환 장치의 제4 실시예를 도시하는 블럭도.

도 7은 본 발명의 코드 변환 장치의 제5 실시예를 도시하는 블럭도.

<도면의 주요 부분에 대한 부호의 설명>

1050: 음성 디코딩 회로

1060: 음성 인코딩 회로

1100: 코드 시퀀스 변환 회로

1300: 식별 회로

1400: 코드 시퀀스 생성 회로

2100: 제2 코드 시퀀스 변환 회로

3000: 코드 시퀀스 출력 회로

본 발명은 음성 신호들을 저 비트율로 전송하거나 저장하기 위한 인코딩 및 디코딩 기술에 관한 것으로, 보다 상세히는 제1 음성 코딩 방식에 의해 음성 신호를 인코딩함으로써 획득한 제1 코드 시퀀스를 다른 음성 코딩 방식에 의해 디코딩될 수 있는 제2 코드 시퀀스로 변환시키기 위한 코드 변환(트랜스코딩(transcoding)) 기술에 관한 것이다.

CELP(Code Excited Linear Prediction)는 음성 신호를 중간 비트율 및 저 비트율로 효율적으로 인코딩하는 음성 코딩 방식 중 하나로서 잘 알려져 있다. 이 CELP 방식은 [1] 1985년 발표된 "Proc. of IEEE Int. Conf. on Acoustics, Speech and Signal Processing"의 pp. 937-940에 기재되고 "M. R. Schroeder" 및 "B. S. Atal"이 저술한 "Code excited linear prediction: high quality speech at very low bit rates"에 기술되어 있다.

CELP 방식에 따르면, 인코더는 입력 음성 신호로부터, 선형 예측 필터를 특성화(characterizing)하기 위한 LP(Linear Prediction) 계수 및 이러한 LP 필터를 여기하기 위한(exciting) 여기 신호를 분리시킨다. 인코더는 이 LP 계수 및 여기 신호를 인코딩하고 이들을 디코더로 전송한다. 디코더는 수신된 LP 계수를 자신의 LP 필터에 설정하고 수신된 여기 신호로 이러한 LP 필터를 여기시켜 고품질 음성 신호를 산출한다.

이러한 여기 신호는 ACB(Adaptive Codebook) 및 FCB(Fixed Codebook)의 가중된 합에 의해 표현된다. ACB는 입력 음성 신호의 핀치(pinch) 기간을 포함하는 한편, FCB는 난수 및 펄스로 구성된다. ACB 및 FCB 성분을 이들 각자의 이득(gain)(ACB 이득 및 FCB 이득)으로 곱함으로써 여기 신호를 산출한다.

3G(제3 세대) 모바일 네트워크 및 유선 패킷 네트워크가, 예를 들어, 상호접속되어야 하는 경우, 이들 네트워크에 이용된 표준 음성 코딩 방식들은 서로 다를 수 있다. 그러므로, 이들 2개의 네트워크의 직접적인 접속을 수행하기 위해서는, 서로 다른 음성 코딩 방식들 간의 코드 변환 기술(즉, 트랜스코딩)이 필요할 것이다. 직렬 접속(tandem connection)은 음성 코딩을 위한 트랜스코딩 기술 중 하나로서 알려져 있다.

도 1은 종래의 직렬 접속에 기초하는 코드 변환 장치를 도시한다. 이러한 코드 변환 장치는 제1 음성 코딩 방식에 의해 산출된 제1 코드 시퀀스를 제2 음성 코딩 방식에 의해 디코딩해야 할 제2 코드 시퀀스로 변환한다.

도 1을 참조하면서, 종래의 코드 변환 장치를 이하에서 기술하기로 한다. 코드 시퀀스는 음성 코딩 및 디코딩의 처리 단위인 프레임 기간(예를 들면, 20초)으로 입력되고 출력된다. 후술될 바와 같이, 각 프레임은 헤더 및 페이로드로 구성된다.

도 1에서, 코드 시퀀스 변환 회로(1100)는 음성 디코딩 회로(1050) 및 음성 인코딩 회로(1060)로 구성된다. 음성 디코딩 회로(1050)는 입력 단자(10)에 제공된 제1 코드 시퀀스를 제1 음성 코딩 방식에 의해 디코딩한다. 음성 인코딩 회로(1060)는 음성 디코딩 회로(1050)로부터 출력되는 디코딩된 음성 신호를 제2 음성 코딩 방식에 의해 인코딩(또는 재-인코딩)하여 제2 코드 시퀀스를 생성한다.

음성 인코딩 및 디코딩 방식에 관련하여, 상기 참조문헌 [1] 및 참조문헌 [2] 3GPP TS 26.090 "AMR Speech Codec; Transcoding Functions"에 상세한 설명이 기술되어 있다.

그러나, 도 1의 코드 변환 장치는 코드 변환을 수행하기 위하여 상당량의 처리를 필요로 한다. 그 이유는 이러한 코드 변환 장치에서 음성 디코딩 회로는 제1 코드 시퀀스를 디코딩하고 이 디코딩된 음성 신호를 재-인코딩해야하기 때문이다.

US2003/0065506A(참조문헌 [3])는 제1 코드 시퀀스 내의 비-음성부를 디코딩하지 않고 제1 입력 코드 시퀀스를 제2 음성 코딩 방식의 코드 시퀀스로 변환하는 코드 변환 장치를 개시한다.

이러한 코드 변환 장치에서, 코드 분리부는 제1 코드 시퀀스 내의 비-음성 코드를 복수의 엘리먼트 코드들로 분리시키고, 비-음성 코드 변환부는 이들 엘리먼트 코드를 제2 음성 코딩 방식을 위한 복수의 엘리먼트 코드들로 변환한다. 이러한 코드 변환 장치는 이러한 변환에 의해 획득한 제2 엘리먼트 코드들을 멀티플렉싱(multiplex)하여 제2 비-음성 코드 시퀀스를 산출한다. 코드 변환 장치는 또한 음성 코드 변환부에 의해 변환되는 제2 음성 코드 시퀀스와 이 제2 비-음성 코드 시퀀스를 멀티플렉싱하여 제2 코드 시퀀스를 출력한다.

이 코드 변환 장치는 제1 비-음성 코드 시퀀스를 제2 비-음성 코드 시퀀스로 변환하는 비-음성 코드 변환 회로를 필요로 한다. 이러한 비-음성 코드 변환은 상당량의 처리를 필요로 한다. 예를 들면, AMR 방식을 따르는 비-음성 코드 시퀀스가 ITU-T 권고 G.729를 따르는 비-음성 코드 시퀀스로 변환되어야 하는 경우를 고려하자. 각각의 코드 시퀀스는 스펙트럼 엔벨로프(envelope)를 나타내는 LP 계수 정보 및 CN(comfortable noise) 정보로서의 매 프레임에 대한 전력(power) 정보를 포함한다.

그러나, AMR 방식용 인코더는 매 8개의 프레임마다 LP 계수 및 전력 정보의, 8개의 프레임들에 대한 평균값을 전송한다. 반면에, G.729용 인코더는 LP 계수 정보의 현재 프레임에 대한 이전 6개의 프레임 또는 값에 대한 평균값을 비주기적으로 전송한다. G.729용 인코더는 또한 전력 정보의 현재 프레임에 대한 이전의 3개의 프레임 또는 값에 대한 평균값을 전송한다.

즉, 이들 2개의 음성 코딩 방식들 간에는, CN 정보에 대한 구체적인 코드들 뿐만 아니라 각 엘리먼트 코드에 대한 전송 간격들까지도 서로 다르게 된다. 그러므로, 참조문헌 [3]에 제시된 비-음성 코드 변환 회로는 엘리먼트 코드들을 변환시키기 위하여 상당량의 처리를 필요로 한다.

본 발명의 제1 예시적인 특징은 상술한 코드 변환시 처리량이 감소한 코드 변환 장치를 제공한다.

본 발명의 제1 예시적인 양태에 따르면, 제1 음성 코딩 방식을 따르는 제1 코드 시퀀스를 제2 음성 코딩 방식을 따르는 제2 코드 시퀀스로 변환시키는 코드 변환 방법이 제공된다. 이 방법은 다음의 단계들을 포함한다. 제1 단계는 제1 코드 시퀀스가 음성부에 대응하는지 비-음성부에 대응하는지를 식별하고, 이 식별 결과를 제어 플래그로서 나타내는 수치를 생성한다. 제2 단계는 제어 플래그의 값이 음성부에 대응한다면 제1 코드 시퀀스를 제2 코드 시퀀스로 변환하고 상기 제2 코드 시퀀스를 출력한다. 제3 단계는 제어 플래그의 값이 비-음성부에 대응하면 제어 플래그의 값에 대응하는 제2 코드 시퀀스를 출력한다.

본 발명의 제1 예시적인 양태는, 제1 음성 코딩 방식을 따르는 제1 코드 시퀀스가 제2 음성 코딩 방식을 따르는 제2 코드 시퀀스로 변환될 때, 비-음성 코드에 관련된 처리량을 줄여준다. 그 이유는 본 발명의 제1 예시적인 양태가, 제1 코드 시퀀스로부터 획득한 정보에 기초하여, 코드 시퀀스가 음성부에 대응하는지 비-음성부에 대응하는지를 식별하기 때문이다. 이 식별 결과를 나타내는 수치는 제어 플래그로서 생성된다. 본 발명의 제1 예시적인 양태는 이 제어 플래그의 값에 기초하여 제2 코드 시퀀스의 비-음성부를 생성한다. 본 발명의 제1 예시적인 양태에 따른 비-음성부 코드 시퀀스의 변환은 제1 음성 코딩 방식에 의해 디코딩하는 것 및 제2 음성 코딩 방식에 의해 재-인코딩하는 것으로 구성되는 프로세스가 필요하지 않다.

본 발명의 제1 예시적인 양태에서는 참조문헌 [2]가 제시한 비-음성부 코드 시퀀스가 다른 음성 코딩 방식의 비-음성부 코드 시퀀스로 변환되는 변환 프로세스에 비하여 처리량이 상당히 줄어든다. 그 이유는 본 발명의 제1 예시적인 양태가 제1 비-음성 코드 시퀀스를 제2 음성 코딩 방식의 비-음성 코드 시퀀스로 변환시키지 않지만 제1 코드 시퀀스로부터 획득한 코드 시퀀스의 유형을 나타내는 정보에 기초하여 제2 음성 코딩 방식의 비-음성부에 대응하는 코드 시퀀스를 생성하기(또는 이전에 저장된 코드 시퀀스를 산출하기) 때문이다. 그러므로, 코드 변환에 필요한 계산량이 상당히 줄어들 수 있다.

본 발명의 다른 특징 및 양태는 바람직한 실시예의 설명으로부터 명백해질 것이다.

본 발명의, 상술한 목적 및 다른 목적, 새로운 특징 및 이점은 첨부된 도면과 함께 이하 상세한 설명을 읽음으로써 보다 완전하게 이해될 것이다.

먼저, 본 발명의 개관 및 원리가 설명된다.

이하 설명에서, "비-음성"이란 목소리 및 음악과는 다른 소리를 의미한다. "비-음성"은 무음, 잡음, 톤, 등을 포함한다.

본 발명의 방법은 이하의 기본적인 단계를 가진다.

[단계 A] 이 단계는 제1 코드 시퀀스의 각 프레임에 포함된 정보를 이용하여, 프레임 내의 제1 코드 시퀀스가 음성부에 대응하는지 비-음성부에 대응하는지를 식별하고, 이 식별 결과를 나타내는 제어 플래그를 생성한다.

[단계 B] 이 단계는 제어 플래그가 음성부를 나타낸다면 제1 코드 시퀀스를 제2 코드 시퀀스로 변환한다.

[단계 C] 이 단계는 제어 플래그가 비-음성부를 나타낸다면, 제어 플래그의 값에 대응하는 제2 코드 시퀀스를 생성한다. 단계 C는 비-음성의 유형 정보에 대응하는 이전에-저장된 제2 코드 시퀀스를 판독하고 출력할 수 있다.

단계 A는 이하의 단계 A1 및 A2로 대체될 수 있다.

[단계 A1] 이 단계는 제1 디코딩 방법으로 제1 코드 시퀀스로부터 음성 신호를 디코딩한다.

[단계 A2] 이 단계는 디코딩된 음성 신호를 이용하여, 상기 제1 코드 시퀀스가 음성부에 대응하는지 비-음성부에 대응하는지를 나타내는 제어 플래그를 생성한다.

본 발명은, 제1 코드 시퀀스로부터 획득한 정보에 기초하여, 제1 코드 시퀀스가 음성부 및 비-음성부 중 어느 것에 대응하는지 나타내는 유형 정보를 식별한다. 또한, 본 발명은 비-음성부의 유형 정보를 식별한다. 비-음성부의 유형의 개수가 오직 1개라면, 이 비-음성부에 대한 제어 플래그의 값의 개수는 1개이다. 제1 코드 시퀀스가 비-음성부에 대응한다면, 본 발명은, 이러한 제어 플래그의 값에 기초하여, 코드 변환의 처리(제1 음성 코딩 방식에 의해 디코딩하고 디코딩된 신호를 제2 음성 코딩 방식에 의해 재-인코딩하는 것)는 수행하지 않으면서, 제2 음성 코딩 방식의 비-음성 코드 시퀀스를 생성한다.

그러므로, 본 발명은, 전체 코드 시퀀스에 대한 비-음성부의 비에 따라, 제1 코드 시퀀스를 제1 음성 코딩 방식의 음성 디코딩 회로로 디코딩하고 그 다음 상기 디코딩에 의해 획득한 음성 신호를 제2 음성 코딩 방식의 음성 인코딩 회로로 재-인코딩하는 데에 필요한 처리량을 줄인다. 일반적으로, 비-음성부에 대한 시간 비 는 음성부에 대한 시간 비보다 크다. 그러므로, 음성부가 직렬 접속에서와 같이 디코딩되고 재-인코딩되는 경우에서도, 본 발명에 의해 실현되는 요구되는 처리량에 있어서의 감소의 효과가 두드러진다.

또한, 본 발명은 참조문헌 [3]의 기술에 필수적인 프로세스, 즉 엘리먼트 코드들을 분리하고, 분리된 엘리먼트 코드들을 변환하며, 변환된 엘리먼트 코드들을 멀티플렉싱하기 위한 프로세스를 필요로 하지 않는다. 따라서, 본 발명은 비-음성 코드 시퀀스를 변환시키는 데에 필요한 시간을 줄일 수 있다.

실시예 1

본 발명의 실시예 1은 실시예 1의 구조를 도시하는 블럭도인 도 2를 참조하여 보다 상세히 기술될 것이다.

도 2에서, 종래의 기술의 일례에 대한 도 1에 나타난 것과 동일하거나 등가인 구성요소는 동일한 참조 번호로 표기된다. 도 2에서, 입력 단자(10), 출력 단자(20), 음성 디코딩 회로(1050), 및 음성 인코딩 회로(1060)는 시작 상태가 도 1의 상태와 다르다는 점을 제외하고는 기본적으로 도 1에 도시된 구성요소와 동일한 기능을 제공한다. 이하의 실시예 1에서는 상술한 것과 동일하거나 등가 구성요소의 설명은 생략하고 도 1에 도시된 구성요소들과 구조에 있어서의 차이점에 대해 중점적으로 설명하기로 한다. 즉, 이하의 설명은 프레임 유형 추출 회로(1200), 식별 회로(1300), 코드 시퀀스 생성 회로(1400), 제1 스위치(1110) 및 제2 스위치(1120)에 초점을 맞추어 실시예 1을 설명한다.

프레임 유형 추출 회로(1200)는 입력 단자(10)에 제공된 제1 코드 시퀀스로 부터 헤더와 페이로드를 분리한다. 그 다음, 프레임 유형 추출 회로(1200)가 이 헤더로부터 프레임 유형 정보를 추출하고, 이러한 프레임 유형 정보를 식별 회로(1300)에 출력한다.

식별 회로(1300)는 프레임 유형 추출 회로(1200)로부터 프레임 유형 정보를 수신한다. 식별 회로(1300)는 이 프레임 유형 정보에 기초하여 제어 플래그를 생성한다. 식별 회로(1300)는 이 제어 플래그를 제1 스위치(1110), 제2 스위치(1120) 및 코드 시퀀스 생성 회로(1400)에 출력한다. 프레임 유형 정보가 음성부를 나타낸다면, 식별 회로(1300)는 제어 플래그를 값 "0"으로 출력한다. 프레임 유형 정보가 잡음을 나타낸다면, 식별 회로(1300)는 제어 플래그를 값 "1"로 출력한다. 프레임 유형 정보가 무음임을 나타낸다면, 식별 회로(1300)는 제어 플래그를 값 "2"로 출력한다. 즉, 프레임 유형 정보에 기초하여, 실시예 1은 프레임 내의 제1 코드 시퀀스의 유형 정보를 획득한다.

일반적으로, 제1 코드 시퀀스는 헤더 및 페이로드를 포함한다. 헤더가 프레임 유형 정보를 포함하기 때문에, 식별 회로는 제1 코드 시퀀스를 디코딩하지 않고 프레임 내의 제1 코드 시퀀스로부터 디코딩된 신호가 음성부에 대응하는지 비-음성부(무음 또는 잡음)에 대응하는지 식별할 수 있다.

헤더 및 프레임 유형 정보는 [4] 3GPP TS 26.101의 "AMR Speech Codec Frame Structure"에 상세히 기술된다.

프레임 유형 정보가 음성을 나타낼 때, 페이로드는 음성 신호를 나타내는 파라미터(음성 파라미터)에 대응하는 코드 시퀀스를 포함한다. 여기서, 음성 파라미 터는, 예를 들면, LP 계수, ACB, FCB, ACB 이득 및 FCB 이득을 포함한다. 반면에, 프레임 유형 정보가 비-음성을 나타낸다면, 페이로드는 잡음을 나타내는 코드 시퀀스(잡음 파라미터)를 포함한다. 잡음 파라미터는, 예를 들면, LP 계수 및 프레임 에너지를 포함한다.

비-음성에 대한 페이로드의 사이즈는 음성에 대한 페이로드 사이즈보다 작거나 0이다. 즉, 음성부에 대한 페이로드의 사이즈와 비-음성부에 대한 페이로드의 사이즈는 서로 다른 값을 가진다.

그러므로, 프레임 유형 정보를 식별하는 대신에 제1 코드 시퀀스의 프레임의 사이즈 또는 페이로드의 사이즈를 식별함으로써, 실시예 1의 식별 회로는 각 프레임에 대하여 제1 코드 시퀀스로부터 디코딩된 신호가 음성부에 대응하는지 비-음성부에 대응하는지를 식별할 수 있다.

상기 참조 문헌 [4]에 따르면, 음성 신호가 12.2kbit/s의 비트율로 인코딩되는 경우, 페이로드의 유형(음성, 비-음성 또는 무음), 페이로드의 사이즈 및 프레임 유형 간의 관계는 도 3에 제시된 바와 같다.

도 2에서, 제1 스위치(1110)는 입력 단자(10)로부터 제1 코드 시퀀스를 수신하고 식별 회로(1300)로부터 제어 플래그를 수신한다. 제어 플래그가 (음성을 나타내는) 0이라면, 제1 스위치는 음성 디코딩 회로(1050)에 제1 코드 시퀀스를 출력한다. 제어 플래그가 (잡음을 나타내는) "1"이거나 (무음을 나타내는) "2"라면, 제1 스위치는 제1 코드 시퀀스를 출력하지 않는다.

여기서, 실시예 1은 제어 플래그가 "0" 또는 "1"일 경우 제1 스위치가 제1 코드 시퀀스를 음성 디코딩 회로(1050)에 출력하도록 수정될 수 있다.

실시예 1의 코드 시퀀스 변환 회로(1100)가 도 1의 코드 시퀀스 변환 회로와 유사한 구조를 가지지만, 도 2의 코드 시퀀스 변환 회로(1100)는 제1 스위치로부터 제공된 제1 코드 시퀀스만을, 음성 디코딩 회로(1050)로 디코딩하고 음성 인코딩 회로(1060)로 재-인코딩한다.

코드 시퀀스 생성 회로(1400)는 비-음성부의 제1 코드 시퀀스에 대응하는 제2 코드 시퀀스를 생성하고, 이 제2 코드 시퀀스를 제2 스위치(1120)에 출력한다. 여기서, "비-음성부의 제1 코드 시퀀스에 대응하는 제2 코드 시퀀스를 생성하는 것"은 "제어 플래그의 값에 대응하는 잡음, 무음, 톤에 대한 제2 코드 시퀀스를 생성하는 것"을 의미한다.

다음에, 제어 플래그가 무음을 나타내는 경우를 설명한다. 제2 비-음성 코드 시퀀스를 생성할 때, 코드 시퀀스 생성 회로(1400)는 제어 플래그의 값을 참조한다.

예를 들면, 제2 음성 코딩 방식이 3GPP AMR 코덱을 따르는 경우, 무음에 대한 페이로드의 사이즈는 상술한 바와 같이 0비트이다. 이러한 경우, 생성된 제2 코드 시퀀스는 헤더(프레임 유형은 15)만으로 구성된다.

또한, 예를 들어, 제2 음성 코딩 방식이 ITU-T 권고 G.711을 따르는 경우, 무음을 나타내는 코드는 0xFF이며 페이로드는 그 개수가 프레임 길이에 대응하는 샘플들의 개수와 동일한 0xFF로 구성된다. 예를 들면, 프레임 길이가 20 msec이고 샘플링 주파수가 8000 Hz인 경우, 프레임 길이에 대응하는 샘플들의 개수는 160이 되도록 계산된다. 그러므로, 이러한 경우의 페이로드는 160 0xFF 코드를 포함하는 1280 비트 데이터이다.

G.711은 [5] ITU-T 권고 G.711의 "pulse Code Modulation(PCM) of Voice Frequencies"에 상세히 기술되어 있다.

상술한 설명은 무음에 대한 제2 코드 시퀀스를 생성하는 예제에 관련된 것이지만, 이 실시예에서 잡음에 대한 제2 코드 시퀀스를 생성하는 것이 가능하다. 예를 들면, 코드 시퀀스 생성 회로(1400)는 내부적으로 제2 음성 코딩 방식을 따르는 이전에-인코딩된 잡음을 기억한다. 그 다음, 코드 시퀀스 생성 회로(1400)는 제어 플래그의 값에 따라서 이러한 인코딩된 잡음을 생성할 수 있다.

여기서, 제어 플래그 값이 "0"(음성)과는 다른 값이라면 코드 시퀀스 생성 회로는 소정의 치환 신호(예를 들면, 이 실시예의 상위 장치에 의해 결정된 치환 신호)에 대응하는 제2 코드 시퀀스를 출력하도록 수정될 수 있다. 예를 들면, 코드 시퀀스 생성 회로는 제어 플래그 값이 비-잡음부("무음", "잡음", 및 "톤" 등)를 나타내는 경우에도 "무음"에 대응하는 제2 코드 시퀀스를 출력하도록 수정될 수 있다. 또한, 코드 시퀀스 생성 회로는 제어 플래그 값이 비-음성부를 나타내는 경우에도 작은 진폭을 가지는 "잡음"에 대응하는 제2 코드 시퀀스를 출력하도록 수정될 수 있다.

도 2에서, 식별 회로(1300)에 의해 제공된 제어 플래그가 (음성을 나타내는) "0"이라면, 제2 스위치(1120)는 음성 인코딩 회로(1060)로부터 출력되는 제2 코드 시퀀스를 출력 단자(20)에 출력한다. 또한, 상기 플래그가 (잡음을 나타내는) "1" 이거나 (무음을 나타내는) "2"이거나 (톤을 나타내는) "3" 중 하나인 경우, 제2 스위치(1120)는 코드 시퀀스 생성 회로(1400)로부터 출력되는 제2 코드 시퀀스를 출력 단자(20)에 출력한다.

여기서, 상술한 바와 같이, 실시예 1은 제어 플래그가 "0" 또는 "1"인 경우 제2 스위치(1120)가 음성 인코딩 회로(1060)로부터 출력되는 제2 코드 시퀀스를 출력 단자(20)에 출력하도록 수정될 수 있다.

이 실시예는 음성 디코딩 회로 및 음성 인코딩 회로를 전혀 수정할 필요가 없기 때문에, 각자의 표준 코딩 방식들을 따르는 상기 음성 디코딩 회로 또는 상기 음성 인코딩 회로를 그대로 이용할 수 있다.

이 실시예는, 입력 음성 코딩 방식(제1 방식)과 출력 음성 코딩 방식(제2 방식)이 동일한 종류인 경우에 또는 서로 다른 종류인 경우에도 처리량을 줄이는 효과가 발생한다. 예를 들면, 입력 음성 코딩 방식과 출력 음성 코딩 방식이 동일한 종류인 경우, 이는 비트율을 변경시키는 것에 대응한다. 이러한 경우에서도, 실시예 1은 비-음성부에 대한 처리량을 줄인다.

또한, 제1 코드 시퀀스의 제1 코딩 방식이 제2 코드 시퀀스의 제2 코딩 방식과 동일한 경우, 이 실시예는 또한 다음과 같이 수정될 수 있다. 이러한 경우, 이러한 수정예에서는 음성부의 코드 변환 기능이 필요하지 않다. 즉, 이 수정예에서는, 도 2의 코드 변환 회로(1100)가 필요하지 않으며 제1 스위치(1110)와 제2 스위치(1120)가 직접 접속된다.

실시예 2

도 4는 본 발명에 따른 코드 변환 장치의 실시예 2의 구조를 도시하는 도면이다. 도 4에서, 도 2에 나타나는 동일하거나 등가 구성요소들은 동일한 참조 번호로 표기된다.

이 실시예에서, 실시예 1의 직렬 접속의 코드 시퀀스 변환 회로(1100)는 제2 코드 시퀀스 변환 회로(2100)로 대체된다. 그러므로, 제2 코드 시퀀스 변환 회로(2100)가 이하에서 설명될 것이다.

제2 코드 시퀀스 변환 회로(2100)는 제1 스위치(1110)로부터 제공되는 음성부의 제1 코드 시퀀스의 음성 파라미터에 대응하는 각 코드에 대한 코드 변환을 수행한다. 또한, 제2 코드 시퀀스 변환 회로(2100)는 제2 스위치(1120)에 이 코드 변환에 의해 변환된 코드들로 구성된 코드 시퀀스를 출력한다. 직렬 접속을 하지 않는 코드 변환은 [6] 2000년 발표된 "Proc. of IEEE Workshop on Speech Coding 2000"의 pp.78-80에 기재된 "Hong-Goo Kang" 등이 저술한, "Improving transcoding capability of speech coders in clean and frame erasured channel environments"에 상세히 기술되어 있다.

실시예 3

도 5는 본 발명에 따른 코드 변환 장치의 실시예 3의 구조를 도시하는 도면이다. 도 5에서, 도 2에 나타난 것과 동일하거나 등가 구성요소들은 동일한 참조 번호로 표기된다. 도 5에서, 입력 단자(10), 출력 단자(20), 음성 디코딩 회로(1050) 및 제2 스위치(1120)는 이들 구성요소들 간의 상호 접속이 일부 상이하다는 점을 제외하고는 기본적으로 도 1 및 도 2에 도시된 구성요소와 동일한 구성요 소이다. 이하의 실시예 3의 설명은 상술한 것과 동일하거나 등가 구성요소의 설명은 생략하고, 도 2에 도시된 구조와 상이한 것들, 즉, 음성 신호 검출 회로(3200), 코드 시퀀스 생성 회로(3400) 및 음성 인코딩 회로(1061)를 설명한다.

도 5에서, 음성 디코딩 회로(1050)는 음성 신호 검출 회로(3200)에 디코딩된 음성 신호를 제공한다. 이 디코딩된 음성 신호가 음성부에 대응한다면, 음성 검출 회로(3200)는 제어 플래그 "0"을 출력한다. 이 디코딩된 음성 신호가 비-음성부에 대응한다면, 음성 검출 회로(3200)는 제어 플래그 "1"을 출력한다. 이 제어 플래그는 음성 인코딩 회로(1061), 코드 시퀀스 생성 회로(3400) 및 제2 스위치(1120)에 제공된다.

여기서, 음성 신호 검출 회로(3200)는 디코딩된 음성 신호로부터 계산될 수 있는, 핀치 주기, 스펙트럼 기울기, 음성 전력 등으로서 음성 신호를 특성화하는 특징량을 이용함으로써 이 제어 플래그를 계산한다. 즉, 음성 신호 탐지 회로는 대응하는 값을, 이들 특징량이 음성부에 대응하는지 비-음성부에 대응하는지를 식별하는 제어 플래그에 설정한다. 이 제어 플래그는, 실시예 1에서의 식별 회로(1300)의 출력에서 알 수 있는 바와 같이, 비-음성부를 잡음부와 무음부로 분류할 수 있다.

예를 들면, 음성 전력의 특징량의 경우, 가장 단순한 방식은 음성부에서는 상대적으로 강한 전력을 가지는 부분에 대응하고 비-음성부에서는 상대적으로 약한 전력을 가지는 부분에 대응하는 것이다. 그러므로, 음성 신호 검출 회로(3200)는 전력이 큰 경우 제어 플래그에 "0"을 설정하고 전력이 작은 경우에는 "1"을 설정한 다.

음성 신호를 음성부와 비-음성부로 분류하는 방법은 [7] 3GPP TS 26.094 "AMR Speech Codec; Voice Activity Detector(VAD)"에 상세히 기술되어 있다.

비-음성부는 잡음 또는 무음으로 제한되지 않는다. 예를 들면, 톤 신호 또한 비-음성부로서 간주될 수 있다. 이러한 경우, 음성 신호 검출 회로(3200)는 톤 신호 탐지 회로의 추가적인 기능을 제공한다. 또한 디코딩된 음성 신호가 톤 신호에 대응하면 이 음성 신호 탐지 회로는, 예를 들면 "3"을 제어 플래그에 설정한다.

톤 신호를 탐지하는 방법은 EP-A-1395065 "Tone detector and method therefore"(참조 문헌 [8])에 상세히 기술되어 있다.

도 5에서, 코드 시퀀스 변환 회로(1101)는 음성 디코딩 회로(1050) 및 음성 인코딩 회로(1061)로 구성된다.

제어 플래그는 음성 신호 검출 회로(3200)로부터 음성 인코딩 회로(1061)에 제공된다. 이 제어 플래그 값이 (음성부를 나타내는) "0"이라면, 음성 인코딩 회로(1061)는 음성 디코딩 회로(1050)로부터 출력되는 디코딩된 음성 신호를 제2 음성 코딩 방식에 의해 재-인코딩한다. 그 다음, 음성 인코딩 회로(1061)는 이 재-인코딩을 통해 획득한 코드 시퀀스를 제2 코드 시퀀스로서 제2 스위치(1120)에 제공한다. 음성 인코딩 회로(1061)는 음성 인코딩의 처리가 제어 플래그의 값의 기초하여 수행되거나 수행되지 않는다는 점을 제외하고는 실시예 1의 음성 인코딩 회로(1060)의 구조와 동일한 구조를 가진다.

음성 신호 검출 회로(3200)로부터 출력되는 제어 플래그가 음성부의 값과 다 른 값을 나타낸다면, 코드 시퀀스 생성 회로(3400)는 무음, 잡음 또는 톤에 대응하는 제2 코드 시퀀스를 생성한다. 이렇게 생성된 제2 코드 시퀀스는 제2 스위치(1120)에 제공된다. 여기서, 코드 시퀀스 생성 회로(3400)는 도 2 및 도 4의 코드 시퀀스 생성 회로(1400)와 동일한 방식으로 무음 또는 잡음에 대응하는 제2 코드 시퀀스를 생성한다.

도 2의 코드 시퀀스 생성 회로(1400)에서와 같이, 제어 플래그 값이 "0(음성)"이 아닌 값이라면 코드 시퀀스 생성 회로(3400)는 소정의 치환 신호(예를 들면, 이 실시예의 상위 장치에 의해 결정된 치환 신호)에 대응하는 제2 코드 시퀀스를 출력하도록 수정될 수 있다. 예를 들면, 코드 시퀀스 생성 회로는 제어 플래그 값에 상관없이, 제어 플래그 값이 비-음성부("무음", "잡음", "톤" 등)를 나타내더라도 "무음"에 대응하는 제2 코드 시퀀스를 출력하도록 수정될 수 있다. 또한, 코드 시퀀스 제어 회로는 제어 플래그 값이 비-음성부를 나타내더라도 작은 진폭을 가지는 "잡음"에 대응하는 제2 코드 시퀀스를 출력하도록 수정될 수 있다.

실시예 4

도 6은 본 발명에 따른 코드 변환 장치의 실시예 4의 구조를 도시하는 도면이다. 도 6에서, 도 2에 나타난 것과 동일하거나 등가 구성요소는 동일한 참조 번호로 표기된다.

이 실시예에서, 실시예 1의 코드 시퀀스 생성 회로(1400)는 코드 시퀀스 출력 회로(3000)로 대체된다. 이러한 대체는 실시예 2 및 실시예 3에 적용될 수 있다.

이하, 코드 시퀀스 출력 회로가 설명될 것이다.

코드 시퀀스 출력 회로(3000)는 메모리 회로(3001) 및 출력 회로(3002)로 구성된다.

메모리 회로(3001)는 제어 플래그의 값에 관련하여 비-음성부(무음, 등)에 대응하는 제2 코드 시퀀스를 미리 기억하고 있다.

예를 들면, 제2 음성 코딩 방식이 3GPP AMR 코덱을 따른다면, 제2 코드 시퀀스는 무음에 대한 페이로드의 사이즈가 상술한 바와 같이 0 비트이기 때문에 헤더(프레임 유형은 15)만으로 구성된다.

제2 음성 코딩 방식이 ITU-T G.711을 따른다면, 페이로드는 그 수가 프레임 길이에 대응하는 샘플들의 개수와 동일한 0xFF 코드들로 구성된다. 예를 들면, 프레임 길이가 20 msec이고 샘플링 주파수가 8000 Hz인 경우, 프레임 길이에 대응하는 샘플들의 개수는 160이 되도록 계산된다. 이러한 경우의 페이로드는 160 0xFF 코드들을 가지는 1280 비트 데이터가 되는 것으로 간주된다. ITU-T G.711은 앞서 언급한 참조 문헌 [5]에 상세히 기술되어 있다.

상기 설명은 무음에 대한 제2 코드 시퀀스를 생성하기 위한 것이다. 실시예 1과 마찬가지로, 잡음에 대한 코드 시퀀스는 메모리 회로(3001)에 미리 기억될 수도 있다.

출력 회로(3002)는 제어 플래그의 값에 따라 메모리 회로(3001)에 저장된 제2 코드 시퀀스를 판독하여, 이 코드 시퀀스를 제2 스위치(1120)에 제공한다.

이 실시예에서, 실시예 1과 마찬가지로, 제어 플래그가 (음성부를 나타내는) "0"이라면, 제2 스위치(1120)는 출력 단자(20)에 음성 인코딩 회로(1060)로부터 출력되는 제2 코드 시퀀스를 출력한다. 제어 플래그가 (잡음을 나타내는) "1"이거나 (무음을 나타내는) "2"라면, 제2 스위치(1120)는 코드 시퀀스 출력 회로(3000)로부터 출력되는 제2 코드 시퀀스를 출력한다. 여기서, 실시예 1과 마찬가지로, 제어 플래그가 "0" 또는 "1" 중 하나라면, 제2 스위치(1120)는 출력 단자(20)에 음성 인코딩 회로(1060)로부터 출력되는 제2 코드 시퀀스를 제공할 수 있다.

실시예 5

본 발명에 따른 상술한 실시예 각각의 코드 변환 장치는 디지털 신호 프로세서와 같은 컴퓨터의 제어 하에 실현될 수 있다. 실시예 5에서, 디지털 신호 프로세서와 같은 컴퓨터의 제어 하에 있는 코드 변환 장치가 설명될 것이다.

도 7은 본 발명에 따른 상기 실시예 1 내지 4의 코드 변환 처리가 컴퓨터에 의해 실현되는 장치의 구조를 개략적으로 도시한다. 실시예 5는 컴퓨터(1) 및 기록 매체 판독 장치(5)를 포함한다. 컴퓨터(1)는 CPU(중앙 처리 유닛)(2), 메모리(3) 및 기록 매체 판독 장치 인터페이스(4)를 포함한다. 기록 매체 판독 장치(5) 내에는 컴퓨터 프로그램을 저장하는 기록 매체(6)가 설치되어 있다. CPU(2)는 우선 기록 매체 판독 장치 인터페이스(4)를 통해 기록 매체(6)에 저장된 프로그램을 메모리(3)로 다운로드하고, 상술한 실시예 1 내지 4의 동작들과 유사한 동작들을 실행한다.

다음의 처리를 실행하기 위한 프로그램은 기록 매체(6)에 저장된다.

(A) 제1 코드 시퀀스에 포함된 정보를 이용함으로써 제1 코드 시퀀스가 음성 부에 대응하는지 비-음성부에 대응하는지를 식별하고, 이 식별 결과를 나타내는 제어 플래그를 출력하는 처리;

(B) 이 제어 플래그가 음성부를 나타낸다면, 제1 코드 시퀀스를 제2 코드 시퀀스로 변환하는 처리; 및

(C) 이 제어 플래그가 비-음성을 나타낸다면, 플래그에 대응하는 비-음성에 대한 제2 코드 시퀀스를 생성하는 처리.

처리 (A)는 다음의 처리 (A1) 및 (A2)를 이용하여 실현될 수 있다.

(A1) 제1 디코딩 방법으로 제1 코드 시퀀스로부터 음성 신호를 디코딩하는 처리, 및

(A2) 디코딩된 음성 신호를 이용하여 제1 코드 시퀀스가 음성에 대응하는지 비-음성에 대응하는지를 식별하고, 식별 결과를 나타내는 제어 플래그를 출력하는 처리.

도 7에서, 상기 프로그램은 실행되기 위해 기록 매체 판독 장치(5) 및 기록 매체 판독 장치 인터페이스(4)를 통해 기록 매체(6)로부터 메모리(3)로 판독 입력된다. 상기 프로그램은 마스크 ROM, 플래쉬 메모리 등과 같은 비휘발성 메모리에 저장될 수 있다. 기록 매체는 비휘발성 메모리 외에도, CD-ROM, FD, DVD(Digital Versatile Disk), 자기 테이프(MT), 휴대용 HDD, 등을 포함한다. 또한, 기록 매체는, 컴퓨터가 통신 매체를 통해 서버 장치로부터 프로그램을 수신할 때 프로그램을 전달하기 위한 유무선 통신 매체도 포함한다.

또한, 처리 (C)는 이하의 처리 (C1)에 의해 실현될 수 있다.

(C1) 비-음성에 대한 이전에-저장된 제2 코드 시퀀스로부터 상기 제2 코드 시퀀스를 선택함으로써, 제어 플래그에 대응하는 제2 코드 시퀀스를 출력하는 처리. 이 경우, 비-음성에 대한 제2 코드 시퀀스를 기록 매체(6)에 프로그램의 일부로서 미리 저장하는 것이 바람직하다.

본 발명은 특정 예시적인 실시예에 관련하여 기술되었지만, 본 발명이 수용하는 요지는 이들 특정 실시예로 제한되지 않는다고 이해되어야 한다. 오히려, 본 발명의 요지는 특허 청구 범위의 사상 및 범위에 포함될 수 있는 모든 대안, 수정물 및 동등물을 포함한다고 의도된다. 또한, 본 발명자의 의도는 특허 청구 범위가 출원(prosecution) 중에 보정되는 경우에도 모든 동등물을 유지하는 것이다.

본 발명의 제1 예시적인 양태에서는 참조문헌 [2]가 제시한 비-음성부 코드 시퀀스가 다른 음성 코딩 방식에 대한 비-음성부 코드 시퀀스로 변환되는 변환 프로세스에 비하여 처리량이 상당히 줄어든다. 그 이유는 본 발명의 제1 예시적인 양태가 제1 비-음성 코드 시퀀스를 제2 음성 코딩 방식에 대한 비-음성 코드 시퀀스로 변환시키지 않지만 제1 코드 시퀀스로부터 획득한 코드 시퀀스의 유형을 나타내는 정보에 기초하여 제2 음성 코딩 방식에 대한 비-음성부에 대응하는 코드 시퀀스를 생성하기(또는 이전에 저장된 코드 시퀀스를 산출하기) 때문이다. 그러므로, 코드 변환에 필요한 계산량이 상당히 줄어들 수 있다.

Claims

제1 음성 코딩 방식을 따르는 제1 코드 시퀀스를 제2 음성 코딩 방식을 따르는 제2 코드 시퀀스로 변환하기 위한 코드 변환 방법으로서,

(A) 상기 제1 코드 시퀀스가 음성부에 대응하는지 비-음성부에 대응하는지를 식별하고, 상기 식별 결과를 제어 플래그로서 나타내는 값을 생성하는 단계,

(B) 상기 제어 플래그의 값이 상기 음성부에 대응한다면, 상기 제1 코드 시퀀스를 상기 제2 코드 시퀀스로 변환하여, 상기 제2 코드 시퀀스를 출력하는 단계, 및

(C) 상기 제어 플래그의 값이 상기 비-음성부에 대응한다면, 상기 제어 플래그의 값에 대응하는 상기 제2 코드 시퀀스를 출력하는 단계를 포함하는 방법.
제1항에 있어서,

상기 단계 (A)는 상기 제1 코드 시퀀스에 포함된 정보를 이용함으로써 상기 제어 플래그를 생성하는 방법.
제2항에 있어서,

상기 단계 (A)는 상기 제1 코드 시퀀스 내의 프레임에 포함된 프레임 유형 정보에 기초하여, 상기 제어 플래그를 생성하는 방법.
제2항에 있어서,

상기 단계 (A)는 상기 제1 코드 시퀀스 내의 프레임에 포함되는 프레임 사이즈에 기초하여, 상기 제어 플래그를 생성하는 방법.
제4항에 있어서,

상기 프레임 사이즈는 이러한 프레임의 페이로드의 사이즈에 의해 표현되는 방법.
제1항에 있어서,

상기 단계 (A)는

(A1) 제1 디코딩 방법으로 상기 제1 코드 시퀀스로부터 디코딩된 음성 신호를 생성하는 단계, 및

(A2) 상기 디코딩된 음성 신호에 기초하여 상기 제어 플래그를 생성하는 상기 제1 코드 시퀀스가 상기 음성부에 대응하는지 상기 비-음성부에 대응하는지를 식별하고, 상기 제어 플래그를 생성하는 단계

를 포함하는 방법.
제1항에 있어서,

상기 단계 (C)는 상기 비-음성부에 대응하는 하나 이상의 이전에-저장된 제2 코드 시퀀스로부터 상기 제어 플래그에 대응하는 상기 제2 코드 시퀀스를 출력하는 방법.
제1항에 있어서,

상기 단계 (B)는

(B1) 상기 제어 플래그의 값이 상기 음성부에 대응한다면, 제1 디코딩 방법으로 상기 제1 코드 시퀀스로부터 디코딩된 음성 신호를 생성하는 단계, 및

(B2) 제2 인코딩 방법으로 상기 디코딩된 음성 신호를 재-인코딩하여 상기 제2 코드 시퀀스를 생성하는 단계

를 포함하는 방법.
제1항에 있어서,

상기 제1 음성 코딩 방식 및 상기 제2 음성 코딩 방식은 동일한 방법.
제9항에 있어서,

상기 단계 (B)는 상기 제어 플래그의 값이 상기 음성부에 대응한다면 상기 제1 코드 시퀀스를 상기 제2 코드 시퀀스로서 출력하는 방법.
제1항에 있어서,

상기 단계 (C)는 상기 제어 플래그의 값이 상기 비-음성부를 나타낸다면, 외부로부터 할당된 신호 또는 소정의 신호에 대응하는 제2 코드 시퀀스를 출력하는 방법.
제1 음성 코딩 방식을 따르는 제1 코드 시퀀스를 제2 음성 코딩 방식을 따르는 제2 코드 시퀀스로 변환하기 위한 코드 변환 장치로서,

상기 제1 코드 시퀀스가 음성부에 대응하는지 비-음성부에 대응하는지를 식별하고 상기 식별 결과를 제어 플래그로서 나타내는 값을 생성하는 식별 유닛,

상기 제어 플래그의 값이 상기 음성부에 대응한다면, 상기 제1 코드 시퀀스를 상기 제2 코드 시퀀스로 변환하여 상기 제2 코드 시퀀스를 출력하는 음성부 변환 유닛, 및

상기 제어 플래그의 값이 상기 비-음성부에 대응한다면, 상기 제어 플래그의 값에 대응하는 상기 제2 코드 시퀀스를 출력하는 비-음성부 생성 유닛을 포함하는 장치.
제10항에 있어서,

상기 식별 유닛은 상기 제1 코드 시퀀스에 포함된 정보를 이용함으로써 상기 제어 플래그를 생성하는 장치.
제13항에 있어서,

상기 식별 유닛은, 상기 제1 코드 시퀀스 내의 프레임에 포함된 프레임 유형 정보에 기초하여, 상기 제어 플래그를 생성하는 장치.
제13항에 있어서,

상기 식별 유닛은 상기 제1 코드 시퀀스 내의 프레임에 포함된 프레임 사이즈에 기초하여, 상기 제어 플래그를 생성하는 장치.
제13항에 있어서,

상기 프레임 사이즈는 상기 프레임 내의 페이로드의 사이즈에 의해 표현되는 장치.
제12항에 있어서,

상기 식별 유닛은

제1 디코딩 방법으로 상기 제1 코드 시퀀스로부터 디코딩된 음성 신호를 생성하는 디코더, 및

상기 제1 코드 시퀀스가 상기 디코딩된 음성 신호에 기초하여 상기 음성부에 대응하는지 상기 비-음성부에 대응하는지를 식별하고 상기 제어 플래그를 출력하는 음성 검출 회로

를 포함하는 장치.
제12항에 있어서,

상기 비-음성부 생성 유닛은 상기 비-음성부에 대응하는 하나 이상의 이전에 저장된 제2 코드 시퀀스로부터의 상기 제어 플래그에 대응하는 상기 제2 코드 시퀀스를 생성하는 장치.
제12항에 있어서,

상기 음성부 변환 유닛은

상기 제어 플래그의 값이 상기 음성부에 대응한다면, 제1 디코딩 방법으로 상기 제1 코드 시퀀스로부터 디코딩된 음성 신호를 생성하는 디코더, 및

제2 인코딩 방법으로 상기 디코딩된 음성 신호를 재-인코딩하여 상기 제2 코드 시퀀스를 생성하는 재-인코더

를 포함하는 장치.
제12항에 있어서,

상기 제1 음성 코딩 방식 및 상기 제2 음성 코딩 방식은 동일한 장치.
제20항에 있어서,

상기 제어 플래그의 값이 상기 음성부에 대응한다면 상기 비-음성부 생성 유닛은 상기 제1 코드 시퀀스를 상기 제2 코드 시퀀스로서 출력하는 장치.
제12항에 있어서,

상기 제어 플래그의 값이 상기 비-음성부를 나타낸다면 상기 음성부 변환 유 닛은 외부로부터 할당된 신호 또는 소정의 신호에 대응하는 상기 제2 코드 시퀀스를 출력하는 장치.
제1 음성 코딩 방식을 따르는 제1 코드 시퀀스를 제2 음성 코딩 방식을 따르는 제2 코드 시퀀스로 변환하기 위한 코드 변환 방법을 실행하는 컴퓨터용 프로그램을 기록하는 기록 매체로서,

상기 프로그램은

(A) 상기 제1 코드 시퀀스가 음성부에 대응하는지 비-음성부에 대응하는지를 식별하고, 상기 식별 결과를 제어 플래그로서 나타내는 값을 생성하는 단계,

(B) 상기 제어 플래그의 값이 상기 음성부에 대응한다면, 상기 제1 코드 시퀀스를 상기 제2 코드 시퀀스로 변환하여, 상기 제2 코드 시퀀스를 출력하는 단계, 및

(C) 상기 제어 플래그의 값이 상기 비-음성부에 대응한다면, 상기 제어 플래그의 값에 대응하는 상기 제2 코드 시퀀스를 출력하는 단계를 포함하는 기록 매체.
제23항에 있어서,

상기 단계 (A)는 상기 제1 코드 시퀀스에 포함된 정보를 이용함으로써 상기 제어 플래그를 생성하는 기록 매체.
제24항에 있어서,

상기 단계 (A)는 상기 제1 코드 시퀀스 내의 프레임에 포함된 프레임 유형 정보에 기초하여 상기 제어 플래그를 생성하는 기록 매체.
제24항에 있어서,

상기 단계 (A)는 상기 제1 코드 시퀀스 내의 프레임에 포함되는 프레임 사이즈에 기초하여, 상기 제어 플래그를 생성하기 위한 단계인 기록 매체.
제26항에 있어서,

상기 프레임 사이즈는 상기 프레임의 페이로드의 사이즈에 의해 표현되는 기록 매체.
제23항에 있어서,

상기 단계 (A)는

(A1) 제1 디코딩 방법으로 상기 제1 코드 시퀀스로부터 디코딩된 음성 신호를 생성하는 단계, 및

(A2) 상기 디코딩된 음성 신호에 기초하여, 상기 제1 코드 시퀀스가 상기 음성부에 대응하는지 상기 비-음성부에 대응하는지를 식별하고, 상기 제어 플래그를 출력하는 단계

를 포함하는 기록 매체.
제23항에 있어서,

상기 단계 (C)는 상기 비-음성부에 대응하는 하나 이상의 이전에-저장된 제2 코드 시퀀스로부터 상기 제어 플래그에 대응하는 상기 제2 코드 시퀀스를 생성하기 위한 단계인 기록 매체.
제23항에 있어서,

상기 단계 (B)는

(B1) 상기 제어 플래그의 값이 상기 음성부에 대응한다면, 제1 디코딩 방법으로 상기 제1 코드 시퀀스로부터 디코딩된 음성 신호를 생성하는 단계, 및

(B2) 제2 인코딩 방법으로 상기 디코딩된 음성 신호를 재-인코딩하여 상기 제2 코드 시퀀스를 생성하는 단계

를 포함하는 기록 매체.
제23항에 있어서,

상기 제1 음성 코딩 방식 및 상기 제2 음성 코딩 방식은 동일한 기록 매체.
제31항에 있어서,

상기 단계 (B)는 상기 제어 플래그의 값이 상기 음성부에 대응한다면 상기 제1 코드 시퀀스를 상기 제2 코드 시퀀스로서 출력하는 기록 매체.
제23항에 있어서,

상기 단계 (C)는 상기 제어 플래그의 값이 상기 비-음성부를 나타낸다면, 외부로부터 할당된 신호 또는 소정의 신호에 대응하는 상기 제2 코드 시퀀스를 출력하는 기록 매체.