KR100756311B1

KR100756311B1 - 코드 여기 선형 예측 파라미터 도메인에서의 이중음 다중주파수 검출 및 음성 혼합 방법 및 그 장치

Info

Publication number: KR100756311B1
Application number: KR1020057007180A
Authority: KR
Inventors: 마완 자브리; 지안웨이 왕; 사메 조지; 마이클 이브라힘
Original assignee: 딜리시움 네트웍스 피티와이 리미티드
Priority date: 2002-10-25
Filing date: 2003-10-24
Publication date: 2007-09-07
Also published as: JP2006504300A; WO2004039096A1; KR20050072456A; US20070025546A1; US20040174984A1; EP1557052A1; AU2003273625A1; US7133521B2; CN1708997A

Abstract

발언 신호를 완전히 복호화하고 재구성함이 없이, 코드 여기 선형 예측(Code-exited linear prediction;CELP) 파라미터 공간에서의 DTMF 검출 및 음성 혼합을 위한 방법 및 그 장치가 제공된다. 상기 장치는 이중 톤 변조 주파수(Dual-Tone Multi-Frequency;DTMF) 신호 검출 모듈 및 다중 입력 혼합 모듈을 포함한다. 상기 DTMF 신호 검출 모듈은 입력 CELP 파라미터로부터 특징적 특성을 연산하고 이를 DTMF 신호의 알려진 특성과 비교함으로써 DTMF 신호를 검출한다. 상기 다중 입력 혼합 모듈은 다수의 음성 신호를 나타내는 다수의 셋트의 입력 CELP 파라미터를 단일 셋트의 CELP 파라미터로 혼합한다. 상기 혼합 연산은 입력 CELP 파라미터의 각 셋트를 해석하고, 상기 입력 셋트의 중요도의 순서를 결정하고, CELP 파라미터를 혼합하는 전략을 설정하고, 혼합된 CELP 파라미터를 출력함으로써 수행된다. 상기 방법은 하나 또는 그 이상의 셋트의 CELP 파라미터와 외부 명령을 수신하는 단계와, DTMF 톤을 검출하는 단계와, 다수의 셋트의 CELP 파라미터를 혼합하는 단계, 및 만약 검출된다면 DTMF 신호 및 혼합된 CELP 파라미터를 출력하는 단계를 포함한다.

DTMF 신호 검출, 음성 혼합, CELP 기반 코덱, CELP 파라미터

Description

코드 여기 선형 예측 파라미터 도메인에서의 이중음 다중 주파수 검출 및 음성 혼합 방법 및 그 장치{METHOD AND APPARATUS FOR DTMF DETECTION AND VOICE MIXING IN THE CELP PARAMETER DOMAIN}

관련 출원들의 상호 참조

본 특허 출원은, 2002.10.25.자 출원된 미합중국 임시 특허 출원 제 60/421,342호 (대리인 포대 번호 021318-001200US)의 "음성 변환 부호화기에서의 인밴드 방식 DTMF 검출 및 생성"과, 2002.10.25.자 출원된 미합중국 임시 특허 출원 제60/421,271호 (대리인 포대 번호 021318-001400US)의 "다중 입력원의 음성 변환 부호화 방법"을 기초로 하여 우선권을 주장하며, 모든 목적을 위하여 상기 출원들을 그 참조를 통해 본 명세서에 편입시킨다.

본 발명은 통신 신호의 처리에 관한 것이다. 특히, CELP (Code Excited Linear Prediction; 코드 여기 선형 예측) 도메인에서의 DTMF (Dual-Tone Multi-Frequency; 이중음 다중 주파수) 검출 및 음성 혼합 방법 및 그 장치에 관한 것이다. 특히, 본 발명은, CELP 파라미터로부터 압축된 신호에 DTMF 톤(tone)이 존재하는지를 검출하며, 복수 셋트의 CELP 파라미터에 의하여 표현되는 다중 입력 압축 음성 신호를 단일 셋트의 CELP 파라미터로 혼합하는 방법 및 그 장치에 관한 것이다. 단지 예를 들기 위하여, 본 발명은 음성 변환 부호화(voice transcoding)에 적용될 수 있으나, 본 발명은 보다 넓은 범위에서 응용될 수 있음을 주의하여야 한다.

통신 기술은 수년에 걸쳐 발전해 왔다. 최근, 서로 다른 패킷 네트워크 및 이동 통신 시스템에서의 소정의 대역폭의 요건을 만족시키기 위하여 다양한 디지털 음성 부호화기가 개발되어 왔다. 디지털 음성 부호화기는 역변환 기능과 함께 디지털화된 음성 신호의 압축 기능도 제공한다. 다양한 네트워크와 무선 통신 시스템의 빠른 성장으로 인해 발언 신호(speech signal)는 서로 다른 압축 형식들 사이에서 변환될 것이 요구되고 있다. 이러한 변환의 통상적인 방법은, 하나의 접속을 지원하기 위하여 두 개의 음성 부호화기를 나란히 배치하는 것이다. 이러한 경우, 압축된 첫번째 발언 신호는 첫번째 음성 디코더(decoder)를 통해 디지털화된 신호로 복호화(decode)되고, 그 디지털화된 신호는 두번째 음성 부호화기를 통해 압축된 두번째 발언 신호로 재부호화 된다. 나란히 배치된 두 개의 음성 부호화기는 일반적으로 "직렬 부호화 (tandem coding)" 방식이라고 불린다. 상기 직렬 부호화 방식에 의하면, 압축된 신호를 펄스 코드 변조 (Pulse Code Modulation; PCM) 형식과 같은 디지털화된 신호로 완전히 복호화되고, 다시 그 신호는 재부호화된다. 이것은 많은 양의 처리를 요하게 되고, 증가된 지연을 초래한다. 보다 효율적인 방식은 무엇보다도 스마트 변환 부호화(smart transcoding)이라 불리는 기술을 포함 한다.

현재의 다양한 네트워크와 무선 통신 시스템 하에서 음성 변환 부호화의 요구에 더하여, 진보된 특성 처리(advanced feature processing) 기능을 제공할 것이 또한 요구된다. 진보된 특성의 한 예를 들면, 이중음 다중 주파수 (DTMF) 신호의 검출이다. DTMF 신호 방식은 전화 다이얼링, 음성 우편 (voice mail), 전자 뱅킹 시스템, 심지어 IP 어드레스를 입력하기 위하여 인터넷 프로토콜 (Internet Protocol; IP) 전화 등에 널리 사용되고 있다. 통신용 발언 코덱(speech codec)에서는, 인밴드(in-band) DTMF 신호들이 압축된 비트열(bitstream)로 부호화된다. 통상적인 DTMF 신호 검출은 발언 신호 공간에서 수행된다. 단지 예를 들기 위한 설명을 하면, 쌍극(two-pole) 무한 임펄스 응답(Infinite Impulse Response; IIR)형 필터를 갖는 괴첼 알고리즘 (Goertzel algorithm)이, 입력 디지털 신호로부터 필요한 스펙트럼 정보를 추출하고 DTMF 검출의 기초를 형성하기 위하여 널리 사용된다.

음성 변환 부호화에서 DTMF 신호 검출이 요구될 때, 직렬 방식이 널리 사용된다. 이 경우, 입력 압축 발언 신호는 DTMF 신호 검출을 위하여 다시 발언 도메인으로 복호화되어야만 하며, 그 다음에 다시 압축 형식으로 재부호화되어야 한다. 스마트 음성 변환 부호화에서의 처리가 CELP 파라미터 공간에서 수행되므로, 알려진 DTMF 검출 방법은 종종 적절치 못하게 된다. 나아가, 알려진 스마트 음성 변환 부호화 방법은 DTMF 신호 검출 기능을 포함하지 않아 한계가 있다.

음성 변환 부호화를 위한 다른 진보된 특성의 예는 다중 입력 신호를 다룰 수 있는 능력이다. 만약 입력 신호들이 다수의 발언 신호들이라면, 음성 혼합기는 단순히 발언 신호를 혼합하고 혼합된 발언 신호를 출력한다. 그러나, 패킷 네트워크 또는 무선 통신 시스템에서는, 입력 신호들은 다수의 압축된 신호들이다. 나아가, 현재의 다양한 패킷 네트워크와 무선 통신 시스템에서는, 입력 신호들은 다양한 압축 형식으로 압축될 수 있다. 통상적인 음성 혼합 솔루션은, 입력 패킷을 발언 신호로 복호화함으로써 입력 패킷을 혼합하고, 발언 신호를 혼합하고, 혼합된 발언 신호를 출력 패킷으로 재부호화한다. 이것은, 각 입력 압축 신호의 복호화 및 재부호화에 심각한 연산 복잡성을 요한다.

패킷 네트워크의 음성 혼합에 의하여 생성되는 음성의 품질을 향상시키기 위한 시도로서, 소정의 "스마트" 회의 브릿징(smart conference bridging) 방법이 제안되었다. 이 방법이 측면 정보를 제공할 수 있고 혼합된 음성 신호의 품질을 향상시킬 수 있다 하여도, 그것은 여전히 복호화, 발언 공간에서의 혼합 및 재부호화를 포함하는 직렬 방식을 사용하고 있다. 이러한 방식은 종종 발언 공간으로 진행하지 않는 CELP 파라미터 공간에서 동작하는 음성 변환 부호화기에는 적절치 못하다.

상기한 바로부터, 통신 신호의 개선된 처리를 위한 기술이 강력히 요구됨을 알 수 있다.

본 발명에 의하면, 통신 신호를 처리하는 기술이 제공된다. 특히, 본 발명은 CELP 도메인에서의 DTMF 검출과 음성 혼합을 수행하는 방법 및 장치를 제공한다. 보다 구체적으로는, 본 발명은, CELP 파라미터로부터 압축된 신호에 DTMF 톤이 존재하는지를 검출하며, 또한 복수 셋트의 CELP 파라미터로 표현되는 다중 입력 압축 음성 신호를 단일 셋트의 CELP 파라미터로 혼합하는 방법 및 장치에 관한 것이다. 단지 예를 들기 위하여, 본 발명은 음성 변환 부호화에 적용되었으나, 본 발명은 보다 넓은 범위에서 응용될 수 있음을 주의하여야 한다.

본 발명의 특정 실시예에 의하면, 본 발명은 CELP 파라미터를 사용하는 음성 변환 부호화기에서의 진보된 특성 처리를 위한 방법 및 그 장치를 제공한다. 상기 장치는 하나 또는 그 이상의 셋트의 CELP 파라미터와 외부 명령들을 입력으로서 수신하며, 상기 CELP 파라미터는 필요한 경우 프레임 크기, 서브프레임 크기 또는 기타 특징에 정합시키기 위하여 보간(interpolate)될 수 있다. 상기 장치는, 입력 CELP 파라미터로부터 DTMF 신호를 검출하는 DTMF 신호 검출 모듈, 및 다수의 CELP 코덱(codec)으로부터의 CELP 파라미터들을 단일 셋트의 CELP 파라미터로 혼합하는 다중 입력 혼합 모듈을 포함한다. 본 발명의 특정 실시예에 의하면, 상기 다중 입력 혼합 모듈은 동적 토폴로지(dynamic topology)를 가지며, 입력 압축 신호의 개수에 따라 다른 토폴로지를 구성할 수 있다. 상기 장치는, 검출된 경우, 상기 DTMF 신호와 혼합된 CELP 파라미터를 출력한다.

상기 DTMF 신호 검출 모듈은, DTMF 특성을 연산하기 위한 DTMF 특성 연산 유닛, DTMF 신호에 대응하는 특성 데이터를 저장하는 DTMF 특성 패턴 테이블, 연산된 특성을 저장된 패턴 테이블과 비교하기 위한 DTMF 특성 비교 유닛, 과거의 특성 데이터를 저장하기 위한 DTMF 특성 버퍼 및 DTMF 신호를 결정하기 위한 DTMF 결정 유닛을 포함한다.

상기 다중 입력 혼합 모듈은, CELP 파라미터의 각 셋트로부터 복수의 발언 특성을 검출하기 위한 특성 검출 유닛, CELP 파라미터의 각 셋트의 중요도를 평가하기 위한 정렬 유닛, 혼합 전략을 결정하기 위한 혼합 결정 유닛 및 복수 셋트의 CELP 파라미터를 혼합하기 위한 혼합 연산 유닛을 포함한다.

본 발명은 CELP 파라미터 공간에서의 진보된 특성 처리를 위한 방법을 제공한다. 상기 방법은, 프레임 크기, 서브프레임 크기 또는 기타 특징에 정합시키기 위하여 보간될 수 있는 하나 또는 그 이상의 CELP 파라미터 셋트를 수신하는 단계; DTMF 톤(tone)을 검출하고 복수 셋트의 CELP 파라미터를 혼합하며, 검출된 DTMF 신호와 혼합된 CELP 파라미터를 출력하는 단계를 포함한다.

본 발명의 다른 특정 실시예에 의하면, 본 발명은 CELP 파라미터 공간에서 DTMF 신호를 검출하는 방법을 제공한다. 상기 방법은, CELP 파라미터로부터 DTMF 검출을 위하여 특성을 연산하는 단계; 미리 연산된 DTMF 특성 데이터와 특성을 비교하는 단계; 이전 서브프레임의 DTMF 검출 상태 및 특성을 점검하는 단계; DTMF 신호 규격에 따라 DTMF 신호를 결정하는 단계; 이전 서브프레임의 상태 및 특성 파라미터를 갱신하는 단계; 및 검출된 DTMF 신호를 출력하는 단계를 포함한다.

본 발명의 또 다른 특정 실시예에 의하면, 본발명은 복수 셋트의 입력 CELP 파라미터를 혼합하는 방법을 제공한다. 상기 방법은, 복수 셋트의 CELP 파라미터를 수신하는 단계; 선택된 혼합 전략에 따라 CELP 파라미터의 셋트를 혼합하는 단계; 및 혼합된 CELP 파라미터를 출력하는 단계를 포함한다. 상기 복수 셋트의 입력 CELP 파라미터를 단일 셋트의 혼합된 CELP 파라미터로 혼합하는 방법은, 각 입력의 중요도를 결정하기 위하여 요구되는 신호 특성 파라미터를 연산하는 단계; 상기 특성 파라미터 연산 결과에 따라 상기 복수 셋트의 입력 CELP 파라미터의 중요도의 순서를 정리하는 단계; 외부 제어 명령으로부터 우선 순위를 고려하는 단계; 혼합된 입력을 선택하는 단계; 및 선택된 입력으로부터 혼합된 CELP 파라미터를 연산하는 단계를 포함한다.

본 발명의 또 다른 특정 실시예에 의하면, 본 발명은 통신 신호의 특성 처리를 위한 장치를 제공한다. 상기 장치는, 발언 신호 도메인으로 복호화하지 않으며 CELP 도메인에서 동작하도록 되어 있다. 상기 장치는 이중음 다중 주파수 (DTMF) 신호 검출 모듈을 포함한다. 상기 이중음 다중 주파수 (DTMF) 신호 검출 모듈은 적어도 하나 또는 그 이상의 입력 CELP 파라미터에 기초하여 하나 또는 그 이상의 DTMF 톤(tone)을 검출하게 되어 있으며, 상기 DTMF 신호 검출 모듈은 또한, 결정된다면, 하나 또는 그 이상의 DTMF 신호를 출력하게 되어 있다.

본 발명의 또 다른 실시예에 의하면, 본 발명은 통신 신호의 특성 처리를 위한 장치를 제공한다. 상기 장치는 발언 신호 도메인으로 복호화하지 않으며 CELP 도메인에서 동작하도록 되어 있다. 상기 장치는 DTMF 신호 검출 모듈에 결합된 다중 입력 혼합 모듈을 포함한다. 상기 다중 입력 혼합 모듈은, 하나 이상의 CELP 기반의 코덱(codec)으로부터의 하나 이상의 음성 신호 각각에 의하여 표현되는 CELP 파라미터들을, 단일 셋트의 CELP 파라미터로 처리하게 되어 있다.

본 발명에 의하면 통상의 기술에 비하여 다양한 혜택을 볼 수 있다. 본 발명의 특정 실시예에 의하면, 본 발명은 CELP 정보를 발언 도메인으로 다시 변환하지 않은 채로 DTMF 신호를 검출할 수 있는 용이한 방법을 제공한다. 또한, 본 발명은 통상적인 하드웨어 및 소프트웨어를 사용하여 제공될 수 있다. 본 발명의 특정 실시예에 의하면, 본 발명은 변환 부호화 기술에 결합될 수 있는 추가적인 진보된 모듈들을 또한 제공한다. 실시예에 따라서, 하나 또는 그 이상의 이러한 혜택 또는 특성들이 달성될 수 있다. 이러한 또는 다른 혜택들은 본 명세서의 전체에 걸쳐 또한 이하에서 보다 상세히 기재되어 있다.

본 명세서에 첨부되며 그 일부를 형성하는 첨부 도면들은 본 발명의 실시예를 도시하고 있으며, 그 상세한 설명과 더불어 본 발명의 원리를 설명하는 데에 기여한다.

신규한 것으로 믿고 있는 본 발명의 목적, 특성 및 이점 등은 특히 이하의 특허 청구 범위에 개시되어 있다. 추가적인 목적 및 이점 등과 함께 그 구성 및 동작 방식의 양자에 있어서, 첨부 도면과 함께 이하의 상세한 설명을 참조함으로써 본 발명을 가장 잘 이해할 수 있을 것이다.

도 1은 본 발명의 한 실시예에 의한, CELP 파라미터 도메인에서 DTMF 검출 및 다중 입력 혼합을 위한 장치의 간략한 블록도를 도시한 도면이다.

도 2는 본 발명의 한 실시예에 의한, DTMF 신호 주파수 분류를 도시한 도면이다.

도 3은 본 발명의 한 실시예에 의한, DTMF 신호 검출 장치의 간략한 블록도를 도시한 도면이다.

도 4는 본 발명의 한 실시예에 의한, CELP 파라미터를 이용한 DTMF 신호 검출 방법의 간략한 흐름도를 도시한 도면이다.

도 5는 본 발명의 한 실시예에 의한, 스마트 음성 변환 부호화기에서의 DTMF 검출 및 다중 입력 혼합을 간략히 도시한 블록도이다.

도 6은 본 발명의 한 실시예에 의한, 음성 코덱 GSM-AMR 및 G.723.1 사이에서의 음성 변환 부호화의 DTMF 검출 모듈의 간략한 블록도를 도시한 도면이다.

도 7은 본 발명의 한 실시예에 의한, 입력 GSM-AMR 코덱 비트열로부터의 DTMF 신호를 나타내는 LSP를 도시한 도면이다.

도 8은 본 발명의 한 실시예에 의한, 입력 G.723.1 코덱 비트열로부터의 DTMF 신호를 나타내는 LSP를 도시한 도면이다.

도 9는 본 발명의 한 실시예에 의한, 다중 입력 믹서에서의 세 개의 스피커를 접속하는 통신 링크를 개념적으로 도시한 도면이다.

도 10은 압축 음성 코덱 형식에 의한, 스피커들 사이에서의 통상적인 다중 입력 혼합을 간략히 도시한 도면이다.

도 11은 본 발명의 한 실시예에 의한, 다중 입력 혼합 모듈 장치의 간략한 블록도를 도시한 도면이다.

도 12는 본 발명의 한 실시예에 의한, 다중 입력 혼합 방법의 흐름도를 도시한 도면이다.

도 13은 본 발명의 한 실시예에 의한, 음성 변환 부호화에서의 다중 입력 혼합 장치의 간략한 블록도를 도시한 도면이다.

도 14는 본 발명의 한 실시예에 의한, 서로 다른 음성 코덱 출력을 갖는 음성 변환 부호화기에서의 다중 입력 혼합기 장치의 블록도를 도시한 도면이다.

도 15는 본 발명의 한 실시예에 의한, 서로 다른 음성 코덱 형식을 갖는 서로 다른 네 (4) 참여자 사이의 4자(者) 회의를 개념적으로 도시한 도면이다.

도 16은 본 발명의 한 실시예에 의한, 음성 코덱 G.729, GSM-AMR 및 G.723.1 사이의 프레임 크기의 차이를 도시한 도면이다.

도 17은 본 발명의 한 실시예에 의한, 음성 변환 부호화기에서의 4자 다중 입력 혼합 시스템을 위한 실시예의 블록도를 도시한 도면이다.

본 발명에 의하면, 통신 신호의 처리를 위한 기술이 제공된다. 특히, 본 발명은, CELP 도메인에서 DTMF 검출 및 음성 혼합을 수행하는 방법 및 장치를 제공한다. 보다 구체적으로는, 본 발명은 CELP 파라미터로부터의 압축 신호에서 DTMF 톤(tone)의 존재를 검출하고, 또한 복수 셋트의 CELP 파라미터로 표현되는 복수의 입력 압축 음성 신호를 단일 셋트의 CELP 파라미터로 혼합하기 위한 방법 및 장치에 관한 것이다. 단지 예를 들기 위하여, 본 발명은 음성 변환 부호화에 적용되었으나, 본 발명은 보다 넓은 범위에서 응용될 수 있음을 주의하여야 한다.

도 1은 진보된 특성 처리 모듈 100을 도시한 블록도이다. 본 발명의 한 실 시예에 의하면, 상기 모듈은 DTMF 검출 모듈 및 다중 입력 혼합 모듈을 포함하는 것이 바람직하다. 외부 명령들과, 하나 또는 그 이상의 CELP 기반 코덱에 의하여 전송되는 비트열을 언팩(unpack)하여 유도되는 하나 또는 그 이상의 셋트의 CELP 파라미터들이 입력으로서 수신된다. 출력은, 만약 검출된다면, DTMF 신호 및 혼합된 CELP 파라미터이다. 진보된 특성 처리는, 서로 다른 응용 분야에 있어서 서로 다른 구성 또는 토폴로지(topology)를 가능하게 한다. 추가적인 처리 모듈이 진보된 특성 처리 모듈에 포함될 수 있으며, DTMF 검출 모듈이 생략되거나, 또는 다중 입력 혼합 모듈이 생략될 수 있다.

바람직하게는, 이중음 다중 주파수(DTMF) 신호 검출 모듈은, 적어도 하나 또는 그 이상의 CELP 파라미터 (예컨대, 침묵 기술자 프레임(silence descriptor frame))에 기초하여 하나 또는 그 이상의 DTMF 톤(tone)을 결정하게 되어 있고, 상기 DTMF 신호 검출 모듈은 또한 결정된 경우 하나 또는 그 이상의 DTMF 신호를 출력하게 되어 있다. 바람직하게는, 상기 다중 입력 혼합 모듈은 하나 이상의 음성 신호에 의하여 각각 표현되는 하나 이상의 CELP 기반 코덱으로부터의 CELP 파라미터를 단일 셋트의 CELP 파라미터로 처리하게 되어 있다.

DTMF 신호는 전화 다이얼링, 음성 우편, 전자 뱅킹 시스템, 심지어 IP 어드레스를 입력하기 위하여 IP 전화에도 사용되는 등 널리 사용되고 있다. 많은 표준화된 통신 발언 코덱에 있어서, 인밴드 DTMF 신호는 음성 압축 동안 CELP 기반 비트열로 부호화된다. 보다 상세한 내용은 본 명세서 전반에 걸쳐, 특히 이하에서 개시될 것이다.

열여섯 개의 누름 단추식 디지트(digit)(즉, 0 내지 9, A 내지 D, # 및 *)의 어느 하나에 대응하는 DTMF 신호 200이 도 2에 도시되어 있다. 상기 DTMF 신호는 저주파수 톤(low-frequency tone) 및 고주파수 톤(high-frequency tone)을 포함한다. 가능한 네 개의 저주파수와 네 개의 고주파수가 존재한다. 수평 행은 저주파수를 나타내고, 수직 열은 고주파수를 나타낸다. 저주파수는, 697, 770, 852 및 941 Hz이다. 고주파수는, 1209, 1336, 1477 및 1633 Hz이다. 그러므로, 특정의 실시예에 따라, 열여섯 개의 DTMF 신호의 각각은 고유하게 식별된다.

일반적으로, DTMF 알고리즘은 소정의 허용 오차(tolerance) 이내의 주파수를 가진 신호에 대하여 응답하여야 한다. 다소 넓은 허용 오차도 수용될 수 있으나, 넓은 한계는 잡음에의 민감도를 증가시키고, 결국 디지트 시뮬레이션(digit simulation)을 발언에 적용하는 결과를 낳는다. 또한, 상기 DTMF 알고리즘은 수용 가능한 범위 내에 그 전력 수준이 존재하는 신호를 적절히 수신할 수 있어야 한다. 송신 진폭과 전송 감쇄가 서로 다른 주파수에 대하여 서로 다르다는 점을 주의하여야 한다.

나아가, 상기 DTMF 알고리즘은 최소 기대값을 초과하는 지속 기간(duration)을 갖는 가입자로부터의 신호를 식별하여야 한다. 허위 신호의 징후(false signal indication)로부터 보호하기 위하여, 상기 DTMF 알고리즘은 규정된 최대값보다 그 지속 기간이 짧은 신호에는 반응하지 않아야 한다. 유사하게, 규정된 최소값보다 큰 정지 간격(pause interval)은 DTMF 알고리즘에 의하여 식별되어야 한다. 의사(spurious) 결함(glitch) 또는 오류를 최소화하기 위하여, 짧은 전송 중단 또는 잡 음 펄스에 의하여 수신이 방해된 경우 신호의 이중 등록 및 규정된 최대값보다 짧은 방해(interrupt)는 식별되어서는 안된다.

도 3은 DTMF 검출 모듈 300의 상세를 도시한 도면이다. 이 도면은 단지 예를 들기 위한 것으로서, 후술하는 특허 청구 범위를 부당히 제한하는 것은 아니다. 본 발명의 기술 분야에서 통상의 지식을 가진 자는 다양한 변형, 대안 및 수정들을 식별할 수 있을 것이다. 상기 DTMF 검출 모듈은 CELP 파라미터와 외부 제어 명령을 입력으로서 취한다. 상기 DTMF 검출 모듈은, CELP 파라미터로부터의 DTMF 신호의 특징적 특성을 연산하는 DTMF 특성 파라미터 생성 서브 모듈(sub-module), 각 DTMF 신호에 대응되는 특성 데이터를 저장하는 미리 정의된 조회 테이블(look-up table), 입력 특성 파라미터와 조회 테이블 사이의 유사성을 연산하는 비교 서브 모듈, 유한 상태 머신(finite-state machine)을 통해 DTMF 신호를 결정하는 DTMF 결정 서브 모듈, 이전의 서브프레임의 데이터를 저장하는 버퍼를 포함한다. 예를 들어, DTMF 신호의 특징적 특성 파라미터는 신호 에너지 정보(signal energy information), 피치 정보(pitch information) 및 스펙트럼 정보(spectrum information)가 될 수 있다. 이러한 정보는 입력 CELP 정보로부터 획득할 수 있다. 상기 비교 서브 모듈은 입력 특성 파라미터를 조회 테이블과 정합시킴으로써 입력 신호를 점검할 수 있다. 만약 정합 결과가 특정의 문턱값을 상회한다면, 잠정적 DTMF 디지트가 DTMF 결정 서브 모듈로 출력된다. 상기 DTMF 결정 서브 모듈은, DTMF 톤이 존재하는지의 여부를 판단하기 위하여 DTMF 신호 요건 규격에 대해 이전 상태를 점검할 것이다.

바람직하게는, 이중음 다중 주파수 (DTMF) 신호 검출 모듈은, 하나 또는 그 이상의 CELP 파라미터와 외부 명령을 수신하고 하나 또는 그 이상의 DTMF 특성을 연산할 수 있는 DTMF 특성 연산 유닛을 포함한다. 상기 모듈은 또한, 하나 또는 그 이상의 DTMF 신호에 대응하는 하나 또는 그 이상의 특정적 특성 데이터를 포함하는 하나 또는 그 이상의 DTMF 특성 패턴 테이블을 포함한다. DTMF 특성 비교 유닛도 또한 포함된다. 상기 DTMF 특성 비교 유닛은, 하나 또는 그 이상의 DTMF 특정 신호를 식별하고 하나 또는 그 이상의 DTMF 특정 신호를 분류하기 위하여, DTMF 특성 패턴 테이블의 하나 또는 그 이상의 특정 특성 데이터와 상기 DTMF 특성 연산 유닛으로부터 유도된 하나 또는 그 이상의 DTMF 특성을 처리하게 되어 있다. DTMF 특성 버퍼가 포함된다. 상기 특성 버퍼는, 하나 또는 그 이상의 이전 서브프레임 또는 프레임의 하나 또는 그 이상의 DTMF 특성 파라미터와 하나 또는 그 이상의 DTMF 분류 데이터를 저장할 수 있다. 또한, 상기 모듈은, 하나 또는 그 이상의 DTMF 규격에 따라, 현재 그리고 하나 또는 그 이상의 이전 서브프레임 또는 프레임의 DTMF 분류 데이터로부터의 하나 또는 그 이상의 DTMF 신호를 결정하고, 결정된 DTMF 신호를 송신할 수 있다. 바람직하게는, 상기 DTMF 특성 연산 유닛은, 하나 또는 그 이상의 선형 예측 파라미터 정보, 피치 정보 및 에너지 정보를 이용하여, 하나 또는 그 이상의 DTMF 특성을 처리한다. 상기 DTMF 특성 패턴 테이블은, 하나 또는 그 이상의 DTMF 신호에 대응하는 CELP 파라미터로부터 연관된 특정의 미리 연산된 특성 데이터를 포함한다. 다른 실시예에 의하면, 상기 DTMF 특성 비교 유닛은, 국제 통신 협회 (ITU) 규격에 따라, "1", "2", "3", "4", "5", "6", "7", "8", "9", "0", "A', "B", "C", "D", "#" 및 "*"의 열여섯 개 디지트(digit)에 대응하는 특정 DTMF 신호를 분류한다. 실시예에 따라, 상기 DTMF 결정 유닛은, 하나 또는 그 이상의 DTMF 신호와 하나 또는 그 이상의 특정 디지트를 결정하기 위하여, 논리 상태 머신과 DTMF 신호 범주(criteria)를 포함한다. 상기한 특성 및 기타 특성들은 본 명세서 전반에 걸쳐 특히 이하에서 보다 상세히 설명된다.

도 4는 DTMF 검출 알고리즘 400의 흐름도를 도시한 도면이다. 먼저, 선 스펙트럼 쌍(Line Spectral Pairs; LSP), 피치 지체(pitch lag) 및 입력 코덱의 이득(gain)과 같은 CELP 파라미터로부터 상기 DTMF 특성이 연산된다. 두번째로, 연산된 특성들은, 열여섯 개의 가능한 DTMF 신호를 위해 미리 정의된 테이블의 특성들과 비교된다. 만약 일치하는 것이 없으면, DTMF 검출 플래그(flag)를 리셋(reset)하고, DTMF 신호 부재 상태(no DTMF signal state)에 도달한다. 모든 필요 데이터의 갱신을 수행한다. 만약 다른 입력 서브프레임이 존재한다면, 검출 알고리즘이 계속되고, 그렇지 않으면 검출 알고리즘은 종료된다. 만약 DTMF 일치(match)가 존재한다면, 잠정적 검출 결과에 대하여 상기 DTMF 신호 요건 규격을 점검한다. 만약 규약에 합치된다면, DTMF 플래그를 세트(set)하고, DTMF 디지트를 출력으로 내보낸다. 또 다시, 모든 필요 데이터의 갱신을 수행하고, 만약 다른 서브프레임이 존재하면 검출 알고리즘을 계속하고, 그렇지 않으면 검출 알고리즘을 종료한다. 상기 검출 알고리즘은 전적으로 CELP 부호화 파라미터 공간에서 동작하며, 모든 입력 서브프레임에 대하여 실시된다.

도 5의 블록도 500에 도시된 바와 같이, 진보된 특성 처리가 두 개의 코드 여기 선형 예측 (CELP) 기반 음성 코덱 사이에서의 음성 변환 부호화에 적용되어 있다. 발신지 코덱 언팩 모듈(source codec unpacker module)이 CELP 파라미터를 생성하기 위하여 발신지 코덱 비트열을 언팩한다. CELP 파라미터 보간 모듈은, 필요한 경우, 목적지 코덱의 프레임 길이와 서브프레임 길이에 정합되도록 CELP 파라미터를 보간한다. 보간된 CELP 파라미터는 부호화된 목적지 코덱 파라미터에 매핑(mapping)된다. 목적지 코덱 팩커(destination codec packer)는 부호화된 파라미터를 요구되는 형식의 비트열로 패킹(packing)한다. 이러한 전형적인 음성 변환 부호화 방식에 추가하여, 진보된 특성 처리 모듈 501이 음성 변환 부호화기에 부가된다. 상기 진보된 특성 처리 모듈은 그 입력으로서 보간된 CELP 파라미터를 취하고, 원하는 특성을 연산한다. 결과 특성은, 목적지 코덱의 비트열과 평행한 출력되거나(아웃 오브 밴드(out-of-band)로 전송됨), 향상된 처리를 위해 음성 변환 부호화기로 전달되거나(인밴드(in-band)로 전송됨), 인밴드 및 아웃 오브 밴드 모두로 전송된다. 상기 DTMF 검출 알고리즘은 음성 변환 부호화와 병행하여 동작한다. 즉, 그것은 메인 스트림의 음성 변환 부호화를 방해하지 않는다.

예를 들어, DTMF 신호 검출은 GSM-AMR 음성 코덱과 G.723.1 음성 코덱 사이에서의 음성 변환 부호화에 적용된다. 변환 부호화 방법 및 시스템의 예는, 모두 공유되고 모든 목적을 위해 참조에 의하여 본 명세서에 편입되는, Jabri, Marwan, Anwar에 의하여 2002.3.13. 출원된 PCT/US02/08218호의 비디오 및 발언 신호의 변환 부호화 방법 및 장치와, Jabri, Marwan, Anwar, Wang, Jianwei, Gould, Stephen에 의하여 2003.1.8. 출원된 PCT/US03/00649호의 CELP 기반 발언 코드 간의 변환 부호화 방법 및 시스템에서 찾을 수 있다. 특정 실시예에 의하면, DTMF 신호 검출 모듈과 다중 입력 모듈은 CELP 기반 음성 변환 부호화기에 통합된다.

도 6은 DTMF 검출이라는 진보된 특성이 작동된 전 이중 방식(full-duplex)의 GSM-AMR ⇔ G.723.1 음성 변환 부호화기 600의 간략화된 블록도를 도시한다. 본 발명의 DTMF 신호 검출 프로시져를 이용하면, G.723.1 코덱 비트열로의 음성 변환 부호화 프로세스와 병행하여 GSM-AMR 입력 CELP 파라미터에서 DTMF 검출을 수행할 수 있다. 먼저, 20ms 프레임 입력 GSM-AMR 비트열은 네 개의 5ms 서브프레임에 대한 CELP 파라미터로 언팩(unpack)된다. 이러한 네 개의 GSM-AMR 서브프레임은, 그 다음의 20ms 프레임의 CELP 파라미터로부터의 다른 두 개의 GSM-AMR 서브프레임과 함께 CELP 파라미터의 하나의 G.723.1 프레임으로 보간된다. 그 결과의 보간된 CELP 파라미터는 하나의 G.723.1 프레임의 비트열로 매핑되고 패킹된다. 이 프로시져와 병행하여, 상기 네 개의 GSM-AMR 서브프레임의 CELP 파라미터는 상기 음성 변환 부호화기의 DTMF 검출 모듈로 공급된다. 상기 DTMF 검출 모듈은, CELP 파라미터의 각 서브프레임으로부터의 DTMF 특성을 연산하고, 그들을 미리 정의된 DTMF 특성 데이터와 비교하고, DTMF 규격의 최소 요건에 따라 입력 압축 발언 신호가 DTMF 신호를 포함하는지의 여부에 관하여 판단한다. 만약 입력 특성 파라미터가 상기 조회 테이블의 미리 정의된 DTMF 데이터와 일치된다면, 또한 상기한 유한 상태 머신을 통해 DTMF 신호의 요건을 만족시킨다면, 검출된 DTMF 디지트는 출력되도록 송출된다. 만약 상기 DTMF 검출 모듈이 GSM-AMR로부터 G.723.1로의 음성 변환 부호화기에서 작동되었다면, 상기 DTMF 검출 알고리즘은 모든 인입 GSM-AMR 프레임 에 대하여 수행된다. 그리하여, 음성 변환 부호화의 내내 입력 CELP 파라미터로부터의 DTMF 신호를 검출할 수 있게 된다.

이와 유사하게, G.723.1로부터 GSM-AMR로의 변환 부호화에서, 인입 G.723.1 프레임에 대하여 DTMF 검출 연산이 적용될 수 있다. GSM-AMR 코덱과 G.723.1 코덱의 서로 다른 서브프레임의 크기와 프레임의 크기에 의하여, 약간의 변화가 존재한다.

CELP 파라미터로부터 DTMF 신호 고유의 특정한 특성이 연산될 수 있음을 보이기 위하여, 도 7에 잠정적인 DTMF 신호에 대한 12.2kbps의 속도의 인입 GSM-AMR 프레임의 선 스펙트럼 쌍(Line Spectral Pairs; LSP) 파라미터 700을 도시하였다. 도 8은 잠정적인 DTMF 신호에 대한 6.3kbps의 속도의 인입 G.723.1 프레임의 선 스펙트럼 쌍 파라미터 800을 도시하였다. 이와 유사하게, 언팩된 CELP 피치 지체와 이득 정보가 DTMF 디지트를 검출하고 분류하기 위하여 사용된다.

GSM-AMR 코덱은 여덟 가지의 서로 다른 발언 압축 모드에서 동작할 수 있으며, G.723.1 코덱은 두 가지의 서로 다른 발언 압축 모드에서 동작할 수 있음을 주의하여야 한다. 도 5에 도시된 DTMF 검출 알고리즘은 임의의 속도의 GSM-AMR 및 G.723.1 코덱에 적용될 수 있다. 상기 알고리즘은 또한 임의의 다른 CELP 기반 음성 코덱에 적용될 수 있다.

도 9는 복수의 압축된 음성 신호를 입력으로서 수신하는 다중 입력 혼합기 900을 도시하는 개념도이다. 압축된 신호는 서로 다른 코덱 표준을 사용하여 부호화될 수 있다. 상기 다중 입력 혼합기는 상기 복수의 입력으로부터의 발언 정보를 혼합하고, 압축된 신호를 출력한다.

특정의 실시예에 의하면, 상기 다중 입력 혼합 모듈은, 하나 또는 그 이상의 셋트의 CELP 파라미터와 외부 명령을 수신하고 복수의 발언 특성을 검출할 수 있는 특성 검출 유닛을 포함한다. 특정의 실시예에 의하면, 상기 특성 검출 유닛은 복수의 발언 신호 특성을 결정하게 되어 있으며, 상기 결정은, 활성화된 발언(active speech), 침묵 기술자 프레임(silence descriptor frames) 또는 불연속 전송 프레임(discotinuous transmission frames)으로서 CELP 파라미터들에 의하여 표현되는 입력을 분류하는 것을 포함한다. 다른 실시예에 의하면, 상기 특성 검출 유닛은, 하나 또는 그 이상의 LSP 스펙트럼 정보, 피치 정보, 고정 코드북(fixed-codebook) 정보, 에너지 정보를 포함하는 다수의 발언 신호 특성을 결정한다. 상기 모듈은 또한, 하나 이상의 셋트의 CELP 파라미터의 검출된 특성을 처리하며, 미리 결정된 기준에 기초하여 각 셋트의 CELP 파라미터에 대한 중요도의 순서를 등급 매기는 정렬 유닛을 포함한다. 상기 정렬 유닛은 상기 특성 검출 유닛으로부터 데이터를 수신하며, 소정 실시예에 따라 미리 결정된 기준에 기초하여 복수 셋트의 CELP 파라미터의 중요도의 순서를 정렬한다. 특정의 실시예에 의하면, 상기 하나 이상의 셋트의 CELP 파라미터는 하나 이상의 음성 압축 표준에 의하여 특징지워질 수 있거나, 또는 두 셋트의 CELP 파라미터는 동일한 음성 압축 표준에 의하여 특징지워질 수 있거나, 또는 모든 셋트의 CELP 파라미터가 동일한 음성 압축 표준에 의하여 특징지워질 수 있다. 하나 이상의 셋트의 CELP 파라미터는, 만약 그들이 서로 다른 음성 압축 표준을 사용하여 생성되었다면, 특정 실시예에 있어서의 프레임 크기, 서브프레임 크기 또는 다른 특징을 정합시키기 위하여 보간될 수도 있다. 또한, 상기 모듈은 처리 전략을 결정하고, 처리를 위해 일부 또는 전체 셋트의 CELP 파라미터를 선택하며, 하나 이상의 셋트의 CELP 파라미터의 처리를 제어할 수 있는 혼합 결정 유닛을 포함한다. 특정의 실시예에 의하면, 상기 혼합 결정 유닛은, 처리될 CELP 파라미터의 셋트를 결정하기 위하여 상기 정렬 유닛으로부터 데이터와 외부 명령을 수신한다. 하나 이상의 셋트의 CELP 파라미터를 처리할 수 있는 혼합 연산 유닛이 포함된다. 바람직하게는, 혼합 연산 유닛이 단일 셋트의 CELP 파라미터를 통과시킬 수 있거나, 또는 복수 셋트의 CELP 파라미터를 선택하고 혼합할 수 있거나, 또는 침묵 기술 데이터(silence description data) 정보를 송신할 수 있다.

통상적인 음성 혼합 솔루션은 직렬 방식으로 음성 코덱 입력을 처리한다. 다중 비트열 입력에 수록된 발언 정보가 획득되어 복호화된다. 입력의 음성 혼합은 발언 도메인(speech domain)에서 수행되며, 그리고 나서 혼합된 발언은 재부호화된다. 음성 혼합 응용의 예는, 회의 호(conference call) 중에 복수의 채널을 처리하는 회의 브리지(conference bridge)이다. 회의 호 시나리오에 의하면, 만약 참여자들이 서로 다른 음성 코덱을 보유한 경우, 재부호화 처리는 혼합된 발언을 위한 복수의 특정한 처리들을 수반한다.

도 10은 직렬 방식에서의 통상적인 음성 혼합 솔루션 1000을 도시한 도면이다. 스피커 1은 코덱 A의 압축 형식으로 발언 정보를 송신하며, 스피커 2는 코덱 B의 압축 형식으로 발언 정보를 송신한다. 청취자는 코덱 C의 압축 형식을 수용한 다. 스피커 1 및 2로부터의 발언을 혼합하고 혼합된 발언을 청취자에게 송신하기 위하여, 음성 혼합기는 두 개의 입력 음성 압축 형식을 동일한 발언 도메인으로 변환하기 위하여 복호화기 A 및 B를 필요로 하며, 그리고 나서 입력 발언 신호들을 혼합한다. 혼합된 신호를 송신하기 전에, 이들은 코덱 C의 형식으로 재부호화되어야 한다.

음성 혼합에 있어서 직렬 기반 방식이 효율적이지 못하다는 것은 명백하다. 그것은, 인입되는 비트열을 발언 신호로 완전히 복호화하며, 발언 공간에서 이들 신호들을 결합시키며, 혼합된 발언 신호를 송출 비트열로 완전히 부호화하는 작업을 수반한다.

도 11은, 본 발명에 의하여 상기한 실시예에 의한 다중 입력 혼합 모듈을 더 도시한 블록도이다. 상기 다중 입력 혼합 모듈은, 특성 검출 서브 모듈, 정렬 서브 모듈, 혼합 결정 서브 모듈 및 혼합 연산 서브 모듈을 포함한다. 상기 특성 검출 서브 모듈은, 각 셋트의 CELP 파라미터로부터의 발언 신호 특성을 연산한다. 만약 CELP 파라미터가 서로 다른 CELP 압축 표준으로부터 생성된다면, 프레임 크기, 서브프레임 크기 또는 기타 특징을 정합시키기 위하여, CELP 파라미터의 보간이 요구된다. 연산된 신호 특성은 신호 에너지, 프레임 타입(frame type) 및 신호 타입(signal type)(즉, 활성 발언, 비활성 발언, 불연속 전송 등)을 포함한다. 상기 정렬 서브 모듈은, 연산된 신호 특성으로부터의 각 셋트의 CELP 파라미터의 중요도를 연산하며, 그들의 중요도에 따라 입력 셋트의 CELP 파라미터를 정렬한다. 상기 혼합 결정 서브 모듈은, 혼합 전략을 결정하기 위하여, 정렬 결과로부터의 요 소들, 외부 명령 및 이전의 혼합 결정을 결합한다. 상기 결정은 CELP 파라미터의 어떠한 셋트도 선택하지 않는다거나, CELP 파라미터의 단 한 셋트만이 선택된다거나, CELP 파라미터의 일부 셋트들이 선택된다거나, CELP 파라미터의 모든 셋트가 선택된다거나 하는 것일 수 있다. 상기 혼합 연산 서브 모듈은 선택된 셋트의 CELP 파라미터를 혼합하고 혼합된 CELP 파라미터를 출력한다.

예를 들어, 상기 다중 입력 혼합 모듈은 회의 호(conference call) 도중에 입력 채널을 혼합하기 위하여 사용될 수 있다. 1, 2, 3으로 표시된 세 명의 참석자가 상기 회의 호에 참석 중이고 특정 시간에 참석자 1만이 이야기하고 있다. 참석자 1을 향한 방향에 대한 혼합 결정은, 참석자 2 및 3이 침묵함에 따라, 어떠한 입력 채널도 선택하지 않는 것이다. 참석자 2 및 3을 향한 방향에 대한 혼합 결정은, 활성화된 발언이 포함된 것으로서 단 하나의 채널만이 검출됨에 따라, 참석자 1로부터의 채널만을 선택하는 것이다.

만약 참석자 1 및 2가 모두 특정 시간에 이야기한다면, 참석자 3을 향한 혼합 결정은 입력 채널 1 및 2를 선택하는 것이다. 그러나, 참석자 1 및 2를 향한 방향에 대한 혼합 결정은, 참석자 3으로부터의 입력 채널이 침묵하고 있으므로, 단 하나의 채널만을 선택하는 것이다. 상기 혼합 모듈은, 원하지 않는 울림(echo)을 방지하기 위하여, 참석자의 발언을 자기 자신과 혼합하지 않도록 구성하는 것이다.

몇 가지의 혼합 연산 방식이 존재한다. 예를 들어, 두 개의 입력 A 및 B를 혼합하기 위하여, 각 인입 스트림에 대한 전체 서브프레임의 여기 에너지가 다음 식으로 주어진다. 즉,

및

여기서, e _A (n) 및 e _B (n)은 각각 입력 A 및 B의 여기 벡터이며, N은 목적지 코덱의 서브프레임의 크기이며, Ex _A 및 Ex _B 는 각각 입력 A 및 B의 에너지이다.

피치 지체는 다음으로부터 유도될 수 있다. 즉,

여기서, PL _A 및 PL _B 는 각각 입력 A 및 B의 피치 지체이며, PL _mi _x는 혼합된 신호의 피치 지체이다.

새로운 LSP 파라미터를 생성하는 데에는 몇 가지의 서로 다른 방법이 존재한다. 이들의 첫번째는, LSP 파라미터를 스펙트럼 파라미터로 변환하고, 서브프레임 에너지에 따라 스펙트럼 파라미터를 평균화하며, 스펙트럼 파라미터로부터 다시 LSP 파라미터로 역 변환하는 작업을 수반한다. 스펙트럼 파라미터의 평균화 작업을 하기 등식에 나타내었다. 즉,

여기서, LSF _A 및 LSF _B 는 각각 입력 A 및 B의 스펙트럼 파라미터이며, LSF _mix 는 혼합된 신호의 스펙트럼 파라미터이다.

다른 방법은, 개별 여기 신호에 LSP 기여도를 재도입하고, 필터링된 여기 신호를 결합하여, 그리고 나서 LSP 파라미터와 합성 여기(resultant excitation)를 재연산하는 것이다.

다른 방법은, 낮은 에너지의 LSP 파라미터를 무시하고, 높은 에너지의 입력의 LSP 파라미터들만을 사용하거나, 또는 채널 우선도와 같은 소정의 제어 파라미터들에 기초하는 것을 수반한다.

LSP 혼합 연산과 유사하게, 혼합된 여기 파라미터도 몇 가지의 서로 다른 방법에 의하여 연산될 수 있다. 이들은 서브프레임 에너지에 따라 여기 파라미터를 평균화하거나, 혼합된 LSP 파라미터를 이용하여 그들을 재연산하거나, 또는 가장 높은 에너지 입력의 여기만을 사용하여 획득할 수 있다.

전화 회의와 같은 여러가지 시나리오에 의하면, 모든 셋트의 CELP 파라미터가 활성화된 발언을 나타내는 것은 아니다. 이러한 경우에, CELP 파라미터는 침묵 기술 프레임을 나타낸다. 이러한 프레임들은 무시된다. 다시 말하면, 혼합되는 유일한 CELP 파라미터의 셋트는, 발언을 포함하는 신호를 나타내는 것들이다. 이것은, 활성화된 발언을 나타내지 않는 CELP 파라미터의 셋트에 전송되는 잡음을 제 거할 뿐만 아니라, 연산량을 감소시킨다.

도 12는 CELP 도메인의 다중 입력 혼합 방법 1200의 흐름도를 도시한 도면이다. 상기 방법은, CELP 파라미터의 각 셋트에 신호 특성 연산을 수행하는 단계; 특성 연산의 결과에 따라 CELP 파라미터의 셋트의 중요도의 순서를 정리하는 단계; 외부 명령에 의하여 규정된 소정의 우선순위를 점검하는 단계; 그 중요도와 우선순위에 따라 혼합될 CELP 파라미터의 셋트를 결정하는 단계; 선택된 CELP 파라미터의 셋트를 혼합하는 단계; 및 마지막으로 혼합된 CELP 파라미터를 출력하는 단계를 수반한다.

혼합 전략에는 주로 세 가지 타입이 존재한다. 첫 번째 경우에는, 어떠한 CELP 파라미터의 셋트도 활성화된 발언을 나타내지 않는 경우로서, 상기 혼합 연산은 침묵 프레임 기술자 또는 불연속 전송 정보를 출력한다. 두 번째 경우에는, 단 하나의 CELP 파라미터 셋트만이 활성화된 발언을 나타내는 경우 또는 단 하나의 CELP 파라미터 셋트만이 혼합되도록 선택된 경우로서, 상기 혼합 연산은 혼합된 결과로서 선택된 CELP 파라미터를 출력한다. 세 번째 경우에는, 하나 이상의 CELP 파라미터 셋트가 혼합을 위하여 선택된 경우로서, 혼합 연산은 선택된 CELP 파라미터의 셋트를 혼합하고 그 혼합된 결과를 출력한다.

도 13은, 본 발명에 의한 음성 변환 부호화기의 CELP 도메인에서의 다중 입력 혼합 1300의 실시예의 블록도를 도시한 도면이다. 다중 입력 혼합을 구비한 상기 음성 변환 부호화기는 둘 이상의 참석자를 연결시킨다. 예를 들면, 다중 입력 혼합 시스템은 세 명의 참석자를 연결시킨다. 두 개의 발신지 코덱의 입력 압축 발언 신호의 혼합과 목적지 코덱 형식으로의 변환 부호화를 수행하기 위하여, 다중 입력 혼합 시스템은, 첫 번째 입력 비트열 데이터를 그의 CELP 파라미터로 언팩(unpack)하는 발신지 코덱 언팩커 모듈(source codec unpacker module); 두 번째 입력 비트열을 그의 CELP 파라미터로 언팩하는 다른 발신지 코덱 언팩커 모듈; 상기 첫번째 발신지 코덱 CELP 파라미터를, 목적지 코덱의 프레임 및 서브프레임 크기와 정합된 보간된 CELP 파라미터로 변환하는 보간 모듈; 상기 두 번째 발신지 코덱 CELP 파라미터를, 목적지 코덱의 프레임 및 서브프레임 크기와 정합된 보간된 CELP 파라미터로 변환하는 보간 모듈; 두 개의 입력으로부터의 보간된 CELP 파라미터를 혼합하고 혼합된 CELP 파라미터를 다음 단(stage)으로 송신하는 혼합 모듈; 목적지 코덱에 따라 혼합된 CELP 파라미터를 양자화된 CELP 파라미터로 변환하는 목적지 코덱 매핑 모듈; 및 목적지 코덱 표준에 따라 양자화된 CELP 파라미터를 비트열로 변환하는 목적지 코덱 패커(packer) 모듈을 포함한다.

상기 실시예에 의하면, 인입 비트열은 발언 공간으로 완전히 복호화되지 않으며, 오히려 CELP 파라미터 공간에서 혼합된다. 이것은, 인입 비트열이 발언 신호로 완전히 복호화되지 않으며 다시 완전히 재부호화되지 않으므로, 상당히 완화된 연산 요건이라는 이점을 제공한다.

도 14는 음성 변환 부호화에서의 다중 입력 혼합기 1400의 다른 구성의 블록도를 도시한다. 혼합된 압축 음성 신호가 서로 다른 프레임 크기를 갖는 두 개의 목적지 코덱으로 송신되도록 요구된다.

도 15는 VoIP(Voice-over IP) 패킷망과 무선 통신 시스템에서의 회의 호에 사용된 다중 입력 혼합기를 구비한 음성 변환 부호화기 1500의 일예를 도시한 도면이다. 네 명의 참석자가 회의 호에 참여하였다. 두 명의 참석자는 패킷망으로부터 참여하고, 다른 두 명의 참석자는 무선 통신 시스템으로부터 참여한다. 모든 음성 입력 신호는 압축된 음성 형식이다. 이러한 형식들은 서로 다르다. 이들은 음성 코덱 G.729, G.723.1 및 GSM-AMR에 의하여 생성된다. 패킷망의 참석자 A 및 B는 각각 G.729 코덱과 G.723.1 코덱을 사용하며, 무선 통신 시스템의 참석자 C 및 D는 GSM-AMR 코덱을 사용한다.

도 16은 세 가지 음성 코덱 G.729, G.723.1 및 GSM-AMR 사이의 서로 다른 프레임 크기 및 서브프레임 크기를 도시한다. 이러한 세 가지 음성 코덱은 서로 다른 프레임 길이를 갖는다. G.729 코덱은 10ms의 프레임 길이를 갖는다. GSM-AMR 코덱은 20ms의 프레임 길이를 갖는다. G.723.1은 30ms의 프레임 길이를 갖는다. 나아가, G.729는 하나의 프레임당 두 개의 서브프레임을 가지는 반면, GSM-AMR 및 G.723.1은 하나의 프레임당 네 개의 서브프레임을 갖는다.

도 17은, 본 발명에 의한 G.729, G.723.1 및 GSM-AMR 코덱들 사이의 모든 방향에 대한 다중 입력 혼합기 1700을 구비한 음성 변환 부호화기의 블록도를 도시한다. 참석자로의 각 접속은 입력 및 출력 비트열 모두의 경로를 갖는다. 따라서, 각 코덱 표준에 대하여, 상기 변환 부호화기는, 입력 및 출력 비트열을 다루는 언팩커 모듈(unpacker module) 및 패커 모듈(packer module), 목적지 코덱에서의 참석자의 그것과 다른 모든 참석자의 발언 정보를 혼합하기 위한 혼합 모듈, 및 혼합된 CELP 파라미터를 양자화된 CELP 파라미터로 변환하기 위한 특정 매핑 모듈 (specific mapping module)을 포함한다. 회의 호에 사용되는 세 가지의 서로 다른 코덱 G.729, G.723.1 및 GSM-AMR이 존재하기 때문에, 각 접속은 하나의 언팩커 모듈 이후에 두 개의 보간 모듈을 필요로 한다. 상기 두 개의 보간 모듈은, 발신지 코덱 CELP 파라미터를, 다른 목적지 코덱의 프레임 크기, 서브프레임 크기 및 다른 특징과 정합된 보간된 CELP 파라미터로 보간한다. 예를 들어, 참석자 A로부터의 입력 비트열은 G.729 코덱 형식을 갖는다. 참석자 A에 있어서, 참석자 B에 대한 목적지 코덱은 G.723.1이며, 참석자 C 및 D에 대하여는 GSM-AMR이다. G.729 접속은, G.729 CELP 파라미터를 AMR CELP 파라미터로 변환하기 위한 보간 모듈 G.729 -> AMR과, G.729 CELP 파라미터를 G.723.1 CELP 파라미터로 변환하기 위한 보간 모듈 G.729 -> G.723.1을 필요로 한다. 따라서, 다중 입력 혼합 방법에 관하여 상기한 바에 의하면, 상기 시스템은 완전 복호화 및 재부호화 처리를 요하지 않은 채 다중 입력 혼합 기능을 구비한 음성 변환 부호화를 수행할 수 있다. 실시예에 따라서, 다른 변경, 수정 및 대안 등이 존재할 수 있다. 다른 CELP 변환 부호화기의 특정 예는 본 명세서의 전체에 걸쳐, 특히 이하에서 상세히 발견할 수 있다.

본 명세서에 기술된 CELP 도메인에서의 DTMF 신호 검출 및 다중 입력 혼합에 관한 발명은, G.723.1, GSM-AMR, EVRC, G,728, G.729, G.729A, QCELP, MPEG-4 CELP, SMV, AMR-WB, VMR 등과 같은 CELP 기반의 모든 음성 코덱과 코드 여기 선형 예측 음성 부호화를 이용하는 임의의 음성 코덱에 의하여 생성되는 CELP 파라미터들에 대하여 일반적인 것이다.

본 발명의 바람직한 실시예에 관한 상기 설명은 본 발명의 기술 분야에서 통 상의 지식을 가진 자 누구에게나 본 발명을 실시하고 이용할 수 있도록 하기 위하여 제공된 것이다. 이러한 실시예의 다양한 변형들이 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 이미 명백할 것이며, 여기에서 정의된 상위 원칙은 본 발명의 수완을 이용하지 않고도 다른 실시예에 적용될 수 있다. 그리하여, 본 발명은 여기에서 개시된 실시예에 한정되는 것으로 해석되어서는 아니되며, 여기에서 개시된 원칙과 신규한 특성들과 모순되지 않는 가장 넓은 범위가 허용되어야 한다.

Claims

통신 신호를 처리하기 위한 장치에 있어서,

상기 장치는 이중 톤 변조 주파수(DTMF) 신호 검출 모듈을 포함하고,

상기 DTMF 신호 검출 모듈은:

CELP 기반 도메인에서, 하나 또는 그 이상의 입력 CELP 파라미터들에 의해 표현되는 입력 신호를 수신하고;

상기 하나 또는 그 이상의 입력 CELP 파라미터와 연관된 정보를 처리하고;

적어도 상기 하나 또는 그 이상의 입력 CELP 파라미터와 연관된 정보를 기초로 하나 또는 그 이상의 DTMF 톤을 결정하고;

하나 또는 그 이상의 DTMF 톤이 결정된다면 이를 출력하며,

상기 하나 또는 그 이상의 DTMF 톤은 상기 CELP 기반 도메인에서의 상기 입력 신호와 연관되는 장치.
제1항에 있어서, 상기 DTMF 신호 검출 모듈은,

하나 또는 그 이상의 CELP 파라미터들과 외부 명령들을 수신하고 하나 또는 그 이상의 DTMF 특성을 연산하는 DTMF 특성 연산 유닛;

하나 또는 그 이상의 DTMF 신호에 대응하는 하나 또는 그 이상의 특정 특성 데이터를 저장하는 하나 이상의 DTMF 특성 패턴 테이블;

하나 또는 그 이상의 DTMF 특정 신호를 식별하고 하나 또는 그 이상의 DTMF 특정 신호를 분류하기 위하여, 상기 DTMF 특성 패턴 테이블의 하나 또는 그 이상의 특정 특성 데이터와 상기 DTMF 특성 연산 유닛으로부터 유도된 하나 또는 그 이상의 DTMF 특성을 처리하는 DTMF 특성 비교 유닛;

하나 또는 그 이상의 이전의 서브프레임 또는 프레임의 하나 또는 그 이상의 DTMF 특성 파라미터와 하나 또는 그 이상의 DTMF 분류 데이터를 저장하는 DTMF 특성 버퍼; 및

하나 또는 그 이상의 DTMF 규격에 따라 현재의 그리고 하나 또는 그 이상의 이전의 서브프레임 또는 프레임들의 DTMF 분류 데이터로부터 하나 또는 그 이상의 DTMF 신호를 결정하고, 결정된 DTMF 신호를 내보내는 DTMF 결정 유닛을 포함하는 장치.
청구항 3은(는) 설정등록료 납부시 포기되었습니다.

제2항에 있어서, 상기 DTMF 특성 연산 유닛은 적어도 하나 또는 그 이상의 선형 예측 파라미터 정보, 피치 정보 및 에너지 정보를 이용하여 하나 또는 그 이상의 DTMF 특성들을 처리하는 장치.
청구항 4은(는) 설정등록료 납부시 포기되었습니다.

제2항에 있어서, 상기 DTMF 특성 패턴 테이블은 하나 또는 그 이상의 DTMF 신호에 대응하는 CELP 파라미터로부터 연관된 특정의 미리 연산된 특성 데이터를 저장하는 장치.
청구항 5은(는) 설정등록료 납부시 포기되었습니다.

제2항에 있어서, 상기 DTMF 특성 비교 유닛은, 국제 통신 협회 (ITU) 규격에 따라, "1", "2", "3", "4", "5", "6", "7", "8", "9", "0", "A', "B", "C", "D", "#" 및 "*"의 열여섯 개 디지트(digit)에 대응하는 DTMF 특정 신호를 분류하는 장치.
제2항에 있어서, 상기 DTMF 결정 유닛은, 상기 하나 또는 그 이상의 DTMF 신호 및 하나 또는 그 이상의 특정 디지트를 결정하기 위하여, 논리 상태 머신과 DTMF 신호 범주(criteria)를 더 포함하는 장치.
발언 신호 도메인으로 복호화하지 않고 CELP 도메인에서 작동하는, 통신 신호를 처리하기 위한 장치이며,

상기 장치는, 하나 이상의 음성 신호 각각을 표현하는 하나 이상의 CELP 기반 코덱으로부터의 CELP 파라미터들을 단일 셋트의 CELP 파라미터로 처리하는 다중 입력 혼합 모듈을 포함하고,

상기 다중 입력 혼합 모듈은:

CELP 파라미터들과 외부 명령들의 하나 또는 그 이상의 셋트를 수신하고, 복수의 발언 특성을 검출하는 특성 검출 유닛;

하나 이상의 셋트의 CELP 파라미터의 검출된 특성들을 처리하고, 미리 결정된 기준에 기초하여 CELP 파라미터의 각 셋트의 중요도를 평가하는 정렬 유닛;

처리 전략을 결정하고, 처리를 위한 CELP 파라미터의 일부 또는 모든 셋트를 선택하고, 하나 이상의 셋트의 CELP 파라미터의 처리를 제어하는 혼합 결정 유닛; 및

하나 이상의 셋트의 CELP 파라미터를 처리하는 혼합 연산 유닛을 포함하는 장치.
청구항 8은(는) 설정등록료 납부시 포기되었습니다.

제7항에 있어서, 하나 이상의 셋트의 CELP 파라미터가 하나 이상의 음성 압축 표준에 의해 특징져지거나, 두 셋트의 CELP 파라미터가 동일한 음성 압축 표준에 의해 특징져지거나, 또는 모든 셋트의 CELP 파라미터가 동일한 음성 압축 표준에 의해 특징져질 수 있는 장치.
제7항에 있어서, 하나 이상의 셋트의 CELP 파라미터가 다른 압축 표준을 사용하여 생성된 경우, 프레임 크기, 서브프레임 크기 또는 다른 특징에 정합시키기 위하여 보간될 수 있는 장치.
제1항에 있어서, 상기 DTMF 신호 검출 모듈에 접속된 변환 부호화 모듈을 더 포함하는 장치.
제7항에 있어서, 상기 다중 입력 혼합 모듈에 접속된 변환 부호화 모듈을 더 포함하는 장치.
삭제
청구항 13은(는) 설정등록료 납부시 포기되었습니다.

제1항에 있어서, 상기 CELP 파라미터들은 침묵 기술자 프레임(silence descriptor frame)을 나타내는 장치.
제7항에 있어서, 상기 다중 입력 혼합 모듈은 동적 토폴로지(dynamic topology)를 가지며, 입력 압축 신호의 개수에 따라 다른 토폴로지를 구성할 수 있는 장치.
제1항에 있어서, 상기 DTMF 신호 검출 모듈은 CELP 기반 음성 변환 부호화기에 통합되는 장치.
제7항에 있어서, 상기 특성 검출 유닛은 복수의 발언 신호 특성을 결정하고, 상기 결정은 CELP 파라미터들에 의해 표현되는 입력을 활성화된 발언(active speech), 침묵 기술자 프레임, 또는 불연속 전송 프레임으로 분류하는 것을 포함하는 장치.
제7항에 있어서, 상기 특성 검출 유닛은, LSP 스펙트럼 정보, 피치 정보, 고정된 코드북 정보, 및 에너지 정보 중 하나 또는 그 이상을 포함하는 복수의 발언 신호 특성을 결정하는 장치.
제7항에 있어서, 상기 정렬 유닛은 상기 특성 검출 유닛으로부터 데이터를 수신하고, 미리 결정된 기준에 기초하여 다수의 셋트의 CELP 파라미터의 중요도를 정리하는 장치.
제7항에 있어서, 상기 혼합 결정 유닛은, 처리된 CELP 파라미터들의 셋트를 결정하기 위해 상기 정렬 유닛으로부터의 데이터 및 외부 제어 명령을 수신하는 장 치.
제7항에 있어서, 상기 혼합 연산 유닛은 단일 셋트의 CELP 파라미터들을 통과시키거나, 다수의 셋트의 CELP 파라미터들을 선택하고 혼합하거나, 또는 침묵 기술자 데이터 정보를 송신할 수 있는 장치.
발언 신호로 복호화하지 않고, DTMF 톤을 결정하고 하나 또는 그 이상의 CELP 기반 코덱들 각각의 하나 또는 그 이상의 CELP 파라미터들을 사용하여 다수의 입력 압축 신호를 처리하는 단계를 포함하는, CELP 기반의 도메인에서 통신 신호를 처리하는 방법이며,

하나 또는 그 이상의 셋트의 CELP 파라미터와 외부 명령을 입력하는 단계;

하나 또는 그 이상의 CELP 파라미터들로부터 압축된 신호의 하나 또는 그 이상의 DTMF 톤을 결정하는 단계;

다수의 셋트의 CELP 파라미터를 단일 셋트의 CELP 파라미터로 처리하는 단계; 및

만약 검출된다면 하나 또는 그 이상의 결정된 DTMF 톤과 상기 단일 셋트로 처리된 CELP 파라미터를 출력하는 단계를 포함하는 방법.
청구항 22은(는) 설정등록료 납부시 포기되었습니다.

제21항에 있어서, 상기 CELP 파라미터가, LSP 정보, 피치 정보, 여기 벡터 정보, 에너지 정보, 고정된 코드북 정보, 및 침묵 기술자 정보 중 하나 또는 그 이 상을 포함하는 방법.
제21항에 있어서, 상기 DTMF 톤을 결정하는 단계는,

CELP 파라미터로부터 DTMF 특성 파라미터를 유도하는 단계;

하나 또는 그 이상의 결과를 출력하기 위해 DTMF 신호 특성 데이터의 미리 정의된 조회 테이블(look-up table)로 특성 파라미터들을 처리하는 단계;

상기 하나 또는 그 이상의 결과를 DTMF 결정 유닛으로 전송하는 단계;

DTMF 신호 정의 표준에 따라 하나 또는 그 이상의 DTMF 신호를 출력하기 위해 상기 DTMF 결정 유닛을 이용하여 하나 또는 그 이상의 이전의 서브프레임의 분류 결과를 결정하는 단계;

현재의 서브프레임의 하나 또는 그 이상의 결과를 저장하고, 하나 또는 그 이상의 이전의 서브프레임의 결과를 갱신하는 단계; 및

만약 DTMF 신호가 검출된다면, DTMF 톤을 출력하는 단계를 포함하는 방법.
제21항에 있어서, 상기 하나 또는 그 이상의 DTMF 톤을 검출하는 단계는 서브프레임 마다에 대해서 수행되는 방법.
제23항에 있어서, 상기 하나 또는 그 이상의 DTMF 특성을 유도하는 단계는 LSP 스펙트럼 정보, 피치 정보, 및 에너지 정보 중 하나 또는 그 이상을 사용하는 방법.
제23항에 있어서, 상기 DTMF 신호 특성 데이터의 미리 정의된 조회 테이블은, 선택된 CELP 압축 형식으로 DTMF 신호를 CELP 파라미터로 변환함으로써 미리 연산되고, DTMF 검출 처리 전에 테이블에 미리 저장되는 방법.
제21항에 있어서, 다수의 셋트의 CELP 파라미터를 처리하는 단계는 둘 이상의 입력 코덱의 CELP 파라미터를 혼합할 수 있는 방법.
제21항에 있어서, 다수의 셋트의 CELP 파라미터를 처리하는 단계는 침묵 기술자 프레임과 불연속 전송을 취급할 수 있는 방법.
제21항에 있어서, 상기 다수의 셋트의 CELP 파라미터를 처리하는 단계는,

입력 CELP 파라미터의 각 셋트에 대한 신호 특성 연산을 수행하는 단계;

입력 CELP 파라미터의 각 셋트의 중요도의 순서를 상기 신호 특성 연산의 결과에 따라 정리하는 단계;

상기 중요도의 순서 및 외부 명령에 따라 혼합 전략을 결정하는 단계;

상기 선택된 혼합 전략에 따라 입력된 CELP 파라미터의 셋트를 혼합하는 단계; 및

상기 혼합된 CELP 파라미터를 출력하는 단계를 포함하는 방법.
제29항에 있어서, 상기 신호 특성 연산을 수행하는 단계는, LSP 정보, 피치 정보, 여기 정보, 고정 코드북 정보, 에너지 정보, 및 침묵 프레임 정보 중 하나 또는 그 이상을 사용하여 신호 특성을 연산하는 방법.
제29항에 있어서, 상기 혼합 전략은 CELP 파라미터의 셋트들 중 최고의 중요도를 갖는 오직 하나의 셋트를 선택하는 단계와, 외부 명령에 따라 CELP 파라미터의 특정 셋트를 선택하는 단계와, 입력된 CELP 파라미터의 셋트들 중 일부를 혼합하는 단계 또는 입력된 CELP 파라미터의 셋트들 모두를 혼합하는 단계를 포함하는 방법.
청구항 32은(는) 설정등록료 납부시 포기되었습니다.

제29항에 있어서, 상기 입력된 CELP 파라미터의 셋트들은 회의 호(conference call)로의 입력 채널이고, 혼합을 위해 선택된 CELP 파라미터의 셋트들은 지연에 기인한 울림(echo)을 피하기 위해 목적지 채널의 CELP 파라미터를 포함하지 않는 방법.
발언 신호 도메인으로 복호화하지 않고 CELP 도메인에서 작동하는 통신 신호의 특성 처리를 위한 장치이며,

적어도 하나 또는 그 이상의 입력 CELP 파라미터에 기초하여 하나 또는 그 이상의 이중 톤 변조 주파수(DTMF) 톤을 결정하고, 하나 또는 그 이상의 DTMF 신호가 결정된다면 이를 출력하는 DTMF 신호 검출 모듈을 포함하는 장치.
발언 신호 도메인으로 복호화하지 않고 CELP 도메인에서 작동하고, 이중 톤 변조 주파수(DTMF) 신호 검출 모듈을 포함하는, 통신 신호의 특성 처리를 위한 장치에 있어서,

상기 DTMF 신호 검출 모듈에 접속되고, 하나 이상의 음성 신호 각각을 표현하는 하나 이상의 CELP 기반 코덱(codec)으로부터의 CELP 파라미터들을 단일 셋트의 CELP 파라미터로 처리하는 다중 입력 혼합 모듈을 포함하는 장치.
발언 신호 도메인으로 복호화하지 않고 CELP 기반 도메인에서 작동하는, 통신 신호를 처리하기 위한 장치이며,

상기 장치는 다중 입력 혼합 모듈을 포함하고,

상기 다중 입력 혼합 모듈은:

각각이 하나 또는 그 이상의 신호를 표현하는 하나 또는 그 이상의 셋트의 CELP 파라미터들을, 하나 또는 그 이상의 CELP 기반 코덱으로부터 수신하고;

상기 수신된 하나 또는 그 이상의 셋트의 CELP 파라미터들을 단일 셋트의 CELP 파라미터로 처리하고;

합성 신호를 표현하는 상기 단일 셋트의 CELP 파라미터를 출력하며,

상기 하나 또는 그 이상의 셋트의 CELP 파라미터들을 상기 발언 신호 도메인으로 복호화하지 아니하고, 상기 하나 또는 그 이상의 신호를 상기 발언 신호 도메인에서 상기 합성 신호로 혼합하지 아니하며, 상기 합성 신호를 상기 발언 신호 도메인으로부터 CELP 기반 도메인으로 부호화하지 않고, 상기 하나 또는 그 이상의 셋트의 CELP 파라미터들이 상기 단일 셋트의 CELP 파라미터로 처리되는 장치.
제35항에 있어서,

상기 다중 입력 혼합 모듈에 접속된 변환부호화 모듈을 더 포함하는 장치.
삭제
제35항에 있어서,

상기 다중 입력 혼합 모듈은 CELP 기반 음성 변환 부호화기에 통합되는 장치.