KR100832144B1

KR100832144B1 - 지각적으로 개선된 음향신호의 엔코딩

Info

Publication number: KR100832144B1
Application number: KR1020037005479A
Authority: KR
Inventors: 스테판 브룬; 수산네 안데르쏜
Original assignee: 텔레폰악티에볼라겟엘엠에릭슨(펍)
Priority date: 2000-10-20
Filing date: 2001-09-07
Publication date: 2008-05-27
Also published as: US6611798B2; KR20030048061A; AU8460601A; ATE380378T1; EP1328923B1; US20020049584A1; JP2004515801A; CN1470048A; CA2424373C; DE60131766T2; CA2424373A1; WO2002033692A1; ES2296791T3; EP1328923A1; AU2001284606B2; EP1199812A1; CN1312658C; PT1328923E; JP5222452B2; DE60131766D1

Abstract

본 발명은, 엔코딩된 정보를 기반으로 재생된 대응신호(z)가 인지적으로 높은 품질을 가지도록 음향 소오스신호(x)를 엔코딩하는 것에 관한 것이다. 음향 소오스신호(x)는 송신기(300)의 코딩장치에 의해 적어도 하나의 기본 코드화 신호(P)로 엔코딩된다. 따라서, 적어도 하나의 기본 코드화 신호(P)는 음향신호(x) 중 인지적으로 중요한 특징들을 나타낸다. 송신기(300)의 코딩장치는 기본 코드화 신호(P)가 기초로 하는 신호성분들 중 적어도 하나를 수신하고 또한 이에 응해 평탄화된 신호성분을 발생하는 적어도 하나의 스펙트럼 평탄화 유닛(305a)를 포함한다. 그럼 다음, 적어도 하나의 강화된 코드화 신호(P_(E))가 대응하는 평탄화 신호성분에서부터 생성된다.

Description

지각적으로 개선된 음향신호의 엔코딩{Perceptually Improved Encoding of Aucoustic Signals}

본 발명은, 엔코딩된 정보를 기반으로 재구성된 대응신호가 공지된 엔코딩 해결방법에 따른 것 보다 높은 감각 음질을 가지도록 음향 소오스신호의 엔코딩에 관한 것이다. 보다 특히, 본 발명은 청구항 제1항과 제31항의 전재부에 따라 전송매체를 통한 전송을 위한 엔코딩된 정보를 생성하기 위한 음향신호들의 엔코딩과, 청구항 제15항과 제37항의 전재부에 따라 전송매체를 통해 전송되는 엔코딩된 정보의 디코딩에 각각 관한 것이다. 본 발명은 또한 청구항 제44항에 따른 통신시스템과, 청구항 제13항과 제29항에 따른 컴퓨터 프로그램들과 그리고 청구항 제13항과 30항 따른 컴퓨터 판독가능 매체에 관한 것이다.

오디오와 음성 코덱(codec = coder 와 decoder)에 대해 많은 상이한 응용이 있다. 예컨대, 고정 및 이동통신 시스템들과 비디오회의 시스템에서 음향신호들의 효율적인 비트율(bit-rate) 전송을 위해 엔코딩과 디코딩 방법이 사용된다. 또한, 음성코덱들은 비밀전화에 활용되고 또한 음성저장을 위해 활용될 수 있다.

고정 및 이동전화와 그리고 비디오회의에서 경향은 개선된 품질의 재구성 음 향신호로 진행되고 있다. 이러한 경향은, 이들 시스템들이 오늘날의 고정 전화망의 것과 동일하거나 또는 것보다 좋은 음질을 제공한다는 소비자의 기대를 반영한다. 이러한 기대를 충족시키는 한가지 방법은, 음향신호에 대한 주파수대역을 확장시켜서, 소오스 신호에 포함되는 많은 정보를 수신기로 전달하는 것이다. 음성신호의 에너지의 대다수는 스펙트럼적으로 0 kHz와 4 kHz 사이에 위치한다는 것은 사실이다(즉, 현기술 코덱의 전형적인 대역폭). 그러나, 상당한 량의 에너지 또는 4 kHz 에서 8 kHz의 주파수대역에 분포된다. 이 대역에서 주파수성분들은 청취자인 인간에게는 "명료함(clearness)"으로 인지되고 그리고 대화자의 느낌으로는 청취자에게 "가까운"것으로 인지된다.

인간의 가청 주파수 해상도는 주파수를 증가시킴에 따라서 감소된다. 따라서 4 kHz와 8 kHz 사이의 주파수성분들은 충분한 정확도를 가지게 모델링시키기 위해서 비교적 작은 비트들을 필요로 한다. 그럼에도 불구하고, 오늘 인지적 품질을 만족시켜주는 재생 음향신호를 제공하는 공지된 비트-율 능율 광대역 코덱이 없다. 48, 56 및 64 kbps의 비트-율에서 동작하는 현존하는 ITU-T G.722 광대역 광대역 코딩 표준은, 채용한 비트-율과 비교하면 불만족스러운 품질을 제공한다(ITU-T = International Telecommunication Union, standardisation sector).

미국특허 제5,956,686호는 포락(envelope)의 스펙트럼이 주파수대역들로 분할되어, 상이한 코딩방법들이 개별적인 대역들의 포락에 적용될 수 있는, 적응성 변환 코딩/디코딩 장치를 기술하고 있다. 이는, 스펙트럼 포락의 대역들 간에 상이한 여유도를 활용할 수 있도록 한다. 또한 스펙트럼 포락은 각 주파수대역에서 시간변동(time fluctuation)을 보상하기 위해 코딩 및/또는 전송방법으로 조정될 수 있다.

미국특허 제5,526,464호는 잔여신호가 주파수대역들로 분할되는, 부호와 여기된 선형 예측코딩 방법을 기술하고 있다. 각 대역에 대해 특정 코드북이 제공되고 그리고 코드북의 크기는 주파수대역을 증가시킴에 따라 감소된다. 코드북 검색 복잡도를 감소시키기 위해 주파수를 감소시킴으로써 샘플링율이 감소된다.

따라서, 본 기술분야에서, 상이한 주파수대역들의 변동특성을 적용한 코딩방법이 고려하는 예가 있다. 그러나, 소오스신호의 비트-효율 코딩을 얻기 위해서 상이한 특성들만이 사용되었다. 제2주파수대역에 있는 신호들을 코딩하기 위해 제1ㅈ파수대역에 대해 최적화된 코딩방법을 사용할 때, 적용한 코딩에서 고유한 불안전성을 보상하기 위하여 취하는 어떠한 특별 방법들의 제시가 아직까지 없다.

오늘날, 대부분의 코딩모델들은 협대역 신호들(전형적으로 0 - 4 kHz)에 대해 설계된다. 만일 이러한 음성코딩 모델이 큰 대역폭, 즉 0- 8 kHz를 가지는 음향신호의 코딩에 적용된다면, 코딩은 관련 주파수대역의 부분, 일반적으로 낮은 부분에 대해서만 최적화되게 된다.

이와같은 현상이 벌어지는 한 이유는, 일반적으로 코딩 파라미터들의 양자화가 타겟신호와 재생신호 간의 시간영역에서 상관관계를 수반하기 때문이다. 이러한 상관관계는 주로 저주파수영역에서 신호매칭을 기반으로 하게되는데, 이는 음성신호 중에서 고주파수성분은 저주파수성분에 비해 낮은 전력밀도를 가지기 때문이다. 그 결과, 수신측에서 고주파수성분들은 열악하게 재생되게 된다.

불행히도, 이 열악한 재생은 인간청취에서 결함으로 인해 실행될 수 없거나 또는 음성신호들의 특성에 의해 실행될 수 없다. 음성이 생성되면, 음성트랙은 렁(lung)의 기원이 되는 공중파를 통한 필터로서 동작한다. 소위 포르만트 (formant)들은 이 필터의 공진주파수에 대응한다. 음성 중 저주파수대역에서, 타겟신호는 독특한 포르만트를 가진다. 그러나, 고주파수에 대해서, 포르만트들은 보다 확산된다. 사용한 음성모델의 한계들로 인해, 통상적인 협대역 코더에 의해 엔코딩되는 비교적 큰 대역폭을 가지는 음향신호가, 그의 상부 주파수대역에서 독특한 스펙트럼구조를 가지는(예컨대, 피크와 벨리(계곡)) 신호로서 재생되게 된다. 인간인 청취자는 일반적으로, 비자연적이고 또한 금속성 음과 같은 특성을 가지는 음향신호를 인지하게 된다.

때때로, 재생신호의 품질을 한층 더 증가시키기 위해 제2코더가 제1코더의 출력신호에 적용되거나 또는 제1코더와 동시에 적용된다. 만일 이러한 방법이 통상 적인 협대역 코더에 사용된다면, 광대역 소오스신호를 엔코딩할 때 사용하면 주파수대역 중에서 최고 정점에서 스펙트럼 구조는 때때로 한층 더 현저하게 될 것이다. 광대역 음향신호들에 대해서 개선된 음질의 관점에서 보면 상기와 같은 것은 협대역 음향신호에 대해 바람직하지만, 그러나 그 효과는 정반대가 될 수 있다.

따라서 본 발명의 목적은 상기의 문제점들을 경감시키는, 음향신호에 대한 개선된 코딩방법을 제공하는 것이다.

본 발명의 한 특징에 따라서, 목적은 초기에 설명한 것과 같이 전송매체를 통한 전송을 위해 엔코딩된 정보를 생성하기 위해 음향 소오스신호를 엔코딩하는 방법에 의해 달성되는데, 이는, 1차 코드화 신호와 타겟신호를 특징으로 하는데, 이들 각각은 주파수성분을 나타내는 계수들을 포함한다. 타겟신호 각각에 1차 코드호신호에 대응하는 적어도 하나의 평탄화 신호가 생성되는데, 이는 선택적으로 수정된, 타겟신호 각각에 1차 코드화신호의 버전이고, 문턱값 위의 주파수 정보를 나타내는 계수값들에서의 변화가 줄어든다.

본 발명의 다른 특징에 따라, 목적은 컴퓨터의 내부 메모리에 직접 로딩될 수 있는 컴퓨터 프로그램으로 달성되는데, 이는 컴퓨터에서 실행될 때 상기에서 설명한 방법을 제어하기 위한 소프트웨어를 포함한다.

본 발명의 또 다른 특징에 따라, 목적은 컴퓨터로 판독할 수 있는 매체로 달성되는데, 이는 그 내부에 기록된 프로그램을 가지고, 이 프로그램은 상기 문맥에서 설명한 방법을 컴퓨터가 제어하도록 한다.

본 발명의 또 다른 특징에 따라, 목적은 초기에 설명한 것과 같이 음향 소오스신호의 추정을 디코딩하는 방법으로 달성되는데, 이는 각각이 주파수성분을 나타내는 계수들을 포함하는, 평탄화된 1차 디코드화 스펙트럼으로 달성된다. 상기 평탄화된 1차 디코드화 스펙트럼은 적어도 하나의 1차 디코드화 스펙트럼 중 하나의 선택적으로 수정된 버전이고, 문턱값 위의 주파수성분을 나타내는 계수값들에서의 변화가 감소된다.

본 발명의 또 다른 특징에 따라, 목적은 컴퓨터의 내부 메모리에 직접 로딩도리 수 있는 컴퓨터 프로그램에 의해 달성되는데, 이는 컴퓨터에서 실행될 때 상기의 문장에서 설명한 방법을 제어하기 위한 소프트웨어를 포함한다.

본 발명의 또 다른 특징에 따라, 목적은 컴퓨터가 판독할 수 있는 매체에 의해 달성되는데, 이 매체는 그 내부에 기록된 프로그램을 가지고, 이 프로그램은 상기의 문맥에서 설명한 방법을 컴퓨터가 제어하도록 한다.

본 발명의 또 다른 특징에 따라, 목적은 초기에서 설명한 것과 같은 송신기 에 의해 달성되는데, 문턱값 위의 주파수성분을 나타내는 계수값들에서의 변화가 감소되도록, 1차 코드화 신호를 선택적으로 수정함으로서 1차 코드화 신호로부터 평탄화된 출력신호를 생성하는 적어도 하나의 스펙트럼 평탄화 유닛을 특징으로 한다.

본 발명의 또 다른 부수적인 특징에 따라, 초기에 설명한 것과 같은 수신기에 의해 달성되는데, 평탄화된 1차 디코드화 스펙트럼이, 각각이 주파수성분을 나타내는 계수들을 포함하는 것을 특징으로 한다. 문턱값 위의 주파수성분을 나타내는 계수값들에서의 변화가 감소되도록 적어도 하나의 1차 디코드화 스펙트럼을 선택적으로 수정함으로써 평탄화된 1차 디코드화 스펙트럼을 수신기의 스펙트럼 평탄화 유닛이 생성한다.

본 발명의 또 다른 부수적인 특징에 따라, 목적은 제1노드에서 제2노드로 음향 소오스신호의 전송을 위한 통신시스템으로 달성된다. 이 통신시스템은, 제1노드에서는 음향 소오스신호를 엔코딩하고 그리고 엔코드된 정보를 생성하기 위한 제안된 송신기를 포함한다. 제2노드에서는, 송신기가 생성한 엔코드된 정보를 수신하고 또한 엔코드된 정보의 추정을 음향 소오스신호의 추정으로 디코딩하는 제안 수신기를 포함한다. 전송매체는 송신기에서 수신기로 적어도 하나의 향상된 코드화 신호를 전송하는데 사용한다.

수신기에 의해 재생되게 되는 음향신호로부터의 신호들 중 하나 또는 그 이상에서, 문턱값 위의 주파수정보를 나타내는 계수값들에서의 변동의 감소는 음성 또는 음악과 같은 전형적인 음향신호들의 인지 자연감(perceived naturalness)을 개선시킨다. 특히, 선행기술 코딩기술에 의해 발생되는 금속성 음은 상당한 정도로 완화된다. 이는 특히 바람직한 효과인데, 인지 음질은 차후 광대역 응용의 성공에 핵심 포인트이기 때문이다.

예로서 설명되는 바람직한 실시예와, 첨부도면들을 참조하여 본 발명을 보다 상세히 설명한다.

도 1A는 각각이 음향 소오스신호의 주파수성분을 나타내는 1차 디코드화 스펙트럼의 계수들로 주파수를 나타내는 도면.

도 1B는 문턱주파수 위의 주파수대역에서의 주파수성분을 나타내는 도 1A에서의 계수들에 대해 평균 계수값들을 어떻게 계산하는가를 설명하는 도면.

도 1C는 문턱주파수 위의 주파수대역에서의 주파수성분들에 대해 도 1B의 평균 계수값들을 최초 계수값들과 교체하는가를 설명하는 도면.

도 2A는 중첩(overlapping) 주파수대역들에서의 계수값들을 가산하는데 사용되는 윈도우함수의 제1예를 보여주는 도면.

도 2B는 중첩 주파수대역들에서의 계수값들을 가산하는데 사용되는 윈도우함수의 제2예를 보여주는 도면.

도 3은 본 발명에 따른 송신기-수신기 쌍에 대한 블록도.

도 4는 본 발명의 제1실시예에 따른 스펙트럼 평탄화유닛에 대한 블록도.

도 5는 본 발명의 제2실시예에 따른 스펙트럼 평탄화유닛에 대한 블록도.

도 6A는 본 발명의 제2실시예에 따른 스펙트럼 평탄화유닛에 의해 엔코딩되게 되는 1차 디코드화 스펙트럼의 중간(intermediate) 계수들에 대한 블록도.

도 6B는 주파수도에서, 본 발명의 제2실시예에 따라 분할되는 평탄화된 디코드화 스펙트럼의 계수들을 보여주는 도면.

도 7은 본 발명의 한 실시예에 다른 통신시스템에 대한 블록도.

도 8은 본 발명에 따른 음향신호 엔코딩의 일반적인 방법을 흐름도로 설명하는 도면.

도 9는 본 발명에 따라 음향신호의 추정으로 엔코드화 정보를 디코딩하는 일반적인 방법을 흐름도로 설명하는 도면.

도 1A는 주파수도에서, x-축을 따라 일차 디코드화 스펙트럼

의 계수 K_Y 를 보여주는 도면이다. 각 계수 K_Y는 임의의 엔코딩방법에 따라 인코딩되어, 전송매체를 통해 전송된 다음에 적절한 디코딩방법에 따라 디코딩되는 음향 소오스신호의 주파수성분의 크기(magnitude)를 나타낸다. 따라서, 일차 디코드화 스펙트럼

은 음향신호(x) 중에서 인지적으로 중요한 특성을 나타낸다.

도 1B는 계수 K_Y로 표시되는 일차 디코드화 스펙트럼

을 문턱주파수(f_T) 위의 주파수대역들(ⅰ, ⅱ 및 ⅲ)로 분할하는가를 설명한다. 제1 주파수대역 ⅰ는 문턱주파수(f_T)와 제1경계주파수(edge frequency)(f_ⅰ) 사이의 주파수성분들을 포함하고, 제2주파수대역 ⅱ은 제1경계주파수(f_ⅰ)와 제2경계주파수(f_ⅱ) 사이의 주파수성분들을 포함하고, 그리고 제3주파수대역 ⅲ은 제2경계주파수(f_ⅱ)와 제3경계주파수(f_ⅲ) 사이의 주파수성분들을 포함한다. 주파수대역들 ⅰ, ⅱ 및 ⅲ 각각에서 각 점선은 문제의 주파수대역에 대한 산술적인 평균 계수값을 나타낸다. 본 발명의 대체 실시예에서, 산술적 평균값 대신에 중간(median) 계수값이 결정된다.

평탄화된 일차 디코드화 스펙트럼

은 일차 디코드화 스펙트럼

의 선택적 수정 버전으로서 생성되는데, 문턱값(f_T) 위의 주파수정보를 나타내는 계수값들(K_YE)에서 변화가 감소된다. 도 1C는 도 1B의 평균 계수값(K_ⅰ, K_ⅱ 및 K_ⅲ)들을, 문턱주파수(f_T) 위의 주파수대역들(ⅰ, ⅱ 및 ⅲ)을 나타내는 최초 계수값들과 교체하여, 계수값들(K_YE)에서 상기 변화의 감소가 이루어지는 예를 보여준다.

도 1B와 1C는 주파수대역들(ⅰ, ⅱ 및 ⅲ)들이 중첩되지 않고(non- overlapping) 또한 상이한 대역폭들을 가지는 본 발명의 실시예를 보여준다. 인간 청취의 해상도는 주파수가 증가함에 따라서 대수적(logarithmic) 관계에 따라 대략적으로 감소하기 때문에, 인지적(perceptual) 관점에서 보아 주파수대역 ⅰ, ⅱ 및 ⅲ들을 대수적 주파수스케일에 따라 분할하는 것이 타당하다. 예컨대, 바크 스케일(Bark scale)은 스펙트럼을 다음의 주파수, 0 kHz, 0,1kHz, 0,2kHz, 0,3kHz, 0,4kHz, 0,63kHz, 0,77kHz, 0,92kHz, 1,08kHz, 1,27kHz, 1,48kHz, 1,72kHz, 2kHz, 2,32kHz, 2,7kHz, 3,15kHz, 3,7kHz, 4,4kHz, 5,3kHz, 6,4kHz, 7,7kHz, 9,5kHz, 12kHz 및 15,5kHz 들로 분할한다. 멜 켑스트럼(Mel cepstrum) 스케일은 인간 청취의 임계대역(critical band)과 닮는 것을 목적으로 하는 대체 주파수대역 셋트를 규정한다. 인지적 선형 예측방법(perceptual linear prediction-method; PLP)은 스펙트럼의 인지적으로 유도된 스케일링 및 압축을 나타내는 주파수대역들 셋트를 얻기 위한 다른 수단을 제공한다.

물론, 주파수대역들은 또한 등거리(equidistant)일 수 있거나 또는 문턱주파수(f_T) 위의 전체 스펙트럼을 커버하는 단지 하나의 단일 주파수대역이 있을 수 있다.

게다가, 주파수대역들의 각 대역폭에 상관없이, 이웃하는 주파수대역들은 적어도 부분적으로 서로 중첩될 수 있다. 만일 이러한 경우가 발생하면, 주파수대역들의 중첩영역내 최종 계수값들을 관련 계수값들을 함께 가산하여 유도할 수 있기 전에 각 주파수대역내 계수들을 윈도우함수(window function)로 승산하여야만 한다.

도 2A는 사다리꼴 형상을 가지고 또한 저부 경계주파수(f_l)와 상부 경계주파수(f_u) 사이로 규정되는 윈도우함수 W₁의 제1예를 보여준다. 윈도우함수 W₁은 비중첩 주파수영역들에서는 일정한 크기, 예컨대 1을 가지고 그리고 이웃하는 주파수대역들이 중첩하는 저부 천이영역과 대응하는 상부 천이영역에서는 점진적으로 감소하는 크기를 가진다. 윈도우함수 W₁의 크기는 각 천이영역의 중간점에서 상기 일정한 크기의 절반(예컨대, 0.5)와 동일한 것이 바람직하다. 물론, 상기 중간점은 사용한 소정의 비-선형 주파수 스케일에 대해 규정되어야만 한다.

도 2B는 중첩하는 주파수대역들에서의 계수값들을 가산하는데 사용하게 되는 윈도우함수 W₂ 의 다른 예를 보여주는 것으로서, 비-사다리꼴 형상을 가지지만, 그러나 상기에서 도 2A를 참조해 설명한 것과 동일한 특성을 가진다. 천이영역들(예컨대, 사인(sine) 또는 코사인 파의 첫번째 1/4)에서 비-선형의 형상을 가지는 윈도우함수는 특정 응용에 대해 유리한 주파수특성을 가진다.

도 3은 본 발명에 따른 송신기-수신기 쌍에 대한 블록도를 보여준다. 송신기(300)는 음향 소오스신호(x)를 엔코딩된 표현 P_(E)으로 엔코딩하는데, 이는 전송매체(306)를 통해 수신기(310)로 송신된다.

송신기(300)는 음향신호(x) 중에서 인지적으로 중요한 특징들을 나타내는 적어도 하나의 기본 코드화 신호 p를 생성하기 위한 코딩장치를 포함한다. 수신기(310)는 상기 기본 코드화 신호 P로부터 직접 음향 소오스신호(x)의 추정을 재생할 수 있다. 그러나, 본 발명의 바람직한 실시예에 따라, 송신기(300)는 또한 제1 스펙트럼 평탄화유닛(305a)를 포함하고, 이 유닛은 기본 코드화 신호 P가 근거로하는 신호성분들 중 적어도 하나를 수신하고 또한 이에 응해 대응하는 평탄화 신호성분을 생성한다. 강화된(enhanced) 코드화 신호 P_(E) 가 상기 대응하는 평탄화 신호성분으로부터 생성된다. 상기 강화된 코드화 신호 P_(E)는 인지적으로 개선된 음향소오스신호(x)의 추정

을 수신기(310)가 재생할 수 있도록 하는 음향 소오스신호 (x)의 개선된 표현을 구성한다. 문턱값 위의 주파수정보를 나타내는 스펙트럼의 계수값들에서 변화가 감소되도록 신호성분들의 스펙트럼을 선택적으로 수정함으로써, 제1 스펙트럼 평탄화유닛(305a)은 기본 코드화 신호 P 중의 적어도 하나의 신호성분으로부터 대응하는 평탄화 신호를 생성한다. 그러므로, 제1 스펙트럼 평탄화유닛 (305a)은 도면 1A - 1C를 참조하여 설명한 일차 디코드화 스펙트럼

의 수정과 대응하는 방식으로 신호성분들의 스펙트럼을 수정한다.

강화된 코드화 신호 P_(E) 는 전송매체(306)를 통해 전송되어, 전송된 강화 코드화 신호

형태로 강화 코드화 신호 P_(E) 의 추정으로서 수신기(310)가 수신한다. 상기의 전송된 강화 코드화 신호

는, 제2 스펙트럼 평탄화유닛(305b)로 음향 소오스신호(x)의 인지적으로 개선된 추정

을 재구성하는데 수신기(310)가 사용한다. 문턱값 위의 주파수정보를 나타내는, 평탄화된 일차 디코드화 스펙트럼

의 계수값들에서 변화가 감소되도록 전송된 강화 코드화 신호

로부터 디코딩되는 일차 스펙트럼

을 선택적으로 수정함으로써, 제2 스펙트럼 평탄화유닛(305b)은 인지적으로 개선된, 음향 소오스신호(x)의 추정

을 생성한다.

도 4는 본 발명의 제1 실시예에 따라 디자인된 도 3의 스펙트럼 평탄화유닛 (305a 및 305b)에 대한 블록도를 보여준다. 그러나, 간략화의 이유로, 제2 스펙트럼 평탄화 유닛(305b)의 변수들에 대해서만 참고가 이루어진다. 스펙트럼 평탄화 유닛(305b)은 주파수 성분을 각각 나타내는, 일차 디코드화 스펙트럼

의 계수들(K_Y)이 저장되는 제1 버퍼 메모리(401)를 포함한다. 프로세싱유닛(402)은 문턱값 (f_T) 위의 주파수성분들에 대응하는 계수들 k_Y ⁿ⁺¹ - k_Y ^m 을 제1 버퍼메모리(401)로부 터 수신하여, 적어도 하나의 주파수 대역(ⅰ, ⅱ 및 ⅲ) 각각에 대해 상기 계수들 k_Y ⁿ⁺¹ - k_Y ^m 의 평균 계수값들 K_ⅰ, K_ⅱ; K_ⅲ 을 계산한다. 그런 다음, 계산된 평균 계수값들 K_ⅰ, K_ⅱ; K_ⅲ 각각은 특정 주파수 대역(ⅰ, ⅱ 및 ⅲ)에서의 일차 디코드화 스펙트럼

의 계수들 K_Y 의 숫자에 대응하는 횟수만큼, 제2 버퍼메모리(403)에 반복적으로 저장된다. 이러한 저장의 목적은, 일차 디코드화 스펙트럼

의 계수들 K_Y 을 적절한 평균 계수값들 K_ⅰ, K_ⅱ; K_ⅲ 로 신속한 교체가 이루어지도록 하는 것이다. 계수들의 교체는 제1 버퍼메모리(401)에서부터 문턱값(f_T) 까지의 계수값들 k_Y ¹ - k_Y ⁿ 을 독출하고 또한 제2 버퍼메모리(403)에서부터 문턱값(f _T) 위의 평탄화된 계수들 k_Y ⁿ⁺¹ - k_Y ^m 을 독출하는 독출유닛(404)에 의해 이루어진다. 그런 다음, 이들 계수들 k_Y ¹ - k_Y ⁿ, K_ⅰ, K_ⅱ; K_ⅲ 은 함께, 독출유닛(404)에서부터 출력에 제공되는, 평탄화된 일차 디코드화 스펙트럼

의 계수들 K_YE 을 형성한다.

도 5는 본 발명의 제2 실시예에 따라 디자인된 도 3의 스펙트럼 평탄화 유닛(305a 및 305b)에 대한 블록도를 보여준다. 다시 한번, 간략화의 이유로, 제2 스펙트럼 평탄화유닛(305b)의 변수들에 대해서만 참조가 이루어진다.

스펙트럼 평탄화유닛(305b)은 입력을 통해 일차 스펙트럼

을 수신하는 제1 트랜스포머(501)를 포함한다. 제1 트랜스포머(501)는 제1출력에서 대응하는 각 스펙트럼(angular spectrum) Y_s ^arg 를 생성하고, 제2출력에서 대응하는 크기 스펙트럼(magnitude spectrum)

를 생성한다. 크기 스펙트럼

은 계수값들 k_Y ¹, ..., k_Y ^m 으로 표시된다. 선택적으로, 스펙트럼 평탄화유닛(305b)은 대수 트랜스포머(변환기)(logarithmic transformer)(502)를 포함하는데, 트랜스포머는 문턱주파수(f_T) 위의 주파수성분들을 나타내는 크기 스펙트럼

의 계수들 k_Y ⁿ⁺¹, ..., k_Y ^m 을 수신하는 한편, 낮은 주파수성분들을 나타내는 크기 스펙트럼

의 계수들 k_Y ¹, ..., k_Y ⁿ 은 결합기(combiner)(507)로 전송된다. 대수 트랜스포머(502)는 문턱주파수(f_T) 위의 주파수성분들을 나타내는 크기 스펙트럼

의 계수들 k_Y ⁿ⁺¹, ..., k_Y ^m 을 입력에서 수신하고, 이에 응해 출력에 대수 변환을 제공한다. 제1 역 트랜스포머(inverse transformer)(503)는 크기 스펙트럼 중에서 변환된(트랜스폼 된) 부분을 입력에서 수신하고, 이에 응해 켑스트럼(cepstrum) 영역에서 성분을 각각 나타내는 켑스트럼 계수 셋트를 가지는 켑스트럼-코드화(cepstrum-coded) 신호를 출력 에 제공한다. 대수 트랜스포머(502)가 포함되지 않는 경우, 크기 스펙트럼

의 계수들 k_Y ⁿ⁺¹, ..., k_Y ^m 은 제1 트랜스포머(501)에서 제1 역 트랜스포머(503)로 직접 공급된다. 후속하는 폐기유닛(discarding unit)(504)은 켑스트럼 코드화 신호에서 n차수 및 그 이상 차수의 켑스트럼 계수들을 폐기하고, 폐기한 계수들을 제로 값화(zero valued) 계수들로 교체하고, 그리고 신호를 제2 트랜스포머(505)에 전송하고, 트랜스포머는 대응하는 스펙트럼 신호를 생성한다.

그런 다음, 만일 대응하는 대수변환이 대수 트랜스포머(502)에 의해 이전에 수행되었다면, 상기 스펙트럼신호는 후속 역 대수 트랜스포머(506)에서 대수적으로 역 변환된다. 역 대수 트랜스포머(506)는 대수적으로 평탄화된 계수들 k_Y ⁿ⁺¹ - k_Y ^m 을 생성한다. 따라서, 제2 트랜스포머(505)에서부터 앞서 평탄화된 계수들 k_Y ⁿ⁺¹ - k_Y ^m 또는 역 대수 트랜스포머(506)에서부터 대수적으로 평탄화된 계수들 k_Y ⁿ⁺¹ - k_Y ^m 은, 문턱주파수(f_T) 아래의 주파수성분들을 나타내는 크기 스펙트럼

의 계수들 k_Y ¹, .., k_Y ⁿ 과 함께 결합기(507)로 전송된다. 결합기는 계수들 k_Y ¹, .., k_Y ⁿ 과 평탄화된 계수들 k_Y ⁿ⁺¹ - k_Y ^m 에 응해 평탄화된 크기 스펙트럼

를 제공한다. 제2 역 트랜스포머(508)는 각 스펙트럼 Y_s ^arg을 제1입력에서 수신하고 그리고 제2입력에서는 평탄화된 크기 스펙트럼

을 수신하며, 이에 응해 강화된(enhanced) 코드화 신호

를 생성한다.

도 6A는 (대수) 크기 스펙트럼도에서, 일차 디코드화 스펙트럼

의 스펙트럼 계수들 K_S 들의 예를 보여준다. 도면에서 알 수 있듯이, 일차 디코드화 스펙트럼

은 이웃하는 계수들 K_S 간에 큰 변화를 가지는 계수들을 포함한다. 이러한 변화는, 음향정보의 표시를 위한 주파수대역 중에서 첨단부에서 바람직하지 않기 때문에, 이 변화는 도 5를 참조하여 상기에서 설명한 바와 같이 스펙트럼 평탄화유닛(305b)에서 감소된다. 스펙트럼 평탄화유닛(305b)은 일차 디코드화 스펙트럼

을 수신하고, 그리고 문턱값(f_T) 위의 주파수정보를 나타내는 계수값들 K_YE 에서 변화가 감소한, 평탄화된 일차 디코드화 스펙트럼

을 제공한다. 즉 문턱값(f_T) 위의 주파수정보(스펙트럼 인텍스 K_Y ⁿ에 대응)를 나타내는, 평탄화된 일차 디코드화 스펙트럼

의 계수값들 K_YE 들에서 변화가 감소되게 되는 값으로 폐기유닛(504)의 변수 n이 선택된다.

도 6B는 주파수도에서, 스펙트럼 평탄화유닛(305b)에 의해 대응하는 평탄화된 일차 디코드화 스펙트럼

의 계수값들 K_YE 을 나타내도록 수정된 후에, 도 6A에서 일차 디코드화 스펙트럼

의 크기 스펙트럼 계수들 K_S 을 보여준다.

켑스트럼 변환과 그리고 계속하여 켑스트럼 코드화 신호에서 고-차수 계수들의 폐기에 대한 대안으로서, 스펙트럼 평탄화는 일차 스펙트럼

을 나타내는 스펙트럼 계수들의 선형 저역통과 필터링 또는 문턱값(f_T) 위의 주파수성분들을 나타내는 일차 스펙트럼

의 스펙트럼 계수들을 중간 필터링함으로써 이루어질 수 있다.

도 7은 본 발명의 한 실시예에 따른 통신시스템에 대한 블록도를 보여주는데, 음향 소오스신호(x)가 저-비트율 엔코드화 신호로서 제1노드에서 제2노드로 전송될 수 있고, 여기에서 음향 소오스신호(x)의 추정

으로 재구성된다. 시스템은 송신기(300)와, 전송매체(306)와 그리고 수신기(310)를 포함한다.

송신기(300)는 신호 코더(coder)(702)를 포함하는데, 이는 음향 소오스신호 (x)를 수신하기 위한 입력과 음향신호(x) 중 인지적으로 중요한 특징을 나타내는 기본 코드화 신호 P₁ 을 제공하기 위한 출력을 가진다. 신호 코더(702)는 또한 음향 소오스신호(x)의 필터링된 (일반적인 의미) 버전을 나타내는 타겟신호(r)와 기본 코드화 신호 P₁ 을 기반으로 재생된 신호를 나타내는 일차 코드화 신호(y)를 제공한다. 타겟신호(y)와 일차 코드화 신호(y) 어느것도, 하나 또는 둘 다는 상기에서 설명한 방법에 따라서 스펙트럼 평탄화유닛(305a 및 305b)에서 스펙트럼적으로 평탄화된다.

본 발명의 바람직한 실시예에 따라서, 제1스펙트럼 평탄화유닛(305a)은 일차 코드화 신호(y)를 수신하여, 이에 응해 평탄화된 일차 코드화 신호(y_E)를 생성한다. 그럼에도 불구하고, 타겟신호(r)를 수신하여 이에 응해 평탄화된 타겟신고(r_E)를 생성하기 위해 추가적인 스펙트럼 평탄화유닛(305c)가 송신기에 포함될 수 있다. 본 발명의 다른 바람직한 실시예에 따라서, 타겟신호(r)를 개선하는 스펙트럼 평탄화유닛(305c)만이 포함된다(일차 코드화 신호(y)를 개선하는 스펙트럼 평탄화유닛 (305a)은 포함되지 않는다). 본 발명의 이들 실시예들은 도 7에서 점선과 점선박스로 표시되어 있다.

문턱값(f_T) 위의 주파수정보를 나타내는 신호의 스펙트럼 계수값들에서의 변 화를 감소시킴으로써 평탄화된 일차 코드화 신호(y_E)를 (그리고 가능하다면 평탄화된 타겟신호 r_E 를) 생성하기 위해 스펙트럼 평탄화유닛(305a 및 305c) 둘 다는 본 발명에 따른 방법에 따라서 동작한다.

송긴기(300)의 등화 코더(equalisation coder)(703)는 평탄화된 일차 코드화 신호(y_E)와 (평탄화되었을 수 있는) 타겟신호(r_(E))를 수신한다. 등화 코더(703)는 (평탄화되었을 수 있는)타겟신호(r_(E))와 평탄화된 일차 코드화 신호(y_E)를 주파수영역으로 변환시키고 그리고 변환된 신호들의 스펙트럼간의 비율(ratio) 스펙트럼(C)을 계산하여 (평탄화되었을 수 있는)타겟신호(r_(E))와 평탄화된 일차 코드화 신호(y_E) 간의 대수적 스펙트럼 차이를 나타낸다. 그러므로 비율 스펙트럼(C)의 크기는, 제1 코드화 신호 P₁ 가 음향신호(x)를 얼마나 잘 설명하는지를 나타낸다.

비율 스펙트럼(C)은 등화 코더(703)에서 출력으로 제공되어, 양자화기 (quantiser)(704)로 제공되며, 양자화기는 비율 신호(C)에 응해 그의 출력에 이차 코드화 신호 P_c 를 제공한다. 이차 코드화 신호 P_c 는 계수 셋트를 포함하는 이산 (discrete) 및 양자화 신호를 나타낸다.

마지막으로, 송신기(300)는 제1 코드화 신호 P₁ 와 이차 코드화 신호 P_c 를 전송매체(306)로 전달하기 위해 고안된 출력유닛(도시되지 않음)을 포함한다. 송신기(300)와 수신기(310) 중 적어도 하나가 이동형인 경우에, 전송매체(306)는 일반적으로, 적어도 부분적으로, 하나 이상의 무선자원으로 구성된다. 자연히, 고정 또는 이동통신을 위해 적응된 다른 형태의 전송매체를 본 발명에 따라 잘 적용할 수 있다.

수신기(310)는 제1 코드화 신호 P₁ 을 나타내는 제1 전송신호

와 이차 코드화 신호 P_c 를 나타내는 제2 전송신호

로서 신호들 P₁,P_c 의 추정들을 수신한다. 제1 전송신호

와 제2 전송신호

는, 수신기(310)가 음향 소오스신호(x)의 인지적으로 개선된 추정

을 재생(재구성)하는데 사용한다. 이를 수행하기 위해, 수신기(310)는 등화 디코더(707)와, 재생(재구성) 유닛(708)과, 스펙트럼 평탄화 유닛(305b)와 등화기(709)를 포함한다.

재생유닛(708)은 입력을 통해 제1 전송신호

를 수신하여, 이에 응해 음향 소오스신호(x)의 스펙트럼의 추정을 나타내는 일차 디코드화 스펙트럼

를 그 출력에 생성한다. 일차 디코드화 신호

는 스펙트럼 평탄화 유닛(305b)으로 전송된다. 이 유닛(305b)은 제안된 방법에 따라, 평탄화된 일차 디코드화 스펙트럼

를 생성한다.

등화 디코더(707)는 제2 전송신호

를 수신하여, 이에 응해 그 출력에 추정된 등화 스펙트럼

을 제공한다. 추정된 등화 스펙트럼

은 평탄화된 일차 디코드화 스펙트럼

과 함께 등화기(709)로 전송된다. 등확기(709)는 추정된 등화 스텍트럼

과 평탄화된 일차 디코드화 스펙트럼

간의 승산을 수행한다. 그런 다음, 등화기(709)는 승산의 결과로부터 역 변환을 생성하여 시간영역의 신호를 형성한다. 이 신호는 소오스 신호의 개선된 추정

을 구성하고 그리고 등화기(709)의 출력에 전달된다.

개선된 추정

은 또한 소오스신호(x)의 간접 표현을 구성한다. 예컨대, 선형 예측 코더의 경우에, 대신에 개선된 추정

이 될 수 있고, 이로부터 소오스신호(x)의 추정이 합성필터를 통해 생성될 수 있다.

많은 코딩시스템(예컨대, GSM EFR-코더 및 AMR-코더)에서의 코덱들은 프레임들 또는 서브-프레임들로 분할(세그먼트)되는 음성신호에 대해 블록방식(block- wise)으로 동작하기 때문에, 음성신호의 세그먼테이션(분할)에 대응하는 블록-방식 방법에서 등화 연산자(operator) C를 적용하는 것이 바람직하다(GSM=Global system for Mobile Communication; EFR=Enhanced Full Rate; AMR=Adaptive Multi-Rate). 물론, 소오스신호(x)의 추정된 평탄화 스펙트럼을 나타내는 주파수변환 Y_E 에 대해서도 마찬가지다.

도 8은 본 발명에 따라 음향신호를 엔코딩하는 방법을 흐름도로 설명한다. 제1단계 801에서, 음향신호(x)를 수신한다. 음향신호(x) 중 인지적으로 중요한 특성들을 나타내는 기본 코드화 신호 P가 다음 단계 802에서 생성된다. 후속 단계 803에서, 기본 코드화 신호 P가 근거로 하는 신호성분들 중 적어도 하나의 계수값들에서 변화를 감소시키고 또한 이에 응해 평탄화된 신호성분을 생성한다. 강화된 (enhanced) 기본 코드화 신호 P_(E)가 대응하는 평탄화 신호성분에서부터 생성된다. 마지막으로, 단계 804에서, 강환된 코드화 신호 P가 수신기로 전송을 위한 전송매체로 전달된다.

도 9는 본 발명에 따라 엔코드된 정보를 음향신호의 추정으로 디코딩하는 방법을 흐름도를 설명한다. 첫번째 단계 901에서, 전송매체로부터 적어도 하나의 전송된 (강화되었을) 코드화 신호

를 수신한다. 그럼 다음 단계 902에서, 일차 디코드화 스펙트럼

이 상기 적어도 하나의 전송된 (강화되었을) 코드화 신호

로부터 발생된다. 계속해서 단계 903에서, 평탄화된 일차 디코드화 스펙트럼

이 일차 디코드화 스펙트럼

에서부터 형성된다. 마지막으로 단계( 904)에서, 평탄화된 일차 디코드화 스펙트럼

을 기반으로 소오스신호의 추정

이 발생된다. 추정

은 인간이 청취자에게 높은 인지 음질을 가진다.

상기에서 제안한 본 발명의 실시예들은 주파수영역에서의 모든 동작(연산)을 포함한다. 그러나, 본 발명의 바람직한 실시예에 따라, 대응하는 행위들이 시간영역에서 이루어질 수 있다. 즉, 서브-밴드 필터로 음향 소오스신호를 나타내는 신호를 적어도 두 개의 상이한 신호성분들로 분할함으로써 이루어질 수 있다. 그런 다음, 신호성분들은 개별적으로 전력(파워)조정되어 원하는 평탄화를 얻는다. 계속하여, 전력 조정된 신호성분들은 평탄화된 단일 기본 코드화 신호로 결합된다. 이 신호는 문턱주파수 위의 주파수성분에 대해 주파수변화가 감소된 음향 소오스신호의 표시를 구성한다.

본 명세서에 사용되는 용어 "포함한다/포함하는"은 상술한 특징, 완전체, 단계 또는 성분(부품)의 실제를 명기하기 위해 취한 것이다. 그러나, 이 용어는 하나 이상의 추가적인 특징, 완전체, 단계 또는 성분들 또는 이들의 그룹의 추가 또는 실재를 배제하지 않는다.

본 발명은 도면에 기술된 실시예들에 한정되지 않고, 청구항의 범위 내에서 자유롭게 수정될 수 있다

Claims

음향 소오스신호(x)에 응해, 음향 소오스신호(x) 중에서 인지적으로 중요한 특징들을 나타내는 기본 코드화 신호(P₁)와,

음향 소오스신호(x)의 필터링된 버전을 나타내는 타겟신호(r)와,

기본 코드화 신호(P₁)을 기반으로 한 재생신호를 나타내는 일차 코드화 신호(y)를 생성하는 단계와;

일차 코드화 신호(y)와 타겟신호(r) 중 적어도 하나에 응해, 일차 코드호ㅘ 신호(y)와 타겟신호(r)의 인지적으로 개선된 표시를 구성하는 대응하는 평탄화 신호(y_E; r_E)를 생성하는 단계와;그리고

평탄화된 일차 코드화 신호(y_E)와 타겟신호(r)와,

일차 코드화 신호(y)와 평탄화된 타겟신호(r_E)와,

평탄화된 일차 코드화 신호(y_E)와 평탄화된 타겟신호(r_E)들 각각의 조합을 기반으로 이차 코드화 신호(P_C)를 생성하는 단계를 포함하는, 전송매체(306)를 통한 전송을 위한 엔코드화 신호(P₁, P_C)를 생성하기 위해 음향 소오스신호(x)를 엔코딩하는 방법에 있어서,

일차 코드화 신호(y)는, 각각이 주파수성분을 나타내는 계수들(K_Y)을 포함하 고,

타겟신호(r)는, 각각이 주파수성분을 나타내는 계수들을 포함하고,

대응하는 평탄화된 신호들(y_E; r_E)은 일차 코드화 신호(y)와 타겟신호(r)의 선택적으로 수정된 버전이며, 여기에서 문턱값(f_T) 위의 주파수정보를 나타내는 계수값들(K_YE)에서 변화가 감소되는 것을 특징으로 하는, 전송매체를 통한 전송을 위한 엔코드화 신호를 생성하기 위해 음향 소오스신호를 엔코딩하는 방법.
제1항에 있어서,

문턱값(f_T) 위의 주파수성분들을 나타내는 일차 코드화 신호(y)의 계수들(K_Y)들을 하나 이상의 주파수대역들(ⅰ,ⅱ 및 ⅲ)로 나누고,

각 주파수대역들(ⅰ,ⅱ 및 ⅲ) 내에서 계수들(K_Y)에 대해 평균 계수값들(K_ⅰ, K_ⅱ및 K_ⅲ)을 계산하고, 그리고

각 주파수대역들(ⅰ,ⅱ 및 ⅲ) 내 계수들(K_Y)을 각 평균 계수값들(K_ⅰ, K_ⅱ및 K_ⅲ)로 교체함으로서 평탄화된 일차 코드화 신호(y_E)가 일차 코드화 신호(y)로부터 유도되는 것을 특징으로 하는 방법.
제2항에 있어서, 상기 주파수대역들(ⅰ,ⅱ 및 ⅲ)이 등간격인 것을 특징으로 하는 방법.
제2항에 있어서, 상기 주파수대역들(ⅰ, ⅱ 및 ⅲ)이 적어도 부분적으로 중첩되는 것을 특징으로 하는 방법.
제4항에 있어서,

윈도우된 대응하는 주파수대역들을 구하기 위해 윈도우함수(W₁; W₂)들로 각 주파수대역(ⅰ,ⅱ 및 ⅲ)들을 승산하고,

각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써, 주파수대역들(ⅰ,ⅱ 및 ⅲ)의 중첩하는 영역에서의 최종 계수값들이 유도되는 것을 특징으로 하는 방법.
제5항에 있어서, 상기 윈도우함수(W₁; W₂)들은 비-중첩 주파수영역에서는 일전한 크기를 가지고 또한 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 방법.
제1항에 있어서, 일차 코드화 신호(y)의 선택적 수정은,

각각이 켑스트럼 영역에서 성분을 나타내는 켑스트럼 계수들의 셋트를 가지는 켑스트럼 코드화 신호를 생성하는 단계와,

특정 차수(n)와 이 보다 높은 차수의 켑스트럼 코드화 신호에서 켑스트럼 계수들을 폐기하는 단계를 포함하는 것을 특징으로 하는 방법.
제7항에 있어서, 문턱값(f_T) 위의 주파수정보를 나타내는 평탄화된 일차 코드화 신호(y_E)의 계수값들(K_YE)에서 변화가 감소되도록 상기 특정 차수(n)를 선택하는 것을 특징으로 하는 방법.
제1항 내지 제8항 중 어느 한 항에 있어서, 이차 코드화 신호(P_C)는, 제1 코드화 신호(P₁)가 음향신호(x)를 얼마나 잘 묘사하는지를 나타내는 것을 특징으로 하는 방법.
제9항에 있어서, 이차 코드화 신호(P_C)는 타겟신호(r)와 일차 코드화 신호(y) 간의 스펙트럼 비율을 나타내는 것을 특징으로 하는 방법.
제9항에 있어서, 이차 코드화 신호(P_C)는 타겟신호(r)와 일차 코드화 신호(y) 간의 대수적 스펙트럼 차이를 나타내는 것을 특징으로 하는 방법.
제10항에 있어서,

음향신호(x)에 응해 주파수 변환된 타겟신호(R)를 생성하고,

음향신호(x)에 응해 주파수 변환된 일차 코드화 신호(Y)를 생성하고,

주파수 변환된 타겟신호(R)와 주파수 변환된 일차 코드화 신호(Y) 간의 비율 스펙트럼(C)을 생성하고, 그리고

비율 스펙트럼(C)을 기반으로 이차 코드화 신호(Pc)를 형성함으로써,

이차 코드화 신호(PC)를 유도하는 것을 특징으로 하는 방법.
컴퓨터의 내부 메모리에 직접 로딩될 수 있으며, 컴퓨터에서 실행될 때에 청구항 제1항 내지 제12항 중 어느 하나의 단계들을 제어하기 위한 소프트웨어를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
청구항 제1항 내지 제12항 중 어느 한 항의 단계를 컴퓨터가 제어할 수 있도록 해주는 프로그램이 기록되어 있는 컴퓨터 판독가능 매체.
적어도 하나의 코드화 신호(P_(E))를 나타내는 적어도 하나의 전송된 코드화 신호
를 수신하는 단계와,

적어도 하나의 전송된 코드화 신호
에서부터 적어도 하나의 일차 디코드화 스펙트럼
을 디코딩하는 단계와,

적어도 하나의 일차 디코드화 스펙트럼
에서부터 평탄화된 일차 디코드화 스펙트럼
을 생성하는 단계와, 그리고

평탄화된 일차 디코드화 스펙트럼
을 기반으로 음향 소오스신호(x)의 추정
을 생성하는 단계를 포함하는, 전송매체(306)를 통해 전송된 엔코드화 정보로부터 음향 소오스신호(x)의 표현의 추정
을 디코딩하는 방법에 있어서,

상기 평탄화된 일차 디코드화 스펙트럼
은, 각각이 주파수성분을 나타내는 계수들(K_Y)을 포함하고, 상기 평탄화된 일차 디코드화 스펙트럼
은 적어도 하나의 일차 디코드화 스펙트럼
의 선택적으로 수정된 버전이고, 여기에서 문턱값(f_T) 위의 주파수정보를 나타내는 계수값들(K_YE)에서 변화가 감소하는 것을 특징으로 하는, 전송매체(306)를 통해 전송된 엔코드화 정보로부터 음향 소오스신호(x)의 표현의 추정
을 디코딩하는 방법.
제15항에 있어서, 음향 소오스신호(x)의 표현은 음향 소오스신호(x) 그 자체를 구성하는 것을 특징으로 하는 방법.
제15항에 있어서, 음향 소오스신호(x)의 표현은 여기신호를 구성하고, 음향 소오스신호(x)가 상기 여기신호로부터 유도될 수 있는 것을 특징으로 하는 방법.
제15항 내지 제17항 중 어느 한 항에 있어서,

문턱값(f_T) 위의 주파수성분들을 나타내는 적어도 하나의 일차 디코드화 스펙트럼
중 하나의 계수들(K_Y)들을 하나 이상의 주파수대역들(ⅰ, ⅱ; ⅲ)로 분할하고,

각 주파수대역들(ⅰ, ⅱ; ⅲ) 내의 계수들(K_Y)에 대한 평균 계수값(K_ⅰ, K_ⅱ 및 K_ⅲ)들을 계산하고,

각 주파수대역들(ⅰ, ⅱ; ⅲ) 내 계수들(K_Y)을 각 평균 계수값(K_ⅰ, K_ⅱ 및 K_ⅲ)들로 교체시킴으로써, 평탄화된 일차 디코드화 신호
가 적어도 하나의 일차 디코드화 스펙트럼
에서부터 유도되는 것을 특징으로 하는 방법.
제18항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)은 등간격인 것을 특징으로 하는 방법.
제18항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)이 적어도 부분적으로 중첩되어 있는 것을 특징으로 하는 방법.
제20항에 있어서,

윈도우된 대응하는 주파수대역들을 얻기 위해서 각 주파수대역들(ⅰ, ⅱ; ⅲ)을 윈도우함수(W₁; W₂)로 승산하고,

각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써 주파수대역(ⅰ, ⅱ; ⅲ)들의 중첩영역들에서의 최종 계수값들이 유도되는 것을 특징으로 하는 방법.
제21항에 있어서, 윈도우함수(W₁; W₂)는 비-중첩 주파수영역들에서 일정한 크기를 가지고, 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 방법.
제15항 내지 제17항 중 어느 한 항에 있어서, 적어도 하나의 일차 디코드화 스펙트럼
의 선택적 수정은,

각각이 켑스트럼 영역에서 성분을 나타내는 켑스트럼 계수들의 셋트를 가지는 켑스트럼 코드화 신호를 생성하는 단계와,

특정 차수(n)와 이 보다 높은 차수의 켑스트럼 코드화 신호에서 켑스트럼 계수들을 폐기하는 단계를 포함하는 것을 특징으로 하는 방법.
제23항에 있어서, 문턱값(f_T) 위의 주파수정보를 나타내는 평탄화된 일차 디 코드화 스펙트럼
의 계수값들(K_YE)에서 변화가 감소되도록 상기 특정 차수(n)를 선택하는 것을 특징으로 하는 방법.
제15항 내지 제17항 중 어느 한 항에 있어서, 적어도 하나의 전송된 강화 코드화 신호
가,

음향신호(x)의 코딩된 표현을 구성하는 제1 코드화 신호(P₁)의 제1추정
과,

제1 코드화 신호(P₁)가 음향신호(x)를 얼마나 잘 묘사하는지를 나타내는 제2차 코드화 신호(Pc)의 제2추정
을 포함하는 것을 특징으로 하는 방법.
제25항에 있어서, 상기 제2차 코드화 신호(P_C)는 타겟신호(r)의 스펙트럼과 일차 코드화 신호(y)의 스펙트럼 간의 비율을 나타내는 것을 특징으로 하는 방법.
제25항에 있어서, 상기 제2차 코드화 신호(P_C)는 타겟신호(r)의 대수적 스펙트럼과 일차 코드화 신호(y)의 대수적 스펙트럼 간의 차이를 나타내는 것을 특징으로 하는 방법.
제25항에 있어서,

제1추정
에 응해 적어도 하나의 일차 디코드화 스펙트럼
을 생성하고,

상기 적어도 하나의 일차 디코드화 스펙트럼
에 응해 평탄화된 일차 디코드화 스펙트럼
을 생성하고,

제2추정
에 응해 등화 스펙트럼
을 생성하고, 그리고

등화 스펙트럼
과 평탄화된 일차 디코드화 스펙트럼
에 응해 음향 소오스신호(x)의 추정
을 생성함으로써, 음향 소오스신호(x)의 추정
이 유도되는 것을 특징으로 하는 방법.
컴퓨터의 내부 메모리에 직접 로딩될 수 있으며, 컴퓨터에서 실행될 때에 청구항 제15항 내지 제28항 중 어느 하나의 단계들을 제어하기 위한 소프트웨어를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
청구항 제15항 내지 제28항 중 어느 한 항의 단계를 컴퓨터가 제어할 수 있도록 해주는 프로그램이 기록되어 있는 컴퓨터 판독가능 매체.
음향 소오스신호(x)를 수신하기 위한 입력을 가지고 또한 음향 소오스신호(x)의 추정
을 재구성할 수 있는 음향신호(x)의 인지적으로 중요한 특성들을 나타내는 기본 코드화 신호(P₁)을 제공하기 위한 제1출력과, 음향 소오스신호(x)의 필터링된 버전을 나타내는 타겟신호(r)를 제공하기 위한 제2출력과, 기본 코드화 신호(P₁)을 기반으로 하는 재구성신호를 나타내는 일차 코드화 신호(y)를 제공하기 위한 제3출력을 가지는 일차 코더(702)와,

상기 일차 코드화 신호(y)에 응해, 일차 코드화 신호(y)의 인지적으로 개선된 표현을 구성하는, 평탄화된 일차 코드화 신호(y_E)를 생성하기 위한 적어도 하나의 스펙트럼 평탄화 유닛(305a)과,

상기 평탄화된 일차 코드화 신호(y_E)와 타겟신호(r)를 기반으로 이차 코드화 신호(P_C)를 생성하기 위한 양자화기(704)를 포함하는, 전송매체(306)를 통한 전송을 위한 엔코딩된 정보를 생성하기 위해 음향 소오스신호(x)를 엔코딩하는 송신기에 있어서,

상기 적어도 하나의 스펙트럼 평탄화 유닛(305a)은, 문턱값(f_T) 위의 주파수정보를 나타내는 계수값(K_YE)들에서 변화가 감소되도록 일차 코드화 신호(y)를 선택적으로 수정함으로서 일차 코드화 신호(y)로부터 평탄화된 출력신호(y_E)를 생성하도록 고안되는 것을 특징으로 하는 송신기.
제31항에 있어서, 상기 적어도 하나의 스펙트럼 평탄화 유닛(305a,305b)은:

각각이 주파수성분을 나타내는 입력신호(P)의 계수들(K_Y)을 저장하기 위한 제1 버퍼메모리(401)와,

문턱값(f_T) 위의 주파수성분들에 대응하는 계수들(k_Y ⁿ⁺¹ - k_Y ^m)들에 대해, 적어도 하나의 주파수대역(ⅰ, ⅱ; ⅲ)들 각각에 대해 상기 제1 버퍼메모리(401)에 저장된 계수들(k_P ⁿ⁺¹ - k_P ^m)의 평균 계수값들(K_ⅰ, K_ⅱ; K_ⅲ)을 계산하기 위한 프로세싱 유닛(402)와,

특정 주파수대역들(ⅰ, ⅱ; ⅲ)에서 적어도 하나의 기본 코드화 신호(P)의 대응하는 계수들(K_P)들이 있는 한 각 주파수대역들(ⅰ, ⅱ; ⅲ)에 대한 각 평균 계수값들(K_ⅰ, K_ⅱ; K_ⅲ)을 반복적으로 저장하기 위한 제2 버퍼메모리(403)와,

상기 제1 버퍼메모리(401)에서부터 문턱값(f_T) 까지의 계수들(k_Y ¹ - k_Y ⁿ)을 독출하고 또한 제2 버퍼메모리(403)에서부터 문턱값(f_T) 위의 계수들(k_Y ⁿ⁺¹ - k_Y ^m)을 독출하여 출력신호(y_E)의 계수들(K_YE)을 형성하는 독출유닛(404)를 포함하는 것을 특징으로 하는 송신기.
제32항에 있어서, 상기 주파수대역(ⅰ, ⅱ; ⅲ)들은 등간격인 것을 특징으로 하는 송신기.
제32항 또는 제33항에 있어서, 상기 주파수대역(ⅰ, ⅱ; ⅲ)들은 적어도 부분적으로 중첩되는 것을 특징으로 하는 송신기.
제34항에 있어서,

윈도우된 대응하는 주파수대역들을 얻기 위하여 윈도우함수(W₁; W₂)로 각 주파수대역(ⅰ, ⅱ; ⅲ)을 승산하고, 그리고

각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써 주파수대역들(ⅰ, ⅱ; ⅲ)의 중첩영역들에서 최종 계수값들을 유도하기 위한 계수 결합기를 포함하는 것을 특징으로 하는 송신기.
제35항에 있어서, 상기 윈도우함수(W₁; W₂)들은 비-중첩 주파수영역에서는 일전한 크기를 가지고 또한 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 송신기.
수신한 엔코드 정보
로부터 유도되는 일차 디코드화 스펙트럼
을 수신하기 위한 입력과 평탄화된 일차 디코드화 스펙트럼
를 제공하기 위한 출력을 가지는 스펙트럼 평탄화유닛(305b)를 포함하는, 전송매체(306)로부터 수신된 엔코드화 정보로부터 음향 소오스신호(x)의 표현의 추정
을 디코딩하는 수신기에 있어서, 상기 평탄화된 일차 디코드화 스펙트럼
은 주파수성분을 나타내고, 스펙트럼 평탄화유닛(305b)은 문턱값(f_T) 위의 주파수성분을 나타내는 계수값들 (K_YE)에서 변화가 감소되도록 일차 디코드화 스펙트럼
을 선택적으로 수정함으로써 평탄화된 일차 디코드화 스펙트럼
을 생성하도록 고안되는 것을 특징으로 하는 수신기.
제37항에 있어서,

엔코드된 정보
에서 제1 전송신호
을 수신하기 위한 입력과 일차 디코드화 스펙트럼
을 제공하기 위한 출력을 가지는 재구성(재생)유닛(708)와,

엔코드된 정보
에서 제2 전송신호
를 수신하기 위한 입력과 추정된 등화 스펙트럼
을 제공하기 출력을 가지는 등화 디코더(707)와,

평탄화된 일차 디코드화 스펙트럼
를 수신하기 위한 제1입력과, 상기 추정된 등화 스펙트럼
을 수신하기 위한 제2입력과 그리고 음향 소오스신호(x)의 추정
을 제공하기 위한 출력을 가지는 양자화기(709)를 더 포함하는 것을 특징으로 하는 수신기.
제38항에 있어서, 스펙트럼 평탄화 유닛(305b)은:

각각이 주파수성분을 나타내는 일차 디코드화 스펙트럼
의 계수들(K_Y)을 저장하기 위한 제1 버퍼메모리(401)와,

문턱값(f_T) 위의 주파수성분들에 대응하는 계수들(k_Y ⁿ⁺¹ - k_Y ^m)들에 대해, 적어도 하나의 주파수대역(ⅰ, ⅱ; ⅲ)들 각각에 대해 상기 제1 버퍼메모리(401)에 저장된 계수들(k_Y ⁿ⁺¹ - k_Y ^m)의 평균 계수값들(K_ⅰ, K_ⅱ; K_ⅲ)을 계산하기 위한 프로세싱 유닛(402)와,

특정 주파수대역들(ⅰ, ⅱ; ⅲ)에서 적어도 하나의 기본 코드화 신호(P)의 대응하는 계수들(K_Y)들이 있는 한 각 주파수대역들(ⅰ, ⅱ; ⅲ)에 대한 각 평균 계수값들(K_ⅰ, K_ⅱ; K_ⅲ)을 반복적으로 저장하기 위한 제2 버퍼메모리(403)와,

상기 제1 버퍼메모리(401)에서부터 문턱값(f_T) 까지의 계수들(k_Y ¹ - k_Y ⁿ)을 독출하고 또한 제2 버퍼메모리(403)에서부터 문턱값(f_T) 위의 계수들(k_Y ⁿ⁺¹ - k_Y ^m)을 독출하여 평탄화된 일차 디코드화 스펙트럼
의 계수들(K_YE)을 형성하는 독출유닛(404)를 포함하는 것을 특징으로 하는 수신기.
제39항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)은 등간격인 것을 특징으로 하는 수신기.
제39항 또는 제40항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)은 적어도 부분적으로 중첩하는 것을 특징으로 하는 수신기.
제41항에 있어서,

윈도우된 대응하는 주파수대역들을 얻기 위하여 윈도우함수(W₁; W₂)로 각 주파수대역(ⅰ, ⅱ; ⅲ)을 승산하고, 그리고

각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써 주파수대역들(ⅰ, ⅱ; ⅲ)의 중첩영역들에서 최종 계수값들을 유도하기 위한 계수 결합기를 포함하는 것을 특징으로 하는 수신기.
제42항에 있어서, 상기 윈도우함수(W₁; W₂)들은 비-중첩 주파수영역에서는 일전한 크기를 가지고 또한 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 수신기.
제1노드에서 제2노드로 음향 소오스신호(x)의 전송을 위한 통신시스템에 있 어서,

상기 청구항 제31항 내지 제36항 중 어느 한 항에 따라 엔코드된 정보를 생성하기 위해 음향 소오스신호(x)를 엔코딩하는 송신기(300)와,

상기 송신기(300)가 생성한 엔코드된 정보를 수신하기 위한 입력을 가지고 또한 엔코딩된 정보를 청구항 제37항 내지 제43항 중 어느 한 항에 따라 음향 소오스신호(x)의 추정
으로 디코딩하는 수신기(310)와,

송신기(300)에서 수신기(310)로 적어도 하나의 강화된 코드화 신호(P_(E))를 전송하기 위한 전송매체(306)를 포함하는 것을 특징으로 하는 통신시스템.