KR20060051298A - 대역 제한 오디오 신호의 대역폭 확장 - Google Patents

대역 제한 오디오 신호의 대역폭 확장 Download PDF

Info

Publication number
KR20060051298A
KR20060051298A KR1020050085829A KR20050085829A KR20060051298A KR 20060051298 A KR20060051298 A KR 20060051298A KR 1020050085829 A KR1020050085829 A KR 1020050085829A KR 20050085829 A KR20050085829 A KR 20050085829A KR 20060051298 A KR20060051298 A KR 20060051298A
Authority
KR
South Korea
Prior art keywords
band
parameter
audio signal
wideband
signal
Prior art date
Application number
KR1020050085829A
Other languages
English (en)
Other versions
KR101207670B1 (ko
Inventor
베른트 이저
게라트 우웨 슈미트
Original Assignee
하만 베커 오토모티브 시스템즈 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 하만 베커 오토모티브 시스템즈 게엠베하 filed Critical 하만 베커 오토모티브 시스템즈 게엠베하
Publication of KR20060051298A publication Critical patent/KR20060051298A/ko
Application granted granted Critical
Publication of KR101207670B1 publication Critical patent/KR101207670B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/69Spread spectrum techniques
    • H04B1/7163Spread spectrum techniques using impulse radio
    • H04B1/7176Data mapping, e.g. modulation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)
  • Transmitters (AREA)
  • Amplifiers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

본 발명은 대역 제한 오디오 신호의 대역폭 확장을 위한 시스템 및 방법에 관한 것이다. 본 발명의 시스템은 전송 사이클 레이트에서 대역 제한 오디오 신호를 분석하고 전송 사이클 레이트에서 적어도 하나의 대역 제한 매개변수를 획득하도록 구성된 분석 수단, 적어도 하나의 대역 제한 매개변수에 기초하여 적어도 하나의 광대역 매개변수를 획득하도록 구성된 매핑 수단, 및 전송 사이클 레이트에서 고대역 및/또는 저대역 오디오 신호를 생성하도록 구성된 오디오 신호 생성 수단을 포함한다.
대역 제한 오디오 신호, 광대역 오디오 신호, 전송 사이클 레이트, 대역폭 확장, 스펙트럼 엔벨로프

Description

대역 제한 오디오 신호의 대역폭 확장{BANDWIDTH EXTENSION OF BANDLIMITED AUDIO SIGNALS}
도 1은 신호 전처리 수단, 2개의 제어부, 비선형 매핑 수단, 신호 생성 수단 및 광대역 합성 수단을 포함하는 본 발명의 시스템의 일 실시예의 기본 구조를 나타내는 도면.
도 2는 대역 제한 신호로부터 스펙트럼 엔벨로프(spectral envelope)를 추출하는 수단, 피치와 전력 분석을 수행하는 수단, 2개의 제어부, 한 쌍의 코드 블럭, 사인 및 잡음 생성기, 및 광대역 합성 수단을 포함하는 본 발명의 시스템의 일 실시예를 나타내는 도면.
도 3은 대역 제한 스펙트럼 엔벨로프를 결정하는 단계, 이벤트 신호를 생성하는 단계, 광대역 스펙트럼 엔벨로프를 추정하는 단계, 및 고대역/저대역 음성 신호를 생성하는 단계를 포함하는 본 발명의 방법의 흐름을 나타내는 도면.
<도면의 주요 부호에 대한 부분의 설명>
11 : 전처리 수단
12 : 신호 분석 수단
13 : 제어부 1
14 : 비선형 매핑 수단
15 : 제어부 2
16 : 신호 생성 수단
17 : 광대역 음성 합성 수단
본 발명은 대역 제한 오디오 신호의 처리에 관한 것으로서, 전송 사이클 레이트에서 동작하는 합성 오디오 신호 생성기에 의한 대역폭 확장에 관련된 것이다. 보다 구체적으로는, 본 발명은 음성 신호의 형태의 대역 제한 오디오 신호의 처리에 관한 것이다.
오디오 신호의 전송은 종종 몇몇 대역폭 제한되어 발생한다. 대략 20㎐ 내지 20㎑의 주파수 범위를 커버하는 자연적인 대면(face to face) 음성 통신과는 달리, 전화기 또는 셀룰러 폰에 의한 전화 통신은 제한된 대역폭을 특징으로 한다. 통상의 전화 대역 제한(협대역) 오디오, 특히, 음성 신호는 단지 300㎐ 내지 3.4㎑의 대역폭을 나타낸다. 하부 및 상부 주파수 신호의 제어는 음성 품질의 열화를 야기하기 때문에, 특히, 명료성이 감소하기 때문에, 제한된 대역폭을 보다 넓은 대역폭으로 확장함으로써 획득될 수 있는 이점이 있다.
전화기 대역폭을 개선하는 문제점에 대한 가능한 솔루션은 둘 이상의 대역 제한 음성 채널의 조합 또는 이른바 광대역 음성 코드의 사용이다. 그러나, 이러한 방법은 서비스 변형을 요구할 뿐만 아니라 바람직하게 않게 비용을 증가시킨다.
따라서, 통신의 수신측에서 개선된 대역폭을 제공하는 것이 매우 바람직하다. 인간의 성도(vocal tract)의 속성으로 인해, 대역 제한으로 인해 상실하는 원래의 언급의 주파수 부분과 대역 제한 음성 신호 간의 상관관계가 있다. 결과적으로, 대역폭 확장의 유망한 방법은 대역 제한 음성 신호로부터 광대역 음성 신호의 합성을 포함한다.
대역폭의 확장은 임의의 음성 신호 분석, 예를 들면, 고역 통과 필터로 보충되는 입력 대역 제한 음성 신호의 직접 스펙트럼 폴딩(direct spectral folding)에 의해 광대역 음성 신호를 생성함으로써 달성될 수 있다. 단순한 스펙트럼 폴딩에 대신하여, 예를 들면, 대역 제한 음성 신호의 내삽 후에 파형 정류(wave form rectification)와 같은 비선형 처리가 광대역 음성 신호를 획득하는데 사용될 수 있다. 이러한 직접 변환 기술은 사용하기 용이한 반면, 이들은 통상 음성 신호 분석을 사용하는 방법에 비교하여 열악한 결과를 나타낸다.
음성 신호 분석을 사용하여 제한된 전화 음성으로부터 광대역 음성 신호를 생성하는 일반적인 시스템은 통상 적어도 두 개의 처리 단계를 수행한다. 제1 단계에서, 광대역 스펙트럼 엔벨로프는 대역 제한 음성 신호로부터 추출되는 결정된 대역 제한 엔벨로프로부터 추정된다.
통상, 룩업 테이블 또는 코드 북(J. Epps 및 W.H. Holmes에 의한 "A New Technique for Wideband Enhancement of Coded Bandlimited Speech", IEEE Workshop on Speech Coding, Conf. Proc., p.174, 1999 참조)은 음성 신호의 대역 제한 및 광대역 스펙트럼 엔벨로프 표시를 한정하되, 다소 컴퓨터 시간 및 메모리 소모적인 트레이닝 단계 동안 설계된다. 수신된 음성 신호의 추출된 대역 제한 스펙트럼 엔벨로프 표시의 가장 근접한 광대역 스펙트럼 엔벨로프 표시은 코드 북에서 식별되어야 하여, 그 후 필요한 광대역 음성 신호를 합성하는데 사용되어야 한다.
코드 북의 구성, 예를 들면, US 5,455,888에서와 같이 선형 예측 코딩(LPC) 분석의 수단에 의해 달성될 수 있다. LPC 계수는 광대역 트레이닝 신호로부터 추출된다. 이들 신호는 대역 통과 필터링되고 결과적인 대역 제한 신호의 LPC 계수는 또한 추출되어 대역 제한 및 광대역 신호의 LPC 표현 간의 상관관계를 설정할 수 있게 한다.
제2 단계에서, 광대역 여기 신호는 수신된 대역 제한 음성 신호로부터 생성되어야 한다. 이 여기 신호는 성대(vocal chord)에서 즉시 검출될 수 있는, 즉, 전체 성도, 입으로부터 음성 방출 특성에 의한 변형이 없는 신호를 이상적으로 나타낸다. 여기 신호는 예를 들면 비선형 특성 곡선("Spectral Widening of the Excitation Signal for Telephone-Band Speech Enhancement", IWANEC 2001, Conf. Proc., p.215, 2001 참조)에 의해, 또는 대역 제한 여기 신호의 피치 및 전력에 기초하여(US 5,455,888)에 의해 모델링될 수 있다. 전화 대역의 대역폭을 확장하기 위해서, 모델링된 여기 신호는 그 후 추정된 광대역 스펙트럼 엔벨로프로 형성되고 대역 제한 신호에 추가된다.
상술한 모든 방법은 신호 처리가 소정 개수의 연속적인 음성 샘플로 이루어진 프레임 또는 블럭에 기초한다는 공통점을 갖는다. 음성 분석 동안 결정되는, 예를 들면, 포르만트(formant), 피치, 평균 전력 및 스펙트럼 엔벨로프와 같은 관련 음성 매개변수는 통상 20㎳인 프레임의 기간 동안 일정하다고 가정한다. 이 프레임은 50% 까지 서로 중첩되도록 선택되어 통상 10㎳ 이상의 시간 오프셋을 야기한다.
신호 처리에서 이러한 시간 지연은 진폭 및/또는 주파수 및/또는 위상의 불연속 모델링에 의해 야기되는 아티팩트(artifact)를, 특히, 높은 시간 가변성을 지닌 통신에서 유도할 수 있다. 더욱이, 핸즈 프리 전화 통신의 경우, 당업계의 시스템에 의해 야기되는 신호 경로에서의 한정 지연은 전송 경로의 지연에 의해 바람직하지 않게 보완된다.
따라서, 대역 제한 전화 통신을 확장하는데 있어서 최근의 개발과 개선에도 불구하고, 개선된 오디오, 특히, 효과적인 대역폭 확장을 포함하는 음성 신호 처리가 여전히 요구된다. 따라서, 본 발명의 기초가 되는 과제는 상술한 단점을 극복하고 수신기 측에서 효과적으로 확장되는 대역폭 음성 통신의 음성 처리에 대한 시스템 및 방법을 제공하는 것이다.
상기 과제는 청구항 제1항에 따른 시스템과 청구항 제12항에 따른 방법에 의해 해결된다. 대역 제한 오디오 신호의 대역폭 확장에 대한 본 발명의 시스템은 전송 사이클 레이트에서 대역 제한 오디오 신호를 분석하고 전송 사이클 레이트에서 적어도 하나의 대역 제한 매개변수를 획득하도록 구성된 분석 수단, 상기 적어도 하나의 대역 제한 매개변수에 기초하여 적어도 하나의 광대역 매개변수를 획득 하도록 구성된 매핑 수단, 및 고대역 및/또는 저대역 오디오 신호를 상기 전송 사이클 레이트에서 상기 적어도 하나의 광대역 매개변수에 기초하여 생성하도록 구성되는 오디오 신호 생성 수단을 포함한다.
본 발명에 따르면, 종래 기술과는 달리, 대역 제한 오디오 신호는 전송 사이클 레이트에서와 고대역 및/또는 저대역 오디오 신호에서 분석될 뿐만 아니라 결합된 광대역 오디오 신호는 전송 사이클 레이트를 기초로 생성된다. "고대역" 및 "저대역"은 주파수 스펙트럼의 부분을 의미하는 것으로서, 수신된 제한 대역에 추가하여 합성된다. 예를 들면, 대역 제한 신호가 300㎐ 내지 3.4㎑의 주파수 범위를 나타내는 경우, 저대역 및 고대역 신호는 샘플링 레이트의 최대 절반으로 50 내지 300㎐의 주파수와 3.4㎑에서 소정의 고주파 한도까지의 주파수 범위를 각각 나타낸다.
대역폭 확장을 위한 통상의 시스템은 블럭 또는 프레임 기반으로 동작한다. 8㎑의 통상의 샘플링 레이트에 있어서, 분석 및 광대역 오디오 합성은 통상 약 20㎳의 프레임, 즉, 오디오 데이터의 160개 정도의 연속 샘플을 포함하는 프레임에 대하여 수행된다. 결과적으로, 종래의 전반적인 신호 처리는 일부 지연을 나타내는 반면, 본 발명에 따른 신호 처리는 지연이 전혀 또는 거의 없이 수행될 수 있다. 더욱이, 송신측의 음성 전달(verbal utterance)이 높은 시간 가변성을 나타내는 경우에도, 진폭, 주파수 및 위상에 있어서의 광대역 오디오 신호의 연속 합성이 본 발명의 시스템에 의해 제공된다.
본 발명은 특히 수신된 음성의 개선된 명료성과 자연스러움을 나타내는 음성 전화통신에서의 대역폭 확장에 유용하다. 특히, 분석 수단과 전송 사이클 레이트에서의 오디오 신호 생성 수단의 동작은 광대역 오디오, 특히, 음성 신호의 진폭, 주파수 및 위상의 연속 합성으로 거의 또는 이상적으로 완전히 지연이 없는 음성 통신을 가능하게 한다. 본 발명은 오디오 신호의 처리에는 유용한 것으로 이해되지만, 통상, 대역 제한 음성 신호의 확장에서 탁월하게 적용된다.
오디오 또는 음성 분석 수단은 바람직하게는 음성의 피치를 추정하고 대역 제한 여기 신호와 대역 제한 스펙트럼 엔벨로프를 추출하며 관련 대역 제한 매개변수를 제공한다. 통상, 대역 제한 매개변수는 예를 들면 대역 제한 스펙트럼 엔벨로프의 결정, 피치, 단기간 전력, 고대역 통과 대 저대역 통과 전력비 및 신호 대 잡음비에 대한 특성인 매개변수이다. 따라서, 광대역 매개변수는 예를 들면 광대역 스펙트럼 엔벨로프, 광대역 스펙트럼 엔벨로프의 결정을 위한 특성 매개변수 및 광대역 여기 신호와 같이 대역 제한 매개변수에 대응하는 광대역 오디오 신호에 대한 매개변수를 포함한다.
내삽에 의해 샘플링 레이트를 증가시키는 것과 같이 일부 전처리는 분석 이전에 수행될 수 있다. 프로세서 부하를 상대적으로 낮게 유지하기 위해서, 분석 수단에서 반복 알고리즘을 구현하는 것이 바람직할 수 있다.
예를 들면, 선형 예측 코딩(LPC) 방법이 대역 제한 스펙트럼 엔벨로프를 추출하는데 사용될 수 있다. 이 방법에 따르면, 시간 신호 x(n)의 n번째 샘플은 다음과 같이 M개의 이전 샘플로부터 추정될 수 있다:
Figure 112005051425613-PAT00001
여기서, ak(n)은 예측 에러 신호 e(n)을 최소화하는 방식으로 최적화되어야 한다. 최적화는 예를 들면 최소 평균 제곱 알고리즘에 의해 반복적으로 행해질 수 있다. 대응하는 광대역 스펙트럼 엔벨로프는 몇몇 비선형 매핑 수단(아래 참조)에 의해 추출된 대역 제한 스펙트럼 엔벨로프에 할당될 수 있다.
대역 제한 음성 신호의 분석에 기초하여, 광대역 여기 신호가 생성될 수 있다. 이러한 광대역 여기 신호는 추정된 광대역 스펙트럼 엔벨로프에 의해 추후 형상되어 광대역 음성 신호를 생성할 수 있다.
여러 다른 음성 분석 절차가 음성 분석 수단에 의해 수행될 수 있으며 전송된 대역 제한 음성 신호를 보완하는 저대역/고대역 음성 신호의 후속 함성에 사용될 수 있다. 무엇보다도, 단기간 전력, 실제 신호 대 잡음비 SNR, 고대역 통과 대 저대역 통과 전력비, 및 신호 널링(signal nulling)이 결정될 수 있고 검출된 음성 신호의 음성(voiced portion) 및 비음성 부분(unvoiced portion)에 대한 분류가 수행될 수 있다.
또한, 시스템은 전송 사이클 레이트에서 오디오 신호 생성 수단에 의해 생성되는 고대역 및/또는 저대역 오디오 신호와 대역 제한 오디오 신호를 수신하고 대역 제한 오디오 신호와 고대역 및/또는 저대역 오디오 신호를 전송 사이클 레이트에서 광대역 오디오 신호에 결합하도록 구성되는 결합 수단을 포함하는 이점이 있 다.
바람직한 실시예에서, 본 발명은 적어도 하나의 대역 제한 매개변수를 수신하도록 구성된 제어 수단을 더 포함하되, 상기 제어 수단은 전송 사이클 레이트보다 낮은 이벤트 레이트에서 그리고 적어도 하나의 특정 조건이 충족된 경우에만 적어도 하나의 광대역 매개변수를 획득하도록 매핑 수단을 제어한다.
본 실시예에 따르면, 전송 사이클 레이트 기반으로 동작하는 실시간 처리 부분과 시스템의 비동기 부분을 구별할 수 있다. 실시간 처리 부분은 대역 제한 오디오 신호의 수신 및 분석, 및 고대역 및/또는 저대역 오디오 신호의 생성을 수행한다. 제어 수단은 "이벤트 레이트"로 불리는 전송 사이클 레이트는 아니지만 보다 낮은 레이트인 적어도 하나의 광대역 매개변수를 획득하는 매핑 수단을 제어한다는 의미에서 비동기적으로 동작할 수 있다. 이에 의해, 프로세서 부하가 상당히 감소될 수 있다.
더욱이, 임의의 경우에 광대역 매개변수를 획득할 필요는 없지만, 예를 들면 오디오 신호의 상당한 변형이 발생하는 경우에만, 이에 따라 고대역 및/또는 저대역 오디오 신호의 생성이 변형되어야 한다.
제어 수단은 고대역 및/또는 저대역 오디오 신호를 생성하는데 필요한, 특히, 주파수, 위상 및 진폭에서 매개변수에 대한 통상의 값에 적응시키는 오디오 신호 생성 수단을 제어할 수 있되, 상기 통상의 값은 이벤트 레이트에서 적어도 하나의 광대역 매개변수에 기초하여 변형된다.
오디오 또는 음성 신호 생성은 본 발명에 따른 사이클 레이트 기반으로 수행 되지만, 즉, 오디오 또는 음성 신호 생성 수단은 예를 들면 주파수와 진폭의 실제 값으로 실시간 동작하지만, 오디오 신호 생성 수단이 전송 사이클 레이트보다 낮은 레이트에서 적응시켜야 하는 통상의 값을 변형하는 것이 이로울 수 있다.
본 발명에 따르면, 오디오 신호 생성 수단이 매 전송 사이클마다 제한된 최대 증분으로 통상 값에 적합하도록 제어되되, 특히 최대 증분은 음성 생성의 시간 가변성에 기초한 것이 매우 바람직하다.
신호 생성 수단, 특히 사인 생성기는 연속적으로 동작하지만 예를 들면 화자의 언급의 시간 가변성에 의해 주어지는, 사전 분석에 의해 획득되지만 소정의 적합 속도인 공칭값에 즉시 적합하게 되지 않는다. 그 결과, 단기간 에러 분석 데이터는 합성된 음성 신호에 대한 심각한 영향을 갖지 않고 위상 불연속이 방지된다.
본 발명의 일 실시예에 따르면, 제어 수단은 제1 및 제2 제어부를 포함하되, 상기 제1 제어부는 적어도 하나의 조건이 충족되는 경우 적어도 하나의 이벤트 신호를 생성하도록 구성되고, 이벤트 신호가 생성된 경우에만 매핑 수단을 제어하여 적어도 하나의 광대역 매개변수를 획득하고, 상기 제2 제어부는 적어도 하나의 이벤트 신호와 적어도 하나의 광대역 매개변수를 수신하도록 구성되고 적어도 하나의 이벤트 신호가 수신된 경우에만 고대역 및/또는 저대역 오디오 신호를 생성하는데 필요한 매개변수에 대한 공칭값을 변형한다.
제1 및 제2 제어부는 서로 논리적으로 및/또는 물리적으로 구별될 수 있다. 제2 제어부는 사이클 레이트 기반으로 오디오 신호 생성 수단을 제어할 수 있지만, 이는 사이클 레이트보다 낮은 레이트(이벤트 레이트)에서 이벤트 신호 기반으로만 그리고 이벤트 신호가 제1 제어부에 의해 생성된 경우에만 오디오 생성 수단에 대한 공칭값을 변형한다.
상기 적어도 하나의 특정 조건은 적어도 하나의 대역 제한 매개변수가 소정 한도를 초과하는 경우, 또는 이벤트 레이트의 2개의 연속 펄스에 대한 적어도 하나의 대역 제한 매개변수 간의 차이가 소정 한도를 초과하거나, 소정 개수의 사이클 레이트가 초과된 경우에 주어질 수 있다. 예를 들면, 유클리드 거리와 같은 벡터량에 대한 기하학적 거리 측정 이외에, 심리음향 거리(psychoacoustic distance)가 또한 사용될 수 있다.
또한, 분석 수단 및/또는 제어 수단은 오디오 신호 생성 수단의 제어에 사용되는 신뢰성 코드 번호를 생성할 수 있다. 분석 수단이 상이한 분석 결과에 대한 신뢰성 코드 번호를 제어하는 경우, 제어 수단은 고대역/저대역 오디오 신호의 생성에 사용되는 매개변수에 대한 결합된 신뢰 정보를 획득할 수 있다.
또한, 제어 수단은 그 자신의 신뢰성 코드 번호를 생성할 수 있다. 예를 들면, 추정된 피치에 대한 높은 신뢰도가 상이한 분석 도구에 의해 표시된 경우, 제어부는 평활화(smoothing) 없이 또는 단지 극히 일부만으로 오디오 신호를 생성하도록 신호 생성 수단의 제어를 결정할 수 있다. 또한, 광대역 매개변수의 재계산에 대한 상이한 영향은 개별 신뢰성 번호에 따라 가중될 수 있다.
더욱이, 신뢰성 코드 번호에 대한 한계를 미리 결정하는 것이 바람직할 수 있다. 분석 프로세스의 결과에 대한 실제 신뢰성 코드 번호가 소정 한도 아래로 떨어지는 경우(작은 수가 낮은 신뢰 레벨을 의미하는 경우), 광대역 매개변수의 채 택과 이에 따라 신호 처리 수단을 제어하도록 계산된 공칭값이 실행되지 않을 수 있다.
본 발명의 시스템의 일 실시예에 따르면, 매핑 수단은 적어도 하나의 대역 제한 매개변수와 적어도 하나의 광대역 매개변수 간의 상관 관계를 제공하는 인공 중립 네트워크 및/또는 코드 북을 포함한다.
바람직하게는, 한 쌍의 코드 북이 사용될 수 있다. 이러한 쌍의 제1 코드 북은 스펙트럼 엔벨로프에 대한 대역 제한 샘플 벡터로 트레이닝되어야 하고, 제2 코드 북은 광대역 벡터로 트레이닝되어야 한다. 트레이닝은 벡터 양자화 방법에 기초할 수 있다. 실제 분석된 음성 신호에 있어서, 예를 들면, 대역 제한 코드 북의 LPC 계수를 포함하는 가장 근접한 요소가 결정된다. 광대역 코드 북의 관련 벡터로의 매핑은 예를 들면 광대역 스펙트럼 엔벨로프의 추정치에 대하여 사용될 매개변수를 결정할 수 있게 한다.
다르게는, 또는 코드 북에 더하여, 분석된 대역 제한 음성 신호의 가장 근접한 샘플의 광대역 음성 신호로의 비선형 매핑을 위한 다른 수단이 인공 중립 네트워크를 감쌀 수 있다.
비선형 매핑 이전에, 예를 들면 LPC 계수인 획득된 광대역 매개변수의 몇몇 변형이 수행될 수 있다. 선 스펙트럼 주파수 또는 켑스트럴 계수(cepstral coefficient)로의 변형은 이점이 있는 구현예를 나타낸다.
본 발명의 시스템의 오디오 신호 생성 수단은 사인 생성기와 잡음 생성기에 의해 또는 사인 생성기를 포함할 수 있다.
또한, 본 발명은 핸즈 프리 시스템을 제공하며, 특히, 상술한 바와 같이 본 발명의 시스템을 포함하는 차량에 사용되는 핸즈 프리 시스템을 제공한다.
더욱이, 본 발명은 대역 제한 오디오 신호로부터 광대역 오디오 신호를 생성하는 방법에 관한 것으로서, 전송 사이클 레이트에서 대역 제한 오디오 신호를 수신하고 분석하는 단계; 전송 사이클 레이트에서 적어도 하나의 대역 제한 매개변수를 획득하는 단계; 적어도 하나의 광대역 매개변수를 적어도 하나의 대역 제한 매개변수에 할당하는 단계; 전송 사이클 레이트에서 적어도 하나의 광대역 매개변수에 기초하여 고대역 및/또는 저대역 오디오 신호를 생성하는 단계; 및 오디오 신호 생성 수단에 의해 생성되는 대역 제한 오디오 신호와 고대역 및/또는 저대역 오디오 신호를 전송 사이클 레이트에서 광대역 오디오 신호에 결합하는 단계를 포함한다.
본 발명의 방법의 일 실시예에 따르면, 적어도 하나의 광대역 매개변수는 코드 북 및/또는 인공 네트워크를 사용하여 적어도 하나의 대역 제한 매개변수에 할당된다.
적어도 하나의 광대역 매개변수의 적어도 하나의 대역 제한 매개변수로의 할당은 이벤트 레이트가 전송 사이클 레이트보다 적고 적어도 하나의 특정 조건이 충족된 경우에만 실행된다.
본 발명의 방법의 일 실시예에 따르면, 매개변수, 특히, 주파수와 진폭에 대한 공칭값은 고대역 및/또는 저대역 오디오 신호를 생성하는데 사용되고, 이들 공칭값은 이벤트 레이트에서 적어도 하나의 광대역 매개변수에 기초하여 변형된다. 또한, 오디오 신호 생성 수단은 매 전송 사이클에서 제한된 최대 증분으로 공칭값에 적합하도록 될 수 있다.
적어도 하나의 이벤트 신호는 적어도 하나의 특정 조건이 충족된 경우 생성될 수 있고, 적어도 하나의 광대역 매개변수는 적어도 하나의 대역 제한 매개변수에 할당될 수 있으며, 이벤트 신호가 생성된 경우에는 고대역 및/또는 저대역 오디오 신호를 생성하는데 필요한 매개변수에 대한 공칭값이 변형될 수 있다.
본 발명의 방법에서 사용되는 적어도 하나의 특정 조건은, 적어도 하나의 대역 제한 매개변수의 값이 소정 한도를 초과하는 경우 또는 이벤트 레이트의 두 개의 연속 펄스에 대한 적어도 하나의 대역 제한 매개변수의 값들 간의 차이, 예를 들면, 현재의 분석값과 마지막 이벤트에서의 결정된 값 사이의 차이가 소정 한도를 초과한 경우, 또는 소정 개수의 사이클 레이트가 초과된 경우 충족될 수 있다.
본 발명의 방법의 일 실시예는 획득된 적어도 하나의 대역 제한 매개변수 및/또는 적어도 하나의 대역 제한 매개변수 중 하나 이상의 결합 및/또는 적어도 하나의 광대역 매개변수 및/또는 적어도 하나의 광대역 매개변수 중 하나 이상의 결합에 대한 신뢰성 코드 번호를 포함하되, 상기 신뢰성 코드 번호는 오디오 신호 생성 수단을 제어하는데 사용된다.
고대역 및/또는 저대역 오디오 신호는 사인 생성기에 의해 또는 사인 생성기와 잡음 생성기에 의해 사이클 레이트에서 생성될 수 있다.
더욱이, 본 발명은 펄스 기반 방식으로 동작하는 합성 음성 신호 생성기에 의한 대역폭 확장으로 대역 제한 음성 통신의 음성 처리에 대한 본 발명의 방법을 수행하는 컴퓨터 실행가능 명령을 갖는 하나 이상의 컴퓨터 판독가능 매체를 포함하는 컴퓨터 프로그램 제품을 제공한다.
본 발명의 다른 특징 및 이점은 도면을 참조하여 설명될 수 있다. 본 명세서에서, 본 발명의 바람직한 실시예를 나타내는 첨부 도면에 대한 참조가 행해진다. 이러한 실시예는 본 발명의 전체 범위를 나타내려는 것이 아니며, 본 발명의 범위는 후술하는 청구항에 의해 한정됨이 이해될 것이다.
도 1은 대역 제한 오디오, 특히, 음성 신호의 대역폭 확장에 대한 본 발명의 기본 요소를 나타내며, 특히, 예를 들면 대역 제한 음성 통신을 개선한다. 본 발명의 후술하는 실시예에서, 음성 통신 시스템의 애플리케이션을 설명한다. 보다 일반적인 오디오 신호 처리에 대한 변형은 직접적인 방식으로 수행될 수 있다.
대역 제한 음성 신호는 전처리 수단(11)에 의해 전처리된다. 이는 검출된 대역 제한 음성 신호를 신호 분석 수단(12)과 광대역 음성 합성 수단 또는 결합 수단(17)으로 간단히 전송할 수 있다.
다르게는, 샘플링 레이트를 증가시킴으로써, 그러나 추가적인 주파수 범위를 생성하지 않고 전처리 대역 제한 음성 신호가 원하는 대역폭으로 변환될 수 있는 이점이 있다. 예를 들면, 대역 제한 신호는 8㎑에서 샘플링되는 경우, 16㎑의 샘플링 주파수에서 신호를 출력하는 전처리를 위한 내삽 수단에서 입력될 수 있다. 샘플링 레이트가 증가되는 경우, 수신된 대역 제한 신호의 주파수 범위의 광대역 음성 합성 또는 결합 수단(17)만으로의 전송을 가능하게 하는 대역 통과를 더 사용 할 수 있는 것이 바람직하다.
신호 분석 수단(12)는 전송 사이클 레이트 기준으로 동작하고 전처리된 음성 신호로부터 대역 제한 스펙트럼 엔벨로프를 추출하는 수단을 포함하는 것이 바람직하다. 예측 에러 필터를 계산하기 위해서 선형 예측 코딩(LPC)의 강인한 방법을 사용하는 것이 바람직할 수 있다. 예측 에러 필터의 계수는 대역 제한 스펙트럼 엔벨로프의 매개변수 결정을 위해 사용될 수 있다.
다르게는, 선 스펙트럼 주파수 또는 켑스트럴 계수 또는 멜-주파수 켑스트럴 계수(mel-frequency cepstral coefficient)에 기초한 스펙트럼 엔벨로프 표시에 대한 모델을 사용할 수 있다.
당업계에서 공지된 바와 같이, 예측 에러에 대한 최적화 문제는 자기 상관 행렬을 내삽한 선형 등식 시스템으로 공식화될 수 있다. 이러한 대수 등식 시스템의 솔루션에 대한 효율적인 알고리즘은 본 발명의 일 실시예에서 사용될 수 있는 레빈슨 더빈 알고리즘(Levinson-Durbin algorithm)이다. 레빈슨 더빈 알고리즘의 사용에 의한 LPC 분석을 수행하는 프로세서 부하는 표준 FET의 부하보다 낮지만, 여전히 상당히 높다.
그러나, 프로세서 부하를 감소하기 위해서 예를 들면 최소 자승법(LMS)에 기초할 수 있는 반복 알고리즘을 대신 사용할 수 있는 것이 바람직할 수 있다. 신호 처리가 푸리에 변환 시간 신호 X(f)로 수행되는 경우, 스펙트럼 엔벨로프는 주파수(f) 공간에서 올 폴(all-pole) 전송 펑션 W(f)에 기반하여 모델링될 수 있다:
Figure 112005051425613-PAT00002
여기서, M개의 샘플 중에서 m번째 신호의 시간 지연 kㆍt로서, ak와 E(t)는 예측 변수와 에러 신호를 각각 의미한다. 관련 모델은 대역 제한 스펙트럼 엔벨로프의 계산을 위해 매우 효율적인 반복 방법으로서 본 발명에서 사용될 수 있는 자동 회귀 모델(Auto-Regressive Model)로 알려져 있다.
또한, 신호 분석 수단(12)은 당업계에서 공지된 바와 같이 비선형 특성 직선의 수단에 의해 행해질 수 있는 광대역 여기 신호를 추정하는 수단을 포함할 수 있다. 이러한 광대역 여기 신호는 성대에서 직접 검출될 수 있는, 즉, 전체 성도에 의한 변형이 없고 글로털 신호(glottal signal)로 통상 알려진 신호를 나타낸다. 추정된 광대역 여기 신호는 합성 광대역 신호를 획득하기 위해서 추정된 광대역 스펙트럼 엔벨로프(아래 참조)에 의해 추후 형성될 수 있다.
포함될 수 있는 추가적인 신호 분석 수단은 실제 SNR, 여기 신호의 단기간 전력, 포르만트, 피치, 고대역 대 저대역 전력비를 결정하거나 검출된 구두 언급의 음성 및 비음성 부분에 따른 구변 수단이다.
또한, 음성 분석 수단의 각각의 컴포넌트는 출력 신뢰성 코드 번호를 출력할 수 있다. 통상, 이들은 추정된 매개변수, 예를 들면, 피치의 신뢰 레벨을 측정하는 스칼라 수치, 예를 들면, 0 내지 1이다.
신호 분석 수단(12)에 의해 획득되는 이러한 결과 및 신뢰성 코드 번호는 제 1 제어부(13)에 의해 수신된다. 수신된 데이터에 기초하여, 제1 제어부(13)는 이벤트 신호를 생성한다. 이벤트 신호는 몇몇 소정 조건이 충족된 경우 통상 생성된다. 합리적인 조건은 유클리드 거리와 같이 잘 정의된 거리 측정의 초과, 이벤트 신호(아래 참조)의 최종 생성시에 획득된 매개변수와 신호 분석 수단(12)에 의해 실제 획득되는 매개변수와의 단순 차이를 포함한다.
제1 제어부(13)는 전송 사이클 레이트 기반으로 동작하지는 않지만 전송 사이클 레이트보다 적은 가변 레이트에서만 액티브인 이점이 있다. 반면에, 제어의 몇몇 동결을 방지하기 위해서 매 nH>1 사이클 주기마다 이벤트 신호의 생성을 실행하는 것이 바람직할 수 있다.
음성 분석 수단(12)의 모든 결과가 획득된 후에 새로운 신뢰성 코드 번호가 계산되는 것이 바람직할 수 있다. 제어부(13)는 이들 모든 데이터를 수신하기 때문에, 분석 데이터의 신뢰 레벨(들)의 결합 추정치를 제공할 수 있다. 더욱이, 신호 분석 수단(12)의 상이한 컴포넌트에 의해 획득되는 개별 신뢰성 코드 번호는 새로운 신뢰성 코드 번호를 획득하기 위해서 제어부(13)에 의해 사용될 수 있다.
또한, 제1 제어부(13)는 실제 분석 데이터가 광대역 음성 합성의 변형을 요구함을 나타내는 적어도 하나의 이벤트 신호를 생성할 수 있다. 예를 들면, 대역 제한 스펙트럼 엔벨로프의 시간적 변화를 나타내는 제1 제어부(13)에 의해 이벤트 신호가 생성된 경우, 예를 들면, 광대역 LPC 계수인 광대역 매개변수의 새로운 추정치는 변경된 대역 제한 매개변수에 대응하여 필요하게 된다.
계산된 대역 제한 매개변수에 기초하여 광대역 매개변수의 추정은 몇몇 비선형 매핑 수단(14)에 의해 수행되는 것이 바람직할 수 있다. 일 실시예에 따르면, 코드 북의 쌍은 하나의 코드 북에 포함된 광대역 매개변수를 다른 코드 북에 포함된 대역 제한 매개변수에 할당하는데 사용된다. 일반적으로 말하면, 대역 제한 음성 신호가 분석되어 대역 제한 코드 북에서 가장 근접한 표현이 식별된다. 대응하는 광대역 신호 표현이 그 후 결정되어 광대역 음성 신호를 합성하는데 사용된다.
원리상, 전체 광대역 신호를 합성하거나, 다르게는, 대역 제한 신호의 대역폭 밖에서 합성된 음성 신호 부분, 즉, 고대역 및 저대역 음성 신호를 검출되고 분석된 대역 제한 신호에 추가하는 것이 바람직할 수 있다.
인공 중립 네트워크는 비선형 매핑 수단(14)으로서 코드 북의 보완 또는 대체로서 사용될 수 있다. 이러한 네트워크의 가중치는 사용 전에 오프라인으로 트레이닝되어야 하지만, 몇몇 온라인 트레이닝은 개별 신뢰성 코드 번호에 관련하여 고찰된다.
실제 애플리케이션과 구현에 따라 인공 중립 네트워크와 코드 북은 트레이닝을 요구하는 반면, 예를 들면 대역 제한 스펙트럼 엔벨로프의 스펙트럼 경사의 상부 밴드로의 선형 외삽에 기초한 야스카와 접근법(Yasukawa approach)과 같은 임의의 트레이닝을 요구하지 않는 방법을 사용하는 것으로 충분할 수 있다.
획득된 광대역 매개변수뿐만 아니라 이벤트 신호는 음성 신호 합성에 대한 새로운 공칭값을 결정하여 신호 생성 수단(16)을 제어하도록 제공되는 제2 제어부(15)에 의해 수신된다. 제2 제어부(15)는 제1 제어부(13)와 논리적으로 및/또는 물리적으로 분리될 수 있다.
예를 들면, 새로운 피치가 신호 분석 수단(12)에 의해 추정되고 이에 따라 이벤트 신호가 제1 제어부(13)에 의해 생성된 경우, 제2 제어부는 분석된 음성 신호의 새로운 광대역 확장에 의해 제공되고, 그 결과, 제2 제어부(15)는 신호 생성 수단(16)에 대한 공칭값을 조정한다.
또한, 제2 제어부(15)는 신호 생성 수단(16)에 추정된 광대역 매개변수의 신뢰 레벨 및/또는 예를 들면 생성된 사인 톤(sine tone)에서 불연속을 방지하기 위한 신호 합성의 개정 속도의 한도에 관한 정보를 제공하는 것이 바람직할 수 있다.
예를 들면, 매개변수 Δl, max가 한정되어 i번째 사인 생성기를 제어하여 최대값에서 Δl, max에 의해 각 사이클 레이트마다 주파수의 실제 값을 변경하는데 사용될 수 있다. 또한, Δl, min < Δl, max를 정의하고 주파수 범위에 대하여 신뢰성 코드 번호 0≤cl≤1 (작은 값은 낮은 신뢰 레벨을 나타냄)를 사용하여, i번째 사인 생성기의 주파수 변경에 대한 변경의 최대 속도는 Δl, min = Δl, max+cll, max - Δl, min)으로 측정될 수 있다.
신호 생성 수단(16)은 이벤트 신호에 따라 변경될 수 있는 제2 제어부(15)에 의해 제어 신호가 제공되는 반면, 신호 생성 수단(16)은 전송 사이클 레이트에서 동작하는 점이 중요하다.
신호 생성 수단(16)은, 예를 들면, 자연 음성의 물리적 생성에 기초하여 제 한된 적합 속도로 사전 분석에 의해 획득되는 공칭값에 적합하게 된다.
도 2는 본 발명의 시스템의 일 실시예를 나타낸다. 아래 점선으로 나타낸 수단은 전송 사이클 레이트 기반으로 동작하는 반면, 위에서 점선으로 나타낸 것은 이벤트 신호 기반으로 동작한다.
대역 제한 음성 신호 xlim은 검출된 후 대역 제한 스펙트럼 엔벨로프를 추출하고(20), 피치 분석하며(21) 대역 제한 여기 신호의 전력을 결정(22)하도록 구성된 컴포넌트를 포함하는 신호 분석 수단에 의해 수신된다. 신호 분석 수단(20, 21, 및 22)의 컴포넌트를 서로 데이터를 교환할 수 있다.
사인 생성기(26)에 대한 제어 매개변수는 피치 주파수 매개변수를 포함하는 것이 바람직하다. 이러한 매개변수는 피치 분석 수단에 의해, 예를 들면, 스펙트럼의 대수에 대한 역 FFT를 수행하여 켑스트럴(cepstral) 신호를 생성함으로써 획득될 수 있다. 구두 언급의 피치는 당업계로부터 공지된 몇몇 피크 선택 알고리즘에 의해 검출될 수 있는 켑스트럴 신호에서 피크로서 나타난다. 잡음 생성기에 대하여 사인 및 주파수 응답에 대한 진폭은 생성된 광대역 스펙트럼 엔벨로프로부터 획득된다.
제1 제어부(23)는 분석 수단(20, 21 및 22)에 의해 획득되는 데이터를 수신하고 광대역 음성 신호의 합성이 변형되어야 하는지를 결정한다. 상이한 매개변수에 대한 제1 제어부(23)에 의해 이벤트 신호를 생성하는 상이한 레이트를 갖는 것이 이점이 있을 수 있다. 임의의 경우, 생성 이벤트 신호의 레이트는 전송 사이클 레이트보다 낮아야 하는 것이 바람직하다.
제1 제어부(23)가 예를 들어 켑스트럴 이벤트 신호가 소정 한도를 초과하는 거리 측정으로 생성된 마지막 시점에서 결정된 일련의 켑스트럴 계수와 비교되는 켑스트럴 계수의 변화로 인해 이벤트 신호를 생성하는 경우, 한 쌍의 코드 북(24)은 변형된 광대역 음성 신호를 생성하는데 필요한 광대역 매개변수를 추정하는데 사용될 수 있다. 코드 북(24)에 의해, 주어진 결정된 대역 제한에 대한 광대역 스펙트럼 엔벨로프가 추정될 수 있다(상기 참조).
제1 제어부(23)와 코드 북(24)으로부터 수신된 데이터에 기초하여, 제2 제어부(25)는 사인 생성기(26)와 잡음 생성기(27)를 제어하여 (수신된 신호 xLim의 제한된 대역폭과 비교하여) 저대역 및 고대역 음성 신호를 생성한다. 두 생성기는 모두 전송 사이클 레이트 기반으로 동작한다. 제2 제어부(25)는 생성기(26 및 27)에 대한 새로운 공칭값을 결정할 뿐만 아니라 신호 합성의 개정 속도에 대한 한도와 신뢰성 코드 번호를 출력한다.
사인 생성기는 30 내지 300㎐의 주파수 범위에서의 저대역 확장과 3.4㎑ 내지 소정 주파수까지의 주파수 범위에서의 고대역 확장을 합성할 수 있고, 음성 신호 생성은 피치 주파수와 정수 배수에 주로 기초할 수 있다.
광대역 합성 수단(28)은 전송 사이클 레이트에서 대역 제한 신호 xLim뿐만 아니라 사인 생성기(26)와 잡음 생성기(27)에 의해 합성된 신호를 수신하여 최종 광대역 음성 신호 xWB를 합성한다. 바람직한 실시예에 따르면, 이 수단(28)은 합성 생성된 신호에 대한 대역 저지 필터를 포함할 수 있으며, 이들 필터링된 신호를 무변형 대역 제한 신호 xLim에 추가하여 광대역 음성 신호 xWB를 획득한다.
도 3은 본 발명의 방법의 기본 단계를 나타낸다. 대역 제한 신호는 검출되고(31) 그 후 분석된다. 구현된 알고리즘은 바람직하게는 반복 방식으로 전송 사이클 레이트 기반으로 동작한다. 특히, 대역 제한 스펙트럼 엔벨로프는 예를 들면 LPC 분석을 수행함으로써 결정된다(32). 대역 제한 스펙트럼 엔벨로프와 신뢰성 코드 번호의 매개변수 설명을 위한 대역 제한 매개변수가 제어부에 출력된다.
이 제어부는 이벤트 신호의 생성이 실행되는지(n≥nH) 또는 사이클 시간의 소정 정수 배수 nL이 이벤트 신호의 최종 생성 이후 경과된 기간(사이클 시간의 n배)만큼 초과되는지를 점검한다(33). n>nL인 경우, 대역 제한 매개변수, 특히, 대역 제한 스펙트럼 엔벨로프에 대한 매개변수에서 상당한 변화가 발생하는지를 더 점검한다(33). 몇몇 소정 거리 측정이 실제 대역 제한 매개변수, 예를 들면, 스펙트럼 엔벨로프를 모델링하는 LPC 계수와 이벤트가 생성된 최종 시점에서 결정된 각각의 매개변수 간의 (벡터) 차만큼 초과한 경우, 또는 하나의 매개변수가 소정 임계치를 초과하는 경우, 상당한 변화가 발생한다.
n<nL 또는 대역 제한 매개변수의 상당한 변화가 결정되지 않은 경우, 저대역 및 고대역 음성 신호가 생성되어(37) 통상의 제어 매개변수에 소정 속도로 적합하게 된다. 반대의 경우, 새로운 이벤트 신호가 생성되고(34) 대역 제한 스펙트럼 엔벨로프에 대응하는 광대역 스펙트럼 엔벨로프가 추정된다(35). 이러한 목적으로, 한 쌍의 코드 북이 사용될 수 있다. 이 쌍의 제1 코드 북은 스펙트럼 엔벨로프에 대한 대역 제한 샘플 벡터로 트레이닝되고 제2 코드 북은 광대역 벡터로 트레이닝되었다. 트레이닝은 유클리드 또는 임의의 다른 거리의 코드어에 기초하여 예를 들면 린드 부조 그레이(Linde-Buzo-Gray) 설계 방식과 같이 벡터 양자화 방법에 기초할 수 있다.
대역 제한 스펙트럼 엔벨로프(32)에 대한 대역 제한 매개변수를 결정한 후에, 매개변수 벡터는 이러한 매개변수 벡터로의 가장 근접한 거리로 대역 제한 코드 북의 벡터에 할당된다. 거리 측정으로서, 예를 들면, 이타쿠로-사이토(Itakuro-Saito) 거리 측정이 사용될 수 있다. 대역 제한 코드 북에 결정된 벡터는 광대역 코드 북의 대응 벡터에 매핑되고(35), 상기 광대역 코드 북은 물론 광대역 음성 신호를 합성하는데 사용된다.
무엇보다도, 특히 어느 광대역 매개변수가 갱신되어야 하는지에 대한 이벤트 신호의 정보와, 광대역 스펙트럼 엔벨로프에 대한 매개변수를 사용하여, 신호 생성기가 제어되어(36) 검출되고(31) 분석된 대역 제한 음성 신호에서 상실한 저대역 및 고대역 음성 부분을 생성한다(37).
사인 생성기는 통상 진폭과 주파수에 대한 공칭값에 적합하도록 제어되고 잡음 생성기는 통상 스펙트럼 엔벨로프의 전력에 적합하도록 제어된다. 단계 33 내지 35와는 달리, 저대역 및 고대역 음성 신호의 생성은 사이클 레이트 기반으로 수행된다. 신호 생성기는 이들의 실제 값으로 연속 동작하지만, 공칭값은 이벤트 신 호 기준, 즉, 사이클 구간의 매 nH>n>nL≥1 배만으로 변형된다.
상술한 모든 실시예는 본 발명의 특징 및 이점을 한정하려는 것이 아니고 예시하려는 것이다. 상술한 특징 중 일부 또는 전부는 상이한 방식으로 결합될 수 있음이 이해되어야 한다. 상술한 실시예는 음성 신호 처리에 관한 것이지만, 이들은 통상 오디오 신호 처리에 이용가능한 본 발명의 범위 내에서 변형될 수 있다.
상술한 본 발명에 따르면, 음성 신호 처리에 있어서 대역폭 확장을 효과적으로 구현할 수 있으며, 수신기 측에서 효과적으로 확장된 대역폭 음성 통신의 음성 처리에 대한 시스템 및 방법을 제공할 수 있다.

Claims (22)

  1. 대역 제한 오디오 신호의 대역폭 확장을 위한 시스템에 있어서,
    전송 사이클 레이트에서 대역 제한 오디오 신호를 분석하고 상기 전송 사이클 레이트에서 적어도 하나의 대역 제한 매개변수를 획득하도록 구성된 분석 수단;
    상기 적어도 하나의 대역 제한 매개변수에 기초하여 적어도 하나의 광대역 매개변수를 획득하도록 구성된 매핑 수단; 및
    상기 전송 사이클 레이트에서 상기 적어도 하나의 광대역 매개변수에 기반하여 고대역 및/또는 저대역 오디오 신호를 생성하도록 구성된 오디오 신호 생성 수단을 포함하는 대역폭 확장 시스템.
  2. 제1항에 있어서,
    상기 대역 제한 매개변수는 대역 제한 스펙트럼 엔벨로프(bandlimited spectral envelope)의 결정을 위한 특성 매개변수 및/또는 피치 및/또는 단기간 전력 및/또는 고대역 대 저대역 전력비(highband-pass-to-lowband-pass power ratio) 및/또는 신호 대 잡음비를 포함하고,
    상기 광대역 매개변수는 광대역 스펙트럼 엔벨로프 및/또는 광대역 여기 신호의 결정을 위한 특성 매개변수 및/또는 광대역 여기 신호를 포함하는 대역폭 확장 시스템.
  3. 제1항 또는 제2항에 있어서,
    상기 대역 제한 오디오 신호 및 상기 전송 사이클 레이트에서 상기 오디오 신호 생성 수단에 의해 생성되는 상기 고대역 및/또는 저대역 오디오 신호를 수신하고 상기 전송 사이클 레이트에서 상기 대역 제한 오디오 신호와 상기 고대역 및/또는 저대역 오디오 신호를 광대역 오디오 신호에 결합하도록 구성된 결합 수단을 더 포함하는 대역폭 확장 시스템.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 적어도 하나의 대역 제한 매개변수를 수신하도록 구성된 제어 수단을 더 포함하되,
    상기 제어 수단은 이벤트 레이트가 상기 전송 사이클 레이트보다 적은 경우, 그리고 적어도 하나의 특정 조건이 충족되는 경우에만 적어도 하나의 광대역 매개변수를 획득하도록 상기 매핑 수단을 제어하는 대역폭 확장 시스템.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제어 수단은 상기 오디오 신호 생성 수단을 제어하여 고대역 및/또는 저대역 오디오 신호를 생성하는데 필요한 매개변수, 특히, 주파수, 위상 및 진폭에 대한 공칭값을 적합하게 하되,
    상기 공칭값은 상기 이벤트 레이트에서 상기 적어도 하나의 광대역 매개변수에 기초하여 변형되는 대역폭 확장 시스템.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 오디오 신호 생성 수단은 매 전송 사이클 동안 제한된 최대 증분으로 상기 공칭값에 적합하게 되도록 제어되고,
    상기 최대 증분(maximum increment)은 특히 음성 생성의 시간 가변성(temporal variability)에 기초하는 대역폭 확장 시스템.
  7. 제4항 내지 제6항 중 어느 한 항에 있어서,
    상기 제어 수단은 제1 및 제2 제어부를 포함하되,
    상기 제1 제어부는 적어도 하나의 특정 조건이 충족되는 경우 적어도 하나의 이벤트 신호를 생성하도록 구성되고, 이벤트 신호가 생성된 경우에만 상기 매핑 수단을 제어하여 적어도 하나의 광대역 매개변수를 획득하고,
    상기 제2 제어부는 상기 적어도 하나의 이벤트 신호와 상기 적어도 하나의 광대역 매개변수를 수신하도록 구성되고, 적어도 하나의 이벤트 신호가 수신된 경우에만 고대역 및/또는 저대역 오디오 신호를 생성하는데 필요한 매개변수에 대한 공칭값을 변형하는 대역폭 확장 시스템.
  8. 제4항 내지 제7항 중 어느 한 항에 있어서,
    상기 적어도 하나의 특정 조건은,
    상기 적어도 하나의 대역 제한 매개변수의 값이 소정 한도를 초과하거나,
    상기 이벤트 레이트의 두 개의 연속 펄스에 대하여 상기 적어도 하나의 대역 제한 매개변수의 값들 간의 차이가 소정 한도를 초과하거나,
    소정 개수의 사이클 레이트가 초과되는 것에 의해 주어지는 대역폭 확장 시스템.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 분석 수단 및/또는 상기 제어 수단은 상기 오디오 신호 생성 수단의 제어에 사용되는 신뢰성 코드 번호(reliability code number)를 생성하는 대역폭 확장 시스템.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서,
    상기 매핑 수단은 상기 적어도 하나의 대역 제한 매개변수와 상기 적어도 하나의 광대역 매개변수 간의 상관 관계를 제공하는 인공 중립 네트워크 및/또는 코드 북을 포함하는 대역폭 확장 시스템.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 오디오 신호 생성 수단은 사인 생성기 또는 사인 생성기 및 잡음 생성기를 포함하는 대역폭 확장 시스템.
  12. 대역 제한 오디오 신호로부터 광대역 오디오 신호를 생성하는 방법에 있어 서,
    전송 사이클 레이트에서 대역 제한 오디오 신호를 수신하여 분석하고 상기 전송 사이클 레이트에서 적어도 하나의 대역 제한 매개변수를 획득하는 단계;
    적어도 하나의 광대역 매개변수를 상기 적어도 하나의 대역 제한 매개변수에 할당하는 단계;
    상기 전송 사이클 레이트에서 상기 적어도 하나의 광대역 매개변수에 기초하여 고대역 및/또는 저대역 오디오 신호를 생성하는 단계; 및
    상기 대역 제한 오디오 신호 및 상기 오디오 신호 생성 수단에 의해 생성되는 상기 고대역 및/또는 저대역 오디오 신호를 상기 전송 사이클 레이트에서 광대역 오디오 신호에 결합하는 단계를 포함하는 광대역 오디오 신호 생성 방법.
  13. 제12항에 있어서,
    상기 대역 제한 매개변수는 대역 제한 스펙트럼 엔벨로프의 결정을 위한 특성 매개변수 및/또는 피치 및/또는 단기간 전력 및/또는 고대역 대 저대역 전력비 및/또는 신호 대 잡음비를 포함하고,
    상기 광대역 매개변수는 광대역 스펙트럼 엔벨로프 및/또는 광대역 스펙트럼 엔벨로프의 결정을 위한 특성 매개변수 및/또는 광대역 여기 신호를 포함하는 광대역 오디오 신호 생성 방법.
  14. 제12항 또는 제13항에 있어서,
    상기 적어도 하나의 광대역 매개변수는 코드 북 및/또는 인공 네트워크를 사용하여 상기 적어도 하나의 대역 제한 매개변수에 할당되는 광대역 오디오 신호 생성 방법.
  15. 제12항 내지 제14항 중 어느 한 항에 있어서,
    상기 적어도 하나의 광대역 매개변수의 상기 적어도 하나의 대역 제한 매개변수로의 할당은 이벤트 레이트가 상기 전송 사이클 레이트보다 적은 경우, 그리고 적어도 하나의 특정 조건이 충족된 경우에만 실행되는 광대역 오디오 신호 생성 방법.
  16. 제15항에 있어서,
    매개변수, 특히, 주파수 및 진폭에 대한 공칭값이 고대역 및/또는 저대역 오디오 신호를 생성하는데 사용되고,
    이들 공칭값은 상기 이벤트 레이트에서 상기 적어도 하나의 광대역 매개변수에 기초하여 변형되는 광대역 오디오 신호 생성 방법.
  17. 제16항에 있어서,
    상기 오디오 신호 생성 수단은 매 전송 사이클마다 제한된 최대 증분으로 공칭값에 적합하게 되고,
    상기 최대 증분은 특히 음성 생성의 시간 가변성에 기초하는 광대역 오디오 신호 생성 방법.
  18. 제16항 또는 제17항에 있어서,
    적어도 하나의 특정 조건이 충족된 경우, 적어도 하나의 이벤트 신호가 생성되고,
    상기 적어도 하나의 광대역 매개변수는 상기 적어도 하나의 대역 제한 매개변수에 할당되어, 이벤트 신호가 생성되는 경우에만, 고대역 및/또는 저대역 오디오 신호를 생성하는데 필요한 매개변수에 대한 공칭값공칭값는 광대역 오디오 신호 생성 방법.
  19. 제15항 내지 제18항 중 어느 한 항에 있어서,
    상기 이벤트 레이트의 두 개의 연속 펄스에 대하여 상기 적어도 하나의 대역 제한 매개변수의 값 사이의 차이가 소정 한도를 초과하거나, 또는 소정 개수의 사이클 레이트가 초과되는 경우, 상기 적어도 하나의 매개변수 조건이 충족되는 광대역 오디오 신호 생성 방법.
  20. 제12항 내지 제19항 중 어느 한 항에 있어서,
    상기 획득된 적어도 하나의 대역 제한 매개변수 및/또는 적어도 하나의 대역 제한 매개변수 중 하나 이상의 결합 및/또는 적어도 하나의 광대역 매개변수 및/또는 상기 적어도 하나의 광대역 매개변수 중 하나 이상의 결합에 대한 신뢰성 코드 번호를 계산하는 단계를 더 포함하되,
    상기 신뢰성 코드 번호는 상기 오디오 신호 생성 수단을 제어하는데 사용되는 광대역 오디오 신호 생성 방법.
  21. 제12항 내지 제20항 중 어느 한 항에 있어서,
    상기 고대역 및/또는 저대역 오디오 신호는 사인 생성기 또는 사인 생성기와 잡음 생성기에 의해 상기 사이클 레이트에서 생성되는 광대역 오디오 신호 생성 방법.
  22. 제12항 내지 21항 중 어느 한 항에 따른 방법의 단계를 수행하는 컴퓨터 실행가능 명령을 갖는 하나 이상의 컴퓨터 판독가능 매체를 포함하는 컴퓨터 프로그램 제품.
KR1020050085829A 2004-09-17 2005-09-14 대역 제한 오디오 신호의 대역폭 확장 KR101207670B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04022198A EP1638083B1 (en) 2004-09-17 2004-09-17 Bandwidth extension of bandlimited audio signals
EP04022198.8 2004-09-17

Publications (2)

Publication Number Publication Date
KR20060051298A true KR20060051298A (ko) 2006-05-19
KR101207670B1 KR101207670B1 (ko) 2012-12-03

Family

ID=34926584

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050085829A KR101207670B1 (ko) 2004-09-17 2005-09-14 대역 제한 오디오 신호의 대역폭 확장

Country Status (8)

Country Link
US (1) US7630881B2 (ko)
EP (1) EP1638083B1 (ko)
JP (1) JP4764118B2 (ko)
KR (1) KR101207670B1 (ko)
CN (1) CN1750124B (ko)
AT (1) ATE429698T1 (ko)
CA (1) CA2518332A1 (ko)
DE (1) DE602004020765D1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
WO2015133795A1 (ko) * 2014-03-03 2015-09-11 삼성전자 주식회사 대역폭 확장을 위한 고주파 복호화 방법 및 장치
CN106463143A (zh) * 2014-03-03 2017-02-22 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
US11688406B2 (en) 2014-03-24 2023-06-27 Samsung Electronics Co., Ltd. High-band encoding method and device, and high-band decoding method and device

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP1686564B1 (en) * 2005-01-31 2009-04-15 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited acoustic signals
WO2006114368A1 (de) * 2005-04-28 2006-11-02 Siemens Aktiengesellschaft Verfahren und vorrichtung zur geräuschunterdrückung
US20070109977A1 (en) * 2005-11-14 2007-05-17 Udar Mittal Method and apparatus for improving listener differentiation of talkers during a conference call
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
EP1814107B1 (en) * 2006-01-31 2011-10-12 Nuance Communications, Inc. Method for extending the spectral bandwidth of a speech signal and system thereof
CN101064634B (zh) * 2006-04-30 2011-08-10 华为技术有限公司 频段重配置系统和方法
EP1892703B1 (en) * 2006-08-22 2009-10-21 Harman Becker Automotive Systems GmbH Method and system for providing an acoustic signal with extended bandwidth
EP1947644B1 (en) * 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
CN101227537B (zh) * 2007-01-19 2010-12-01 中兴通讯股份有限公司 一种宽带声学回声消除方法
US7599475B2 (en) * 2007-03-12 2009-10-06 Nice Systems, Ltd. Method and apparatus for generic analytics
EP1970900A1 (en) * 2007-03-14 2008-09-17 Harman Becker Automotive Systems GmbH Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal
RU2441286C2 (ru) * 2007-06-22 2012-01-27 Войсэйдж Корпорейшн Способ и устройство для обнаружения звуковой активности и классификации звуковых сигналов
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
EP2207166B1 (en) * 2007-11-02 2013-06-19 Huawei Technologies Co., Ltd. An audio decoding method and device
EP2218068A4 (en) * 2007-11-21 2010-11-24 Lg Electronics Inc METHOD AND APPARATUS FOR SIGNAL PROCESSING
MY155538A (en) * 2008-07-11 2015-10-30 Fraunhofer Ges Forschung An apparatus and a method for generating bandwidth extension output data
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
EP2360687A4 (en) * 2008-12-19 2012-07-11 Fujitsu Ltd VOICE BAND EXTENSION DEVICE AND VOICE BAND EXTENSION METHOD
DK2211339T3 (en) 2009-01-23 2017-08-28 Oticon As listening System
JP4945586B2 (ja) 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP5126145B2 (ja) * 2009-03-30 2013-01-23 沖電気工業株式会社 帯域拡張装置、方法及びプログラム、並びに、電話端末
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
RU2568278C2 (ru) * 2009-11-19 2015-11-20 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы пропускания звукового сигнала нижней полосы
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
US9031268B2 (en) * 2011-05-09 2015-05-12 Dts, Inc. Room characterization and correction for multi-channel audio
CN103093757B (zh) * 2012-01-17 2014-10-29 大连理工大学 一种窄带码流转换为宽带码流的转换方法
CN102543089B (zh) * 2012-01-17 2013-04-17 大连理工大学 一种窄带码流转换为宽带码流的转换装置
JP5338962B2 (ja) * 2012-10-23 2013-11-13 沖電気工業株式会社 帯域拡張装置、方法及びプログラム、並びに、電話端末
US9258428B2 (en) 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
RU2662921C2 (ru) * 2013-06-10 2018-07-31 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для кодирования, обработки и декодирования огибающей аудиосигнала путем моделирования представления совокупной суммы с использованием квантования и кодирования распределения
US9293143B2 (en) * 2013-12-11 2016-03-22 Qualcomm Incorporated Bandwidth extension mode selection
CN105513590A (zh) * 2015-11-23 2016-04-20 百度在线网络技术(北京)有限公司 语音识别的方法和装置
CN107705801B (zh) * 2016-08-05 2020-10-02 中国科学院自动化研究所 语音带宽扩展模型的训练方法及语音带宽扩展方法
US11507807B2 (en) * 2016-09-27 2022-11-22 Panasonic Intellectual Property Management Co., Ltd. Audio signal processing device, audio signal processing method, and control program
TWI752166B (zh) * 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3382704A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
US10510358B1 (en) * 2017-09-29 2019-12-17 Amazon Technologies, Inc. Resolution enhancement of speech signals for speech synthesis
EP3585076B1 (en) * 2018-06-18 2023-12-27 FalCom A/S Communication device with spatial source separation, communication system, and related method
GB2593117A (en) * 2018-07-24 2021-09-22 Nokia Technologies Oy Apparatus, methods and computer programs for controlling band limited audio objects
GB2596169B (en) * 2020-02-11 2022-04-27 Tymphany Acoustic Tech Ltd A method and an audio processing unit for detecting a tone
CN112652324A (zh) * 2020-12-28 2021-04-13 深圳万兴软件有限公司 语音增强优化方法及语音增强优化系统、可读存储介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3308668B2 (ja) * 1993-07-23 2002-07-29 クラリオン株式会社 高調波付加回路
JP3483958B2 (ja) * 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JPH08278800A (ja) * 1995-04-05 1996-10-22 Fujitsu Ltd 音声通信システム
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US7623496B2 (en) * 2001-04-24 2009-11-24 Intel Corporation Managing bandwidth in network supporting variable bit rate
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
JP3879922B2 (ja) * 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
FI116498B (fi) * 2002-09-23 2005-11-30 Nokia Corp Kaistanleveyden mukauttaminen
JP4041385B2 (ja) * 2002-11-29 2008-01-30 株式会社ケンウッド 信号補間装置、信号補間方法及びプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US8296157B2 (en) 2007-11-21 2012-10-23 Electronics And Telecommunications Research Institute Apparatus and method for deciding adaptive noise level for bandwidth extension
WO2015133795A1 (ko) * 2014-03-03 2015-09-11 삼성전자 주식회사 대역폭 확장을 위한 고주파 복호화 방법 및 장치
CN106463143A (zh) * 2014-03-03 2017-02-22 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
US10410645B2 (en) 2014-03-03 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
CN106463143B (zh) * 2014-03-03 2020-03-13 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
US10803878B2 (en) 2014-03-03 2020-10-13 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
US11676614B2 (en) 2014-03-03 2023-06-13 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
US11688406B2 (en) 2014-03-24 2023-06-27 Samsung Electronics Co., Ltd. High-band encoding method and device, and high-band decoding method and device

Also Published As

Publication number Publication date
US20060106619A1 (en) 2006-05-18
CA2518332A1 (en) 2006-03-17
US7630881B2 (en) 2009-12-08
KR101207670B1 (ko) 2012-12-03
JP2006085176A (ja) 2006-03-30
EP1638083A1 (en) 2006-03-22
CN1750124A (zh) 2006-03-22
DE602004020765D1 (de) 2009-06-04
ATE429698T1 (de) 2009-05-15
EP1638083B1 (en) 2009-04-22
JP4764118B2 (ja) 2011-08-31
CN1750124B (zh) 2010-06-16

Similar Documents

Publication Publication Date Title
KR101207670B1 (ko) 대역 제한 오디오 신호의 대역폭 확장
EP1157374B1 (en) Enhancing perceptual performance of sbr and related hfr coding methods by adaptive noise-floor addition and noise substitution limiting
EP1995723B1 (en) Neuroevolution training system
EP1489599B1 (en) Coding device and decoding device
RU2389085C2 (ru) Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx
KR101213840B1 (ko) 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
EP1300833B1 (en) A method of bandwidth extension for narrow-band speech
KR101461774B1 (ko) 대역폭 확장기
US7613604B1 (en) System for bandwidth extension of narrow-band speech
EP1252621B1 (en) System and method for modifying speech signals
KR100388387B1 (ko) 여기파라미터의결정을위한디지탈화된음성신호의분석방법및시스템
US6691085B1 (en) Method and system for estimating artificial high band signal in speech codec using voice activity information
KR20100105733A (ko) 코딩 및 디코딩 방법 및 장치
JP2003514267A (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
US8909539B2 (en) Method and device for extending bandwidth of speech signal
Kornagel Techniques for artificial bandwidth extension of telephone speech
EP3079151A1 (en) Audio encoder and method for encoding an audio signal
JP4287840B2 (ja) 符号化装置
KR0156983B1 (ko) 음성 부호기

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20151030

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20161115

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20171110

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20181128

Year of fee payment: 7