KR100754033B1 - 스펙트럼 향상을 구현하기 위한 방법 및 장치 - Google Patents

스펙트럼 향상을 구현하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR100754033B1
KR100754033B1 KR1020027013952A KR20027013952A KR100754033B1 KR 100754033 B1 KR100754033 B1 KR 100754033B1 KR 1020027013952 A KR1020027013952 A KR 1020027013952A KR 20027013952 A KR20027013952 A KR 20027013952A KR 100754033 B1 KR100754033 B1 KR 100754033B1
Authority
KR
South Korea
Prior art keywords
spectral
signal
incomplete
spectrum
frequency band
Prior art date
Application number
KR1020027013952A
Other languages
English (en)
Other versions
KR20030007528A (ko
Inventor
삐에릭 필립
빠트리스 꼴랑
Original Assignee
프랑스 뗄레꽁(소시에떼 아노님)
티디에프
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=8849404&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100754033(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 프랑스 뗄레꽁(소시에떼 아노님), 티디에프 filed Critical 프랑스 뗄레꽁(소시에떼 아노님)
Publication of KR20030007528A publication Critical patent/KR20030007528A/ko
Application granted granted Critical
Publication of KR100754033B1 publication Critical patent/KR100754033B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

본 발명은 스펙트럼 향상을 위한 방법 및 그 장치에 관한 것이다. 본 발명에 따른 방법은, 제 1 스펙트럼 주파수 대역을 포함하는 불완전한 스펙트럼을 포함하고 있는 신호의 스펙트럼 컨텐츠를 향상시키기 위한 방법에 있어서, 스펙트럼이 제 2 스펙트럼 주파수 대역으로 제한된 전치된 스펙트럼 신호를 생성하기 위하여, 상기 제 1 주파수 대역의 스펙트럼 컨텐츠를 상기 스펙트럼으로부터 제외된 상기 제 2 주파수 대역으로 적어도 한 번 전치(transposition)하는 단계; 향상된 스펙트럼 신호를 생성하기 위하여 상기 전치된 스펙트럼 신호의 스펙트럼을 성형(shaping)하는 단계; 및 향상된 스펙트럼 신호를 생성하기 위하여, 상기 불완전한 스펙트럼 신호를 전치되고 성형되어 향상된 상기 스펙트럼 신호와 결합시키는 단계를 포함하여 이루어지며, 상기 스펙트럼 컨텐츠가 화이트닝 단계를 거치는 것을 특징으로 한다.
스펙트럼 포락선 추정 모듈, 화이트닝 필터, 스펙트럼 변환 모듈, 성형 필터

Description

스펙트럼 향상을 구현하기 위한 방법 및 장치{SPECTRAL ENHANCING METHOD AND DEVICE}
본 발명은 불완전한 스펙트럼을 가지고 있는 신호의 스펙트럼을 향상시킬 수 있는 방법 및 그 장치에 관한 것으로써, 보다 상세하게는, 본 발명은 제한 스펙트럼 주파수 대역 부호기에 의해 부호화된 음성 신호에 대한 향상된 복호화에 적용할 수 있다.
레이트-리덕션(rate-reduction) 음성 부호화에 있어서, 비트 속도가 낮아질 때 음성 신호는 종종 대역 통과 제한을 받아야만 한다. 이러한 대역 통과 제한은 가청 양자화 잡음이 부호화된 신호로 전달되는 것을 막기 위하여 필요하다. 이와 같은 경우에 있어서, 원신호의 고주파 컨텐츠는 가능한 범위까지 재생성되어야 한다.
그것은 종래 기술로써 잘 알려져 있으며, 특히, 특허 WO 9,857,436A호는 복호화된 신호의 저주파 스펙트럼을 고주파 쪽으로 고조파적 전치(harmonical transposition)를 수행하여 원신호의 고주파 특수 컨텐츠를 재생성하는 것에 관해 기술하고 있다. 이 전치는 고조파 열(n*fk)의 모든 주파수에서 기본 주파수(fk)의 스펙트럼 값을 재복사함으로써 수행된다. 그렇게 전개된 고주파 스펙트럼의 형상(shape)은 스펙트럼 가중치 인자를 인가함으로써 조절된다.
도 1은 종래의 스펙트럼 복원 장치를 보여주는 개략도이다. 부호화된 음성 신호는 저주파수 스펙트럼 신호(SB)를 분석 필터 뱅크(102)로 인가하는 복호기(101)에 의해 복호화되며, 이 필터들의 출력(k)은 스펙트럼 가중치 인자에 의해 가중된 후 합성 필터 세트(104)의 고조파 차수(n*k (n=1...N))의 입력에 연결되어 있다. 간단하게도, 분석 필터 뱅크의 출력(각각 합성 필터 벤치의 보간)에 데시메이터(decimator)가 생략되어 있다.
합성된 신호(SH)는 고주파 스펙트럼을 나타낸다. 그것은 가산기(105)에 의해 신호(SB)와 더해져서 복원된 광대역 신호(SR)를 생성한다.
전술한 복원 기술은 부대역 분석(sub-band analysis) 및 복소 고조파 복사(complex harmonic duplication)에 근거하고 있다. 그것은 위상 및 진폭을 조절하기 위한 고가의 방법들을 수반한다. 또한, 스펙트럼 가중치 인자들은 스펙트럼 포락선을 개략적으로 모델링한다.
일반적으로, 모든 복호화 배경 이외에, 불완전한 스펙트럼을 나타내는 물리적 신호의 스펙트럼 컨텐츠를 향상하는 것이 실현가능하여햐 한다는 것이 중요하다. "불완전한 스펙트럼"이란 용어는 제한된 지원(limited support)을 지닌 스펙트럼 또는 "홀(hole)"을 나타내는 스펙트럼을 가르킨다. 특히, 음성 신호 또는 제한된 대역 통과를 지닌 음성 신호의 경우에 그러하며, 스펙트럼 컨텐츠의 향상은 복호화 시 음질 및 신호의 명확성을 향상시키는 것이다.
본 발명이 이루고자 하는 기술적 과제는, 고도의 성능을 지니며 실질적으로 간단한 스펙트럼 복원 장치 및 더 일반적으로 스펙트럼 향상 장치를 제공하는 데 있다.
또 다른 기술적 과제는, 종래에 비하여 신호의 더 정확하고 더 단순한 복원된 특별한 형상을 획득하는 데 있다.
또한, 본 발명은 청구항 제1항에서 청구된 방법 및 청구항 제20항에서 청구된 장치에 의해 상술한 문제점을 해결하는 데 그 목적이 있다.
본 발명의 이하 설명될 특징 및 다른 특징들은 본 발명의 바람직한 실시예에 관한 설명 및 첨부한 도면을 참조하여 설명될 것이다.
도 1은 종래 기술에 따른 음성 신호의 스펙트럼 복원 장치를 보여주는 개략도이다.
도 2는 본 발명의 일 실시예에 따른 스펙트럼 향상을 위한 장치를 보여주는 개략도이다.
도 3a 및 도 3b는 본 발명에 따른 구현 모드에서 사용되는 스펙트럼 전치 모듈을 보여주는 도면이다.
도 4는 본 발명에 따른 구현 모드에서 스펙트럼 향상을 위한 방법을 보여주는 개략도이다.
도 5는 본 발명에 따른 스펙트럼 향상을 위한 장치를 구비하고 있는 부호기 및 복호기를 포함하여 이루어진 시스템을 보여주는 개략도이다.
이하, 불완전한 스펙트럼을 지닌 신호(SB), 특히 제한된 주파수 대역의 신호의 스펙트럼을 향상시키는 것에 관하여 설명하기로 한다.
본 발명은, 어떤 정지 모드들(stationary modes)의 경우 신호가 스펙트럼 포락선 필터를 이용하여 여기 신호(excitation signal)를 필터링한 결과로써 모델링 된다는 사실을 이용한다. 신호(SB)의 스펙트럼 포락선에 대해 설명하면, 그 스펙트럼은 전달함수가 포락선 함수에 대략 반비례하는 화이트닝 필터(whitening filter)로 신호를 통과시킴으로써 화이트닝된다. 이러한 방식으로, 최초 여기 신호는 주파수 대역의 고려하에 스펙트럼 형상의 영향을 덜 받고 대략적으로 생성된다. 따라서, 음성 신호의 특별한 경우에 있어서, 여기 신호는 그것의 포르만트 구조(formantic structure)를 벗어나야 할 것이다. 본 발명은 화이트닝된 스펙트럼을 전치시킴으로써 신호(SB)의 스펙트럼을 향샹시키는 것에 대해 제안하고 있다. 그 결과신호는 형상을 갖추어야만하는 전치된 스펙트럼 신호(transposed-spectrum signal)이다. 이 스펙트럼 성형(shaping)은 전달함수가 신호(SB)의 스펙트럼 포락선 함수로부터 도시적으로 외삽(extrapolation)되는 성형 필터(shaping filter)에 의해 구현된다.
도 2는 본 발명에 따른 스펙트럼 향상을 위한 장치를 보여주는 도면이다. 통상적으로 제한된 주파수 대역 음성 신호(예를 들어 0-5 kHz의 대역)인 불완전한 스 펙트럼 신호는 전달 함수가 스펙트럼 포락선의 추정에 기반한 화이트닝 필터(201)에 의해 필터링된다. 스펙트럼 포락선 추정은 스펙트럼 향상을 위한 장치의 모듈(202)에 의해 수행된다. 본 발명의 제 1 실시예에서, 스펙트럼 포락선 추정은 불완전한 스펙트럼 신호의 분석에 기반하고 있다. 본 발명의 제 2 실시예에서, 포락선은 정보에 기반하여 추정되며 외부 소스 예를 들여 복호기로부터 이용가능하다. 상기 두 가지 경우에서, 화이트닝 필터의 전달함수는 스펙트럼 포락선 함수의 역수이다.
화이트닝된 스펙트럼 신호(SW)는 전치 모듈(transposing module)(203)에 의해 스펙트럼 전치를 거치게 된다. 그 다음, 그렇게 얻어진, 통상적으로 고주파수(예를 들어, 상기 음성 신호의 경우에 5-10 kHz) 쪽으로 변환(translation)된 스펙트럼을 지닌 신호인 천이된 스펙트럼 신호는 성형 필터(204)에 의해 필터링된다. 제 1 실시예에 있어서, 그 전달 함수는 신호(SB)의 스펙트럼 포락선 함수로부터 외삽된다. 제 2 실시예에 따르면, 그 전달 함수 추론은 전 주파수 대역(full frequency band)(SB)의 스펙트럼 포락선을 나타내는 외부 정보에 기반한다. 가산기(205)는 특별한 향상 신호로 불리우는 필터 신호(SE)와 제한된 스펙트럼 신호(SB)를 가산하여 스펙트럼 향상된(또는 복원된) 신호(SR)를 생성한다.
예를 들어, 스펙트럼 포락선 추정 모듈(202)은 J. Makhoul이 ("Linear Prediction: A Tutorial Review" Proceedings of the IEEE, vol. 63, #4, 561-580 페이지)에서 설명한 것 같이 LPC 분석에 의해 포락선을 모델링한다. 신호(S)는 아래 수식과 같이 차수(P)의 자동회귀적 모델링(autoregressive modeling)에 따라 모델링된다.
Figure 112002034162530-pct00001
여기서, Sn은 모델링될 신호이며,
ak는 예측 계수들(또는 LPC 계수들)이며,
un은 예측 나머지(prediction residue)이며,
P는 사용된 필터의 차수, 즉 사용된 LPC 필터의 계수들의 수이며,
G는 정규화 이득을 나타낸다.
이 LPC 필터는 아래의 수식과 같은 형식으로 신호(S)를 모델링한다.
Figure 112002034162530-pct00002
여기서,
Figure 112002034162530-pct00003

필터의 차수(P)(P는 충분히 크다) 및 LPC 계수들의 값을 적절하게 선택함으로써, 예측 나머지(un)는 스펙트럼적으로 백색 또는 실질적으로 백색으로 가정될 수 있다. 필터(A(z))에 의한 S(z)의 필터링 결과가 U(z)가 되므로, 필터(A(z)) 또한 화이트닝 필터라고 부른다. 이러한 필터 계수들은 종래 기술(예를 들어, 네빈손-더빈(Levinson-Durbin) 알고리즘)이다.
그러므로, 스펙트럼 형상은 아래 수식에 의해 모델링된다.
Figure 112002034162530-pct00004
Figure 112002034162530-pct00005
계수들(ak)은 신호(SB)의 제한된 스펙트럼을 LPC 분석함으로써 또는 외부 정보에 기반하여 (도시적으로, 아래에서 설명하게 될 방식에서의 복호기에 의해) 직접적으로 값을 구할 수 있다. 이러한 구현 모드는 점선(230)으로 표시되어 있다.
즉, 계수들(ak)은 원 전신호 주파수 대역(original full signal frequency band)를 LPC 분석함으로써 값을 구할 수 있다. 이것은 예를 들어 신호(SB)가 주파수 대역 제한 부호화에 의해 생성될 경우일 것이다. 이 부호기는 LPC 계수들을 -직접적으로 또는 그것들의 감소되고 정량화된 형태로- 스펙트럼 향상을 위한 장치로 제공하며, 계수들의 값들은 전 주파수 대역 스펙트럼의 스펙트럼 형상을 복원하도록 한다. 이 구현 모드는 점선(220)으로 나타내었다.
계수들은 국부 신호 정지 상태(local signal stationary state)를 더 잘 정합시키기 위해 선택되어진 타임 케리어(time carrier)에 입각하여 결정된다. 따라 서, 비정지 신호(non-stationary signal)의 경우, 분석해야할 신호의 부분이 스펙트럼 컨텐츠에 대하여 동질 프레임(homogeneous)로 분할된다. 이 동질성은 서브 프레임의 각각에서 추정된 스펙트럼 간의 거리를 측정한 다음 유사 구역의 필터들을 재편성함으로써 스펙트럼 분석을 이용하여 직접적으로 측정된다.
또한, 스펙트럼 포락선을 나타내는 정보가 필터의 형태로 스펙트럼 포락선을 모델링하도록 허용한다고 가정하면, 상기 정보는 LPC 계수들과는 다른 형태라는 것은 명백하다. 아마도, 이 정보는 스펙트럼 형상 사전(spectral shapes dictionary)의 벡터들의 형태로 이용가능할 수 있다. 그것은 모델링 필터의 계수들이 충분히 추론될 것이다. 화이트닝 필터의 전달 함수는 포락선 모델링 필터의 전달 함수의 역수로써 선택된다.
필터(201)에 의한 화이트닝은 주파수 영역 뿐만 아니라 시간 영역에서도 수행될 수 있다.
스펙트럼 전치 모듈(203)은 주파수 영역 또는 시간 영역 중 하나에서 동작될 수 있다. 전치는 단순한 변환 또는 더 복잡한 동작일 수 있다. 만일 대상 주파수 대역(즉, 신호(SH)의 주파수 대역)이 (신호(SB)의) 최초 주파수 대역에 인접하면, 변환에 의해 이어지는 스펙트럼 반전이 두 개의 주파수 대역이 결합하는 스펙트럼 불연속을 피하는 데 이용된다는 유리한 점이 있다.
전치는 주파수 영역에서 일반적인 동작이기 때문에 이하에서 설명을 생략하기로 한다.
전치는 또한 시간 영역에서도 수행될 수 있다. 만일 그것이 단순한 변환과 관련된다면, 그것은 예를 들어 더 낮은 측파대(sideband)를 제거하면서 변환 주파수에서 단측파대를 단순히 변조함으로써 수행될 수 있다. 만일, 인접한 주파수 대역에서 변환으로써 스펙트럼 반전이 관련되면, 상측파대를 제거하면서 단측파대를 접합 주파수(junction frequency)로 두 번 변조함으로써 구현될 수 있다.
또한, 도 3a 및 도 3b에 도시한 바와 같이, 전치는 분석 필터 뱅크 및 합성 필터 뱅크(예를 들어, 다상 필터들(polyphased filter) 뱅크)를 이용하여 수행된다. 도 3a와 같이, 전치는 분석 필터 출력을 합성 필터들의 입력의 변환된 랭크의 입력과 연결을 함으로써 수행되며, 도 3b와 같이, 스펙트럼 반전은 분석 필터들의 출력을 합성 필터의 입력의 변환된 반전 차수들의 입력과 연결함으로써 수행된다.
전치는 최초 주파수 대역의 전부 또는 일부분에 적용될 수 있다. 대상 주파수 대역 내에서 다른 주파수들로의 몇몃 전치는 스펙트럼 성형 단계 이전에 고려될 수 있다. 또한, 전치는 스펙트럼 화이트닝이 이후에 연결된 후 또는 연결되기 전에 일어난다.
대상 주파수 대역에서의 전치에 뒤이어, 신호는 성형 필터(204)에 의해 형상을 갖추게 된다. 몇가지 구현 모드가 가능하다.
우선, 스펙트럼 향상을 위한 장치가 전 주파수 대역 스펙트럼 포락선(예를 들어, 전술한 제한된 주파수 대역 부호화에 의해 생성된 신호의 경우)에 관한 정보를 수신하면, 이 정보는 성형 필터의 전달 함수를 추정하는 데 이용될 수 있다. 이것은 예를 들어 전 주파수 대역 신호의 LPC 계수들이 이용가능한 경우일 것이다. 이 경우에, 대상 주파수 대역의 스펙트럼은 주파수 대역의 고려하에 포락선의 형상을 가정한다. 이 구현 모드는 점선(220)으로 나타내었다.
그 다음, 전달 함수가 최초 주파수 대역의 스펙트럼 포락선을 외삽함으로써 생성될 수 있다. 다양한 외삽 방법(extrapolating method)들이 고려될 수 있으며, 특히 스펙트럼 포락선을 모델링하는 절차를 고려할 수 있다. 최초 주파수 대역의 스펙트럼 포락선에 기반하여 모듈(202)에 의해 추정된 LPC 계수들의 특별한 경우에, 계수들이 LPC 계수들인 성형 필터가 사용된다는 유리한 점이 있다.
만일 전치가 화이트닝과 연결되면, 화이트닝 필터 및 후속 성형은 화이트닝 필터의 각 전달 함수와 성형 필터의 전달 함수와의 곱(product)에 해당하는 전달 함수를 이용하여 하나의 동작으로 수행될 수 있다.
도 4는 본 발명의 일 실시예에 따른 스펙트럼 향상을 위한 방법을 보여주는 도면이다. 특히, 도 4는 (음성 응용의 일반적인 경우인) 불완전한 스펙트럼이 저주파수 대역에 제한되어 있고 대상 주파수 대역이 인접 고주파수 대역인 특별한 경우를 위해 다양한 신호들(SB, SW, SH, SE, SR)를 보여주고 있다. 전치는 화이트닝에 후속되는 것으로 가정한다.
도 4a는 전 주파수 대역의 스펙트럼 포락선 뿐만 아니라 저주파수 신호(SB)의 스펙트럼을 보여주고 있다. 그것은 저주파수 신호의 포락선(점선 곡선)을 외삽함으로써 결정되며, 또는 정보의 외부 소스가 전 주파수 대역 포락선의 기술을 제공한다.
도 4b는 스펙트럼 화이트닝 후 신호(SW)의 스펙트럼을 보여주는 도면이다.
도 4c는 스펙트럼 화이트닝 후 신호(SH)의 스펙트럼을 보여주는 도면이며, 선택된 전치는 단순한 변환이다.
도 4d는 스펙트럼 성형 후 신호(SE)의 스펙트럼을 보여주는 도면이다.
도 4e는 스펙트럼 향상된 또는 복원된 신호(SR)의 스펙트럼을 보여주는 도면이다.
도 5는 전술한 스펙트럼 향상을 위한 장치와 관련된 복호기(500) 및 주파수 대역 제한 부호기(510)를 포함하여 이루어진 본 발명에 따른 시스템을 보여주는 도면이다.
스펙트럼 추정 모듈(511)로 인하여, 부호기는 전 주파수 대역 신호의 스펙트럼 포락선을 나타내는 정보를 제공할 수 있으며, 또한, 성형될 하나 또는 몇 개 주파수 대역에서 신호의 스펙트럼 포락선을 나타내는 정보를 제공할 수도 있다. 그러므로, 이 정보는 전술한 스펙트럼 성형 필터에 의해 직접적으로 사용될 수 있다. 만일 필요할 경우, 부호기로 부터 전송된 정보는, 화이트닝-전치-성형 동작의 결과가 부호화 전에 스펙트럼 신호 포락선을 최적으로 복원하는 방식으로 화이트닝 필터의 전달 함수를 보정하는 데 사용된다. 이 실시예는 점선(520)으로 나타내었다.
복호기는 전술한 방법에 의해 스펙트럼 향상을 채택하는 불완전한 또는 제한된 스펙트럼 신호를 제공한다. 이 예에서, 엄밀히 말하면, 스펙트럼 복원과 관련되며, 원신호 소스(S)의 스펙트럼의 일 부분이 부호화에 의해 잘려진다. 불완전한 스 펙트럼 복호화된 신호와 더불어, 복호기는 또는 자체적으로 포락선 추정 모듈(502)에 의해 이용되는 이 신호의 스펙트럼 포락선과 관련된 정보를 제공한다. 이 실시예는 점선(530)으로 나타내었다. 복호기 만이 불완전한 스펙트럼 복호화된 신호를 제공하면, 스펙트럼 포락선은 이후 신호에 기반하여 추정된다.
본 발명에 따른 시스템의 대표적인 응용은 퍼셉티브 부호기(perceptive encoder)에 의해 부호화된 음성 신호를 스펙트럼 복원하는 것이다. 음성 부호기는 속도 감소 변환 방식(예를 들어, MPEG1, MPEG2 또는 MPEG4-GA) 또는 CELP 타입(ITU G72X) 또는 심지어 파라메트릭 타입(파라메트릭 MPEG4 타입)일 수 있다.
본 발명에 따르면, 주어진 전송 속도에서 인지되는 음질은 향상될 것이며, 음성은 "더 명확하게" 될 것이다. 대안적으로, 속도는 같은 품질에서 더 낮아질 수 있다. 도시적인 구성으로서, 고주파수 스펙트럼 정보의 2 kbit/s에 더하여 24 kbit/s로 부호화된 신호를 전송함으로써 생성된 26 kbit/s의 품질은 본 발명의 장치가 없을 경우 대략 64 kbit/s의 품질과 대등하게 된다.
본 발명의 응용은 다양하며 음성 신호의 스펙트럼 복원에 제한되지 않는다. 본 발명은 임의의 물리적 신호 특히 음성 신호를 복원할 수 있다.
이후 및 전술한 바와 같이, 본 발명은 원신호 즉 이전 신호의 스펙트럼 복원에 한정되지 않으며 일반적으로 스펙트럼 신호 향상에 적용될 수 있다.

Claims (23)

  1. 제 1 스펙트럼 주파수 대역을 포함하는 불완전한 스펙트럼을 포함하고 있는 신호의 스펙트럼 컨텐츠를 향상시키기 위한 방법에 있어서,
    스펙트럼이 제 2 스펙트럼 주파수 대역으로 제한되는 전치된 스펙트럼 신호를 생성하기 위하여, 상기 제 1 주파수 대역의 스펙트럼 컨텐츠를 상기 스펙트럼으로부터 제외된 상기 제 2 주파수 대역으로 적어도 한 번 전치(transposition)하는 단계;
    향상된 스펙트럼 신호를 생성하기 위하여 상기 전치된 스펙트럼 신호의 스펙트럼을 성형(shaping)하는 단계; 및
    향상된 스펙트럼 신호를 생성하기 위하여, 상기 불완전한 스펙트럼 신호를 전치되고 성형되어 향상된 상기 스펙트럼 신호와 결합시키는 단계를 포함하여 이루어지며,
    상기 전치된 스펙트럼 신호의 발생은, 상기 전치된 스펙트럼 신호의 스펙트럼이 상기 스펙트럼 컨텐츠의 화이트닝된 버전이 되는 방식으로 상기 스펙트럼 컨텐츠를 화이트닝하는 단계를 포함하는 것을 특징으로 하는 스펙트럼 컨텐츠를 향상하기 위한 방법.
  2. 제1항에 있어서,
    상기 제 2 스펙트럼 대역은 상기 제 1 스펙트럼 대역과 인접한 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 스펙트럼 컨텐츠의 전치는 스펙트럼 변환(spectrum translation)을 포함하는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  4. 제3항에 있어서,
    상기 스펙트럼 컨텐츠의 전치는 스펙트럼 반전을 더 포함하는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  5. 제3항 또는 제4항 중 어느 하나의 항에 있어서,
    상기 스펙트럼 변환은 변조에 의해 구현되는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  6. 제5항에 있어서,
    상기 변조는 단측파대 변조인 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  7. 제3항에 있어서,
    상기 스펙트럼 변환은 분석 필터 뱅크를 통해 상기 불완전한 스펙트럼 신호를 필터링하고, 그 출력을 합성 필터 뱅크의 입력의 변환된 차수들에 인가함으로써 수행되는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  8. 제4항에 있어서,
    상기 스펙트럼 반전 및 상기 스펙트럼 변환은 분석 필터 뱅크를 통해 상기 불완전한 스펙트럼 신호를 필터링하고, 그 출력을 합성 필터들의 뱅크의 반전되고 변환된 차수의 입력에 인가함으로써 수행되는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  9. 제1항 내지 제8항 중 어느 하나의 항에 있어서,
    상기 스펙트럼 컨텐츠 화이트닝은 화이트닝 필터를 통해 상기 불완전한 스펙트럼을 필터링함으로써 구현되는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  10. 제9항에 있어서,
    상기 화이트닝 필터의 전달 함수는 상기 불완전한 스펙트럼 신호의 스펙트럼 포락선을 제공하는 정보에 기반하여 생성되는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  11. 제10항에 있어서,
    상기 스펙트럼 포락선을 제공하는 상기 정보는 스펙트럼 포락선 추정 모듈에 의해 제공되는 불완전한 스펙트럼 신호의 LPC 계수들을 포함하는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  12. 제1항 내지 제11항 중 어느 하나의 항에 있어서,
    상기 스펙트럼 성형은 성형 필터를 통하여 상기 전치된 스펙트럼 신호를 필터링함으로써 구현되는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  13. 제12항에 있어서,
    상기 성형 필터의 전달 함수는 상기 불완전한 스펙트럼 신호의 스펙트럼 포락선을 외삽(extrapolating)함으로써 생성되는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  14. 제12항에 있어서,
    상기 성형 필터의 전달 함수는 불완전한 스펙트럼 신호의 완전한 스펙트럼 버전의 스펙트럼 포락선을 제공하는 정보에 기반하여 생성되는 것을 특징으로 하는 스펙트럼 컨텐츠 향상을 위한 방법.
  15. 제9항 내지 제11항 및 제14항 중 어느 하나의 항에 있어서,
    상기 화이트닝 필터의 전달 함수는 상기 완전한 스펙트럼 버전의 상기 스펙트럼 포락선을 제공하는 상기 정보의 함수로써 조절되는 것을 특징으로 하는 스펙트럼 향상을 위한 방법.
  16. 삭제
  17. 퍼셉티브 부호화(perceptive encoding)와 같이, 광 주파수 대역 소스 신호를 스펙트럼 제한 방식으로 부호화를 수행하여 생성되는 불완전한 스펙트럼 신호 특히 제한된 주파수 대역 음성 신호의 복호화를 향상시키기 위한 방법에 있어서,
    제1항 내지 제15항 중 어느 하나의 항의 스펙트럼 향상을 위한 방법에 의하여 상기 복호화된 신호를 향상시키는 것을 특징으로 하는 불완전한 스펙트럼 신호의 복호화를 향상시키기 위한 방법.
  18. 불완전한 스펙트럼 신호 특히 제한된 주파수 대역 음성 신호의 복호화를 향상시키기 위한 방법으로서, 상기 불완전한 스펙트럼 신호는 퍼셉티브 부호와 같이 광 주파수 대역 소스 신호를 스펙트럼 제한 방식으로 부호화하는 것과 불완전한 스펙트럼 신호를 제공하기 위한 부호화된 신호를 복호화하는 것에 의해 생성되는, 불완전한 스펙트럼 신호의 복호화를 향상시키는 방법에 있어서,
    상기 방법은 제13항의 스펙트럼 향상을 위한 방법에 의하여 불완전한 스펙트럼 신호를 향상시키는 것으로 구성되고, 상기 불완전한 스펙트럼 신호의 상기 스펙트럼 포락선에 관한 정보는 상기 부호화에 의해 생성되는 것을 특징으로 하는 불완전한 스펙트럼 신호의 복호화를 향상시키기 위한 방법.
  19. 광 주파수 대역 소스 신호를 스펙트럼 제한 방식으로 부호화를 수행하여 생성되는 불완전한 스펙트럼 신호 특히 제한된 주파수 대역 음성 신호의 복호화를 향상시키기 위한 방법에 있어서,
    상기 부호화가 상기 광 주파수 대역 소스 신호의 상기 스펙트럼 포락선과 관련한 정보를 제공하기 때문에, 상기 불완전한 스펙트럼 신호의 완전한 스펙트럼 버전이 상기 광 주파수 대역 소스 신호가 되며, 제14항 또는 제15항의 스펙트럼 향상을 위한 방법에 의해 상기 복호화된 신호를 향상하는 것을 특징으로 하는 불완전한 스펙트럼 신호의 복호화를 향상시키기 위한 방법.
  20. 제 1 스펙트럼 주파수 대역을 포함하는 불완전한 스펙트럼을 포함하고 있는 신호의 스펙트럼 컨텐츠 향상을 위한 장치에 있어서,
    제1항 내지 제15항 중 어느 하나의 항의 방법을 수행하도록 구현된 것을 특징으로 하는 불완전한 스펙트럼을 포함하고 있는 신호의 스펙트럼 컨텐츠 향상을 위한 장치.
  21. 신호 복호기에 추가되는 추가장치로서, 복호화될 신호가 퍼셉티브 음성 부호기와 같은 주파수 제한 부호기로부터 전달되고, 상기 추가장치는 제17항의 방법이 구현되도록 설계된, 신호 복호기에 추가되는 추가장치.
  22. 퍼셉티브 음성 부호기와 같은 주파수 대역 제한 부호기에 의해 부호화된 신호를 위한 복호기를 포함하고, 제17항 또는 제18항의 방법을 수행하도록 설계된 상기 복호기에 추가되는 추가장치를 더 포함하여 이루어진 수신 장치.
  23. 소스 신호를 수신하고 부호화된 신호를 생성하는, 퍼셉티브 부호기와 같은 스펙트럼 제한 부호기;
    상기 부호기로 하여금 전 주파수 대역 소스 신호의 스펙트럼 포락선에 관한 정보를 제공하게 하는 스펙트럼 추정 수단;
    불완전한 스펙트럼 신호를 제공하는 상기 부호기를 통해 부호화된 신호를 복호화하기 위한 복호기; 및
    스펙트럼 포락선 및 불완전한 스펙트럼 신호에 입각하여 향상된 신호를 제공하고, 상기 향상된 신호를 복호기를 통해 제공된 불완전한 스펙트럼에 결합하기 위하여, 제19항의 방법을 수행하도록 설계된 추가장치를 포함하여 이루어진 부호화/복호화 장치.
KR1020027013952A 2000-04-18 2001-04-12 스펙트럼 향상을 구현하기 위한 방법 및 장치 KR100754033B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0005023 2000-04-18
FR0005023A FR2807897B1 (fr) 2000-04-18 2000-04-18 Methode et dispositif d'enrichissement spectral
PCT/FR2001/001126 WO2001080223A1 (fr) 2000-04-18 2001-04-12 Methode et dispositif d'enrichissement spectral

Publications (2)

Publication Number Publication Date
KR20030007528A KR20030007528A (ko) 2003-01-23
KR100754033B1 true KR100754033B1 (ko) 2007-09-04

Family

ID=8849404

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027013952A KR100754033B1 (ko) 2000-04-18 2001-04-12 스펙트럼 향상을 구현하기 위한 방법 및 장치

Country Status (11)

Country Link
EP (1) EP1275109B2 (ko)
JP (1) JP4928703B2 (ko)
KR (1) KR100754033B1 (ko)
CN (1) CN1182514C (ko)
AT (1) ATE276570T1 (ko)
DE (1) DE60105576T3 (ko)
DK (1) DK1275109T4 (ko)
ES (1) ES2228847T5 (ko)
FR (1) FR2807897B1 (ko)
PT (1) PT1275109E (ko)
WO (1) WO2001080223A1 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
DE102004021403A1 (de) * 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
FR2875351A1 (fr) * 2004-09-16 2006-03-17 France Telecom Procede de traitement de donnees par passage entre domaines differents de sous-bandes
JP5034228B2 (ja) * 2005-11-30 2012-09-26 株式会社Jvcケンウッド 補間装置、音再生装置、補間方法および補間プログラム
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8935158B2 (en) 2006-12-13 2015-01-13 Samsung Electronics Co., Ltd. Apparatus and method for comparing frames using spectral information of audio signal
KR100860830B1 (ko) * 2006-12-13 2008-09-30 삼성전자주식회사 음성 신호의 스펙트럼 정보 추정 장치 및 방법
DE102007035171A1 (de) 2007-07-27 2009-02-05 Siemens Medical Instruments Pte. Ltd. Verfahren zum Anpassen eines Hörgeräts mit Hilfe eines perzeptiven Modells
JP7214726B2 (ja) * 2017-10-27 2023-01-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998057436A2 (en) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Source coding enhancement using spectral-band replication
US5915235A (en) 1995-04-28 1999-06-22 Dejaco; Andrew P. Adaptive equalizer preprocessor for mobile telephone speech coder to modify nonideal frequency response of acoustic transducer
WO2000045379A2 (en) * 1999-01-27 2000-08-03 Coding Technologies Sweden Ab Enhancing perceptual performance of sbr and related hfr coding methods by adaptive noise-floor addition and noise substitution limiting

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1220282A (en) 1985-04-03 1987-04-07 Northern Telecom Limited Transmission of wideband speech signals
EP0551705A3 (en) 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
EP0994464A1 (fr) * 1998-10-13 2000-04-19 Koninklijke Philips Electronics N.V. Procédé destiné à génére un signal large bande a partir d'un signal en bande étroite, appareil pour realiser un tel procédé et equipement téléphonique comportant un tel appareil

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5915235A (en) 1995-04-28 1999-06-22 Dejaco; Andrew P. Adaptive equalizer preprocessor for mobile telephone speech coder to modify nonideal frequency response of acoustic transducer
WO1998057436A2 (en) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Source coding enhancement using spectral-band replication
WO2000045379A2 (en) * 1999-01-27 2000-08-03 Coding Technologies Sweden Ab Enhancing perceptual performance of sbr and related hfr coding methods by adaptive noise-floor addition and noise substitution limiting

Also Published As

Publication number Publication date
DK1275109T4 (da) 2019-02-11
PT1275109E (pt) 2005-02-28
WO2001080223A1 (fr) 2001-10-25
FR2807897A1 (fr) 2001-10-19
DE60105576T2 (de) 2005-11-17
ES2228847T5 (es) 2019-06-14
CN1182514C (zh) 2004-12-29
CN1425177A (zh) 2003-06-18
ES2228847T3 (es) 2005-04-16
JP4928703B2 (ja) 2012-05-09
DK1275109T3 (da) 2004-12-20
DE60105576D1 (de) 2004-10-21
EP1275109B2 (fr) 2018-11-07
EP1275109B1 (fr) 2004-09-15
EP1275109A1 (fr) 2003-01-15
DE60105576T3 (de) 2019-02-21
ATE276570T1 (de) 2004-10-15
FR2807897B1 (fr) 2003-07-18
KR20030007528A (ko) 2003-01-23
JP2004501387A (ja) 2004-01-15

Similar Documents

Publication Publication Date Title
US8239208B2 (en) Spectral enhancing method and device
JP3483958B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
EP0878790A1 (en) Voice coding system and method
KR102322867B1 (ko) Mdct기반의 코더와 이종의 코더 간 변환에서의 인코딩 장치 및 디코딩 장치
KR100754033B1 (ko) 스펙트럼 향상을 구현하기 위한 방법 및 장치
JP4180677B2 (ja) 音声符号化並びに復号化方法及びその装置
JP4622164B2 (ja) 音響信号符号化方法及び装置
TW463143B (en) Low-bit rate speech encoding method
Bhatt et al. A novel approach for artificial bandwidth extension of speech signals by LPC technique over proposed GSM FR NB coder using high band feature extraction and various extension of excitation methods
JPH09127985A (ja) 信号符号化方法及び装置
JPH09127987A (ja) 信号符号化方法及び装置
JP3230791B2 (ja) 広帯域音声信号復元方法
JP3598111B2 (ja) 広帯域音声復元装置
JP3230790B2 (ja) 広帯域音声信号復元方法
JP2853170B2 (ja) 音声符号化復号化方式
JP3770901B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3560964B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP3598112B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
KR100221186B1 (ko) 음성 부호화 및 복호화 장치와 그 방법
JP3773509B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法
JP3770900B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3770899B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3748083B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JPH09127986A (ja) 符号化信号の多重化方法及び信号符号化装置
Abu-Shikhah et al. A hybrid LP-harmonics model for low bit-rate speech compression with natural quality

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120816

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130805

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160801

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170811

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180801

Year of fee payment: 12