KR100832144B1 - 지각적으로 개선된 음향신호의 엔코딩 - Google Patents

지각적으로 개선된 음향신호의 엔코딩 Download PDF

Info

Publication number
KR100832144B1
KR100832144B1 KR1020037005479A KR20037005479A KR100832144B1 KR 100832144 B1 KR100832144 B1 KR 100832144B1 KR 1020037005479 A KR1020037005479 A KR 1020037005479A KR 20037005479 A KR20037005479 A KR 20037005479A KR 100832144 B1 KR100832144 B1 KR 100832144B1
Authority
KR
South Korea
Prior art keywords
signal
coded signal
primary
frequency
coefficients
Prior art date
Application number
KR1020037005479A
Other languages
English (en)
Other versions
KR20030048061A (ko
Inventor
스테판 브룬
수산네 안데르쏜
Original Assignee
텔레폰악티에볼라겟엘엠에릭슨(펍)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텔레폰악티에볼라겟엘엠에릭슨(펍) filed Critical 텔레폰악티에볼라겟엘엠에릭슨(펍)
Publication of KR20030048061A publication Critical patent/KR20030048061A/ko
Application granted granted Critical
Publication of KR100832144B1 publication Critical patent/KR100832144B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

본 발명은, 엔코딩된 정보를 기반으로 재생된 대응신호(z)가 인지적으로 높은 품질을 가지도록 음향 소오스신호(x)를 엔코딩하는 것에 관한 것이다. 음향 소오스신호(x)는 송신기(300)의 코딩장치에 의해 적어도 하나의 기본 코드화 신호(P)로 엔코딩된다. 따라서, 적어도 하나의 기본 코드화 신호(P)는 음향신호(x) 중 인지적으로 중요한 특징들을 나타낸다. 송신기(300)의 코딩장치는 기본 코드화 신호(P)가 기초로 하는 신호성분들 중 적어도 하나를 수신하고 또한 이에 응해 평탄화된 신호성분을 발생하는 적어도 하나의 스펙트럼 평탄화 유닛(305a)를 포함한다. 그럼 다음, 적어도 하나의 강화된 코드화 신호(P(E))가 대응하는 평탄화 신호성분에서부터 생성된다.

Description

지각적으로 개선된 음향신호의 엔코딩{Perceptually Improved Encoding of Aucoustic Signals}
본 발명은, 엔코딩된 정보를 기반으로 재구성된 대응신호가 공지된 엔코딩 해결방법에 따른 것 보다 높은 감각 음질을 가지도록 음향 소오스신호의 엔코딩에 관한 것이다. 보다 특히, 본 발명은 청구항 제1항과 제31항의 전재부에 따라 전송매체를 통한 전송을 위한 엔코딩된 정보를 생성하기 위한 음향신호들의 엔코딩과, 청구항 제15항과 제37항의 전재부에 따라 전송매체를 통해 전송되는 엔코딩된 정보의 디코딩에 각각 관한 것이다. 본 발명은 또한 청구항 제44항에 따른 통신시스템과, 청구항 제13항과 제29항에 따른 컴퓨터 프로그램들과 그리고 청구항 제13항과 30항 따른 컴퓨터 판독가능 매체에 관한 것이다.
오디오와 음성 코덱(codec = coder 와 decoder)에 대해 많은 상이한 응용이 있다. 예컨대, 고정 및 이동통신 시스템들과 비디오회의 시스템에서 음향신호들의 효율적인 비트율(bit-rate) 전송을 위해 엔코딩과 디코딩 방법이 사용된다. 또한, 음성코덱들은 비밀전화에 활용되고 또한 음성저장을 위해 활용될 수 있다.
고정 및 이동전화와 그리고 비디오회의에서 경향은 개선된 품질의 재구성 음 향신호로 진행되고 있다. 이러한 경향은, 이들 시스템들이 오늘날의 고정 전화망의 것과 동일하거나 또는 것보다 좋은 음질을 제공한다는 소비자의 기대를 반영한다. 이러한 기대를 충족시키는 한가지 방법은, 음향신호에 대한 주파수대역을 확장시켜서, 소오스 신호에 포함되는 많은 정보를 수신기로 전달하는 것이다. 음성신호의 에너지의 대다수는 스펙트럼적으로 0 kHz와 4 kHz 사이에 위치한다는 것은 사실이다(즉, 현기술 코덱의 전형적인 대역폭). 그러나, 상당한 량의 에너지 또는 4 kHz 에서 8 kHz의 주파수대역에 분포된다. 이 대역에서 주파수성분들은 청취자인 인간에게는 "명료함(clearness)"으로 인지되고 그리고 대화자의 느낌으로는 청취자에게 "가까운"것으로 인지된다.
인간의 가청 주파수 해상도는 주파수를 증가시킴에 따라서 감소된다. 따라서 4 kHz와 8 kHz 사이의 주파수성분들은 충분한 정확도를 가지게 모델링시키기 위해서 비교적 작은 비트들을 필요로 한다. 그럼에도 불구하고, 오늘 인지적 품질을 만족시켜주는 재생 음향신호를 제공하는 공지된 비트-율 능율 광대역 코덱이 없다. 48, 56 및 64 kbps의 비트-율에서 동작하는 현존하는 ITU-T G.722 광대역 광대역 코딩 표준은, 채용한 비트-율과 비교하면 불만족스러운 품질을 제공한다(ITU-T = International Telecommunication Union, standardisation sector).
미국특허 제5,956,686호는 포락(envelope)의 스펙트럼이 주파수대역들로 분할되어, 상이한 코딩방법들이 개별적인 대역들의 포락에 적용될 수 있는, 적응성 변환 코딩/디코딩 장치를 기술하고 있다. 이는, 스펙트럼 포락의 대역들 간에 상이한 여유도를 활용할 수 있도록 한다. 또한 스펙트럼 포락은 각 주파수대역에서 시간변동(time fluctuation)을 보상하기 위해 코딩 및/또는 전송방법으로 조정될 수 있다.
미국특허 제5,526,464호는 잔여신호가 주파수대역들로 분할되는, 부호와 여기된 선형 예측코딩 방법을 기술하고 있다. 각 대역에 대해 특정 코드북이 제공되고 그리고 코드북의 크기는 주파수대역을 증가시킴에 따라 감소된다. 코드북 검색 복잡도를 감소시키기 위해 주파수를 감소시킴으로써 샘플링율이 감소된다.
따라서, 본 기술분야에서, 상이한 주파수대역들의 변동특성을 적용한 코딩방법이 고려하는 예가 있다. 그러나, 소오스신호의 비트-효율 코딩을 얻기 위해서 상이한 특성들만이 사용되었다. 제2주파수대역에 있는 신호들을 코딩하기 위해 제1ㅈ파수대역에 대해 최적화된 코딩방법을 사용할 때, 적용한 코딩에서 고유한 불안전성을 보상하기 위하여 취하는 어떠한 특별 방법들의 제시가 아직까지 없다.
오늘날, 대부분의 코딩모델들은 협대역 신호들(전형적으로 0 - 4 kHz)에 대해 설계된다. 만일 이러한 음성코딩 모델이 큰 대역폭, 즉 0- 8 kHz를 가지는 음향신호의 코딩에 적용된다면, 코딩은 관련 주파수대역의 부분, 일반적으로 낮은 부분에 대해서만 최적화되게 된다.
이와같은 현상이 벌어지는 한 이유는, 일반적으로 코딩 파라미터들의 양자화가 타겟신호와 재생신호 간의 시간영역에서 상관관계를 수반하기 때문이다. 이러한 상관관계는 주로 저주파수영역에서 신호매칭을 기반으로 하게되는데, 이는 음성신호 중에서 고주파수성분은 저주파수성분에 비해 낮은 전력밀도를 가지기 때문이다. 그 결과, 수신측에서 고주파수성분들은 열악하게 재생되게 된다.
불행히도, 이 열악한 재생은 인간청취에서 결함으로 인해 실행될 수 없거나 또는 음성신호들의 특성에 의해 실행될 수 없다. 음성이 생성되면, 음성트랙은 렁(lung)의 기원이 되는 공중파를 통한 필터로서 동작한다. 소위 포르만트 (formant)들은 이 필터의 공진주파수에 대응한다. 음성 중 저주파수대역에서, 타겟신호는 독특한 포르만트를 가진다. 그러나, 고주파수에 대해서, 포르만트들은 보다 확산된다. 사용한 음성모델의 한계들로 인해, 통상적인 협대역 코더에 의해 엔코딩되는 비교적 큰 대역폭을 가지는 음향신호가, 그의 상부 주파수대역에서 독특한 스펙트럼구조를 가지는(예컨대, 피크와 벨리(계곡)) 신호로서 재생되게 된다. 인간인 청취자는 일반적으로, 비자연적이고 또한 금속성 음과 같은 특성을 가지는 음향신호를 인지하게 된다.
때때로, 재생신호의 품질을 한층 더 증가시키기 위해 제2코더가 제1코더의 출력신호에 적용되거나 또는 제1코더와 동시에 적용된다. 만일 이러한 방법이 통상 적인 협대역 코더에 사용된다면, 광대역 소오스신호를 엔코딩할 때 사용하면 주파수대역 중에서 최고 정점에서 스펙트럼 구조는 때때로 한층 더 현저하게 될 것이다. 광대역 음향신호들에 대해서 개선된 음질의 관점에서 보면 상기와 같은 것은 협대역 음향신호에 대해 바람직하지만, 그러나 그 효과는 정반대가 될 수 있다.
따라서 본 발명의 목적은 상기의 문제점들을 경감시키는, 음향신호에 대한 개선된 코딩방법을 제공하는 것이다.
본 발명의 한 특징에 따라서, 목적은 초기에 설명한 것과 같이 전송매체를 통한 전송을 위해 엔코딩된 정보를 생성하기 위해 음향 소오스신호를 엔코딩하는 방법에 의해 달성되는데, 이는, 1차 코드화 신호와 타겟신호를 특징으로 하는데, 이들 각각은 주파수성분을 나타내는 계수들을 포함한다. 타겟신호 각각에 1차 코드호신호에 대응하는 적어도 하나의 평탄화 신호가 생성되는데, 이는 선택적으로 수정된, 타겟신호 각각에 1차 코드화신호의 버전이고, 문턱값 위의 주파수 정보를 나타내는 계수값들에서의 변화가 줄어든다.
본 발명의 다른 특징에 따라, 목적은 컴퓨터의 내부 메모리에 직접 로딩될 수 있는 컴퓨터 프로그램으로 달성되는데, 이는 컴퓨터에서 실행될 때 상기에서 설명한 방법을 제어하기 위한 소프트웨어를 포함한다.
본 발명의 또 다른 특징에 따라, 목적은 컴퓨터로 판독할 수 있는 매체로 달성되는데, 이는 그 내부에 기록된 프로그램을 가지고, 이 프로그램은 상기 문맥에서 설명한 방법을 컴퓨터가 제어하도록 한다.
본 발명의 또 다른 특징에 따라, 목적은 초기에 설명한 것과 같이 음향 소오스신호의 추정을 디코딩하는 방법으로 달성되는데, 이는 각각이 주파수성분을 나타내는 계수들을 포함하는, 평탄화된 1차 디코드화 스펙트럼으로 달성된다. 상기 평탄화된 1차 디코드화 스펙트럼은 적어도 하나의 1차 디코드화 스펙트럼 중 하나의 선택적으로 수정된 버전이고, 문턱값 위의 주파수성분을 나타내는 계수값들에서의 변화가 감소된다.
본 발명의 또 다른 특징에 따라, 목적은 컴퓨터의 내부 메모리에 직접 로딩도리 수 있는 컴퓨터 프로그램에 의해 달성되는데, 이는 컴퓨터에서 실행될 때 상기의 문장에서 설명한 방법을 제어하기 위한 소프트웨어를 포함한다.
본 발명의 또 다른 특징에 따라, 목적은 컴퓨터가 판독할 수 있는 매체에 의해 달성되는데, 이 매체는 그 내부에 기록된 프로그램을 가지고, 이 프로그램은 상기의 문맥에서 설명한 방법을 컴퓨터가 제어하도록 한다.
본 발명의 또 다른 특징에 따라, 목적은 초기에서 설명한 것과 같은 송신기 에 의해 달성되는데, 문턱값 위의 주파수성분을 나타내는 계수값들에서의 변화가 감소되도록, 1차 코드화 신호를 선택적으로 수정함으로서 1차 코드화 신호로부터 평탄화된 출력신호를 생성하는 적어도 하나의 스펙트럼 평탄화 유닛을 특징으로 한다.
본 발명의 또 다른 부수적인 특징에 따라, 초기에 설명한 것과 같은 수신기에 의해 달성되는데, 평탄화된 1차 디코드화 스펙트럼이, 각각이 주파수성분을 나타내는 계수들을 포함하는 것을 특징으로 한다. 문턱값 위의 주파수성분을 나타내는 계수값들에서의 변화가 감소되도록 적어도 하나의 1차 디코드화 스펙트럼을 선택적으로 수정함으로써 평탄화된 1차 디코드화 스펙트럼을 수신기의 스펙트럼 평탄화 유닛이 생성한다.
본 발명의 또 다른 부수적인 특징에 따라, 목적은 제1노드에서 제2노드로 음향 소오스신호의 전송을 위한 통신시스템으로 달성된다. 이 통신시스템은, 제1노드에서는 음향 소오스신호를 엔코딩하고 그리고 엔코드된 정보를 생성하기 위한 제안된 송신기를 포함한다. 제2노드에서는, 송신기가 생성한 엔코드된 정보를 수신하고 또한 엔코드된 정보의 추정을 음향 소오스신호의 추정으로 디코딩하는 제안 수신기를 포함한다. 전송매체는 송신기에서 수신기로 적어도 하나의 향상된 코드화 신호를 전송하는데 사용한다.
수신기에 의해 재생되게 되는 음향신호로부터의 신호들 중 하나 또는 그 이상에서, 문턱값 위의 주파수정보를 나타내는 계수값들에서의 변동의 감소는 음성 또는 음악과 같은 전형적인 음향신호들의 인지 자연감(perceived naturalness)을 개선시킨다. 특히, 선행기술 코딩기술에 의해 발생되는 금속성 음은 상당한 정도로 완화된다. 이는 특히 바람직한 효과인데, 인지 음질은 차후 광대역 응용의 성공에 핵심 포인트이기 때문이다.
예로서 설명되는 바람직한 실시예와, 첨부도면들을 참조하여 본 발명을 보다 상세히 설명한다.
도 1A는 각각이 음향 소오스신호의 주파수성분을 나타내는 1차 디코드화 스펙트럼의 계수들로 주파수를 나타내는 도면.
도 1B는 문턱주파수 위의 주파수대역에서의 주파수성분을 나타내는 도 1A에서의 계수들에 대해 평균 계수값들을 어떻게 계산하는가를 설명하는 도면.
도 1C는 문턱주파수 위의 주파수대역에서의 주파수성분들에 대해 도 1B의 평균 계수값들을 최초 계수값들과 교체하는가를 설명하는 도면.
도 2A는 중첩(overlapping) 주파수대역들에서의 계수값들을 가산하는데 사용되는 윈도우함수의 제1예를 보여주는 도면.
도 2B는 중첩 주파수대역들에서의 계수값들을 가산하는데 사용되는 윈도우함수의 제2예를 보여주는 도면.
도 3은 본 발명에 따른 송신기-수신기 쌍에 대한 블록도.
도 4는 본 발명의 제1실시예에 따른 스펙트럼 평탄화유닛에 대한 블록도.
도 5는 본 발명의 제2실시예에 따른 스펙트럼 평탄화유닛에 대한 블록도.
도 6A는 본 발명의 제2실시예에 따른 스펙트럼 평탄화유닛에 의해 엔코딩되게 되는 1차 디코드화 스펙트럼의 중간(intermediate) 계수들에 대한 블록도.
도 6B는 주파수도에서, 본 발명의 제2실시예에 따라 분할되는 평탄화된 디코드화 스펙트럼의 계수들을 보여주는 도면.
도 7은 본 발명의 한 실시예에 다른 통신시스템에 대한 블록도.
도 8은 본 발명에 따른 음향신호 엔코딩의 일반적인 방법을 흐름도로 설명하는 도면.
도 9는 본 발명에 따라 음향신호의 추정으로 엔코드화 정보를 디코딩하는 일반적인 방법을 흐름도로 설명하는 도면.
도 1A는 주파수도에서, x-축을 따라 일차 디코드화 스펙트럼
Figure 112003013819919-pct00001
의 계수 KY 를 보여주는 도면이다. 각 계수 KY는 임의의 엔코딩방법에 따라 인코딩되어, 전송매체를 통해 전송된 다음에 적절한 디코딩방법에 따라 디코딩되는 음향 소오스신호의 주파수성분의 크기(magnitude)를 나타낸다. 따라서, 일차 디코드화 스펙트럼
Figure 112003013819919-pct00002
은 음향신호(x) 중에서 인지적으로 중요한 특성을 나타낸다.
도 1B는 계수 KY로 표시되는 일차 디코드화 스펙트럼
Figure 112003013819919-pct00003
을 문턱주파수(fT) 위의 주파수대역들(ⅰ, ⅱ 및 ⅲ)로 분할하는가를 설명한다. 제1 주파수대역 ⅰ는 문턱주파수(fT)와 제1경계주파수(edge frequency)(f) 사이의 주파수성분들을 포함하고, 제2주파수대역 ⅱ은 제1경계주파수(f)와 제2경계주파수(f) 사이의 주파수성분들을 포함하고, 그리고 제3주파수대역 ⅲ은 제2경계주파수(f)와 제3경계주파수(f) 사이의 주파수성분들을 포함한다. 주파수대역들 ⅰ, ⅱ 및 ⅲ 각각에서 각 점선은 문제의 주파수대역에 대한 산술적인 평균 계수값을 나타낸다. 본 발명의 대체 실시예에서, 산술적 평균값 대신에 중간(median) 계수값이 결정된다.
평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00004
은 일차 디코드화 스펙트럼
Figure 112003013819919-pct00005
의 선택적 수정 버전으로서 생성되는데, 문턱값(fT) 위의 주파수정보를 나타내는 계수값들(KYE)에서 변화가 감소된다. 도 1C는 도 1B의 평균 계수값(K, K 및 K)들을, 문턱주파수(fT) 위의 주파수대역들(ⅰ, ⅱ 및 ⅲ)을 나타내는 최초 계수값들과 교체하여, 계수값들(KYE)에서 상기 변화의 감소가 이루어지는 예를 보여준다.
도 1B와 1C는 주파수대역들(ⅰ, ⅱ 및 ⅲ)들이 중첩되지 않고(non- overlapping) 또한 상이한 대역폭들을 가지는 본 발명의 실시예를 보여준다. 인간 청취의 해상도는 주파수가 증가함에 따라서 대수적(logarithmic) 관계에 따라 대략적으로 감소하기 때문에, 인지적(perceptual) 관점에서 보아 주파수대역 ⅰ, ⅱ 및 ⅲ들을 대수적 주파수스케일에 따라 분할하는 것이 타당하다. 예컨대, 바크 스케일(Bark scale)은 스펙트럼을 다음의 주파수, 0 kHz, 0,1kHz, 0,2kHz, 0,3kHz, 0,4kHz, 0,63kHz, 0,77kHz, 0,92kHz, 1,08kHz, 1,27kHz, 1,48kHz, 1,72kHz, 2kHz, 2,32kHz, 2,7kHz, 3,15kHz, 3,7kHz, 4,4kHz, 5,3kHz, 6,4kHz, 7,7kHz, 9,5kHz, 12kHz 및 15,5kHz 들로 분할한다. 멜 켑스트럼(Mel cepstrum) 스케일은 인간 청취의 임계대역(critical band)과 닮는 것을 목적으로 하는 대체 주파수대역 셋트를 규정한다. 인지적 선형 예측방법(perceptual linear prediction-method; PLP)은 스펙트럼의 인지적으로 유도된 스케일링 및 압축을 나타내는 주파수대역들 셋트를 얻기 위한 다른 수단을 제공한다.
물론, 주파수대역들은 또한 등거리(equidistant)일 수 있거나 또는 문턱주파수(fT) 위의 전체 스펙트럼을 커버하는 단지 하나의 단일 주파수대역이 있을 수 있다.
게다가, 주파수대역들의 각 대역폭에 상관없이, 이웃하는 주파수대역들은 적어도 부분적으로 서로 중첩될 수 있다. 만일 이러한 경우가 발생하면, 주파수대역들의 중첩영역내 최종 계수값들을 관련 계수값들을 함께 가산하여 유도할 수 있기 전에 각 주파수대역내 계수들을 윈도우함수(window function)로 승산하여야만 한다.
도 2A는 사다리꼴 형상을 가지고 또한 저부 경계주파수(fl)와 상부 경계주파수(fu) 사이로 규정되는 윈도우함수 W1의 제1예를 보여준다. 윈도우함수 W1은 비중첩 주파수영역들에서는 일정한 크기, 예컨대 1을 가지고 그리고 이웃하는 주파수대역들이 중첩하는 저부 천이영역과 대응하는 상부 천이영역에서는 점진적으로 감소하는 크기를 가진다. 윈도우함수 W1의 크기는 각 천이영역의 중간점에서 상기 일정한 크기의 절반(예컨대, 0.5)와 동일한 것이 바람직하다. 물론, 상기 중간점은 사용한 소정의 비-선형 주파수 스케일에 대해 규정되어야만 한다.
도 2B는 중첩하는 주파수대역들에서의 계수값들을 가산하는데 사용하게 되는 윈도우함수 W2 의 다른 예를 보여주는 것으로서, 비-사다리꼴 형상을 가지지만, 그러나 상기에서 도 2A를 참조해 설명한 것과 동일한 특성을 가진다. 천이영역들(예컨대, 사인(sine) 또는 코사인 파의 첫번째 1/4)에서 비-선형의 형상을 가지는 윈도우함수는 특정 응용에 대해 유리한 주파수특성을 가진다.
도 3은 본 발명에 따른 송신기-수신기 쌍에 대한 블록도를 보여준다. 송신기(300)는 음향 소오스신호(x)를 엔코딩된 표현 P(E) 으로 엔코딩하는데, 이는 전송매체(306)를 통해 수신기(310)로 송신된다.
송신기(300)는 음향신호(x) 중에서 인지적으로 중요한 특징들을 나타내는 적어도 하나의 기본 코드화 신호 p를 생성하기 위한 코딩장치를 포함한다. 수신기(310)는 상기 기본 코드화 신호 P로부터 직접 음향 소오스신호(x)의 추정을 재생할 수 있다. 그러나, 본 발명의 바람직한 실시예에 따라, 송신기(300)는 또한 제1 스펙트럼 평탄화유닛(305a)를 포함하고, 이 유닛은 기본 코드화 신호 P가 근거로하는 신호성분들 중 적어도 하나를 수신하고 또한 이에 응해 대응하는 평탄화 신호성분을 생성한다. 강화된(enhanced) 코드화 신호 P(E) 가 상기 대응하는 평탄화 신호성분으로부터 생성된다. 상기 강화된 코드화 신호 P(E)는 인지적으로 개선된 음향소오스신호(x)의 추정
Figure 112003013819919-pct00006
을 수신기(310)가 재생할 수 있도록 하는 음향 소오스신호 (x)의 개선된 표현을 구성한다. 문턱값 위의 주파수정보를 나타내는 스펙트럼의 계수값들에서 변화가 감소되도록 신호성분들의 스펙트럼을 선택적으로 수정함으로써, 제1 스펙트럼 평탄화유닛(305a)은 기본 코드화 신호 P 중의 적어도 하나의 신호성분으로부터 대응하는 평탄화 신호를 생성한다. 그러므로, 제1 스펙트럼 평탄화유닛 (305a)은 도면 1A - 1C를 참조하여 설명한 일차 디코드화 스펙트럼
Figure 112003013819919-pct00007
의 수정과 대응하는 방식으로 신호성분들의 스펙트럼을 수정한다.
강화된 코드화 신호 P(E) 는 전송매체(306)를 통해 전송되어, 전송된 강화 코드화 신호
Figure 112003013819919-pct00008
형태로 강화 코드화 신호 P(E) 의 추정으로서 수신기(310)가 수신한다. 상기의 전송된 강화 코드화 신호
Figure 112003013819919-pct00009
는, 제2 스펙트럼 평탄화유닛(305b)로 음향 소오스신호(x)의 인지적으로 개선된 추정
Figure 112003013819919-pct00010
을 재구성하는데 수신기(310)가 사용한다. 문턱값 위의 주파수정보를 나타내는, 평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00011
의 계수값들에서 변화가 감소되도록 전송된 강화 코드화 신호
Figure 112003013819919-pct00012
로부터 디코딩되는 일차 스펙트럼
Figure 112003013819919-pct00013
을 선택적으로 수정함으로써, 제2 스펙트럼 평탄화유닛(305b)은 인지적으로 개선된, 음향 소오스신호(x)의 추정
Figure 112003013819919-pct00014
을 생성한다.
도 4는 본 발명의 제1 실시예에 따라 디자인된 도 3의 스펙트럼 평탄화유닛 (305a 및 305b)에 대한 블록도를 보여준다. 그러나, 간략화의 이유로, 제2 스펙트럼 평탄화 유닛(305b)의 변수들에 대해서만 참고가 이루어진다. 스펙트럼 평탄화 유닛(305b)은 주파수 성분을 각각 나타내는, 일차 디코드화 스펙트럼
Figure 112003013819919-pct00015
의 계수들(KY)이 저장되는 제1 버퍼 메모리(401)를 포함한다. 프로세싱유닛(402)은 문턱값 (fT) 위의 주파수성분들에 대응하는 계수들 kY n+1 - kY m 을 제1 버퍼메모리(401)로부 터 수신하여, 적어도 하나의 주파수 대역(ⅰ, ⅱ 및 ⅲ) 각각에 대해 상기 계수들 kY n+1 - kY m 의 평균 계수값들 K, K; K 을 계산한다. 그런 다음, 계산된 평균 계수값들 K, K; K 각각은 특정 주파수 대역(ⅰ, ⅱ 및 ⅲ)에서의 일차 디코드화 스펙트럼
Figure 112003013819919-pct00016
의 계수들 KY 의 숫자에 대응하는 횟수만큼, 제2 버퍼메모리(403)에 반복적으로 저장된다. 이러한 저장의 목적은, 일차 디코드화 스펙트럼
Figure 112003013819919-pct00017
의 계수들 KY 을 적절한 평균 계수값들 K, K; K 로 신속한 교체가 이루어지도록 하는 것이다. 계수들의 교체는 제1 버퍼메모리(401)에서부터 문턱값(fT) 까지의 계수값들 kY 1 - kY n 을 독출하고 또한 제2 버퍼메모리(403)에서부터 문턱값(f T) 위의 평탄화된 계수들 kY n+1 - kY m 을 독출하는 독출유닛(404)에 의해 이루어진다. 그런 다음, 이들 계수들 kY 1 - kY n, K, K; K 은 함께, 독출유닛(404)에서부터 출력에 제공되는, 평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00018
의 계수들 KYE 을 형성한다.
도 5는 본 발명의 제2 실시예에 따라 디자인된 도 3의 스펙트럼 평탄화 유닛(305a 및 305b)에 대한 블록도를 보여준다. 다시 한번, 간략화의 이유로, 제2 스펙트럼 평탄화유닛(305b)의 변수들에 대해서만 참조가 이루어진다.
스펙트럼 평탄화유닛(305b)은 입력을 통해 일차 스펙트럼
Figure 112003013819919-pct00019
을 수신하는 제1 트랜스포머(501)를 포함한다. 제1 트랜스포머(501)는 제1출력에서 대응하는 각 스펙트럼(angular spectrum) Ys arg 를 생성하고, 제2출력에서 대응하는 크기 스펙트럼(magnitude spectrum)
Figure 112003013819919-pct00020
를 생성한다. 크기 스펙트럼
Figure 112003013819919-pct00021
은 계수값들 kY 1, ..., kY m 으로 표시된다. 선택적으로, 스펙트럼 평탄화유닛(305b)은 대수 트랜스포머(변환기)(logarithmic transformer)(502)를 포함하는데, 트랜스포머는 문턱주파수(fT) 위의 주파수성분들을 나타내는 크기 스펙트럼
Figure 112003013819919-pct00022
의 계수들 kY n+1, ..., kY m 을 수신하는 한편, 낮은 주파수성분들을 나타내는 크기 스펙트럼
Figure 112003013819919-pct00023
의 계수들 kY 1, ..., kY n 은 결합기(combiner)(507)로 전송된다. 대수 트랜스포머(502)는 문턱주파수(fT) 위의 주파수성분들을 나타내는 크기 스펙트럼
Figure 112003013819919-pct00024
의 계수들 kY n+1, ..., kY m 을 입력에서 수신하고, 이에 응해 출력에 대수 변환을 제공한다. 제1 역 트랜스포머(inverse transformer)(503)는 크기 스펙트럼 중에서 변환된(트랜스폼 된) 부분을 입력에서 수신하고, 이에 응해 켑스트럼(cepstrum) 영역에서 성분을 각각 나타내는 켑스트럼 계수 셋트를 가지는 켑스트럼-코드화(cepstrum-coded) 신호를 출력 에 제공한다. 대수 트랜스포머(502)가 포함되지 않는 경우, 크기 스펙트럼
Figure 112003013819919-pct00025
의 계수들 kY n+1, ..., kY m 은 제1 트랜스포머(501)에서 제1 역 트랜스포머(503)로 직접 공급된다. 후속하는 폐기유닛(discarding unit)(504)은 켑스트럼 코드화 신호에서 n차수 및 그 이상 차수의 켑스트럼 계수들을 폐기하고, 폐기한 계수들을 제로 값화(zero valued) 계수들로 교체하고, 그리고 신호를 제2 트랜스포머(505)에 전송하고, 트랜스포머는 대응하는 스펙트럼 신호를 생성한다.
그런 다음, 만일 대응하는 대수변환이 대수 트랜스포머(502)에 의해 이전에 수행되었다면, 상기 스펙트럼신호는 후속 역 대수 트랜스포머(506)에서 대수적으로 역 변환된다. 역 대수 트랜스포머(506)는 대수적으로 평탄화된 계수들 kY n+1 - kY m 을 생성한다. 따라서, 제2 트랜스포머(505)에서부터 앞서 평탄화된 계수들 kY n+1 - kY m 또는 역 대수 트랜스포머(506)에서부터 대수적으로 평탄화된 계수들 kY n+1 - kY m 은, 문턱주파수(fT) 아래의 주파수성분들을 나타내는 크기 스펙트럼
Figure 112003013819919-pct00026
의 계수들 kY 1, .., kY n 과 함께 결합기(507)로 전송된다. 결합기는 계수들 kY 1, .., kY n 과 평탄화된 계수들 kY n+1 - kY m 에 응해 평탄화된 크기 스펙트럼
Figure 112003013819919-pct00027
를 제공한다. 제2 역 트랜스포머(508)는 각 스펙트럼 Ys arg 을 제1입력에서 수신하고 그리고 제2입력에서는 평탄화된 크기 스펙트럼
Figure 112003013819919-pct00028
을 수신하며, 이에 응해 강화된(enhanced) 코드화 신호
Figure 112003013819919-pct00029
를 생성한다.
도 6A는 (대수) 크기 스펙트럼도에서, 일차 디코드화 스펙트럼
Figure 112003013819919-pct00030
의 스펙트럼 계수들 KS 들의 예를 보여준다. 도면에서 알 수 있듯이, 일차 디코드화 스펙트럼
Figure 112003013819919-pct00031
은 이웃하는 계수들 KS 간에 큰 변화를 가지는 계수들을 포함한다. 이러한 변화는, 음향정보의 표시를 위한 주파수대역 중에서 첨단부에서 바람직하지 않기 때문에, 이 변화는 도 5를 참조하여 상기에서 설명한 바와 같이 스펙트럼 평탄화유닛(305b)에서 감소된다. 스펙트럼 평탄화유닛(305b)은 일차 디코드화 스펙트럼
Figure 112003013819919-pct00032
을 수신하고, 그리고 문턱값(fT) 위의 주파수정보를 나타내는 계수값들 KYE 에서 변화가 감소한, 평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00033
을 제공한다. 즉 문턱값(fT) 위의 주파수정보(스펙트럼 인텍스 KY n에 대응)를 나타내는, 평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00034
의 계수값들 KYE 들에서 변화가 감소되게 되는 값으로 폐기유닛(504)의 변수 n이 선택된다.
도 6B는 주파수도에서, 스펙트럼 평탄화유닛(305b)에 의해 대응하는 평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00035
의 계수값들 KYE 을 나타내도록 수정된 후에, 도 6A에서 일차 디코드화 스펙트럼
Figure 112003013819919-pct00036
의 크기 스펙트럼 계수들 KS 을 보여준다.
켑스트럼 변환과 그리고 계속하여 켑스트럼 코드화 신호에서 고-차수 계수들의 폐기에 대한 대안으로서, 스펙트럼 평탄화는 일차 스펙트럼
Figure 112003013819919-pct00037
을 나타내는 스펙트럼 계수들의 선형 저역통과 필터링 또는 문턱값(fT) 위의 주파수성분들을 나타내는 일차 스펙트럼
Figure 112003013819919-pct00038
의 스펙트럼 계수들을 중간 필터링함으로써 이루어질 수 있다.
도 7은 본 발명의 한 실시예에 따른 통신시스템에 대한 블록도를 보여주는데, 음향 소오스신호(x)가 저-비트율 엔코드화 신호로서 제1노드에서 제2노드로 전송될 수 있고, 여기에서 음향 소오스신호(x)의 추정
Figure 112003013819919-pct00039
으로 재구성된다. 시스템은 송신기(300)와, 전송매체(306)와 그리고 수신기(310)를 포함한다.
송신기(300)는 신호 코더(coder)(702)를 포함하는데, 이는 음향 소오스신호 (x)를 수신하기 위한 입력과 음향신호(x) 중 인지적으로 중요한 특징을 나타내는 기본 코드화 신호 P1 을 제공하기 위한 출력을 가진다. 신호 코더(702)는 또한 음향 소오스신호(x)의 필터링된 (일반적인 의미) 버전을 나타내는 타겟신호(r)와 기본 코드화 신호 P1 을 기반으로 재생된 신호를 나타내는 일차 코드화 신호(y)를 제공한다. 타겟신호(y)와 일차 코드화 신호(y) 어느것도, 하나 또는 둘 다는 상기에서 설명한 방법에 따라서 스펙트럼 평탄화유닛(305a 및 305b)에서 스펙트럼적으로 평탄화된다.
본 발명의 바람직한 실시예에 따라서, 제1스펙트럼 평탄화유닛(305a)은 일차 코드화 신호(y)를 수신하여, 이에 응해 평탄화된 일차 코드화 신호(yE)를 생성한다. 그럼에도 불구하고, 타겟신호(r)를 수신하여 이에 응해 평탄화된 타겟신고(rE)를 생성하기 위해 추가적인 스펙트럼 평탄화유닛(305c)가 송신기에 포함될 수 있다. 본 발명의 다른 바람직한 실시예에 따라서, 타겟신호(r)를 개선하는 스펙트럼 평탄화유닛(305c)만이 포함된다(일차 코드화 신호(y)를 개선하는 스펙트럼 평탄화유닛 (305a)은 포함되지 않는다). 본 발명의 이들 실시예들은 도 7에서 점선과 점선박스로 표시되어 있다.
문턱값(fT) 위의 주파수정보를 나타내는 신호의 스펙트럼 계수값들에서의 변 화를 감소시킴으로써 평탄화된 일차 코드화 신호(yE)를 (그리고 가능하다면 평탄화된 타겟신호 rE 를) 생성하기 위해 스펙트럼 평탄화유닛(305a 및 305c) 둘 다는 본 발명에 따른 방법에 따라서 동작한다.
송긴기(300)의 등화 코더(equalisation coder)(703)는 평탄화된 일차 코드화 신호(yE)와 (평탄화되었을 수 있는) 타겟신호(r(E))를 수신한다. 등화 코더(703)는 (평탄화되었을 수 있는)타겟신호(r(E))와 평탄화된 일차 코드화 신호(yE)를 주파수영역으로 변환시키고 그리고 변환된 신호들의 스펙트럼간의 비율(ratio) 스펙트럼(C)을 계산하여 (평탄화되었을 수 있는)타겟신호(r(E))와 평탄화된 일차 코드화 신호(yE) 간의 대수적 스펙트럼 차이를 나타낸다. 그러므로 비율 스펙트럼(C)의 크기는, 제1 코드화 신호 P1 가 음향신호(x)를 얼마나 잘 설명하는지를 나타낸다.
비율 스펙트럼(C)은 등화 코더(703)에서 출력으로 제공되어, 양자화기 (quantiser)(704)로 제공되며, 양자화기는 비율 신호(C)에 응해 그의 출력에 이차 코드화 신호 Pc 를 제공한다. 이차 코드화 신호 Pc 는 계수 셋트를 포함하는 이산 (discrete) 및 양자화 신호를 나타낸다.
마지막으로, 송신기(300)는 제1 코드화 신호 P1 와 이차 코드화 신호 Pc 를 전송매체(306)로 전달하기 위해 고안된 출력유닛(도시되지 않음)을 포함한다. 송신기(300)와 수신기(310) 중 적어도 하나가 이동형인 경우에, 전송매체(306)는 일반적으로, 적어도 부분적으로, 하나 이상의 무선자원으로 구성된다. 자연히, 고정 또는 이동통신을 위해 적응된 다른 형태의 전송매체를 본 발명에 따라 잘 적용할 수 있다.
수신기(310)는 제1 코드화 신호 P1 을 나타내는 제1 전송신호
Figure 112003013819919-pct00040
와 이차 코드화 신호 Pc 를 나타내는 제2 전송신호
Figure 112003013819919-pct00041
로서 신호들 P1,Pc 의 추정들을 수신한다. 제1 전송신호
Figure 112003013819919-pct00042
와 제2 전송신호
Figure 112003013819919-pct00043
는, 수신기(310)가 음향 소오스신호(x)의 인지적으로 개선된 추정
Figure 112003013819919-pct00044
을 재생(재구성)하는데 사용한다. 이를 수행하기 위해, 수신기(310)는 등화 디코더(707)와, 재생(재구성) 유닛(708)과, 스펙트럼 평탄화 유닛(305b)와 등화기(709)를 포함한다.
재생유닛(708)은 입력을 통해 제1 전송신호
Figure 112003013819919-pct00045
를 수신하여, 이에 응해 음향 소오스신호(x)의 스펙트럼의 추정을 나타내는 일차 디코드화 스펙트럼
Figure 112003013819919-pct00046
를 그 출력에 생성한다. 일차 디코드화 신호
Figure 112003013819919-pct00047
는 스펙트럼 평탄화 유닛(305b)으로 전송된다. 이 유닛(305b)은 제안된 방법에 따라, 평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00048
를 생성한다.
등화 디코더(707)는 제2 전송신호
Figure 112003013819919-pct00049
를 수신하여, 이에 응해 그 출력에 추정된 등화 스펙트럼
Figure 112003013819919-pct00050
을 제공한다. 추정된 등화 스펙트럼
Figure 112003013819919-pct00051
은 평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00052
과 함께 등화기(709)로 전송된다. 등확기(709)는 추정된 등화 스텍트럼
Figure 112003013819919-pct00053
과 평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00054
간의 승산을 수행한다. 그런 다음, 등화기(709)는 승산의 결과로부터 역 변환을 생성하여 시간영역의 신호를 형성한다. 이 신호는 소오스 신호의 개선된 추정
Figure 112003013819919-pct00055
을 구성하고 그리고 등화기(709)의 출력에 전달된다.
개선된 추정
Figure 112003013819919-pct00056
은 또한 소오스신호(x)의 간접 표현을 구성한다. 예컨대, 선형 예측 코더의 경우에, 대신에 개선된 추정
Figure 112003013819919-pct00057
이 될 수 있고, 이로부터 소오스신호(x)의 추정이 합성필터를 통해 생성될 수 있다.
많은 코딩시스템(예컨대, GSM EFR-코더 및 AMR-코더)에서의 코덱들은 프레임들 또는 서브-프레임들로 분할(세그먼트)되는 음성신호에 대해 블록방식(block- wise)으로 동작하기 때문에, 음성신호의 세그먼테이션(분할)에 대응하는 블록-방식 방법에서 등화 연산자(operator) C를 적용하는 것이 바람직하다(GSM=Global system for Mobile Communication; EFR=Enhanced Full Rate; AMR=Adaptive Multi-Rate). 물론, 소오스신호(x)의 추정된 평탄화 스펙트럼을 나타내는 주파수변환 YE 에 대해서도 마찬가지다.
도 8은 본 발명에 따라 음향신호를 엔코딩하는 방법을 흐름도로 설명한다. 제1단계 801에서, 음향신호(x)를 수신한다. 음향신호(x) 중 인지적으로 중요한 특성들을 나타내는 기본 코드화 신호 P가 다음 단계 802에서 생성된다. 후속 단계 803에서, 기본 코드화 신호 P가 근거로 하는 신호성분들 중 적어도 하나의 계수값들에서 변화를 감소시키고 또한 이에 응해 평탄화된 신호성분을 생성한다. 강화된 (enhanced) 기본 코드화 신호 P(E)가 대응하는 평탄화 신호성분에서부터 생성된다. 마지막으로, 단계 804에서, 강환된 코드화 신호 P가 수신기로 전송을 위한 전송매체로 전달된다.
도 9는 본 발명에 따라 엔코드된 정보를 음향신호의 추정으로 디코딩하는 방법을 흐름도를 설명한다. 첫번째 단계 901에서, 전송매체로부터 적어도 하나의 전송된 (강화되었을) 코드화 신호
Figure 112003013819919-pct00058
를 수신한다. 그럼 다음 단계 902에서, 일차 디코드화 스펙트럼
Figure 112003013819919-pct00059
이 상기 적어도 하나의 전송된 (강화되었을) 코드화 신호
Figure 112003013819919-pct00060
로부터 발생된다. 계속해서 단계 903에서, 평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00061
이 일차 디코드화 스펙트럼
Figure 112003013819919-pct00062
에서부터 형성된다. 마지막으로 단계( 904)에서, 평탄화된 일차 디코드화 스펙트럼
Figure 112003013819919-pct00063
을 기반으로 소오스신호의 추정
Figure 112003013819919-pct00064
이 발생된다. 추정
Figure 112003013819919-pct00065
은 인간이 청취자에게 높은 인지 음질을 가진다.
상기에서 제안한 본 발명의 실시예들은 주파수영역에서의 모든 동작(연산)을 포함한다. 그러나, 본 발명의 바람직한 실시예에 따라, 대응하는 행위들이 시간영역에서 이루어질 수 있다. 즉, 서브-밴드 필터로 음향 소오스신호를 나타내는 신호를 적어도 두 개의 상이한 신호성분들로 분할함으로써 이루어질 수 있다. 그런 다음, 신호성분들은 개별적으로 전력(파워)조정되어 원하는 평탄화를 얻는다. 계속하여, 전력 조정된 신호성분들은 평탄화된 단일 기본 코드화 신호로 결합된다. 이 신호는 문턱주파수 위의 주파수성분에 대해 주파수변화가 감소된 음향 소오스신호의 표시를 구성한다.
본 명세서에 사용되는 용어 "포함한다/포함하는"은 상술한 특징, 완전체, 단계 또는 성분(부품)의 실제를 명기하기 위해 취한 것이다. 그러나, 이 용어는 하나 이상의 추가적인 특징, 완전체, 단계 또는 성분들 또는 이들의 그룹의 추가 또는 실재를 배제하지 않는다.
본 발명은 도면에 기술된 실시예들에 한정되지 않고, 청구항의 범위 내에서 자유롭게 수정될 수 있다

Claims (44)

  1. 음향 소오스신호(x)에 응해, 음향 소오스신호(x) 중에서 인지적으로 중요한 특징들을 나타내는 기본 코드화 신호(P1)와,
    음향 소오스신호(x)의 필터링된 버전을 나타내는 타겟신호(r)와,
    기본 코드화 신호(P1)을 기반으로 한 재생신호를 나타내는 일차 코드화 신호(y)를 생성하는 단계와;
    일차 코드화 신호(y)와 타겟신호(r) 중 적어도 하나에 응해, 일차 코드호ㅘ 신호(y)와 타겟신호(r)의 인지적으로 개선된 표시를 구성하는 대응하는 평탄화 신호(yE; rE)를 생성하는 단계와;그리고
    평탄화된 일차 코드화 신호(yE)와 타겟신호(r)와,
    일차 코드화 신호(y)와 평탄화된 타겟신호(rE)와,
    평탄화된 일차 코드화 신호(yE)와 평탄화된 타겟신호(rE)들 각각의 조합을 기반으로 이차 코드화 신호(PC)를 생성하는 단계를 포함하는, 전송매체(306)를 통한 전송을 위한 엔코드화 신호(P1, PC)를 생성하기 위해 음향 소오스신호(x)를 엔코딩하는 방법에 있어서,
    일차 코드화 신호(y)는, 각각이 주파수성분을 나타내는 계수들(KY)을 포함하 고,
    타겟신호(r)는, 각각이 주파수성분을 나타내는 계수들을 포함하고,
    대응하는 평탄화된 신호들(yE; rE)은 일차 코드화 신호(y)와 타겟신호(r)의 선택적으로 수정된 버전이며, 여기에서 문턱값(fT) 위의 주파수정보를 나타내는 계수값들(KYE)에서 변화가 감소되는 것을 특징으로 하는, 전송매체를 통한 전송을 위한 엔코드화 신호를 생성하기 위해 음향 소오스신호를 엔코딩하는 방법.
  2. 제1항에 있어서,
    문턱값(fT) 위의 주파수성분들을 나타내는 일차 코드화 신호(y)의 계수들(KY)들을 하나 이상의 주파수대역들(ⅰ,ⅱ 및 ⅲ)로 나누고,
    각 주파수대역들(ⅰ,ⅱ 및 ⅲ) 내에서 계수들(KY)에 대해 평균 계수값들(K, K및 K)을 계산하고, 그리고
    각 주파수대역들(ⅰ,ⅱ 및 ⅲ) 내 계수들(KY)을 각 평균 계수값들(K, K및 K)로 교체함으로서 평탄화된 일차 코드화 신호(yE)가 일차 코드화 신호(y)로부터 유도되는 것을 특징으로 하는 방법.
  3. 제2항에 있어서, 상기 주파수대역들(ⅰ,ⅱ 및 ⅲ)이 등간격인 것을 특징으로 하는 방법.
  4. 제2항에 있어서, 상기 주파수대역들(ⅰ, ⅱ 및 ⅲ)이 적어도 부분적으로 중첩되는 것을 특징으로 하는 방법.
  5. 제4항에 있어서,
    윈도우된 대응하는 주파수대역들을 구하기 위해 윈도우함수(W1; W2)들로 각 주파수대역(ⅰ,ⅱ 및 ⅲ)들을 승산하고,
    각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써, 주파수대역들(ⅰ,ⅱ 및 ⅲ)의 중첩하는 영역에서의 최종 계수값들이 유도되는 것을 특징으로 하는 방법.
  6. 제5항에 있어서, 상기 윈도우함수(W1; W2)들은 비-중첩 주파수영역에서는 일전한 크기를 가지고 또한 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 방법.
  7. 제1항에 있어서, 일차 코드화 신호(y)의 선택적 수정은,
    각각이 켑스트럼 영역에서 성분을 나타내는 켑스트럼 계수들의 셋트를 가지는 켑스트럼 코드화 신호를 생성하는 단계와,
    특정 차수(n)와 이 보다 높은 차수의 켑스트럼 코드화 신호에서 켑스트럼 계수들을 폐기하는 단계를 포함하는 것을 특징으로 하는 방법.
  8. 제7항에 있어서, 문턱값(fT) 위의 주파수정보를 나타내는 평탄화된 일차 코드화 신호(yE)의 계수값들(KYE)에서 변화가 감소되도록 상기 특정 차수(n)를 선택하는 것을 특징으로 하는 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 이차 코드화 신호(PC)는, 제1 코드화 신호(P1)가 음향신호(x)를 얼마나 잘 묘사하는지를 나타내는 것을 특징으로 하는 방법.
  10. 제9항에 있어서, 이차 코드화 신호(PC)는 타겟신호(r)와 일차 코드화 신호(y) 간의 스펙트럼 비율을 나타내는 것을 특징으로 하는 방법.
  11. 제9항에 있어서, 이차 코드화 신호(PC)는 타겟신호(r)와 일차 코드화 신호(y) 간의 대수적 스펙트럼 차이를 나타내는 것을 특징으로 하는 방법.
  12. 제10항에 있어서,
    음향신호(x)에 응해 주파수 변환된 타겟신호(R)를 생성하고,
    음향신호(x)에 응해 주파수 변환된 일차 코드화 신호(Y)를 생성하고,
    주파수 변환된 타겟신호(R)와 주파수 변환된 일차 코드화 신호(Y) 간의 비율 스펙트럼(C)을 생성하고, 그리고
    비율 스펙트럼(C)을 기반으로 이차 코드화 신호(Pc)를 형성함으로써,
    이차 코드화 신호(PC)를 유도하는 것을 특징으로 하는 방법.
  13. 컴퓨터의 내부 메모리에 직접 로딩될 수 있으며, 컴퓨터에서 실행될 때에 청구항 제1항 내지 제12항 중 어느 하나의 단계들을 제어하기 위한 소프트웨어를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
  14. 청구항 제1항 내지 제12항 중 어느 한 항의 단계를 컴퓨터가 제어할 수 있도록 해주는 프로그램이 기록되어 있는 컴퓨터 판독가능 매체.
  15. 적어도 하나의 코드화 신호(P(E))를 나타내는 적어도 하나의 전송된 코드화 신호
    Figure 112003013819919-pct00066
    를 수신하는 단계와,
    적어도 하나의 전송된 코드화 신호
    Figure 112003013819919-pct00067
    에서부터 적어도 하나의 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00068
    을 디코딩하는 단계와,
    적어도 하나의 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00069
    에서부터 평탄화된 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00070
    을 생성하는 단계와, 그리고
    평탄화된 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00071
    을 기반으로 음향 소오스신호(x)의 추정
    Figure 112003013819919-pct00072
    을 생성하는 단계를 포함하는, 전송매체(306)를 통해 전송된 엔코드화 정보로부터 음향 소오스신호(x)의 표현의 추정
    Figure 112003013819919-pct00073
    을 디코딩하는 방법에 있어서,
    상기 평탄화된 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00074
    은, 각각이 주파수성분을 나타내는 계수들(KY)을 포함하고, 상기 평탄화된 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00075
    은 적어도 하나의 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00076
    의 선택적으로 수정된 버전이고, 여기에서 문턱값(fT) 위의 주파수정보를 나타내는 계수값들(KYE)에서 변화가 감소하는 것을 특징으로 하는, 전송매체(306)를 통해 전송된 엔코드화 정보로부터 음향 소오스신호(x)의 표현의 추정
    Figure 112003013819919-pct00077
    을 디코딩하는 방법.
  16. 제15항에 있어서, 음향 소오스신호(x)의 표현은 음향 소오스신호(x) 그 자체를 구성하는 것을 특징으로 하는 방법.
  17. 제15항에 있어서, 음향 소오스신호(x)의 표현은 여기신호를 구성하고, 음향 소오스신호(x)가 상기 여기신호로부터 유도될 수 있는 것을 특징으로 하는 방법.
  18. 제15항 내지 제17항 중 어느 한 항에 있어서,
    문턱값(fT) 위의 주파수성분들을 나타내는 적어도 하나의 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00078
    중 하나의 계수들(KY)들을 하나 이상의 주파수대역들(ⅰ, ⅱ; ⅲ)로 분할하고,
    각 주파수대역들(ⅰ, ⅱ; ⅲ) 내의 계수들(KY)에 대한 평균 계수값(K, K 및 K)들을 계산하고,
    각 주파수대역들(ⅰ, ⅱ; ⅲ) 내 계수들(KY)을 각 평균 계수값(K, K 및 K)들로 교체시킴으로써, 평탄화된 일차 디코드화 신호
    Figure 112003013819919-pct00079
    가 적어도 하나의 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00080
    에서부터 유도되는 것을 특징으로 하는 방법.
  19. 제18항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)은 등간격인 것을 특징으로 하는 방법.
  20. 제18항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)이 적어도 부분적으로 중첩되어 있는 것을 특징으로 하는 방법.
  21. 제20항에 있어서,
    윈도우된 대응하는 주파수대역들을 얻기 위해서 각 주파수대역들(ⅰ, ⅱ; ⅲ)을 윈도우함수(W1; W2)로 승산하고,
    각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써 주파수대역(ⅰ, ⅱ; ⅲ)들의 중첩영역들에서의 최종 계수값들이 유도되는 것을 특징으로 하는 방법.
  22. 제21항에 있어서, 윈도우함수(W1; W2)는 비-중첩 주파수영역들에서 일정한 크기를 가지고, 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 방법.
  23. 제15항 내지 제17항 중 어느 한 항에 있어서, 적어도 하나의 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00081
    의 선택적 수정은,
    각각이 켑스트럼 영역에서 성분을 나타내는 켑스트럼 계수들의 셋트를 가지는 켑스트럼 코드화 신호를 생성하는 단계와,
    특정 차수(n)와 이 보다 높은 차수의 켑스트럼 코드화 신호에서 켑스트럼 계수들을 폐기하는 단계를 포함하는 것을 특징으로 하는 방법.
  24. 제23항에 있어서, 문턱값(fT) 위의 주파수정보를 나타내는 평탄화된 일차 디 코드화 스펙트럼
    Figure 112003013819919-pct00082
    의 계수값들(KYE)에서 변화가 감소되도록 상기 특정 차수(n)를 선택하는 것을 특징으로 하는 방법.
  25. 제15항 내지 제17항 중 어느 한 항에 있어서, 적어도 하나의 전송된 강화 코드화 신호
    Figure 112007081649436-pct00142
    가,
    음향신호(x)의 코딩된 표현을 구성하는 제1 코드화 신호(P1)의 제1추정
    Figure 112007081649436-pct00143
    과,
    제1 코드화 신호(P1)가 음향신호(x)를 얼마나 잘 묘사하는지를 나타내는 제2차 코드화 신호(Pc)의 제2추정
    Figure 112007081649436-pct00144
    을 포함하는 것을 특징으로 하는 방법.
  26. 제25항에 있어서, 상기 제2차 코드화 신호(PC)는 타겟신호(r)의 스펙트럼과 일차 코드화 신호(y)의 스펙트럼 간의 비율을 나타내는 것을 특징으로 하는 방법.
  27. 제25항에 있어서, 상기 제2차 코드화 신호(PC)는 타겟신호(r)의 대수적 스펙트럼과 일차 코드화 신호(y)의 대수적 스펙트럼 간의 차이를 나타내는 것을 특징으로 하는 방법.
  28. 제25항에 있어서,
    제1추정
    Figure 112007081649436-pct00145
    에 응해 적어도 하나의 일차 디코드화 스펙트럼
    Figure 112007081649436-pct00146
    을 생성하고,
    상기 적어도 하나의 일차 디코드화 스펙트럼
    Figure 112007081649436-pct00147
    에 응해 평탄화된 일차 디코드화 스펙트럼
    Figure 112007081649436-pct00148
    을 생성하고,
    제2추정
    Figure 112007081649436-pct00149
    에 응해 등화 스펙트럼
    Figure 112007081649436-pct00150
    을 생성하고, 그리고
    등화 스펙트럼
    Figure 112007081649436-pct00151
    과 평탄화된 일차 디코드화 스펙트럼
    Figure 112007081649436-pct00152
    에 응해 음향 소오스신호(x)의 추정
    Figure 112007081649436-pct00153
    을 생성함으로써, 음향 소오스신호(x)의 추정
    Figure 112007081649436-pct00154
    이 유도되는 것을 특징으로 하는 방법.
  29. 컴퓨터의 내부 메모리에 직접 로딩될 수 있으며, 컴퓨터에서 실행될 때에 청구항 제15항 내지 제28항 중 어느 하나의 단계들을 제어하기 위한 소프트웨어를 포함하는 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
  30. 청구항 제15항 내지 제28항 중 어느 한 항의 단계를 컴퓨터가 제어할 수 있도록 해주는 프로그램이 기록되어 있는 컴퓨터 판독가능 매체.
  31. 음향 소오스신호(x)를 수신하기 위한 입력을 가지고 또한 음향 소오스신호(x)의 추정
    Figure 112003013819919-pct00096
    을 재구성할 수 있는 음향신호(x)의 인지적으로 중요한 특성들을 나타내는 기본 코드화 신호(P1)을 제공하기 위한 제1출력과, 음향 소오스신호(x)의 필터링된 버전을 나타내는 타겟신호(r)를 제공하기 위한 제2출력과, 기본 코드화 신호(P1)을 기반으로 하는 재구성신호를 나타내는 일차 코드화 신호(y)를 제공하기 위한 제3출력을 가지는 일차 코더(702)와,
    상기 일차 코드화 신호(y)에 응해, 일차 코드화 신호(y)의 인지적으로 개선된 표현을 구성하는, 평탄화된 일차 코드화 신호(yE)를 생성하기 위한 적어도 하나의 스펙트럼 평탄화 유닛(305a)과,
    상기 평탄화된 일차 코드화 신호(yE)와 타겟신호(r)를 기반으로 이차 코드화 신호(PC)를 생성하기 위한 양자화기(704)를 포함하는, 전송매체(306)를 통한 전송을 위한 엔코딩된 정보를 생성하기 위해 음향 소오스신호(x)를 엔코딩하는 송신기에 있어서,
    상기 적어도 하나의 스펙트럼 평탄화 유닛(305a)은, 문턱값(fT) 위의 주파수정보를 나타내는 계수값(KYE)들에서 변화가 감소되도록 일차 코드화 신호(y)를 선택적으로 수정함으로서 일차 코드화 신호(y)로부터 평탄화된 출력신호(yE)를 생성하도록 고안되는 것을 특징으로 하는 송신기.
  32. 제31항에 있어서, 상기 적어도 하나의 스펙트럼 평탄화 유닛(305a,305b)은:
    각각이 주파수성분을 나타내는 입력신호(P)의 계수들(KY)을 저장하기 위한 제1 버퍼메모리(401)와,
    문턱값(fT) 위의 주파수성분들에 대응하는 계수들(kY n+1 - kY m)들에 대해, 적어도 하나의 주파수대역(ⅰ, ⅱ; ⅲ)들 각각에 대해 상기 제1 버퍼메모리(401)에 저장된 계수들(kP n+1 - kP m)의 평균 계수값들(K, K; K)을 계산하기 위한 프로세싱 유닛(402)와,
    특정 주파수대역들(ⅰ, ⅱ; ⅲ)에서 적어도 하나의 기본 코드화 신호(P)의 대응하는 계수들(KP)들이 있는 한 각 주파수대역들(ⅰ, ⅱ; ⅲ)에 대한 각 평균 계수값들(K, K; K)을 반복적으로 저장하기 위한 제2 버퍼메모리(403)와,
    상기 제1 버퍼메모리(401)에서부터 문턱값(fT) 까지의 계수들(kY 1 - kY n)을 독출하고 또한 제2 버퍼메모리(403)에서부터 문턱값(fT) 위의 계수들(kY n+1 - kY m)을 독출하여 출력신호(yE)의 계수들(KYE)을 형성하는 독출유닛(404)를 포함하는 것을 특징으로 하는 송신기.
  33. 제32항에 있어서, 상기 주파수대역(ⅰ, ⅱ; ⅲ)들은 등간격인 것을 특징으로 하는 송신기.
  34. 제32항 또는 제33항에 있어서, 상기 주파수대역(ⅰ, ⅱ; ⅲ)들은 적어도 부분적으로 중첩되는 것을 특징으로 하는 송신기.
  35. 제34항에 있어서,
    윈도우된 대응하는 주파수대역들을 얻기 위하여 윈도우함수(W1; W2)로 각 주파수대역(ⅰ, ⅱ; ⅲ)을 승산하고, 그리고
    각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써 주파수대역들(ⅰ, ⅱ; ⅲ)의 중첩영역들에서 최종 계수값들을 유도하기 위한 계수 결합기를 포함하는 것을 특징으로 하는 송신기.
  36. 제35항에 있어서, 상기 윈도우함수(W1; W2)들은 비-중첩 주파수영역에서는 일전한 크기를 가지고 또한 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 송신기.
  37. 수신한 엔코드 정보
    Figure 112003013819919-pct00097
    로부터 유도되는 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00098
    을 수신하기 위한 입력과 평탄화된 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00099
    를 제공하기 위한 출력을 가지는 스펙트럼 평탄화유닛(305b)를 포함하는, 전송매체(306)로부터 수신된 엔코드화 정보로부터 음향 소오스신호(x)의 표현의 추정
    Figure 112003013819919-pct00100
    을 디코딩하는 수신기에 있어서, 상기 평탄화된 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00101
    은 주파수성분을 나타내고, 스펙트럼 평탄화유닛(305b)은 문턱값(fT) 위의 주파수성분을 나타내는 계수값들 (KYE)에서 변화가 감소되도록 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00102
    을 선택적으로 수정함으로써 평탄화된 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00103
    을 생성하도록 고안되는 것을 특징으로 하는 수신기.
  38. 제37항에 있어서,
    엔코드된 정보
    Figure 112003013819919-pct00104
    에서 제1 전송신호
    Figure 112003013819919-pct00105
    을 수신하기 위한 입력과 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00106
    을 제공하기 위한 출력을 가지는 재구성(재생)유닛(708)와,
    엔코드된 정보
    Figure 112003013819919-pct00107
    에서 제2 전송신호
    Figure 112003013819919-pct00108
    를 수신하기 위한 입력과 추정된 등화 스펙트럼
    Figure 112003013819919-pct00109
    을 제공하기 출력을 가지는 등화 디코더(707)와,
    평탄화된 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00110
    를 수신하기 위한 제1입력과, 상기 추정된 등화 스펙트럼
    Figure 112003013819919-pct00111
    을 수신하기 위한 제2입력과 그리고 음향 소오스신호(x)의 추정
    Figure 112003013819919-pct00112
    을 제공하기 위한 출력을 가지는 양자화기(709)를 더 포함하는 것을 특징으로 하는 수신기.
  39. 제38항에 있어서, 스펙트럼 평탄화 유닛(305b)은:
    각각이 주파수성분을 나타내는 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00113
    의 계수들(KY)을 저장하기 위한 제1 버퍼메모리(401)와,
    문턱값(fT) 위의 주파수성분들에 대응하는 계수들(kY n+1 - kY m)들에 대해, 적어도 하나의 주파수대역(ⅰ, ⅱ; ⅲ)들 각각에 대해 상기 제1 버퍼메모리(401)에 저장된 계수들(kY n+1 - kY m)의 평균 계수값들(K, K; K)을 계산하기 위한 프로세싱 유닛(402)와,
    특정 주파수대역들(ⅰ, ⅱ; ⅲ)에서 적어도 하나의 기본 코드화 신호(P)의 대응하는 계수들(KY)들이 있는 한 각 주파수대역들(ⅰ, ⅱ; ⅲ)에 대한 각 평균 계수값들(K, K; K)을 반복적으로 저장하기 위한 제2 버퍼메모리(403)와,
    상기 제1 버퍼메모리(401)에서부터 문턱값(fT) 까지의 계수들(kY 1 - kY n)을 독출하고 또한 제2 버퍼메모리(403)에서부터 문턱값(fT) 위의 계수들(kY n+1 - kY m)을 독출하여 평탄화된 일차 디코드화 스펙트럼
    Figure 112003013819919-pct00114
    의 계수들(KYE)을 형성하는 독출유닛(404)를 포함하는 것을 특징으로 하는 수신기.
  40. 제39항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)은 등간격인 것을 특징으로 하는 수신기.
  41. 제39항 또는 제40항에 있어서, 상기 주파수대역들(ⅰ, ⅱ; ⅲ)은 적어도 부분적으로 중첩하는 것을 특징으로 하는 수신기.
  42. 제41항에 있어서,
    윈도우된 대응하는 주파수대역들을 얻기 위하여 윈도우함수(W1; W2)로 각 주파수대역(ⅰ, ⅱ; ⅲ)을 승산하고, 그리고
    각 중첩영역에서 이웃하는 윈도우된 주파수대역들의 계수값들을 가산함으로써 주파수대역들(ⅰ, ⅱ; ⅲ)의 중첩영역들에서 최종 계수값들을 유도하기 위한 계수 결합기를 포함하는 것을 특징으로 하는 수신기.
  43. 제42항에 있어서, 상기 윈도우함수(W1; W2)들은 비-중첩 주파수영역에서는 일전한 크기를 가지고 또한 이웃하는 주파수대역들이 중첩하는 상부 및 저부 천이영역에서는 점진적으로 감소하는 크기를 가지는 것을 특징으로 하는 수신기.
  44. 제1노드에서 제2노드로 음향 소오스신호(x)의 전송을 위한 통신시스템에 있 어서,
    상기 청구항 제31항 내지 제36항 중 어느 한 항에 따라 엔코드된 정보를 생성하기 위해 음향 소오스신호(x)를 엔코딩하는 송신기(300)와,
    상기 송신기(300)가 생성한 엔코드된 정보를 수신하기 위한 입력을 가지고 또한 엔코딩된 정보를 청구항 제37항 내지 제43항 중 어느 한 항에 따라 음향 소오스신호(x)의 추정
    Figure 112003013819919-pct00115
    으로 디코딩하는 수신기(310)와,
    송신기(300)에서 수신기(310)로 적어도 하나의 강화된 코드화 신호(P(E))를 전송하기 위한 전송매체(306)를 포함하는 것을 특징으로 하는 통신시스템.
KR1020037005479A 2000-10-20 2001-09-07 지각적으로 개선된 음향신호의 엔코딩 KR100832144B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP00850172A EP1199812A1 (en) 2000-10-20 2000-10-20 Perceptually improved encoding of acoustic signals
EP00850172.8 2000-10-20
PCT/SE2001/001919 WO2002033692A1 (en) 2000-10-20 2001-09-07 Perceptually improved encoding of acoustic signals

Publications (2)

Publication Number Publication Date
KR20030048061A KR20030048061A (ko) 2003-06-18
KR100832144B1 true KR100832144B1 (ko) 2008-05-27

Family

ID=8175680

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037005479A KR100832144B1 (ko) 2000-10-20 2001-09-07 지각적으로 개선된 음향신호의 엔코딩

Country Status (12)

Country Link
US (1) US6611798B2 (ko)
EP (2) EP1199812A1 (ko)
JP (1) JP5222452B2 (ko)
KR (1) KR100832144B1 (ko)
CN (1) CN1312658C (ko)
AT (1) ATE380378T1 (ko)
AU (2) AU2001284606B2 (ko)
CA (1) CA2424373C (ko)
DE (1) DE60131766T2 (ko)
ES (1) ES2296791T3 (ko)
PT (1) PT1328923E (ko)
WO (1) WO2002033692A1 (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002054744A1 (en) * 2000-12-29 2002-07-11 Nokia Corporation Audio signal quality enhancement in a digital network
IL144158A (en) 2001-07-05 2011-06-30 Mosaid Technologies Inc Socket for connecting an analog telephone to a digital communications network that carries digital voice signals
US7308406B2 (en) * 2001-08-17 2007-12-11 Broadcom Corporation Method and system for a waveform attenuation technique for predictive speech coding based on extrapolation of speech waveform
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
DE10254612A1 (de) * 2002-11-22 2004-06-17 Humboldt-Universität Zu Berlin Verfahren zur Ermittlung spezifisch relevanter akustischer Merkmale von Schallsignalen für die Analyse unbekannter Schallsignale einer Schallerzeugung
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7075434B2 (en) * 2003-09-22 2006-07-11 Michael Shafir Encoding and decoding method and system
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals
KR100619893B1 (ko) * 2004-07-23 2006-09-19 엘지전자 주식회사 휴대단말기의 개선된 저전송률 선형예측코딩 장치 및 방법
KR20060067016A (ko) 2004-12-14 2006-06-19 엘지전자 주식회사 음성 부호화 장치 및 방법
US7930176B2 (en) 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US7490036B2 (en) * 2005-10-20 2009-02-10 Motorola, Inc. Adaptive equalizer for a coded speech signal
US7930173B2 (en) 2006-06-19 2011-04-19 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8731909B2 (en) * 2008-08-08 2014-05-20 Panasonic Corporation Spectral smoothing device, encoding device, decoding device, communication terminal device, base station device, and spectral smoothing method
US9979962B2 (en) * 2011-08-08 2018-05-22 Hewlett-Packard Development Company, L.P. Method and system for compression of a real-time surveillance signal
CN105321521B (zh) * 2014-06-30 2019-06-04 美的集团股份有限公司 基于终端运行环境的音频信号编码方法和系统
CN109952609B (zh) * 2016-11-07 2023-08-15 雅马哈株式会社 声音合成方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US920832A (en) 1906-11-26 1909-05-04 Vickers Sons & Maxim Ltd Automatic gun.
US5583962A (en) 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5884010A (en) 1994-03-14 1999-03-16 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
EP1006510A2 (en) * 1994-03-18 2000-06-07 Mitsubishi Denki Kabushiki Kaisha Signal encoding and decoding system

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307441A (en) 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5526464A (en) 1993-04-29 1996-06-11 Northern Telecom Limited Reducing search complexity for code-excited linear prediction (CELP) coding
JP3237089B2 (ja) 1994-07-28 2001-12-10 株式会社日立製作所 音響信号符号化復号方法
JP3970327B2 (ja) * 1996-02-15 2007-09-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ 複雑さが軽減された信号送信システム
TW416044B (en) * 1996-06-19 2000-12-21 Texas Instruments Inc Adaptive filter and filtering method for low bit rate coding
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
EP0926658A4 (en) * 1997-07-11 2005-06-29 Sony Corp INFORMATION DECODERS AND DECODING METHOD, INFORMATION CODERS AND CODING METHOD AND DISTRIBUTION MEDIUM
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
JPH11296196A (ja) * 1998-04-13 1999-10-29 Hitachi Ltd 音声符号化方法および音声符号化処理装置
JP2000047695A (ja) * 1998-07-29 2000-02-18 Oki Electric Ind Co Ltd 符号化装置及び復号化装置
US6182030B1 (en) * 1998-12-18 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced coding to improve coded communication signals

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US920832A (en) 1906-11-26 1909-05-04 Vickers Sons & Maxim Ltd Automatic gun.
US5583962A (en) 1991-01-08 1996-12-10 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5884010A (en) 1994-03-14 1999-03-16 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
EP1006510A2 (en) * 1994-03-18 2000-06-07 Mitsubishi Denki Kabushiki Kaisha Signal encoding and decoding system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
2000 ICASSP, A 14 kb/s wideband speech coder with a parametric highband model, Vol.2 pp.5-9

Also Published As

Publication number Publication date
ES2296791T3 (es) 2008-05-01
CN1312658C (zh) 2007-04-25
DE60131766D1 (de) 2008-01-17
DE60131766T2 (de) 2008-11-13
EP1199812A1 (en) 2002-04-24
JP5222452B2 (ja) 2013-06-26
US20020049584A1 (en) 2002-04-25
CA2424373C (en) 2011-08-30
PT1328923E (pt) 2008-02-28
AU2001284606B2 (en) 2007-01-25
US6611798B2 (en) 2003-08-26
AU8460601A (en) 2002-04-29
KR20030048061A (ko) 2003-06-18
EP1328923B1 (en) 2007-12-05
EP1328923A1 (en) 2003-07-23
ATE380378T1 (de) 2007-12-15
WO2002033692A1 (en) 2002-04-25
CN1470048A (zh) 2004-01-21
JP2004515801A (ja) 2004-05-27
CA2424373A1 (en) 2002-04-25

Similar Documents

Publication Publication Date Title
KR100832144B1 (ko) 지각적으로 개선된 음향신호의 엔코딩
JP5047268B2 (ja) Mdct係数を使用する音声後処理
CA2698031C (en) Method and device for noise filling
KR102063900B1 (ko) 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
CA2984562C (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
US9020815B2 (en) Spectral envelope coding of energy attack signal
CN103187065B (zh) 音频数据的处理方法、装置和系统
TW201724085A (zh) 訊框錯誤隱藏方法以及音訊解碼方法
AU2001284606A1 (en) Perceptually improved encoding of acoustic signals
CN111312278B (zh) 用于带宽扩展的高频解码的方法及设备
Bhatt et al. A novel approach for artificial bandwidth extension of speech signals by LPC technique over proposed GSM FR NB coder using high band feature extraction and various extension of excitation methods
KR102491177B1 (ko) 대역폭 확장을 위한 고주파 복호화 방법 및 장치
JP5451603B2 (ja) デジタルオーディオ信号の符号化
Herre et al. Perceptual audio coding of speech signals
Pollak et al. Audio Compression using Wavelet Techniques

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130507

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140512

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150508

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160510

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170508

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180509

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190516

Year of fee payment: 12