KR100986150B1 - 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템 - Google Patents

합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템 Download PDF

Info

Publication number
KR100986150B1
KR100986150B1 KR1020047020587A KR20047020587A KR100986150B1 KR 100986150 B1 KR100986150 B1 KR 100986150B1 KR 1020047020587 A KR1020047020587 A KR 1020047020587A KR 20047020587 A KR20047020587 A KR 20047020587A KR 100986150 B1 KR100986150 B1 KR 100986150B1
Authority
KR
South Korea
Prior art keywords
signal
component
subband
synthesized
spectral
Prior art date
Application number
KR1020047020587A
Other languages
English (en)
Other versions
KR20050010950A (ko
Inventor
그랜트 알렌 데이비슨
마이클 미드 트루만
매튜 콘라드 펠레스
마크 스튜어트 빈톤
Original Assignee
돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 레버러토리즈 라이쎈싱 코오포레이션 filed Critical 돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority claimed from PCT/US2003/018065 external-priority patent/WO2003107329A1/en
Publication of KR20050010950A publication Critical patent/KR20050010950A/ko
Application granted granted Critical
Publication of KR100986150B1 publication Critical patent/KR100986150B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Optical Elements Other Than Lenses (AREA)
  • Stereophonic System (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Optical Communication System (AREA)
  • Optical Recording Or Reproduction (AREA)
  • Adornments (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Optical Filters (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

오디오 코딩 시스템 내의 수신기는 오디오 신호를 표시하는 신호 전달 주파수 서브대역 신호를 수신한다. 이 서브대역 신호는 검사되어, 오디오 신호의 하나 이상의 특성을 평가한다. 스펙트럼 성분은 합성되어, 평가된 특성을 갖는다. 이 합성된 스펙트럼 성분은 서브대역 신호와 통합되어 합성 필터뱅크를 통과하여 출력 신호를 발생시킨다. 한 가지 구현방식에서, 평가된 특성은 일시적 정형(temporal shape)이고, 잡음-형 스펙트럼 성분은 합성되어 오디오 신호의 일시적 정형(temporal shape)을 갖는다.
역포맷화기, 디코더, 분석기, 합성 필터뱅크, 성분 합성기, 분석기

Description

합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템{AUDIO CODING SYSTEM USING CHARACTERISTICS OF A DECODED SIGNAL TO ADAPT SYNTHESIZED SPECTRAL COMPONENTS}
본 발명은 일반적으로 오디오 코딩 시스템에 관한 것이며, 특히, 오디오 코딩 시스템으로부터 얻어지는 오디오 신호의 인식 품질을 개선시키는 것에 관한 것이다.
오디오 코딩 시스템은 전송 또는 저장하는데 적합한 엔코딩된 신호로 오디오 신호를 엔코딩하고 나서, 이 엔코딩된 신호를 수신 또는 검색하고 이 신호를 디코딩하여 재생을 위한 원래의 오디오 신호 버젼을 얻는데 사용된다. 인식 오디오 코딩 시스템은 오디오 신호를 원래의 오디오 신호 보다 낮은 정보 용량 요구조건을 지닌 엔코딩된 신호로 엔코딩하고 나서, 이 엔코딩된 신호를 디코딩하여 원래의 오디오 신호와 인식할 정도로 구별할 수 없는 출력을 제공하고자 하는 것이다. 인식 오디오 코딩 시스템의 일 예는 Dolby Digital이라 칭하는 2001년 8월에 공개된 제목이 "Revision A to Digital Audio Compression(AC-3) Standard"인 Advanced Television Systems Committee(ATSC) A/52A document(1994)에 기재되어 있다. 또 다른 예는 Bosi 등이 발표한 Advanced Audio Coding(AAC)이라 칭하는 "ISO/IEC MPEG2 Advanced Audio Coding." J.AES, vol.45, no.10, October 1997, pp.789-814에 기재되어 있다. 이들 2가지 코딩 시스템 뿐만 아니라 많은 다른 인식 코딩 시스템에서, 대역 분할 송신기(split-band transmitter)는 분석 필터뱅크를 오디오 신호에 적용하여 주파수 대역 또는 그룹으로 배열된 스펙트럼 성분을 얻고 사이코아쿠스틱 원리에 따라서 스펙트럼 성분을 엔코딩하여 엔코딩된 신호를 발생시킨다. 이 대역폭은 전형적으로 가변되고, 통상적으로 인간 청각 시스템의 소위 임계 대역폭과 동일하다. 상보적인 대역 분할 수신기(split-band receiver)는 엔코딩된 신호를 수신하여 디코딩하여 스펙트럼 성분을 복구하고 합성 필터뱅크를 디코딩된 스펙트럼 성분에 적용하여 원래 오디오 신호의 복제를 얻는다.
인식 코딩 시스템은 주관적이거나 인식된 오디오 품질 측정을 유지하면서 오디오 신호의 정보 용량 요구조건을 감소시켜, 오디오 신호의 엔코딩된 표현이 보다 작은 대역폭을 사용하여 통신 채널을 통해서 전달되거나 보다 적은 공간을 사용하여 기록 매체상에 저장되도록 하는데 사용된다. 정보 용량 요구조건은 스펙트럼 성분의 양자화에 의해 감소된다. 양자화는 양자화된 신호에 잡음을 도입시키지만, 인식 오디오 코딩 시스템은 일반적으로 양자화 잡음 진폭을 제어하고자 시도시 사이코아쿠스틱 모델(psychoacoustic models)을 사용하여, 이 잡음을 마스킹하거나 신호에서 스펙트럼 성분에 의해 가청불가능하게 한다.
통상적인 인식 코딩 기술은 고 비트레이트로 매체를 지닌 엔코딩된 신호를 전송 또는 기록하도록 하는 오디오 코딩 시스템에서 상당히 양호하게 작동하지만, 이들 기술은 엔코딩된 신호가 저 비트레이트로 제한될 때 이들 기술은 스스로 매우 양호한 오디오 품질을 제공하지 못한다. 다른 기술은 매우 낮은 비트 레이트에서 고 품질 신호를 제공하고자 할 때 인식 코딩 기술과 결합되어 사용되었다.
소위 "High-Frequency Regeneration"(HFR)이라 하는 한 가지 기술은 Truman 등이 2002년 3월 28일 출원한 발명의 명칭이 "Broadband Frequency Translation for High Frequency Regeneration"인 미국 특허 출원 10/113,858호에 기재되어 있고, 이 특허 출원이 전반적으로 본원에 참조되어 있다. HFR을 사용하는 오디오 코딩 시스템에서, 송신기는 엔코딩된 신호로부터 고주파수 성분을 배제하고, 수신기는 손실된 고주파수 성분을 위하여 잡음-형 대체 성분을 재생 또는 합성한다. 일반적으로 수신기의 출력에 제공되는 이 결과의 신호는 송신기의 입력에 제공된 원래 신호와 인식할정도로 동일하지 않지만, 복잡한 재생 기술은 저 비트레이트에서 가능한 훨씬 높은 인식 품질을 지닌 원래의 입력 신호와 상당히 양호하게 근사화되는 출력 신호를 제공할 수 있다. 이 내용에서, 고품질은 통상적으로 광 대역폭 및 저레벨의 인식 잡음을 의미한다.
소위 "Spectral Hole Filling"(SHF)라 칭하는 또 다른 분석 기술은 Truman 등이 2002년 6월 17일에 출원한 발명의 명칭이 "Improved Audio Coding System Using Spectral Hole Filling"인 미국 특허 출원 10/174,493호에 서술되어 있고, 이 특허 출원이 전반적으로 본원에 참조되어 있다. 이 기술에 따르면, 송신기는 스펙트럼 성분의 대역이 엔코딩된 신호로부터 생략되도록 하는 방식으로 입력 신호의 스펙트럼 성분을 양자화하여 엔코딩한다. 손실된 스펙트럼 성분의 대역을 스펙트럼 홀(spectral holes)이라 칭한다. 수신기는 스펙트럼 성분을 합성하여 스펙트럼 홀 을 채운다. SHF 기술은 일반적으로 원래 입력 신호와 인식할정도로 동일한 출력 신호를 제공하지 못하지만, 저 비트레이트 엔코딩된 신호로 동작하도록 제한되는 시스템에서 출력 신호의 인식 품질을 개선시킬 수 있다.
HFR 및 SHF와 같은 기술은 많은 상황에서 이점을 제공할 수 있지만, 이들 기술은 모든 상황에서 양호하게 작동하지 못한다. 특히 문제가 되는 한가지 상황은, 급격하게 변화하는 진폭을 지닌 오디오 신호가 분석 및 합성 필터뱅크를 수행하기 위하여 블록 변환을 사용하는 시스템에 의해 엔코딩될 때 야기된다. 이 상황에서, 가청가능한 잡음-형 성분은 변환 블록에 대응하는 시간 주기에 걸쳐서 손상될 수 있다.
시간-손상된 잡음의 가청 효과를 감소시키는데 사용될 수 있는 한 가지 기술은 매우 비고정적인 입력 신호의 구간 동안 분석 및 합성 변환의 블록 길이를 감소시키는 것이다. 이 기술은 고 비트레이트로 매체를 지닌 엔코딩된 신호를 전송 또는 기록하도록 하는 오디오 코딩 시스템에서 양호하게 작동하지만, 보다 짧은 블록의 사용이 이 변환에 의해 성취되는 코딩 이득을 감소시키기 때문에 보다 낮은 비트 레이트 시스템에선 또한 양호하게 작동하지 않는다.
또 다른 기술에서, 송신기는 입력 신호를 변경하여, 진폭의 급격한 변화가 분석 변환의 적용전 제거되거나 감소되도록 한다. 이 수신기는 합성 변환의 적용후 변경 효과를 반전시킨다. 불행하게도, 이 기술은 입력 신호의 실제 스펙트럼 특성을 모호하게 함으로써 효율적인 인식 코딩을 위하여 필요로 되는 정보를 왜곡시키고, 이 때문에 송신기는 전송된 신호의 일부를 사용하여 수신기가 변경 효과를 반 전시키는데 필요로 되는 파라미터를 전달하여야만 한다.
일시적 잡음 정형화로서 공지된 세번째 기술에서, 송신기는 예측 필터를 분석 필터뱅크로부터 얻어진 스펙트럼 성분에 적용하며, 전송된 신호에서 예측 에러 및 예측 필터 계수를 전달하고, 수신기는 역 에측 필터를 예측 에러에 적용하여 스펙트럼 성분을 복구한다. 이 기술은 예측 필터 계수를 전달하는데 필요로 되는 신호 오버헤드로 인해 저 비트레이트 시스템에서 바람직하지 않다.
본 발명의 목적은 저 비트레이트 코딩 시스템에 의해 발생되는 오디오 신호의 인식 품질을 개선시키기 위하여 이와 같은 저 비트레이트 코딩 시스템에서 사용될 수 있는 기술을 제공하는 것이다.
본 발명을 따르면, 엔코딩된 오디오 정보는 엔코딩된 오디오 정보를 수신하고 일부이지만 전부는 아닌 오디오 신호의 스펙트럼 내용을 표시하는 서브대역 신호를 얻으며, 상기 오디오 신호의 특성을 얻기 위하여 상기 서브대역 신호를 검사하며, 상기 오디오 신호의 특성을 지닌 합성된 스펙트럼 성분을 발생시키며, 변경된 서브대역 신호의 세트를 발생시키기 위하여 상기 합성된 스펙트럼 성분을 상기 서브대역 신호와 통합하고, 합성 필터뱅크를 상기 변경된 서브대역 신호의 세트에 적용함으로써 상기 오디오 정보를 발생시킴으로써 처리된다.
본 발명의 각종 특징들 및 바람직한 실시예는 이하의 설명 및 첨부한 도면을 통해서 보다 잘 이해할 수 있을 것이다. 이하의 설명 내용 및 전체 도면은 단지 예로서 설명된 것이지, 본 발명의 영역을 제한하고자 하는 것으로 이해되어서는 안된 다.
도1은 오디오 코딩 시스템내의 송신기의 개요적인 블록도.
도2는 오디오 코딩 시스템 내의 수신기의 개요적인 블록도.
도3은 본 발명의 각종 양상을 구현하기 위하여 사용될 수 있는 장치의 개요적인 블록도.
A. 개요
본 발명의 각종 양상은 다양한 신호 처리 방법 및 도1 및 도2에 도시된 장치들과 유사한 장치들을 포함하는 장치와 관련될 수 있다. 어떤 양상들은 단지 수신기에서만 수행되는 공정에 의해 실행될 수 있다. 다른 양상들은 수신기 및 송신기 둘 다에서 수행되는 협동적인 공정을 필요로 한다. 본 발명의 이들 각종 양상들을 실행하는데 사용될 수 있는 공정에 대한 설명은 이들 공정을 수행하는데 사용될 수 있는 통상적인 장치를 개략적으로 설명한 다음에 설명된다.
도1은 분석 필터뱅크(12)가 경로(11)로부터 오디오 신호를 표시하는 오디오 정보를 수신하고, 이에 응답하여, 이 오디오 신호의 스펙트럼 내용을 표시하는 주파수 서브대역 신호를 제공하는 대역 분할 오디오 송신기(split-band audio transmitter)의 한 가지 구현방식을 도시한 것이다. 각 서브대역 신호는 엔코더(14)로 통과되는데, 상기 엔코더는 상기 서브대역 신호의 엔코딩된 표현을 발생시키고 이 엔코딩된 표현을 포맷화기(16)로 통과시킨다. 포맷화기(16)는 엔코딩된 표 현을 전송 또는 저장하는데 적합한 출력 신호로 어셈블링하고 이 출력 신호를 경로(17)를 따라서 통과시킨다.
도2는 역포맷화기(22)가 오디오 신호의 스펙트럼 내용을 표시하는 주파수 서브대역 신호의 엔코딩된 표현을 전달하는 입력 신호를 경로(21)로부터 수신하는 대역 분할 오디오 수신기의 한가지 구현방식을 도시한 것이다. 역포맷화기(22)는 입력 신호로부터 엔코딩된 표현을 얻어 이를 디코더(24)로 통과시킨다. 디코더(24)는 엔코딩된 표현을 주파수 서브대역 신호로 디코딩한다. 분석기(25)는 서브대역 신호를 검사하여, 서브대역 신호가 나타내는 오디오 신호의 하나 이상의 특성을 얻는다. 특성 표시는 성분 합성기(26)로 통과되는데, 이 성분 합성기는 이 특성에 응답하여 적응되는 공정을 사용하여 합성된 스펙트럼 성분을 발생시킨다. 통합기(integrator)(27)는 성분 합성기(26)에 의해 발생된 합성된 스펙트럼 성분과 디코더(24)에 의해 제공된 서브대역 신호를 통합함으로써 변경된 서브대역 신호의 세트를 발생시킨다. 이 변경된 서브대역 신호 세트에 응답하여, 합성 필터뱅크(28)는 오디오 신호를 표시하는 오디오 정보를 경로(29)를 따라서 발생시킨다. 도면에 도시된 특정 구현방식에서, 분석기(25)도 성분 합성기(26)도 역포맷화기(22)에 의한 입력 신호로부터 얻어진 어떠한 제어 정보에 응답하는 공정에 적응되지 않는다. 다른 구현방식에서, 분석기(25) 및/또는 성분 합성기(26)는 입력 신호로부터 얻어진 제어 정보에 응답할 수 있다.
도1 및 도2에 도시된 장치는 3개의 주파수 서브대역을 위한 필터뱅크를 도시한 것이다. 보다 많은 서브대역이 전형적인 구현방식에 사용될 수 있지만, 예시를 간결하게 하기 위하여 단지 3개만이 도시되어 잇다. 특정한 수가 본 발명에 중요한 것은 아니다.
분석 및 합성 필터뱅크는 본질적으로 이산 퓨리에 변환 또는 이산 코사인 변환(DCT)을 포함한 임의의 블록 변환에 의해 수행될 수 있다. 상술된 바와 같은 송신기 및 수신기를 갖는 하나의 오디오 코딩 시스템에서, 분석 필터뱅크(12) 및 합성 필터뱅크(28)는 Princen 등이 "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation"이라는 제목으로 발표한 ICASSP 1987 Conf. Proc., May 1987, pp. 2161-64에 기재되어 있는 시간-도메인 에일리어싱 소거(TDAC) 변환으로 공지된 변경된 DCT에 의해 수행된다.
블록 변환에 의해 수행되는 분석 필터뱅크는 입력 신호의 구간 또는 블록을 신호 구간의 스펙트럼 내용을 표시하는 변환 계수의 세트로 변환시킨다. 하나 이상의 인접 변환 계수의 그룹은 이 그룹내의 계수들의 수와 동일한 대역폭을 갖는 특정 주파수 서브대역 내에서 스펙트럼 내용을 표시한다. 용어 "서브대역 신호"는 하나 이상의 인접 변환 계수의 그룹과 관계하고, 용어 "스펙트럼 성분"은 변환 계수와 관계한다.
이 설명에서 사용되는 용어 "엔코더" 및 "엔코딩"은 오디오 신호 자신 보다 적은 정보 용량 요구조건을 갖는 엔코딩된 정보로 오디오 신호를 표시하는데 사용될 수 있는 정보 처리 장치 및 방법에 관계한다. 용어 "디코더" 및 "디코딩"은 엔코딩된 표현으로부터 오디오 신호를 복구하는데 사용될 수 있는 정보 처리 장치 및 방법과 관계한다. 감소된 정보 용량 요구조건에 속하는 2가지 예들은 상술된 Dolby Digital 및 AAC 코딩 표준과 호환가능한 비트 스트림을 처리하는데 필요로 되는 코딩이다. 특정 유형의 엔코딩 또는 디코딩이 본 발명에 중요한 것은 아니다.
B. 수신기
본 발명의 각종 양상은 송신기로부터 어떤 특수한 처리 또는 정보를 필요로 하지 않는 수신기에서 실행될 수 있다. 이들 양상이 우선 설명된다.
1. 신호 특성 분석
본 발명은 매우 낮은 비트레이트로 오디오 신호를 표시하는 코딩 시스템에 사용될 수 있다. 매우 낮은 비트레이트 시스템에서 엔코딩된 정보는 통상적으로, 오디오 신호의 스펙트럼 성분의 일부분만을 표시하는 서브대역 신호를 전달한다. 분석기(25)는 이들 서브대역 신호를 검사하여, 서브대역 신호로 표시되는 오디오 신호의 부분의 하나 이상의 특성을 얻는다. 하나 이상의 특성의 표현은 성분 합성기(26)로 통과되고 합성된 스펙트럼 성분의 발생을 적응시키는데 사용된다. 사용될 수 있는 특성의 여러 예들이 후술된다.
a) 진폭
많은 코딩 시스템에 의해 발생되는 엔코딩된 정보는 어떤 소망의 비트 길이 또는 양자화 해상도(quantizing resolution)로 양자화되는 스펙트럼 성분을 표시한다. 양자화된 성분의 최하위 유효 비트(LSB)로 표시되는 레벨 보다 작은 스펙트럼 성분은 엔코딩된 정보로부터 생략되거나, 대안적으로, 양자화 값이 제로 또는 제로로 간주되는 것을 표시하는 어떤 형태로 표시될 수 있다. 엔코딩된 정보에 의해 전달되는 양자화된 스펙트럼 성분의 LSB에 대응하는 레벨은 엔코딩된 정보로부터 생 략되는 작은 스펙트럼 성분의 크기에 대한 상한으로 간주된다.
성분 합성기(26)는 이 레벨을 사용하여 손실된 스펙트럼 성분을 대체하도록 합성되는 임의의 성분의 진폭을 제한한다.
b) 스펙트럼 정형
엔코딩된 정보에 의해 전달되는 서브대역 신호의 스펙트럼 정형은 서브대역 신호 자신들로부터 즉각 이용가능하게 된다. 그러나, 스펙트럼 정형에 대한 다른 정보는 주파수 도메인에서 서브대역 신호에 필터를 적용함으로써 도출될 수 있다. 이 필터는 예측 필터, 저역 통과 필터, 또는 본질적으로, 바람직한 이외 다른 모든 유형의 필터일 수 있다.
스펙트럼 정형 또는 필터 출력의 표시는 적절하게 성분 합성기(26)로 통과된다. 필요한 경우, 어느 필터가 사용되는지에 대한 표시가 또한 통과되어야 한다.
c) 마스킹
인식 모델은 서브대역 신호내의 스펙트럼 성분의 사이코아쿠스틱 마스킹 효과를 추정하기 위하여 적용될 수 있다. 이들 마스킹 효과가 주파수에 의해 가변되기 때문에, 한 주파수에서 제1 스펙트럼 성분에 의해 제공되는 마스킹은 제1 및 제 2 스펙트럼 성분이 동일한 진폭을 가질지라도, 또 다른 주파수에서 제2 스펙트럼 성분에 의해 제공되는 레벨과 동일한 마스킹 레벨을 반드시 제공할 필요가 없다.
추정된 마스킹 효과의 표시는 성분 합성기(26)로 통과되는데, 이 성분 합성기는 스펙트럼 성분의 합성을 제어하여 합성된 성분의 추정된 마스킹 효과가 서브대역 신호 내의 스펙트럼 성분의 추정된 마스킹 효과와 바람직한 관계를 갖도록 한 다.
d) 음조
서브대역 신호의 음조(tonality)는 스펙트럼 평활성 측정값의 계산을 포함한 다양한 방식으로 평가될 수 있는데, 이 측정값은 서브대역 신호 샘플의 기하학적 평균으로 나뉘어진 서브대역 신호 샘플의 산술 평균의 정규화 지수이다. 음조는 또한, 서브대역 신호 내의 스펙트럼 성분의 배열 또는 분포를 분석함으로써 평가될 수 있다. 예를 들어, 서브대역 신호는 소수의 큰 스펙트럼 성분이 훨씬 작은 성분의 긴 구간에 의해 분리되면 잡음과 유사한 것이 아니라 오히려 음조에 유사한 것으로 간주될 수 있다. 또 다른 방식은 예측 필터를 서브대역 신호에 적용하여 예측 이득을 결정한다. 큰 예측 이득은 신호가 음조와 매우 유사하다라는 것을 표시하는 경향이 있다.
음조의 표시는 성분 합성기(26)로 통과되는데, 이 성분 합성기는 합성된 스펙트럼 성분이 적절한 음조 레벨을 갖도록 합성을 제어한다. 이는 음-형 및 잡음-형 합성된 성분의 가중된 조합을 형성함으로써 행해져 소망의 음조 레벨을 성취하도록 한다.
e) 일시적 정형
서브대역 신호로 표시되는 신호의 일시적 정형은 서브대역 신호로부터 직접 추정될 수 있다. 일시적-성형 추정기의 한 가지 구현방식을 위한 기술적인 근거는 식 1로 표시되는 선형 시스템과 관련하여 설명될 수 있다.
y(t) = h(t)ㆍx(t) (1)
여기서 y(t)=추정될 일시적 정형을 갖는 신호;
h(t)=신호 y(t)의 일시적 정형;
도트 심볼(ㆍ)은 승산을 표시하며;
x(t)=신호 y(t)의 일시적으로-플랫한 버젼
이 식은 다음과 같이 재기록될 수 있다.
Y[k]=H[k]*X[k] (2)
여기서 Y[k]=신호 y(t)의 주파수-도메인 표현;
H[k]=h(t)의 주파수-도메인 표현;
스타 심볼(*)은 컨볼루션을 표시하며;
X[k]=신호 x(t)의 주파수-도메인 표현
주파수-도메인 표현 Y[k]는 디코더(24)에 의해 얻어진 하나 이상의 서브대역 신호에 대응한다. 분석기(25)는 Y[k] 및 X[k]의 자동회귀 이동 평균(ARMA) 모델로부터 도출된 수학식의 세트를 풀음으로써 일시적 정형 h(t)의 주파수-도메인 표현 H[k]의 추정치를 구할 수 있다. ARMA 모델의 사용에 관한 부가적인 정보는 Proakis 및 Manolakis의 "Digital Signal Processing: Principles, Algorithms and Applications," MacMillan Publishing Co., New York, 1988.로부터 얻을 수 있다. 특히 pp.818-821을 참조하라.
주파수-도메인 표현 Y[k]은 변환 계수의 블록으로 배열된다. 변환 계수의 각 블록은 신호 y(t)의 단시간 스펙트럼을 표현한다. 주파수-도메인 표현 X[k]은 또한, 블록으로 배열된다. 주파수-도메인 표현 X[k]에서 각 계수 블록은 와이드 센스 스테이션어리(wide sense statioary)로 가정되는 일시적으로-플랫한 신호 x(t)를 위한 샘플 블록을 표시한다. 또한, X[k] 표현의 각 블록 내의 계수가 독립적으로 분포되었다라고 가정하자. 이들 가정이 제공되면, 이 신호는 다음과 같은 ARMA로 표현될 수 있다.
Figure 112004059658102-pct00001
(3)
여기서 L=ARMA 모델의 자동회귀 부분의 길이;
Q=ARAM 모델의 이동 평균 부분의 길이,
수학식 3은 Y[k]의 자동상관에 대해 풀음으로써 al 및 bq에 대해 풀을 수 있다:
Figure 112004059658102-pct00002
(4)
여기서 E{}는 예측값 함수를 표시한다.
수학식 4는 다음과 같이 재기록될 수 있다.
Figure 112004059658102-pct00003
(5)
여기서 RYY[n]은 Y[n]의 자동상관을 표시하고;
RXY[k]는 Y[k] 및 X[k]의 교차상관을 표시한다.
H[k]로 표시되는 선형 시스템이 단지 자동회귀라고 가정하면, 수학식 5의 우측상의 제2 항은 무시될 수 있다. 이로 인해 수학식 5는 다음과 같이 재기록될 수 있다.
Figure 112004059658102-pct00004
(6)
이는 L 계수(ai)를 획득하기 위하여 풀어질 수 있는 L 선형 수학식 세트를 표시한다.
이 설명으로 인해, 지금부터, 주파수-도메인 기술을 사용하는 일시적-정형 추정기의 한가지 구현방식을 설명할 수 있다. 이 구현방식에서, 일시적-정형 추정기는 하나 이상의 서브대역 신호 y(t)의 주파수-도메인 표현 Y[k]를 수신하고 -L≤m≤L에 대한 자동상관 시퀀스 RYY[m]을 계산한다. 이들 값은 풀어질 선형 수학식의 세트를 설정하여 계수 ai를 구하는데 사용되는데, 이 계수는 아래의 수학식 7에서 보여지는 모든 선형-극 필터(FR)의 극을 표시한다.
Figure 112004059658102-pct00005
(7)
이 필터는 잡음-형 신호와 같은 임의의 일시적으로-플랫한 신호의 주파수-도메인 표현에 적용되어 신호 y(t)의 일시적 정형과 실질적으로 동일한 일시적 정형을 갖는 일시적으로-플랫한 신호의 버젼의 주파수-도메인 표현을 구한다.
필터(FR)의 극의 디스크립션은 성분 합성기로 통과될 수 있는데, 이 성분 합성기는 필터를 사용하여 소망의 일시적 정형을 갖는 신호를 표시하는 합성된 스펙트럼 성분을 발생시킨다.
2. 합성된 성분의 생성
성분 합성기(26)는 다양한 방식으로 합성된 스펙트럼 성분을 발생시킬 수 있다. 2가지 방식이 후술된다. 다수의 방식이 사용될 수 있다. 예를 들어, 여러가지 방식이 서브대역 신호로부터 도출되는 특성에 응답하여 또는 주파수 함수에 따라서 선택될 수 있다.
첫번째 방식은 잡음-형 신호를 발생시킨다. 예를 들어, 본질적으로, 임의의 광범위한 각종 시간-도메인 및 주파수-도메인 기술이 잡음-형 신호를 발생시키는데 사용될 수 있다.
두번째 방식은 하나 이상의 주파수 서브대역으로부터 스펙트럼 성분을 복제하는 스펙트럼 복제 또는 스펙트럼 해석이라 칭하는 주파수-도메인 기술을 사용한다. 보다 낮은 주파수 스펙트럼 성분은 통상적으로 보다 높은 주파수로 복제되는데, 그 이유는 어떤 방식에선 보다 높은 주파수 성분이 보다 낮은 주파수 성분과 관계되기 때문이다. 그러나, 원리적으로, 스펙트럼 성분은 보다 높거나 보다 낮은 주파수로 복제될 수 있다. 원하는 경우, 잡음은 부가되거나 변환된 성분과 혼합될 수 있고, 진폭은 원하는 경우 변경될 수 있다. 합성된 성분의 위상에서 불연속성을 제거 또는 적어도 감소시키기 위하여 필요에 따라서 조정이 행해질 수 있다.
스펙트럼 성분의 합성은 분석기(25)로부터 수신되는 정보에 의해 제어되어, 합성된 성분이 서브대역 신호로부터 얻어진 하나 이상의 특성을 갖도록 한다.
3. 신호 성분의 통합
합성된 스펙트럼 성분은 다양한 방식으로 서브대역 신호 스펙트럼 성분과 통합될 수 있다. 한 가지 방식은 상응하는 주파수를 표시하는 각 합성된 서브대역 성 분을 결합시킴으로써 디터(dither) 형태로서 합성된 성분을 사용하는 것이다. 또 다른 방식은 서브대역 신호에 존재하는 선택된 스펙트럼 성분을 하나 이상의 합성된 성분으로 대체하는 것이다. 또한 다른 방식은 합성된 성분을 서브대역 신호의 성분과 병합하여, 서브대역 신호에 존재하지 않는 스펙트럼 성분을 표시하는 것이다. 다양하게 조합된 이들 및 그외 다른 방식이 사용될 수 있다.
C. 송신기
상술된 본 발명의 양상은 본 발명의 특징 없이도 서브대역 신호를 수신하여 디코딩하는 수신기에 의해 필요로 되는 것을 넘어 임의의 제어 정보를 제공하는 송신기를 요구하지 않고도 수신기에서 실행될 수 있다. 본 발명의 이들 양상은 부가적인 제어 정보가 제공되면 향상될 수 있다. 한 가지 예가 후술된다.
어느 일시적 정형이 합성된 성분에 적용되는 정도는 엔코딩된 정보에 제공된제어 정보에 의해 적응될 수 있다. 이를 행하는 한 가지 방식은 이하의 수학식에서 보여주는 바와 같은 파라미터(β)를 사용하는 것이다.
Figure 112004059658102-pct00006
(8)
필터는 β=0일 때 일시적 정형을 제공하지 않는다. β=1일 때, 필터는 합성된 성분의 일시적 정형 및 서브대역 신호의 일시적 정형간의 상관이 최대가 되도록 일시적 정형 정도를 제공한다. β에 대한 다른 값은 중간 레벨의 일시적 정형을 제공한다.
한 가지 구현방식에서, 송신기는 수신기가 8개의 값들중 한 값으로 β를 설 정하도록 하는 제어 정보를 제공한다.
송신기는 수신기가 바람직할 수 있는 어떤 방식으로 성분 합성 공정을 적응시키도록 사용할 수 있는 다른 제어 정보를 제공한다.
D. 구현 방식
본 발명의 각종 양상은 범용 컴퓨터 시스템, 또는 범용 컴퓨터 시스템에서 발견되는 구성요소들과 유사한 구성요소들에 결합되는 디지털 신호 처리기(DSP) 회로와 같은 보다 특수한 구성요소를 포함하는 일부 다른 장치내의 소프트웨어를 포함한 다양한 방식으로 구현될 수 있다. 도3은 송신기 또는 수신기에서 본 발명의 각종 양상을 구현하는데 사용될 수 있는 장치(70)의 블록도이다. DSP(72)는 계산 자원을 제공한다. RAM(73)은 신호 처리를 위하여 DSP(72)에 의해 사용되는 시스템 랜덤 액세스 메모리(RAM)이다. ROM(74)은 장치(70)를 동작시켜 본 발명의 각종 양상을 실행하는데 필요로 되는 프로그램을 저장하기 위하여 판독 전용 메모리(ROM)와 같은 어떤 형태의 영구 저장장치를 표시한다. I/O 제어장치(75)는 통신 채널(76, 77)에 의해 신호를 수신하여 전송하는 인터페이스 회로를 표시한다. 아날로그-디지털 변환기 및 디지털-아날로그 변환기는 원하는 경우 I/O 제어 장치(75)에 포함되어 아날로그 오디오 신호를 수신 및/또는 전송한다. 도시된 실시예에서, 모든 주요한 시스템 구성요소들은 버스(71)에 접속되는데, 이 버스는 하나 이상의 물리적인 버스를 표시할 수 있지만, 버스 구조는 본 발명을 구현하는데 필요로 되지 않는다.
범용 컴퓨터 시스템에서 구현되는 실시예에서, 부가적인 구성요소들은 키보 드 또는 마우스 및 디스플레이와 같이 장치에 인터페이스하고 자기 테이프 또는 디스크와 같은 저장 매체 또는 광학 매체를 갖는 저장 장치를 제어하기 위하여 포함될 수 있다. 이 저장 매체는 응용, 유틸리티, 및 시스템을 운영하기 위한 명령의 프로그램을 기록하는데 사용될 수 있고, 본 발명의 각종 양상을 구현하는 프로그램의 실시예를 포함할 수 있다.
본 발명의 각종 양상을 실시하는데 필요로 되는 기능은 이산 논리 구성요소, 하나 이상의 ASICs 및/또는 프로그램-제어된 프로세서를 포함한 광범위한 다양한 방식으로 구현되는 구성요소들에 의해 수행될 수 있다. 이들 구성요소를 구현하는 방식은 본 발명에 중요하지 않다.
본 발명의 소프트웨어 구현방식은 초음파로부터 자외선 주파수까지의 스펙트럼에 걸쳐서 기저대 또는 변조된 통신 경로와 같은 다양한 기계 판독가능한 매체 또는 자기 테이프, 자기 디스크 및 광 디스크를 포함한 본질적으로 모든 자기 또는 광 기록 기술을 사용하여 정보를 전달하는 매체를 포함한 저장 매체에 의해 이루어질 수 있다. 각종 형태의 ROM 또는 RAM 및 이외 다른 기술에서 구현되는 프로그램에 의해 제어되는 마이크로프로세서, 범용 집적회로, ASIC와 같은 처리 회로에 의해 컴퓨터 시스템(70)의 각종 구성요소로 각종 양상들이 또한 구현될 수 있다.

Claims (30)

  1. 엔코딩된 오디오 정보를 처리하는 방법으로서,
    엔코딩된 오디오 정보를 수신하고, 오디오 신호의 모든 스펙트럼 내용(spectral content)이 아닌 일부 스펙트럼 내용을 표시하는 서브밴드 신호를 상기 수신된 오디오 정보로부터 얻는 단계;
    상기 서브밴드 신호를 검사하여 상기 오디오 신호의 특성을 얻는 단계로서, 상기 특성은 사이코아쿠스틱 마스킹 효과(psychoacoustic masking effects), 음조(tonality) 및 일시적 정형(temporal shape) 중 하나 이상인 단계;
    상기 오디오 신호의 상기 특성을 가진 합성된 스펙트럼 성분을 발생시키는 단계;
    상기 합성된 스펙트럼 성분을 상기 서브밴드 신호와 통합하여 한 세트의 변경된 서브대역 신호를 발생시키는 단계; 및
    상기 한 세트의 변경된 서브대역 신호에 합성 필터뱅크(synthesis filterbank)를 적용함으로써 상기 오디오 정보를 발생시키는 단계;
    를 포함하는 엔코딩된 오디오 정보 처리 방법.
  2. 제1항에 있어서, 상기 특성은 일시적 정형이고, 상기 방법은 스펙트럼 성분을 발생시키고 상기 일시적 정형의 주파수-도메인 표현으로 상기 발생된 스펙트럼 성분을 컨볼빙함으로써 상기 일시적 정형을 갖도록 상기 합성된 스펙트럼 성분을 발생시키는 엔코딩된 오디오 정보 처리 방법.
  3. 제2항에 있어서, 상기 서브대역 신호의 적어도 일부 성분의 자동상관 함수를 계산함으로써 상기 일시적 정형을 얻는 엔코딩된 오디오 정보 처리 방법.
  4. 제1항에 있어서, 상기 특성은 일시적 정형이고, 상기 방법은 스펙트럼 성분을 발생시키고 상기 발생된 스펙트럼 성분의 적어도 일부에 필터를 적용함으로써 상기 일시적 정형을 갖도록 상기 합성된 스펙트럼 성분을 발생시키는 엔코딩된 오디오 정보 처리 방법.
  5. 제4항에 있어서, 상기 엔코딩된 정보로부터 제어 정보를 얻고 상기 제어 정보에 응답하여 상기 필터를 적응시키는 엔코딩된 오디오 정보 처리 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 합성된 스펙트럼 성분을 상기 서브대역 신호의 성분과 병합함으로써 변경된 서브대역 신호의 세트를 발생시키는 엔코딩된 오디오 정보 처리 방법.
  7. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 합성된 스펙트럼 성분을 각각의 서브대역 신호의 성분과 결합함으로써 상기 변경된 서브대역 신호의 세트를 발생시키는 엔코딩된 오디오 정보 처리 방법.
  8. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 서브대역 신호의 각각의 성분을 상기 합성된 스펙트럼 성분으로 대체함으로써 상기 변경된 서브대역 신호의 세트를 발생시키는 엔코딩된 오디오 정보 처리 방법.
  9. 제1항 내지 제5항 중 어느 한 항에 있어서,
    스펙트럼의 제1 부분에서 하나 이상의 서브대역 신호의 성분을 검사함으로써 상기 오디오 신호의 특성을 얻는 단계; 및,
    합성된 서브대역 신호를 형성하기 위하여 상기 스펙트럼의 제1 부분 내의 상기 서브대역 신호의 하나 이상의 성분을 스펙트럼의 제2 부분으로 복제하고 상기 합성된 서브대역 신호가 상기 오디오 신호의 특성을 갖도록 상기 복제된 성분을 변경함으로써 상기 합성된 스펙트럼 성분을 발생시키는 단계를 포함하는 엔코딩된 오디오 정보 처리 방법.
  10. 엔코딩된 오디오 정보를 처리하는 방법을 수행하기 위해 컴퓨터에 의해 실행되는 명령들의 프로그램을 기록한 컴퓨터 판독가능 매체로서, 상기 방법은,
    엔코딩된 오디오 정보를 수신하고, 오디오 신호의 모든 스펙트럼 내용이 아닌 일부 스펙트럼 내용을 표시하는 서브밴드 신호를 상기 수신된 오디오 정보로부터 얻는 단계;
    상기 서브밴드 신호를 검사하여 상기 오디오 신호의 특성을 얻는 단계로서, 상기 특성은 사이코아쿠스틱 마스킹 효과, 음조 및 일시적 정형 중 하나 이상인 단계;
    상기 오디오 신호의 상기 특성을 가진 합성된 스펙트럼 성분을 발생시키는 단계;
    상기 합성된 스펙트럼 성분을 상기 서브밴드 신호와 통합하여 한 세트의 변경된 서브대역 신호를 발생시키는 단계; 및
    상기 한 세트의 변경된 서브대역 신호에 합성 필터뱅크를 적용함으로써 상기 오디오 정보를 발생시키는 단계;
    를 포함하는 컴퓨터 판독가능 매체.
  11. 제10항에 있어서, 상기 특성은 일시적인 정형이고, 상기 방법은 스펙트럼 성분을 발생시키고 상기 일시적 정형의 주파수 도메인으로 상기 발생된 스펙트럼 성분을 컨볼빙함으로써 상기 일시적 정형을 갖도록 상기 합성된 스펙트럼 성분을 발생시키는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  12. 제11항에 있어서, 상기 방법은 상기 서브대역 신호의 적어도 일부 성분의 자동상관 함수를 계산함으로써 일시적 정형을 얻는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  13. 제10항에 있어서, 상기 특성은 일시적 정형이고, 상기 방법은 스펙트럼 성분을 발생시키고 상기 발생된 스펙트럼 성분의 적어도 일부에 필터를 적용함으로써 상기 일시적 정형을 갖도록 상기 합성된 스펙트럼 성분을 발생시키는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  14. 제13항에 있어서, 상기 방법은 상기 엔코딩된 정보로부터 제어 정보를 얻고 상기 제어 정보에 응답하여 상기 필터를 적응시키는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  15. 제10항 내지 제14항 중 어느 한 항에 있어서, 상기 방법은 상기 합성된 스펙트럼 성분을 상기 서브대역 신호의 성분과 병합함으로써 상기 변경된 서브대역 신호의 세트를 발생시키는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  16. 제10항 내지 제14항 중 어느 한 항에 있어서, 상기 방법은 상기 서브대역 신호의 각 성분과 상기 합성된 스펙트럼 성분을 결합함으로써 상기 변경된 서브대역 신호의 세트를 발생시키는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  17. 제10항 내지 제14항 중 어느 한 항에 있어서, 상기 방법은 상기 서브대역 신호의 각 성분을 상기 합성된 스펙트럼 성분으로 치환함으로써 상기 변경된 서브대역 신호의 세트를 발생시키는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  18. 제10항 내지 제14항 중 어느 한 항에 있어서, 상기 방법은,
    스펙트럼의 제1 부분 내의 하나 이상의 서브대역 신호의 성분을 검사함으로써 상기 오디오 신호의 특성을 얻는 단계; 및
    합성된 서브대역 신호를 형성하기 위하여 상기 스펙트럼의 제1 부분 내의 하나 이상의 서브대역 신호의 성분을 스펙트럼의 제2 부분으로 복제하고 상기 합성된 서브대역 신호가 상기 오디오 신호의 특성을 갖도록 상기 복제된 성분을 변경함으로써 상기 합성된 스펙트럼 성분을 발생시키는 단계;
    를 포함하는 것을 특징으로 하는 컴퓨터 판독가능 매체.
  19. 엔코딩된 오디오 정보를 처리하는 장치로서,
    상기 장치는, 엔코딩된 오디오 정보를 수신하는 입력 단말기; 메모리; 및 상기 입력 단말기와 상기 메모리에 연결되는 처리 회로;를 포함하고,
    상기 처리 회로는,
    상기 엔코딩된 오디오 정보를 수신하고, 오디오 신호의 모든 스펙트럼 내용이 아닌 일부 스펙트럼 내용을 표시하는 서브밴드 신호를 상기 수신된 오디오 정보로부터 얻고;
    상기 서브밴드 신호를 검사하여 상기 오디오 신호의 특성을 얻는데, 상기 특성은 사이코아쿠스틱 마스킹 효과, 음조 및 일시적 정형 중 하나 이상이고;
    상기 오디오 신호의 상기 특성을 가진 합성된 스펙트럼 성분을 발생시키고;
    상기 합성된 스펙트럼 성분을 상기 서브밴드 신호와 통합하여 한 세트의 변경된 서브대역 신호를 발생시키고; 및
    상기 한 세트의 변경된 서브대역 신호에 합성 필터뱅크를 적용함으로써 상기 오디오 정보를 발생시킴;
    을 특징으로 하는 엔코딩된 오디오 정보 처리 장치.
  20. 제19항에 있어서, 상기 특성은 일시적 정형이고, 상기 처리 회로는 스펙트럼 성분을 발생시키고 상기 일시적 정형의 주파수-도메인 표현으로 상기 발생된 스펙트럼 성분을 컨볼빙함으로써 상기 일시적 정형을 갖도록 상기 합성된 스펙트럼 성분을 발생시키도록 적응되는 엔코딩된 오디오 정보 처리 장치.
  21. 제20항에 있어서, 상기 처리 회로는 상기 서브대역 신호의 적어도 일부 성분의 자동상관 함수를 계산함으로써 상기 일시적 정형을 얻도록 적응되는 엔코딩된 오디오 정보 처리 장치.
  22. 제19항에 있어서, 상기 특성은 일시적 정형이고, 상기 처리 회로는 스펙트럼 성분을 발생시키고 필터를 상기 발생된 스펙트럼 성분의 적어도 일부에 적용함으로써 상기 일시적 정형을 갖도록 상기 합성된 스펙트럼 성분을 발생시키도록 적응되는 엔코딩된 오디오 정보 처리 장치.
  23. 제22항에 있어서, 상기 처리 회로는 상기 엔코딩된 정보로부터 제어 정보를 얻고 상기 제어 정보에 응답하여 상기 필터를 적응시키도록 적응되는 엔코딩된 오디오 정보 처리 장치.
  24. 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 처리 회로는 상기 합성된 스펙트럼 성분을 상기 서브대역 신호의 성분과 병합함으로써 변경된 서브대역 신호의 세트를 발생시키도록 적응되는 엔코딩된 오디오 정보 처리 장치.
  25. 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 처리 회로는 상기 합성된 스펙트럼 성분을 상기 서브대역 신호의 각 성분과 결합함으로써 상기 변경된 서브대역 신호의 세트를 발생시키도록 적응되는 엔코딩된 오디오 정보 처리 장치.
  26. 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 처리 회로는 상기 서브대역 신호의 각 성분을 상기 합성된 스펙트럼 성분으로 대체함으로써 상기 변경된 서브대역 신호 세트를 발생시키도록 적응되는 엔코딩된 오디오 정보 처리 장치.
  27. 제19항 내지 제23항 중 어느 한 항에 있어서, 상기 처리 회로는:
    스펙트럼의 제1 부분 내의 하나 이상의 서브대역 신호의 성분을 검사함으로써 상기 오디오 신호의 특성을 얻으며; 및,
    합성된 서브대역 신호를 형성하기 위하여 상기 스펙트럼의 제1 부분 내의 하나 이상의 서브대역 신호의 성분을 스펙트럼의 제2 부분으로 복제하고 상기 합성된 서브대역 신호가 상기 오디오 신호의 특성을 갖도록 상기 복제된 성분을 변경함으로써 상기 합성된 스펙트럼 성분을 발생시키는 엔코딩된 오디오 정보 처리 장치.
  28. 삭제
  29. 삭제
  30. 삭제
KR1020047020587A 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템 KR100986150B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US10/174,493 US7447631B2 (en) 2002-06-17 2002-06-17 Audio coding system using spectral hole filling
US10/174,493 2002-06-17
US10/238,047 US7337118B2 (en) 2002-06-17 2002-09-06 Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US10/238,047 2002-09-06
PCT/US2003/018065 WO2003107329A1 (en) 2002-06-01 2003-06-09 Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR1020107013897A Division KR100986152B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
KR1020107013899A Division KR100986153B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템

Publications (2)

Publication Number Publication Date
KR20050010950A KR20050010950A (ko) 2005-01-28
KR100986150B1 true KR100986150B1 (ko) 2010-10-07

Family

ID=29733607

Family Applications (5)

Application Number Title Priority Date Filing Date
KR1020047020570A KR100991448B1 (ko) 2002-06-17 2003-05-30 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
KR1020107009429A KR100991450B1 (ko) 2002-06-17 2003-05-30 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
KR1020107013899A KR100986153B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
KR1020107013897A KR100986152B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
KR1020047020587A KR100986150B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템

Family Applications Before (4)

Application Number Title Priority Date Filing Date
KR1020047020570A KR100991448B1 (ko) 2002-06-17 2003-05-30 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
KR1020107009429A KR100991450B1 (ko) 2002-06-17 2003-05-30 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템
KR1020107013899A KR100986153B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
KR1020107013897A KR100986152B1 (ko) 2002-06-17 2003-06-09 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템

Country Status (20)

Country Link
US (4) US7447631B2 (ko)
EP (6) EP1736966B1 (ko)
JP (6) JP4486496B2 (ko)
KR (5) KR100991448B1 (ko)
CN (1) CN100369109C (ko)
AT (7) ATE536615T1 (ko)
CA (6) CA2736046A1 (ko)
DE (3) DE60310716T8 (ko)
DK (3) DK1514261T3 (ko)
ES (1) ES2275098T3 (ko)
HK (6) HK1070729A1 (ko)
IL (2) IL165650A (ko)
MX (1) MXPA04012539A (ko)
MY (2) MY159022A (ko)
PL (1) PL208344B1 (ko)
PT (1) PT2216777E (ko)
SG (3) SG177013A1 (ko)
SI (2) SI2209115T1 (ko)
TW (1) TWI352969B (ko)
WO (1) WO2003107328A1 (ko)

Families Citing this family (144)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
DE10134471C2 (de) * 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP2005532586A (ja) * 2002-07-08 2005-10-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ処理
US7889783B2 (en) * 2002-12-06 2011-02-15 Broadcom Corporation Multiple data rate communication system
EP1629463B1 (en) 2003-05-28 2007-08-22 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
RU2381571C2 (ru) * 2004-03-12 2010-02-10 Нокиа Корпорейшн Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
EP3336843B1 (en) * 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
KR20070012832A (ko) * 2004-05-19 2007-01-29 마츠시타 덴끼 산교 가부시키가이샤 부호화 장치, 복호화 장치 및 이들의 방법
EP1782419A1 (en) * 2004-08-17 2007-05-09 Koninklijke Philips Electronics N.V. Scalable audio coding
US20090182563A1 (en) * 2004-09-23 2009-07-16 Koninklijke Philips Electronics, N.V. System and a method of processing audio data, a program element and a computer-readable medium
CN101048935B (zh) 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
KR100707173B1 (ko) * 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US7546240B2 (en) 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US8121848B2 (en) * 2005-09-08 2012-02-21 Pan Pacific Plasma Llc Bases dictionary for low complexity matching pursuits data coding and decoding
US20070053603A1 (en) * 2005-09-08 2007-03-08 Monro Donald M Low complexity bases matching pursuits data coding and decoding
US7813573B2 (en) * 2005-09-08 2010-10-12 Monro Donald M Data coding and decoding with replicated matching pursuits
US7848584B2 (en) * 2005-09-08 2010-12-07 Monro Donald M Reduced dimension wavelet matching pursuits coding and decoding
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
EP2002426B1 (en) 2006-04-04 2009-09-02 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the mdct domain
JP2009534713A (ja) * 2006-04-24 2009-09-24 ネロ アーゲー 低減ビットレートを有するデジタル音声データを符号化するための装置および方法
ATE493794T1 (de) 2006-04-27 2011-01-15 Dolby Lab Licensing Corp Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke
US20070270987A1 (en) * 2006-05-18 2007-11-22 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
JP4940308B2 (ja) 2006-10-20 2012-05-30 ドルビー ラボラトリーズ ライセンシング コーポレイション リセットを用いるオーディオダイナミクス処理
US8521314B2 (en) 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
AU2012261547B2 (en) * 2007-03-09 2014-04-17 Skype Speech coding system and method
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
WO2009011827A1 (en) 2007-07-13 2009-01-22 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
CA2698031C (en) 2007-08-27 2016-10-18 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for noise filling
JP5183741B2 (ja) 2007-08-27 2013-04-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充と帯域拡張との間の遷移周波数の適合
ATE501506T1 (de) * 2007-09-12 2011-03-15 Dolby Lab Licensing Corp Spracherweiterung mit anpassung von geräuschpegelschätzungen
JP5302968B2 (ja) * 2007-09-12 2013-10-02 ドルビー ラボラトリーズ ライセンシング コーポレイション 音声明瞭化を伴うスピーチ改善
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
WO2009084918A1 (en) * 2007-12-31 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2410522B1 (en) * 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for encoding an audio signal and computer program
PL3246918T3 (pl) * 2008-07-11 2023-11-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio, sposób dekodowania sygnału audio oraz program komputerowy
CN102099855B (zh) * 2008-08-08 2012-09-26 松下电器产业株式会社 频谱平滑化装置、编码装置、解码装置、通信终端装置、基站装置以及频谱平滑化方法
WO2010028297A1 (en) 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010053287A2 (en) * 2008-11-04 2010-05-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
TWI716833B (zh) * 2009-02-18 2021-01-21 瑞典商杜比國際公司 用於高頻重建或參數立體聲之複指數調變濾波器組
TWI597938B (zh) * 2009-02-18 2017-09-01 杜比國際公司 低延遲調變濾波器組
KR101078378B1 (ko) * 2009-03-04 2011-10-31 주식회사 코아로직 오디오 부호화기의 양자화 방법 및 장치
EP2555191A1 (en) * 2009-03-31 2013-02-06 Huawei Technologies Co., Ltd. Method and device for audio signal denoising
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
EP2491553B1 (en) * 2009-10-20 2016-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an iterative interval size reduction
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
CN102792370B (zh) 2010-01-12 2014-08-06 弗劳恩霍弗实用研究促进协会 使用描述有效状态值及区间边界的散列表的音频编码器、音频解码器、编码音频信息的方法及解码音频信息的方法
EP4250290A1 (en) 2010-01-19 2023-09-27 Dolby International AB Improved subband block based harmonic transposition
TWI557723B (zh) 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
JPWO2011121955A1 (ja) * 2010-03-30 2013-07-04 パナソニック株式会社 オーディオ装置
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US20130173275A1 (en) * 2010-10-18 2013-07-04 Panasonic Corporation Audio encoding device and audio decoding device
CN103443856B (zh) * 2011-03-04 2015-09-09 瑞典爱立信有限公司 音频编码中的后量化增益校正
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
US9015042B2 (en) * 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
EP2684190B1 (en) 2011-03-10 2015-11-18 Telefonaktiebolaget L M Ericsson (PUBL) Filling of non-coded sub-vectors in transform coded audio signals
US8706509B2 (en) * 2011-04-15 2014-04-22 Telefonaktiebolaget L M Ericsson (Publ) Method and a decoder for attenuation of signal regions reconstructed with low accuracy
TWI562133B (en) 2011-05-13 2016-12-11 Samsung Electronics Co Ltd Bit allocating method and non-transitory computer-readable recording medium
US9264094B2 (en) * 2011-06-09 2016-02-16 Panasonic Intellectual Property Corporation Of America Voice coding device, voice decoding device, voice coding method and voice decoding method
JP2013007944A (ja) 2011-06-27 2013-01-10 Sony Corp 信号処理装置、信号処理方法、及び、プログラム
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
WO2013188562A2 (en) * 2012-06-12 2013-12-19 Audience, Inc. Bandwidth extension via constrained synthesis
EP2717263B1 (en) * 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
CN103854653B (zh) 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
BR112015017748B1 (pt) * 2013-01-29 2022-03-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Preenchimento de ruído na codificação de áudio de transformada perceptual
BR112015018050B1 (pt) 2013-01-29 2021-02-23 Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. Quantização de sinal de áudio de tonalidade adaptativa de baixacomplexidade
KR102072365B1 (ko) 2013-04-05 2020-02-03 돌비 인터네셔널 에이비 고급 양자화기
JP6157926B2 (ja) * 2013-05-24 2017-07-05 株式会社東芝 音声処理装置、方法およびプログラム
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
EP2830063A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
RU2764260C2 (ru) 2013-12-27 2022-01-14 Сони Корпорейшн Устройство и способ декодирования
EP2919232A1 (en) * 2014-03-14 2015-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and method for encoding and decoding
JP6035270B2 (ja) 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
RU2572664C2 (ru) * 2014-06-04 2016-01-20 Российская Федерация, От Имени Которой Выступает Министерство Промышленности И Торговли Российской Федерации Устройство активного гашения вибрации
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
MA40417A (fr) 2014-08-08 2017-06-14 Raffaele Migliaccio Mélange d'acides gras et de palmitoyl éthanolamide pour utilisation dans le traitement de pathologies inflammatoires et allergiques
WO2016040885A1 (en) 2014-09-12 2016-03-17 Audience, Inc. Systems and methods for restoration of speech components
WO2016072628A1 (ko) * 2014-11-07 2016-05-12 삼성전자 주식회사 오디오 신호를 복원하는 방법 및 장치
US9691408B2 (en) 2014-12-16 2017-06-27 Psyx Research, Inc. System and method for dynamic equalization of audio data
CN107210824A (zh) 2015-01-30 2017-09-26 美商楼氏电子有限公司 麦克风的环境切换
TWI693594B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
US20170024495A1 (en) * 2015-07-21 2017-01-26 Positive Grid LLC Method of modeling characteristics of a musical instrument
RU2714365C1 (ru) * 2016-03-07 2020-02-14 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ гибридного маскирования: комбинированное маскирование потери пакетов в частотной и временной области в аудиокодеках
DE102016104665A1 (de) 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
WO2018106088A1 (ko) * 2016-12-09 2018-06-14 주식회사 엘지화학 밀봉재 조성물
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
EP3544005B1 (en) 2018-03-22 2021-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding with dithered quantization
CN114242089A (zh) 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
AU2019258524B2 (en) 2018-04-25 2024-03-28 Dolby International Ab Integration of high frequency audio reconstruction techniques
WO2023117145A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using different noise filling methods
TW202333143A (zh) * 2021-12-23 2023-08-16 弗勞恩霍夫爾協會 在音訊寫碼中使用濾波用於頻譜時間改善頻譜間隙填充之方法及設備
TW202334940A (zh) * 2021-12-23 2023-09-01 紐倫堡大學 在音訊寫碼中使用不同雜訊填充方法進行頻譜時間上改良之頻譜間隙填充之方法及設備
WO2023117146A1 (en) * 2021-12-23 2023-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for spectrotemporally improved spectral gap filling in audio coding using a filtering

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US36478A (en) * 1862-09-16 Improved can or tank for coal-oil
US3995115A (en) * 1967-08-25 1976-11-30 Bell Telephone Laboratories, Incorporated Speech privacy system
US3684838A (en) * 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
WO1986003873A1 (en) * 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US4790016A (en) * 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
US4885790A (en) 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
DE3683767D1 (de) * 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
JPH02183630A (ja) * 1989-01-10 1990-07-18 Fujitsu Ltd 音声符号化方式
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
KR100228688B1 (ko) * 1991-01-08 1999-11-01 쥬더 에드 에이. 다차원 음장용 인코우더/디코우더
JP3134337B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル信号符号化方法
EP0551705A3 (en) * 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
JP2563719B2 (ja) 1992-03-11 1996-12-18 技術研究組合医療福祉機器研究所 音声加工装置と補聴器
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
US5402124A (en) * 1992-11-25 1995-03-28 Dolby Laboratories Licensing Corporation Encoder and decoder with improved quantizer using reserved quantizer level for small amplitude signals
US5394466A (en) * 1993-02-16 1995-02-28 Keptel, Inc. Combination telephone network interface and cable television apparatus and cable television module
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JPH07225598A (ja) 1993-09-22 1995-08-22 Massachusetts Inst Of Technol <Mit> 動的に決定された臨界帯域を用いる音響コード化の方法および装置
JP3186489B2 (ja) * 1994-02-09 2001-07-11 ソニー株式会社 ディジタル信号処理方法及び装置
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
US5758315A (en) * 1994-05-25 1998-05-26 Sony Corporation Encoding/decoding method and apparatus using bit allocation as a function of scale factor
US5748786A (en) * 1994-09-21 1998-05-05 Ricoh Company, Ltd. Apparatus for compression using reversible embedded wavelets
JP3254953B2 (ja) 1995-02-17 2002-02-12 日本ビクター株式会社 音声高能率符号化装置
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
JPH08328599A (ja) * 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
DE69620967T2 (de) * 1995-09-19 2002-11-07 At & T Corp Synthese von Sprachsignalen in Abwesenheit kodierter Parameter
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
US6138051A (en) * 1996-01-23 2000-10-24 Sarnoff Corporation Method and apparatus for evaluating an audio decoder
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
JP3519859B2 (ja) * 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
JPH1091199A (ja) * 1996-09-18 1998-04-10 Mitsubishi Electric Corp 記録再生装置
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
JP3213582B2 (ja) * 1997-05-29 2001-10-02 シャープ株式会社 画像符号化装置及び画像復号装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
CN1144179C (zh) * 1997-07-11 2004-03-31 索尼株式会社 声音信号解码方法和装置、声音信号编码方法和装置
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP2000148191A (ja) * 1998-11-06 2000-05-26 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化装置
US6300888B1 (en) * 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
WO2000063886A1 (en) * 1999-04-16 2000-10-26 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for audio coding
FR2807897B1 (fr) * 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
JP2001324996A (ja) * 2000-05-15 2001-11-22 Japan Music Agency Co Ltd Mp3音楽データ再生方法及び装置
JP3616307B2 (ja) * 2000-05-22 2005-02-02 日本電信電話株式会社 音声・楽音信号符号化方法及びこの方法を実行するプログラムを記録した記録媒体
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP2001343998A (ja) * 2000-05-31 2001-12-14 Yamaha Corp ディジタルオーディオデコーダ
JP3538122B2 (ja) 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
GB0103245D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of inserting additional data into a compressed signal
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling

Also Published As

Publication number Publication date
HK1070728A1 (en) 2005-06-24
MY159022A (en) 2016-11-30
ATE529859T1 (de) 2011-11-15
JP2010156990A (ja) 2010-07-15
IL216069A0 (en) 2011-12-29
EP2216777B1 (en) 2011-12-07
CA2489441C (en) 2012-04-10
US20090138267A1 (en) 2009-05-28
JP5705273B2 (ja) 2015-04-22
TW200404273A (en) 2004-03-16
CA2735830A1 (en) 2003-12-24
CA2735830C (en) 2014-04-08
JP2012212167A (ja) 2012-11-01
US20030233234A1 (en) 2003-12-18
US8032387B2 (en) 2011-10-04
IL165650A (en) 2010-11-30
JP5253564B2 (ja) 2013-07-31
KR20100063141A (ko) 2010-06-10
PL372104A1 (en) 2005-07-11
ES2275098T3 (es) 2007-06-01
PT2216777E (pt) 2012-03-16
EP2216777A1 (en) 2010-08-11
CA2736065C (en) 2015-02-10
ATE470220T1 (de) 2010-06-15
JP2013214103A (ja) 2013-10-17
KR100991448B1 (ko) 2010-11-04
ATE529858T1 (de) 2011-11-15
MY136521A (en) 2008-10-31
JP5345722B2 (ja) 2013-11-20
CA2736065A1 (en) 2003-12-24
CN100369109C (zh) 2008-02-13
KR20100086068A (ko) 2010-07-29
ATE473503T1 (de) 2010-07-15
EP1514261B1 (en) 2006-12-27
CA2736060A1 (en) 2003-12-24
JP2005530205A (ja) 2005-10-06
KR100991450B1 (ko) 2010-11-04
HK1070729A1 (en) 2005-06-24
MXPA04012539A (es) 2005-04-28
CA2489441A1 (en) 2003-12-24
JP5253565B2 (ja) 2013-07-31
EP2207170B1 (en) 2011-10-19
HK1146146A1 (en) 2011-05-13
DK2207169T3 (da) 2012-02-06
SG10201702049SA (en) 2017-04-27
CA2736060C (en) 2015-02-17
TWI352969B (en) 2011-11-21
CN1662958A (zh) 2005-08-31
EP2207169A1 (en) 2010-07-14
EP1736966A2 (en) 2006-12-27
JP2012103718A (ja) 2012-05-31
CA2736046A1 (en) 2003-12-24
DE60332833D1 (de) 2010-07-15
EP1736966B1 (en) 2010-07-07
EP2209115B1 (en) 2011-09-28
KR20050010950A (ko) 2005-01-28
ATE536615T1 (de) 2011-12-15
US7447631B2 (en) 2008-11-04
ATE349754T1 (de) 2007-01-15
SI2209115T1 (sl) 2012-05-31
KR100986152B1 (ko) 2010-10-07
ATE526661T1 (de) 2011-10-15
DK1736966T3 (da) 2010-11-01
KR20050010945A (ko) 2005-01-28
KR20100086067A (ko) 2010-07-29
PL208344B1 (pl) 2011-04-29
DE60333316D1 (de) 2010-08-19
CA2736055A1 (en) 2003-12-24
EP2207169B1 (en) 2011-10-19
HK1141624A1 (en) 2010-11-12
US7337118B2 (en) 2008-02-26
IL216069A (en) 2015-11-30
DE60310716T2 (de) 2007-10-11
DK1514261T3 (da) 2007-03-19
EP2207170A1 (en) 2010-07-14
EP1736966A3 (en) 2007-11-07
US20030233236A1 (en) 2003-12-18
KR100986153B1 (ko) 2010-10-07
EP1514261A1 (en) 2005-03-16
SG2014005300A (en) 2016-10-28
SI2207169T1 (sl) 2012-05-31
JP4486496B2 (ja) 2010-06-23
JP2012078866A (ja) 2012-04-19
US20090144055A1 (en) 2009-06-04
AU2003237295A1 (en) 2003-12-31
DE60310716T8 (de) 2008-01-31
JP5063717B2 (ja) 2012-10-31
CA2736055C (en) 2015-02-24
EP2209115A1 (en) 2010-07-21
HK1141623A1 (en) 2010-11-12
SG177013A1 (en) 2012-01-30
US8050933B2 (en) 2011-11-01
DE60310716D1 (de) 2007-02-08
HK1146145A1 (en) 2011-05-13
WO2003107328A1 (en) 2003-12-24
IL165650A0 (en) 2006-01-15

Similar Documents

Publication Publication Date Title
KR100986150B1 (ko) 합성된 스펙트럼 성분을 적용하기 위하여 디코딩된 신호의 특성을 사용하는 오디오 코딩 시스템
US20080140405A1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
TWI463790B (zh) 用於信號分析與合成之適應性混成變換技術(一)
JP5302980B2 (ja) 複数の入力データストリームのミキシングのための装置
CN1838239B (zh) 一种用于增强信源解码器的设备及方法
EP2186087A1 (en) Improved transform coding of speech and audio signals
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JP3827720B2 (ja) 差分コーディング原理を用いる送信システム
Spanias et al. Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB
IL165648A (en) An audio coding system that uses decoded signal properties to coordinate synthesized spectral components
IL216068A (en) An audio broadcast system that uses decoded signal properties to coordinate synthesized spectral components

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130926

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140923

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150923

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160922

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170926

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180919

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20191001

Year of fee payment: 10