KR20070034481A - 반향 음향 신호를 코딩하는 방법 - Google Patents

반향 음향 신호를 코딩하는 방법 Download PDF

Info

Publication number
KR20070034481A
KR20070034481A KR1020067025693A KR20067025693A KR20070034481A KR 20070034481 A KR20070034481 A KR 20070034481A KR 1020067025693 A KR1020067025693 A KR 1020067025693A KR 20067025693 A KR20067025693 A KR 20067025693A KR 20070034481 A KR20070034481 A KR 20070034481A
Authority
KR
South Korea
Prior art keywords
audio signal
audio
signal
echo
encoded
Prior art date
Application number
KR1020067025693A
Other languages
English (en)
Other versions
KR101158717B1 (ko
Inventor
니콜 에이치. 반 쉬즌델
안드레아스 제이. 제리츠
코라도 보스카리노
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20070034481A publication Critical patent/KR20070034481A/ko
Application granted granted Critical
Publication of KR101158717B1 publication Critical patent/KR101158717B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

본 발명은 오디오 인코더와 디코더와 오디오 인코딩과 디코딩을 위한 방법에 관한 것이다. 인코더에서, 바람직하게 반향 시간 및 반향 진폭과 같은 소수의 파라미터만을 사용해서 표현함으로써, 오디오 신호는 울림이 없는 신호부와, 상기 오디오 신호와 연관된 반향 필드에 대한 정보로 나누어 진다. 그후, 울림이 없는 신호는 오디오 코덱을 사용해서 인코딩된다. 디코더에서, 울림이 없는 신호부는 오디오코덱을 사용해서 복원되고, 바람직하게 반향 필드 정보를 기반으로 생성된 룸(room) 임펄스 응답을 가지고 컨벌루션(convolution)하여, 반향 필드에 대한 정보에 따라 반향을 적용시켜 복원된 울림이 없는 신호부는 실질적으로 원래 오디오 신호로 변환된다. 본 발명에 따라, 수반된 오디오 코덱은 울림이 없는 오디오 신호만을 인코딩할 수 있어서, 반향 오디오 신호 상에서 불량한 성능을 제공하는 파라미터화된 오디오 코덱의 문제점을 해결한다.

Description

반향 음향 신호를 코딩하는 방법{CODING REVERBERANT SOUND SIGNALS}
본 발명은 오디오 신호 코딩의 분야에 관한 것이다. 특히, 본 발명은 반향 오디오 신호의 효과적인 코딩 분야에 관한 것이다. 본 발명은 인코더, 디코더, 인코딩과 디코딩을 위한 방법, 인코딩된 오디오 신호, 이러한 인코딩된 신호를 나타내는 데이터를 가진 저장 및 전송 매체와 인코더 및/또는 디코더를 구비한 오디오 디바이스에 관한 것이다.
반향은 소리가 기록되는 예를 들면, 콘서트 홀 같은 환경의 음향 효과에 의해 야기된다. 이것은 이런 환경에서 표면에 대한 반사로 이루어 진다. 결과적으로, 기록된 음향 신호는 직접적 "드라이(dry)" 오디오 신호를 포함할뿐만 아니라, 일련의 지연되고 감쇄된 반사를 포함한다. 즉, 반향 성분은 지연되고 감쇄된 버전의 직접 "드라이" 음향으로 이루어져 있어, 그 결과 반향 성분은 직접 신호와 상관된다. 여기서, "드라이" 수단은 "울림이 없는(anechoic)", 즉, 실질적으로 아무런 메아리나 반향이 포함하지 않는 것을 의미한다.
일부의 비-투명 음향 코덱은 상당한 양의 반향을 가진 음향 신호를 코딩함으로써 적절히 기능하지 않는다는 것, 즉, 코덱은 명확히 들을 수 있는 아티팩트(artefact)를 가진 음향 신호를 생성한다는 것이 이 실험을 통해 보여진다. 하지 만, 동일 음향 코덱은 매우 또는 순수하게 "드라이"한 신호, 즉, 추가된 반향이 없는 울림이 없는 환경 또는 인공적으로 생성된 음향에서 기록된 음향 신호를 가진 음향 신호상에서 잘 수행될 수 있다.
많은 응용에서, 반향은 음향 신호의 부정적인 특징이라고 고려된다. 예를 들면, 음성이 반향을 포함할 때, 자동 음성 인식 시스템의 성능이 감퇴되고, 통신 응용에서, 반향은 음성의 명료성과 품질에 부정적인 영향을 준다. 이 문제에 대한 하나의 해결책은 신호로부터 반향을 제거하기 위한 것, 즉, 반향-제거(de-reverberate)일 수 있는데, 이것은 또한 일부 시스템에서 수행되며(Basbug, 등, 2003), 명세서 말미의 참고 문헌의 목록이 참조된다.
고품질 오디오 코딩에서, 하지만, 상황이 다르다. 오디오 코딩은 투명성(transparency)을 지향하며, 따라서 반향도 또한 코딩될 필요가 있다. 또한, 음악에서 반향 성분은 신호의 중요한 부분이고, 이 성분을 갖는 오디오 신호는, 반향 성분을 갖지 않는 신호에 대해 선호되고, 반향 성분을 갖지 않는 이러한 신호는 "드라이"하게 또는 흐리게 들리고, 이 음향은 기록 환경의 상당한 개별적 특성이 부족하다.
종래 기술에서의 본 발명자들의 지식에 대해, 아무런 특별한 예방책도 음향 신호의 반향 성분을 코딩하기 위해 수행되지 않았고, 이것은 품질상의 문제를 초래할 수 있다.
오디오 코덱을 사용해서 고 품질로 반향 오디오 신호를 취급할 수 있는 방법과 오디오 인코더와 디코더를 제공하는 것이 본 발명의 목적이라고 볼 수 있다.
본 발명의 제1 측면에 따라, 이 목적은 오디오 신호를 인코딩하기 위해 적응된 오디오 인코더를 제공함으로써 달성되고, 오디오 인코더는:
- 오디오 신호를 실질적으로 울림이 없는 오디오 신호와 상기 오디오 신호와 연관된 반향 필드를 설명하는 정보로 분리시키기 위해 적응된 분리 수단과,
- 실질적으로 울림이 없는 오디오 신호를 제1 인코딩된 신호부로 인코딩하고, 반향 필드를 설명하는 정보를 제2 인코딩된 신호부로 인코딩하기 위해 적응된 인코더 수단을 포함한다.
분리 수단은 상기 오디오 신호를 울림이 없는, 즉 "드라이"한 부분과 오디오 신호와 관련이 있는 반향 양상에 대한 정보로 분리시키는 역할을 한다. 다른 말로 하면, 오디오 신호는 반향이 제거되고, 오디오 신호와 연관된 반향 필드를 설명하는 정보가 추출되는데, 즉, 이 정보는 반향의 실질적으로 투명한 재생성을 가능케 한다.
인코더 수단은 "드라이" 부분과 반향 부분을 분리적으로 취급한다. 따라서, "드라이" 부분을 인코딩하기 위한 오디오 코덱을 제1 인코딩된 신호 부분에 적용하는 것이 가능하며, 한편, 반향 부분은, 인코더에서 신호의 반향부를 실질적으로 재생성하기에 충분히 정확한 파리미터화된 설명과 같은, 반향을 설명하기에 적합한 완전히 다른 알고리즘에 따라 인코딩될 수 있다.
이것은 반향 음향 신호를 코딩하는 문제를 해결하면서, 오디오 코덱을 반향 성분을 코딩하는 작업으로부터 경감시켜준다. 대신에, 반향 오디오 신호의 반향부를 인코딩하기 위한 수단은 매우 제한된 수의 파라미터를 사용하는 원래의 오디오 신호의 반향부의 파라미터화된 설명을 기초로 한 반향 알고리즘을 포함할 수 있다. 효과로서, 파라미터화된 코덱은 단지 "드라이" 신호를 인코딩하기 위해서만 사용될 수 있는데, 이러한 코덱은 상기와 같은 신호를 위해 매우 적절하다. 이에 따라, 반향 오디오 신호의 반향부를 인코딩하기 위한 수단과 결합하여 오디오 코덱을 사용해서 반향 오디오 신호를 실질적으로 투명하게 인코딩하고 디코딩하는 것이 가능하다.
추가적으로, 인코딩 효율은 직접적으로 반향 음향 신호를 인코딩하는 것에 비교되어 증가된다. 이것은 제1 양상에 따른 인코더가 반향 필드에 의해 음향 신호에 도입된 상관을 최대한 이용하여, 보다 높은 효율을 초래하기 때문이다. 즉, 반향부에서의 잉여가 특별히 고려된다.
일 실시예에서, 인코더 수단은 파라미터화된 오디오 코덱에 따른 실질적으로 울림이 없는 오디오 신호를 인코딩하기 위해 적응될 수 있다(예, Schuijers et al., 2003). 다른 바람직한 실시예에서, 분리 수단은 우노키(Unoki)의 반향 제거(de-reverberation) 알고리즘을 상기 오디오 신호에 적용하기 위해 적응되어, 상기 오디오 신호를 실질적으로 울림이 없는 부분과 상기 반향 필드를 설명하는 정보로 분리시키기 위해 적응된다. 우노키의 반향 제거 알고리즘에 의해, M. Unoki, M. Furukawa, K. Sakata와 M. Akagi, "A Method based on the MFT Concept for dereverberatng the Power Envelope from the Reverberant Signal," in Proc. IEEE Int. Conf. on Acoust. Speech, Signal Processing, Hong Kong, China, April 6-19, Vol. I, pp. 840-843, 2003에서 설명된 반향-제거 원리가 이해된다. 이 논문은 여기서 참조로 병합된다.
본 발명의 제2 양상은 제1 부분과 제2 부분을 가진 인코딩된 오디오 신호로부터 오디오 신호를 재생성하기 위해 적응된 오디오 디코더를 제공하고, 상기 오디오 디코더는:
- 제1 인코딩된 신호부를 실질적으로 울림이 없는 오디오 신호로 디코딩하기 위해 적응된 디코더 수단으로서, 상기 디코더 수단은 제2 인코딩된 신호부로부터 상기 오디오 신호와 연관된 반향 필드를 설명하는 정보를 생성하기 위해 더 적응되는, 디코더 수단과,
- 상기 반향 필드를 설명하는 정보를 기반으로 반향을 상기 실질적으로 울림이 없는 오디오 신호에 추가하기 위해 적응된 변환 수단을 포함한다.
따라서, 제2 양상에 따른 오디오 디코더는 제1 양상에 따른 오디오 인코더로부터 인코딩된 신호를 디코딩하기 위해 적응되고, 따라서 인코더/디코더 시스템을 형성한다.
디코더 수단에서, "드라이" 신호가 재구성된다. 그러면 반향은 반향 정보를 기초로 하여 변환 수단에 의해 "드라이" 신호에 추가된다. 이것은 소수의 파라미터를 기반으로 하여 고 오디오 품질 반향을 생성할 수 있는 기존의 인공 반향 생성기 또는 룸(room) 시뮬레이터로부터 알려진다. 본 발명의 추가적인 이익, 즉, 디코더에서의 반향의 추가는 반향이 디코딩된 "드라이" 신호에서의 일부 잠재적인 아티팩트를 마스킹하는 것이다.
바람직하게, 변환 수단은 시간(t)의 함수인 임펄스 응답{h(t)}을 갖는 재생성된 울림이 없는 오디오 신호를 컨벌루션(convolution)하기 위한 수단을 포함하고, h(t)는 제2 인코딩된 신호부를 기반으로 한다.
바람직하게, 제2 인코딩된 신호부는:
- 상기 오디오 신호의 반향 시간과 관련이 있는 제1 파라미터(T)와,
- 상기 오디오 신호의 반향 진폭과 관련이 있는 제2 파라미터(A)의 표현을 포함한다.
디코더 수단은 파라미터화된 오디오 코덱에 따라 제1 인코딩된 신호부를 디코딩하기 위해 적응될 수 있다.
제3 양상에서, 본 발명은 오디오 신호를 인코딩하는 방법을 제공하며,
- 오디오 신호를 실질적으로 울림이 없는 부분과 상기 오디오 신호와 연관된 반향 필드를 설명하는 정보로 분리시키는 단계와,
- 상기 오디오 신호의 실질적으로 울림이 없는 부분을 제1 인코딩된 신호로 인코딩하는 단계와,
- 상기 반향 필드를 설명하는 정보를 제2 인코딩된 신호로 인코딩하는 단계를 포함한다.
제4 양상에서, 본 발명은 원래의 오디오 신호를 나타내는 인코딩된 오디오 신호를 디코딩하는 방법을 제공하는데, 상기 방법은:
- 제1 인코딩된 신호부를 제1 오디오 신호로 디코딩하는 단계,
- 제2 인코딩된 신호부를 상기 원래의 오디오 신호와 연관된 반향 필드를 설명하는 정보로 디코딩하는 단계,
- 상기 원래 오디오 신호를 재생성하기 위해 상기 반향 필드를 설명하는 정보를 기반으로 반향을 추가하여 제1 오디오 신호를 변환하는 단계를 포함한다.
제5 양상에서, 본 발명은 원래의 오디오 신호를 나타내는 인코딩된 오디오 신호를 제공하고, 상기 인코딩된 신호는
- 상기 원래의 오디오 신호의 실질적으로 울림이 없는 부분을 나타내는 제1 부분과,
- 상기 원래의 오디오 신호와 연관된 반향 필드에 대한 정보를 나타내는 제2 부분을 포함한다.
인코딩된 신호는 표준 디지털 오디오 포맷을 따르는 포맷을 갖는 디지털 전기 신호일 수 있다. 신호는 두 개의 오디오 디바이스 사이에서 전기 접속 케이블을 사용해서 전송될 수 있다. 하지만, 인코딩된 신호는 무선 주파수 반송파를 사용하는 공중(air-borne) 무선 신호일 수 있거나, 광 섬유를 사용해서 전송하기 위해 적응된 광 신호일 수 있다.
제6 양상에서, 본 발명은 제5 양상에 따른 인코딩된 오디오 신호를 나타내는 데이터를 포함하는 저장 매체를 제공한다. 저장 매체는 바람직하게 DVD, CD, 판독 및 기록 가능한 CD, 미니디스크, MP3 디스크, 콤팩트 플래시(compact flash), 메모리 스틱 등과 같은 표준 오디오 데이터 저장 매체이다. 하지만, 이 저장 매체는 컴퓨터 하드디스크, 컴퓨터 메모리, 플로피 디스크 등과 같은 컴퓨터 데이터 저장 매체일 수 있다.
제7 양상에서, 본 발명은 제1 양상에 따른 오디오 인코더를 포함하는 오디오 디바이스를 제공한다.
제8 양상에서, 본 발명은 제2 양상에 따른 오디오 디코더를 포함하는 오디오 디바이스를 제공한다.
제7 양상 및 제8 양상에 따른 바람직한 오디오 디바이스는 모든 다른 유형의 테이프, 디스크 또는 메모리 기반의 오디오 기록기 또는 재생기이다. 예를 들면, MP3 재생기, DVD 재생기, 컴퓨터를 위한 오디오 처리기 등이다. 추가적으로, 모바일 폰에 대해 이로울 수 있다.
다음에서, 본 발명이 본 발명에 따른 바람직한 인코더와 디코더의 블록도를 예시하는 첨부된 도 1을 참조하여 보다 상세히 설명된다.
본 발명이 다양한 수정 및 대안적인 형태일수 있는 한편, 특정 실시예가 도면에서 예로서 도시되었고, 여기서 보다 상세히 설명될 것이다. 하지만, 본 발명이 개시된 특별한 형태에 한정되도록 의도되지 않는 것이 이해되어야 한다. 오히려, 본 발명은 첨부된 청구항들에 의해 한정된 본 발명의 정신과 범위 이내에 있는 모든 수정, 등가물과 대안들을 포괄하는 것이다.
도 1은 신호 흐름에 대해서 인코더(1)와 인코더(2)의 바람직한 실시예의 원리를 설명하는 블록도.
오디오 신호는 인코더(1)의 입력(IN)에서 수신된다, 먼저, 오디오 신호가 반 향 추출기(REV EXT)에 의해 취급된다. 여기서, 오디오 신호는 우노키(Unoki)의 반향 제거 알고리즘(우노키 등, 2003)을 사용해서 반향 제거된다. 단청(monaural) 신호에 대해, 반향 오디오 신호로부터 반향 성분을 추출하는 것은 사소하지(trivial) 않다. 하지만, 이 추출은 완벽할 필요가 없고, 이득은 반향 필드의 일부를 제거하여 이미 달성될 수 있다. 다중-채널 신호에 대해, 이미 우수한 반향 제거 알고리즘이 존재한다.
그러면, 야기된 "드라이" 신호는 (Schuijers 등, 2003)에서 설명된 인코더 수단(ENC)의 SSC 인코더부에서 인코딩되고, 한편 인코딩 수단(ENC)의 다른 부분은 반향 추출기(REV EXT)에 의해 추출된 반향부를 인코딩한다. 인코더(1)로부터의 출력은 두 부분을 갖는데, 제1 부분은 인코더 수단(ENC)의 SSC 인코더 부분에 의해 제공되고, 제2 부분은 반향 추출기(REV EXT)에 의해 제공된 두 개의 반향 파라미터, 즉, 원래의 오디오 신호의 제거된 반향 부분의 파라미터 설명을 포함한다. 바람직하게, 두 개의 반향 파라미터(4)는 반향 시간(TR)과 반향 진폭 상수(A)이고, 이 파라미터는 오디오 신호의 "드라이" 부분에 대한 원래 오디오 신호의 반향부의 레벨과 연관되고, 룸 반향 임펄스 응답{h(t)}의 매우 간단한 설명이다. 신호의 시작에서 완전한 룸 반향 임펄스 응답{h(t)}을 또한 전송할 수 있으며, 필요할 때 신호 중간에 갱신이 이루어진다. h(t)가 일반적으로 느리게 변하거나 전혀 변하지 않기 때문에, 이것이 또한 효율적이다. 반향부를 인코딩하는 인코더 수단(ENC)의 인코더부는 반향 추출기(REV EXT)에 의해 전달되는 반향의 실제 형태에 매우 종속된다. 반향 추출기(REV EXT)가 단지 소수의 반향 파라미터를 전달하는 경우에, 반향부의 인코딩은 그 추출 자체에 포함된다고 간주될 수 있고, 따라서 인코더 수단(ENC)은 반향 추출기(REV EXT)로부터 수신된 반향부에 추가적인 인코딩을 추가할 필요가 없다.
디코더(2)는 인코더(1)로부터 SSC 인코딩된 신호(3)와 두 개의 반향 파라미터(4)를 수신한다. 도 1은 단지 인코더/디코더 시스템의 원리만을 설명하는 것이 이해되어야 한다. 인코딩된 신호(3, 4) 또는 이 신호(3, 4)를 나타내는 데이터는 MP3 재생기들을 위한 오디오 디스크와 같은 데이터 캐리어 또는 저장 매체 상에 일반적으로 저장될 수 있다.
디코더(2)에서, SSC 인코딩된 신호(3)는 디코더 수단(DEC)의 SSC 디코더부에 의해 디코딩되고, 따라서 실질적으로 "드라이"한 오디오 신호를 복원한다. 그러면 이 복원된 "드라이" 신호는 반향 처리기(REV)에 입력된다. 반향 처리기(REV)는 또한 디코더 수단(DEC)의 다른 부분에 의해 디코딩되었던 두 개의 반향 파라미터(4)를 또한 수신하고, 이 파라미터(4)를 기초로 해서, 반향 처리기(REV)는 두 개의 반향 파라미터(4)에서 추출된 반향 정보를 기초로 임펄스 응답을 생성하는데, 즉, 룸 임펄스 응답은 두 개의 반향 파라미터(4)를 기반으로 구성된다. 원래 오디오 신호의 반향부는 생성된 반향 임펄스 응답과의 컨벌루션(convolution)에 의해 디코더 수단(DEC)의 SSC 디코더부로부터 복원된 "드라이" 오디오 신호에 인가된다. 따라서, 복원된 "드라이" 오디오 신호는 복원된, 또는 적어도 실질적으로 복원된, 원래 오디오 신호로 변환된다. 마지막으로, 이 복원된 원래 오디오 신호는 인코더(2)의 출력(OUT)에서 제공된다.
반향 처리기(REV)에서 생성된 룸 반향 임펄스 응답{h(t)}은 바람직하게:
h(t)=A*exp(-6.9t/TR)*n(t)이고, t는 시간을 표시하고, n(t)는 백색 잡음 신호이다.
원리에서, 본 발명은 현재 MPEG에서 표준화되고, 임의의 반향 제거 알고리즘을 갖는, 예를 들면, (Schuijers 등, 2003)에서 언급되고 설명된 SSC 인코더와 같은 임의의 인코더와 연결되어 사용될 수 있다.
본 발명에 따른 인코더와 디코더는 디지털 신호 프로세서를 가진 단일 칩상에서 구현될 수 있다. 그러면, 이러한 디바이스의 신호 처리기 용량에 독립적인 오디오 디바이스에 내장되어 적용될 수 있다. 대안적으로, 인코더와 디코더는 응용 디바이스의 주요 신호 처리기상에 실행되는 알고리즘에 의해 순전히 구현될 수 있다.
청구항들에서, 도면으로의 참조 기호는 명백성 이유만을 위해 포함된다. 도면에서 예시적인 실시예로의 이러한 참조는 어떤 식으로든 청구항들의 범위를 제한하는 것으로 해석되지 말아야 한다.
참고 문헌 목록:
F. Basburg, K. Swaminathan과 S. Nandkumar, "Noise Reduction and Echo Cancellation Front-End for Speech Codecs," IEEE Transactions on Speech and Audio Processing, vol. 11, no. 1, 2003.
E. Schuijers, W. Oomen, B. den Brinker, J. Breebaart, "Advances in Parametric Coding for High-Quality Audio," in Proc. of the 114th AES Convention 2003 March 22-25 Amsterdam, The Netherlands, 2003.
M. Unoki, M. Furukawa, K. Sakata, 및 M. Akagi, "A Method based on the MTF Concept for dereverberating the Power Envelope from the Reverberant Signal," in Proc. IEEE Int. Conf. on Acoust., Speech, Signal Processing, Hong Kong, China, April 6-19, Vol. I, pp. 840-843, 2003.
본 발명은 오디오 신호 코딩의 분야에 이용 가능하다.

Claims (14)

  1. 오디오 신호를 인코딩하기 위해 적응된 오디오 인코더(1)로서,
    - 오디오 신호를 실질적으로 울림이 없는 오디오 신호와 상기 오디오 신호와 연관된 반향 필드를 설명하는 정보로 분리시키기 위해 적응된 분리 수단과,
    - 실질적으로 울림이 없는 오디오 신호를 제1 인코딩된 신호부(3)로 인코딩하고, 반향 필드를 설명하는 정보를 제2 인코딩된 신호부(4)로 인코딩하기 위해 적응된 인코더 수단을 포함하는, 오디오 인코더.
  2. 제1항에 있어서, 상기 분리 수단은 우노키(Unoki)의 반향 제거(de-reverberation) 알고리즘을 상기 오디오 신호에 적용하여, 상기 오디오 신호를 실질적으로 울림이 없는 부분과 상기 반향 필드를 설명하는 정보로 분리시키도록 적응된, 오디오 인코더.
  3. 제1항에 있어서, 상기 인코더 수단은 파라미터화된(parametric) 오디오 코덱에 따라 실질적으로 울림이 없는 오디오 신호를 인코딩하기 위해 적응된, 오디오 인코더.
  4. 제1 부분(3)과 제2 부분(4)을 가진 인코딩된 오디오 신호로부터 오디오 신호를 재생성하기 위해 적응된 오디오 디코더(2)로서,
    - 제1 인코딩된 신호부(3)를 실질적으로 울림이 없는 오디오 신호로 디코딩하기 위해 적응된 디코더 수단으로서, 상기 디코더 수단은 제2 인코딩된 신호부(4)로부터 상기 오디오 신호와 연관된 반향 필드를 설명하는 정보를 생성하도록 더 적응되는, 디코더 수단과,
    - 상기 반향 필드를 설명하는 정보를 기반으로 반향을 상기 실질적으로 울림이 없는 오디오 신호에 추가하기 위해 적응된 변환 수단을 포함하는, 오디오 디코더.
  5. 제4항에 있어서, 상기 변환 수단은 시간(t)의 함수인 임펄스 응답{h(t)}과 실질적으로 울림이 없는 오디오 신호를 컨벌루션(convoluting)하기 위한 수단을 포함하고, h(t)는 상기 반향 필드를 설명하는 정보를 기반으로 하는, 오디오 디코더.
  6. 제5항에 있어서, 상기 디코더 수단은 제2 인코딩된 신호부(4)로부터:
    - 상기 오디오 신호의 반향 시간과 관련이 있는 제1 파라미터(T)와,
    - 상기 오디오 신호의 반향 진폭과 관련이 있는 제2 파라미터(A)를
    생성하기 위해 적응되는, 오디오 디코더.
  7. 제6항에 있어서, 상기 변환 수단은 상기 제1 및 제2 파라미터를 기반으로 하여 h(t)=A*exp(k*t/T)*n(t)로서 상기 임펄스 응답{h(t)}을 계산하기 위해 적응되고, k는 상수를 나타내고, n(t)는 잡음 신호를 나타내는, 오디오 디코더.
  8. 제4항에 있어서, 상기 디코더 수단은 파라미터화된 오디오 코덱에 따라 제1 인코딩된 신호부(3)를 디코딩하기 위해 적응되는, 오디오 디코더.
  9. 오디오 신호를 인코딩하는 방법으로서,
    - 오디오 신호를 실질적으로 울림이 없는 부분과 상기 오디오 신호와 연관된 반향 필드를 설명하는 정보로 분리시키는 단계와,
    - 상기 오디오 신호의 실질적으로 울림이 없는 부분을 제1 인코딩된 신호로 인코딩하는 단계와,
    - 상기 반향 필드를 설명하는 정보를 제2 인코딩된 신호로 인코딩하는 단계를 포함하는, 오디오 인코더.
  10. 원래의 오디오 신호를 나타내는 인코딩된 오디오 신호를 디코딩하는 방법으로서,
    - 제1 인코딩된 신호부를 제1 오디오 신호로 디코딩하는 단계,
    - 제2 인코딩된 신호부를 상기 원래의 오디오 신호와 연관된 반향 필드를 설명하는 정보로 디코딩하는 단계,
    - 상기 원래 오디오 신호를 재생성하기 위해 상기 반향 필드를 설명하는 정보를 기반으로 반향을 추가하여 제1 오디오 신호를 변환하는 단계를 포함하는, 원 래의 오디오 신호를 나타내는 인코딩된 오디오 신호를 디코딩하는 방법.
  11. 원래의 오디오 신호를 나타내는 인코딩된 오디오 신호(3, 4)로서,
    - 상기 원래의 오디오 신호의 실질적으로 울림이 없는 부분을 나타내는 제1 부분(3)과,
    - 상기 원래의 오디오 신호와 연관된 반향 필드에 대한 정보를 나타내는 제2 부분(4)을 포함하는, 원래의 오디오 신호를 나타내는 인코딩된 오디오 신호.
  12. 제11항에 기재된 인코딩된 오디오 신호(3)를 나타내는 데이터를 포함하는 저장 매체.
  13. 제1항에 기재된 오디오 인코더(1)를 포함하는 오디오 디바이스.
  14. 제4항에 기재된 오디오 디코더(2)를 포함하는 오디오 디바이스.
KR1020067025693A 2004-06-08 2005-06-03 반향 음향 신호를 코딩하는 방법 KR101158717B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04102582 2004-06-08
EP04102582.6 2004-06-08
PCT/IB2005/051820 WO2005122640A1 (en) 2004-06-08 2005-06-03 Coding reverberant sound signals

Publications (2)

Publication Number Publication Date
KR20070034481A true KR20070034481A (ko) 2007-03-28
KR101158717B1 KR101158717B1 (ko) 2012-06-22

Family

ID=34969303

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067025693A KR101158717B1 (ko) 2004-06-08 2005-06-03 반향 음향 신호를 코딩하는 방법

Country Status (8)

Country Link
US (1) US20080281602A1 (ko)
EP (1) EP1757165B1 (ko)
JP (1) JP5247148B2 (ko)
KR (1) KR101158717B1 (ko)
CN (2) CN104112450A (ko)
AT (1) ATE539431T1 (ko)
TW (1) TW200611242A (ko)
WO (1) WO2005122640A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9294862B2 (en) 2008-04-17 2016-03-22 Samsung Electronics Co., Ltd. Method and apparatus for processing audio signals using motion of a sound source, reverberation property, or semantic object

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003061285A2 (en) 2001-12-24 2003-07-24 Scientific Generics Limited Captioning system
CN104112450A (zh) * 2004-06-08 2014-10-22 皇家飞利浦电子股份有限公司 音频编码器,音频解码器,编码与解码音频信号的方法及音频设备
CN101141644B (zh) * 2007-10-17 2010-12-08 清华大学 编码集成系统和方法与解码集成系统和方法
GB2462588A (en) * 2008-04-29 2010-02-17 Intrasonics Ltd Data embedding system
GB2460306B (en) 2008-05-29 2013-02-13 Intrasonics Sarl Data embedding system
JP5169584B2 (ja) * 2008-07-29 2013-03-27 ヤマハ株式会社 インパルス応答加工装置、残響付与装置およびプログラム
JP4950971B2 (ja) * 2008-09-18 2012-06-13 日本電信電話株式会社 残響除去装置、残響除去方法、残響除去プログラム、記録媒体
TWI475896B (zh) 2008-09-25 2015-03-01 Dolby Lab Licensing Corp 單音相容性及揚聲器相容性之立體聲濾波器
CN101727892B (zh) * 2009-12-03 2013-01-30 无锡中星微电子有限公司 混响模型生成方法及装置
WO2012010929A1 (en) * 2010-07-20 2012-01-26 Nokia Corporation A reverberation estimator
US8908874B2 (en) * 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
CN102750956B (zh) * 2012-06-18 2014-07-16 歌尔声学股份有限公司 一种单通道语音去混响的方法和装置
JP6160072B2 (ja) * 2012-12-06 2017-07-12 富士通株式会社 オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
CN112188375B (zh) * 2014-09-26 2022-04-26 Med-El电气医疗器械有限公司 听觉假体装置及其中的音频信号处理方法
WO2017035281A2 (en) * 2015-08-25 2017-03-02 Dolby International Ab Audio encoding and decoding using presentation transform parameters
JP6512607B2 (ja) * 2016-02-16 2019-05-15 日本電信電話株式会社 環境音合成装置、その方法及びプログラム
CN108391165A (zh) * 2018-02-07 2018-08-10 深圳市亿联智能有限公司 一种具有自动翻译功能的智能网关及音频处理方式
CN113597777B (zh) 2019-05-15 2023-07-07 苹果公司 音频处理
WO2021086624A1 (en) * 2019-10-29 2021-05-06 Qsinx Management Llc Audio encoding with compressed ambience
US11271607B2 (en) 2019-11-06 2022-03-08 Rohde & Schwarz Gmbh & Co. Kg Test system and method for testing a transmission path of a cable connection between a first and a second position

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1268546A (en) * 1985-08-30 1990-05-01 Shigenobu Minami Stereophonic voice signal transmission system
US6377862B1 (en) * 1997-02-19 2002-04-23 Victor Company Of Japan, Ltd. Method for processing and reproducing audio signal
FI116990B (fi) * 1997-10-20 2006-04-28 Nokia Oyj Menetelmä ja järjestelmä akustisen virtuaaliympäristön käsittelemiseksi
US6188769B1 (en) * 1998-11-13 2001-02-13 Creative Technology Ltd. Environmental reverberation processor
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3979133B2 (ja) * 2002-03-13 2007-09-19 ヤマハ株式会社 音場再生装置、プログラム及び記録媒体
JP4019759B2 (ja) * 2002-03-22 2007-12-12 ヤマハ株式会社 残響付与方法、インパルス応答供給制御方法、残響付与装置、インパルス応答補正装置、プログラム及び該プログラムを記録した記録媒体
CN1311426C (zh) * 2002-04-10 2007-04-18 皇家飞利浦电子股份有限公司 立体声信号的编码、解码方法和装置及其传输设备
EP1554716A1 (en) * 2002-10-14 2005-07-20 Koninklijke Philips Electronics N.V. Signal filtering
CN104112450A (zh) * 2004-06-08 2014-10-22 皇家飞利浦电子股份有限公司 音频编码器,音频解码器,编码与解码音频信号的方法及音频设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9294862B2 (en) 2008-04-17 2016-03-22 Samsung Electronics Co., Ltd. Method and apparatus for processing audio signals using motion of a sound source, reverberation property, or semantic object

Also Published As

Publication number Publication date
EP1757165B1 (en) 2011-12-28
CN104112450A (zh) 2014-10-22
WO2005122640A1 (en) 2005-12-22
KR101158717B1 (ko) 2012-06-22
TW200611242A (en) 2006-04-01
CN1965610A (zh) 2007-05-16
EP1757165A1 (en) 2007-02-28
JP5247148B2 (ja) 2013-07-24
JP2008503793A (ja) 2008-02-07
US20080281602A1 (en) 2008-11-13
ATE539431T1 (de) 2012-01-15

Similar Documents

Publication Publication Date Title
KR101158717B1 (ko) 반향 음향 신호를 코딩하는 방법
Spanias et al. Audio signal processing and coding
EP1210712B1 (en) Scalable coding method for high quality audio
TWI573131B (zh) 用以編碼或解碼音訊聲軌之方法、音訊編碼處理器及音訊解碼處理器
KR100331166B1 (ko) 오디오신호를 코딩하기 위한 방법 및 장치와 비트스트림을디코딩하기 위한 방법 및 장치
KR101237413B1 (ko) 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
CN101385075B (zh) 用于编码/解码信号的装置和方法
JP2005157390A (ja) 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置
JP2006011456A (ja) 低ビット率符号化/復号化方法及び装置並びにコンピュータ可読媒体
KR20160012215A (ko) 구면 조화 계수들에 대한 공간 마스킹의 수행
JP2012103718A (ja) 合成されたスペクトル成分に適合するようにデコードされた信号の特性を使用するオーディオコーディングシステム
JP2008539462A (ja) オーディオエンコーダを並列に動作させる方法及びシステム
JP2004046179A (ja) 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
KR20020002241A (ko) 디지털 오디오장치
KR20040001184A (ko) 하모닉 성분을 이용한 오디오 코딩방법 및 장치
CN105869647B (zh) 一种智能手机原生dsd音频解码方法、系统及智能手机
KR20100062667A (ko) 코덱 플랫폼 장치
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
KR100300887B1 (ko) 디지털 오디오 데이터의 역방향 디코딩 방법
KR101464977B1 (ko) 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
KR20080066538A (ko) 멀티 채널 신호의 부호화/복호화 방법 및 장치
KR100754389B1 (ko) 음성 및 오디오 신호 부호화 장치 및 방법
JP2006079742A (ja) 情報処理装置および方法、並びにプログラム
KR101281945B1 (ko) 오디오 코딩 장치 및 방법
Fong et al. A power efficient asynchronous dithering scheme for mass-produced hearing aids and personal sound amplifying devices

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150611

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160608

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170612

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180607

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190612

Year of fee payment: 8