KR20170016488A - 오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템 - Google Patents

오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템 Download PDF

Info

Publication number
KR20170016488A
KR20170016488A KR1020177000895A KR20177000895A KR20170016488A KR 20170016488 A KR20170016488 A KR 20170016488A KR 1020177000895 A KR1020177000895 A KR 1020177000895A KR 20177000895 A KR20177000895 A KR 20177000895A KR 20170016488 A KR20170016488 A KR 20170016488A
Authority
KR
South Korea
Prior art keywords
signal
audio signal
value
decorrelated
weighting factors
Prior art date
Application number
KR1020177000895A
Other languages
English (en)
Other versions
KR101989062B1 (ko
Inventor
크리스티앙 울레
파트리크 감프
올리버 헬무트
슈테판 바르가
세바스티앙 샤러
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20170016488A publication Critical patent/KR20170016488A/ko
Application granted granted Critical
Publication of KR101989062B1 publication Critical patent/KR101989062B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Abstract

프로세싱된 신호의 과도 및 음조 부분들을 감소 또는 제거하기 위해 오디오 신호를 프로세싱하기 위한 신호 프로세서 및 프로세싱된 신호로부터 제 1 역상관된 신호 및 제 2 역상관된 신호를 생성하기 위한 역상관기를 포함하는, 오디오 신호를 향상시키기 위한 장치가 개시된다. 장치는, 제 1 및 제 2 역상관된 신호 및 오디오 신호 또는 오디오 신호로부터 코히어런스 향상에 의해 유도된 신호를, 시변 가중치 팩터들을 사용하여 가중적으로 결합하고, 2-채널 오디오 신호를 획득하기 위한 결합기를 더 포함한다. 장치는, 오디오 신호의 상이한 부분들이 상이한 가중치 팩터들과 곱해지고 2-채널 오디오 신호가 시변 역상관도를 갖도록 오디오 신호를 분석함으로써 시변 가중치 팩터들을 제어하기 위한 제어기를 더 포함한다.

Description

오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템{APPARATUS AND METHOD FOR ENHANCING AN AUDIO SIGNAL, SOUND ENHANCING SYSTEM}
본 출원은 오디오 신호 프로세싱 및 특히 모노 또는 듀얼-모노 신호의 오디오 프로세싱에 관한 것이다.
청각적 장면은 직접적인 음향 및 주변 음향의 혼합으로 모델링될 수 있다. 직접적인(또는 지향적인) 음향들은 음원들, 예를 들어, 악기, 보컬리스트 또는 스피커에 의해 방출되고, 가능한 최단 경로 상에서 수신기, 예를 들어, 청취자의 귀 또는 마이크로폰에 도달된다. 이격된 마이크로폰들의 세트를 사용하여 직접적인 음향을 캡쳐하는 경우, 수신된 신호들은 코히어런트하다. 반대로, 주변 (또는 확산) 음향들은, 예를 들어, 실내 반향, 박수 또는 소음에 기여하는 많은 이격된 음원들 또는 음향 반사 경계들에 의해 방출된다. 이격된 마이크로폰들의 세트를 사용하여 주변 음향 필드를 캡쳐하는 경우, 수신된 신호들은 적어도 부분적으로 코히어런트하지 않다.
모노포닉 음향 재생은 일부 재생 시나리오들(예를 들어, 댄스 클럽들)에서 또는 일부 타입들의 신호들(예를 들어, 음성 녹음)에 대해 적절한 것으로 고려될 수 있지만, 대부분의 음악 녹음들, 영화 음향 및 TV 음향은 스테레오 신호들이다. 스테레오 신호들은 주변(또는 확산) 음향들 및 음원들의 방향 및 폭의 감각을 생성할 수 있다. 이는, 공간 큐(space cue)들에 의해 인코딩된 스테레오 정보를 이용하여 달성된다. 가장 중요한 공간 큐는 채널-간 레벨 차이들(ICLD), 채널-간 시간 차이들(ICTD) 및 채널-간 코히어런스(ICC)이다. 결과적으로, 스테레오 신호들 및 대응하는 음향 재생 시스템들은 하나보다 많은 채널을 갖는다. ICLD 및 ICTD는 방향 감각에 기여한다. ICC는 음향의 폭 감각을 유발하며, 주변 음향들의 경우 음향이 모든 방향들에서 오는 것으로 인식된다.
다양한 포맷들의 다중 채널 음향 재생이 존재하지만, 오디오 녹음 및 음향 재생 시스템들 대부분은 여전히 2 개의 채널들을 갖는다. 2-채널 스테레오 음향은 엔터테인먼트 시스템들에 대한 표준이고 리스너(listener)들이 이에 대해 사용된다. 그러나, 스테레오 신호는 단지 2 개의 채널 신호들만을 갖도록 제한되는 것이 아닐 하나보다 많은 채널 신호를 가질 수 있다. 유사하게, 모노포닉 신호들은 단지 하나의 채널 신호만을 갖도록 제한되는 것이 아니라, 다수의 그러나 동일한 채널 신호들을 가질 수 있다. 예를 들어, 2 개의 동일한 채널 신호들을 포함하는 오디오 신호는 듀얼-모노 신호로 지칭될 수 있다.
스테레오 신호들 대신에 모노포닉 신호들이 청취자에게 이용가능한 데에는 여러 이유들이 존재한다. 첫째로, 오래된 녹음은, 그 때 스테레오 기술들이 사용되지 않았기 때문에 모노포닉이다. 둘째로, 송신 또는 저장 매체의 대역폭 제한들이 스테레오 정보의 손실을 초래할 수 있다. 대표적인 예는 주파수 변조(FM)를 사용한 라디오 방송이다. 여기서, 간섭 소스들, 다중경로 왜곡들 또는 다른 송신 손상들은 잡음있는 스테레오 정보를 초래할 수 있고, 이는, 통상적으로 채널들 둘 모두 사이의 차동 신호로 인코딩된 2-채널 신호들의 송신의 경우이다. 수신 조건들이 불량한 경우 스테레오 정보를 부분적으로 또는 완전히 폐기하는 것이 일반적이다.
스테레오 정보의 손실은 음질 저하를 초래할 수 있다. 일반적으로, 더 많은 수의 채널들을 포함하는 오디오 신호는 더 적은 수의 채널들을 포함하는 오디오 신호에 비해 더 높은 음질을 포함할 수 있다. 청취자들은 고음질을 포함하는 오디오 신호들을 청취하는 것을 선호할 수 있다. 미디어에 저장되거나 미디어를 통해 송신되는 데이터 레이트들과 같은 효율성 이유들로 음질은 종종 감소된다.
따라서, 오디오 신호들의 음질을 증가(향상)시킬 필요가 있다.
따라서, 본 발명의 목적은 오디오 신호들의 향상 및/또는 재생된 오디오 신호들의 감각을 증가시키기 위한 장치 또는 방법을 제공하는 것이다.
이러한 목적은, 청구항 제 1 항에 따른 오디오 신호를 향상시키기 위한 장치, 청구항 제 14 항에 따른 오디오 신호를 향상시키기 위한 방법 및 청구항 제 13 항에 따른 음향 향상 시스템 또는 청구항 제 15 항에 따른 컴퓨터 프로그램에 의해 달성된다.
본 발명은, 수신된 오디오 신호들을 적어도 2 개의 셰어(share)들로 분할하고 수신된 신호의 셰어들 중 적어도 하나를 역상관시켜 인위적으로 공간 큐를 생성함으로써, 수신된 오디오 신호가 향상될 수 있다는 발견에 기초한다. 셰어들의 가중된 조합은, 스테레오로 인식되는 오디오 신호를 수신하는 것을 허용하고, 따라서 향상된다. 역상관이 음질을 감소시키는 성가신 효과들을 초래할 수 있는 경우, 적용된 가중치들을 제어하는 것은 향상의 레벨이 낮아질 수 있도록 가변적인 역상관도(degree of decorrelation) 및 그에 따른 가변적인 향상도(degree of enhancement)를 허용한다. 따라서, 음성 신호들의 경우와 같이 낮은 역상관이 적용되거나 전혀 적용되지 않는 부분들 또는 시간 간격들을 포함하고, 음악 신호들의 경우와 같이 더 많거나 높은 역상관도가 적용되는 부분들 또는 시간 간격들을 포함하는 가변적인 오디오 신호가 향상될 수 있다.
본 발명의 일 실시예는 오디오 신호를 향상시키기 위한 장치를 제공한다. 장치는 프로세싱된 신호의 과도 및 음조 부분들을 감소 또는 제거하기 위해 오디오 신호를 프로세싱하기 위한 신호 프로세서를 포함한다. 장치는 프로세싱된 신호로부터 제 1 역상관된 신호 및 제 2 역상관된 신호를 생성하기 위한 역상관기를 더 포함한다. 장치는 결합기 및 제어기를 더 포함한다. 결합기는, 제 1 역상관된 신호, 제 2 역상관된 신호 및 오디오 신호 또는 오디오 신호로부터 코히어런스 향상에 의해 유도된 신호를, 시변 가중치 팩터들을 사용하여 가중적으로 결합하고, 2-채널 오디오 신호를 획득하도록 구성된다. 제어기는, 오디오 신호의 상이한 부분들이 상이한 가중치 팩터들과 곱해지고 2-채널 오디오 신호가 시변 역상관도를 갖도록 오디오 신호를 분석함으로써 시변 가중치 팩터들을 제어하도록 구성된다.
스테레오(또는 다중 채널) 정보를 거의 또는 전혀 갖지 않는 오디오 신호, 예를 들어, 하나의 채널을 갖는 신호 또는 다수지만 거의 동일한 채널 신호들을 갖는 신호는, 향상이 적용된 후, 다중 채널, 예를 들어, 스테레오 신호로 인식될 수 있다. 수신된 모노 또는 듀얼-모노 오디오 신호는 상이한 경로들에서 상이하게 프로세싱될 수 있고, 하나의 경로에서 오디오 신호의 과도 및/또는 음조 부분들이 감소 또는 제거된다. 이러한 방식으로 프로세싱된 신호가 역상관되는 것, 및 역상관된 신호가 오디오 신호 또는 그로부터 유도된 신호를 포함하는 제 2 경로와 가중적으로 결합되는 것은, 서로에 대해 높은 역상관 팩터를 포함할 수 있는 2 개의 신호 채널들을 획득하는 것을 허용하여, 2 개의 채널들은 스테레오 신호로 인식된다.
역상관된 신호 및 오디오 신호(또는 그로부터 유도된 신호)를 가중적으로 결합하기 위해 사용되는 가중치 팩터들을 제어함으로써, 시변 역상관도가 획득될 수 있어서, 오디오 신호를 향상시키는 것이 가능하게는 원하지 않는 효과들을 초래할 상황들에서, 향상은 감소 또는 생략될 수 있다. 예를 들어, 다수의 위치의 소스들로부터의 화자를 인식하는 것이 청취자에게 성가신 효과들을 초래할 수 있을 때 라디오 스피커의 신호 또는 다른 현저한 음원 신호들이 향상되는 것은 바람직하지 않다.
추가적인 실시예에 따르면, 오디오 신호를 향상시키기 위한 장치는 프로세싱된 신호의 과도 및 음조 부분들을 감소 또는 제거하기 위해 오디오 신호를 프로세싱하기 위한 신호 프로세서를 포함한다. 장치는 역상관기, 결합기 및 제어기를 더 포함한다. 역상관기는 프로세싱된 신호로부터 제 1 역상관된 신호 및 제 2 역상관된 신호를 생성하도록 구성된다. 결합기는, 제 1 역상관된 신호 및 오디오 신호 또는 오디오 신호로부터 코히어런스 향상에 의해 유도된 신호를, 시변 가중치 팩터들을 사용하여 가중적으로 결합하고, 2-채널 오디오 신호를 획득하도록 구성된다. 제어기는, 오디오 신호의 상이한 부분들이 상이한 가중치 팩터들과 곱해지고 2-채널 오디오 신호가 시변 역상관도를 갖도록 오디오 신호를 분석함으로써 시변 가중치 팩터들을 제어하도록 구성된다. 이는, 모노 신호 또는 모노 신호와 유사한 신호(예를 들어, 듀얼-모노 또는 멀티-모노)를 스테레오-채널 오디오 신호인 것으로 인식하는 것을 허용한다.
오디오 신호를 프로세싱하기 위해, 제어기 및/또는 신호 프로세서는 주파수 도메인에서 오디오 신호의 표현을 프로세싱하도록 구성될 수 있다. 표현은 복수의 또는 다수의 주파수 대역들(서브대역들)을 포함할 수 있고, 이들 각각은 일 부분, 즉, 오디오 신호 각각의 스펙트럼의 오디오 신호 부분을 포함한다. 주파수 대역들 각각에 대해, 제어기는 2-채널 오디오 신호에서 인식된 역상관 레벨을 예측하도록 구성될 수 있다. 제어기는, 오디오 신호의 부분들(주파수 대역들)에 대한 가중치 팩터들을 증가시켜 더 높은 역상관도를 허용하고, 오디오 신호의 부분들에 대한 가중치 팩터들을 감소시켜 더 낮은 역상관도를 허용하도록 추가로 구성될 수 있다. 예를 들어, 박수 또는 소음과 같은 현저하지 않은 음원 신호를 포함하는 부분은, 현저한 음원 신호를 포함하는 부분보다 더 높은 역상관을 허용하는 가중치 팩터에 의해 결합될 수 있고, 여기서 용어 현저한 음원 신호는 음성, 악기, 보컬리스트 또는 스피커와 같이 직접적인 음향들로 인식되는 신호의 부분들에 대해 사용된다.
프로세서는, 주파수 대역의 일부 또는 전부 각각에 대해, 주파수 대역이 과도 또는 음조 성분들을 포함하는지 여부를 결정하고, 과도 또는 음조 부분들의 감소를 허용하는 스펙트럼 가중치들을 결정하도록 구성될 수 있다. 스펙트럼 가중치들 및 스케일링 팩터들은, 이진 결정들로 인한 성가신 효과들이 감소 및/또는 회피될 수 있도록 다수의 가능한 값들을 각각 포함할 수 있다.
제어기는 2-채널 오디오 신호의 인식된 역상관 레벨이 타겟 값 주위의 일정 범위 내에 유지되도록 가중치 팩터들을 스케일링하도록 추가로 구성될 수 있다. 범위는 예를 들어 타겟 값의 ± 20 %, ± 10 % 또는 ± 5 %까지 확장될 수 있다. 타겟 값은, 예를 들어, 타겟 값을 변경하는 변하는 과도 및 음조 부분들을 포함하는 오디오 신호가 획득되도록, 음조 및/또는 과도 부분의 측정에 대해 미리 결정된 값일 수 있다. 이것은, 오디오 신호가 역상관되어 있는 경우 또는 예를 들어, 음성과 같이 현저한 음원에 대해 어떠한 역상관도 목적이 아닌 경우 낮은 역상관을 수행하거나 심지어 역상관을 전혀 수행하지 않는 것, 그리고 신호가 역상관되지 않았고 그리고/또는 역상관이 목적인 경우 높은 역상관을 허용한다. 가중치 팩터들 및/또는 스펙트럼 가중치들은 다수의 값들로 또는 심지어 거의 연속적으로 결정 및/또는 조절될 수 있다.
역상관기는 오디오 신호의 반향 또는 지연에 기초하여 제 1 역상관된 신호를 생성하도록 구성될 수 있다. 제어기는 오디오 신호의 반향 또는 지연에 또한 기초하여 테스트 역상관된 신호를 생성하도록 구성될 수 있다. 반향은, 오디오 신호를 지연시키고 오디오 신호 및 이의 지연된 버전을 유한 임펄스 응답 필터 구조와 유사하게 결합함으로써 수행될 수 있고, 반향은 또한 무한 임펄스 응답 필터로서 구현될 수 있다. 지연 시간 및/또는 지연들 및 조합들의 수는 변할 수 있다. 테스트 역상관된 신호에 대해 오디오 신호를 지연 또는 반향시키는 지연 시간은, 예를 들어 지연 시간보다 짧을 수 있어서, 제 1 역상관된 신호에 대해 오디오 신호를 지연 또는 반향시키는 경우 지연 필터의 더 작은 필터 계수를 도출한다. 인식된 역상관 강도를 예측하기 위해, 지연 시간 및/또는 필터 계수들을 감소시킴으로써 계산 노력 및/또는 계산 능력이 감소될 수 있도록 더 낮은 역상관도 및 그에 따른 더 짧은 지연 시간이 충분할 수 있다.
후속적으로, 본 발명의 선호되는 실시예들은 첨부된 도면들에 대해 설명된다.
도 1은 오디오 신호를 향상시키기 위한 장치의 개략적인 블록도를 도시한다.
도 2는 오디오 신호를 향상시키기 위한 추가적인 장치의 개략적인 블록도를 도시한다.
도 3은 예측되는 인식된 역상관 강도의 레벨에 기초한 스케일링 팩터들(가중치 팩터들)의 컴퓨팅을 표시하는 예시적인 표를 도시한다.
도 4a는 가중치 팩터들을 부분적으로 결정하기 위해 실행될 수 있는 방법의 일부의 개략적인 흐름도를 도시한다.
도 4b는 인식된 역상관 레벨에 대한 측정이 임계 값들과 비교되는 경우를 도시하는, 도 4a의 방법의 추가적인 단계들의 개략적인 흐름도를 도시한다.
도 5는 도 1의 역상관기로서 동작하도록 구성될 수 있는 역상관기의 개략적인 블록도를 도시한다.
도 6a는 적어도 하나의 과도(단기) 신호 부분들을 포함하는 오디오 신호의 스펙트럼을 포함하는 개략도를 도시한다.
도 6b는 음조 성분을 포함하는 오디오 신호의 개략적인 스펙트럼을 도시한다.
도 7a는 과도 프로세싱 스테이지에 의해 수행되는 가능한 과도 프로세싱을 예시하는 개략적인 표를 도시한다.
도 7b는 음조 프로세싱 스테이지에 의해 실행될 수 있는 가능한 음조 프로세싱을 예시하는 예시적인 표를 도시한다.
도 8은 오디오 신호를 향상시키기 위한 장치를 포함하는 음향 향상 시스템의 개략적인 블록도를 도시한다.
도 9a는 배경/전경 프로세싱에 따라 입력 신호의 프로세싱에 대한 개략적인 블록도를 도시한다.
도 9b는 입력 신호를 전경 및 배경 신호로 분리하는 것을 예시한다.
도 10은 입력 신호에 스펙트럼 가중치들을 적용하도록 구성되는 개략적인 블록도 및 장치를 도시한다.
도 11은 오디오 신호를 향상시키기 위한 방법의 개략적인 흐름도를 도시한다.
도 12는 직접적인 신호 성분 또는 드라이 신호 성분 및 반향 신호 성분을 포함하는 혼합 신호에서 인식된 반향/역상관 레벨에 대한 측정치를 결정하기 위한 장치를 예시한다.
도 13a 내지 도 13c는 라우드니스 모델 프로세서의 구현들을 도시한다.
도 14는 도 12, 도 13a, 도 13b, 도 13c에 대한 일부 양상들에서 이미 논의된 라우드니스 모델 프로세서의 구현을 예시한다.
동일한 또는 동등한 엘리먼트들 또는 동일한 또는 동등한 기능을 갖는 엘리먼트들은, 하기 설명에서, 상이한 도면들에서 발생하는 경우에도 동일한 또는 동등한 참조 부호들로 표시된다.
하기 설명에서, 본 발명의 실시예들에 대한 더 철저한 설명을 제공하기 위해 다수의 세부 사항들이 상술된다. 그러나, 이러한 특정 세부사항들 없이도 본 발명의 실시예들이 실시될 수 있음은 본 기술분야의 당업자들에게 자명할 것이다. 다른 예들에서, 본 발명의 실시예들을 모호하게 하는 것을 회피하기 위해, 널리 공지된 구조들 및 디바이스들은 상세히 설명되기보다는 블록도 형태로 도시된다. 또한, 이하 설명되는 상이한 실시예들의 특징들은 구체적으로 달리 언급되지 않으면 서로 결합될 수 있다.
다음으로, 오디오 신호를 프로세싱하는 것이 참조될 것이다. 장치 또는 이의 컴포넌트들은 오디오 신호를 수신, 제공 및/또는 프로세싱하도록 구성될 수 있다. 각각의 오디오 신호는 동일한 시간 도메인 및/또는 주파수 도메인에서 수신, 제공 또는 프로세싱될 수 있다. 시간 도메인에서 오디오 신호 표현은, 예를 들어, 푸리에 변환들 등에 의해 오디오 신호의 주파수 표현으로 변환될 수 있다. 주파수 표현은, 예를 들어, 단기 푸리에 변환(STFT), 이산 코사인 변환 및/또는 고속 푸리에 변환(FFT)을 사용함으로써 획득될 수 있다. 대안적으로 또는 추가적으로, 주파수 표현은 직교 미러 필터QMF)들을 포함할 수 있는 필터뱅크 (filterbank)에 의해 획득될 수 있다. 오디오 신호의 주파수 도메인 표현은, 푸리에 변환들로부터 공지된 바와 같이 복수의 서브대역들을 각각 포함하는 복수의 프레임들을 포함할 수 있다. 각각의 서브대역은 오디오 신호의 일부를 포함한다. 오디오 신호의 시간 표현 및 주파수 표현은 서로 변환될 수 있기 때문에, 하기 설명은, 오디오 신호가 시간 도메인 표현 또는 주파수 도메인 표현인 것으로 제한되지 않아야 한다.
도 1은 오디오 신호(102)를 향상시키기 위한 장치(10)의 개략적인 블록도를 도시한다. 오디오 신호(102)는, 주파수 도메인 또는 시간 도메인에서 표현되는, 예를 들어, 모노 신호 또는 모노형 신호, 예를 들어, 듀얼-모노 신호이다. 장치(10)는 신호 프로세서(110), 역상관기(120), 제어기(130) 및 결합기(140)를 포함한다. 신호 프로세서(110)는 오디오 신호(102)를 수신하고, 오디오 신호(102)에 비해 프로세싱된 신호(112)의 과도 및 음조 부분들을 감소 또는 제거하기 위해 오디오 신호(102)를 프로세싱하여 프로세싱된 신호(112)를 획득하도록 구성된다.
역상관기(120)는 프로세싱된 신호(112)를 수신하고 프로세싱된 신호(112)로부터 제 1 역상관된 신호(122) 및 제 2 역상관된 신호(124)를 생성하도록 구성된다. 역상관기(120)는 적어도 부분적으로, 프로세싱된 신호(112)를 반향시킴으로써 제 1 역상관된 신호(122) 및 제 2 역상관된 신호(124)를 생성하도록 구성될 수 있다. 제 1 역상관된 신호(122) 및 제 2 역상관된 신호(124)는, 제 1 역상관된 신호(122)가 제 2 역상관된 신호(124)보다 짧거나 긴 시간 지연(반향 시간)을 포함하도록 반향에 대해 상이한 시간 지연들을 포함할 수 있다. 제 1 또는 제 2 역상관된 신호(122 또는 124)는 또한 지연 또는 반향 필터없이 프로세싱될 수 있다.
역상관기(120)는 제 1 역상관된 신호(122) 및 제 2 역상관된 신호(124)를 결합기(140)에 제공하도록 구성된다. 제어기(130)는 오디오 신호(102)를 수신하고, 오디오 신호(102)의 상이한 부분들이 상이한 가중치 팩터들 a 또는 b와 곱해지도록 오디오 신호(102)를 분석함으로써 시변 가중치 팩터들 a 및 b를 제어하도록 구성된다. 따라서, 제어기(130)는 가중치 팩터들 a 및 b를 결정하도록 구성된 제어 유닛(132)을 포함한다. 제어기(130)는 주파수 도메인에서 동작하도록 구성될 수 있다. 제어 유닛(132)은 단기 푸리에 변환(STFT), 고속 푸리에 변환(FFT) 및/또는 정규의 푸리에 변환(FT)을 사용함으로써 오디오 신호(102)를 주파수 도메인으로 변환하도록 구성될 수 있다. 오디오 신호(102)의 주파수 도메인 표현은, 푸리에 변환들로부터 공지된 바와 같이 복수의 서브대역들을 포함할 수 있다. 각각의 서브대역은 오디오 신호의 일부를 포함한다. 대안적으로, 오디오 신호(102)는 주파수 도메인에서의 신호의 표현일 수 있다. 제어 유닛(132)은 오디오 신호의 디지털 표현의 각각의 서브대역에 대해 한 쌍의 가중치 팩터들 a 및 b를 제어 및/또는 결정하도록 구성될 수 있다.
결합기는 제 1 역상관된 신호(122), 제 2 역상관된 신호(124), 가중치 팩터들 a 및 b를 사용하여 오디오 신호(102)로부터 유도된 신호(136)를 가중적으로 결합하도록 구성된다. 오디오 신호(102)로부터 유도된 신호(136)는 제어기(130)에 의해 제공될 수 있다. 따라서, 제어기(130)는 선택적인 유도 유닛(134)을 포함할 수 있다. 유도 유닛(134)은 예를 들어, 오디오 신호(102)의 부분들을 적응, 수정 또는 향상시키도록 구성될 수 있다. 특히, 유도 유닛(110)은 신호 프로세서(110)에 의해 감쇠, 감소 또는 제거되는 오디오 신호(102)의 부분들을 증폭하도록 구성될 수 있다.
신호 프로세서(110)는 또한 주파수 도메인에서 동작하고, 오디오 신호(102)를 프로세싱하여, 신호 프로세서(110)가 오디오 신호(102)의 스펙트럼의 각각의 서브대역에 대한 과도 및 음조 부분들을 감소 또는 제거하도록 구성될 수 있다. 이것은, 과도 부분을 거의 또는 전혀 또는 음조 부분을 거의 또는 전혀(즉, 잡음) 포함하지 않는 서브대역에 대해서 프로세싱이 적거나 또는 프로세싱이 전혀 없는 것을 도출할 수 있다. 대안적으로, 결합기(140)는 유도된 신호 대신에 오디오 신호(102)를 수신할 수 있는데, 즉, 제어기(130)는 유도 유닛(134)없이 구현될 수 있다. 그러면, 신호(136)는 오디오 신호(102)와 동일할 수 있다.
그 다음, 결합기(140)는 가중치 팩터들 a 및 b를 포함하는 가중 신호(138)를 수신하도록 구성된다. 결합기(140)는 제 1 채널 y1 및 제 2 채널 y2를 포함하는 출력 오디오 신호(142)를 획득하도록 추가로 구성되어, 즉, 오디오 신호(142)는 2-채널 오디오 신호이다.
신호 프로세서(110), 역상관기(120), 제어기(130) 및 결합기(140)는 오디오 신호(102), 그로부터 유도된 신호(136) 및/또는 프로세싱된 신호들(112, 122 및/또는 124)을 프레임 단위 및 서브대역 단위로 프로세싱하여, 신호 프로세서(110), 역상관기(120), 제어기(130) 및 결합기(140)는 한번에 하나 이상의 주파수 대역들(신호의 부분들)을 프로세싱함으로써 각각의 주파수 대역에 대해 전술된 동작들을 실행하도록 구성될 수 있다.
도 2는 오디오 신호(102)를 향상시키기 위한 장치(200)의 개략적인 블록도를 도시한다. 장치(200)는 신호 프로세서(210), 역상관기(120), 제어기(230) 및 결합기(240)를 포함한다. 역상관기(120)는 r1로 표시된 제 1 역상관된 신호(122) 및 r2로 표시된 제 2 역상관된 신호(124)를 생성하도록 구성된다.
신호 프로세서(210)는 과도 프로세싱 스테이지(211), 음조 프로세싱 스테이지(213) 및 결합 스테이지(215)를 포함한다. 신호 프로세서(210)는 주파수 도메인에서 오디오 신호(102)의 표현을 프로세싱하도록 구성된다. 오디오 신호(102)의 주파수 도메인 표현은 다수의 서브대역들(주파수 대역들)을 포함하고, 여기서 과도 프로세싱 스테이지(211) 및 색조 프로세싱 스테이지(213)는 주파수 대역들 각각을 프로세싱하도록 구성된다. 대안적으로, 오디오 신호(102)의 주파수 변환에 의해 획득된 스펙트럼은, 특정 주파수 범위들 또는 주파수 대역들, 예를 들어, 20Hz, 50Hz 또는 100Hz 미만 및/또는 16 kHz, 18 kHz 또는 22 kHz 초과의 주파수 대역들을 추가적인 프로세싱으로부터 배제하기 위해 감소, 즉 커팅될 수 있다. 이것은, 감소된 계산 노력 및 그에 따른 더 신속한 및/또는 더 정확한 프로세싱을 허용할 수 있다.
과도 프로세싱 스테이지(211)는 프로세싱된 주파수 대역들 각각에 대해 주파수 대역이 과도 부분들을 포함하는지 여부를 결정하도록 구성된다. 음조 프로세싱 스테이지(213)는 주파수 대역들 각각에 대해 오디오 신호(102)가 주파수 대역에서 음조 부분들을 포함하는지 여부를 결정하도록 구성된다. 과도 프로세싱 스테이지(211)는 적어도 과도 부분들을 포함하는 주파수 대역들에 대해 스펙트럼 가중치 팩터들(217)을 결정하도록 구성되며, 스펙트럼 가중치 팩터들(217)은 각각의 주파수 대역과 연관된다. 도 6a 및 도 6b에서 설명되는 바와 같이, 과도 및 음조 특성들은 스펙트럼 프로세싱에 의해 식별될 수 있다. 과도 및/또는 음조의 레벨은 과도 프로세싱 스테이지(211) 및/또는 음조 프로세싱 스테이지(213)에 의해 측정되고 스펙트럼 가중치로 변환될 수 있다. 음조 프로세싱 스테이지(213)는 적어도 음조 부분들을 포함하는 주파수 대역들에 대한 스펙트럼 가중치 계수들(219)을 결정하도록 구성된다. 스펙트럼 가중치 팩터들(217 및 219)은 다수의 가능한 값들을 포함할 수 있고, 스펙트럼 가중치 팩터들(217 및/또는 219)의 크기는 주파수 대역에서의 과도 및/또는 음조 부분들의 양을 표시한다.
스펙트럼 가중치 팩터들(217, 219)은 절대 값 또는 상대 값을 포함할 수 있다. 예를 들어, 절대 값은 주파수 대역에서 과도 및/또는 음조 음향 에너지의 값을 포함할 수 있다. 대안적으로, 스펙트럼 가중치 팩터들(217 및/또는 219)은 0과 1 사이의 값과 같은 상대 값을 포함할 수 있고, 값 0은 주파수 대역이 과도 또는 음조 부분들을 전혀 또는 거의 포함하지 않음을 표시하고, 값 1은 많은 양의 또는 완전한 과도 및/또는 음조 부분들을 포함하는 주파수 대역을 표시한다. 스펙트럼 가중치 팩터들은, 3, 5, 10개의 수 또는 더 많은 값들(단계들), 예를 들어, (0, 0.3 및 1), (0.1, 0.2, ..., 1) 등과 같은 다수의 값들 중 하나를 포함할 수 있다. 스케일의 크기, 최소값과 최대값 사이의 단계들의 수는 적어도 0이지만, 바람직하게는 적어도 하나 및 더 바람직하게는 적어도 5일 수 있다. 바람직하게는, 다수의 스펙트럼 가중치들(217, 219)의 값들은 최소값, 최대 값 및 최소값과 최대값 사이의 값을 포함하는 적어도 3개의 값을 포함한다. 최소값과 최대값 사이의 더 많은 수의 값들은 주파수 대역들 각각의 더 연속적인 가중치들을 허용할 수 있다. 최소값 및 최대값은 0과 1 또는 다른 값들 사이의 스케일로 스케일링될 수 있다. 최대값은 최고 또는 최저 레벨의 과도 및/또는 음조를 표시할 수 있다.
결합 스테이지(215)는 후술되는 바와 같이 주파수 대역들 각각에 대한 스펙트럼 가중치들을 결합하도록 구성된다. 신호 프로세서(210)는 결합된 스펙트럼 가중치들을 주파수 대역들 각각에 적용하도록 구성된다. 예를 들어, 스펙트럼 가중치들(217 및/또는 219) 또는 그로부터 유도된 값은 프로세싱된 주파수 대역에서 오디오 신호(102)의 스펙트럼 값들과 곱해질 수 있다.
제어기(230)는 신호 프로세서(210)로부터 스펙트럼 가중치 팩터들(217, 219) 또는 그에 대한 정보를 수신하도록 구성된다. 유도된 정보는, 예를 들어, 표의 인덱스 번호일 수 있고, 인덱스 번호는 스펙트럼 가중치 팩터들과 연관된다. 제어기는 코히어런트 신호 부분들, 즉 과도 프로세싱 스테이지(211) 및/또는 음조 프로세싱 스테이지(213)에 의해 감소 또는 제거되지 않거나 부분적으로만 감소 또는 제거된 부분들에 대한 오디오 신호(102)를 향상시키도록 구성된다. 간단히 말해, 유도 유닛(234)은 신호 프로세서(210)에 의해 감소 또는 제거되지 않은 부분들을 증폭할 수 있다.
유도 유닛(234)은 z로 표시된 오디오 신호(102)로부터 유도된 신호(236)를 제공하도록 구성된다. 결합기(240)는 신호 z(236)를 수신하도록 구성된다. 역상관기(120)는 신호 프로세서(210)로부터 s로 표시된 프로세싱된 신호(212)를 수신하도록 구성된다.
결합기(240)는 제 1 채널 신호 y1 및 제 2-채널 신호 y2를 획득하기 위해 가중치 팩터들(스케일링 팩터들) a 및 b와 역상관된 신호들 r1 및 r2를 결합하도록 구성된다. 신호 채널들 y1 및 y2는 출력 신호(242)에 결합되거나 개별적으로 출력될 수 있다.
즉, 출력 신호(242)는 (통상적으로) 상관된 신호 z(236) 및 역상관된 신호 s(각각 r1 또는 r2)의 조합이다. 역상관된 신호는 2 단계, 즉, 첫째로 과도 및 음조 신호 성분들의 억제(감소 또는 제거) 및 둘째로 역상관에서 획득된다. 과도 신호 성분들 및 음조 신호 성분들의 억제는 스펙트럼 가중을 이용하여 수행된다. 신호는 주파수 도메인에서 프레임 단위로 프로세싱된다. 스펙트럼 가중치들은 각각의 주파수 빈(주파수 대역) 및 시간 프레임에 대해 컴퓨팅된다. 따라서, 오디오 신호는 전체 대역에서 프로세싱되는데, 즉 고려되는 모든 부분들이 프로세싱된다.
프로세싱의 입력 신호는 단일-채널 신호 x(102)일 수 있고, 출력 신호는 2-채널 신호 y = [y1, y2] 일 수 있고, 여기서 인덱스는 제 1 및 제 2 채널, 예를 들어, 스테레오 신호의 좌측 및 우측 채널을 표시한다. 출력 신호 y는 2-채널 신호 r = [r1, r2]와,
Figure pct00001
(1)
Figure pct00002
(2)
에 따른 스케일링 팩터들 a 및 b를 갖는 단일-채널 신호 z를 선형 결합함으로써 컴퓨팅될 수 있고,
여기서, "x"는 방정식 (1) 및 (2)의 곱셈 연산자를 나타낸다.
방정식 (1) 및 (2)는 질적으로 해석되어야 하며, 이는, 신호들 z, r1 및 r2의 셰어가 변하는 가중치 팩터들에 의해 제어(변경)될 수 있음을 표시한다. 예를 들어, 역수 값으로 나누는 것과 같은 역 연산들을 형성하는 것에 의해, 상이한 연산들을 수행함으로써 동일한 또는 동등한 결과들이 획득될 수 있다. 대안적으로 또는 추가적으로, 2-채널 신호 y를 획득하기 위해 스케일링 팩터들 a 및 b 및/또는 y1 및/또는 y2에 대한 값들을 포함하는 룩업 테이블이 사용될 수 있다.
스케일링 팩터들 a 및/또는 b는 인식된 상관 강도에 따라 단조적으로 감소하도록 컴퓨팅될 수 있다 인식된 강도에 대해 예측된 스칼라 값은 스케일링 팩터들을 제어하기 위해 사용될 수 있다.
r1 및 r2를 포함하는 역상관된 신호 r은 2 단계로 컴퓨팅될 수 있다. 먼저, 과도 및 음조 신호 성분들의 감쇠가 신호 s를 도출한다. 둘째로, 신호 s의 역상관이 수행될 수 있다.
과도 신호 성분들 및 음조 신호 성분들의 감쇠는, 예를 들어, 스펙트럼 가중을 이용하여 수행된다. 신호는 주파수 도메인에서 프레임 단위로 프로세싱된다. 스펙트럼 가중치들은 각각의 주파수 빈 및 시간 프레임에 대해 컴퓨팅된다. 감쇠의 목적은 두 가지이다.
1. 과도 또는 음조 신호 성분들은 통상적으로 소위 전경 신호들에 속하고, 따라서, 스테레오 이미지 내에서 이들의 위치는 종종 중앙이다.
2. 강한 과도 신호 성분들을 갖는 신호들의 역상관은 인식가능한 아티팩트들을 초래한다. 강한 음조 신호 성분들을 갖는 신호들의 역상관은 또한, 풍부한 신호 스펙트럼(가능하게는 불협화음) 배음(overtone)들로 인해 음색의 변경이 아닌 주파수의 변경으로 인식될 만큼 적어도 주파수 변조가 충분히 느린 경우, 음조 성분들(즉, 사인 곡선들)이 주파수 변조될 때 인식가능한 아티팩트들을 초래한다.
상관된 신호 z는 과도 및 음조 신호 성분들을 향상시키는 프로세싱, 예를 들어 신호 s를 컴퓨팅하기 위한 억제의 역수를 질적으로 적용함으로써 획득될 수 있다. 대안적으로, 예를 들어 프로세싱되지 않은 입력 신호가 그대로 사용될 수 있다. z가 또한 2-채널 신호인 경우가 존재할 수 있음을 주목한다. 실제로, 많은 저장 매체(예를 들어, 콤팩트 디스크)는 신호가 모노인 경우에도 2 개의 채널들을 사용한다. 두 개의 동일한 채널들을 갖는 신호는 "듀얼-모노"로 지칭된다. 입력 신호 z가 스테레오 신호인 경우가 또한 존재할 수 있고, 프로세싱의 목적은 스테레오 효과를 증가시키는 것일 수 있다.
인식된 역상관 강도는 EP 2 541 542 A1에 설명된 바와 같이, 라우드니스 계산 모델들을 사용하여 예측되는 인식된 늦은 반향 강도와 유사하게 예측될 수 있다.
도 3은 예측되는 인식된 역상관 강도의 레벨에 기초한 스케일링 팩터들(가중치 팩터들) a 및 b의 컴퓨팅을 표시하는 예시적인 표를 도시한다.
예를 들어, 인식된 역상관 강도는, 그 강도의 값이, 인식된 낮은 역상관 레벨을 표시하는 0의 값, 넌(none) 각각과, 높은 역상관 레벨을 표시하는 10의 값 사이에서 변할 수 있는 스칼라 값을 포함하도록 예측될 수 있다. 레벨들은 예를 들어 청취자 테스트들 또는 예측 시뮬레이션에 기초하여 결정될 수 있다. 대안적으로, 역상관 레벨의 값은 최소값과 최대값 사이의 범위를 포함할 수 있다. 인식되는 역상관 레벨의 값은 최소값 및 최대값보다 많은 값을 수용하도록 구성될 수 있다. 바람직하게는, 인식된 상관 레벨은 적어도 3 개의 상이한 값들 및 더 바람직하게는 적어도 7 개의 상이한 값들을 수용할 수 있다.
인식된 역상관의 결정된 레벨에 기초하여 적용될 가중치 팩터들 a 및 b는 메모리에 저장될 수 있고, 제어기(130 또는 230)에 대해 액세스가능할 수 있다. 인식된 역상관 레벨들이 증가함에 따라, 오디오 신호 또는 결합기에 의해 그로부터 유도된 신호와 곱해질 스케일링 팩터들 a가 또한 증가할 수 있다. 인식된 역상관의 증가된 레벨은, 역상관 레벨들이 증가함에 따라, 오디오 신호 또는 그로부터 유도된 신호가 출력 신호(142 또는 242)에 더 높은 셰어를 포함하도록 "신호가 이미 (부분적으로) 역상관된 것"으로 해석될 수 있다. 역상관 레벨들이 증가함에 따라, 가중치 팩터 b는 감소되도록 구성되어, 즉, 신호 프로세서의 출력 신호에 기초하여 역상관기에 의해 생성된 신호 r1 및 r2는 결합기(140 또는 240)에서 결합되는 경우 더 낮은 셰어를 포함할 수 있다 .
가중치 팩터 a는, 적어도 1(최소값) 및 최대 9(최대값)의 스칼라 값을 포함하는 것으로 도시되어 있다. 가중치 팩터 b는 최소값 2 및 최대값 8을 포함하는 범위에서 스칼라 값을 포함하는 것으로 도시되어 있지만, 가중치 팩터들 a 및 b 둘 모두는 최소값 및 최대값을 포함하는 범위 내의 값, 바람직하게는 최소값과 최대값 사이의 적어도 하나의 값을 포함할 수 있다. 도 3에 도시된 가중치 팩터들 a 및 b의 값들에 대한 대안으로, 인식된 역상관 레벨이 증가함에 따라, 가중치 팩터 a는 선형으로 증가할 수 있다. 대안적으로 또는 추가적으로, 인식된 역상관 레벨이 증가함에 따라, 가중치 팩터 b는 선형으로 감소할 수 있다. 또한, 인식된 역상관의 레벨에 대해, 프레임에 대해 결정된 가중치 팩터들 a 및 b의 합은 일정하거나 거의 일정할 수 있다. 예를 들어, 인식된 역상관 레벨이 증가함에 따라, 가중치 팩터 a는 0부터 10까지 증가할 수 있고, 가중치 팩터 b는 10의 값부터 0의 값으로 감소할 수 있다. 가중치 팩터들 둘 모두가 선형으로, 예를 들어, 스텝 사이즈 1로 감소 또는 증가하면, 가중치 팩터들 a 및 b의 합은 인식된 역상관의 각각의 레벨에 대해 10의 값을 포함할 수 있다. 적용될 가중치 팩터들 a 및 b는 시뮬레이션 또는 실험에 의해 결정될 수 있다.
도 4a는, 예를 들어, 제어기(130 및/또는 230)에 의해 실행될 수 있는 방법(400)의 일부의 개략적인 흐름도를 도시한다. 제어기는, 예를 들어, 도 3에 도시된 바와 같이 스칼라 값을 도출하는 단계(410)에서 인식된 역상관 레벨에 대한 측정치를 결정하도록 구성된다. 단계(420)에서, 제어기는 결정된 측정치를 임계 값과 비교하도록 구성된다. 측정치가 임계 값보다 높으면, 제어기는 단계(430)에서 가중치 팩터들 a 및/또는 b를 수정 또는 적응시키도록 구성된다. 단계(430)에서, 제어기는 a 및 b에 대한 기준값에 대해 가중치 팩터 b를 감소시키거나, 가중치 팩터 a를 증가시키거나, 가중치 팩터 b를 감소시키고 가중치 팩터 a를 증가시키도록 구성된다. 예를 들어, 임계치는, 예를 들어, 오디오 신호의 주파수 대역들 내에서 변할 수 있다. 예를 들어, 임계치는, 저레벨의 역상관이 선호되거나 목표임을 표시하는 현저한 음원 신호를 포함하는 주파수 대역들에 대해 낮은 값을 포함할 수 있다. 대안적으로 또는 추가적으로 임계치는, 고레벨의 역상관이 선호되는 것을 표시하는 현저하지 않은 음원 신호를 포함하는 주파수 대역들에 대해 높은 값을 포함할 수 있다.
현저하지 않은 음원 신호들을 포함하는 주파수 대역들의 상관을 증가시키고 현저한 음원 신호들을 포함하는 주파수 대역들에 대한 역상관을 제한하는 것이 목표일 수 있다. 임계치는 예를 들어, 가중치 팩터들 a 및/또는 b가 수용할 수 있는 값들의 범위의 20 %, 50 % 또는 70 %일 수 있다. 예를 들어, 도 3을 참조하면, 현저한 음원 신호를 포함하는 주파수 프레임에 대해 임계 값은 7보다 낮거나, 5보다 낮거나 3보다 낮을 수 있다. 인식된 역상관 레벨이 너무 높으면, 단계(430)를 실행함으로써, 인식된 역상관 레벨이 감소될 수 있다. 가중치 팩터들 a 및 b는 단독으로 또는 한번에 둘 모두가 변경될 수 있다. 도 3에 도시된 표는 예를 들어, 제어기에 의해 적응될 초기 값들인 가중치 팩터들 a 및/또는 b에 대한 초기 값들을 포함하는 값일 수 있다.
도 4b는, 인식된 역상관 레벨에 대한 측정치(단계(410)에서 결정됨)가 임계 값에 비교되고, 측정치가 임계 값보다 낮은 경우(단계(440))를 묘사하는 방법(400)의 추가적인 단계들의 개략적인 흐름도를 도시한다. 제어기는, 인식된 역상관 레벨을 증가시키기 위해 a 및 b에 대한 기준에 대해 b를 증가시키거나, a를 감소시키거나, b를 증가시키키고 a를 감소시키도록 구성되고, 측정치가 적어도 임계 값인 값을 포함하도록 구성된다.
대안적으로 또는 추가적으로, 제어기는 2-채널 오디오 신호의 인식된 역상관 레벨이 타겟 값 주위의 일정 범위 내에 유지되도록 가중치 팩터들 a 및 b를 스케일링하도록 구성될 수 있다. 타겟 값은 예를 들어 임계 값일 수 있고, 임계 값은, 가중치 팩터들 및/또는 스펙트럼 가중치들이 결정되는 주파수 대역에 포함되는 신호의 타입에 기초하여 변할 수 있다. 타겟 값 주위의 범위는 타겟 값의 ± 20 %, ± 10 % 또는 ± 5 %까지 확장될 수 있다. 이것은, 인식된 역상관이 대략 타겟 값(임계치)인 경우 가중치 팩터들을 적응시키는 것을 중단하도록 허용할 수 있다.
도 5는 역상관기(120)로서 동작하도록 구성될 수 있는 역상관기(520)의 개략적인 블록도를 도시한다. 역상관기(520)는 제 1 역상관 필터(526) 및 제 2 역상관 필터(524 )를 포함한다. 제 1 역상관 필터(526) 및 제 2 역상관 필터(528) 둘 모두는 예를 들어 신호 프로세서로부터 프로세싱된 신호 s(512)를 수신하도록 구성된다. 역상관기(520)는 프로세싱된 신호(512)를 제 1 역상관 필터(526)의 출력 신호(523)와 결합하여 제 1 역상관된 신호(522)(r1)를 획득하고, 제 2 역상관 필터(528)의 출력 신호(525)와 결합하여 제 2 역상관된 신호(524)(r2)를 획득한다. 신호들의 결합을 위해, 역상관기(520)는 신호들을 임펄스 응답들과 컨벌루션하고 그리고/또는 스펙트럼 값들을 실수 및/또는 허수 값들과 곱하도록 구성될 수 있다. 대안적으로 또는 추가적으로, 나누기, 합, 차 등과 같은 다른 연산들이 실행될 수 있다.
역상관 필터들(526 및 528)은 프로세싱된 신호(512)를 반향 또는 지연시키도록 구성될 수 있다. 역상관 필터들(526 및 528)은 유한 임펄스 응답(FIR) 및/또는 무한 임펄스 응답(IIR) 필터를 포함할 수 있다. 예를 들어, 역상관 필터(526 및 528)는 프로세싱된 신호(512)를, 시간 및/또는 주파수에 걸쳐 감쇠 또는 지수함수적으로 감쇠하는 잡음 신호로부터 획득된 임펄스 응답과 컨벌루션하도록 구성될 수 있다. 이것은, 신호(512)에 대한 반향을 포함하는 역상관된 신호(523 및/또는 525)를 생성하도록 허용한다. 반향 신호의 반향 시간은, 예를 들어, 50 내지 1000 ms, 80 내지 500 ms 및/또는 120 내지 200 ms의 값을 포함할 수 있다. 반향 시간은, 반향의 전력이 임펄스에 의해 여기된 후 작은 값으로 감쇠하는데 소요되는, 예를 들어, 초기 전력보다 60 dB 아래로 감쇠하는데 소요되는 지속기간으로 이해될 수 있다. 바람직하게는, 역상관 필터들(526 및 528)은 IIR-필터들을 포함한다. 이것은, (제로-) 필터 계수들에 대한 계산들이 생략될 수 있도록 필터 계수들 중 적어도 일부가 제로로 설정되는 경우 계산량을 감소시키도록 허용한다. 선택적으로, 역상관 필터는 하나보다 많은 필터를 포함할 수 있고, 여기서 필터들은 직렬 및/또는 병렬로 접속된다.
즉, 반향은 역상관 효과를 포함한다. 역상관기는 역상관할 뿐만 아니라 울림(sonority)을 오직 약간 변경하도록 구성될 수 있다. 기술적으로, 반향은 임펄스 응답을 고려하여 특성화될 수 있는 선형 시간 불변(LTI) 시스템으로 간주될 수 있다. 임펄스 응답의 길이는 종종 반향에 대해 RT60으로 언급된다. 이것은, 그 이후 임펄스 응답이 60 dB만큼 감소되는 시간이다. 반향은 최대 1 초 또는 심지어 최대 몇 초의 길이를 가질 수 있다. 반향과 유사한 구조를 포함하지만, 임펄스 응답의 길이에 영향을 미치는 파라미터들에 대한 상이한 세팅들을 포함하는 역상관기가 구현될 수 있다.
도 6a는 적어도 하나의 과도(단기) 신호 부분들을 포함하는 오디오 신호(602a)의 스펙트럼을 포함하는 개략도를 도시한다. 과도 신호 부분은 광대역 스펙트럼을 도출한다. 스펙트럼은 주파수들 f에 걸쳐 크기들 S(f)로 도시되며, 여기서 스펙트럼은 다수의 주파수 대역들 b1-3으로 세분화된다. 과도 신호 부분은 b1-3에서 주파수 대역들 중 하나 이상에서 결정될 수 있다.
도 6b는 음조 성분을 포함하는 오디오 신호(602b)의 개략적인 스펙트럼을 도시한다. 스펙트럼의 예는 7 개의 주파수 대역들 fb1-7로 도시되어 있다. 주파수 대역 fb4는 주파수 대역들 fb1-7의 중앙에 배열되고 다른 주파수 대역들 fb1-3 및 fb5-7에 비해 최대 크기 S(f)를 포함한다. 중심 주파수(주파수 대역 fb5)에 대해 증가하는 거리를 갖는 주파수 대역들은, 감소하는 크기들을 갖는 음조 신호의 고조파 반복들을 포함한다. 신호 프로세서는, 예를 들어, 크기 S(f)를 평가함으로써 음조 성분을 결정하도록 구성될 수 있다. 음조 성분의 증가하는 크기 S(f)는 감소된 스펙트럼 가중치 팩터들만큼 신호 프로세서에 의해 통합될 수 있다. 따라서, 주파수 대역 내에서 과도 및/또는 음조 성분들의 셰어가 높을수록, 신호 프로세서의 프로세싱된 신호에서 주파수 대역이 덜 기여할 수 있다. 예를 들어, 주파수 대역 fb4에 대한 스펙트럼 가중치는, 제로의 값 또는 제로에 가까운 값, 또는 주파수 대역 fb4가 낮은 셰어를 갖는 것으로 고려되는 것을 표시하는 다른 값을 포함할 수 있다.
도 7a는 신호 프로세서(110 및/또는 210)와 같은 신호 프로세서에 의해 수행되는 가능한 과도 프로세싱(211)을 예시하는 개략적인 표를 도시한다. 신호 프로세서는 고려되는 주파수 도메인에서 오디오 신호의 표현의 주파수 대역들 각각에서 과도 성분들의 양, 예를 들어, 셰어를 결정하도록 구성된다. 평가는 적어도 최소값(예를 들어, 1) 및 최대값(예를 들어, 15)을 포함하는 스타터 값으로 과도 성분들의 양을 결정하는 것을 포함할 수 있고, 더 높은 값은 주파수 대역 내의 더 많은 양의 과도 성분들을 표시할 수 있다. 주파수 대역에서 과도 성분들의 양이 많을수록, 각각의 스펙트럼 가중치, 예를 들어, 스펙트럼 가중치(217)는 더 낮을 수 있다. 예를 들어, 스펙트럼 가중치는 적어도 0과 같은 최소값 및 최대 1과 같은 최대값의 값을 포함할 수 있다. 스펙트럼 가중치는 최소값과 최대값 사이에 복수의 값들을 포함할 수 있고, 스펙트럼 가중치는 고려사항 팩터 및/또는 추후 프로세싱을 위한 주파수 대역의 고려사항 팩터를 표시할 수 있다. 예를 들어, 0의 스펙트럼 가중치는, 주파수 대역이 완전히 감쇠되는 것을 표시할 수 있다. 대안적으로, 또한 다른 스케일링 범위들이 구현될 수 있는데, 즉, 도 7a에 도시된 표는 과도 주파수 대역인 주파수 대역 및/또는 스펙트럼 가중치의 스텝 사이즈의 평가에 대해 다른 스텝 사이즈들을 갖는 표들로 스케일링 및/또는 변환될 수 있다. 스펙트럼 가중치는 연속적으로 변할 수 있다.
도 7b는, 예를 들어, 음조 프로세싱 스테이지(213)에 의해 실행될 수 있는 가능한 음조 프로세싱을 예시하는 예시적인 표를 도시한다. 주파수 대역 내에서 음조 성분들의 양이 많을수록, 각각의 스펙트럼 가중치(219)는 더 낮을 수 있다. 예를 들어, 주파수 대역의 음조 성분들의 양은 최소값 1과 최대값 8 사이에서 스케일링될 수 있고, 최소값은, 주파수 대역에 음조 성분들이 전혀 또는 거의 전혀 포함되지 않는 것을 표시한다. 최대값은, 주파수 대역이 많은 양의 음조 성분들을 포함한다는 것을 표시할 수 있다. 스펙트럼 가중치(219)와 같은 각각의 스펙트럼 가중치는 또한 최소값 및 최대값을 포함할 수 있다. 최소값(예를 들어, 0.1)은, 주파수 대역이 거의 완전히 또는 완전히 감쇠된 것을 표시할 수 있다. 최대값은, 주파수 대역이 거의 감쇠 또는 완전히 감쇠된 것을 표시할 수 있다. 스펙트럼 가중치(219)는 최소값, 최대값 및 바람직하게는 최소값과 최대값 사이의 적어도 하나의 값을 포함하는 다수의 값들 중 하나를 수용할 수 있다. 대안적으로, 스펙트럼 가중치가 고려 팩터가 되도록 음조 주파수 대역들의 감소된 셰어에 대해 스펙트럼 가중치가 감소할 수 있다.
신호 프로세서는, 신호 프로세서(210)에 대해 설명된 바와 같이, 과도 프로세싱을 위한 스펙트럼 가중치 및/또는 음조 프로세싱을 위한 스펙트럼 가중치를 주파수 대역의 스펙트럼 값들과 결합하도록 구성될 수 있다. 예를 들어, 프로세싱된 주파수 대역에 대해, 스펙트럼 가중치(217 및/또는 219)의 평균값은 결합 스테이지(215)에 의해 결정될 수 있다. 주파수 대역의 스펙트럼 가중치들은 오디오 신호(102)의 스펙트럼 값들과 결합되거나, 예를 들어 곱해질 수 있다. 대안적으로, 결합 스테이지는, 스펙트럼 가중치들(217 및 219) 둘 모두를 비교하고, 그리고/또는 둘 모두의 더 낮은 또는 더 높은 스펙트럼 가중치를 선택하고, 선택된 스펙트럼 가중치를 스펙트럼 값들과 결합하도록 구성될 수 있다. 대안적으로, 스펙트럼 가중치들은 상이하게, 예를 들어 합, 차, 몫 또는 팩터로서 결합될 수 있다.
오디오 신호의 특성은 시간이 지남에 따라 변할 수 있다. 예를 들어, 라디오 방송 신호는 먼저 음성 신호(현저한 음원 신호)를, 그리고 그 후 음악 신호(현저하지 않은 음원 신호)를 포함할 수 있거나 또는 그 반대일 수 있다. 또한, 음성 신호 및/또는 음악 신호 내의 변동들이 발생할 수 있다. 이것은, 스펙트럼 가중치들 및/또는 가중치 팩터들의 급격한 변화들을 초래할 수 있다. 신호 프로세서 및/또는 제어기는, 예를 들어, 2 개의 신호 프레임들 사이의 최대 스텝 사이즈를 제한함으로써, 2 개의 프레임들 사이의 변동들을 감소 또는 제한하기 위해 스펙트럼 가중치들 및/또는 가중치 팩터들을 추가적으로 적응시키도록 구성될 수 있다. 오디오 신호의 하나 이상의 프레임들은 일정 시간 기간에서 합산될 수 있고, 신호 프로세서 및/또는 제어기는 이전 시간 기간, 예를 들어 하나 이상의 이전 프레임들의 스펙트럼 가중치들 및/또는 가중치 팩터들을 비교하고, 실제 시간 기간에 대해 결정된 스펙트럼 가중치들 및/또는 가중치 팩터들의 차이가 임계 값을 초과하는지 여부를 결정하도록 구성될 수 있다. 임계 값은, 예를 들어, 청취자에게 성가신 효과들을 초래하는 값을 표현할 수 있다. 신호 프로세서 및/또는 제어기는 이러한 성가신 효과들이 감소 또는 방지되도록 변동들을 제한하도록 구성될 수 있다. 대안적으로, 차이 대신에, 비율과 같은 다른 수학적 표현들이 스펙트럼 가중치들 및/또는 이전 및 실제 시간 기간의 가중치 팩터들을 비교하기 위해 또한 결정될 수 있다.
즉, 음조 및/또는 과도 특성들의 양을 포함하는 특징이 각각의 주파수 대역에 할당된다.
도 8은 오디오 신호(102)를 향상시키기 위한 장치(801)를 포함하는 음향 향상 시스템(800)의 개략적인 블록도를 도시한다. 음향 향상 시스템(800)은, 오디오 신호를 수신하고 오디오 신호를 장치(801)에 제공하도록 구성되는 신호 입력(106)을 포함한다. 음향 향상 시스템(800)은 2 개의 스피커들(808a 및 808b)을 포함한다. 스피커(808a)는 신호 y1을 수신하도록 구성된다. 스피커(808b)는, 스피커들(808a 및 808b)을 이용하여 신호 y1 및 y2가 음파 또는 신호들로 전달될 수 있도록 신호 y2를 수신하도록 구성된다. 신호 입력(106)은 유선 또는 무선 신호 입력, 예를 들어, 라디오 안테나일 수 있다. 장치(801)는 예를 들어 장치(100 및/또는 200)일 수 있다.
상관된 신호 z는 과도 및 음조 성분들을 향상시키는 프로세싱(신호 s를 컴퓨팅하기 위한 억제의 질적 역수)을 적용함으로써 획득될 수 있다. 결합기에 의해 수행되는 결합은 y (y1/y2) = 스케일링 팩터 1·z + 스케일링 팩터 2·스케일링 팩터 (r1/r2)로 선형적으로 표현될 수 있다. 스케일링 팩터들은 인식된 역상관 강도를 예측함으로써 획득될 수 있다.
대안적으로, 신호들 y1 및/또는 y2는 스피커(808a 및/또는 808b)에 의해 수신되기 전에 추가로 프로세싱될 수 있다. 예를 들어, 신호 y1 및/또는 y2는, 신호 y1 및/또는 y2를 프로세싱함으로써 유도된 신호 또는 신호들이 스피커들(808a 및/또는 808b)에 제공되도록 증폭, 등화 등이 될 수 있다.
오디오 신호에 추가된 인공 반향은 반향의 레벨이 가청적이지만 너무 크지(집중적인 것) 않도록 구현될 수 있다. 가청적인 또는 성가신 레벨들은 테스트들 및/또는 시뮬레이션들에서 결정될 수 있다. 너무 높은 레벨은, 명확성이 떨어지는 것, 타악기 음향이 시간상 흐려지는 것 등으로 인해 양호하게 들리지 않는다. 타겟 레벨은 입력 신호에 의존할 수 있다. 입력 신호가 적은 양의 과도들을 포함하고 주파수 변조들에 의해 적은 양의 음조들을 포함하면, 반향은 더 낮은 정도로 가청적이고 레벨은 증가될 수 있다. 역상관기는 유사한 활성 원리를 포함할 수 있기 때문에, 이것은 역상관에도 유사하게 적용된다. 따라서, 역상관기의 최적의 강도는 입력 신호에 의존할 수 있다. 컴퓨팅은 수정된 파라미터들에 의해 동일할 수 있다. 신호 프로세서 및 제어기에서 실행되는 역상관은, 구조적으로 동일할 수 있지만 상이한 파라미터 세트들로 동작되는 2 개의 역상관기들에 의해 수행될 수 있다. 역상관 프로세서들은 2-채널 스테레오 신호들로 제한되는 것이 아니라 2 개보다 많은 신호들을 갖는 채널에 또한 적용될 수 있다. 역상관은, 모든 신호 쌍들의 역상관에 대해 최대 모든 값들을 포함할 수 있는 상관 메트릭들로 정량화될 수 있다.
발명된 방법의 발견은, 공간 큐를 생성하고 공간 큐를 신호에 도입하여, 프로세싱된 신호가 스테레오 신호의 감각을 생성하게 하는 것이다. 프로세싱은 하기 기준에 따라 설계된 것으로 간주될 수 있다.
1. 높은 강도(또는 라우드니스 레벨)를 갖는 직접적인 음원들은 중앙에 로컬라이징된다. 이들은 현저한 직접적인 음원들, 예를 들어, 음악 녹음에서 가수 또는 큰 소리의 악기이다.
2. 주변 음향들은 확산되는 것으로 인식된다.
3. 낮은 강도(즉, 낮은 라우드니스 레벨들)를 갖는 직접적인 음원에 가능하게는 주변 음향들보다 더 작은 범위까지 확산도가 추가된다.
4. 프로세싱은 자연스럽게 들려야 하고 아티팩트들을 도입해서는 안된다.
설계 기준은, 오디오 녹음의 생성에서의 통상적인 관례 및 스테레오 신호들의 신호 특성들과 일치한다.
1. 현저한 직접적인 음향들은 통상적으로 중앙으로 패닝되는데(panned), 즉, 이들은 무시가능한 ICLD 및 ICTD와 혼합된다. 이러한 신호들은 높은 코히어런스를 나타낸다.
2. 주변 음향들은 낮은 코히어런스를 나타낸다.
3. 예를 들어, 오케스트라와 협연하는 오페라 가수와 같은 반향 환경에서 다수의 직접적인 소스들을 녹음하는 경우, 각각의 직접적인 음향의 확산양은 소스들의 마이크로폰들까지의 거리와 관련되는데, 이는, 마이크로폰까지의 거리가 증가하는 경우 직접적인 신호와 반향 사이의 비율이 감소하기 때문이다. 따라서 낮은 강도로 캡쳐된 음향들은 통상적으로 직접적인 음향들보다 코히어런트가 낮다(즉, 반대로 더 많이 확산된다).
프로세싱은 역상관을 이용하여 공간 정보를 생성한다. 즉, 입력 신호들의 ICC는 감소된다. 오직 극단적인 경우들에서만, 역상관이 완전히 미상관된 신호들을 초래한다. 통상적으로, 부분적인 역상관이 달성되고 바람직하다. 프로세싱은 지향성 큐(즉, ICLD 및 ICTD)를 조작하지 않는다. 이러한 제한의 이유는, 직접적인 음원의 원래의 또는 의도된 위치에 대한 어떠한 정보도 이용가능하지 않기 때문이다.
상기 설계 기준에 따르면, 역상관은 다음과 같은 혼합 신호 내의 신호 성분들에 대해 선택적으로 적용된다:
1. 설계 기준 1에서 논의된 바와 같이 신호 성분들에 대해 역상관이 전혀 또는 거의 적용되지 않는다.
2. 설계 기준 2에서 논의된 바와 같이 신호 성분들에 대해 역상관이 적용된다. 이러한 역상관은 프로세싱의 출력에서 획득되는 혼합 신호의 인식된 폭에 크게 기여한다.
역상관은 설계 기준 3에서 논의된 바와 같이 신호 성분들에 적용되지만, 설계 기준 2에서 논의된 바와 같은 신호 성분들에 대한 것보다 더 적은 정도로 적용된다.
이러한 프로세싱은, 입력 신호 x를 전경 신호 xa 및 배경 신호 xb의 가산적 혼합물, 즉, x = xa + xb로 표현하는 신호 모델을 이용하여 예시된다. 설계 기준 1에서 논의된 바와 같이 전경 신호는 모든 신호 성분들을 포함한다. 설계 기준 2에서 논의된 바와 같이 배경 신호는 모든 신호 성분들을 포함한다. 설계 기준 3에서 논의된 바와 같은 모든 신호 성분들은 분리된 신호 성분들 중 어느 하나에 배타적으로 할당되는 것이 아니라 전경 신호 및 배경 신호에 부분적으로 포함된다.
출력 신호 y는 y = ya + yb로 계산되며, 여기서 yb는 xb를 역상관함으로써 계산되고 ya는 ya = xa 또는 xa를 역상관함으로써 계산된다. 즉, 배경 신호는 역상관을 이용하여 프로세싱되고 전경 신호는 역상관을 이용하여 프로세싱되지 않거나, 역상관에 의해 프로세싱되지만 배경 신호보다 더 적은 정도로 프로세싱된다. 도 9b는 이러한 프로세싱을 예시한다.
이러한 접근법은 상기 설계 기준을 충족시키는 것에 머물지 않는다. 추가적인 이점은, 전경 신호는 역상관을 적용하는 경우 원하지 않게 착색되기 쉬울 수 있는 한편, 배경은 이러한 가청적 아티팩트들을 도입함이 없이 역상관될 수 있다는 점이다. 따라서, 설명된 프로세싱은 혼합물의 모든 신호 성분들에 대해 역상관을 동일하게 적용하는 프로세싱에 비해 더 양호한 음질을 도출한다.
지금까지 입력 신호는, 개별적으로 프로세싱되고 출력 신호로 결합되는 "전경 신호" 및 "배경 신호"로 표시된 2 개의 신호들로 분해되었다. 동일한 근거를 따르는 동등한 방법들이 실현가능한 것을 주목해야 한다.
신호 분해는 반드시 오디오 신호, 즉 시간 경과에 따른 파형의 형상과 유사한 신호들을 출력하는 프로세싱일 필요는 없다. 그 대신, 신호 분해는, 역상관 프로세싱에 대한 입력으로 사용될 수 있고 후속적으로 파형 신호로 변환될 수 있는 임의의 다른 신호 표현을 도출할 수 있다. 이러한 신호 표현의 예는 단기 푸리에 변환에 의해 컴퓨팅되는 스펙트로그램이다. 일반적으로, 가역 및 선형 변환들은 적절한 신호 표현들을 도출한다.
대안적으로, 공간 큐는 입력 신호 x에 기초하여 스테레오 정보를 생성함으로써 선행적인 신호 분해없이 선택적으로 생성된다. 유도된 스테레오 정보는 시변 및 주파수 선택적 값들로 가중되고, 입력 신호와 결합된다. 시변 및 주파수-선택적 가중치 팩터들은, 이들이 배경 신호가 지배적인 시간-주파수 영역들에서는 크고 전경 신호가 지배적인 시간-주파수 영역들에서는 작도록 컴퓨팅된다. 이것은, 배경 신호와 전경 신호의 시변 및 주파수-선택적 비율을 정량화함으로써 공식화될 수 있다. 가중치 팩터들은 예를 들어, 단조적으로 증가하는 함수들을 이용하여 배경-대-전경 비율로부터 컴퓨팅될 수 있다.
대안적으로, 선행적인 신호 분해는 2 개보다 많은 분리된 신호들을 도출할 수 있다.
도 9a 및 도 9b는, 예를 들어, 신호들 중 하나에서 음조 과도 부분들을 억제(감소 또는 제거)함으로써 입력 신호를 전경 및 배경 신호로 분리하는 것을 예시한다.
입력 신호가 전경 신호 및 배경 신호의 가산적인 혼합이라는 가정을 사용함으로써 단순화된 프로세싱이 유도된다. 도 9b는 이를 예시한다. 여기서, 여기서, 분리 1은 전경 신호 또는 배경 신호 중 어느 하나의 분리를 표시한다. 전경 신호가 분리되면, 출력 1은 전경 신호를 표시하고 출력 2는 배경 신호이다. 배경 신호가 분리되면, 출력 1은 배경 신호를 표시하고 출력 2는 전경 신호이다.
신호 분리 방법의 설계 및 구현은 전경 신호들 및 배경 신호들이 별개의 특성들을 갖는다는 발견에 기초한다. 그러나, 이상적인 분리로부터의 편차들, 즉 현저한 직접적인 음원들의 신호 성분들의 배경 신호로의 누설 또는 주변 신호 성분들의 전경 신호로의 누설은 수용가능하고, 반드시 최종적 결과의 음질을 손상시키지는 않는다.
시간적 특성들에 대하여, 일반적으로 전경 신호들의 서브대역 신호들의 시간적 엔빌로프들은, 배경 신호들의 서브대역 신호들의 시간 엔빌로프들보다 더 강한 진폭 변조들을 특징으로 하는 것이 관측될 수 있다. 반대로, 배경 신호들은 통상적으로 전경 신호들보다 덜 과도적(또는 타악기적, 즉 더 지속적)이다.
스펙트럼 특성들의 경우, 일반적으로 전경 신호들이 더 음조성일 수 있음이 관측될 수 있다. 반대로, 배경 신호들은 통상적으로 전경 신호들보다 더 잡음이 많다.
위상 특성들에 대해, 일반적으로 배경 신호들의 위상 정보는 전경 신호들보다 더 잡음이 많은 것이 관측될 수 있다. 전경 신호들의 많은 예들에 대한 위상 정보는 다수의 주파수 대역들에 걸쳐 일치한다.
현저한 음원 신호들과 유사한 특성들을 특징으로 하는 신호들은 배경 신호들보다 전경 신호들일 가능성이 높다. 현저한 음원 신호들은 음조 신호 성분과 잡음 신호 성분 사이의 전이들로 특성화되는데, 음조 신호 성분들은, 강하게 변조된 기본 주파수를 갖는 시변 필터링된 펄스 열(train)들이다. 스펙트럼 프로세싱은 이러한 특성들에 기초할 수 있고, 분해는 스펙트럼 감산 또는 스펙트럼 가중을 이용하여 구현될 수 있다.
스펙트럼 감산은, 예를 들어, 입력 신호의 연속적인(가능하게는 중첩하는) 부분들의 짧은 프레임들의 스펙트럼들이 프로세싱되는 주파수 도메인에서 수행된다. 기본 원리는, 원하는 신호와 간섭 신호의 가산적인 혼합으로 가정되는 입력 신호들의 크기 스펙트럼들로부터 간섭 신호의 크기 스펙트럼의 추정치를 감산하는 것이다. 전경 신호 분리의 경우, 원하는 신호는 전경이고 간섭 신호는 배경 신호이다. 배경 신호 분리의 경우, 원하는 신호는 배경이고 간섭 신호는 전경 신호이다.
스펙트럼 가중(또는 단기 스펙트럼 감쇠)은 동일한 원리를 따르고, 입력 신호 표현을 스케일링함으로써 간섭 신호를 감쇠시킨다. 입력 신호 x(t)는 단기 푸리에 변환(STFT), 필터 뱅크, 또는 주파수 대역 인덱스 n 및 시간 인덱스 k를 갖는 다중 주파수 대역들 X(n, k)을 갖는 신호 표현을 유도하기 위한 임의의 다른 수단을 사용하여 변환된다. 입력 신호들의 주파수 도메인 표현들은, 서브대역 신호들이 시변 가중치들 G(n, k)로 스케일링되도록 프로세싱된다.
Figure pct00003
(3)
가중치 연산 Y(n, k)의 결과는 출력 신호의 주파수 도메인 표현이다. 출력 시간 신호 y(t)는 주파수 도메인 변환의 역 프로세싱, 예를 들어, 역 STFT를 사용하여 컴퓨팅된다. 도 10은 스펙트럼 가중을 예시한다.
역상관은, 상호 (부분적으로 또는 완전히) 미상관되지만 입력 신호와 유사하게 들리는 다수의 출력 신호들이 획득되도록 하나 이상의 동일한 입력 신호를 프로세싱하는 것을 지칭한다. 2 개의 신호들 사이의 상관은 상관 계수 또는 정규화된 상관 계수를 이용하여 측정될 수 있다. 2 개의 신호들 X1(n, k) 및 X2(n, k)에 대한 주파수 대역들에서 정규화된 상관 계수 NCC는,
Figure pct00004
(4)
와 같이 정의되고,
여기서,
Figure pct00005
Figure pct00006
는 각각 제 1 및 제 2 입력 신호의 자동 전력 스펙트럼 밀도들(PSD)이고,
Figure pct00007
는,
Figure pct00008
(5)
에 의해 주어지는 상호-PSD이고, 여기서,
Figure pct00009
는 기대값 연산이고, X*는 X의 복수 콘주게이트를 표시한다.
역상관은, 역상관 필터들을 사용함으로써 또는 주파수 도메인에서 입력 신호들의 위상을 조작함으로써 구현될 수 있다. 역상관 필터들에 대한 예는 전대역 통과 필터이고, 이는, 정의에 의해 입력 신호들의 크기 스펙트럼을 변경하지 않고, 오직 신호들의 위상만을 변경한다. 이것은, 출력 신호들이 입력 신호들과 유사하게 들리는 점에서 중립적으로 들리는 출력 신호들을 도출한다. 다른 예는 반향이고, 이는 또한 필터 또는 선형 시간 불변 시스템으로 모델링될 수 있다. 일반적으로, 역상관은, 입력 신호의 다수의 지연된(및 가능하게는 필터링된) 카피들을 입력 신호에 추가함으로써 달성될 수 있다. 수학적 측면에서, 인위적인 반향은, 반향(또는 역상관) 시스템의 임펄스 응답과 입력 신호의 컨벌루션으로 구현될 수 있다. 지연 시간이 작은 경우, 예를 들어, 50 ms보다 작은 경우, 신호의 지연된 카피들은 별개의 신호들(에코들)로 인식되지 않는다. 에코의 감각을 도출하는 지연 시간의 정확한 값은 반향 임계치이고, 스펙트럼 및 시간 신호 특성들에 의존한다. 이것은, 예를 들어, 느리게 증가하는 엔빌로프를 갖는 음향의 경우보다 임펄스형 음향들의 경우 더 작다. 현재의 문제에 대해, 에코 임계치보다 작은 지연 시간들을 사용하는 것이 바람직하다.
일반적인 경우에, 역상관 프로세스는 N 개의 채널들을 갖는 입력 신호를 프로세싱하고, 출력의 채널 신호들이 (부분적으로 또는 완전히) 상호 미상관되도록 M 개의 채널들을 갖는 신호를 출력한다.
설명된 방법에 대한 많은 애플리케이션 시나리오들에서, 입력 신호를 일정하게 프로세싱하는 것은 적절하지 않고, 입력 신호의 분석에 기초하여 입력 신호를 활성화하고 그 영향을 제어하는 것이 적절하다. 일례는 FM 방송이고, 여기서, 송신의 장애가 스테레오 정보의 완전한 또는 부분적 손실을 초래하는 경우에만 설명된 방법이 적용된다. 다른 예는 음악 녹음들의 콜렉션을 청취하는 것이고, 여기서, 녹음들의 서브세트는 모노포닉이고 다른 서브세트는 스테레오 녹음들이다. 두 시나리오들 모두는 오디오 신호들의 스테레오 정보의 시변 양에 의해 특성화된다. 이것은, 스테레오 향상의 활성화 및 영향에 대한 제어, 즉 알고리즘의 제어를 요구한다.
제어는 오디오 신호들의 공간 큐(ICLD, ICTD 및 ICC, 또는 이들의 서브세트)를 추정하는 오디오 신호들의 분석을 이용하여 구현된다. 추정은 주파수 선택적 방식으로 구현될 수 있다. 추정의 출력은, 프로세싱의 활성화 또는 영향을 제어하는 스칼라 값에 맵핑된다. 신호 분석은 입력 신호 또는 대안적으로 분리된 배경 신호를 프로세싱한다.
프로세싱의 영향을 제어하는 간단한 방식은, 스테레오 향상의 (가능하게는 스케일링된) 출력 신호에 입력 신호의 (가능하게는 스케일링된)카피를 추가함으로써 그 영향을 감소시키는 것이다. 제어의 부드러운 전이는 제어 신호를 시간에 따라 저역 통과 필터링함으로써 획득된다.
도 9a는 배경/전경 프로세싱에 따라 입력 신호(102)의 프로세싱(900)에 대한 개략적인 블록도를 도시한다. 입력 신호(102)는, 전경 신호(914)가 프로세싱될 수 있도록 분리된다. 단계(916)에서, 전경 신호(914)에 대해 역상관이 수행된다. 단계(916)는 선택적이다. 대안적으로, 전경 신호(914)는 프로세싱되지 않고, 즉, 미상관되어 유지될 수 있다. 프로세싱 경로(920)의 단계(922)에서, 배경 신호(924)가 추출, 즉, 필터링된다. 단계(926)에서, 배경 신호(924)는 역상관된다. 단계(904)에서, 역상관된 전경 신호(918)(대안적으로 전경 신호(914)) 및 역상관된 배경 신호(928)는 혼합되어 출력 신호(906)가 획득된다. 즉, 도 9a는 스테레오 향상의 블록도를 도시한다. 전경 신호 및 배경 신호가 컴퓨팅된다. 배경 신호는 역상관에 의해 프로세싱된다. 선택적으로, 전경 신호는 역상관에 의해, 그러나 배경 신호보다 적은 정도까지 프로세싱될 수 있다. 프로세싱된 신호들은 출력 신호에 결합된다.
도 9b는 입력 신호(102)의 분리 단계(912')를 포함하는 프로세싱(900')의 개략적인 블록도를 도시한다. 분리 단계(912')는 앞서 설명된 바와 같이 수행될 수 있다. 전경 신호(출력 신호 1)(914')는 분리 단계(912')에 의해 획득된다. 배경 신호(928')는 결합 단계(926')에서 전경 신호(914'), 가중치 팩터들 a 및/또는 b 및 입력 신호(102)를 결합함으로써 획득된다. 배경 신호(출력 신호 2)(928')는 결합 단계(926')에 의해 획득된다.
도 10은, 예를 들어, 입력 신호(1002)일 수 있는 입력 신호(1002)에 스펙트럼 가중치들을 적용하도록 구성되는 개략적인 블록도 및 장치(1000)를 도시한다. 시간 도메인의 입력 신호(1002)는 주파수 도메인에서 서브대역들 X(1, k) ... X(n, k)로 분할된다. 필터뱅크(1004)는 입력 신호(1002)를 N 개의 서브대역들로 분할하도록 구성된다. 장치(1000)는 시간 인스턴스(프레임) k에서 N 개의 서브대역들 각각에 대한 과도 스펙트럼 가중치 및/또는 음조 스펙트럼 가중치 G(1, k) ... G(n, k)를 결정하도록 구성된 N 개의 계산 인스턴스들을 포함한다. 스펙트럼 가중치들 G(1, k) ... G(n, k)은, 가중된 서브대역 신호들 X(1, k) ... X(n, k) n, k)가 획득되도록, 서브대역 신호 X(1,k)…X(n,k)와 결합된다. 장치(1000)는 시간 도메인에서 Y(t)로 표시된 필터링된 출력 신호(1012)를 획득하기 위해 가중 서브대역 신호들을 결합하도록 구성된 역 프로세싱 유닛(1008)을 포함한다. 장치(1000)는 신호 프로세서(110 또는 210)의 일부일 수 있다. 즉, 도 10은 입력 신호를 전경 신호 및 배경 신호로 분해하는 것을 예시한다.
도 11은 오디오 신호를 향상시키기 위한 방법(1100)의 개략적인 흐름도를 도시한다. 방법(1100)는 프로세싱된 신호의 과도 및 음조 부분들을 감소 또는 제거하기 위해 오디오 신호가 프로세싱되는 제 1 단계(1110)를 포함한다. 방법(1100)은, 프로세싱된 신호로부터 제 1 역상관된 신호 및 제 2 역상관된 신호가 생성되는 제 2 단계(1120)를 포함한다. 방법(1100)의 단계(1130)에서, 제 1 역상관된 신호, 제 2 역상관된 신호 및 오디오 신호 또는 코히어런스 향상에 의해 오디오 신호로부터 유도된 신호는, 2-채널 오디오 신호를 획득하기 위해 시변 가중치 팩터들을 사용함으로써 가중적으로 결합된다. 방법(1100)의 단계(1140)에서, 오디오 신호의 상이한 부분들이 상이한 가중치 팩터들과 곱해지고 2-채널 오디오 신호가 시변 역상관도를 갖도록 오디오 신호를 분석함으로써 시변 가중치 팩터들이 제어된다.
다음으로, 라우드니스 측정에 기초하여 인식된 역상관 레벨을 결정할 가능성을 설명하기 위한 세부사항들이 상술될 것이다. 도시되는 바와 같이, 라우드니스 측정은 인식된 반향 레벨을 예측하도록 허용할 수 있다. 위에서 언급된 바와 같이, 반향은 또한, 인식된 반향 레벨이 또한 인식된 역상관 레벨로 간주될 수 있도록 역상관을 의미하며, 역상관의 경우 반향은 1 초보다 짧을 수 있어서, 예를 들어 500 ms보다 짧을 수 있고, 250 ms 또는 200 ms보다 짧을 수 있다.
도 12는 직접적인 신호 성분 또는 드라이 신호 성분(1201) 및 반향 신호 성분(102)을 포함하는 혼합 신호에서 인식된 반향 레벨에 대한 측정치를 결정하기 위한 장치를 예시한다. 드라이 신호 성분(1201) 및 반향 신호 성분(1202)은 라우드니스 모델 프로세서(1204)에 입력된다. 라우드니스 모델 프로세서는 직접적인 신호 성분(1201) 및 반향 신호 성분(1202)을 수신하도록 구성되고, 또한 도 13a에 예시된 바와 같이 인식 필터 스테이지(1204a) 및 후속적으로 접속된 라우드니스 계산기(1204b)를 포함한다. 라우드니스 모델 프로세서는 그 출력으로서 제 1 라우드니스 측정치(1206) 및 제 2 라우드니스 측정치(1208)를 생성한다. 라우드니스 측정치들 둘 모두는, 제 1 라우드니스 측정치(1206) 및 제 2 라우드니스 측정치(1208)를 결합하기 위해 결합기(1210)에 입력되어, 최종적으로 인식된 반향 레벨에 대한 측정치(1212)가 획득된다. 구현에 따라, 감지된 레벨(1212)에 대한 측정치는 상이한 신호 프레임들에 대한 인식된 라우드니스에 대해 적어도 2 개의 측정치들의 평균값에 기초하여, 인식된 반향 레벨을 예측하기 위한 예측기(1214)에 입력될 수 있다. 그러나,도 12의 예측기(1214)는 선택적이고, 실제적으로 인식된 레벨에 대한 측정치를, 라우드니스와 관련된 양적 값을 부여하는데 유용한 손(Sone) 단위의 범위와 같은 단위 범위 또는 특정 값 범위로 변환한다. 그러나, 제어기에서, 예를 들어 예측기(1214)에 의해 프로세싱되지 않은 인식된 레벨(1212)에 대한 측정치에 대해 다른 용도들이 또한 사용될 수 있고, 제어기는, 예측기(1214)에 의해 출력된 값에 반드시 의존할 필요가 없지만, 반향된 신호 또는 이득 팩터 g의 강력하게 변하는 레벨 정정들을 갖지 않기 위해 바람직하게는 시간에 따른 평활화가 선호되는 일종의 평활화된 형태로 또는 직접적인 형태로, 인식된 레벨(1212)에 대한 측정치를 직접 프로세싱할 수 있다.
특히, 인식 필터 스테이지는 직접적인 신호 성분, 반향 신호 성분 또는 혼합 신호 성분을 필터링하도록 구성되며, 인식 필터 스테이지는 인간과 같은 개체의 청각적 인식 메커니즘을 모델링하여 필터링된 직접적인 신호, 필터링된 반향 신호 또는 필터링된 혼합 신호를 획득하도록 구성된다. 구현에 따라, 인식 필터 스테이지는, 병렬로 동작하는 2 개의 필터를 포함할 수 있거나, 또는 스토리지 및 단일 필터를 포함할 수 있는데, 이는, 3 개의 신호들, 즉 반향 신호, 혼합 신호 및 직접적인 신호 각각을 필터링하기 위해 실제로 하나의 동일한 필터가 사용될 수 있기 때문이다. 그러나, 이러한 상황에서, 도 13a는 청각적 인식 메커니즘을 모델링하는 n 개의 필터를 예시하지만, 실제로 2 개의 필터들 또는 반향 신호 성분, 혼합 신호 성분 및 직접적인 신호 성분을 포함하는 그룹으로부터 2 개의 신호들을 필터링하는 단일 필터로도 충분할 수 있다.
라우드니스 계산기(1204b) 또는 라우드니스 평가기는 필터링된 직접적인 신호를 사용하여 제 1 라우드니스 관련 측정치를 추정하고 필터링된 반향 신호 또는 필터링된 혼합 신호를 사용하여 제 2 라우드니스 측정치를 추정하도록 구성되고, 혼합 신호는 직접적인 신호 성분 및 반향 신호 성분 중첩으로부터 유도된다.
도 13c는 인식된 반향 레벨에 대한 측정치를 계산하는 4 가지 선호되는 모드들을 예시한다. 구현은, 직접적인 신호 성분 x 및 반향 신호 성분 r 둘 모두가 라우드니스 모델 프로세서에서 사용되지만, 제 1 측정치 EST1을 결정하기 위해 반향 신호가 자극으로서 사용되고, 직접적인 신호가 잡음으로서 사용되는 부분적인 라우드니스에 의존한다. 제 2 라우드니스 측정치 EST2를 결정하기 위해, 상황이 변경되고, 직접적인 신호 성분이 자극으로서 사용되고, 반향 신호 성분이 잡음으로서 사용된다. 그 다음, 결합기에 의해 생성된 인식된 정정 레벨에 대한 측정치는 제 1 라우드니스 측정치 EST1과 제 2 라우드니스 측정치 EST2 사이의 차이이다.
그러나, 도 13c의 라인들 2, 3 및 4에 표시된 다른 계산 효율적인 실시예들 추가적으로 존재한다. 이러한 보다 계산 효율적인 측정치들은 혼합 신호 m, 직접적인 신호 x 및 반향 신호 n을 포함하는 3 개의 신호들의 총 라우드니스를 계산하는 것에 의존한다. 도 13c의 마지막 열에 표시된 결합기에 의해 수행되는 요구된 계산에 따라, 제 1 라우드니스 측정치 EST1은 혼합 신호 또는 반향 신호의 총 라우드니스이고, 제 2 라우드니스 측정치 EST2는 직접적인 신호 성분 x 또는 혼합 신호 성분 m의 총 라우드니스이고, 실제 결합은 도 13c에 예시된 바와 같다.
도 14는 도 12, 도 13a, 도 13b, 도 13c에 대한 일부 양상들에서 이미 논의된 라우드니스 모델 프로세서의 구현을 예시한다. 특히, 인식 필터 스테이지(1204a)는 각각의 브랜치에 대한 시간-주파수 변환기(1401)를 포함하고, 여기서, 도 3의 실시예에서 x[k]는 자극을 표시하고 n[k]는 잡음을 표시한다. 시간/주파수 변환된 신호는 귀 전달 함수 블록(ear transfer function block)(1402)으로 포워딩되고(귀 전달 함수는 대안적으로, 이와 유사한 결과들, 그러나 더 높은 계산 부하를 갖는 시간-주파수 변환기 전에 컴퓨팅될 수 있음을 주목한다), 이러한 블록(1402)의 출력은 여기 패턴 컴퓨팅 블록(1404)에, 및 그 후 시간적 적분 블록(1406)에 입력된다. 그 다음, 블록(1408)에서, 이러한 실시예에서의 특정 라우드니스가 계산되고, 여기서 블록(1408)은 도 13a의 라우드니스 계산기 블록(1204b)에 대응한다. 후속적으로, 블록(1410)에서 주파수에 걸친 적분이 수행되고, 여기서 블록(1410)은 도 13b의 1204c 및 1204d로서 이미 설명된 가산기에 대응한다. 블록(1410)은 자극 및 잡음의 제 1 세트에 대한 제 1 측정치, 및 자극 및 잡음의 제 2 세트에 대한 제 2 측정치를 생성한다. 특히, 도 13b가 고려되는 경우, 제 1 측정치를 계산하기 위한 자극은 반향 신호이고 잡음은 직접적인 신호인 한편, 제 2 측정치 계산하는 경우 상황은 변경되어, 자극은 직접적인 신호 성분이고 잡음은 반향 신호 성분이다. 따라서, 2 개의 상이한 라우드니스 측정치들을 생성하기 위해, 도 14에 예시된 절차가 2 회 수행되었다. 그러나, 계산에서의 변경은 오직, 상이하게 동작하는 블록(1408)에서만 발생하고, 따라서 블록들(1401 내지 1406)에 의해 예시된 단계들은 한번만 수행되면 되고, 도 13c에 도시된 구현의 경우 제 1 추정된 라우드니스 및 제 2 추정된 라우드니스를 컴퓨팅하기 위해 시간적 적분 블록(1406)의 결과는 저장될 수 있다. 다른 구현의 경우, 블록(1408)은 각각의 브랜치에 대한 개별적인 블록 "총 음량 컴퓨팅"으로 대체될 수 있고, 이러한 구현에서는 하나의 신호가 자극으로 간주되든지 또는 잡음으로 간주되든지 무관함을 주목해야 한다.
일부 양상들은 장치의 상황에서 설명되었지만, 이러한 양상들은 또한 대응하는 방법의 설명을 표현하는 것이 명백하며, 여기서 블록 또는 디바이스는 방법 단계 또는 방법 단계의 특징에 대응한다. 유사하게, 방법의 상황에서 설명되는 양상들은 또한 대응하는 장치의 블록 또는 아이템 또는 특징의 설명을 표현한다.
특정한 구현 요건들에 따라, 본 발명의 실시예들은 하드웨어 또는 소프트웨어로 구현될 수 있다. 구현은, 각각의 방법이 수행되도록 프로그래밍가능 컴퓨터 시스템과 협력하는(또는 협력할 수 있는), 전자적으로 판독가능한 제어 신호들을 저장하는 디지털 저장 매체, 예를 들어, 플로피 디스크, DVD, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리를 사용하여 수행될 수 있다.
본 발명에 따른 일부 실시예들은, 본원에서 설명되는 방법들 중 하나가 수행되도록 프로그래밍가능 컴퓨터 시스템과 협력할 수 있는, 전자적으로 판독가능한 제어 신호들을 갖는 데이터 캐리어를 포함한다.
일반적으로, 본 발명의 실시예들은 프로그램 코드를 갖는 컴퓨터 프로그램 물건으로서 구현될 수 있고, 프로그램 코드는, 컴퓨터 프로그램 물건이 컴퓨터 상에서 실행되는 경우 본 방법들 중 하나를 수행하도록 동작한다. 프로그램 코드는 예를 들어, 머신-판독가능 캐리어 상에 저장될 수 있다.
다른 실시예들은, 본원에서 설명되는 방법들 중 하나를 수행하기 위한, 머신 판독가능 캐리어 상에 저장되는 컴퓨터 프로그램을 포함한다.
따라서, 달리 말하면, 창작적 방법의 일 실시예는, 컴퓨터 프로그램이 컴퓨터 상에서 실행되는 경우, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
따라서, 창작적 방법들의 추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 포함되고 기록되는 데이터 캐리어(예를 들어, 디지털 저장 매체 또는 컴퓨터 판독가능 매체)이다.
따라서, 창작적 방법의 추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 표현하는 신호들의 시퀀스 또는 데이터 스트림이다. 예를 들어, 신호들의 시퀀스 또는 데이터 스트림은, 예를 들어, 인터넷을 통해, 데이터 통신 접속을 통해 전송되도록 구성될 수 있다.
추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하도록 구성 또는 적응되는 프로세싱 수단, 예를 들어, 컴퓨터 또는 프로그래밍가능 로직 디바이스를 포함한다.
추가적인 실시예는, 본원에서 설명되는 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.
앞서 설명된 실시예들은, 본 발명의 원리들에 대해 단지 예시적이다. 본원에서 설명되는 배열들 및 세부사항들의 변형들 및 변화들이 당업자들에게 자명할 것이 이해된다. 따라서, 본 발명은 후속 특허 청구항들의 범주에 의해서만 제한되며, 본원의 실시예들의 서술 및 설명의 방식으로 제시되는 특정 세부사항들에 의해서는 제한되지 않도록 의도된다.

Claims (15)

  1. 오디오 신호(102)를 향상시키기 위한 장치(100; 200)로서,
    프로세싱된 신호(112; 212)의 과도 및 음조 부분들을 감소 또는 제거하기 위해 상기 오디오 신호(102)를 프로세싱하기 위한 신호 프로세서(110; 210);
    상기 프로세싱된 신호(112; 212)로부터 제 1 역상관된 신호 및 제 2 역상관된 신호(124; r2)를 생성하기 위한 역상관기(120; 520);
    상기 제 1 역상관된 신호(122; 522, r1), 상기 제 2 역상관된 신호(124; r2) 및 상기 오디오 신호 또는 상기 오디오 신호(102)로부터 코히어런스 향상에 의해 유도된 신호를, 시변 가중치 팩터들(a, b)을 사용하여 가중적으로 결합하고, 2-채널 오디오 신호(142; 242)를 획득하기 위한 결합기(140; 240); 및
    상기 오디오 신호의 상이한 부분들(fb1-fb7)이 상이한 가중치 팩터들(a, b)과 곱해지고 상기 2-채널 오디오 신호(142; 242)가 시변 역상관도를 갖도록 상기 오디오 신호(122)를 분석함으로써 상기 시변 가중치 팩터들(a, b)을 제어하기 위한 제어기(130; 230)를 포함하는,
    장치.
  2. 제 1 항에 있어서,
    상기 제어기(130; 230)는, 상기 오디오 신호(102)의 부분들(fb1-fb7)에 대한 상기 가중치 팩터들(a, b)을 증가시켜 더 높은 역상관도를 허용하고, 상기 오디오 신호(102)의 부분들(fb1-fb7)에 대한 상기 가중치 팩터들(a, b)을 감소시켜 더 낮은 역상관도를 허용하도록 구성되는,
    장치.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 제어기(130; 230)는, 상기 2-채널 오디오 신호(142; 242)의 인식된 역상관 레벨이 타겟 값 주위의 일정 범위 내에 유지되도록 상기 가중치 팩터들(a, b)을 스케일링하도록 구성되고, 상기 범위는 상기 타겟 값의 ± 20 %까지 확장되는,
    장치.
  4. 제 3 항에 있어서,
    상기 제어기(130; 230)는 상기 오디오 신호(102)를 반향시킴으로써 상기 타겟 값을 결정하여 반향된 오디오 신호를 획득하고, 상기 오디오 신호와 상기 반향된 오디오 신호(102)를 비교함으로써 비교 결과를 획득하도록 구성되고, 상기 제어기는 상기 비교 결과에 기초하여 상기 인식된 역상관 레벨(232)를 결정하도록 구성되는,
    장치.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    상기 제어기(130; 230)는, 상기 오디오 신호(102)의 현저한 음원 신호 부분을 결정하고, 현저한 음원 신호를 포함하지 않는 상기 오디오 신호(102)의 부분에 비해 상기 현저한 음원 신호 부분에 대한 상기 가중치 팩터들(a, b)을 감소시키도록 구성되고,
    상기 제어기(130; 230)는, 상기 오디오 신호(102)의 현저하지 않은 음원 신호 부분을 결정하고, 현저하지 않은 음원 신호를 포함하지 않는 상기 오디오 신호(102)의 부분에 비해 상기 현저하지 않은 음원 신호 부분에 대한 상기 가중치 팩터들(a, b)을 증가시키도록 구성되는,
    장치.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 제어기(130; 230)는,
    상기 오디오 신호(102)의 일부로부터 테스트 역상관된 신호를 생성하고;
    상기 오디오 신호의 일부 및 상기 테스트 역상관된 신호로부터 인식된 역상관 레벨에 대한 측정치를 유도하고;
    상기 인식된 역상관 레벨에 대한 측정치로부터 상기 가중치 팩터들(a, b)을 유도하도록 구성되는,
    장치.
  7. 제 6 항에 있어서,
    상기 역상관기(120, 520)는 제 1 반향 시간을 갖는 상기 오디오 신호(102)의 반향에 기초하여 상기 제 1 역상관된 신호(122; r1)를 생성하도록 구성되고, 상기 제어기(130; 230)는 제 2 반향 시간을 갖는 상기 오디오 신호(102)의 반향에 기초하여 상기 테스트 역상관된 신호를 생성하도록 구성되고, 상기 제 2 반향 시간은 상기 제 1 반향 시간보다 짧은,
    장치.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    제어기(130; 230)는, 상기 가중치 팩터들(a, b) 각각이 제 1 다수의 가능한 값들 중 하나의 값을 포함하도록 상기 가중치 팩터들(a, b)을 제어하도록 구성되고, 상기 제 1 다수의 값은, 최소값, 최대값 및 상기 최소값과 상기 최대값 사이의 값을 포함하는 적어도 3 개의 값들을 포함하고,
    상기 신호 프로세서(110, 210)는 주파수 도메인에서 상기 오디오 신호(102)의 일부를 각각 표현하는 제 2 다수의 주파수 대역들에 대한 스펙트럼 가중치들(217, 219)을 결정하도록 구성되고, 상기 스펙트럼 가중치들(217, 219) 각각은 제 3 다수의 가능한 값들 중 하나의 값을 포함하고, 상기 제 3 다수의 값은, 최소값, 최대값 및 상기 최소값과 상기 최대값 사이의 값을 포함하는 적어도 3 개의 값들을 포함하는,
    장치.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서,
    상기 신호 프로세서(110; 210)는,
    상기 오디오 신호(102)가 상기 주파수 도메인으로 전송되도록, 그리고 제 2 다수의 주파수 대역들(fb1-fb7)이 상기 주파수 도메인에서 상기 오디오 신호(102)의 사이 제 2 다수의 부분들을 표현하도록 상기 오디오 신호(102)를 프로세싱하고;
    각각의 주파수 대역(fb1-fb7)에 대해, 상기 오디오 신호(102)의 과도 프로세싱(211)을 위한 프로세싱 값을 표현하는 제 1 스펙트럼 가중치(217)를 결정하고;
    각각의 주파수 대역(fb1-fb7)에 대해, 상기 오디오 신호(102)의 음조 프로세싱(213)을 위한 프로세싱 값을 표현하는 제 2 스펙트럼 가중치(219)를 결정하고;
    각각의 주파수 대역(fb1-fb7)에 대해, 상기 제 1 스펙트럼 가중치(217) 및 상기 제 2 스펙트럼 가중치(219) 중 적어도 하나를 상기 주파수 대역(fb1-fb7)에서 상기 오디오 신호(102)의 스펙트럼 값들에 적용하도록 구성되고,
    상기 제 1 스펙트럼 가중치(217) 및 상기 제 2 스펙트럼 가중치(219) 각각은, 제 3 다수의 가능한 값들 중 하나의 값을 포함하고, 상기 제 3 다수의 값은, 최소값, 최대값 및 상기 최소값과 상기 최대값 사이의 값을 포함하는 적어도 3 개의 값들을 포함하는,
    장치.
  10. 제 9 항에 있어서,
    상기 제 2 다수의 주파수 대역들(fb1-fb7) 각각에 대해, 상기 신호 프로세서(110; 210)는 상기 주파수 대역(fb1-fb7)에 대해 결정된 상기 제 1 스펙트럼 가중치(217) 및 상기 제 2 스펙트럼 가중치(219)를 비교하고, 2 개의 값들 중 하나가 더 작은 값을 포함하는지 여부를 결정하고, 상기 더 작은 값을 포함하는 스펙트럼 가중치(217; 219)를 상기 주파수 대역(fb1-fb7)에서 상기 오디오 신호(102)의 스펙트럼 값들에 적용하도록 구성되는,
    장치.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 역상관기(520)는, 상기 프로세싱된 오디오 신호(512, s)를 필터링하여 상기 제 1 역상관된 신호(522, r1)를 획득하도록 구성되는 제 1 역상관 필터(526) 및 상기 프로세싱된 오디오 신호(512, s)를 필터링하여 제 2 역상관된 신호(524, r2)를 획득하도록 구성되는 제 2 역상관 필터(528)를 포함하고, 상기 결합기(140; 240)는, 상기 제 1 역상관된 신호(522, r1), 상기 제 2 역상관된 신호(524, r2) 및 상기 오디오 신호(102) 또는 상기 오디오 신호(102)로부터 유도된 신호(136; 236)를 가중적으로 결합하여 상기 2-채널 오디오 신호(142; 242)를 획득하도록 구성되는,
    장치.
  12. 제 1 항 내지 제 11 항 중 어느 한 항에 있어서,
    제 2 복수의 주파수 대역들(fb1-fb7)에 대해, 상기 주파수 대역들(fb1-fb7) 각각은 제 1 시간 기간을 갖고 상기 주파수 도메인에서 표현되는 상기 오디오 신호(102) 부분을 포함하고,
    제어기(130; 230)는, 상기 가중치 팩터들(a, b) 각각이 제 1 다수의 가능한 값들 중 하나의 값을 포함하도록 상기 가중치 팩터들(a, b)을 제어하고, - 상기 제 1 다수의 값은, 최소값, 최대값 및 상기 최소값과 상기 최대값 사이의 값을 포함하는 적어도 3 개의 값들을 포함함 -, 실제 시간 기간에 대해 결정된 가중치 팩터들(a, b)의 값 및 이전 시간 기간에 대해 결정된 가중치 팩터들(a, b)의 값에 기초한 비율 또는 차이가 임계 값보다 크거나 동일하면, 상기 비율 또는 상기 차이가 감소되도록 상기 실제 시간 기간에 대해 결정된 가중치 팩터들(a, b)을 적응시키도록 구성되고,
    상기 신호 프로세서(110, 210)는, 제 3 다수의 가능한 값들 중 하나의 값을 각각 포함하는 상기 스펙트럼 가중치들(217, 219)을 결정하도록 구성되고, 상기 제 3 다수의 값은, 최소값, 최대값 및 상기 최소값과 상기 최대값 사이의 값을 포함하는 적어도 3 개의 값들을 포함하는,
    장치.
  13. 음향 향상 시스템(800)으로서,
    제 1 항 내지 제 12 항 중 어느 한 항에 따른 오디오 신호를 향상시키기 위한 장치(801);
    상기 오디오 신호(102)를 수신하도록 구성되는 신호 입력(106);
    2-채널 오디오 신호(y1/y2) 또는 상기 2-채널 오디오 신호(y1/y2)로부터 유도된 신호를 수신하고, 상기 2-채널 오디오 신호(y1/y2) 또는 상기 2-채널 오디오 신호(y1/y2)로부터 유도된 신호로부터 음향 신호들을 생성하도록 구성되는 적어도 2 개의 스피커들(808a, 808b)을 포함하는,
    음향 향상 시스템.
  14. 오디오 신호(102)를 향상시키기 위한 방법(1100)으로서,
    프로세싱된 신호(112; 212)의 과도 및 음조 부분들을 감소 또는 제거하기 위해 상기 오디오 신호(102)를 프로세싱하는 단계(1110);
    상기 프로세싱된 신호(112; 212)로부터 제 1 역상관된 신호(122, r1) 및 제 2 역상관된 신호(124; r2)를 생성하는 단계(1120);
    상기 제 1 역상관된 신호(122, r1), 상기 제 2 역상관된 신호(124, r2) 및 상기 오디오 신호(102) 또는 상기 오디오 신호(102)로부터 코히어런스 향상에 의해 유도된 신호(136; 236)를, 시변 가중치 팩터들(a, b)을 사용하여 가중적으로 결합하고, 2-채널 오디오 신호(142; 242)를 획득하는 단계(1130); 및
    상기 오디오 신호의 상이한 부분들이 상이한 가중치 팩터들(a, b)과 곱해지고 상기 2-채널 오디오 신호(142; 242)가 시변 역상관도를 갖도록 상기 오디오 신호(102)를 분석함으로써 상기 시변 가중치 팩터들(a, b)을 제어하는 단계(1140)를 포함하는,
    방법.
  15. 컴퓨터 프로그램이 저장된 비일시적 저장 매체로서,
    상기 컴퓨터 프로그램은, 컴퓨터에 의해 실행되는 경우 제 14 항에 따른 오디오 신호를 향상시키기 위한 방법을 수행하기 위한 프로그램 코드를 갖는,
    비일시적 저장 매체.
KR1020177000895A 2014-07-30 2015-07-27 오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템 KR101989062B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14179181.4A EP2980789A1 (en) 2014-07-30 2014-07-30 Apparatus and method for enhancing an audio signal, sound enhancing system
EP14179181.4 2014-07-30
PCT/EP2015/067158 WO2016016189A1 (en) 2014-07-30 2015-07-27 Apparatus and method for enhancing an audio signal, sound enhancing system

Publications (2)

Publication Number Publication Date
KR20170016488A true KR20170016488A (ko) 2017-02-13
KR101989062B1 KR101989062B1 (ko) 2019-06-13

Family

ID=51228374

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177000895A KR101989062B1 (ko) 2014-07-30 2015-07-27 오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템

Country Status (12)

Country Link
US (1) US10242692B2 (ko)
EP (2) EP2980789A1 (ko)
JP (1) JP6377249B2 (ko)
KR (1) KR101989062B1 (ko)
CN (1) CN106796792B (ko)
AU (1) AU2015295518B2 (ko)
CA (1) CA2952157C (ko)
ES (1) ES2797742T3 (ko)
MX (1) MX362419B (ko)
PL (1) PL3175445T3 (ko)
RU (1) RU2666316C2 (ko)
WO (1) WO2016016189A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016141023A1 (en) * 2015-03-03 2016-09-09 Dolby Laboratories Licensing Corporation Enhancement of spatial audio signals by modulated decorrelation
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
EP3324407A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
US11373667B2 (en) * 2017-04-19 2022-06-28 Synaptics Incorporated Real-time single-channel speech enhancement in noisy and time-varying environments
US11467309B2 (en) * 2017-08-23 2022-10-11 Halliburton Energy Services, Inc. Synthetic aperture to image leaks and sound sources
CN109002750B (zh) * 2017-12-11 2021-03-30 罗普特科技集团股份有限公司 一种基于显著性检测与图像分割的相关滤波跟踪方法
US10306391B1 (en) 2017-12-18 2019-05-28 Apple Inc. Stereophonic to monophonic down-mixing
RU2762302C1 (ru) * 2018-04-05 2021-12-17 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ или компьютерная программа для оценки разности во времени между каналами
EP3573058B1 (en) * 2018-05-23 2021-02-24 Harman Becker Automotive Systems GmbH Dry sound and ambient sound separation
CN113115175B (zh) * 2018-09-25 2022-05-10 Oppo广东移动通信有限公司 3d音效处理方法及相关产品
US10587439B1 (en) 2019-04-12 2020-03-10 Rovi Guides, Inc. Systems and methods for modifying modulated signals for transmission
EP4320614A1 (en) * 2021-04-06 2024-02-14 Dolby Laboratories Licensing Corporation Multi-band ducking of audio signals technical field

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001005187A1 (en) * 1999-07-09 2001-01-18 Aureal Semiconductor, Inc. Dynamic decorrelator for audio signals
US20130173274A1 (en) * 2010-08-25 2013-07-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for generating a decorrelated signal using transmitted phase information

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19632734A1 (de) * 1996-08-14 1998-02-19 Thomson Brandt Gmbh Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal
DE60043585D1 (de) * 2000-11-08 2010-02-04 Sony Deutschland Gmbh Störungsreduktion eines Stereoempfängers
EP2665294A2 (en) * 2003-03-04 2013-11-20 Core Wireless Licensing S.a.r.l. Support of a multichannel audio extension
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
DE602005018023D1 (de) * 2005-04-29 2010-01-14 Harman Becker Automotive Sys Kompensation des Echos und der Rückkopplung
RU2473062C2 (ru) * 2005-08-30 2013-01-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
JP4504891B2 (ja) * 2005-08-31 2010-07-14 日本電信電話株式会社 反響消去方法、反響消去装置、プログラム、記録媒体
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
JP4887420B2 (ja) * 2006-03-13 2012-02-29 ドルビー ラボラトリーズ ライセンシング コーポレイション 中央チャンネルオーディオのレンダリング
ATE448638T1 (de) * 2006-04-13 2009-11-15 Fraunhofer Ges Forschung Audiosignaldekorrelator
MY151722A (en) * 2006-07-07 2014-06-30 Fraunhofer Ges Forschung Concept for combining multiple parametrically coded audio sources
JP4835298B2 (ja) * 2006-07-21 2011-12-14 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法およびプログラム
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
JP2008129189A (ja) * 2006-11-17 2008-06-05 Victor Co Of Japan Ltd 反射音付加装置および反射音付加方法
KR101312470B1 (ko) * 2007-04-26 2013-09-27 돌비 인터네셔널 에이비 출력 신호 합성 장치 및 방법
JP5021809B2 (ja) * 2007-06-08 2012-09-12 ドルビー ラボラトリーズ ライセンシング コーポレイション アンビエンス信号成分とマトリックスデコードされた信号成分とを制御可能に結合することによるサラウンドサウンドオーディオチャンネルのハイブリッド導出
WO2009039897A1 (en) * 2007-09-26 2009-04-02 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
RU2443075C2 (ru) * 2007-10-09 2012-02-20 Конинклейке Филипс Электроникс Н.В. Способ и устройство для генерации бинаурального аудиосигнала
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
RU2546717C2 (ru) * 2009-06-02 2015-04-10 Конинклейке Филипс Электроникс Н.В. Многоканальное акустическое эхоподавление
EP2489206A1 (fr) * 2009-10-12 2012-08-22 France Telecom Traitement de donnees sonores encodees dans un domaine de sous-bandes
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
WO2011072729A1 (en) * 2009-12-16 2011-06-23 Nokia Corporation Multi-channel audio processing
EP2586025A4 (en) * 2010-07-20 2015-03-11 Huawei Tech Co Ltd A tone signal
EP2541542A1 (en) * 2011-06-27 2013-01-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal
RU2595912C2 (ru) * 2011-05-26 2016-08-27 Конинклейке Филипс Н.В. Аудиосистема и способ для нее
JP5884473B2 (ja) * 2011-12-26 2016-03-15 ヤマハ株式会社 音響処理装置および音響処理方法
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
EP2917908A1 (de) * 2012-11-09 2015-09-16 Storming Swiss Sàrl Nichtlineare inverse kodierung von multikanal-signalen
WO2014105857A1 (en) * 2012-12-27 2014-07-03 Dts, Inc. System and method for variable decorrelation of audio signals
EP2941770B1 (en) * 2013-01-04 2017-08-30 Huawei Technologies Co., Ltd. Method for determining a stereo signal
JP6242489B2 (ja) * 2013-07-29 2017-12-06 ドルビー ラボラトリーズ ライセンシング コーポレイション 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法
WO2015036350A1 (en) * 2013-09-12 2015-03-19 Dolby International Ab Audio decoding system and audio encoding system
WO2016210174A1 (en) * 2015-06-25 2016-12-29 Dolby Laboratories Licensing Corporation Audio panning transformation system and method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001005187A1 (en) * 1999-07-09 2001-01-18 Aureal Semiconductor, Inc. Dynamic decorrelator for audio signals
US20130173274A1 (en) * 2010-08-25 2013-07-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for generating a decorrelated signal using transmitted phase information

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Draft International Standard ISO/IEC DIS 23008-3. Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio. ISO/IEC JTC 1/SC 29/WG 11. 2014.0 *
ISO/IEC CD 23008-3. Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio. ISO/IEC JTC 1/SC 29/WG 11. 2014.04.04. *
ISO/IEC CD 23008-3. Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio. ISO/IEC JTC 1/SC 29/WG 11. 2014.04.04.* *

Also Published As

Publication number Publication date
MX362419B (es) 2019-01-16
CN106796792B (zh) 2021-03-26
RU2017106093A3 (ko) 2018-08-28
RU2666316C2 (ru) 2018-09-06
PL3175445T3 (pl) 2020-09-21
JP2017526265A (ja) 2017-09-07
EP3175445A1 (en) 2017-06-07
CA2952157C (en) 2019-03-19
AU2015295518A1 (en) 2017-02-02
US10242692B2 (en) 2019-03-26
BR112017000645A2 (pt) 2017-11-14
US20170133034A1 (en) 2017-05-11
EP2980789A1 (en) 2016-02-03
EP3175445B8 (en) 2020-08-19
JP6377249B2 (ja) 2018-08-22
RU2017106093A (ru) 2018-08-28
CA2952157A1 (en) 2016-02-04
WO2016016189A1 (en) 2016-02-04
KR101989062B1 (ko) 2019-06-13
CN106796792A (zh) 2017-05-31
ES2797742T3 (es) 2020-12-03
EP3175445B1 (en) 2020-04-15
AU2015295518B2 (en) 2017-09-28
MX2017001253A (es) 2017-06-20

Similar Documents

Publication Publication Date Title
KR101989062B1 (ko) 오디오 신호를 향상시키기 위한 장치 및 방법 및 음향 향상 시스템
KR101984115B1 (ko) 오디오 신호 처리를 위한 다채널 다이렉트-앰비언트 분해를 위한 장치 및 방법
JP5149968B2 (ja) スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法
CA2835463C (en) Apparatus and method for generating an output signal employing a decomposer
US9743215B2 (en) Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
AU2012280392B2 (en) Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator
EP2484127B1 (en) Method, computer program and apparatus for processing audio signals
JP2003274492A (ja) ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
Czyżewski et al. Adaptive personal tuning of sound in mobile computers
Uhle Center signal scaling using signal-to-downmix ratios
BR112017000645B1 (pt) Aparelho e método para reforço de um sistema de reforço de som e sinal de áudio
AU2012252490A1 (en) Apparatus and method for generating an output signal employing a decomposer

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right