KR20150103252A - 스테레오 신호를 결정하는 방법 - Google Patents

스테레오 신호를 결정하는 방법 Download PDF

Info

Publication number
KR20150103252A
KR20150103252A KR1020157020958A KR20157020958A KR20150103252A KR 20150103252 A KR20150103252 A KR 20150103252A KR 1020157020958 A KR1020157020958 A KR 1020157020958A KR 20157020958 A KR20157020958 A KR 20157020958A KR 20150103252 A KR20150103252 A KR 20150103252A
Authority
KR
South Korea
Prior art keywords
signal
audio channel
input audio
microphone
power spectrum
Prior art date
Application number
KR1020157020958A
Other languages
English (en)
Other versions
KR101694225B1 (ko
Inventor
크리스토프 팔러
다비드 비레뜨
위에 랑
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20150103252A publication Critical patent/KR20150103252A/ko
Application granted granted Critical
Publication of KR101694225B1 publication Critical patent/KR101694225B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/09Electronic reduction of distortion of stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)

Abstract

본 발명은 출력 스테레오 신호(Y1,Y2)를 결정하는 방법(200)에 관한 것으로, 이 방법은, 상기 제1 입력 오디오 채널 신호(m1)와, 필터링된 버전의 상기 제2 입력 오디오 채널 신호(m2)의 차에 기초하여 제1 차분 신호(x1)를 결정하고, 상기 제2 입력 오디오 채널 신호(m2)와 필터링된 버전의 상기 제1 입력 오디오 채널 신호(m1)의 차에 기초하여 제2 차분 신호(x2)를 결정하는 단계(201); 상기 제1 차분 신호(x1)에 기초하여 제1 파워 스펙트럼(P1)을 결정하고, 상기 제2 차분 신호(x2)에 기초하여 제2 파워 스펙트럼(P2)을 결정하는 단계(203); 상기 제1 파워 스펙트럼(P1) 및 상기 제2 파워 스펙트럼(P2)의 함수로서 제1 가중 함수(W1) 및 제2 가중 함수(W2)를 결정하는 단계(205) - 상기 제1 가중 함수(W1) 및 상기 제2 가중 함수(W2)는 지수 함수(exponential function)로 이루어짐 -; 및 상기 출력 스테레오 신호(Y1,Y2) 중 제1 출력 오디오 채널 신호(Y1)를 획득하기 위해, 상기 제1 입력 오디오 채널 신호(m1)와 상기 제2 입력 오디오 채널 신호(m2)의 제1 조합을 나타내는 제1 신호를 상기 제1 가중 함수(W1)를 가지고 필터링하고, 상기 출력 스테레오 신호(Y1,Y2) 중 제2 출력 오디오 채널(m2)를 획득하기 위해, 상기 제1 입력 오디오 채널 신호(m1)와 상기 제2 입력 오디오 채널 신호(m2)의 제2 조합을 나타내는 제2 신호를 상기 제2 가중 함수(W2)를 가지고 필터링하는 단계(207)를 포함한다.

Description

스테레오 신호를 결정하는 방법{METHOD FOR DETERMINING A STEREO SIGNAL}
본 발명은 스테레오 신호를 결정하는 방법, 컴퓨터 프로그램 및 장치에 관한 것이다.
스테레오 마이크로폰은 통상 2개의 지향성 마이크로폰 소자를 이용하여 스테레오 재생에 적합한 신호를 바로 기록한다. 지향성 마이크로폰은, 예컨대 카디오이드(cardioid) 또는 피거에이트(figure-eight) 마이크로폰과 같이 관련 모델에 따라어느 한 방향 또는 여러 방향으로부터 소리를 취득하는 마이크로폰이다. 지향성 마이크로폰은 비싸고 소형 장치에 장착하기 어렵다. 그래서, 통상 무지향성(omni-directional) 마이크로폰 소자가 모바일 장치에서 사용된다. 무지향성 또는 비지향성(non-directional) 마이크로폰의 응답은 일반적으로 3차원에서의 완전한 구인 것으로 생각된다. 그러나 무지향성 마이크로폰에 의해 생성된 스테레오 신호는 오직 작은 좌우 신호 분리성(signal separation)를 가진다. 실제로, 2개의 무지향성 마이크로폰 간의 겨우 몇 센티미터의 작은 거리로 인해, 스테레오 이미지 폭은, 채널 간 에너지 및 지연의 차가 작아서 더 제한된다. 이 에너지 및 지연의 차는 공간 신호(spatial cue)로 알려져 있으며 이것은 J. Blauert의 "Spatial Hearing: The Psychoacoustics of Human Sound Localizzation" (MIT Press, 캠브리지, 미국, 1997)에서 설명되어 있듯이 공간 인지(spatial perception)에 직접적으로 영향을 준다. 그래서, C. Faller의 "Conversion of two closely spaced omnidirectional microphone signals to an xy stereo signal"(Preprint 129th Convention AES, 2010)에 나타나 있듯이, 무지향성 마이크로폰 신호를 보다 더 큰 분리성(separation)을 가진 스테레오 신호로 변환하기 위한 기술이 제안되어 있다.
더 큰 좌우 분리성을 가진 스테레오 신호를 생성하기 위해, 'Gradient microphones'(J. Acoust. Soc. Am. 17(3), 192-198)에서 Olson, H.F. (1946)에 의해 실험되어 있듯이, 2개의 무지향성 마이크로폰 신호는 2개의 1차 차분 신호로 변환될 수 있다. 그러한 프로세스(100)가 도 1에 도시되어 있다. M1 및 M2는 2개의 무지향성 마이크로폰을 나타낸다. 1차 차분 신호(x1, x2)는 제1 마이크로폰(M1)으로부터의 신호 m1(t)와 τ만큼 지연된 제2 마이크로폰(M2)으로부터의 신호 m2(t) 간의 차분 신호를 계산하여 획득된다. 그런 다음 자유장 정정 필터링(free-field correction filtering)(h)이 차분 신호 m1(t-τ)-m2(t) 및 m2(t-τ)-m1(t)에 적용된다.
상술한 방법의 단점은, 차분 신호가 낮은 주파수에서 낮은 신호대잡음비를 높은 주파수에서는 스펙트럼 결함(spectral defect)을 가진다는 것이다. C.Faller의 "Conversion of two closely spaced omnidirectional microphone signals to an xy stereo signal"(Preprint 129th Convention AES, 2010)에서 제안된 기술은 게인 필터의 계산을 위해서만 차분 신호(x1 및 x2)를 이용하는 것으로 이 문제를 해결하려고 했다. 이것은 이후 원래의 마이크로폰 신호(m1 및 m2)에 적용되고, 이것으로 양호한 SNR(신호대잡음비)과 감소된 스펙트럼 결함을 달성하였다.
그러나 이 기술은 특정 스테레오 이미지 또는 특성 녹음 시나리오에 한정된다.
본 발명은 스테레오 신호를 캡처하거나 처리하는 향상된 기술을 제공하는 것을 목적으로 한다.
상기 목적은 독립 청구항의 특징에 의해 달성된다. 추가의 구현 형태는 종속 청구항, 상세한 설명 및 도면으로부터 자명하다.
본 발명은, 상술한 종래 기술이 캡처되거나 처리된 스테레오 신호의 스테레오 폭을 조정하는 가능성을 제안하고 있지 않다는 것에 착안한 것이다. 게인 필터는 스테레오 이미지를 제어하도록 수정될 수 없거나 또는 사용자에 의해 온라인으로 변경될 수 없는 고정된 스테레오 이미지를 제공하기 위해 계산된다. 그래서, 이 스테레오 마이크로폰은 최적의 위치에 배치하지 않고는 최적의 스테레오 신호를 제공하지 않는다. 예컨대, 대상물을 둘러싼 섹터가 스테레오 마이크로폰이 캡처하는 섹터에 대응하는 각도를 가지도록 기록할 대상물까지의 마이크로폰의 거리를 수동으로 선택되어야 한다.
본 발명은 또한 폭 제어를 적용하는 것이 스테레오 신호를 캡처하거나 처리하기 위한 향상된 기술을 제공한다는 착안에 기초한 것이다. 입력 스테레오 신호의 스테레오 폭을 직접 제어하는 추가의 제어 파라미터를 사용함으로써, 스테레오 신호는 기록할 대상물의 위치에 대해 대응하는 스테레오 이미지 폭에 걸쳐 더 좁게 또는 더 넓게 만들어질 수 있다. 이 제어 파라미터는 또한 스테레오 폭 제어 파라미터라고도 지칭할 수 있다. 스테레오 폭을 제어하기 위해, 가중 함수에 지수 파라미터를 도입하고 수정하는 것에 의해 필요에 따라 용이하게 차분 신호 통계(differenctila signal statistics)를 수정하거나 변경할 수 있다.
본 발명을 보다 상세히 기술하기 위해 이하의 용어, 약어 및 표기가 사용된다.
M1, M2: 제1(좌) 및 제2(우) 마이크로폰
m1, m2: 제1 및 제2 입력 오디오 채널 신호, 예컨대 제1 및 제1 마이크로폰 신호
x1, x2: m1및 m2의 제1 및 제2 차분 신호
P1(k,i), P2(k,i): 제1(좌) 및 제2(우) 차분 신호의 파워 스펙트럼
X1(k,i), X2(k,i): 제1(좌) 및 제2(우) 차분 신호의 스펙트럼
Y1(k,i), Y2(k,i): 제1(좌) 및 제2(우) 스테레오 출력 신호의 스펙트럼
Y1, Y2: 제1(좌) 및 제2(우) 출력 오디오 채널 신호
W1(k,i), W2(k,i): 제1(좌) 및 제2(우) 가중 함수(예컨대 제1(좌) 및 제2(우) 스테레오 게인 필터)
β: 스테레오 폭 제어 파라미터
D(k,i): 확상 음성 반향(diffuse sound reverberation)
Φ(k,i): 제1(좌) 및 제2(우) 차분 신호 간의 정규 상호 연관도(normalized cross correlation)
L: 좌측 출력 신호 또는 좌측 출력 오디오 채널 신호
R: 우측 출력 신호 또는 우측 출력 오디오 채널 신호
STFT: Short Time Fourier Transform
SNR: Signal-to-Noise Ratio
BCC: Binaural Cue Coding
CLD: Channel Level Differences
ILD: Interchannel Level Differences
ITD: Interchannel Time Differences
ICC: Interchannel Coherence/Cross Correlation
QMF: Quadrature Mirror Filter
제1 측면에 따르면, 본 발명은 입력 스테레오 신호에 기초하여 출력 스테레오 신호를 결정하는 방법에 관한 것으로, 상기 입력 스테레오 신호는 제1 입력 오디오 채널 신호 및 제2 입력 오디오 채널 신호를 포함하고, 상기 방법은: 상기 제1 입력 오디오 채널 신호와, 상기 제2 입력 오디오 채널 신호의 필터링된 버전의 차에 기초하여 제1 차분 신호를 결정하고, 상기 제2 입력 오디오 채널 신호와, 상기 제1 입력 오디오 채널 신호의 필터링된 버전의 차에 기초하여 제2 차분 신호를 결정하는 단계; 상기 제1 차분 신호에 기초하여 제1 파워 스펙트럼을 결정하고, 상기 제2 차분 신호에 기초하여 제2 파워 스펙트럼을 결정하는 단계; 상기 제1 파워 스펙트럼 및 상기 제2 파워 스펙트럼의 함수로서 제1 가중 함수 및 제2 가중 함수를 결정하는 단계 - 상기 제1 가중 함수 및 상기 제2 가중 함수는 지수 함수(exponential function)로 이루어짐 -; 및 상기 출력 스테레오 신호 중 제1 출력 오디오 채널 신호를 획득하기 위해, 상기 제1 입력 오디오 채널 신호와 상기 제2 입력 오디오 채널 신호의 제1 조합을 나타내는 제1 신호를 상기 제1 가중 함수를 가지고 필터링하고, 상기 출력 스테레오 신호 중 제2 출력 오디오 채널를 획득하기 위해, 상기 제1 입력 오디오 채널 신호와 상기 제2 입력 오디오 채널 신호의 제2 조합을 나타내는 제2 신호를 상기 제2 가중 함수를 가지고 필터링하는 단계를 포함한다.
제1 및 제2 가중 함수를 위한 추가 파라미터로서 지수 함수를 이용하는 것에 의해, 스테레오 신호의 스테레오 폭이 지수 함수의 지수에 의존하여 제어될 수 있다. 따라서 마이크로폰을 최적 위치에 위치시키거나 마이크로폰의 상대적인 위치 및/또는 방향을 조정할 필요 없이 스테레오 폭을 제어하는 것만으로 스테레오 신호는 최적으로 캡처되거나 처리될 수 있다.
제1 측면에 따른 방법의 제1의 가능한 실시형태에서, 상기 제1 신호는 상기 제1 입력 오디오 채널 신호이고, 상기 제2 신호는 상기 제2 입력 오디오 채널 신호이다.
제1 및 제2 입력 오디오 채널 신호를 필터링할 때, 이 필터링은 용이하게 실행된다.
제1 측면 또는 제1 측면의 제1의 실시형태에 따른 방법의 제2의 가능한 실시형태에서, 상기 제1 신호는 상기 제1 차분 신호이고, 상기 제2 신호는 상기 제2 차분 신호이다.
제1 및 제2 차분 신호를 필터링할 때, 이 방법은 향상된 좌우 분리를 가진 스테레오 신호를 제공한다.
제1 측면의 제2의 가능한 실시형태에 따른 방법의 제3의 가능한 실시형태에서, 상기 지수 함수의 지수(β)는 0.5와 2 사이에 있다.
지수가 1인 경우, 제1 및 제2 차분 신호의 스테레오 폭이 사용되고, 지수가 1보다 큰 경우, 이미지는 더 넓어지며, 지수가 1보다 작으면 이미지는 더 좁아진다. 그래서 이미지 폭은 유연하게 제어된다. 따라서 지수는 '스테레오 폭 제어 파라미터'라고 지칭될 수 있다. 다른 실시형태에서는, 이 지수가 다른 범위에서 선택되는데, 예컨대 0.25 내지 4, 0.2 내지 5, 0.1 내지 1이다. 그러나 0.5 내지 2의 범위가 특히 사람의 스테레오 폭에 대한 사람의 인식에 잘 맞는다는 것이 보여졌다.
제1 측면에 따른 방법 또는 이상의 제1 측면의 실시형태에 따른 방법의 제4의 가능한 실시형태에서, 상기 제1 가중 함수 및 제2 가중 함수를 결정하는 단계는, 정규화 함수에 의해 상기 제1 파워 스펙트럼의 지수 버전(exponential version)을 정규화하는 단계; 및 상기 정규화 함수에 의해 상기 제2 파워 스펙트럼의 지수 버전을 정규화하는 단계를 포함하고, 상기 정류화 함수는 상기 제1 파워 스펙트럼(P1)의 지수 버전과 상기 제2 파워 스펙트럼(P2)의 지수 버전의 합에 기초한 함수이다.
동일한 정규화 함수에 의해 파워 스펙트럼을 정류화하는 것에 의해, 좌우 채널 간의 파워비가 스테레오 신호에 유지된다. 파워 스펙트럼을 계산하기 위한 단시간 평균(short-time average)를 사용할 때, 음향적 느낌(acoustical impression)이 향상된다.
제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법의 제5의 가능한 실시형태에서, 상기 제1 가중 함수 및 상기 제2 가중 함수는 상기 제1 입력 오디오 채널 신호 및 상기 제2 입력 오디오 채널 신호의 확산 음성(diffuse sound), 보다 상세하게는 상기 제1 입력 오디오 채널 신호 및 상기 제2 입력 오디오 채널 신호의 반향 음성(reverberation sound)의 파워 스펙트럼에 의존한다.
그래서 이 방법은 확산 음성과 같은 원하지 않은 신호를 고려할 수 있도록 한다. 가중 함수는 그 원하지 않은 신호를 감쇠시켜서 스테레오 신호의 인식성과 품질을 향상시킨다.
제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법의 제6의 가능한 실시형태에서, 상기 제1 가중 함수 및 상기 제2 가중 함수는 상기 제1 차분 신호 및 상기 제2 차분 신호 간의 정규 상호 연관도(normalized cross correlation)에 의존한다.
디지털 신호 처리 기술을 이용하면 차분 신호들 간의 정규 상호 연관도가 용이하게 계산된다.
제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법의 제7의 가능한 실시형태에서, 상기 제1 가중 함수 및 상기 제2 가중 함수는 상기 제1 파워 스펙트럼 및 상기 제2 파워 스펙트럼의 최소치에 의존한다.
파워 스펙트럼의 최소치가 마이크로폰 신호의 반향을 나타내는 측정치로서 사용될 수 있다.
제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법의 제8의 가능한 실시형태에서,
상기 제1 가중 함수 및 제2 가중 함수를 결정하는 단계는,
Figure pct00001
Figure pct00002
또는,
Figure pct00003
Figure pct00004
에 의해 이루어지고, 여기서 P1(k,i)는 상기 제1 파워 스펙트럼을 나타내고, P2(k,i)는 상기 제2 파워 스펙트럼을 나타내며, W1(k,i)는 상기 제1 파워 스펙트럼에 대한 가중 함수를 나타내고, W2(k,i)는 상기 제2 파워 스펙트럼에 대한 가중 함수를 나타내며, D(k,i)는
Figure pct00005
로 결정되는 확산 음성의 파워 스펙트럼이며, 여기서 또한 Φ(k,i)는 상기 제1 차분 신호 및 상기 제2 차분 신호 간의 정규 상호 연관도이고, g는 게인 펙터(gain factor), β는 상기 지수 함수의 지수, k는 시간 인덱스, i는 주파수 인덱스이다.
이 방법은, 폭 확장 및 잡음 제어로 마이크로폰 신호의 게인 필터링을 제공한다. 획득된 스테레오 신호는 향상된 좌우 분리 및 잡음 감소 특성의 특징을 가진다.
제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법의 제9의 가능한 실시형태에서, 상기 출력 스테레오 신호 중 상기 제1 출력 오디오 채널 신호 및 상기 제2 출력 오디오 채널 신호에 기초하여, 공간 정보(spatial cue), 보다 상세하게는 채널 레벨차, 채널간 시간차, 채널간 위상차 및 채널간 코히어런스/상호 연관도 중 하나를 결정하는 단계를 더 포함한다.
이 방법은 공간 정보 코딩을 이용하는 코더/디코더에서 파라메트릭 스테레오 신호에 적용될 수 있다. 디코딩된 스테레오 신호의 스피치 품질은, 차분 신호 통계가 지수 함수에 의해 수정된 때 향상된다.
제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법의 제10의 가능한 실시형태에서, 제1 입력 오디오 채널 신호 및 제2 입력 오디오 채널 신호는 무지향성 마이크로폰으로부터 오거나 또는 무지향성 마이크로폰을 이용하여 획득된 것이다.
무지향성 마이크로폰은 비싸지 않고 모바일 장치, 스마트폰 및 태블릿과 같은 소형 장치 내에 쉽게 장착될 수 있다. 이상의 방법 중 하나를 임의의 입력 스테레오 신호 및 무지향성 마이크로폰으로부터 온 대응하는 입력 오디오 채널 신호에 적용하는 것에 의해 구체적으로는 인식되는 스테레오 폭을 향상시킨다. 입력 스테레오 신호는, 예컨대, 추가의 오디오 인코딩 단계를 적용하기 전에 무지향성 마이크로폰에 의해 직접 캡처되는 원래의 스테레오 신호; 또는 예컨대 무지향성 마이크로폰으로부터 캡처된 스테레오 신호를 이용하여 획득된 인코딩된 스테레오 신호를 디코딩하는 것에 의해 재구성되는 재구성된 스테레오 신호일 수 있다.
제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법의 제11의 가능한 실시형태에서, 상기 필터링된 버전의 제1 입력 오디오 채널 신호는 상기 제1 입력 오디오 채널 신호의 지연된 버전이고, 상기 필터링된 버전의 제2 입력 오디오 채널 신호는 상기 제2 입력 오디오 채널 신호의 지연된 버전이다.
마이크로폰 신호의 필터링은 지연을 조정함으로써 유연한 좌우 분리를 가능하게 한다.
제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법의 제12의 가능한 실시형태에서, 상기 제1 입력 오디오 채널 신호는 제1 마이크로폰의 제1 마이크로폰 신호이고, 상기 제2 입력 오디오 채널 신호는 제2 마이크로폰의 제2 마이크로폰 신호이다.
제1 마이크로폰 및 제2 마이크로폰은, 예컨대 무지향성 마이크로폰일 수 있다.
이상의 방법 중 임의의 방법을, 예컨대 소스 인코딩이나 공간 인코딩과 같은 손실 오디오 인코딩을 적용하기 전에, 마이크로폰 신호상에서 출력 스테레오 신호를 결정하기 위해 적용하면, 무손실 인코딩을 제외한 모든 인코딩은 전형적으로 마이크로폰에 의해 캡처된 원래의 스테레오 신호에 포함된 공간 정보의 손실을 가져오기 때문에, 연속하는 스테레오 코딩의 품질 및 디코딩된 스테레오 신호의 인식된 스테레오 품질을 향상시킬 수 있다.
이상의 방법 중 임의의 방법을, 예컨대 소스 인코딩이나 공간 인코딩과 같은 손실 오디오 인코딩을 적용하기 전에, 무지향성 마이크로폰에 의해 캡처된 마이크로폰 신호 상에서 출력 스테레오 신호를 결정하기 위해 적용하면, 특히, 예컨대 모바일 단말의 내장형 무지향성 마이크로폰과 같은, 서로 가까이 배치된 무지향성 마이크로폰에서, 코딩의 품질 및 디코딩된 스테레오 신호의 인식 스테레오 폭을 향상시킬 수 있다.
제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법의 제13의 가능한 실시형태에서, 지수 함수의 지수의 값은 고정되거나 조정 가능한 것이다.
지수 함수의 지수의 값이 고정되면, 고정된 방식으로 출력 스테레오 신호의 인식 스테레오 폭을 좁히거나 넓힐 수 있다. 지수 함수의 지수의 값이 조정 가능하면, 예컨대 사용자 인터페이스를 통한 사용자 입력에 기초하여 자동으로 또는 수동으로 유연하게 출력 스테레오 신호의 인식 스테레오 폭(perceived stereo width)을 조정할 수 있다.
제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법의 제14의 가능한 실시형태에서, 본 방법은 사용자 인터페이스를 통해 지수 함수의 지수의 값을 설정하거나 수정하는 단계를 더 포함한다.
제2 측면에 따르면, 본 발명은, 컴퓨터상에서 실행된 때 제1 측면 또는 이상의 제1 측면의 실시형태에 따른 방법을 수행하는 프로그램 코드를 가진 컴퓨터 프로그램 또는 컴퓨터 프로그램 제품에 관한 것이다.
제3 측면에 따르면, 본 발명은 입력 스테레오 신호에 기초하여 출력 스테레오 신호를 결정하는 장치에 관한 것이고, 입력 스테레오 신호는 제1 입력 오디오 채널 신호 및 제2 입력 오디오 채널 신호를 포함한다. 이 장치는 제1 측면 또는 이상의 제1 측면의 실시형태 중 어느 하나의 방법을 적용하는 것에 의해 상기 제1 입력 오디오 채널 신호 및 상기 제2 입력 오디오 채널 신호로부터 출력 스테레오 신호를 생성하기 위한 프로세서를 포함한다.
이 장치는 제1 측면 또는 이상의 제1 측면의 실시형태 중 어느 하나의 방법을 실행하도록 구성된다면 어떤 장치든 될 수 있다. 이 장치는, 예컨대 외장형 또는 내장형 마이크로폰에 의해 입력 스테레오 신호를 캡처하고 제1 측면 또는 이상의 제1 측면의 실시형태 중 어느 하나의 방법을 수행하는 것에 의해 출력 스테레오 신호를 결정하도록 구성된 모바일 장치일 수 있다. 이 장치는 또한, 예컨대 인코딩되거나 인코딩되지 않은 방식으로 스테레오 신호를 제공하거나 캡처하는 장치에 연결되고 입력 스테레오 신호로서 이 캡처 장치로부터 수신된 스테레오 신호를 후처리하여 제1 측면 또는 이상의 제1 측면의 실시형태 중 어느 하나의 방법을 수행하는 것에 의해 출력 스테레오 신호를 결정하도록 구성된 네트워크 장치 또는 다른 임의의 장치일 수 있다.
제3 측면에 따른 장치의 제1의 가능한 실시형태에서, 이 장치는 상기 스테레오 신호의 폭을 제어하는 폭 제어 파라미터를 저장하기 위한 메모리; 및/또는
상기 폭 제어 파라미터를 제공하기 위한 사용자 인터페이스를 더 포함하고, 상기 폭 제어 파라미터는 상기 제1 파워 스펙트럼에 가중처리를 행하기 위한 상기 제1 가중 함수 및 상기 제2 파워 스펙트럼에 가중처리를 행하기 위한 상기 제2 가중 함수에 의해 사용된다.
종래의 장치의 메모리는 폭 제어 파라미터를 저장하기 위해 사용될 수 있다. 기존의 사용자 인터페이스는 폭 제어 파라미터를 제공하기 위해 사용될 수 있다. 다르게는, 슬라이더를 이용하여 사용자 인터페이스를 구현할 수 있고 이것은 구현이 용이하다. 따라서 사용자는 스테레오 폭을 제어할 수 있게 되고 이로써 그의 품질 경험을 향상시킬 수 있다.
제3 측면 또는 제3 측면의 제1의 실시형태에 따른 장치의 제2의 가능한 실시형태에서, 폭 제어 파라미터는 상기 제1 파워 스펙트럼 및 상기 제2 파워 스펙트럼에 적용되는 지수이고, 상기 지수는 0.5와 2 사이의 범위 내에 있다.
0.5 내지 2의 범위는 스테레오 폭을 제어하기 위한 최적 범위이다.
이 장치는, 한 쌍의 마이크로폰으로부터, 특히 한 쌍의 무지향성 마이크로폰으로부터 스테레오 신호를 생성하거나 스테레오 신호를 후처리할 때 스테레오 폭을 변경하는 방법을 제공한다. 이 마이크로폰은 예컨대 모바일 장치와 같은 장치에 통합될 수 있거나 또는 외장형으로서 예컨대 좌우 마이크로폰 신호를 모바일 장치에 제공하는 헤드폰에 통합될 수 있다. 입력 스테레오 신호를 캡처하는 2개의 마이크로폰 사이의 거리가 작을수록, 본 발명의 실시형태에 의해 제공되는 출력 스테레오 신호의 인식 스테레오 폭의 향상 가능성이 더 커진다.
제4 측면에 따르면, 본 발명은 스테레오 신호를 캡처하는 방법에 관한 것으로서, 이 방법은, 제1 및 제2 마이크로폰 신호를 수신하는 단계; 제1 및 제2 차분 신호를 생성하는 단계; 제1 및 제2 스펙트럼을 추정하는 단계; 지수를 적용하는 것에 의해 수정된 스펙트럼을 계산하는 단계; 수정된 스펙트럼에 기초하여 가중 함수로서 제1 및 제2 게인 필터를 계산하는 단계; 및 제1 및 제2 출력 오디오 채널을 획득하기 위해 제1 및 제2 마이크로폰 신호에 게인 필터를 적용하는 단계를 포함한다.
제5 측면에 따르면, 본 발명은 스테레오 신호를 계산하는 방법에 관한 것으로서, 이 방법은, 좌우 마이크로폰 신호로부터 좌우 차분 마이크로폰 신호를 계산하는 단계; 차분 마이크로폰 신호의 파워를 계산하는 단계; 상기 파워에 지수를 적용하는 단계; 좌우 마이크로폰 신호에 대한 게인 펙터를 계산하는 단계; 및 좌우 마이크로폰 신호에 게인 펙터를 적용하는 단계를 포함한다.
여기에 기술된 방법, 시스템 및 장치는 디지털 신호 프로세서(DSP), 마이크로 컨트롤러, 또는 다른 임의의 부가 프로세서에 소프트웨어로서 구현되거나 또는 ASIC(Application Specific Integrated Circuit) 내에 하드웨어로서 구현될 수 있다.
본 발명은 디지털 전자 회로 또는 컴퓨터 하드웨어, 펌웨어, 소프트웨어 또는 이들의 조합, 예컨대 종래의 모바일 장치에서 이용할 수 있는 하드웨어나 상술한 방법을 처리하기 위한 전용의 새로운 하드웨어로 구현될 수 있다.
본 발명의 다른 실시예는 이하의 도면을 참조하여 기술된다.
도 1은 스테레오 신호를 생성하기 위한 종래의 방법의 모식도이다.
도 2는 일 실시형태에 따라 출력 스테레오 신호를 결정하기 위한 방법(200)의 모식도이다.
도 3은 일 실시형태에 따라 폭 제어를 이용한 출력 스테레오 신호를 결정하기 위한 방법(300)의 모식도이다.
도 4는 일 실시형태에 따른 장치(예컨대 모바일 장치)의 모식도이다.
도 5는 일 실시형태에 따라 파라메트릭(parametric) 스테레오 신호를 계산하는 장치(예컨대 모바일 장치)의 모식도이다.
이하에서는, 본 발명의 실시형태가 기술되는데, 여기서 제1 입력 오디오 채널 신호는 제1 마이크로폰의 제1 마이크로폰 신호이고, 제2 입력 오디오 채널 신호는 제2 마아크로폰의 제2 마이크로폰 신호이다.
도 2는 일 실시형태에 따라 출력 스테레오 신호를 결정하기 위한 방법(200)의 모식도이다.
출력 스테레오 신호는 제1 마이크로폰의 제1 마이크로폰 신호 및 제2 마이크로폰의 제2 마이크로폰 신호로부터 결정된다. 이 방법(200)은, 제1 마이크로폰 신호와 필터링된 버전의 제2 마이크로폰 신호의 차에 기초하여 제1 차분 신호를 결정하고, 제2 마이크로폰 신와 필터링된 버전의 제1 마이크로폰 신호의 차에 기초하여 제2 차분 신호를 결정하는 단계(201)를 포함한다. 이 방법(200)은 제1 차분 신호에 기초하여 제1 파워 스펙트럼을 결정하고 제2 차분 신호에 기초하여 제2 파워 스펙트럼을 결정하는 단계(203)를 포함한다. 이 방법(200)은 제1 및 제2 파워 스펙트럼의 함수로서 제1 및 제2 가중 함수를 결정하는 단계(205)를 포함하고, 여기서 제1 및 제2 가중 함수(weighting function)는 지수 함수(exponential function)를 포함하여 이루어진다. 이 방법(200)은, 출력 스테레오 신호의 제1 출력 오디오 채널 신호를 획득하기 위해, 제1 및 제2 마이크로폰 신호와 제1 가중 함수의 제1 조합을 나타내는 제1 신호를 필터링하고, 출력 스테레오 신호의 제2 출력 오디오 채널 신호를 획득하기 위해 제1 및 제2 마이크로폰 신호와 제2 가중 함수의 제2 조합을 나타내는 제2 신호를 필터링하는 단계(207)를 포함한다.
본 방법(200)의 실시형태에서, 제1 신호는 제1 마이크로폰 신호이고 제2 신호는 제2 마이크로폰 신호이다. 본 방법(200)의 다른 실시형태에서, 제1 신호는 제1 차분 신호이고 제2 신호는 제2 차분 신호이다. 본 방법(200)의 일 실시형태에서, 지수 함수의 지수 또는 지수의 값은 0.5와 2 사이에 있다. 본 방법(200)의 일 실시형태에서, 제1 및 제2 가중 함수를 결정하는 단계는: 정규화 함수에 의해 제1 파워 스펙트럼의 지수 버전(exponential version)을 정규화하는 단계 및 정규화 함수에 의해 제2 파워 스펙트럼의 지수 버전을 정규화하는 단계를 포함하고, 이 정규화 함수는 제1 파워 스펙트럼의 지수 버전 및 제2 파워 스펙트럼의 지수 버전의 합에 기초한 것이다. 본 방법(200)의 일 실시형태에서, 제1 및 제2 가중 함수는 제1 및 제2 마이크로폰 신호, 특히 제1 및 제2 마이크로폰 신호의 반향 음성(reverberation sound)의 확산 음성의 파워 스펙트럼에 의존한다. 본 방법의 일 실시형태(200)에서, 제1 및 제2 가중 함수는 제1 및 제2 차분 신호 간의 정규 상호 연관도(normalized cross correlation)에 의존한다. 본 방법(200)의 일 실시형태에서, 제1 및 제2 가중 함수는 제1 및 제2 파워 스펙트럼의 최소치에 의존한다. 본 방법(200)의 일 실시형태에서, 제1 가중 함수(W1) 및 제2 가중 함수(W2)를 결정하는 단계는,
Figure pct00006
Figure pct00007
또는,
Figure pct00008
Figure pct00009
로 구성되고, 여기서 P1(k,i)는 제1 파워 스펙트럼을 나타내고, P2(k,i)는 제2 파워 스펙트럼을 나타내며, W1(k,i)는 제1 파워 스펙트럼에 대한 가중 함수를 나타내고, W2(k,i)는 제2 파워 스펙트럼에 대한 가중 함수를 나타내며, D(k,i)는
Figure pct00010
로 결정되는 확산 음성의 파워 스펙트럼이며, 여기서 또한 Φ(k,i)는 제1 및 제2 차분 신호 간의 정규 상호 연관도이고, g는 게인 펙터, β는 지수 함수의 지수, k는 시간 인덱스, i는 주파수 인덱스이다. 이러한 가중 함수는 도 3을 참조하여 이하에서 더 상세히 설명된다.
본 방법(200)의 일 실시형태에서, 본 방법은 또한, 스테레오 신호의 제1 및 제2 채널에 기초하여 공간 정보(spatial cue), 구체적으로는 채널 레벨차, 채널간 시간차, 채널간 위상차 및 채널간 코히어런스/상호 연관도 중 하나를 결정하는 단계를 더 포함한다. 본 방법(200)의 일 실시형태에서, 제1 및 제2 마이크로폰은 무지향성 마이크로폰이다. 본 방법(200)의 일 실시형태에서, 제1 마이크로폰의 필터링된 버전은 제1 마이크로폰 신호의 지연된 버전이고, 제2 마이크로폰 신호의 필터링된 버전은 제2 마이크로폰 신호의 지연된 버전이다.
도 3은 일 실시형태에 따라 폭 제어를 이용하여 출력 스테레오 신호를 결정하기 위한 방법(300)의 모식도이다.
출력 스테레오 신호(Y1, Y2)는 제1 마이크로폰(M1)의 제1 마이크로폰 신호(m1) 및 제2 마이크로폰(M2)의 제2 마이크로폰 신호(m2)로부터 결정된다. 본 방법(300)은, 제1 마이크로폰 신호(m1)와 필터링된 버전의 제2 마이크로폰 신호(m2)의 차분에 기초하여 제1 차분 신호(x1)를 결정하고 제2 마이크로폰 신호(m2)와 필터링된 버전의 제1 마이크로폰 신호(m1)의 차분에 기초하여 제2 차분 신호(x2)를 결정하는 단계를 포함한다. 이 차분 신호(x1, x2)를 결정하는 단계는 프로세싱 블록 A로 나타내어져 있다. 본 방법(300)은 제1 차분 신호(x1)에 기초하여 제1 파워 스펙트럼(P1)을 결정하고, 제2 차분 신호(x2)에 기초하여 제2 파워 스펙트럼(P2)을 결정하는 단계를 포함한다. 본 방법(300)은 가중 함수에 의해 제1 파워 스펙트럼(P1) 및 제2 파워 스펙트럼(P2)에 가중처리(weighting)를 수행하고 가중처리된 제1 파워 스펙트럼(W1) 및 제2 파워 스펙트럼(W2)을 획득하는 단계를 포함한다. 파워 스펙트럼(P1, P2)을 결정하고 파워 스펙트럼(P1, P2)에 가중처리를 수행하여 가중처리된 파워 스펙트럼(W1, W2)를 획득하는 것은 프로세싱 블록 B로 나타내어져 있다. 가중화는 가중 제어 파라미터 β, 예컨대 지수에 기초한다. 본 방법(300)은 가중화된 제1 파워 스펙트럼(W1)에 기초하여 제1 게임 필터(C1)를 조정하고, 가중화된 제2 파워 스펙트럼(W2)에 기초하여 제2 게임 필터(C2)를 조정하는 단계를 포함한다. 본 방법(300)은, 출력 스테레오 신호(Y1, Y2)를 획득하기 위해, 제1 마이크로폰 신호(m1)를 제1 게인 필터(C1)를 가지고 필터링하고, 제2 마이크로폰 신호(m2)를 제2 게인 필터(C2)를 가지고 필터링하는 단계를 포함한다. 본 방법(300)은 도 2를 참조하여 상술한 방법(200)에 대응한다.
도 1을 참조하여 상술한 압력 성분 신호(pressure gradient signals)인 m1(t-τ)-m2(t) 및 m2(t-τ)-m1(t)는 잠재적으로 유용한 스테레오 신호가 될 수 있다. 그러나, 저 주파수에서, 도 1에 도시된 자유장 응답 정정 필터 h(t)가 저주파수에서 잡음을 증폭시키기 때문에 잡음이 증폭된다. 출력 스테레오 신호에서 증폭되는 저 주파수 잡음을 피하기 위해, 압력 성분 신호(x1(t), x2(t))가 신호로서 직접 사용되지 않고 그 통계만이 출력 스테레오 신호(Y1(t), Y2(t))를 생성하기 위해 원래의 마이크로폰 신호(m1(t), m2(t))에 적용되는 (시변) 필터를 추정하기 위해 사용된다.
이하에서, 이산 시간(tiem discrete) 신호가 고려된다. 여기서, 시간(t)은 이산 시간 인덱스(n)로 교체된다. 신호, 예컨대 x1(t)의 이산 시간 STFT(Shourt Time Fourier Transform)으로 표현한 것은 X1(k,i)로 지칭되고, 여기서 k는 시간 인덱스, i는 주파수 인덱스이다. 도 3에서, 오직 대응하는 시간 신호가 지시되어 있다. 본 방법(300)의 일 실시형태에서, 본 방법(300)의 제1 단계는 STFT를 2개의 무지향성 마이크로폰(M1, M2)로부터 들어오는 입력 신호(m1(t), m2(t))에 적용하는 단계를 포함한다. 본 방법(300)의 일 실시형태에서, 블록 A는 도 1을 참조하여 상술한 1차 차분 신호(x1, x2)의 연산에 대응한다.
좌우 스펙트럼 출력 신호의 STFT 스펙트럼은 이하와 같이 계산된다.
Figure pct00011
(1)
M1(k,i) 및 M2(k,i)는 원래의 무지향성 마이크로폰 신호(m1(t), m2(t))의 STFT 표현식이며, W1(k,i) 및 W2(k,i)는 이하에서 기술되는 필터이다.
좌우 차분 신호(x1, x2)의 파워 스펙트럼은 이하와 같이 추정된다.
Figure pct00012
(2)
여기서 *는 복소수를 나ㅏ내고, E{.}는 단시간 평균화 연산(short time averaging operation)이다.
P1(k,i) 및 P2(k,i)에 기초하여, 스테레오 게인 필터는 다음과 같이 계산된다.
Figure pct00013
(3)
여기서, 지수 β는 스테레오 폭을 제어한다. β=1이면 차분 신호의 스테레오 폭이 사용되고, β>1이면 이미지가 더 넓게 되고, β<1이면 이미지가 더 좁아진다. 일 실시형태에서, β는 0.5와 2 사이의 범위에서 선택된다.
일 실시형태에서, 원하지 않은 신호의 파워 스펙트럼, 예컨대 노이즈나 반향이 추정된다. 일 실시형태에서, 확산 음성(반향)이 이하와 같이 추정된다.
Figure pct00014
(4)
Φ(k,i)는 좌우 차분 신호(x1, x2) 간의 정규 상호 연관도를 나타낸다. 이 추정치에 기초하여, 좌우 게인 필터(W1(k,i), W2(k,i))가 이하에서 계산된다.
Figure pct00015
(5)
여기서,
Figure pct00016
는 원하지 신호에 주어진, 그것을 감쇠시키기 위한 게인을 나타내며, L은 dB로 표시하는 감쇠를 나타낸다.
도 4는 일 실시형태에 따라, 예컨대 모바일 장치와 같은 장치(400)의 모식도이다.
이 모바일 장치(400)는, 제1 마이크로폰(M1)에 의해 제공되는 제1 마이크로폰 신호(m1)와 제2 마이크로폰(M2)에 의해 제공되는 제2 마이크로폰 신호(m2)로부터 출력 스테레오 신호(L,R)를 결정하는 프로세서(401)를 포함한다. 이 프로세서(401)는 도 2를 참조하여 설명한 방법(200) 또는 도 3을 참조하여 설명한 방법(300)의 실시형태 중 임의의 것을 적용하도록 구성되어 있다. 일 실시형태에서, 모바일 장치(400)는 출력 스테레오 신호(L,R)의 폭을 제어하는 폭 제어 파라미터(β)를 수신하는 폭 제어 수단(403)을 포함한다. 이 폭 제어 파라미터(β)는, 도 3을 참조하여 상술한 제1 파워 스펙트럼(P1) 및 제2 파워 스펙트럼(P2)에 가중처리를 행하기 위한 가중 함수에 의해 사용된다.
모바일 장치(400)의 일 실시형태에서, 폭 제어 수단(403)은 폭 제어 파라미터(β)를 저장하는 메모리를 포함한다. 모바일 장치(400)의 일 실시형태에서, 폭 제어 수단(403)은 폭 제어 파라미터(β)를 제공하는 사용자 인터페이스를 포함한다. 모바일 장치(400)의 일 실시형태에서, 폭 제어 파라미터(β)는 제1 파워 스펙트럼(P1) 및 제2 파워 스펙트럼(P2)에 적용되는 지수(exponent)이며, 이 지수 β는 0.5와 2 사이의 범위에 있다.
일 실시형태에서, 마이크로폰(M1,M2)은 무지향성 마이크로폰이다. 이 2개의 무지향성 마이크로폰(M1,M2)은 스테레오 변환 방법을 적용하는 시스템에 연결되어 있다. 일 실시형태에서, 이 마이크로폰은 모바일 장치(400)에 연결되는 이어폰에 장착된 마이크로폰이다. 일 실시형태에서, 모바일 장치는 스마트폰 또는 태블릿이다.
일 실시형태에서, 도 2 및 도 3을 참조하여 설명한 방법(200, 300)이, 스테레오 기록의 스테레오 폭을 향상시키고 제어하기 위해 모바일 장치(400)에 적용된다. 일 실시형태에서, 폭 제어 파라미터(β)는 모바일 장치(400)의 제조사에 의헤 제공된 미리 정해진 또는 고정된 파라미터로서 메모리에 저장된다. 다른 실시형태로서, 폭 제어 파라미터(β)는 스테레오 폭을 사용자가 조정할 수 있도록 하는 사용자 인터페이스로부터 획득된다. 일 실시형태에서, 사용자는 슬라이더를 가지고 스테레오 폭을 제어한다. 일 실시형태에서, 슬라이더는 파라미터(β)를 0.5와 2 사이에서 제어한다.
일 실시형태에서, 모바일 장치(400)는, 예컨대, 셀룰러폰, 스마트폰, 태블릿, 노트북, 휴대형 게임기, 딕터폰(Dictaphone)이나 음성 녹음기와 같은 오디오 기록 장치, 카메라나 캠코더와 같은 영상 기록 장치 중 하나이다.
도 5는, 일 실시형태에 따라 파라메트릭 스테레오 신호(504)를 계산하는, 예컨대 모바일 장치(500)와 같은 장치의 모식도이다.
모바일 장치(500)는 제1 마이크로폰(M1)에 의해 제공되는 제1 마이크로폰 신호(m1)과 제2 마이크로폰(M2)에 의해 제공되는 제2 마이크로폰 신호(m2)로부터 파라메트릭 스테레오 신호(504)를 생성하는 프로세서(501)를 포함한다. 이 프로세서(501)는 도 2를 참조하여 설명한 방법(200) 또는 도 3을 참조하여 설명한 방법(300)의 실시형태 중 임의의 것을 적용하도록 구성되어 있다. 일 실시형태에서, 모바일 장치(500)는 파라메트릭 스테레오 신호(504)의 폭을 제어하는 폭 제어 파라미터(β)를 수신하는 폭 제어 수단(503)을 포함한다. 이 폭 제어 파라미터(β)는 도 2 또는 도 3을 참조하여 상술한 바와 같은 제1 파워 스펙트럼(P1) 및 제2 파워 스펙트럼(P2)에 가중처리를 행하기 위한 가중 함수에 의해 사용된다. 프로세서(501)는 도 4를 참조하여 상술한 프로세서(401)와 동일한 기능을 포함할 수 있다. 폭 제어 수단(503)은 도 4를 참조하여 상술한 폭 제어 수단(403)에 대응한다.
예컨대 무지향성 마이크로폰과 같은 2개의 마이크로폰(M1,M2)은 낮은 비트율 스테레오 코딩(low bit rate stereo coding)에 기반을 둔 모바일 장치(500)에 연결되어 있다. 이 코딩/디코딩 파라다임은 "BCC(Binaural Cue Coding)"으로 알려진 스테레오 신호의 파라메트릭 레프리젠테이션(parametric representation)을 이용할 수 있는데, 이 BCC는 "Parametric Coding of Spatial Audio" (C. Faller, Ph.D. Thesis No. 3062, Ecole Polytechnique Federale de Lausanne(EPFL), 2004)에 상세하게 제시되어 있다. 이 문헌에는, 파라메트릭 공간 오디오 코딩 기법(parametric spatial audio coding scheme)이 기술되어 있다. 이 기법은 청각 공간 이미지(auditory spatial image)의 인식에 관련된 채널간 정보(inter-channel cues)의 추출 및 코딩, 그리고 다중채널 오디오 신호의 모노 또는 스테레오 레프리젠테이션의 코딩에 기초한다. 채널간 정보에는, 채널 레벨차(CLD: Channel Level Difference)라고도 알려진 채널간 레벨차(ILD: Interchannel Level Difference), 채널간 위상차(IPD: Interchannel Phase Difference)로 나타내어질 수 있는 채널간 시간차(ITD: Interchannel Time Difference), 그리고 채널간 코히어런스/상호 연관도(ICC: Interchannel Coherence/Cross Correlation)가 포함된다. 채널간 정보는, 예컨대 종래의 STFT(Short-Tiem Fourier Trnasform) 또는 복소수 변조된 QMF(Complex-modulated Quadrature Mirror Filter)를 이용하는 것에 의해, 입력 신호의 서브-밴드 레프리젠테이션에 기초하여 추출될 수 있다. 서브-밴드는 사람의 청각계의 주파수 해상도를 모방하는 불균일 주파수에 따르는 파라미터 밴드로 그룹화된다. 모노 또는 스테레오 다운믹스 신호(502)는 원래의 다채널 오디오 신호를 매트릭스화하는 것에 의해 획득된다. 그런 다음 이 다운믹스 신호(502)는 종래의 최신 모노 또는 스테레오 오디오 코더를 이용하여 인코딩된다. 일 실시형태에서, 모바일 장치(500)는 종래의 최신 오디오 코더를 이용하여 다운믹스 신호(502) 또는 인코딩된 다운믹스 신호를 출력한다.
일 실시형태에서, 모노 다운믹스 신호(502)는 "Parametric Coding of Spatial Audio" (C. Faller, Ph.D. Thesis No. 3062, Ecole Polytechnique Federale de Lausanne(EPFL), 2004)에 따라 계산된다. 다르게는, 다른 다운믹싱 방법이 사용된다. 일 실시형태에서, 이하의 식으로 서브-밴드마다 계산되는 채널 레벨차(CLD)는,
Figure pct00017
(6)
스테레오 폭 제어를 계산에 넣기 위해, 다음 식으로 변경된다:
Figure pct00018
(7)
Y1[k], Y2[k]는 도 2 내지 도 4를 참조하여 상술한 실시형태에 의해 결정되는 출력 스테레오 신호의 2개의 출력 오디오 채널 신호에 대응한다. 추가적으로 파라메트릭 오디오 인코딩을 포함하는 일 실시형태에서, (수정된) 스테레오 신호 Y1[k], Y2[k]는, 다운믹스 신호(502)와 함께 스테레오 파라메트릭 신호 또는 부가 정보(504)로서 출력되는 공간 정보(CLD, ICC, ITD)를 계산하기 위한 중간 신호 Y1[k], Y2[k]로서 사용된다.
폭 제어 파라미터(β)는, 모바일 장치(500)의 제조사에 의해 제공되는 미리 정해진 파라미터로서, 메모리에 저장될 수 있다. 다르게는, 폭 제어 파라미터(β)는 사용자가 스테레오 폭을 조정할 수 있도록 하는 사용자 인터페이스로부터 획득될 수 있다. 사용자는 예컨대 0.5와 2 사이에서 파라미터(β)를 제어할 수 있는 슬라이더를 이용하여 스테레오 폭을 제어할 수 있다.
본 발명의 실시예(방법, 컴퓨터 프로그램 및 장치)가, 주로, 제1 입력 오디오 채널 신호가 제1 마이크로폰의 제1 마이크로폰 신호이고 제2 입력 오디오 채널 신호가 제2 마이크로폰의 제2 마이크로폰 신호인 실시예에 기초하여 설명되고 있지만, 본 발명의 실시예는 이러한 것에 한정되지 않는다. 본 발명의 실시형태는 예컨대 스테레오 신호의 저장 또는 전송을 위해 사전에 인코딩되고 디코딩되거나 또는 그렇지 않은 임의의 입력 스테레오 신호에 적용될 수 있다. 인코딩된 입력 스테레오 신호의 경우, 본 발명의 실시형태는 인코딩된 스테레오 신호를 디코딩하는 단계, 즉, 차분 신호 등을 결정하기 전에 인코딩된 스테레오 신호로부터 제1 및 제2 입력 오디오 채널 신호를 재구성하는 단계를 포함한다. 다른 실시형태에서, 제1 입력 및 출력 오디오 채널 신호는 좌측 입력 및 출력 오디오 채널 신호일 수 있고, 제2 입력 및 출력 오디오 채널 신호는 우측 입력 및 출력 오디오 채널 신호일 수 있으며, 또는 그 반대일 수 있다. 지수 함수의 지수의 값은, 그 값이 1을 포함하거나 제외하는 값의 범위 내에 있는 모든 경우에 있어서 고정될 수도 있고 조정 가능하게 될 수도 있다. 1보다 작은 값은 출력 스테레오 신호의 스테레오 폭을 좁게 만들고 1보다 큰 값은 출력 스테레오 신호의 스테레오 폭을 넓게 한다. 지수의 값은 0.5 내지 2의 범위 내에 있을 수 있다. 다른 실시형태에서, 지수의 값은 0.25 내지 4의 범위, 0.2 내지 5의 범위, 또는 0.1 내지 10의 범위 등에 있을 수 있다.
장치에 관한 실시예가 주로 도 4 및 5에 기초한 예의 모바일 장치를 가지고 설명되었지만, 본 장치의 실시형태는, 제1 측면에 따른 방법의 실시형태 주 어느 것 또는 제1 측면에 따른 실시형태 중 어느 것이든 수행할 수 있도록 된 장치라면 어떤 것이든 될 수 있다. 본 장치는, 예컨대, 내장형 또는 외장형 마이크로폰에 의해 입력 스테레오 신호를 캡처하고 제1 측면에 따른 방법 또는 제1 측면에 따른 실시형태 중 어느 하나에 따른 방법을 수행하는 것에 의해 출력 스테레오 신호를 결정하도록 구성된 모바일 장치일 수 있다. 이 장치는 또한, 예컨대, 인코딩되거나 또는 인코딩되지 않은 상태로 스테레오 신호를 제공하거나 캡처하는 장치에 연결되고, 상술한 실시형태 중 하나에 따른 방법을 수행하는 것에 의해 출력 스테레오 신호를 결정하기 위해 입력 스테레오 신호로서 캡처링 장치로부터 수신한 스테레오 신호를 후처리하도록 구성된 네트워크 장치 또는 다른 어떤 장치일 수 있다.
이상으로부터, 통상의 기술자라면 다양한 방법, 시스템, 기록 매체상의 컴퓨터 프로그램 등이 제공된다는 것을 자명하게 알 것이다.
본 개시는 또한, 실행시에, 적어도 하나의 컴퓨터로 하여금 여기에 기술된 수행하는 단계 및 계산하는 단계를 실행하도록 하는 컴퓨터에 의해 실행 가능한 코드 또는 명령어를 포함하는 컴퓨터 프로그램 제품을 지원한다.
많은 대체, 변경 및 변형이 이상의 개시된 내용에 비추어 통상의 기술자에게 자명하게 된다. 물론 통상의 기술자는 여기에 기술되지 않은 다양한 본 발명의 응용예가 있을 수 있다는 것을 쉽게 인식할 것이다. 본 발명이 하나 이상의 특정 실시예를 참조하여 기술되었지만, 통상의 기술자라면 본 발명의 보호 범위에서 벗어나지 않고 많은 변경이 가해질 수 있다는 것을 인식할 것이다. 따라서 첨부된 청구범위의 범위 및 그 균등의 범위 내에서 본 발명이 이상에서 설명한 것과 다르게 굿현될 수 있다는 것을 이해해야 한다.

Claims (18)

  1. 입력 스테레오 신호(m1,m2)에 기초하여 출력 스테레오 신호(Y1,Y2)를 결정하는 방법(200)으로서,
    상기 입력 스테레오 신호는 제1 입력 오디오 채널 신호(m1) 및 제2 입력 오디오 채널 신호(m2)를 포함하고,
    상기 방법은,
    상기 제1 입력 오디오 채널 신호(m1)와, 상기 제2 입력 오디오 채널 신호(m2)의 필터링된 버전의 차에 기초하여 제1 차분 신호(x1)를 결정하고, 상기 제2 입력 오디오 채널 신호(m2)와, 상기 제1 입력 오디오 채널 신호(m1)의 필터링된 버전의 차에 기초하여 제2 차분 신호(x2)를 결정하는 단계(201);
    상기 제1 차분 신호(x1)에 기초하여 제1 파워 스펙트럼(P1)을 결정하고, 상기 제2 차분 신호(x2)에 기초하여 제2 파워 스펙트럼(P2)을 결정하는 단계(203);
    상기 제1 파워 스펙트럼(P1) 및 상기 제2 파워 스펙트럼(P2)의 함수로서 제1 가중 함수(W1) 및 제2 가중 함수(W2)를 결정하는 단계(205) - 상기 제1 가중 함수(W1) 및 상기 제2 가중 함수(W2)는 지수 함수(exponential function)로 이루어짐 -; 및
    상기 출력 스테레오 신호(Y1,Y2) 중 제1 출력 오디오 채널 신호(Y1)를 획득하기 위해, 상기 제1 입력 오디오 채널 신호(m1)와 상기 제2 입력 오디오 채널 신호(m2)의 제1 조합을 나타내는 제1 신호를 상기 제1 가중 함수(W1)를 가지고 필터링하고, 상기 출력 스테레오 신호(Y1,Y2) 중 제2 출력 오디오 채널(m2)를 획득하기 위해, 상기 제1 입력 오디오 채널 신호(m1)와 상기 제2 입력 오디오 채널 신호(m2)의 제2 조합을 나타내는 제2 신호를 상기 제2 가중 함수(W2)를 가지고 필터링하는 단계(207)
    를 포함하는 방법.
  2. 제1항에 있어서,
    상기 제1 신호는 상기 제1 입력 오디오 채널 신호(m1)이고, 상기 제2 신호는 상기 제2 입력 오디오 채널 신호(m2)인, 방법.
  3. 제1항에 있어서,
    상기 제1 신호는 상기 제1 차분 신호(x1)이고, 상기 제2 신호는 상기 제2 차분 신호(x2)인, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 지수 함수의 지수(β)가 0.5와 2 사이에 있는, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제1 가중 함수(W1) 및 제2 가중 함수(W2)를 결정하는 단계는,
    정규화 함수에 의해 상기 제1 파워 스펙트럼(P1)의 지수 버전(exponential version)을 정규화하는 단계; 및
    상기 정규화 함수에 의해 상기 제2 파워 스펙트럼(P2)의 지수 버전을 정규화하는 단계
    를 포함하고,
    상기 정류화 함수는 상기 제1 파워 스펙트럼(P1)의 지수 버전과 상기 제2 파워 스펙트럼(P2)의 지수 버전의 합에 기초한 함수인, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 제1 가중 함수(W1) 및 상기 제2 가중 함수(W2)는 상기 제1 입력 오디오 채널 신호(m1) 및 상기 제2 입력 오디오 채널 신호(m2)의 확산 음성(diffuse sound), 보다 상세하게는 상기 제1 입력 오디오 채널 신호(m1) 및 상기 제2 입력 오디오 채널 신호(m2)의 반향 음성(reverberation sound)의 파워 스펙트럼에 의존하는, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 제1 가중 함수(W1) 및 상기 제2 가중 함수(W2)는 상기 제1 차분 신호(x1) 및 상기 제2 차분 신호(x2) 간의 정규 상호 연관도(normalized cross correlation)에 의존하는, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    상기 제1 가중 함수(W1) 및 상기 제2 가중 함수(W2)는 상기 제1 파워 스펙트럼(P1) 및 상기 제2 파워 스펙트럼(P2)의 최소치에 의존하는, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 제1 가중 함수(W1) 및 제2 가중 함수(W2)를 결정하는 단계는,
    Figure pct00019
    Figure pct00020

    또는,
    Figure pct00021
    Figure pct00022

    에 의해 이루어지고, 여기서 P1(k,i)는 상기 제1 파워 스펙트럼을 나타내고, P2(k,i)는 상기 제2 파워 스펙트럼을 나타내며, W1(k,i)는 상기 제1 파워 스펙트럼에 대한 가중 함수를 나타내고, W2(k,i)는 상기 제2 파워 스펙트럼에 대한 가중 함수를 나타내며, D(k,i)는
    Figure pct00023
    로 결정되는 확산 음성의 파워 스펙트럼이며, 여기서 또한 Φ(k,i)는 상기 제1 차분 신호 및 상기 제2 차분 신호 간의 정규 상호 연관도이고, g는 게인 펙터(gain factor), β는 상기 지수 함수의 지수, k는 시간 인덱스, i는 주파수 인덱스인, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서,
    상기 출력 스테레오 신호(Y1,Y2) 중 상기 제1 출력 오디오 채널 신호(Y1) 및 상기 제2 출력 오디오 채널 신호(Y2)에 기초하여, 공간 정보(spatial cue), 보다 상세하게는 채널 레벨차, 채널간 시간차, 채널간 위상차 및 채널간 코히어런스/상호 연관도 중 하나를 결정하는 단계를 더 포함하는 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 필터링된 버전의 제1 입력 오디오 채널 신호(m1)는 상기 제1 입력 오디오 채널 신호(m1)의 지연된 버전이고, 상기 필터링된 버전의 제2 입력 오디오 채널 신호(m2)는 상기 제2 입력 오디오 채널 신호(m2)의 지연된 버전인, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서,
    상기 제1 입력 오디오 채널 신호(m1)는 제1 마이크로폰(M1)의 제1 마이크로폰 신호(m1)이고, 상기 제2 입력 오디오 채널 신호(m2)는 제2 마이크로폰(M2)의 제2 마이크로폰 신호(m2)인, 방법.
  13. 제12항에 있어서,
    상기 제1 마이크로폰(M1) 및 상기 제2 마이크로폰(M2)은 무지향성(omni-directional) 마이크로폰인, 방법.
  14. 컴퓨터상에서 실행된 때, 제1항 내지 제13항 중 어느 한 항에 기재된 방법을 수행하기 위한 프로그램 코드를 가진 컴퓨터 프로그램.
  15. 입력 스테레오 신호(m1,m2)에 기초하여 출력 스테레오 신호(Y1,Y2;L,R)를 결정하는 장치(400)로서,
    상기 입력 스테레오 신호는 제1 입력 오디오 채널 신호(m1) 및 제2 입력 오디오 채널 신호(m2)를 포함하고,
    상기 장치는, 제1항 내지 제13항 어느 한 항의 방법을 적용하는 것에 의해 상기 제1 입력 오디오 채널 신호(m1) 및 상기 제2 입력 오디오 채널 신호(m2)로부터 출력 스테레오 신호(Y1,Y2;L,R)를 생성하기 위한 프로세서(401)를 포함하는,
    장치.
  16. 제15항에 있어서,
    상기 스테레오 신호의 폭을 제어하는 폭 제어 파라미터(β)를 저장하기 위한 메모리; 및/또는
    상기 폭 제어 파라미터(β)를 제공하기 위한 사용자 인터페이스
    를 더 포함하고,
    상기 폭 제어 파라미터는 상기 제1 파워 스펙트럼(P1)에 가중처리를 행하기 위한 상기 제1 가중 함수(W1) 및 상기 제2 파워 스펙트럼(P2)에 가중처리를 행하기 위한 상기 제2 가중 함수(W2)에 의해 사용되는,
    장치.
  17. 제15항 또는 제16항에 있어서,
    상기 폭 제어 파라미터(β)는 상기 제1 파워 스펙트럼 및 상기 제2 파워 스펙트럼에 적용되는 지수이고, 상기 지수(β)는 0.5와 2 사이의 범위 내에 있는, 장치.
  18. 제15항 내지 제17항 중 어느 한 항에 있어서,
    상기 장치는 모바일 장치(400)이고, 상기 모바일 장치는 제1 마이크로폰(M1) 및 제2 마이크로폰(M2)를 포함하고,
    상기 제1 입력 오디오 채널 신호(m1)은 제1 마이크로폰(M1)의 제1 마이크로폰 신호(m1)이고, 상기 제2 입력 오디오 채널 신호(m2)는 상기 제2 마이크로폰(M2)의 제2 마이크로폰 신호(m2)인, 장치.
KR1020157020958A 2013-01-04 2013-01-04 스테레오 신호를 결정하는 방법 KR101694225B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2013/050112 WO2014106543A1 (en) 2013-01-04 2013-01-04 Method for determining a stereo signal

Publications (2)

Publication Number Publication Date
KR20150103252A true KR20150103252A (ko) 2015-09-09
KR101694225B1 KR101694225B1 (ko) 2017-01-09

Family

ID=47603603

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157020958A KR101694225B1 (ko) 2013-01-04 2013-01-04 스테레오 신호를 결정하는 방법

Country Status (5)

Country Link
US (1) US9521502B2 (ko)
EP (1) EP2941770B1 (ko)
KR (1) KR101694225B1 (ko)
CN (1) CN104981866B (ko)
WO (1) WO2014106543A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
CN105070304B (zh) * 2015-08-11 2018-09-04 小米科技有限责任公司 实现对象音频录音的方法及装置、电子设备
CN105590630B (zh) * 2016-02-18 2019-06-07 深圳永顺智信息科技有限公司 基于指定带宽的定向噪音抑制方法
CN107026934B (zh) * 2016-10-27 2019-09-27 华为技术有限公司 一种声源定位方法和装置
CN110033784B (zh) * 2019-04-10 2020-12-25 北京达佳互联信息技术有限公司 一种音频质量的检测方法、装置、电子设备及存储介质
WO2023009414A1 (en) * 2021-07-26 2023-02-02 Immersion Networks, Inc. System and method for audio diffusor

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110063826A (ko) * 2008-09-11 2011-06-14 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9009057B2 (en) * 2006-02-21 2015-04-14 Koninklijke Philips N.V. Audio encoding and decoding to generate binaural virtual spatial signals

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110063826A (ko) * 2008-09-11 2011-06-14 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FALLER, Christof. Conversion of Two Closely Spaced Omnidirectional Microphone Signals to an XY Stereo Signal. Audio Engineering Society Convention 129. 2010.11.04.* *
FALLER, Christof. Parametric coding of spatial audio. 2004. PhD Thesis. ECOLE POLYTECHNIQUE FEDERALE DE LAUSANNE.* *

Also Published As

Publication number Publication date
CN104981866A (zh) 2015-10-14
KR101694225B1 (ko) 2017-01-09
EP2941770A1 (en) 2015-11-11
US20160234621A1 (en) 2016-08-11
US9521502B2 (en) 2016-12-13
EP2941770B1 (en) 2017-08-30
CN104981866B (zh) 2018-09-28
WO2014106543A1 (en) 2014-07-10

Similar Documents

Publication Publication Date Title
US10573328B2 (en) Determining the inter-channel time difference of a multi-channel audio signal
JP6641018B2 (ja) チャネル間時間差を推定する装置及び方法
JP5511136B2 (ja) マルチチャネルシンセサイザ制御信号を発生するための装置および方法並びにマルチチャネル合成のための装置および方法
KR101480258B1 (ko) 미리 계산된 참조 곡선을 이용한 입력 신호 분해 장치 및 방법
JP2019097219A (ja) ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
JP2024063059A (ja) マルチチャネル信号の符号化方法およびエンコーダ
KR101694225B1 (ko) 스테레오 신호를 결정하는 방법
US11942098B2 (en) Method and apparatus for adaptive control of decorrelation filters
TWI714046B (zh) 用於估計聲道間時間差的裝置、方法或計算機程式
JP2008504578A (ja) マルチチャネル出力信号を発生するためのマルチチャネルシンセサイザおよび方法
KR20070028080A (ko) 이동통신 단말의 오디오 재생시 주변 잡음에 적응하는 자동음량 조절 방법 및 장치
US20190066701A1 (en) Optimized coding and decoding of spatialization information for the parametric coding and decoding of a multichannel audio signal
US9311925B2 (en) Method, apparatus and computer program for processing multi-channel signals
JP2022536169A (ja) 音場関連レンダリング
RU2779415C1 (ru) Устройство, способ и компьютерная программа для кодирования, декодирования, обработки сцены и других процедур, связанных с пространственным аудиокодированием на основе dirac с использованием диффузной компенсации
EP4330963A1 (en) Method and device for multi-channel comfort noise injection in a decoded sound signal

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20191217

Year of fee payment: 4