KR20230005264A - 음향 크로스토크 소거 및 가상 스피커 기술 - Google Patents

음향 크로스토크 소거 및 가상 스피커 기술 Download PDF

Info

Publication number
KR20230005264A
KR20230005264A KR1020227040863A KR20227040863A KR20230005264A KR 20230005264 A KR20230005264 A KR 20230005264A KR 1020227040863 A KR1020227040863 A KR 1020227040863A KR 20227040863 A KR20227040863 A KR 20227040863A KR 20230005264 A KR20230005264 A KR 20230005264A
Authority
KR
South Korea
Prior art keywords
audio signal
circuit
input
audio
crosstalk cancellation
Prior art date
Application number
KR1020227040863A
Other languages
English (en)
Inventor
러셀 그레이
Original Assignee
티에이치엑스 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 티에이치엑스 리미티드 filed Critical 티에이치엑스 리미티드
Publication of KR20230005264A publication Critical patent/KR20230005264A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/09Electronic reduction of distortion of stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

실시예는 크로스토크 소거 및/또는 가상 스피커의 생성을 수행하기 위한 방법, 장치 및 시스템을 제공한다. 오디오 프로세서는 크로스토크 소거 회로 및 선형화 회로를 포함할 수 있다. 선형화 회로는 평탄한 전체 주파수 응답을 제공하기 위해 크로스토크 소거 회로의 주파수 응답을 오프셋할 수 있다. 가상 스피커 회로는 출력 채널과 관련된 입력 신호를 수신하고 입력 신호를 수정되지 않은 출력 채널로 전달할 수 있다. 가상 스피커 회로는 입력 신호를 기반으로 가상화 신호를 생성하고 가상화 신호를 다른 물리적 채널로 전달한다. 가상화 신호는 가상 스피커 회로에 의해 생성된 가상 스피커의 가상 스피커 위치에 대응하는 동측 HRTF(head-related transfer function) 및 대측 HRTF에 기초하여 추가로 생성될 수 있다. 다른 실시예가 기술 및/또는 청구될 수 있다.

Description

음향 크로스토크 소거 및 가상 스피커 기술
본 출원은 2020년 4월 23일에 출원된 "음향 크로스토크 소거 및 가상 스피커 기법"이라는 제목의 미국 출원 16/857,033에 대한 우선권을 주장한다.
본 명세서에서의 실시예들은 오디오 재생 분야에 관한 것으로, 보다 상세하게는 음향 크로스토크 소거 및 가상 스피커 기술에 관한 것이다.
오디오 재생 시스템에서 음향 크로스토크는 왼쪽 라우드스피커가 청취자의 오른쪽 귀에 사운드 에너지를 도입하거나 및/또는 오른쪽 라우드스피커가 청취자의 왼쪽 귀에 사운드 에너지를 도입할 때 발생한다. 일부 시스템은 이 원치 않는 사운드 에너지를 소거하기 위해 크로스토크 소거 프로세스를 구현한다. 그러나, 이러한 크로스토크 소거 프로세스는 스펙트럼 아티팩트(예: 피드백 작업의 콤 필터링)를 도입한다.
또한, 일부 오디오 재생 시스템은 가상 스피커 기술을 구현하여 청취자가 사운드를 라우드스피커의 물리적 위치가 아닌 소스에서 발생하는 것으로 인식하도록 한다. 이는 일반적으로 심리 음향 위치 신호(psychoacoustic location cues)를 포함하도록 소스 오디오를 조작하여 달성된다. 예를 들어, 이전 방법은 심리 음향 위치 신호를 추가하기 위해 각 채널에서 머리 관련 임펄스 응답(head-related impulse response; HRIR) 컨볼루션을 수행한다. 그러나, 이러한 가상 스피커 기술은 스펙트럼 아티팩트를 출력 신호에 도입하기도 한다.
본 명세서의 다양한 실시예는 크로스토크 소거를 수행하고 및/또는 하나 이상의 가상 스피커를 생성하는 오디오 프로세서를 기술한다. 예를 들어, 오디오 프로세서는 입력 단자와 오디오 출력 단자 사이에서 서로 직렬로 연결된 크로스토크 소거 회로 및 선형화 회로를 포함할 수 있다. 크로스토크 소거 회로는 크로스토크를 소거하기 위해 입력 신호에 기초하여 출력 단자에 크로스토크 소거 신호를 제공할 수 있다. 크로스토크 소거 회로는 제1 주파수 응답을 갖는다. 선형화 회로는 작동 범위에 걸쳐 평탄한(즉, 1과 같음) 크로스토크 소거 방법에 대한 전체 주파수 응답을 제공하기 위해 제2 주파수 응답을 갖는다. 예를 들어, 제2 주파수 응답은 제1 주파수 응답의 역일 수 있다. 따라서, 선형화 회로와 크로스토크 소거 회로의 조합은 평탄한 주파수 응답을 제공하면서 출력 신호에 대한 크로스토크 소거를 제공할 수 있다.
부가적으로 또는 대안적으로, 오디오 프로세서는 가상 스피커 회로를 포함할 수 있다. 가상 스피커 회로는 다채널 청취 환경의 물리적 채널에 대한 입력 신호를 수신할 수 있다. 가상 스피커 회로는 수정되지 않은 입력 신호를 물리 채널과 관련된 제1 출력 단자(예를 들어, 동측 출력(the ipsilateral output))에 전달할 수 있다. 가상 스피커 회로는 입력 신호에 기초하여 가상화 신호를 생성하고 가상화 신호를 제2 물리적 채널(예를 들어, 대측 출력(the contralateral output))과 연관된 제2 출력 단자에 제공할 수 있다. 가상화 신호는, 아래에서 추가로 설명되는 바와 같이, 가상 스피커의 가상 스피커 위치에 대응하는 동측 HRTF(head-related transfer function) 및 대측 HRTF에 기초하여 추가로 생성될 수 있다. 따라서, 가상 스피커 방법은 동측 출력에 스펙트럼 아티팩트를 도입하지 않을 수 있다. 또한, 가상 스피커 방법은 실시간으로 작동할 수 있고 제한된 디지털 신호 처리 리소스가 필요할 수 있으므로 광범위한 제품 가격 범주에 걸쳐 사용될 수 있다.
이들 및 다른 실시예는 아래에서 더 상세히 설명된다.
실시예는 첨부된 도면 및 청구범위와 함께 다음의 상세한 설명에 의해 쉽게 이해될 것이다. 실시예는 예로서 설명되며 첨부된 도면의 도면에 제한되지 않는다.
도 1은 다양한 실시예에 따라 크로스토크 소거 회로 및 선형화 회로를 갖는 오디오 프로세서를 개략적으로 도시한다.
도 2는 다양한 실시예에 따른 크로스토크 소거 회로 및 선형화 회로의 예시적인 구현을 개략적으로 도시한다.
도 3은 다양한 실시예에 따라 가상 스피커 회로, 크로스토크 소거 회로 및 선형화 회로를 갖는 오디오 프로세서를 개략적으로 예시한다.
도 4는 다양한 실시예에 따라 가상 스피커 회로를 갖는 오디오 프로세서를 개략적으로 예시한다.
도 5는 다양한 실시예에 따른 가상 스피커 회로의 예시적인 구현을 개략적으로 도시한다.
도 6은 다양한 실시예에 따른 가상 스피커 방법을 설명하기 위한 청취 환경을 개략적으로 예시한다.
도 7은 다양한 실시예에 따라 본 명세서에 기술된 크로스토크 소거 방법 및/또는 가상 스피커 방법을 구현할 수 있는 오디오 재생 시스템을 개략적으로 도시한다.
본 상세한 설명에서, 본 명세서의 일부를 형성하고 실행될 수 있는 예시적인 실시예에 의해 도시된 첨부 도면을 참조한다. 다른 실시예가 이용될 수 있고 구조적 또는 논리적 변경이 범위를 벗어나지 않고 이루어질 수 있음을 이해해야 한다. 따라서, 상세한 설명은 제한적인 의미로 받아들여져서는 안 된다.
다양한 작동은 실시예를 이해하는 데 도움이 될 수 있는 방식으로 차례로 여러 개별 작동으로 설명될 수 있다. 그러나 설명의 순서는 이러한 작동이 순서에 의존하는 것을 의미하는 것으로 해석되어서는 안 된다.
설명은 위/아래, 뒤/앞, 위/아래와 같은 시각 기반 설명을 사용할 수 있다. 그러한 설명은 단지 논의를 용이하게 하기 위해 사용되며 개시된 실시예의 적용을 제한하려는 의도가 아니다.
"결합된" 및 "연결된"이라는 용어는 파생어와 함께 사용될 수 있다. 이들 용어는 서로에 대한 동의어로 의도된 것이 아님을 이해해야 한다. 오히려, 특정 실시예에서, "연결된"은 2개 이상의 요소가 서로 직접적인 물리적 또는 전기적 접촉에 있음을 나타내기 위해 사용될 수 있다. "결합된"은 2개 이상의 요소가 직접 물리적 또는 전기적 접촉 상태에 있음을 의미할 수 있다. 그러나 "결합된"은 둘 이상의 요소가 서로 직접 접촉하지 않지만 여전히 서로 협력하거나 상호 작용하는 것을 의미할 수도 있다.
설명의 목적상, "A/B" 또는 "A 및/또는 B" 형식의 구문은 (A), (B) 또는 (A 및 B)를 의미한다. 설명의 목적상 "A, B 및 C 중 적어도 하나" 형태의 구문은 (A), (B), (C), (A 및 B), (A 및 C), (B 및 C) 또는 (A, B 및 C)를 의미한다. 설명의 목적상 "(A)B" 형태의 구문은 (B) 또는 (AB)를 의미하며, 즉 A는 선택적 요소이다.
설명은 "실시예" 또는 "실시예들"이라는 용어를 사용할 수 있으며, 각각 동일하거나 다른 실시예 중 하나 이상을 지칭할 수 있다. 또한, 실시예와 관련하여 사용된 "포함하는", "갖는", "구비하는" 등의 용어는 동의어이며, 일반적으로 "개방형" 용어로 의도된다(예를 들어, 용어 "포함하는"은 "포함하나 이에 한정되지 아니한다"로 해석되어야 하고, 용어 "가지다"는 "적어도 가지다"로 해석되어야 하며, "포함하다"는 "포함하나 이에 한정되지 아니한다" 등으로 해석되어야 한다.)
본 명세서에서 사용되는 "전기회로망" 또는 "회로"라는 용어는, 하나 이상의 소프트웨어 또는 펌웨어 프로그램, 조합 논리 회로 및/또는 설명된 기능을 제공하는 기타 적절한 구성 요소를 실행하는, ASIC(Application Specific Integrated Circuit), 전자 회로, 프로세서(공유, 전용 또는 그룹) 및/또는 메모리(공유, 전용 또는 그룹)를 지칭하거나, 그 일부이거나, 포함할 수 있다.
본 명세서에서 임의의 복수 및/또는 단수 용어의 사용과 관련하여, 당업자는 문맥 및/또는 적용에 적절하도록 복수에서 단수로 및/또는 단수에서 복수로 번역할 수 있다. 명확성을 위해 다양한 단수/복수 순열이 여기에 명시적으로 설명될 수 있다.
도 1은 다양한 실시예에 따른 오디오 프로세서(100)를 도시한다. 오디오 프로세서(100)는 입력 단자(102)에서 입력 오디오 신호 x[n]을 수신할 수 있고 출력 단자(104)에서 출력 오디오 신호 y[n]를 생성할 수 있다. 오디오 프로세서(100)는 입력 단자(102)와 출력 단자(104) 사이에 서로 직렬로 결합된 크로스토크 소거 회로(106) 및 선형화 회로(108)를 포함할 수 있다. 예를 들어, 일부 실시예에서, 크로스토크 소거 회로(106)는 신호 경로를 따라 선형화 회로(108) 다음에 연결될 수 있다(예를 들어, 선형화 회로(108)와 출력 단자(104) 사이).
일부 실시예에서, 입력 오디오 신호 x[n]은 다중 채널을 갖는 오디오 재생 시스템의 하나의 채널에 대응할 수 있다. 오디오 재생 시스템은 시스템의 각 개별 채널에 대한 오디오 프로세서(100)를 포함할 수 있다. 일부 실시예에서, 오디오 프로세서(100)는 좌측 스피커 및 우측 스피커를 갖는 2 채널 오디오 시스템으로 구현될 수 있다. 추가적으로 또는 대안적으로, 오디오 프로세서(100)는 2개 이상의 스피커를 갖는 다중 채널 오디오 시스템(예를 들어, 서라운드 사운드 시스템)에서 구현될 수 있다. 다채널 오디오 시스템은 좌측 및 우측 스피커와 동일한 평면에 추가 스피커(예: 청취자 수준 스피커) 및/또는 하나 이상의 다른 평면에 추가 스피커(예: 높이 스피커)를 포함할 수 있다.
다양한 실시예에서, 상이한 채널에 대한 오디오 프로세서(100)는 일부 실시예에서 동일한 처리 회로(예를 들어, 디지털 신호 프로세서)에서 구현될 수 있고, 공유 구성요소를 포함하거나 포함하지 않을 수 있다. 대안적으로 또는 부가적으로, 오디오 재생 시스템은 하나 이상의 각각의 채널에 대해 개별 오디오 프로세서를 갖는 다수의 집적 회로를 포함할 수 있다. 일부 실시예에서, 오디오 프로세서(100)는 (예를 들어, 디지털 소스로부터 및/또는 아날로그-디지털 변환기(ADC)를 통해) 디지털 신호로서 입력 오디오 신호를 수신할 수 있다. 출력 오디오 신호는 스피커로 전달되기 전에 DAC(디지털-아날로그) 변환기에 의해 아날로그 오디오 신호로 변환될 수 있다.
다양한 실시예에서, 크로스토크 소거 회로(106)는 오디오 신호의 크로스토크 아티팩트를 소거하기 위해(예를 들어, 청취자의 한쪽 귀로 의도된 사운드 에너지가 다른 귀에 도달하는 것을 방지하기 위해) 그 입력 오디오 신호에 기초하여 출력 오디오 신호를 생성할 수 있다. 크로스토크 소거 회로(106)는 도 2와 관련하여 아래에서 추가로 논의되는 바와 같이 비선형 주파수 응답을 가질 수 있다. 따라서, 크로스토크 소거 회로(106)는 스펙트럼 아티팩트를 출력 신호에 도입할 수 있다.
다양한 실시예에서, 선형화 회로(108)는 (예를 들어, 크로스토크 소거 회로(106) 및/또는 선형화 회로(108)의 동작 범위에 걸쳐) 평탄한 오디오 프로세서(100)의 전체 주파수 응답을 제공하기 위해 크로스토크 소거 회로(106)의 주파수 응답을 오프셋하기 위해 포함될 수 있다. 예를 들어, 선형화 회로(108)는 크로스토크 소거 회로(106)에 제공되는 중간 오디오 신호 m[n]을 생성하기 위해 입력 오디오 신호 x[n]을 사전 왜곡할 수 있다. 크로스토크 소거 회로(106)는 중간 오디오 신호 m[n]을 처리하여 출력 오디오 신호 y[n]을 생성할 수 있다. 선형화 회로(108)의 주파수 응답은 크로스토크 소거 회로(106)의 주파수 응답의 역(inverse)일 수 있다. 따라서, 오디오 신호를 처리하는 선형화 회로(108) 및 크로스토크 소거 회로(106) 모두에 의해, 전체 주파수 응답은 원하는 크로스토크 소거를 제공하면서 평탄할 수 있다. 이러한 개념은 도 2와 관련하여 아래에서 자세히 설명한다.
도 2는 다양한 실시예에 따른 오디오 프로세서(100)에 대응할 수 있는 오디오 프로세서(200)를 도시한다. 오디오 프로세서(200)는 입력 단자(202)에서 입력 오디오 신호 x[n]을 수신하고 출력 단자(204)에서 출력 오디오 신호 y[n]을 제공할 수 있다. 전술한 바와 같이, 일부 실시예에서, 입력 오디오 신호 x[n]은 다중 채널을 갖는 오디오 재생 시스템의 하나의 채널에 대응할 수 있다.
다양한 실시예에서, 오디오 프로세서(200)는 입력 단자(202)와 출력 단자(204) 사이에 서로 직렬로 연결된(캐스케이딩이라고도 함) 선형화 회로(208) 및 크로스토크 소거 회로(206)를 포함할 수 있다. 예를 들어, 선형화 회로(208)는 도 2에 도시된 바와 같이 크로스토크 소거 회로(206)보다 신호 경로에서 더 일찍 결합될 수 있다. 선형화 회로(208)는 입력 오디오 신호 x[n]을 수신하고 (예를 들어, 중간 노드(216)에서) 크로스토크 소거 회로(206)에 제공되는 중간 오디오 신호 m[n]을 생성할 수 있다. 크로스토크 소거 회로(206)는 중간 오디오 신호 m[n]을 수신하고 출력 오디오 신호 y[n]를 생성할 수 있다. 도 2에 도시된 크로스토크 소거 회로(206)는 (예를 들어, 상이한 입력 채널 및/또는 출력 채널에 대응하는) 다수의 입력 및 출력을 포함하는 더 크로스토크 소거 회로의 하나의 신호 경로를 예시할 수 있다.
다양한 실시예에서, 크로스토크 소거 회로(206)는 크로스토크 아티팩트를 소거하기 위해 그의 입력 오디오 신호(예를 들어, m[n])를 수정할 수 있다. 예를 들어, 크로스토크 소거 회로(206)는 필터(210), 지연 요소(212), 및/또는 출력 단자(204)로부터 크로스토크 소거 회로(206)의 입력에 결합된 가산기(adder; 218)까지의 피드백 루프에 결합된 감쇠 요소(attenuation element; 214)를 포함할 수 있다(예를 들어, 중간 노드(216)). 크로스토크 소거 회로(206)의 피드백 루프로부터의 피드백은 가산기(218)에 의해 입력 오디오 신호로부터 감산되어(subtracted) 출력 단자(204)에서 출력 오디오 신호 y[n]을 생성한다. 일부 실시예는 크로스토크 소거 회로(206)의 피드백 루프에 추가 피드백 루프 및/또는 추가 또는 상이한 처리 요소를 포함할 수 있다.
필터(210), 지연 요소(212) 및/또는 감쇠 요소(214)의 값 및/또는 구성은 시스템 구성(예: 스피커 수 및/또는 스피커 레이아웃), 예상된, 측정된 또는 결정된 청취자 위치, 머리 관련 전달 기능, 의도된 출력 기능 등과 같은 임의의 적절한 인자에 기초하여 결정될 수 있다.
크로스토크 소거 회로(206)를 분리하여 보면(예를 들어, 선형화 회로(208)가 없는), 크로스토크 소거 회로(206)의 입력(m[n])에 기초한 이산 시간 영역에서 크로스토크 소거 회로(206)의 출력(y[n])은 방정식 (1)로 주어질 수 있다:
Figure pct00001
(1)
여기서, K1은 지연 요소(212)의 지연값, a1은 감쇠 요소(214)의 감쇠값, h1[n]은 필터(210)의 필터 함수이다.
방정식(1)을 주파수 도메인으로 변환하고 일부 대수적 조작을 수행하면 방정식(2)에 따른 크로스토크 소거 회로(206)의 주파수 응답이 생성된다:
Figure pct00002
(2)
따라서, 방정식 (2)에 의해 입증된 바와 같이, 크로스토크 소거 회로(206)의 피드백 루프에 의해 제공되는 크로스토크 소거는 균일하지 않은(예를 들어, 스펙트럼 아티팩트를 도입하는) 주파수 응답을 갖는다.
다양한 실시예에서, 선형화 회로(208)는 피드백 루프의 주파수 효과의 균형을 맞추고 오디오 프로세서(200)의 전체 주파수 응답을 다음과 같이 제공하기 위해 크로스토크 소거 회로(206)에 대한 입력으로서 제공되는 중간 오디오 신호 m[n]을 생성한다. 예를 들어, 선형화 회로(208)는 필터(220), 지연 소자(222), 및/또는 입력 단자(202)로부터 중간 노드(216)에 결합된 가산기(226)까지의 피드포워드 루프에 결합된 감쇠 요소(224)를 포함할 수 있다. 피드포워드 루프로부터의 피드포워드 신호는 가산기(226)에 의해 선형화 회로(208)의 출력에 가산되어 중간 오디오 신호 m[n]을 생성한다.
선형화 회로(208)를 분리하여 보면, 선형화 회로(208)의 출력은 방정식 (3)으로 주어진다:
Figure pct00003
(3)
여기서, K2는 지연 요소(222)의 지연값, a2는 감쇠 요소(224)의 감쇠값, h2[n]은 필터(220)의 필터 함수이다.
방정식(3)을 주파수 도메인으로 변환하고 일부 대수적 조작을 수행하면 방정식(4)에 따른 피드포워드 루프(208)의 주파수 응답이 산출된다:
Figure pct00004
(4)
방정식(2)과 방정식(4)을 결합하면 도 5에 도시된 오디오 프로세서(200)의 전체 주파수 응답이 제공된다:
Figure pct00005
(5)
따라서, 오디오 프로세서(200)의 전체 주파수 응답은 다음 조건이 충족되는 경우 1(즉, 주파수 스펙트럼에 걸쳐 평평함)이 될 것임을 알 수 있다:
Figure pct00006
(6)
따라서, 크로스토크 소거 회로(206)의 피드백 루프 및 선형화 회로(208)의 피드포워드 루프의 요소들은 방정식 (6)의 상기 조건을 만족하도록 설계 및/또는 제어될 수 있다. 예를 들어, 제어 회로(예를 들어, 디지털 신호 프로세서에서 구현됨)는 필터, 지연, 감쇠의 값, 및/또는 다른 값이 피드백 루프와 피드포워드 루프 사이에서 동일하도록, 피드백 루프(들) 및 대응하는 피드포워드 루프(들) 사이에서 동일하도록 제어할 수 있다.
오디오 프로세서(200)는 다중 크로스토크 소거 회로(206) 및 선형화 회로(208) 및/또는 2개 이상의 입력 오디오 신호(예를 들어, 상이한 채널에 대응하는)로부터 출력 오디오 신호를 생성하기 위한 추가 신호 경로를 포함할 수 있다. 결과적인 오디오 프로세서(200)는 평탄한 주파수 응답을 제공하면서 오디오 신호의 음향 크로스토크를 소거할 것이다. 오디오 프로세서(200)의 요소는 방정식 (6)의 조건이 유지되는 한 임의의 원하는 지연, 동작 대역, 및/또는 감쇠 레벨(예를 들어, 필터(210 및 220), 지연 요소(212 및 222), 및/또는 감쇠 요소(214 및 224)의 값을 조정함으로써)과 함께 구성될 수 있다.
전술한 바와 같이, 가상 스피커를 위한 오디오 처리 방법, 관련 장치 및 시스템이 또한 여기에 설명되어 있다. 가상 스피커 방법은 스테레오 또는 다중 채널(예를 들어, 2개 이상의 채널) 소스 오디오로부터 2개 이상의 개별 드라이브 유닛(예를 들어, 스피커)을 포함하는 확성기 시스템에서 재생되는 몰입형 공간 오디오 청취 환경(immersive spatial audio listening environment)을 생성할 수 있다. 다채널 청취 환경은 환경의 각각의 물리적 채널에 대응하는 둘 이상의 물리적 스피커를 포함할 수 있다. 다채널 청취 환경은 물리적 스피커의 위치와 다른 각각의 가상 스피커 위치와 관련된 하나 이상의 가상 스피커를 더 포함할 수 있다. 가상 스피커는 하나 이상의 물리적 스피커에 제공되는 오디오 신호를 청취자가 가상 출력 채널을 각각의 가상 스피커 위치에서 오는 것으로 인식하도록 수정함으로써 가상 스피커 방법에 의해 생성될 수 있다. 다양한 실시예에서, 물리적 스피커는 헤드폰 스피커 및/또는 아웃보드 스피커를 포함할 수 있다.
다양한 실시예에서, 가상 스피커 방법은 스펙트럼 아티팩트가 없는 몰입형 청취 환경을 생성하기 위해 본 명세서에 기술된 선형 크로스토크 소거 프로세스에 더하여 구현될 수 있다. 예를 들어, 도 3은 일부 실시예에 따른 오디오 프로세서(300)를 도시한다. 오디오 프로세서(300)는 선형화 회로(308) 및 입력 단자(302)와 출력 단자(304) 사이에 결합된 크로스토크 소거 회로(306)를 포함한다. 선형화 회로(308) 및/또는 크로스토크 소거 회로(306)는 본 명세서에 기술된 각각의 선형화 회로(108 및/또는 208) 및/또는 크로스토크 소거 회로(106 및/또는 206)에 대응할 수 있다. 오디오 프로세서(300)는 오디오 프로세서(300)의 입력 단자(302)와 선형화 회로(308)의 입력 사이에 연결된 가상 스피커 회로(310)를 더 포함할 수 있다. 가상 스피커 회로(310)는 본 명세서에 기술된 가상 스피커 방법을 구현할 수 있다.
대안적으로, 가상 스피커 방법은 크로스토크 소거 없이 구현되거나(예를 들어, 헤드폰과 함께 사용되는 경우), 여기에 설명된 것과 다른 크로스토크 소거 방법으로 구현될 수 있다. 예를 들어, 도 4는 입력 단자(402)와 출력 단자(404) 사이에 직렬로 연결된 가상 스피커 회로(410)를 포함하는 오디오 프로세서(400)를 도시한다. 가상 스피커 회로(410)는 본 명세서에 기술된 가상 스피커 방법을 구현할 수 있다.
가상 스피커 방법의 다양한 실시예에서, 물리적 출력 채널과 연관된 주어진 입력 채널에 대해, 입력 오디오 신호는 가상 스피커 처리 방법에 의해 어떠한 수정도 없이 대응하는 물리적 스피커로 전달될 수 있다(입력 오디오 신호는 크로스토크 소거와 같이, 사용될 수 있는 다른 처리 작업에 의해 처리될 수 있다). 가상 스피커는 하나 이상의 다른 물리적 스피커에 추가 가상화 오디오 신호를 제공함으로써 생성될 수 있다.
가상 스피커 방법은 서라운드 사운드 환경의 느낌을 생성하기 위해, 청취자에게 심리 음향 단서를 제공하는 추가의 신호 처리와 함께 수신 오디오 스트림에 적용되는 차이 필터를 생성함으로써 작동할 수 있다. 이 방법은 서로 물리적으로 분리된 트랜스듀서를 갖는 2개의 별도로 어드레싱 가능한 음향 재생 채널을 포함하는 임의의 재생 장치에서 구현될 수 있다.
예를 들어, 도 5는 다양한 실시예에 따라 가상 스피커 방법을 구현할 수 있는 가상 스피커 회로(500)를 도시한다. 일부 실시예에서, 가상 스피커 회로(500)는 가상 스피커 회로(310 및/또는 410)에 대응할 수 있다. 가상 스피커 회로(500)는 입력 단자(502)에서 입력 신호 xL[n]을 수신할 수 있다. 입력 신호 xL[n]는 다채널 청취 환경의 물리적 채널(예를 들어, 왼쪽 스피커 채널)에 해당할 수 있다. 가상 스피커 회로(500)는 수정되지 않은 입력 신호 xL[n]을 물리적 채널에 대응하는 제1 출력 단자(504)에 전달할 수 있다(예를 들어, 물리적 스피커 및/또는 물리적 채널을 위한 후속하는 처리 회로(예를 들어, 선형화 회로 및/또는 크로스토크 소거 회로)에 전달된다). 따라서, 물리적 채널에 대한 출력 신호 yL[n]는 물리적 채널에 대한 입력 신호 xL[n]와 동일하다.
추가로, 가상 스피커 회로(500)는 입력 신호 xL[n]에 기초하여 가상화 신호 yR[n]을 생성할 수 있고, 가상화 신호를 상이한 물리적 채널(예를 들어, 이 예시에서 우측 스피커 채널)에 대응하는 제2 출력 단자(506)로 전달할 수 있다. 가상화 신호는 아래에서 추가로 설명되는 바와 같이 가상 화자의 가상 화자 위치에 대응하는 동측 HRTF 및 대측 HRTF에 기초하여 추가로 생성될 수 있다. 예를 들어, 일부 실시예에서, 가상 스피커 회로(500)는 필터(520), 감쇠 요소(524) 및/또는 지연 요소(522)를 포함하여 각각의 필터링, 감쇠 및 지연을 입력 신호 xL[n]에 제공하여 가상화 신호 yR[n]를 생성한다. 다른 실시예는 가상화 신호를 생성하기 위해 더 적은 구성 요소, 추가의 구성 요소 및/또는 구성 요소의 다른 배열을 포함할 수 있다.
도 6은 가상 스피커 방법이 구현될 수 있는 청취 환경(600)을 예시한다. 청취 환경(600)은 좌측 스피커(602) 및 우측 스피커(604)를 포함할 수 있다. 가상 스피커 방법은 스피커(602, 604)에 대해 위치하는 청취 위치(606)를 고려하여 구현될 수 있다. 예를 들어, 스피커(602, 604)는 두 스피커(602, 604)의 기준축이 서로 평행하고 또 청취 위치(606)에서 청취자의 코끝에서부터 두 소스로부터 등거리에 있는 청취 위치(606)에서 청취자의 머리 뒤쪽까지 지면에 대해 평행하게 그려진 가상선에 평행하도록 위치될 수 있다. 기술의 구현 중 하나는 수신 스테레오 오디오를 방위각 전용 공간 환경(예: 생성된 엘리베이션(elevation) 신호 없음)으로 처리한다. 일부 실시예에서, 다른 스피커 배열 및/또는 청취자 위치를 구현하기 위해 방법에 대한 수정이 이루어질 수 있다. 예를 들어, 일부 실시예는 엘리베이션 신호가 있는 가상 높이 채널을 포함할 수 있다.
청취 환경(600)에서, 청취 위치(606)는 지점 A, B, C 및 D에 의해 모서리에 정의된 박스의 중앙에 위치할 수 있다. 이전의 오디오 공간화 접근 방식에서, 수신 오디오는 머리 관련 임펄스 응답(HRIR) 데이터와 컨볼루션되어 적절한 지연 및 스펙트럼 이동을 생성하여 오디오를 위치 또는 위치 정보로 인코딩한다. 이 방법의 한 가지 단점은 처리된 모든 오디오에 스펙트럼 변화를 도입한다는 것이다. 대조적으로, 본 명세서에 기술된 가상 스피커 방법은 어떠한 스펙트럼 변화도 도입하지 않고 청취 위치에서 공간화된 음장을 생성할 수 있다.
가상 스피커 방법은 스테레오 물리적 스피커를 통한 재생을 위해 스테레오 오디오 신호를 공간화하기 위한 청취 환경(600)과 관련하여 설명될 것이다. 이해하기 쉽도록 이 프로세스는 수신 스테레오 오디오의 한 채널과 관련하여 설명된다. 수신 오디오의 다른 채널에 대한 프로세스는 채널 지정을 제외하고 동일하다. 이 프로세스는 또한 2개 이상의 물리적 스피커와 함께 사용될 수 있다(예를 들어, 추가 프로세스 경로를 포함함으로써, 및/또는 공간화 신호가 복수의 물리적 스피커에 걸쳐 분산되는 방식을 수정함으로써).
가상화의 한 방법에서, 왼쪽 수신 시간 도메인 오디오 채널 xL은 원하는 왼쪽 위치에 대응하는 HRIR의 두 채널인 동측(hLL) 및 대측(hLR)과 컨볼루션된다. 그 결과는 두 개의 출력 신호이며, 하나는 재생 시스템(yL)의 왼쪽 채널로 전송되고 다른 하나는 재생 시스템(yR)의 오른쪽 채널로 전송된다:
Figure pct00007
(7)
방정식 (7)을 주파수 도메인으로 변환하면 방정식 (8)이 생성된다:
Figure pct00008
(8)
방정식 (8)은 동측 출력 측면에 대한 대측 출력의 표현을 얻기 위해 재배열될 수 있다:
Figure pct00009
(9)
방정식 (9)의 최종 형태는, 주파수 도메인에서 동측 및 대측 머리 관련 전달 함수(HRTF)의 차이에 의해 수정된, 대측 출력 신호에 의해 부여된 심리음향적 국소화 효과가 동측 출력 신호의 선형 함수임을 보여준다. 본 명세서의 다양한 실시예에 따르면, 가상 스피커 프로세스의 동측 출력은 수정되지 않은 입력 채널이다. 따라서, 대측 출력은 방정식 (9)에 기초하여 생성될 수 있다. 예를 들어, 가상 스피커 방식의 동측 출력과 대측 출력은 다음과 같을 수 있다:
Figure pct00010
(10)
따라서, 다양한 실시예에서, 공간화된 신호는 의도된 로컬라이제이션 원점(localization origins)에 대응하는 2개의 HRTF의 비율과 동일한 필터를 적용(예를 들어, 도 5의 필터(520)에 의해 적용됨)함으로써 임의의 청취 차원에 걸쳐 소스 오디오로부터 임의로 생성될 수 있다. 도 6을 다시 참조하면, 입력 오디오를 A-B 차원에서 공간화하기 위해 STS(side-to-side) 프로세스(608)가 적용될 수 있다. 추가적으로 또는 대안적으로, A-C 차원에서 입력 오디오를 공간화하기 위해 FTB(front-to-back) 프로세스(610)가 적용될 수 있다. 프로세스(608 및/또는 610)는 적절한 로컬라이제이션 단서(localization cues)를 생성하기 위해, 지연, 감쇠 및 위상 조정(예를 들어, 도 5에 도시된 바와 같은)과 같은 추가적인 신호 처리 요소를 포함할 수 있다. 위상 조정은 예를 들어 하나 이상의 전역 통과 필터(all-pass filters)를 사용하여 필터(520)에 의해 제공될 수 있다.
일부 실시예는 STS 프로세스(608) 및/또는 FTB 프로세스(610)에 더하여 또는 그를 대신하여, 하나 이상의 다른 차원에서 공간화 프로세스를 포함할 수 있다. 예를 들어, 일부 실시예는 추가적으로 또는 대안적으로 입력 오디오를 수직 차원으로 공간화하는 엘리베이션 프로세스 및/또는 입력 오디오를 대각선 차원으로 공간화하는 대각선 공간화 프로세스를 포함할 수 있다.
다양한 실시예에서, 본 명세서에 기술된 크로스토크 소거 방법 및/또는 가상 스피커 방법은 임의의 적절한 오디오 재생 시스템에서 구현될 수 있다. 도 7은 크로스토크 소거 방법 및/또는 가상 스피커 방법을 구현할 수 있는 오디오 프로세서 회로(702)를 포함하는 시스템(700)의 일례를 개략적으로 도시한다. 예를 들어, 오디오 프로세서 회로(702)는 본 명세서에 기술된 오디오 프로세서(100, 200, 300 및/또는 400) 및/또는 가상 스피커 회로(500)를 포함할 수 있다.
다양한 실시예에서, 시스템(700)은 다채널 입력 오디오 신호일 수 있는 입력 오디오 신호를 수신할 수 있다. 입력 오디오 신호는 디지털 및/또는 아날로그 형태로 수신될 수 있다. 입력 오디오 신호는 시스템 700의 다른 구성 요소(예: 미디어 플레이어 및/또는 저장 장치)로부터 및/또는 시스템(700)과 통신 가능하게 연결된 다른 장치(예를 들어, 유선 연결(예를 들어, Universal Serial Bus(USB)), 광 디지털, 동축 디지털, HDMI(High Definition Media Interconnect), 유선 LAN(Local Area Network) 등)을 통해, 및/또는 무선 연결(예를 들어, Bluetooth, 무선 LAN(WiFi와 같은 WLAN)), 셀룰러 등)로부터 수신될 수 있다.
다양한 실시예에서, 오디오 프로세서 회로(702)는 출력 오디오 신호를 생성하고 출력 오디오 신호를 증폭기 회로(704)에 전달할 수 있다. 오디오 프로세서 회로(702)는 각각 크로스토크 소거를 제공하고/하거나 가상 스피커(들)를 생성하기 위해, 본 명세서에 기술된 크로스토크 소거 회로(들) 및/또는 가상 스피커 회로(들)를 구현할 수 있다. 출력 오디오 신호는 2개 이상의 출력 채널을 갖는 다채널 오디오 신호일 수 있다.
증폭기 회로(704)는 유선 및/또는 무선 연결을 통해 오디오 프로세서 회로(702)로부터 출력 오디오 신호를 수신할 수 있다. 증폭 회로(704)는 오디오 프로세서 회로(702)로부터 수신된 출력 오디오 신호를 증폭하여 증폭된 오디오 신호를 생성할 수 있다. 증폭기 회로(704)는 증폭된 오디오 신호를 2개 이상의 물리적 스피커(706)로 전달할 수 있다. 스피커(706)는 아웃보드 스피커 및/또는 헤드폰 스피커와 같이, 증폭된 오디오 신호에 기초하여 가청 사운드를 생성하기 위한 임의의 적합한 오디오 출력 장치를 포함할 수 있다. 스피커(706)는 증폭기 회로로부터 증폭된 오디오 신호를 수신하기 위한 독립형 스피커일 수 있고, 및/또는 증폭기 회로(704) 및/또는 오디오 프로세서 회로(702)를 또한 포함하는 장치에 통합될 수 있다. 예를 들어, 스피커(706)는 증폭기 회로(704)를 포함하지 않는 수동 스피커 및/또는 동일한 장치에 통합된 증폭기 회로(704)를 포함하는 능동 스피커일 수 있다.
일 예에서, 스피커(706)는 예를 들어 청취자의 왼쪽 귀에 오디오를 제공하는 좌측 스피커 및 청취자의 우측 귀에 오디오를 제공하는 우측 스피커를 갖는 헤드폰 스피커일 수 있다. 헤드폰은 유선 및/또는 무선 인터페이스를 통해 입력 오디오를 수신할 수 있다. 헤드폰은 (예를 들어, 무선 인터페이스로부터의 오디오 재생을 위한) 오디오 증폭기(704)를 포함하거나 포함하지 않을 수 있다. 일부 실시예에서, 헤드폰은 본 명세서에 기술된 가상 스피커 방법을 적용하기 위해 오디오 프로세서 회로(702)를 포함할 수 있다. 대안적으로, 헤드폰은 가상 스피커 방식을 적용한 이후에 처리된 오디오를 다른 장치로부터 수신할 수 있다.
다양한 실시예에서, 시스템(700)의 일부 또는 모든 요소는 휴대폰, 컴퓨터, 오디오/비디오 수신기, 통합 증폭기, 독립형 오디오 프로세서(오디오/비디오 프로세서를 포함), 파워드 스피커(예: 스마트 스피커 또는 비스마트 파워드 스피커), 헤드폰, 아웃보드 USB DAC 장치 등과 같은, 임의의 적합한 장치에 포함될 수 있다.
다양한 실시예에서, 오디오 프로세서 회로(702)는 하나 이상의 디지털 신호 프로세서 회로와 같은 하나 이상의 집적 회로를 포함할 수 있다. 추가적으로, 또는 대안적으로, 시스템(700)은 하나 이상의 프로세서, 메모리(예를 들어, 랜덤 액세스 메모리(RAM), 대용량 저장 장치(예를 들어, 플래시 메모리, 하드 디스크 드라이브(HDD) 등)), 안테나, 디스플레이 등과 같은 하나 이상의 추가 구성요소를 포함할 수 있다.
특정 실시예들이 본 명세서에 도시되고 설명되었지만, 동일한 목적을 달성하기 위해 계산된 광범위한 대체 및/또는 동등한 실시예들 또는 구현들이 범위를 벗어나지 않고 도시되고 설명된 실시예들에 대체될 수 있다는 것은 당업자들에 의해 이해될 것이다. 당업자는 실시예들이 매우 다양한 방식으로 구현될 수 있다는 것을 쉽게 이해할 것이다. 본 출원은 본 명세서에서 논의된 실시예들의 임의의 적응 또는 변형을 다루기 위한 것이다. 따라서, 실시예들은 청구항들 및 이의 등가물들에 의해서만 제한되는 것이 명백하게 의도된다.

Claims (20)

  1. 입력 오디오 신호를 수신하는 입력 단자;
    출력 오디오 신호를 제공하는 출력 단자;
    상기 입력 단자와 상기 출력 단자 사이에 연결되어 상기 출력 오디오 신호에 크로스토크 소거 신호를 제공하는 크로스토크 소거 회로로서, 상기 크로스토크 소거 회로는 제1 주파수 응답을 가지는, 크로스토크 소거 회로;
    상기 입력 단자와 상기 출력 단자 사이에서 상기 크로스토크 소거 회로와 직렬로 연결된 선형화 회로로서, 상기 선형화 회로는 작동 범위에 걸쳐 평탄한 오디오 프로세서 회로에 대하여 전체 주파수 응답을 제공하기 위한 제2 주파수 응답을 가지는, 선형화 회로;
    를 포함하는 오디오 프로세서 회로.
  2. 제1항에 있어서,
    상기 크로스토크 소거 회로는 필터, 감쇠 요소 및 상기 크로스토크 소거 회로의 출력과 상기 크로스토크 소거 회로의 입력 사이의 피드백 루프에 결합된 지연 요소를 갖는 피드백 루프를 포함하는 것인,
    오디오 프로세서 회로.
  3. 제2항에 있어서,
    상기 필터는 제1 필터이고, 상기 감쇠 요소는 제1 감쇠 요소이며, 상기 지연 요소는 제1 지연 요소이고, 상기 선형화 회로는 제2 필터, 제2 감쇠 요소 및 상기 선형화 회로의 입력과 상기 선형화 회로의 출력 사이의 피드포워드 루프에 결합된제2 지연 요소를 갖는 피드포워드 루프를 포함하는 것인,
    오디오 프로세서 회로.
  4. 제1항에 있어서,
    상기 선형화 회로의 하나 이상의 값을 상기 크로스토크 소거 회로의 대응하는 하나 이상의 값과 동일하게 제어하는 제어 회로를 더 포함하는,
    오디오 프로세서 회로.
  5. 제1항에 있어서,
    상기 선형화 회로는 입력 오디오 신호를 수신하고 상기 입력 오디오 신호에 기초하여 중간 오디오 신호를 생성하며, 상기 크로스토크 소거 회로는 상기 중간 오디오 신호를 수신하고 상기 중간 오디오 신호에 기초하여 상기 출력 오디오 신호를 생성하는 것인,
    오디오 프로세서 회로.
  6. 제5항에 있어서,
    상기 입력 단자와 상기 출력 단자 사이의 신호 경로에서 상기 크로스토크 소거 회로의 제1 주파수 응답은
    Figure pct00011

    이고,
    여기서 Y(z)는 출력 오디오 신호이고, K1은 제1 지연 값이고, a1은 제1 감쇠 값이고, H1(z)는 제1 필터 함수이며;
    상기 선형화 회로의 제2 주파수 응답은
    Figure pct00012

    이며,
    여기서 M(z)는 중간 오디오 신호이고, X(z)는 입력 오디오 신호이며, K2는 제2 지연 값이고, a2는 제2 감쇠 값이고, H2(z)는 제2 필터 함수이며;
    Figure pct00013

    인, 오디오 프로세서 회로.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 입력 오디오 신호는 제1 입력 오디오 신호이고, 상기 오디오 프로세서 회로는 가상 스피커 회로를 더 포함하여:
    제2 입력 오디오 신호를 수신하고 - 여기에서 제2 입력 오디오 신호는 다채널 청취 환경의 제1 물리적 채널에 대응함;
    제2 입력 오디오 신호를 제1 물리적 채널에 대한 제1 입력 오디오 신호로서 상기 크로스토크 소거 회로에 전달하며;
    제2 입력 오디오 신호에 기초하여 상기 다채널 청취 환경의 가상 채널을 생성하고 - 여기에서 상기 가상 채널은 가상 채널 위치와 연관되고, 여기에서, 가상 채널을 생성하기 위해, 상기 가상 스피커 회로는:
    상기 제2 입력 오디오 신호, 가상 채널 위치에 대응하는 동측 HRTF(head-related transfer function) 및 가상 채널 위치에 대응하는 대측 HRTF에 기초하여 가상화 오디오 신호를 생성하고; 및
    상기 다중 채널 청취 환경의 제2 물리적 채널에 가상화 오디오 신호를 제공하는 것인,
    오디오 프로세서 회로.
  8. 제7항에 있어서,
    상기 가상 스피커 회로는 상기 제2 입력 오디오 신호를 수정 없이 상기 크로스토크 소거 회로에 전달하는 것인,
    오디오 프로세서 회로.
  9. 제7항에 있어서,
    상기 가상화 오디오 신호는
    Figure pct00014

    에 따라 생성되고,
    여기에서, Y2는 주파수 도메인에서 가상화 오디오 신호이고, H12는 대측 HRTF이고, H11은 동측 HRTF이고, X1은 물리적 채널에 대한 제2 입력 오디오 신호인,
    오디오 프로세서 회로.
  10. 다채널 청취 환경의 제1 물리적 채널에 대응하는 입력 오디오 신호를 수신하는 입력 단자;
    상기 입력 단자에 결합된 가상 스피커 회로로서, 상기 가상 스피커 회로는 상기 입력 오디오 신호에 기초하여 상기 다채널 청취 환경의 가상 채널을 생성하고, 상기 가상 채널은 가상 채널 위치와 관련되며, 상기 가상 채널을 생성하기 위하여, 상기 가상 스피커 회로는:
    입력 오디오 신호, 가상 채널 위치에 대응하는 동측 HRTF(head-related transfer function) 및 가상 채널 위치에 대응하는 대측 HRTF에 기초하여 가상화 오디오 신호를 생성하고; 및
    상기 다중 채널 청취 환경의 제2 물리적 채널에 상기 가상화 오디오 신호를 제공하는,
    가상 스피커 회로;
    를 포함하는, 오디오 프로세서 회로.
  11. 제10항에 있어서,
    가상 스피커 회로는 또한 상기 입력 오디오 신호를 수정 없이 상기 제1 물리적 채널과 관련된 물리적 스피커로 전달하는 것인,
    오디오 프로세서 회로.
  12. 제10항에 있어서,
    상기 가상화 오디오 신호는
    Figure pct00015

    에 따라 생성되고,
    여기에서, Y2는 주파수 도메인에서 가상화 오디오 신호이고, H12는 대측 HRTF이고, H11은 동측 HRTF이고, X1은 제1 물리적 채널에 대한 입력 오디오 신호인,
    오디오 프로세서 회로.
  13. 제10항 내지 제12항 중 어느 한 항에 있어서,
    상기 입력 오디오 신호는 제1 입력 오디오 신호이고, 상기 가상화 오디오 신호는 제1 가상화 오디오 신호이며, 상기 가상 스피커 회로는 또한:
    상기 다중 채널 청취 환경의 제2 물리적 채널과 연관된 제2 입력 오디오 신호를 수신하고;
    상기 제2 입력 오디오 신호에 기초하여 상기 가상 채널에 대한 제2 가상화 오디오 신호를 생성하며; 및
    제2 가상화 오디오 신호를 제1 물리적 채널에 제공하는 것인,
    오디오 프로세서 회로.
  14. 오디오 프로세서로서,
    입력 오디오 신호를 수신하고 상기 입력 오디오 신호에 기초하여 중간 오디오 신호를 생성하는 선형화 회로로서, 상기 선형화 회로는 제1 주파수 응답을 갖는, 선형화 회로; 및
    상기 중간 오디오 신호를 수신하고 상기 중간 오디오 신호에서 크로스토크를 소거하기 위해 출력 오디오 신호를 생성하는 크로스토크 소거 회로로서, 상기 크로스토크 소거 회로는 작동 범위에 걸쳐 평탄한 프로세서 회로에 대한 전체 주파수 응답을 제공하기 위한 제2 주파수 응답을 갖는, 크로스토크 소거 회로;
    를 포함하는, 오디어 프로세서; 및
    상기 오디오 프로세서에 결합된 오디오 증폭기로서, 상기 오디오 증폭기는 상기 출력 오디오 신호를 증폭하고 상기 출력 오디오 신호를 하나 이상의 스피커에 제공하는, 오디오 증폭기;
    를 포함하는, 오디오 출력 시스템.
  15. 제14항에 있어서,
    상기 크로스토크 소거 회로는 필터, 감쇠 요소, 및 상기 크로스토크 소거 회로의 출력과 상기 크로스토크 소거 회로의 입력 사이의 피드백 루프에 결합된 지연 요소를 갖는 피드백 루프를 포함하는 것인,
    오디오 출력 시스템.
  16. 제15항에 있어서,
    상기 필터는 제1 필터이고, 상기 감쇠 요소는 제1 감쇠 요소이고, 상기 지연 요소는 제1 지연 요소이며, 상기 선형화 회로는 상기 제1 필터와 동일한 필터 기능을 갖는 제2 필터, 상기 제1 제1 감쇠 요소와 동일한 감쇠 값을 갖는 제2 감쇠 요소, 및 상기 제1 지연 요소와 동일한 지연 값을 갖는 제2 지연 요소를 갖는 피드포워드 루프를 포함하고, 상기 제2 필터, 상기 제2 감쇠 요소 및 상기 제2 지연 요소는 상기 선형화 회로의 입력과 상기 선형화 회로의 출력 사이에서 상기 피드포워드 루프에서 결합되는 것인,
    오디오 출력 시스템.
  17. 제14항에 있어서,
    상기 선형화 회로의 제1 주파수 응답은
    Figure pct00016

    이고,
    여기에서, M(z)는 중간 오디오 신호이고, X(z)는 입력 오디오 신호이고, K2는 선형화 지연 값이고, a2는 선형화 감쇠 값이고, H2(z)는 선형화 필터 함수이고;
    상기 크로스토크 소거 회로의 제2 주파수 응답은
    Figure pct00017

    이고,
    여기에서, Y(z)는 출력 오디오 신호이고, K1은 크로스토크 지연 값이고, a1은 크로스토크 감쇠 값이고, H1(z)는 크로스토크 필터 함수이고;
    여기에서,
    Figure pct00018

    인, 오디오 출력 시스템.
  18. 제14항에 있어서,
    상기 입력 신호는 제1 입력 신호이고, 상기 오디오 프로세서 회로는 가상 스피커 회로를 더 포함하여:
    제2 입력 오디오 신호를 수신하고 - 상기 제2 입력 오디오 신호는 다채널 청취 환경의 제1 물리적 채널에 대응함;
    수정되지 않은 상기 제2 입력 오디오 신호를 상기 선형화 회로의 제1 입력에 전달하고 - 여기서, 상기 제1 입력은 상기 제1 물리적 채널에 대한 것임;
    출력 오디오 신호, 가상 채널 위치에 대응하는 동측 HRTF(head-related transfer function) 및 가상 채널 위치에 대응하는 대측 HRTF에 기초하여 가상화 오디오 신호를 생성하고; 및
    가상 채널 위치와 관련된 가상 채널을 생성하기 위해 상기 선형화 회로의 제2 입력에 상기 가상화 오디오 신호를 제공 - 여기서, 제2 입력은 상기 다중 채널 청취 환경의 제2 물리적 채널에 대응함;하는 것인,
    오디오 출력 시스템.
  19. 제18항에 있어서,
    상기 가상화 오디오 신호는
    Figure pct00019

    에 따라 생성되고,
    여기에서, Y2는 주파수 도메인에서 가상화 오디오 신호이고, H12는 대측 HRTF이고, H11은 동측 HRTF이고, X1은 제1 물리적 채널에 대한 제2 입력 오디오 신호인,
    오디오 출력 시스템.
  20. 제14항 내지 제19항 중 어느 한 항에 있어서,
    증폭된 출력 오디오 신호를 수신하기 위해 오디오 증폭기에 연결된 하나 이상의 스피커를 더 포함하는 것인,
    오디오 출력 시스템.
KR1020227040863A 2020-04-23 2021-04-05 음향 크로스토크 소거 및 가상 스피커 기술 KR20230005264A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/857,033 US11246001B2 (en) 2020-04-23 2020-04-23 Acoustic crosstalk cancellation and virtual speakers techniques
US16/857,033 2020-04-23
PCT/US2021/025813 WO2021216274A1 (en) 2020-04-23 2021-04-05 Acoustic crosstalk cancellation and virtual speakers techniques

Publications (1)

Publication Number Publication Date
KR20230005264A true KR20230005264A (ko) 2023-01-09

Family

ID=78223152

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227040863A KR20230005264A (ko) 2020-04-23 2021-04-05 음향 크로스토크 소거 및 가상 스피커 기술

Country Status (8)

Country Link
US (1) US11246001B2 (ko)
EP (1) EP4140152A4 (ko)
JP (1) JP2023522995A (ko)
KR (1) KR20230005264A (ko)
CN (1) CN115702577A (ko)
AU (1) AU2021258825A1 (ko)
CA (1) CA3176011A1 (ko)
WO (1) WO2021216274A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11750745B2 (en) 2020-11-18 2023-09-05 Kelly Properties, Llc Processing and distribution of audio signals in a multi-party conferencing environment

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6449368B1 (en) * 1997-03-14 2002-09-10 Dolby Laboratories Licensing Corporation Multidirectional audio decoding
US6243476B1 (en) 1997-06-18 2001-06-05 Massachusetts Institute Of Technology Method and apparatus for producing binaural audio for a moving listener
US6442277B1 (en) * 1998-12-22 2002-08-27 Texas Instruments Incorporated Method and apparatus for loudspeaker presentation for positional 3D sound
US6584205B1 (en) 1999-08-26 2003-06-24 American Technology Corporation Modulator processing for a parametric speaker system
US6920223B1 (en) 1999-12-03 2005-07-19 Dolby Laboratories Licensing Corporation Method for deriving at least three audio signals from two input audio signals
US7715836B2 (en) 2002-09-03 2010-05-11 Broadcom Corporation Direct-conversion transceiver enabling digital calibration
ATE428274T1 (de) 2003-05-06 2009-04-15 Harman Becker Automotive Sys Verarbeitungssystem fur stereo audiosignale
US7050388B2 (en) 2003-08-07 2006-05-23 Quellan, Inc. Method and system for crosstalk cancellation
JP2005341384A (ja) 2004-05-28 2005-12-08 Sony Corp 音場補正装置、音場補正方法
US7835535B1 (en) 2005-02-28 2010-11-16 Texas Instruments Incorporated Virtualizer with cross-talk cancellation and reverb
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
US8379868B2 (en) 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US8705748B2 (en) 2007-05-04 2014-04-22 Creative Technology Ltd Method for spatially processing multichannel signals, processing module, and virtual surround-sound systems
GB0712998D0 (en) 2007-07-05 2007-08-15 Adaptive Audio Ltd Sound reproducing systems
US20090086982A1 (en) * 2007-09-28 2009-04-02 Qualcomm Incorporated Crosstalk cancellation for closely spaced speakers
US9173032B2 (en) 2009-05-20 2015-10-27 The United States Of America As Represented By The Secretary Of The Air Force Methods of using head related transfer function (HRTF) enhancement for improved vertical-polar localization in spatial audio systems
US20100303245A1 (en) 2009-05-29 2010-12-02 Stmicroelectronics, Inc. Diffusing acoustical crosstalk
US8818206B2 (en) * 2009-06-24 2014-08-26 Ciena Corporation Electrical domain suppression of linear crosstalk in optical communication systems
US20120314872A1 (en) 2010-01-19 2012-12-13 Ee Leng Tan System and method for processing an input signal to produce 3d audio effects
US9578440B2 (en) 2010-11-15 2017-02-21 The Regents Of The University Of California Method for controlling a speaker array to provide spatialized, localized, and binaural virtual surround sound
EP2656640A2 (en) 2010-12-22 2013-10-30 Genaudio, Inc. Audio spatialization and environment simulation
US10243719B2 (en) 2011-11-09 2019-03-26 The Board Of Trustees Of The Leland Stanford Junior University Self-interference cancellation for MIMO radios
US9913064B2 (en) 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers
MX2015014065A (es) 2013-04-05 2016-11-25 Thomson Licensing Metodo para manejar campo reverberante para audio inmersivo.
EP3056025B1 (en) 2013-10-07 2018-04-25 Dolby Laboratories Licensing Corporation Spatial audio processing system and method
EP3081014A4 (en) * 2013-12-13 2017-08-09 Ambidio, Inc. Apparatus and method for sound stage enhancement
KR102516625B1 (ko) 2015-01-30 2023-03-30 디티에스, 인코포레이티드 몰입형 오디오를 캡처하고, 인코딩하고, 분산하고, 디코딩하기 위한 시스템 및 방법
US9866180B2 (en) 2015-05-08 2018-01-09 Cirrus Logic, Inc. Amplifiers
CN108293165A (zh) * 2015-10-27 2018-07-17 无比的优声音科技公司 增强音场的装置和方法
WO2017165968A1 (en) 2016-03-29 2017-10-05 Rising Sun Productions Limited A system and method for creating three-dimensional binaural audio from stereo, mono and multichannel sound sources
EP3232688A1 (en) 2016-04-12 2017-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for providing individual sound zones
US10979844B2 (en) 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
US10674266B2 (en) * 2017-12-15 2020-06-02 Boomcloud 360, Inc. Subband spatial processing and crosstalk processing system for conferencing
US10609504B2 (en) 2017-12-21 2020-03-31 Gaudi Audio Lab, Inc. Audio signal processing method and apparatus for binaural rendering using phase response characteristics
JPWO2019135269A1 (ja) * 2018-01-04 2020-12-17 株式会社 Trigence Semiconductor スピーカ駆動装置、スピーカ装置およびプログラム
US20190394603A1 (en) 2018-06-22 2019-12-26 EVA Automation, Inc. Dynamic Cross-Talk Cancellation

Also Published As

Publication number Publication date
US11246001B2 (en) 2022-02-08
AU2021258825A1 (en) 2022-11-17
WO2021216274A1 (en) 2021-10-28
US20210337336A1 (en) 2021-10-28
EP4140152A1 (en) 2023-03-01
JP2023522995A (ja) 2023-06-01
CA3176011A1 (en) 2021-10-28
EP4140152A4 (en) 2024-05-01
CN115702577A (zh) 2023-02-14

Similar Documents

Publication Publication Date Title
US8824709B2 (en) Generation of 3D sound with adjustable source positioning
TWI230024B (en) Method and audio apparatus for improving spatial perception of multiple sound channels when reproduced by two loudspeakers
TWI397325B (zh) 用於切分立體音訊內容之改良式頭部相關轉移函數
CA2265961C (en) Transaural stereo device
JP6539742B2 (ja) オーディオ信号をフィルタリングするためのオーディオ信号処理装置および方法
US20220070605A1 (en) Virtual rendering of object based audio over an arbitrary set of loudspeakers
CN111131970B (zh) 过滤音频信号的音频信号处理装置和方法
CA2744459A1 (en) Surround sound virtualizer and method with dynamic range compression
JP2005513892A5 (ko)
KR20120067294A (ko) 가상 서라운드 렌더링을 위한 스피커 어레이
KR20190109726A (ko) 멀티채널 오디오 신호들을 다운믹싱하기 위한 장치 및 방법
KR20230005264A (ko) 음향 크로스토크 소거 및 가상 스피커 기술
EP2708038A1 (en) A speaker for reproducing surround sound
US11962984B2 (en) Optimal crosstalk cancellation filter sets generated by using an obstructed field model and methods of use
EP1021062B1 (en) Method and apparatus for the reproduction of multi-channel audio signals
US10841728B1 (en) Multi-channel crosstalk processing
CN113615210A (zh) 无上发和环绕扬声器的条形音箱中的虚拟高度和环绕效果
JPH04273800A (ja) 音像定位装置及び音像定位信号処理方法