KR102374934B1

KR102374934B1 - 사운드 스테이지 보존 오디오 채널 합산

Info

Publication number: KR102374934B1
Application number: KR1020217025273A
Authority: KR
Inventors: 조셉 안토니 3세 마리글리오; 재커리 셀데스
Original assignee: 붐클라우드 360, 인코포레이티드
Priority date: 2019-01-11
Filing date: 2020-01-10
Publication date: 2022-03-15
Also published as: TWI727605B; EP3891737A4; CN113316941A; WO2020146827A1; TW202034307A; JP7038921B2; JP2022516374A; KR20210102993A; US10993061B2; CN113316941B; EP3891737B1; US20200228910A1; EP3891737A1

Abstract

오디오 시스템은 사운드 스테이지 보존 채널 합산을 제공한다. 시스템은 오디오 신호 성분 쌍을 회전시킴으로써, 제 1 회전된 성분 및 제 2 회전된 성분을 생성하는 회로를 포함한다. 회로는 제 1 회전된 성분을 이용하여, 서로 위상이 다른 좌측 쿼드러쳐 성분을 생성하고 제 2 회전된 성분을 이용하여, 서로 위상이 다른 우측 쿼드러쳐 성분을 생성한다. 회로는 좌측 및 우측 쿼드러쳐 성분에 기초하여, 직교 상관 변환(orthogonal correlation transform, OCT) 성분을 생성한다. 각 OCT 성분은, 좌측 쿼드러쳐 성분 및 우측 쿼드러쳐 성분의 가중치가 부여된 결합을 포함한다. 하나 이상의 상기 OCT 성분을 이용하여, 모노 출력 채널을 생성한다.

Description

사운드 스테이지 보존 오디오 채널 합산

본 개시는 일반적으로 오디오 프로세싱, 더 구체적으로 사운드 스테이지 보존 채널 합산에 관한 것이다.

오디오 컨텐츠는 일반적으로 스테레오 재생을 위해 설계된다. 이 가정은 이 규칙에 의해 암시되는 기대를 준수하지 않는 재생 해결책에 문제가 된다. 이러한 두 가지 경우는 모노 스피커와 비제약형 메쉬(mesh)로 배열된 다중 스피커이다. 두 경우 모두에서, 일반적인 해결책은 스테레오 오디오 신호의 좌측 및 우측 채널을 모두 합하는 것이며, 이는 음의 상관 관계가 있는 정보의 손실을 야기한다. 또한, 비제약형 메쉬의 경우, 메쉬의 기하학에 대한 지식의 부족은 원본 컨텐츠에 인코딩된 사운드 스테이지 정보를 보존하기 위한 기회를 잃게 한다.

실시예는 사운드 스테이지 보존 채널 합산 및 오디오 시그널의 불규칙한 메쉬 확산을 제공하는 비선형 단일 필터-뱅크(filter-bank)에 관한 것이다. 직교 상관 변환을 통한 모노 합산(본 명세서에서 "MON-OCT"라고도 지칭함)은 사운드 스테이지 보존 채널 합산을 제공한다. 오디오 신호에 MON-OCT를 적용하는 것은 최소 지연 및 최적의 과도 응답을 위해 시간 영역에서 구현될 수 있는 다중 입력, 다중 출력 비선형 단일 필터-뱅크를 사용하는 것을 포함할 수 있다.

일부 실시예에서, 직교 상관 변환을 통한 모노 합산의 다중 대역 구현은 비선형 필터와 관련된 아티팩트(artifact)를 감소시키는 데 사용된다. 광대역 오디오 신호는, 위상 보정 4차 Linkwitz-Riley 네트워크를 사용하는 것과 같이, 서브 대역(subband) 또는 다른 필터-뱅크 토폴로지(topology)(예컨대, 웨이블릿 분해(wavelet decomposition) 또는 STFT(short-time-Fourier-transform))로 분할될 수 있다. 필터의 비선형 역학은 신호 종속(signal-dependent), 시변(time-varying) 선형 역학으로 설명할 수 있다. 단일 구속 요건은 모든 조건에서 필터의 안정성을 보장한다.

일부 실시예는 회로를 포함하는 시스템을 포함한다. 회로는 오디오 신호 성분 쌍을 회전시킴으로써 제 1 회전된 성분 및 제 2 회전된 성분을 생성, 제 1 회전된 성분을 이용하여 서로 위상이 다른 좌측 쿼드러쳐(quadrature) 성분을 생성, 제 2 회전된 성분을 이용하여 서로 위상이 다른 우측 쿼드러쳐 성분을 생성, 좌측 및 우측 쿼드러쳐 성분에 기초하여 각 성분이 좌측 쿼드러쳐 성분 및 우측 쿼드러쳐 성분의 가중치가 부여된 결합을 포함하는 직교 상관 변환(orthogonal correlation transform, OCT) 성분을 생성, 하나 이상의 OCT 성분을 이용하여 모노 출력 채널을 생성, 및 모노 출력 채널을 하나 이상의 스피커에 제공하도록 구성된다.

일부 실시예는 방법을 포함한다. 방법은, 회로에 의해서, 오디오 신호 성분 쌍을 회전시킴으로써 제 1 회전된 성분 및 제 2 회전된 성분을 생성하는 단계, 제 1 회전된 성분을 이용하여 서로 위상이 다른 좌측 쿼드러쳐 성분을 생성하는 단계, 제 2 회전된 성분을 이용하여 서로 위상이 다른 우측 쿼드러쳐 성분을 생성하는 단계, 좌측 및 우측 쿼드러쳐 성분에 기초하여 각 성분이 좌측 쿼드러쳐 성분 및 우측 쿼드러쳐 성분의 가중치가 부여된 결합을 포함하는 직교 상관 변환(orthogonal correlation transform, OCT) 성분을 생성하는 단계, 하나 이상의 OCT 성분을 이용하여 모노 출력 채널을 생성하는 단계, 및 모노 출력 채널을 하나 이상의 스피커에 제공하는 단계를 포함한다.

일부 실시예는 적어도 하나의 프로세서에 의해 실행될 때, 오디오 신호 성분 쌍을 회전시킴으로써 제 1 회전된 성분 및 제 2 회전된 성분을 생성, 제 1 회전된 성분을 이용하여 서로 위상이 다른 좌측 쿼드러쳐 성분을 생성, 제 2 회전된 성분을 이용하여 서로 위상이 다른 우측 쿼드러쳐 성분을 생성, 좌측 및 우측 쿼드러쳐 성분에 기초하여 각 성분이 좌측 쿼드러쳐 성분 및 우측 쿼드러쳐 성분의 가중치가 부여된 결합을 포함하는 직교 상관 변환(orthogonal correlation transform, OCT) 성분을 생성, 하나 이상의 OCT 성분을 이용하여 모노 출력 채널을 생성, 및 모노 출력 채널을 하나 이상의 스피커에 제공하도록, 적어도 하나의 프로세서를 구성하는, 명령어를 저장하는 비일시적 컴퓨터 판독가능 매체를 포함한다.

도 1은 일부 실시예에 따른, 오디오 처리 시스템의 블록도이다.
도 2는 일부 실시예에 따른, 오디오 처리 시스템의 블록도이다.
도 3은 일부 실시예에 따른, 주파수 대역 분할기의 블록도이다.
도 4는 일부 실시예에 따른, 사운드 스테이지 보존 채널 합산을 위한 프로세스의 흐름도이다.
도 5는 일부 실시예에 따른, 서브 대역 분해를 포함한 사운드 스테이지 보존 채널 합산을 위한 프로세스의 흐름도이다.
도 6은 일부 실시예에 따른, 컴퓨터의 블록도이다.
도면은 단지 예시의 목적으로 다양한 실시예를 도시한다. 통상의 기술자는 이하 논의로부터, 본 명세서에서 설명되는 원리로부터 벗어남 없이, 본 명세서에서 예시된 구조 및 방법의 대안적인 실시예를 채용할 수 있다는 것을 용이하게 이해할 것이다.

오디오 처리 시스템

도 1은 일부 실시예에 따른, 오디오 처리 시스템(100)의 블록도이다. 오디오 시스템(100)은 직교 상관 변환("MON-OCT")을 통한 모노 합산을 이용하여 사운드 스테이지 보존 채널 합산을 제공한다. 오디오 처리 시스템(100)은 회전 프로세서(102), 쿼드러쳐(quadrature) 프로세서(104), 직교 상관 변환(본 명세서에서 "OCT"라고도 지칭됨) 프로세서(106) 및 성분 선택기(108)를 포함한다.

회전 프로세서(102)는 좌측 채널 u(t)₁ 및 우측 채널 u(t)₂을 포함하는 입력 신호 u(t)를 수신한다. 회전 프로세서(102)는 채널 u(t)₁과 채널 u(t)₂을 회전시켜 제 1 회전된 성분 x(t)₁, 그리고 채널 u(t)₁과 채널 u(t)₂을 회전시켜 제 2 회전된 성분 x(t)₂을 생성한다. 채널 u(t)₁ 및 u(t)₂은 오디오 신호 성분 쌍이다. 일 예시에서, 채널 u(t)₁은 스테레오 오디오 신호의 좌측 채널이고 채널 u(t)₂은 스테레오 오디오 신호의 우측 채널이다.

쿼드러쳐 프로세서(104)는 회전된 성분 각각에 대한 쿼드러쳐 필터를 포함한다. 쿼드러쳐 필터(112a)는 제 1 회전된 성분 x(t)₁을 수신하고, 서로 위상 관계(예컨대, 90도)를 갖고 각각 제 1 회전된 성분 x(t)₁과 단일(unity) 크기 관계를 갖는 좌측 쿼드러쳐 성분 H(x(t)₁)₁ 및 H(x(t)₁)₂을 생성한다. 쿼드러쳐 필터(112b)는 제 2 회전된 성분 x(t)₂을 수신하고, 서로 위상 관계(예컨대, 90도)를 갖고 각각 제 2 회전된 성분 x(t)₂과 단일 크기 관계를 갖는 우측 쿼드러쳐 성분 H(x(t)₂)₁ 및 H(x(t)₂)₂을 생성한다.

OCT 프로세서(106)는 쿼드러쳐 성분 H(x(t)₁)₁, H(x(t)₁)₂,H(x(t)₂)₁ 및 H(x(t)₂)₂을 수신하고, 가중치를 이용하여 쿼드러쳐 성분 쌍을 결합하여 OCT 성분 OCT₁, OCT₂, OCT₃ 및 OCT₄을 생성한다. OCT 성분의 번호는 쿼드러쳐 성분의 번호에 대응할 수 있다. 각 OCT 성분은 입력 신호 u(t)의 좌측 채널 u(t)₁ 및 우측 채널 u(t)₂로부터의 기여를 포함하되, 좌측 채널 u(t)₁ 및 우측 채널 u(t)₂을 단순 결합함으로써 발생되는 음의 상관 관계가 있는 정보의 손실이 없다. 쿼드러쳐 성분을 사용하면 진폭 null이 위성 null로 변환되는 합산이 생성된다.

성분 선택기(110)는, OCT 성분 OCT₁, OCT₂, OCT₃ 및 OCT₄ 중 하나 이상을 이용하여, 모노 출력 채널 O을 생성한다. 일부 실시예에서, 성분 선택기(110)는 출력 채널 O에 대해 OCT 성분 중 하나를 선택한다. 다른 실시예에서, 성분 선택기(110)는 복수의 OCT 성분의 결합에 기초하여 출력 채널 O을 생성한다. 예를 들어, 다수의 OCT 성분은, 상이한 OCT 성분에 시간에 따라 다르게 가중치를 부여하여, 출력 채널 O로 결합될 수 있다. 여기서, 출력 채널 O은 다수의 OCT 성분의 시변 결합이다.

이와 같이, 오디오 처리 시스템(100)은 좌측 채널 u(t)₁ 및 우측 채널 u(t)₂을 포함하는 입력 신호 u(t)로부터 출력 채널 O을 생성한다. 입력 신호 u(t)는 다양한 수의 채널을 포함할 수 있다. n개의 채널 입력 신호에 대해, 오디오 처리 시스템(100)은 2n개의 쿼드러쳐 성분 및 2n개의 OCT 성분을 생성하고, 2n개의 OCT 성분 중 하나 이상을 이용하여 출력 채널 O을 생성할 수 있다.

직교 상관 변환을 통한 선형 모노 합산

일부 실시예에서, 선형, 시불변 형태의 OCT(예컨대, 수학식(7)에 정의된 바와 같음)는 다중(예컨대, n개) 채널을 포함하는 오디오 신호로부터 모노 출력 채널을 생성하는 데 사용될 수 있다.

스테레오 오디오 신호는 수학식(1)에 따라 정의될 수 있다.

여기서, u(t)₁은 스테레오 오디오 신호의 좌측 채널 L일 수 있고, u(t)₂는 스테레오 오디오 신호의 우측 채널 R일 수 있다. 다른 실시예에서, u(t)₁ 및 u(t)₂은 좌측 및 우측 채널 이외의 오디오 신호 성분 쌍이다.

이 2차원 신호로부터 선형 투영(projection)이 1차원에 적용되는 경우, 널스페이스(nullspace)를 예상하여야 한다. 두 채널을 합산하는 일반적인 해결책은 정확히 이를 수행한다. 결과적으로, 널스페이스는 u(t)₁ = -u(t)₂ 형태의 벡터를 포함한다.

입력 오디오 신호 u(t)로부터 회전된 성분 x(t)를 생성(예컨대, 회전 프로세서(102)에 의해)하기 위해, 회전 행렬이 적용된다. n = 2인 채널에 대해, 2x2 직교 회전 행렬은 수학식(2)에 의해 정의될 수 있다.

여기서 θ는 회전의 각도를 결정한다. 회전의 각도 θ가 45°인 일 예시에서, 각 입력 신호 성분은 45°만큼 회전한다. 회전의 각도 θ가 -45°일 수 있는 다른 예시에서, 반대 방향으로 회전이 이루어진다. 일부 예시(예컨대, 아래의 수학식(11)에 나타난 바와 같은)에서, 회전의 각도는 시간에 따라 또는 입력 신호에 대응하여 변한다. 그러나, 이러한 특정 경우에, 회전은 고정되고, u(t)에 적용되어 수학식(3)에 의해 정의되는 바와 같이 x(t)를 생성한다.

쿼드러쳐 성분을 생성(예컨대, 쿼드러쳐 프로세서(104)에 의해)하기 위해, 쿼드러쳐 전역 통과 필터의 쌍(예컨대, 쿼드러쳐 필터 112a 및 112b)을 포함하는 쿼드러쳐 전역 통과 필터 함수 H()가 연속 시간 프로토타입을 이용하여 정의된다. 채널 x(t)₁의 경우, 예를 들어, 쿼드러쳐 전역 통과 필터 함수는 수학식(4)에 따라 정의될 수 있다.

여기서 H()는 2개의 쿼드러쳐 전역 통과 필터 H()₁ 및 H()₂를 포함하는 선형 연산자이다. H()₁은 H()₂에 의해 생성되는 성분과 90도 위상 관계를 갖는 성분을 생성하고, H()₁ 및 H()₂의 출력은 쿼드러쳐 성분으로 지칭된다.

(t)₁ 은 x(t)₁과 동일한 크기 스펙트럼을 갖지만, x(t)₁과 제약 없는 위상 관계를 갖는 신호이다.

H(x(t)₁)₁ 및 H(x(t)₁)₂는 서로 90도 위상 관계를 가지며, 각각은 입력 채널 x(t)₁과 단일 크기 관계를 갖는다. 유사하게, 쿼드러쳐 전역 통과 필터 함수 H()는 채널 x(t)₂에 적용되어 H(x(t)₂)₁ 및 H(x(t)₂)₂로 정의되는 쿼드러쳐 성분을 생성할 수 있고, 여기서 쿼드러쳐 성분은 서로 90도 위상 관계를 가지며, 각각은 입력 채널 x(t)₂과 단일 크기 관계를 갖는다.

오디오 신호 u(t)는 2개(예컨대, 좌측 및 우측) 채널에 제한되지 않고, n개의 채널을 포함할 수 있다. 따라서, x(t)의 차원 또한 가변적이다. 더 일반적으로, 선형 쿼드러쳐 전역 통과 필터 함수 Hn(x(t))는 n개의 채널 성분을 포함하는 n차원 벡터 x(t)에 대한 작용으로 정의될 수 있다. 이러한 결과는 수학식(5)에 의해 정의되는 2n차원의 행 벡터이다.

여기서 H()1 및 H()는 위의 수학식(4)에 따라 정의된다. 여기의 90도 위상 관계를 갖는 쿼드러쳐 성분 쌍은 오디오 신호의 n개의 채널 각각에 대해 생성된다. 이와 같이, 쿼드러쳐 전역 통과 필터 함수 Hn()은 오디오 신호 u(t)의 n차원 벡터를 2n차원 공간으로 투영한다.

쿼드러쳐 성분으로부터 OCT 출력을 생성(예컨대, OCT 프로세서(106)에 의해)하기 위해, 쿼드러쳐 성분 각각에 회전이 적용된다. 회전 행렬은 치환 행렬(permutation matrix)에 블록 형태로 적용되어, 수학식(6)에 의해 정의되는 바와 같은 고정 행렬 P를 생성한다.

고정 행렬 P는 Hn(x(t))의 쿼드러쳐 성분과 곱해진다. u(t)가 스테레오 신호(예컨대, n = 2)이고, 이에 따라 x(t)의 차원도 2인 경우, 이 4x4 직교 행렬 P는 4차원 벡터 결과인 H ₂(x(t))를 4개의 직교 성분에 의해 정의되는 4차원 기저(basis), OCT 성분으로 변환한다. 예를 들어, 제 1 좌측 쿼드러쳐 성분은 반전된 제 2 우측 쿼드러쳐 성분과 결합하여 제 1 OCT 성분을 생성할 수 있고, 제 1 좌측 쿼드러쳐 성분은 제 2 우측 쿼드러쳐 성분과 결합하여 제 2 OCT 성분을 생성할 수 있으며, 제 2 좌측 쿼드러쳐 성분은 반전된 제 1 우측 쿼드러쳐 성분과 결합하여 제 3 OCT 성분을 생성할 수 있고, 제 2 좌측 쿼드러쳐 성분은 제 1 우측 쿼드러쳐 성분과 결합하여 제 4 OCT 성분을 생성할 수 있다. 이와 같이, 쿼드러쳐 성분 쌍은 가중치가 부여되고 결합되어 OCT 성분을 생성한다. 2개 초과의 채널을 갖는 오디오 신호 u(t)의 경우, 더 큰 회전 및 치환 행렬이, 알맞은 크기의 고정 행렬을 생성하는 데 사용될 수 있다. OCT 성분을 유도하는 일반적인 수학식은 수학식(7)에 의해 정의된다.

모노 출력 채널을 생성(예컨대, 성분 선택기(110)에 의해)하기 위해, OCT로부터 생성되는 출력 중 하나가 선택될 수 있다. 모노 출력 채널은 하나의 스피커 또는 다중 스피커에 제공된다.

직교 상관 변환을 통한 비선형 모노 합산

단순히 앞서 설명된 바와 같은 2차원 오디오 벡터를 변환하는 것 및 단일 출력을 선택하는 것은 여전히 널스페이스를 초래할 것이다. 그러나, 많은 실제 예시에서, 이러한 부분 공간에서 지각적으로(perceptually) 중요한 오디오 정보를 가질 확률은, L + R 또는 L - R과 같은 위치에서 중요한 정보를 가질 확률보다 훨씬 낮다. 이는 업계 표준이 된 통상의 믹싱 기술 때문이다.

OCT 출력이 주요한 정보를 누락할 것이 여전히 가능하다. 이를 해결하기 위해, 비선형 합이 사용될 수 있고, 이는 2개 이상의 OCT 출력의 신호 종속, 시변 결합으로 서술할 수 있다.

예를 들어, 성분 선택기(110)는 OCT 출력 중 2개를 선택하고, 선택된 OCT 출력을 이용하여 비선형 합을 생성할 수 있다. MON-OCT가 2-채널 오디오 신호 u(t)에 적용되어 4개의 OCT 출력을 생성할 때 가능한 결합을 열거하기 위해, 4 x 2 투영 행렬 Π이 4개의 OCT 출력으로부터 성분 쌍을 선택하는 데 사용될 수 있다. 예를 들어 수학식(8)에 나타난 바와 같이, 선택된 성분은 투영 행렬 내 0이 아닌 인덱스에 해당한다.

본 예시에서, 수학식(9)에 나타난 바와 같이, 투영 행렬 Π은 제 2 및 제 3 OCT 출력을 선택하여 직교 성분 M_a(u) 및 M_b(u)의 2차원 벡터를 생성한다.

결과적인 2차원 벡터는 결합되어 입력 신호에 의존하는 시변 회전을 이용함으로써 모노 출력 채널을 생성한다. 회전 각도의 순간적인 변화의 비선형 효과를 완화하기 위해, S(x)가 선형 또는 비선형 저역 통과 필터, 슬루(slew) 제한기 또는 일부 유사한 요소와 같은 기울기 제한 함수를 나타내도록 한다. 이 필터의 동작은 결과적인 변조 정현파의 절대 주파수에 상한을 설정하여, 회전으로 인한 최대 비선형성을 효과적으로 제한하는 것이다.

비록 국부적 최적화에는 많은 상이한 테스트가 사용될 수 있지만, 일 예에서, 2개의 직교 성분 사이의 피크(peak) 절댓값은, 수학식(10)에 의해 정의되는 바와 같이, 각도

_u를 결정하는 기울기 제한 함수 S에 대한 입력으로 사용된다.

다른 실시예는, 기울기 제한 함수 S(x)에 대한 입력으로서 상이한 최적 측정을 사용할 수 있다. 각도

_u는 주어진 대해 동적으로 변화하는 최적 u를 가리킨다. 이러한 최적은, 수학식(11)에 의해 정의되는 바와 같이, 투영으로 추출되어 모노 출력 채널

_a,b(u)을 생성한다.

비록 투영 행렬 Π이 MON-OCT에서의 4개의 직교 성분 출력 중 두 번째 및 세 번째를 선택하는 것으로 앞서 논의되었지만, OCT 출력 중 임의의 것이 선택되어 모노 출력 채널을 생성할 수 있다. 일부 실시예에서, 다중 OCT 출력이 선택되고 상이한 스피커에 제공될 수 있다. 일부 실시예에서, 직교 성분은, RMS 최대화 또는 다른 함수와 같은 다른 요소에 기초한 결합에 대해 선택될 수 있다. 일부 실시예에서 수학식(11)은 벡터 [Ma(u) Mb(u)]를 투영하는 것이 아니라 단지 회전시키며, 이는 다중-채널 출력을 생성한다.

서브 대역 분해를 통한 아티팩트 최소화

수학식(11)에 의해 정의되는 모노 출력 채널은

_u의 각속도만큼 주파수 시프팅의 결과인 비선형 아티팩트(artifact)를 포함할 수 있다. 이는 광대역 오디오 신호 u(t)가 주파수 서브 대역 성분으로 분리되는 서브 대역 분해를 적용함으로써 완화될 수 있다. 그 다음, MON-OCT는 서브 대역 각각에 수행될 수 있고, 서브 대역 각각에 대한 결과는 모노 출력 채널로 결합된다. 주파수 대역 분할기는 오디오 신호를 서브 대역으로 분리하는 데 사용될 수 있다. MON-OCT를 서브 대역 각각에 적용한 후, 주파수 대역 결합기는 서브 대역을 출력 채널로 결합하는 데 사용될 수 있다.

서브 대역 분할은 비선형 아티팩트를 줄이기 위해 제공된다. 현저한 응답과 과도 응답 간에 트레이드오프가 발생할 수 있지만, 모든 실제적인 목적을 위해 추가적인 매개변수화 없이 설정할 수 있을 만큼 최적의 영역은 충분히 작다.

도 2는 일부 실시예에 따른, 오디오 처리 시스템(200)의 블록도이다. 오디오 처리 시스템(200)은 주파수 대역 분할기(202), 주파수 대역 분할기(204), 오디오 처리 시스템(100(1)) 내지 (100(4)) 및 주파수 대역 결합기(206)를 포함한다.

주파수 대역 분할기(202)는 입력 신호 u(t)의 좌측 채널 u(t)₁을 수신하고, 좌측 채널 u(t)₁을 좌측 서브 대역 성분 u(t)₁(1), u(t)₁(2), u(t)₁(3) 및 u(t)₁(4)으로 분리한다. 4개의 좌측 서브 대역 성분 u(t)₁(1), u(t)₁(2), u(t)₁(3) 및 u(t)₁(4)의 각각은 좌측 채널 u(t)₁의 상이한 주파수 대역의 오디오 데이터를 포함한다. 주파수 대역 분할기(204)는 입력 신호 u(t)의 우측 채널 u(t)₂을 수신하고, 우측 채널 u(t)₂을 우측 서브 대역 성분 u(t)₂(1), u(t)₂(2), u(t)₂(3) 및 u(t)₂(4)으로 분리한다. 4개의 우측 서브 대역 성분 u(t)₂(1), u(t)₂(2), u(t)₂(3) 및 u(t)₂(4)의 각각은 우측 채널 u(t)₂의 상이한 주파수 대역의 오디오 데이터를 포함한다.

오디오 처리 시스템(100(1), 100(2), 100(3) 및 100(4))은 좌측 서브 대역 성분 및 우측 서브 대역 성분을 수신하고, 좌측 및 우측 서브 대역 성분에 기초하여 서브 대역에 대한 모노 서브 대역 성분을 생성한다. 도 1과 관련하여 앞선 오디오 처리 시스템(100)에 관한 논의는, 전체 좌측 채널 u(t)₁ 및 우측 채널 u(t)₂이 아닌, 좌측 및 우측 채널의 서브 대역에 동작이 수행된다는 점을 제외하고는, 오디오 처리 시스템(100(1), 100(2), 100(3) 및 100(4))의 각각에 적용될 수 있다.

오디오 처리 시스템(100(1))은 좌측 서브 대역 성분 u(t)₁(1) 및 우측 서브 대역 성분 u(t)₂(1)을 수신하고, 모노 서브 대역 성분 O(1)을 생성한다. 오디오 처리 시스템(100(2))은 좌측 서브 대역 성분 u(t)₁(2) 및 우측 서브 대역 성분 u(t)₂(2)을 수신하고, 모노 서브 대역 성분 O(2)을 생성한다. 오디오 처리 시스템(100(3))은 좌측 서브 대역 성분 u(t)₁(3) 및 우측 서브 대역 성분 u(t)₂(3)을 수신하고, 모노 서브 대역 성분 O(3)을 생성한다. 오디오 처리 시스템(100(4))은 좌측 서브 대역 성분 u(t)₁(4) 및 우측 서브 대역 성분 u(t)₂(4)을 수신하고, 모노 서브 대역 성분 O(4)을 생성한다. 오디오 처리 시스템(100(1) 내지 100(4))에 의해 수행되는 처리는 상이한 서브 대역 성분에 따라 상이할 수 있다.

주파수 대역 결합기(206)는 모노 서브 대역 성분 O(1), O(2), O(3) 및 O(4)을 수신하고, 이 모노 서브 대역 성분을 모노 출력 채널 O로 결합한다.

도 3은 일부 실시예에 따른, 주파수 대역 분할기(300)의 블록도이다. 주파수 대역 분할기(300)는 주파수 대역 분할기(202 또는 204)의 일 예시이다. 주파수 대역 분할기(300)는 코너 주파수에서 적용되는 위상 보정을 가진 4차 Linkwitz-Riley 크로스오버 네트워크이다. 주파수 대역 분할기(300)는 오디오 신호(예컨대, 좌측 채널 u(t)₁ 및 우측 채널 u(t)₂)를 서브 대역 성분(318, 320, 322 및 324)으로 분리한다.

주파수 대역 분할기는, 출력에서 일관된 합산을 할 수 있도록, 위상 보정을 가진 4차 Linkwitz-Riley 크로스오버 직렬을 포함한다. 주파수 대역 분할기(300)는 저역 통과 필터(302), 고역 통과 필터(304), 전역 통과 필터(306), 저역 통과 필터(308), 고역 통과 필터(310), 전역 통과 필터(312), 고역 통과 필터(316) 및 저역 통과 필터(314)를 포함한다.

저역 통과 필터(302) 및 고역 통과 필터(304)는 코너 주파수(예컨대, 300Hz)를 갖는 4차 Linkwitz-Riley 크로스오버를 포함하고, 전역 통과 필터(306)는 매칭(matching) 2차 전역 통과 필터를 포함한다. 저역 통과 필터(308) 및 고역 통과 필터(310)는 다른 코너 주파수(예컨대, 510Hz)를 갖는 4차 Linkwitz-Riley 크로스오버를 포함하고, 전역 통과 필터(312)는 매칭 2차 전역 통과 필터를 포함한다. 저역 통과 필터(314) 및 고역 통과 필터(316)는 다른 코너 주파수(예컨대, 2700Hz)를 갖는 4차 Linkwitz-Riley 크로스오버를 포함한다. 이와 같이, 주파수 대역 분할기(300)는, 0 내지 300Hz를 포함하는 주파수 서브 대역(1)에 대응하는 서브 대역 성분(318), 300 내지 510Hz를 포함하는 주파수 서브 대역(2)에 대응하는 서브 대역 성분(320), 510 내지 2700Hz를 포함하는 주파수 서브 대역(3)에 대응하는 서브 대역 성분(322) 및 2700Hz 내지 Nyquist 주파수를 포함하는 주파수 서브 대역(4)에 대응하는 서브 대역 성분(324)을 생성한다. 본 예시에서, 주파수 대역 분할기(300)는 n = 4 서브 대역 성분을 생성한다. 서브 대역 성분의 수와 주파수 대역 분할기(300)에 의해 생성되는 서브 대역 성분의 수에 대응하는 주파수 범위는 달라질 수 있다. 주파수 대역 분할기(300)에 의해 생성되는 서브 대역 성분은, 주파수 대역 결합기(206)에 의하는 것과 같이, 편향되지 않은 완전한 합산을 가능하게 한다.

비제약형 메쉬 네트워크에 대한 직교 상관 변환을 통한 모노 합산

오디오 처리 시스템(100)은, 사운드 스테이지의 지각적으로 중요한 성분을 보존하도록 설계된 다중 입력, 다중 출력 비선형 필터-뱅크(filter-bank)를 제공하며(수학식(7)에 의해 정의된 선형 형태를 갖는, 수학식(11)에 의해 정의되는 일부 실시예에서), 여기서 최적 조건은 1개를 초과하는 출력을 이용하여 만족될 수 있다. 이는 숫자나 배치에 대한 걱정 없이, 오디오가 단일 또는 다중 드라이버 스피커의 메쉬에 분배될 수 있으며, 여전히 해당 오디오 신호의 강력(compelling)하지만 다중 중심 공간 경험을 재생산하기를 희망한다는 것을 의미한다. 상이한 비선형 합이 각 서브 대역에 대해 선택될 수 있고, 서브 대역과 비선형 합 사이의 이러한 관계는 각 출력으로 치환될 수 있다. 예를 들어, 4개의 비선형 합(a, b, c, d)은 각각 2개의 서브 대역으로 이루어진 3개의 독립적인 출력을 생성(예컨대, 출력 1 = [서브 대역 1, 서브 대역 2])하는 데 사용될 수 있고, 그 후 각 서브 대역에 대한 비선형 합은 출력 1 = [a, b], 출력 2 = [b, c], 출력 3 = [c, d]을 이용하여 치환될 수 있다. 최적 조건과 구성하는 서브 대역의 수에 따라, 이는 다수의 고유 신호를 생성할 수 있고, 이들 각각은 지각되는 동일한 전체(same perceptual whole)에 대한 약간의 변화를 포함한다. 각각이 단독으로 재생될 때, 확산되는 신호 각각은 전체 사운드 스테이지를 재생산한다. 다중 스피커의 메쉬를 이용하는 것과 같이, 동시에 재생될 때, 확산되는 신호는 편향되지 않지만 의심할 여지 없는 공간적 품질을 나타낸다.

일부 실시예에서, 스피커의 메쉬에 대해, MON-OCT를 이용하여 생성된 출력 중 하나는 스피커 각각에 제공될 수 있다. 일부 실시예에서, 직교 성분 쌍은, 상이한 모노 출력 채널이 메쉬의 스피커 각각에 제공되면서, 모노 출력 채널을 정의하는 비선형 합(예컨대, 각각의 합은 수학식(11)에 의해 정의되는 바와 같은 모노 출력 채널임)을 생성하는 데 사용된다.

예시 프로세스

도 4는 일부 실시예에 따른, 사운드 스테이지 보존 채널 합산의 프로세스(400)의 흐름도이다. 도 4에 나타난 프로세스는 오디오 처리 시스템(예컨대, 오디오 처리 시스템(100))의 구성요소에 의해 수행될 수 있다. 다른 실시예에서, 다른 엔티티(entity)가 도 4의 단계의 일부 또는 전부를 수행할 수 있다. 실시예는 상이한 및/또는 추가적인 단계를 포함할 수 있으며, 상이한 순서로 단계가 수행될 수 있다.

오디오 처리 시스템은, 오디오 신호 성분 쌍을 회전시켜 제 1 회전된 성분 및 제 2 회전된 성분을 생성한다(405). 일 예시에서, 오디오 신호 성분 쌍은 스테레오 오디오 신호의 좌측 오디오 신호 성분 및 우측 오디오 신호 성분을 포함한다. 회전은 고정된 각도를 사용할 수 있거나 또는 회전의 각도는 시간에 따라 변할 수 있다. 좌측 성분은 좌측 채널(예컨대, 광대역)을 포함할 수 있고, 우측 성분은 우측 채널(예컨대, 광대역)을 포함할 수 있다. 일부 실시예에서 및 도 5를 참조하여 더 자세히 설명되는 바와 같이, 좌측 성분은 좌측 서브 대역 성분을 포함할 수 있고, 우측 성분은 우측 서브 대역 성분을 포함할 수 있다. 오디오 신호 성분 쌍은 좌측 및 우측 채널에 제한되지 않고, 다른 유형의 오디오 신호 및 오디오 신호 성분 쌍이 사용될 수 있다.

오디오 처리 시스템은, 제 1 회전된 성분을 이용하여, 서로 위상이 다른 좌측 쿼드러쳐 성분을 생성한다(410). 좌측 쿼드러쳐 성분은 서로 간에 90도 위상 관계를 가질 수 있다. 일부 실시예에서, 오디오 처리 시스템은 제 1 회전된 성분을 이용하여, 일부 다른 위상 관계를 갖는 성분을 생성하고, 이러한 성분은 좌측 쿼드러쳐 성분에 대해 본 명세서에서 논의된 바와 유사한 방법으로 처리될 수 있다. 좌측 쿼드러쳐 성분은 제 1 회전된 성분과 단일 크기 관계를 각각 가질 수 있다. 오디오 처리 시스템은 전역 필터 함수를 적용하여, 제 1 회전된 성분을 이용하여 좌측 쿼드러쳐 성분을 생성할 수 있다.

오디오 처리 시스템은, 제 2 회전된 성분을 이용하여, 서로 위상이 다른 우측 쿼드러쳐 성분을 생성한다(415). 우측 쿼드러쳐 성분은 서로 간에 90도 위상 관계를 가질 수 있다. 일부 실시예에서, 오디오 처리 시스템은 제 2 회전된 성분을 이용하여, 일부 다른 위상 관계를 갖는 성분을 생성하고, 이러한 성분은 우측 쿼드러쳐 성분에 대해 본 명세서에서 논의된 바와 유사한 방법으로 처리될 수 있다. 우측 쿼드러쳐 성분은 제 2 회전된 성분과 단일 크기 관계를 각각 가질 수 있다. 오디오 처리 시스템은 전역 필터 함수를 적용하여, 제 2 회전된 성분을 이용하여 우측 쿼드러쳐 성분을 생성할 수 있다.

오디오 처리 시스템은 좌측 및 우측 쿼드러쳐 성분에 기초하여 OCT 성분을 생성하며(420), 여기서 각 OCT 성분은 좌측 쿼드러쳐 성분 및 우측 쿼드러쳐 성분의 가중치가 부여된 결합을 포함한다. 예를 들어, 오디오 처리 시스템은 좌측 쿼드러쳐 성분 및 우측 쿼드러쳐 성분에 가중치를 적용하고, 가중치가 부여된 좌측 및 우측 쿼드러쳐 성분을 결합하여 OCT 성분을 생성한다. 가중치가 부여된 좌측 및 우측 쿼드러쳐 성분의 상이한 결합이 상이한 OCT 성분을 생성하는 데 사용될 수 있다. OCT 성분의 수는 쿼드러쳐 성분의 수에 대응할 수 있다. 각 OCT 성분은 입력 신호의 좌측 채널 및 우측 채널의 기여를 포함하되, 좌측 채널 및 우측 채널을 단순 결합함으로써 발생하는 음의 상관 관계가 있는 정보의 손실은 발생하지 않는다.

오디오 처리 시스템은 하나 이상의 OCT 성분을 이용하여 모노 출력 채널을 생성한다(425). 예를 들어, OCT 성분 중 하나는 모노 출력 채널로 선택될 수 있다. 다른 예에서, 출력 채널은 2개 이상의 OCT 성분의 시변 결합을 포함할 수 있다.

오디오 처리 시스템은 하나 이상의 스피커에 모노 출력 채널을 제공한다(430). 예를 들어, 모노 출력 채널은 단일 스피커 시스템의 스피커 또는 다중 스피커 시스템의 다중 스피커에 제공될 수 있다. 일부 실시예에서, 상이한 모노 출력 채널이 생성되고 메쉬의 상이한 스피커에 제공될 수 있다. 예를 들어, OCT 성분 각각 중 하나는 스피커 각각에 제공될 수 있다. 다른 예에서, OCT 성분 쌍은 비선형 합을 생성하는 데 사용되며, 상이한 비선형 합은 메쉬의 스피커 각각에 제공된다.

프로세스(400)가 좌측 및 우측 채널을 이용하여 논의되지만, 오디오 신호의 채널의 수는 변할 수 있다. 90도 위상 관계를 갖는 쿼드러쳐 성분 쌍이 오디오 신호의 n개의 채널 각각에 대해 생성될 수 있고, 모노 출력 채널이 쿼드러쳐 성분에 기초하여 생성될 수 있다.

도 5는 일부 실시예에 따른, 서브 대역 분할을 포함한 사운드 스테이지 보존 채널 합산의 흐름도이다. 도 5에 나타난 프로세스는 오디오 처리 시스템(예컨대, 오디오 처리 시스템(200))의 구성요소에 의해 수행될 수 있다. 다른 실시예에서, 다른 엔티티가 도 5의 단계의 일부 또는 전부를 수행할 수 있다. 실시예는 상이한 및/또는 추가적인 단계를 포함할 수 있거나 또는 상이한 순서로 단계가 수행될 수 있다.

오디오 처리 시스템은, 좌측 채널을 좌측 서브 대역 성분으로, 우측 채널을 우측 서브 대역 성분으로 분리한다(505). 일 예시에서, 좌측 채널 및 우측 채널 각각은 4개의 서브 대역 성분으로 분리된다. 서브 대역의 수 및 서브 대역의 관련된 주파수 범위는 변할 수 있다.

오디오 처리 시스템은, 각 서브 대역에 대해, 서브 대역의 좌측 서브 대역 성분 및 서브 대역의 우측 서브 대역 성분을 이용하여 모노 서브 대역 성분을 생성한다(510). 예를 들어, 오디오 처리 시스템은 프로세스(400)의 단계(405 내지 425)를 수행하여, 서브 대역에 대한 모노 서브 대역 성분을 생성할 수 있다. 일부 실시예에서, OCT 성분의 상이한 비선형 합이 상이한 서브 대역에 대해 선택되어, 모노 서브 대역 성분을 생성할 수 있다. 최적 조건 및 구성하는 서브 대역의 수에 따라, 이는 많은 수의 가능한 고유 광대역 신호를 발생할 수 있고, 이들 각각은 지각되는 동일한 전체에 대한 약간의 변화를 포함한다.

오디오 처리 시스템은 각 서브 대역의 모노 서브 대역 성분을 모노 출력 채널로 결합한다(515). 예를 들어, 모노 서브 대역 성분이 더해져서 모노 출력 채널을 생성할 수 있다.

오디오 처리 시스템은 하나 이상의 스피커에 모노 출력 채널을 제공한다(520). 하나 이상의 스피커는 단일 스피커 또는 스피커의 메쉬를 포함할 수 있다. 일부 실시예에서, 오디오 처리 시스템은 상이한 스피커의 상이한 모노 출력 채널을 제공한다.

예시 컴퓨터

도 6은 일부 실시예에 따른, 컴퓨터(600)의 블록도이다. 컴퓨터(600)는 오디오 처리 시스템(100 또는 200)과 같은 오디오 처리 시스템을 구현하는 회로의 예시이다. 칩셋(chipset)(604)에 연결된 적어도 하나의 프로세서(602)가 도시되어 있다. 칩셋(604)은 메모리 컨트롤러 허브(620) 및 입력/출력(I/O) 컨트롤러 허브(622)를 포함한다. 메모리(606) 및 그래픽 어댑터(612)는 메모리 컨트롤러 허브(620)에 연결되고, 디스플레이 장치(618)는 그래픽 어댑터(612)에 연결된다. 저장 장치(608), 키보드(610), 포인팅 장치(614) 및 네트워크 어댑터(616)는 I/O 컨트롤러 허브(622)에 연결된다. 컴퓨터(600)는 다양한 유형의 입력 또는 출력 장치를 포함할 수 있다. 컴퓨터(600)의 다른 실시예는 상이한 아키텍처를 갖는다. 예를 들어, 일부 실시예에서, 메모리(606)는 프로세서(602)에 직접 연결된다.

저장 장치(608)는 하드 드라이브, CD-ROM(compact disk read-only memory), DVD 또는 솔리드 스테이트 메모리 장치와 같은 하나 이상의 비일시적 컴퓨터 판독가능 저장 매체를 포함한다. 메모리(606)는 프로세서(602)에 의해 사용되는 프로그램 코드(하나 이상의 명령어로 구성됨) 및 데이터를 보유한다. 프로그램 코드는 도 1 내지 도 5를 참조하여 설명된 처리 양태에 대응할 수 있다.

포인팅 장치(614)는 키보드(610)와 결합하여 컴퓨터 시스템(600)에 데이터를 입력하는 데 사용된다. 그래픽 어댑터(612)는 디스플레이 장치(618)에 이미지 및 다른 정보를 표시한다. 다른 실시예에서, 디스플레이 장치(618)는 사용자 입력 및 선택을 수신할 수 있는 터치 스크린을 포함한다. 네트워크 어댑터(616)는 컴퓨터 시스템(600)을 네트워크와 연결한다. 컴퓨터(600)의 일부 실시예는 도 6에 나타난 구성요소와 상이한 및/또는 다른 구성요소를 갖는다.

일부 실시예에서, 오디오 처리 시스템(100 또는 200)과 같은 오디오 처리 시스템을 구현하는 회로는, ASIC(application-specific integrated circuit), FPGA(field-programmable gate array) 또는 다른 유형의 컴퓨팅 회로를 포함할 수 있다.

추가적인 고려사항

실시예의 전술한 설명은 예시를 위해 제공되었고, 이는 철저하거나 개시된 정확한 형태로 특허권을 제한하려는 의도가 아니다. 관련 기술의 통상의 기술자는 전술한 개시를 고려하여 많은 수정 및 변형이 가능함을 이해할 수 있다.

본 명세서의 일부는, 정보에 대한 동작의 알고리즘 및 기호 표현의 형식으로 실시예를 설명한다. 이러한 알고리즘 설명 및 표현은 일반적으로, 데이터 처리 분야의 통상의 기술자에 의해, 다른 통상의 기술자에게, 효과적으로 자신의 작업의 실질을 전달하는 데 사용된다. 이러한 동작은 기능적으로, 계산적으로 또는 논리적으로 설명되었지만, 컴퓨터 프로그램 또는 등가의 전기 회로, 마이크로코드(microcode) 등에 의해 구현되는 것으로 이해된다. 또한, 일반성을 잃지 않고 이러한 동작의 배열을 모듈로 지칭하는 것이 종종 편리한 것이 증명되었다. 설명된 동작 및 이와 관련한 모듈은 소프트웨어, 펌웨어, 하드웨어 또는 이들의 임의의 조합으로 구현될 수 있다.

본 명세서에서 설명되는 임의의 단계, 동작 또는 프로세스는 하나 이상의 하드웨어 또는 소프트웨어 모듈 독자적으로 또는 다른 장치와 조합하여 수행되거나 구현될 수 있다. 일 실시예에서, 소프트웨어 모듈은 컴퓨터 프로그램 코드를 포함하는 컴퓨터 판독가능 매체를 포함하는, 설명된 임의의 또는 모든 단계, 동작 또는 프로세스를 수행하기 위한 컴퓨터 프로세서에 의해 실행될 수 있는 컴퓨터 프로그램 제품으로 구현된다.

실시예는 또한 본 명세서의 동작을 수행하기 위한 장치에 관한 것일 수 있다. 이 장치는 요구되는 목적을 위해 특별히 구성될 수 있고/있거나 이는 컴퓨터에 저장된 컴퓨터 프로그램에 의해 선택적으로 활성화되거나 재구성되는 범용 컴퓨팅 장치를 포함할 수 있다. 이러한 컴퓨터 프로그램은 비일시적, 유형의(tangible) 컴퓨터 판독가능 저장 매체 또는 전자적 명령어를 저장하는 데 적합한 임의의 유형의 매체에 저장될 수 있고, 이는 컴퓨터 시스템 버스에 연결될 수 있다. 또한, 본 명세서에서 언급된 임의의 컴퓨팅 시스템은 단일 프로세서를 포함할 수 있거나 또는 증가된 컴퓨팅 능력을 위한 다중 프로세서 설계를 채용한 아키텍처일 수 있다.

실시예는 또한 본 명세서에서 설명되는 컴퓨팅 프로세스에 의해 생성되는 제품에 관한 것일 수 있다. 이러한 제품은 컴퓨팅 프로세스로부터 생성된 정보를 포함할 수 있으며, 여기서 정보는 비일시적, 유형의(tangible) 컴퓨터 판독가능 저장 매체에 저장되고, 본 명세서에서 설명되는 컴퓨터 프로그램 제품 또는 다른 데이터 조합의 임의의 실시예를 포함할 수 있다.

마지막으로, 명세서에서 사용되는 언어는 주로 가독성 및 설명적 목적을 위해 선택되었으며, 특허권을 기술하거나 제한하기 위해 선택된 것이 아닐 수 있다. 따라서 특허권의 범위는 본 상세한 설명이 아닌, 이에 기초한 출원에 대해 발행하는 모든 청구범위에 의해 제한되는 것으로 의도된다. 따라서, 실시예의 개시는, 다음 청구범위에 기재된 특허권의 범위를 예시하기 위한 것으로 의도되고, 제한하는 것이 아니다.

Claims

시스템으로서,
회로를 포함하되,
상기 회로는,
오디오 신호 성분 쌍을 회전시킴으로써, 제 1 회전된 성분 및 제 2 회전된 성분을 생성,
상기 제 1 회전된 성분을 이용하여, 서로 위상이 다른 좌측 쿼드러쳐 성분을 생성,
상기 제 2 회전된 성분을 이용하여, 서로 위상이 다른 우측 쿼드러쳐 성분을 생성,
상기 좌측 및 우측 쿼드러쳐 성분에 기초하여, 직교 상관 변환(orthogonal correlation transform, OCT) 성분 - 각 OCT 성분은, 좌측 쿼드러쳐 성분 및 우측 쿼드러쳐 성분의 가중치가 부여된 결합을 포함함 - 을 생성,
하나 이상의 상기 OCT 성분을 이용하여, 모노 출력 채널을 생성, 및
상기 모노 출력 채널을 하나 이상의 스피커에 제공하도록 구성되는,
시스템.
제 1 항에 있어서,
상기 제 1 회전된 성분을 생성하도록 구성되는 상기 회로는, 상기 오디오 신호 성분 쌍에 고정된 회전 각도를 적용하도록 구성되는 회로를 포함하는,
시스템.
제 1 항에 있어서,
상기 제 1 회전된 성분을 생성하도록 구성되는 상기 회로는, 상기 오디오 신호 성분 쌍에 시변(time-varying) 회전 각도를 적용하도록 구성되는 회로를 포함하는,
시스템.
제 1 항에 있어서,
상기 좌측 쿼드러쳐 성분은 서로 90도 위상 관계를 갖고,
상기 우측 쿼드러쳐 성분은 서로 90도 위상 관계를 갖는,
시스템.
제 1 항에 있어서,
상기 좌측 쿼드러쳐 성분은 상기 제 1 회전된 성분과 단일 크기 관계를 갖고,
상기 우측 쿼드러쳐 성분은 상기 제 2 회전된 성분과 단일 크기 관계를 갖는,
시스템.
제 1 항에 있어서,
상기 OCT 성분을 생성하도록 구성되는 상기 회로는,
제 1 좌측 쿼드러쳐 성분을, 반전된 제 2 우측 쿼드러쳐 성분과 결합하여, 제 1 OCT 성분을 생성,
제 1 좌측 쿼드러쳐 성분을, 제 2 우측 쿼드러쳐 성분과 결합하여, 제 2 OCT 성분을 생성,
제 2 좌측 쿼드러쳐 성분을, 반전된 제 1 우측 쿼드러쳐 성분과 결합하여, 제 3 OCT 성분을 생성, 및
제 2 좌측 쿼드러쳐 성분을, 제 1 우측 쿼드러쳐 성분과 결합하여, 제 4 OCT 성분을 생성하도록 구성되는 회로를 포함하는,
시스템.
제 1 항에 있어서,
상기 모노 출력 채널을 생성하도록 구성되는 상기 회로는, 상기 OCT 성분으로부터 하나의 OCT 성분을 선택하도록 구성되는 회로를 포함하는,
시스템.
제 1 항에 있어서,
상기 모노 출력 채널을 생성하도록 구성되는 상기 회로는, 둘 이상의 OCT 성분의 시변 조합을 생성하도록 구성되는 회로를 포함하는,
시스템.
제 8 항에 있어서,
상기 둘 이상의 OCT 성분의 시변 조합은, 상기 오디오 신호의 함수를 입력으로 사용하는 기울기 제한 함수에 의존하는,
시스템.
제 1 항에 있어서,
상기 모노 출력 채널을 생성하도록 구성되는 상기 회로는, 상기 OCT 성분의 제 1 쌍의 비선형 합을 결정하도록 구성되는 회로를 포함하고,
상기 모노 출력 채널을 상기 하나 이상의 스피커에 제공하도록 구성되는 상기 회로는, 상기 모노 출력 채널을 제 1 스피커에 제공하도록 구성되는 회로를 포함하며,
상기 회로는,
상기 OCT 성분의 제 2 쌍 - OCT 성분의 상기 제 1 쌍 및 제 2 쌍은 상이함 - 의 비선형 합을 결정함으로써 다른 모노 출력 채널을 생성하고,
상기 다른 모노 출력 채널을 제 2 스피커에 제공하도록 더 구성되는,
시스템.
제 1 항에 있어서,
상기 오디오 신호 성분 쌍은, 상기 오디오 신호 성분 쌍의 제 1 서브 대역의 좌측 서브 대역 성분 및 상기 오디오 신호 성분 쌍의 상기 제 1 서브 대역의 우측 서브 대역 성분을 포함하며,
상기 OCT 성분은 상기 제 1 서브 대역의 것이고,
상기 모노 출력 채널을 생성하도록 구성되는 상기 회로는, 상기 하나 이상의 상기 OCT 성분을, 상기 오디오 신호 성분 쌍의 제 2 서브 대역의 하나 이상의 다른 OCT 성분과 결합하도록 구성되는 회로를 포함하는,
시스템.
방법으로서,
회로에 의해서,
오디오 신호 성분 쌍을 회전시킴으로써, 제 1 회전된 성분 및 제 2 회전된 성분을 생성하는 단계,
상기 제 1 회전된 성분을 이용하여, 서로 위상이 다른 좌측 쿼드러쳐 성분을 생성하는 단계,
상기 제 2 회전된 성분을 이용하여, 서로 위상이 다른 우측 쿼드러쳐 성분을 생성하는 단계,
상기 좌측 및 우측 쿼드러쳐 성분에 기초하여, 직교 상관 변환(orthogonal correlation transform, OCT) 성분 - 각 OCT 성분은, 좌측 쿼드러쳐 성분 및 우측 쿼드러쳐 성분의 가중치가 부여된 결합을 포함함 - 을 생성하는 단계,
하나 이상의 상기 OCT 성분을 이용하여, 모노 출력 채널을 생성하는 단계, 및
상기 모노 출력 채널을 하나 이상의 스피커에 제공하는 단계를 포함하는,
방법.
제 12 항에 있어서,
상기 제 1 회전된 성분을 생성하는 단계는, 상기 오디오 신호 성분 쌍에 고정된 회전 각도를 적용하는 단계를 포함하는,
방법.
제 12 항에 있어서,
상기 제 1 회전된 성분을 생성하는 단계는, 상기 오디오 신호 성분 쌍에 시변 회전 각도를 적용하는 단계를 포함하는,
방법.
제 12 항에 있어서,
상기 좌측 쿼드러쳐 성분은 서로 90도 위상 관계를 갖고,
상기 우측 쿼드러쳐 성분은 서로 90도 위상 관계를 갖는,
방법.
제 12 항에 있어서,
상기 좌측 쿼드러쳐 성분은 상기 제 1 회전된 성분과 단일 크기 관계를 갖고,
상기 우측 쿼드러쳐 성분은 상기 제 2 회전된 성분과 단일 크기 관계를 갖는,
방법.
제 12 항에 있어서,
상기 OCT 성분을 생성하는 단계는,
제 1 좌측 쿼드러쳐 성분을, 반전된 제 2 우측 쿼드러쳐 성분과 결합하여, 제 1 OCT 성분을 생성하는 단계,
제 1 좌측 쿼드러쳐 성분을, 제 2 우측 쿼드러쳐 성분과 결합하여, 제 2 OCT 성분을 생성하는 단계,
제 2 좌측 쿼드러쳐 성분을, 반전된 제 1 우측 쿼드러쳐 성분과 결합하여, 제 3 OCT 성분을 생성하는 단계, 및
제 2 좌측 쿼드러쳐 성분을, 제 1 우측 쿼드러쳐 성분과 결합하여, 제 4 OCT 성분을 생성하는 단계를 포함하는,
방법.
제 12 항에 있어서,
상기 모노 출력 채널을 생성하는 단계는, 상기 OCT 성분으로부터 하나의 OCT 성분을 선택하는 단계를 포함하는,
방법.
제 12 항에 있어서,
상기 모노 출력 채널을 생성하는 단계는, 둘 이상의 OCT 성분의 시변 조합을 생성하는 단계를 포함하는,
방법.
제 19 항에 있어서,
상기 둘 이상의 OCT 성분의 시변 조합은, 상기 오디오 신호의 함수를 입력으로 사용하는 기울기 제한 함수에 의존하는,
방법.
제 12 항에 있어서,
상기 모노 출력 채널을 생성하는 단계는, 상기 OCT 성분의 제 1 쌍의 비선형 합을 결정하는 단계를 포함하고,
상기 모노 출력 채널을 상기 하나 이상의 스피커에 제공하는 단계는, 상기 모노 출력 채널을 제 1 스피커에 제공하는 단계를 포함하며,
상기 방법은,
상기 OCT 성분의 제 2 쌍 - OCT 성분의 상기 제 1 쌍 및 제 2 쌍은 상이함 - 의 비선형 합을 결정함으로써 다른 모노 출력 채널을 생성하는 단계, 및
상기 다른 모노 출력 채널을 제 2 스피커에 제공하는 단계를 더 포함하는,
방법.
제 12 항에 있어서,
상기 오디오 신호 성분 쌍은, 상기 오디오 신호 성분 쌍의 제 1 서브 대역의 좌측 서브 대역 성분 및 상기 오디오 신호 성분 쌍의 상기 제 1 서브 대역의 우측 서브 대역 성분을 포함하며,
상기 OCT 성분은 상기 제 1 서브 대역의 것이고,
상기 모노 출력 채널을 생성하는 단계는, 상기 하나 이상의 상기 OCT 성분을, 상기 오디오 신호 성분 쌍의 제 2 서브 대역의 하나 이상의 다른 OCT 성분과 결합하는 단계를 포함하는,
방법.
명령어를 저장하는 비일시적 컴퓨터 판독가능 매체로서,
적어도 하나의 프로세서에 의해 실행될 때 상기 명령어는,
오디오 신호 성분 쌍을 회전시킴으로써, 제 1 회전된 성분 및 제 2 회전된 성분을 생성,
상기 제 1 회전된 성분을 이용하여, 서로 위상이 다른 좌측 쿼드러쳐 성분을 생성,
상기 제 2 회전된 성분을 이용하여, 서로 위상이 다른 우측 쿼드러쳐 성분을 생성,
상기 좌측 및 우측 쿼드러쳐 성분에 기초하여, 직교 상관 변환(orthogonal correlation transform, OCT) 성분 - 각 OCT 성분은, 좌측 쿼드러쳐 성분 및 우측 쿼드러쳐 성분의 가중치가 부여된 결합을 포함함 - 을 생성,
하나 이상의 상기 OCT 성분을 이용하여, 모노 출력 채널을 생성, 및
상기 모노 출력 채널을 하나 이상의 스피커에 제공하도록, 상기 적어도 하나의 프로세서를 구성하는,
비일시적 컴퓨터 판독가능 매체.
제 23 항에 있어서,
상기 제 1 회전된 성분을 생성하도록 상기 적어도 하나의 프로세서를 구성하는 상기 명령어는, 상기 오디오 신호 성분 쌍에 고정된 회전 각도를 적용하도록 상기 적어도 하나의 프로세서를 구성하는 명령어를 포함하는,
비일시적 컴퓨터 판독가능 매체.
제 23 항에 있어서,
상기 제 1 회전된 성분을 생성하도록 상기 적어도 하나의 프로세서를 구성하는 상기 명령어는, 상기 오디오 신호 성분 쌍에 시변 회전 각도를 적용하도록 상기 적어도 하나의 프로세서를 구성하는 명령어를 포함하는,
비일시적 컴퓨터 판독가능 매체.
제 23 항에 있어서,
상기 좌측 쿼드러쳐 성분은 서로 90도 위상 관계를 갖고,
상기 우측 쿼드러쳐 성분은 서로 90도 위상 관계를 갖는,
비일시적 컴퓨터 판독가능 매체.
제 23 항에 있어서,
상기 좌측 쿼드러쳐 성분은 상기 제 1 회전된 성분과 단일 크기 관계를 갖고,
상기 우측 쿼드러쳐 성분은 상기 제 2 회전된 성분과 단일 크기 관계를 갖는,
비일시적 컴퓨터 판독가능 매체.
제 23 항에 있어서,
상기 OCT 성분을 생성하도록 상기 적어도 하나의 프로세서를 구성하는 상기 명령어는,
제 1 좌측 쿼드러쳐 성분을, 반전된 제 2 우측 쿼드러쳐 성분과 결합하여, 제 1 OCT 성분을 생성,
제 1 좌측 쿼드러쳐 성분을, 제 2 우측 쿼드러쳐 성분과 결합하여, 제 2 OCT 성분을 생성,
제 2 좌측 쿼드러쳐 성분을, 반전된 제 1 우측 쿼드러쳐 성분과 결합하여, 제 3 OCT 성분을 생성, 및
제 2 좌측 쿼드러쳐 성분을, 제 1 우측 쿼드러쳐 성분과 결합하여, 제 4 OCT 성분을 생성하도록 상기 적어도 하나의 프로세서를 구성하는 명령어를 포함하는,
비일시적 컴퓨터 판독가능 매체.
제 23 항에 있어서,
상기 모노 출력을 생성하도록 상기 적어도 하나의 프로세서를 구성하는 상기 명령어는, 상기 OCT 성분으로부터 하나의 OCT 성분을 선택하도록 상기 적어도 하나의 프로세서를 구성하는 명령어를 포함하는,
비일시적 컴퓨터 판독가능 매체.
제 23 항에 있어서,
상기 모노 출력을 생성하도록 상기 적어도 하나의 프로세서를 구성하는 상기 명령어는, 둘 이상의 OCT 성분의 시변 조합을 생성하도록 상기 적어도 하나의 프로세서를 구성하는 명령어를 포함하는,
비일시적 컴퓨터 판독가능 매체.
제 30 항에 있어서,
상기 둘 이상의 OCT 성분의 시변 조합은, 상기 오디오 신호의 함수를 입력으로 사용하는 기울기 제한 함수에 의존하는,
비일시적 컴퓨터 판독가능 매체.
제 23 항에 있어서,
상기 모노 출력 채널을 생성하도록 상기 적어도 하나의 프로세서를 구성하는 상기 명령어는, 상기 OCT 성분의 제 1 쌍의 비선형 합을 결정하도록 상기 적어도 하나의 프로세서를 구성하는 명령어를 포함하고,
상기 모노 출력 채널을 상기 하나 이상의 스피커에 제공하도록 상기 적어도 하나의 프로세서를 구성하는 상기 명령어는, 상기 모노 출력 채널을 제 1 스피커에 제공하도록 구성하는 명령어를 포함하며,
상기 명령어는,
상기 OCT 성분의 제 2 쌍 - OCT 성분의 상기 제 1 쌍 및 상기 제 2 쌍은 상이함 - 의 비선형 합을 결정함으로써 다른 모노 출력 채널을 생성하고,
상기 다른 모노 출력 채널을 제 2 스피커에 제공하도록 상기 적어도 하나의 프로세서를 더 구성하는,
비일시적 컴퓨터 판독가능 매체.
제 23 항에 있어서,
상기 오디오 신호 성분 쌍은, 상기 오디오 신호 성분 쌍의 제 1 서브 대역의 좌측 서브 대역 성분 및 상기 오디오 신호 성분 쌍의 상기 제 1 서브 대역의 우측 서브 대역 성분을 포함하며,
상기 OCT 성분은 상기 제 1 서브 대역의 것이고,
상기 모노 출력 채널을 생성하도록 상기 적어도 하나의 프로세서를 구성하는 명령어는, 상기 하나 이상의 상기 OCT 성분을, 상기 오디오 신호 성분 쌍의 제 2 서브 대역의 하나 이상의 다른 OCT 성분과 결합하도록 상기 적어도 하나의 프로세서를 구성하는 명령어를 포함하는,
비일시적 컴퓨터 판독가능 매체.