WO2024096314A1

WO2024096314A1 - 전자 장치 및 그 음향 출력 방법

Info

Publication number: WO2024096314A1
Application number: PCT/KR2023/014254
Authority: WO
Inventors: 이윤재; 임동현; 김선민; 박해광
Original assignee: 삼성전자주식회사
Priority date: 2022-11-01
Filing date: 2023-09-20
Publication date: 2024-05-10
Also published as: KR20240062489A

Abstract

전자 장치가 개시된다. 전자 장치는, 복수의 스피커 유닛을 포함하는 스피커 어레이, 적어도 하나의 명령어를 저장하는 메모리 및, 스피커 어레이 및 메모리와 연결되어 전자 장치를 제어하는 하나 이상의 프로세서를 포함한다. 복수의 스피커 유닛은, 임계 주파수 이상의 고역 음향 신호를 출력하는 복수의 트위터(tweeter) 유닛 및 임계 주파수 미만의 중저역 음향 신호를 출력하는 복수의 미드레인지(midrange) 유닛을 포함한다. 하나 이상의 프로세서는, 적어도 하나의 명령어를 실행함으로써, 고역 음향 신호에 대해 빔 포밍(Beam forming) 방식을 이용하여 R(Right) 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L(Left) 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어하고, 중저역 음향 신호에 대해 심리 음향 모델을 이용하여 R 채널 신호 및 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어할 수 있다.

Description

전자 장치 및 그 음향 출력 방법

본 개시는 전자 장치 및 그 음향 출력 방법에 관한 것으로, 더욱 상세하게는 복수의 스피커 유닛을 포함하는 전자 장치 및 그 음향 출력 방법에 관한 것이다.

전자 기술의 발달에 힘입어 다양한 유형의 전자 장치가 개발되고 있다. 특히, 더 새롭고 다양한 기능을 원하는 사용자의 니즈(needs)에 부합하기 위하여 음향 출력 장치는 다양한 컨텐츠의 특성에 대응되는 음향을 제공하도록 개발되고 있다.

일 실시 예에 따른 전자 장치는, 복수의 스피커 유닛을 포함하는 스피커 어레이, 적어도 하나의 명령어를 저장하는 메모리 및, 상기 스피커 어레이 및 상기 메모리와 연결되어 상기 전자 장치를 제어하는 하나 이상의 프로세서를 포함한다. 상기 복수의 스피커 유닛은, 임계 주파수 이상의 고역 음향 신호를 출력하는 복수의 트위터(tweeter) 유닛 및 상기 임계 주파수 미만의 중저역 음향 신호를 출력하는 복수의 미드레인지(midrange) 유닛을 포함한다. 상기 하나 이상의 프로세서는,상기 적어도 하나의 명령어를 실행함으로써, 상기 고역 음향 신호에 대해 빔 포밍(Beam forming) 방식을 이용하여 R(Right) 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L(Left) 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어하고, 상기 중저역 음향 신호에 대해 심리 음향 모델을 이용하여 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어한다.

일 예에 따르면, 상기 하나 이상의 프로세서는, 상기 전자 장치를 기준으로 사용자의 방향을 식별하고, 상기 고역 음향 신호에 대해 상기 식별된 사용자의 방향에 대응되는 빔 포밍 필터를 적용하고 상기 빔 포밍 필터가 적용된 R 채널 신호 및 L 채널 신호를 출력하도록 상기 복수의 트위터 유닛을 제어하고, 상기 중저역 음향 신호에 대해 상기 식별된 사용자의 방향에 대응되는 HRTF(Head Related Transfer Function) 필터를 적용하고, 상기 HRTF 필터가 적용된 R 채널 신호 및 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어할 수 있다.

일 예에 따르면, 복수의 마이크를 포함하는 마이크 어레이를 더 포함하며, 상기 하나 이상의 프로세서는, 상기 복수의 마이크를 통해 사용자 음성이 수신된 시간 차에 기초하여 상기 사용자의 방향을 식별하고, 상기 식별된 사용자 방향에 기초하여 상기 고역 음향 신호에 대해 빔 포밍 방식을 이용하여 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어할 수 있다.

일 예에 따르면, 상기 메모리는, 상기 전자 장치를 기준으로 제1 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제1 빔 포밍 필터 및 상기 제1 방향과 상이한 제2 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제2 빔 포밍 필터를 저장할 수 있다. 상기 하나 이상의 프로세서는, 상기 사용자 방향이 상기 제1 방향에 대응되면, 상기 고역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제1 빔 포밍 필터를 적용하여 상기 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 상기 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어하고, 상기 사용자 방향이 상기 제2 방향에 대응되면, 상기 고역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제2 빔 포밍 필터를 적용하여 상기 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 상기 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어할 수 있다.

일 예에 따르면, 상기 메모리는, 상기 전자 장치를 기준으로 제1 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제1 HRTF 필터 및 상기 제1 방향과 상이한 제2 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제2 HRTF 필터를 저장할 수 있다. 상기 하나 이상의 프로세서는, 상기 사용자 방향이 상기 제1 방향에 대응되면, 상기 중저역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제1 HRTF 필터를 적용하여 상기 제1 HRTF 필터가 적용된 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어하고, 상기 사용자 방향이 상기 제2 방향에 대응되면, 상기 중저역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제2 HRTF 필터를 적용하여 상기 제2 HRTF 필터가 적용된 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어할 수 있다.

일 예에 따르면, 상기 복수의 스피커 유닛은, 상기 스피커 어레이의 중앙 부분에 배치된 복수의 제1 트위터 유닛, 상기 복수의 제1 트위터 유닛의 우측 및 좌측으로 이격 배치된 복수의 제2 트위터 유닛, 및 상기 복수의 제2 트위터 유닛 일측에 배치된 복수의 미드레인지 유닛을 포함할 수 있다.

일 예에 따르면, 상기 복수의 제1 트위터 유닛은, 일렬로 배치된 3개의 트위터 유닛을 포함하고, 상기 복수의 제2 트위터 유닛은, 상기 3개의 트위터 유닛의 우측에 배치된 우측 트위터 유닛 및 상기 3개의 트위터 유닛의 좌측에 배치된 좌측 트위터 유닛을 포함할 수 있다. 상기 복수의 미드레인지 유닛은, 상기 우측 트위터 유닛의 우측에 배치된 제1 미드레인지 유닛 및 상기 좌측 트위터 유닛의 좌측에 배치된 제2 미드레인지 유닛을 포함할 수 있다.

일 예에 따르면, 상기 하나 이상의 프로세서는, 음향 신호에 대해 하이 패스 필터(High Pass Filter)를 적용하여 상기 고역 음향 신호를 획득하고, 상기 음향 신호에 대해 로우 패스 필터(Low Pass Filter)를 적용하여 상기 중저역 음향 신호를 획득할 수 있다.

일 실시 예에 따르면, 복수의 스피커 유닛을 포함하는 스피커 어레이를 포함하는 전자 장치의 음향 출력 방법은, 임계 주파수 이상의 고역 음향 신호에 대해 빔 포밍(Beam forming) 방식을 이용하여 R(Right) 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L(Left) 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 복수의 트위터 유닛을 제어하는 단계 및, 상기 임계 주파수 미만의 중저역 음향 신호에 대해 심리 음향 모델을 이용하여 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 복수의 미드레인지 유닛을 제어하는 단계를 포함할 수 있다.

일 실시 예에 따르면, 복수의 스피커 유닛을 포함하는 스피커 어레이를 포함하는 전자 장치의 하나 이상의 프로세서에 의해 실행되는 경우 상기 전자 장치가 동작을 수행하도록 하는 컴퓨터 명령을 저장하는 비일시적 컴퓨터 판독 가능 매체에 있어서, 상기 동작은, 임계 주파수 이상의 고역 음향 신호에 대해 빔 포밍(Beam forming) 방식을 이용하여 R(Right) 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L(Left) 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 복수의 트위터 유닛을 제어하는 단계 및, 상기 임계 주파수 미만의 중저역 음향 신호에 대해 심리 음향 모델을 이용하여 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 복수의 미드레인지 유닛을 제어하는 단계를 포함할 수 있다.

도 1a 내지 도 1c은 일 실시 예에 따른 전자 장치의 일 구현 예를 나타내는 도면이다.

도 2a는 일 실시 예에 따른 전자 장치의 구성을 나타내는 블럭도이다.

도 2b는 일 실시 예에 따른 전자 장치의 일 구현 예를 나타내는 블럭도이다.

도 2c는 일 실시 예에 따른 전자 장치의 일 구현 예를 나타내는 블럭도이다.

도 3은 일 실시 예에 따른 전자 장치의 음향 출력 방법을 설명하기 위한 도면이다.

도 4는 일 실시 예에 따른 전자 장치의 음향 출력 방법을 설명하기 위한 도면이다.

도 5는 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 도면이다.

도 6a 및 도 6b는 일 실시 예에 따른 빔 포밍 구현 예를 설명하기 위한 도면들이다.

도 7a 내지 도 7c는 일 실시 예에 따른 빔 포밍 구현 예를 설명하기 위한 도면들이다.

도 8a 및 도 8b는 일 예에 따른 HRTF 적용 방법을 설명하기 위한 도면들이다.

도 9a 및 도 9b는 일 예에 따른 HRIR 적용 방법을 설명하기 위한 도면들이다.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다.

본 개시의 실시 예에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 개시의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.

본 명세서에서, "가진다," "가질 수 있다," "포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.

본 개시에서, "A 또는 B," "A 또는/및 B 중 적어도 하나," 또는 "A 또는/및 B 중 하나 또는 그 이상"등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. 예를 들면, "A 또는 B," "A 및 B 중 적어도 하나," 또는 "A 또는 B 중 적어도 하나"는, (1) 적어도 하나의 A를 포함, (2) 적어도 하나의 B를 포함, 또는 (3) 적어도 하나의 A 및 적어도 하나의 B 모두를 포함하는 경우를 모두 지칭할 수 있다.

본 명세서에서 사용된 "제1," "제2," "첫째," 또는 "둘째,"등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다.

어떤 구성요소(예: 제1 구성요소)가 다른 구성요소(예: 제2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어(operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 어떤 구성요소가 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다.

본 개시에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to)," 또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성된(또는 설정된)"은 하드웨어적으로 "특별히 설계된(specifically designed to)" 것만을 반드시 의미하지 않을 수 있다.

어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구성되다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

실시 예에 있어서 "모듈" 혹은 "부"는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 "모듈" 혹은 복수의 "부"는 특정한 하드웨어로 구현될 필요가 있는 "모듈" 혹은 "부"를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서(미도시)로 구현될 수 있다.

한편, 도면에서의 다양한 요소와 영역은 개략적으로 그려진 것이다. 따라서, 본 발명의 기술적 사상은 첨부한 도면에 그려진 상대적인 크기나 간격에 의해 제한되지 않는다.

이하 첨부된 도면들을 참조하여 본 개시의 일 실시 예를 보다 상세하게 설명한다.

전자 장치(100)는 복수의 스피커 유닛을 포함하는 스피커 어레이를 포함할 수 있다. 이 경우, 전자 장치(100)는 사운드바, 홈씨어터 시스템, One box 스피커, 룸 스피커, 프론트 서라운드 스피커 등으로 구현될 수 있다. 다만, 이 예에 한정되는 것은 아니고, 복수의 스피커 유닛을 포함하는 장치라면 본 개시에 따른 전자 장치(100)가 될 수 있다. 예를 들어, 전자 장치(100)는 복수의 스피커 유닛을 구비한 TV, 오디오 장치, 사용자 단말 등으로 구현 가능하다.

전자 장치(100)에 포함된 복수의 스피커 유닛은 전기 펄스를 음파로 변환시키는 기능을 하며, 전기 신호를 음파로 변환시키는 원리와 방법에 따라 구분되는 동전형(動電型) 즉, 다이내믹 형으로 구현될 수 있다. 다만, 이에 한정되는 것은 아니며, 복수의 스피커 유닛은 본 발명이 적용되는 범위 내에서 정전형(靜電型), 유전체형(誘電體型), 자기왜형(磁氣歪型) 등으로 구현될 수도 있다.

또한, 전자 장치(100)는 재생 대역을 저음/중음/고음으로 음역을 구분하고, 각각에 알맞은 스피커 유닛에 구분된 음역을 분담시키는 멀티웨이 방식으로 구현될 수 있다.

일 예로, 두 가지 타입의 스피커에 재생 대역을 분담시킨 2 웨이 방식의 경우, 복수의 스피커 유닛은 트위터 유닛(Tweeter uint) 및 미드레인지 유닛(Midrange unit)를 포함하는 형태로 구현될 도 있다.

일 예로, 세 가지 타입의 스피커에 재생 대역을 분담시킨 3 웨이 방식의 경우, 복수의 스피커 유닛은 고주파 음향 신호를 재생하기 위한 트위터 유닛(Tweeter uint), 중간 주파수 음향 신호를 재생하기 위한 미드레인지 유닛(Midrange unit), 저주파 음향 신호를 재생하기 위한 적어도 하나의 우퍼 유닛(woofer unit) 등을 포함하는 형태로 구현될 수 있다.

도 1a는 전자 장치(100)의 일 구현 예를 나타내는 도면이다.

도 1a에 도시된 바와 같이, 전자 장치(100)에 포함된 복수의 스피커 유닛은 고주파수 대역의 음향 신호 즉, 고역 음향 신호를 재생하는 복수의 트위터 유닛(Tweeter uint)(10), 중간 주파수 대역 및 저주파수 대역의 음향 신호 즉, 중저역 음향 신호를 재생하는 복수의 미드레인지 유닛(20)을 포함할 수 있다.

예를 들어, 복수의 트위터 유닛(10)은 스피커 어레이의 중앙 부분에 배치된 복수의 제1 트위터 유닛(11, 12, 13) 및 복수의 제1 트위터 유닛(11, 12, 13)의 우측 및 좌측으로 이격 배치된 복수의 제2 트위터 유닛(14, 15)를 포함할 수 있다.

이 경우, 복수의 제1 트위터 유닛(11, 12, 13)은 일렬로 배치된 3개의 트위터 유닛(11, 12, 13)을 포함할 수 있다. 그리고, 복수의 제2 트위터 유닛(14, 15)은 3 개의 트위터 유닛(11, 12, 13)의 우측에 배치된 우측 트위터 유닛(14) 및 3 개의 트위터 유닛(11, 12, 13)의 좌측에 배치된 좌측 트위터 유닛(15)을 포함할 수 있다. 즉, 우측 트위터 유닛(14)은 스피커 어레이의 중앙 부분에 배치된 3 개의 트위터 유닛(11, 12, 13) 중 최우측 트위터 유닛(11)의 우측에 배치되고, 좌측 트위터 유닛(15)은 스피커 어레이의 중앙 부분에 배치된 3개의 트위터 유닛(11, 12, 13) 중 최좌측 트위터 유닛(13)의 좌측에 배치될 수 있다. 다만, 복수의 트위터 유닛의 개수 및/또는 배치 위치는 반드시 이에 한정되는 것은 아니다.

복수의 미드레인지 유닛(21, 22)은 복수의 제2 트위터 유닛(14, 15) 일측에 배치될 수 있다. 이 경우, 복수의 미드레인지 유닛(21, 22)은 우측 트위터 유닛(14)의 우측에 배치된 제1 미드레인지 유닛(21) 및 좌측 트위터 유닛(15)의 좌측에 배치된 제2 미드레인지 유닛(22)을 포함할 수 있다. 다만, 복수의 미드레인지 유닛의 개수 및 배치 위치는 반드시 이에 한정되는 것은 아니다.

도 1b는 전자 장치(100)의 세부 구현 예를 나타내는 도면이다.

일 예에 따라 도 1b에 도시된 바와 같이 전자 장치(100)는 도 1a에 도시된 바와 같은 스피커 어레이 뿐 아니라, 복수의 마이크를 포함하는 마이크 어레이(30)를 더 포함할 수 있다. 마이크 어레이(30)는 복수 개의 마이크 일정한 간격으로 배치되도록 구현될 수 있다. 도 1b에서는 마이크 어레이(30)가 4 개의 마이크를 포함하는 것으로 도시하였으나 이에 한정되는 것은 아니다. 일 예에 따라 마이크 어레이(30)는 사용자의 방향을 식별하는데 이용될 수 있다.

도 1c는 일 예에 따른 스피커 어레이의 구현 수치를 설명하기 위한 도면이다.

일 예에 따라 전자 장치(100)는 작은 체적의 스피커 어레이를 포함할 수 있다. 예를 들어, 각 스피커 유닛 별 거리 간 수치는 도 1c에 도시된 바와 같을 수 있으나, 반드시 이에 한정되는 것은 아니다.

한편, 최근 헤드폰/헤드셋/이어폰과 같은 프라이빗 음향 출력 기기를 통해 사용자에게 입체 음향을 제공할 수 있는 메타버스, VR, 게임, 개인 영상 업로드 컨텐츠 등과 같은 컨텐츠의 사용량이 증가하고 있다.

사용자가 프라이빗 음향 출력 기기를 사용할 경우, L(Left) 채널 신호는 사용자의 왼쪽 귀로만 들어가며 반대로, R(Right) 채널 신호는 사용자의 오른쪽 귀로만 들어가게 된다. 예를 들어, Binaural Audio Contents의 경우, 프라이빗 음향 출력 기기로 청취 시 완벽한 입체 음향 체험이 가능하게 된다.

반면, 일반 스피커의 경우, L 채널(또는 R 채널)의 신호는 사용자의 왼쪽 귀 뿐 아니라 오른쪽 귀에도 들어가게 된다. 이와 같은 크로스토크(Crosstalk) 현상으로 인해 입체 음향 효과 반감될 수 밖에 없다.

이하에서는 작은 체적의 스피커 어레이에서 입체 음향 효과를 최대화하기 위하여 효과적으로 크로스토크를 제거할 수 있는 다양한 실시 예에 대해 설명하도록 한다.

도 2a에 따르면 전자 장치(100)은 스피커 어레이(110), 메모리(120) 및 하나 이상의 프로세서(130)를 포함한다.

스피커 어레이(110)는 복수의 스피커 유닛을 포함한다. 일 예에 따라, 도 1a에 도시된 바와 같이, 복수의 스피커 유닛은 복수의 트위터 유닛(10) 및 복수의 미드레인지 유닛(20)을 포함할 수 있다. 이에 대해 도 1a에서 자세히 설명하였으므로, 추가 설명은 생략하도록 한다.

메모리(120)는 다양한 실시 예를 위해 필요한 데이터를 저장할 수 있다. 메모리(120)는 데이터 저장 용도에 따라 전자 장치(100)에 임베디드된 메모리 형태로 구현되거나, 전자 장치(100)에 탈부착이 가능한 메모리 형태로 구현될 수도 있다. 예를 들어, 전자 장치(100)의 구동을 위한 데이터의 경우 전자 장치(100)에 임베디드된 메모리에 저장되고, 전자 장치(100)의 확장 기능을 위한 데이터의 경우 전자 장치(100)에 탈부착이 가능한 메모리에 저장될 수 있다.

한편, 전자 장치(100)에 임베디드된 메모리의 경우 휘발성 메모리(예: DRAM(dynamic RAM), SRAM(static RAM), 또는 SDRAM(synchronous dynamic RAM) 등), 비휘발성 메모리(non-volatile Memory)(예: OTPROM(one time programmable ROM), PROM(programmable ROM), EPROM(erasable and programmable ROM), EEPROM(electrically erasable and programmable ROM), mask ROM, flash ROM, 플래시 메모리(예: NAND flash 또는 NOR flash 등), 하드 드라이브, 또는 솔리드 스테이트 드라이브(solid state drive(SSD)) 중 적어도 하나로 구현될 수 있다. 또한, 전자 장치(100)에 탈부착이 가능한 메모리의 경우 메모리 카드(예를 들어, CF(compact flash), SD(secure digital), Micro-SD(micro secure digital), Mini-SD(mini secure digital), xD(extreme digital), MMC(multi-media card) 등), USB 포트에 연결가능한 외부 메모리(예를 들어, USB 메모리) 등과 같은 형태로 구현될 수 있다.

하나 이상의 프로세서(130)는 전자 장치(100)의 동작을 전반적으로 제어한다. 구체적으로, 하나 이상의 프로세서(130)는 전자 장치(100)의 각 구성과 연결되어 전자 장치(100)의 동작을 전반적으로 제어할 수 있다. 예를 들어, 하나 이상의 프로세서(130)는 스피커 어레이(110) 및 메모리(120)와 전기적으로 연결되어 전자 장치(100)의 전반적인 동작을 제어할 수 있다. 하나 이상의 프로세서(130)는 하나 또는 복수의 프로세서로 구성될 수 있다.

하나 이상의 프로세서(130)는 메모리(120)에 저장된 적어도 하나의 인스트럭션(instruction)을 실행함으로써, 다양한 실시 예에 따른 전자 장치(100)의 동작을 수행할 수 있다.

하나 이상의 프로세서(130)는 CPU (Central Processing Unit), GPU (Graphics Processing Unit), APU (Accelerated Processing Unit), MIC (Many Integrated Core), DSP (Digital Signal Processor), NPU (Neural Processing Unit), 하드웨어 가속기 또는 머신 러닝 가속기 중 하나 이상을 포함할 수 있다. 하나 이상의 프로세서(130)는 전자 장치의 다른 구성요소 중 하나 또는 임의의 조합을 제어할 수 있으며, 통신에 관한 동작 또는 데이터 처리를 수행할 수 있다. 하나 이상의 프로세서(130)는 메모리에 저장된 하나 이상의 프로그램 또는 명령어(instruction)을 실행할 수 있다. 예를 들어, 하나 이상의 프로세서는 메모리에 저장된 하나 이상의 명령어를 실행함으로써, 본 개시의 일 실시 예에 따른 방법을 수행할 수 있다.

본 개시의 일 실시 예에 따른 방법이 복수의 동작을 포함하는 경우, 복수의 동작은 하나의 프로세서에 의해 수행될 수도 있고, 복수의 프로세서에 의해 수행될 수도 있다. 예를 들어, 일 실시 예에 따른 방법에 의해 제 1 동작, 제 2 동작, 제 3 동작이 수행될 때, 제 1 동작, 제 2 동작, 및 제 3 동작 모두 제 1 프로세서에 의해 수행될 수도 있고, 제 1 동작 및 제 2 동작은 제 1 프로세서(예를 들어, 범용 프로세서)에 의해 수행되고 제 3 동작은 제 2 프로세서(예를 들어, 인공지능 전용 프로세서)에 의해 수행될 수도 있다.

하나 이상의 프로세서(130)는 하나의 코어를 포함하는 단일 코어 프로세서(single core processor)로 구현될 수도 있고, 복수의 코어(예를 들어, 동종 멀티 코어 또는 이종 멀티 코어)를 포함하는 하나 이상의 멀티 코어 프로세서(multicore processor)로 구현될 수도 있다. 하나 이상의 프로세서(130)가 멀티 코어 프로세서로 구현되는 경우, 멀티 코어 프로세서에 포함된 복수의 코어 각각은 캐시 메모리, 온 칩(On-chip) 메모리와 같은 프로세서 내부 메모리를 포함할 수 있으며, 복수의 코어에 의해 공유되는 공통 캐시가 멀티 코어 프로세서에 포함될 수 있다. 또한, 멀티 코어 프로세서에 포함된 복수의 코어 각각(또는 복수의 코어 중 일부)은 독립적으로 본 개시의 일 실시 예에 따른 방법을 구현하기 위한 프로그램 명령을 판독하여 수행할 수도 있고, 복수의 코어 전체(또는 일부)가 연계되어 본 개시의 일 실시 예에 따른 방법을 구현하기 위한 프로그램 명령을 판독하여 수행할 수도 있다.

본 개시의 일 실시 예에 따른 방법이 복수의 동작을 포함하는 경우, 복수의 동작은 멀티 코어 프로세서에 포함된 복수의 코어 중 하나의 코어에 의해 수행될 수도 있고, 복수의 코어에 의해 수행될 수도 있다. 예를 들어, 일 실시 예에 따른 방법에 의해 제 1 동작, 제 2 동작, 및 제 3 동작이 수행될 때, 제 1 동작, 제2 동작, 및 제3 동작 모두 멀티 코어 프로세서에 포함된 제 1 코어에 의해 수행될 수도 있고, 제 1 동작 및 제 2 동작은 멀티 코어 프로세서에 포함된 제 1 코어에 의해 수행되고 제 3 동작은 멀티 코어 프로세서에 포함된 제 2 코어에 의해 수행될 수도 있다.

본 개시의 실시 예들에서, 프로세서는 하나 이상의 프로세서 및 기타 전자 부품들이 집적된 시스템 온 칩(SoC), 단일 코어 프로세서, 멀티 코어 프로세서, 또는 단일 코어 프로세서 또는 멀티 코어 프로세서에 포함된 코어를 의미할 수 있으며, 여기서 코어는 CPU, GPU, APU, MIC, DSP, NPU, 하드웨어 가속기 또는 기계 학습 가속기 등으로 구현될 수 있으나, 본 개시의 실시 예들이 이에 한정되는 것은 아니다. 이하에서는 설명의 편의를 위하여 하나 이상의 프로세서(130)를 프로세서(130)로 명명하도록 한다.

도 2b에 따르면 전자 장치(100')은 스피커 어레이(110), 메모리(120), 하나 이상의 프로세서(130) 및 마이크 어레이(140)를 포함할 수 있다.

스피커 어레이(110), 메모리(120) 및 하나 이상의 프로세서(130)는 도 2b에 도시된 구성과 동일하므로 자세한 설명은 생략하도록 한다.

마이크 어레이(140)는 사용자 음성이나 기타 소리를 입력받아 오디오 데이터로 변환할 수 있다.

이 경우, 마이크 어레이(140)는 복수의 마이크를 포함할 수 있다. 일 예에 따라 스피커 어레이(140)는 도 1b에 도시된 마이크 어레이(30)로 구현되며, 전자 장치(100)의 기 정해진 위치, 예를 들어, 중앙 영역에 배치될 수 있다.

도 2c에 따르면 전자 장치(100'')은 스피커 어레이(110), 메모리(120), 하나 이상의 프로세서(130), 마이크 어레이(140), 통신 인터페이스(150), 사용자 인터페이스(160) 및 디스플레이(170)를 포함할 수 있다. 그러나, 이와 같은 구성은 예시적인 것으로서, 본 개시를 실시함에 있어 이와 같은 구성에 더하여 새로운 구성이 추가되거나 일부 구성이 생략될 수 있음을 물론이다. 한편, 한편, 도 2c에 도시된 구성 중 도 2a 및 도 2b에 도시된 구성과 중복되는 구성에 대해서는 자세한 설명은 생략하도록 한다.

통신 인터페이스(150)는 회로(circuitry)를 포함한다. 그리고, 통신 인터페이스(150)는 전자 장치(100)의 구현 예에 따라 다양한 통신 방식을 지원할 수 있다.

예를 들어, 통신 인터페이스(150)는 블루투스(Bluetooth), AP 기반의 Wi-Fi(와이파이, Wireless LAN 네트워크), 지그비(Zigbee), 유/무선 LAN(Local Area Network), WAN(Wide Area Network), 이더넷(Ethernet), IEEE 1394, HDMI(High-Definition Multimedia Interface), USB(Universal Serial Bus), MHL(Mobile High-Definition Link), AES/EBU(Audio Engineering Society/ European Broadcasting Union), 옵티컬(Optical), 코액셜(Coaxial) 등과 같은 통신 방식을 통해 외부 장치, 외부 저장 매체(예를 들어, USB 메모리), 외부 서버(예를 들어 클라우드 서버) 등과 통신을 수행할 수 있다.

이 경우, 통신 인터페이스(150)는 외부 장치, 서버 등으로부터 데이터를 수신하고, 외부 장치, 서버 등으로 데이터를 송신할 수 있다. 예를 들어, 통신 인터페이스(150)는 R 채널 및 L 채널을 포함하는 음향 신호를 수신할 수 있다. 여기에서, 음향 신호는 스테레오 신호 또는 다채널 신호일 수 있다.

사용자 인터페이스(160)는 회로를 포함한다. 그리고, 사용자 인터페이스(160)는 사용자 명령을 입력받을 수 있다. 이를 위해, 사용자 인터페이스(160)는 버튼, 터치 패드, 마우스 및 키보드와 같은 장치로 구현되거나, 디스플레이 기능 및 조작 입력 기능도 함께 수행 가능한 터치 스크린 등으로 구현될 수 있다.

디스플레이(170)는 자발광 소자를 포함하는 디스플레이 또는, 비자발광 소자 및 백라이트를 포함하는 디스플레이로 구현될 수 있다.

예를 들어, 디스플레이(170)는 LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes) 디스플레이, LED(Light Emitting Diodes), 마이크로 LED(micro LED), Mini LED, PDP(Plasma Display Panel), QD(Quantum dot) 디스플레이, QLED(Quantum dot light-emitting diodes) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 디스플레이(170) 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로 및 백라이트 유닛 등도 함께 포함될 수 있다.

일 예에 따라, 디스플레이(170)의 전면에는 다양한 유형의 터치 입력을 감지하기 위한 터치 센서가 배치될 수 있다.

예를 들어, 디스플레이(170)는 사용자 손에 의한 터치 입력, 스타일러스 펜과 같은 입력 장치에 의한 터치 입력, 특정 정전 물질에 의한 터치 입력 등 다양한 유형의 터치 입력을 감지할 수 있다. 여기서, 입력 장치는 전자 펜, 스타일러스 펜, S-펜 등 다양한 용어로 지칭될 수 있는 펜 형의 입력 장치로 구현될 수 있다. 일 예에 따라 디스플레이(170)는 평면(flat) 디스플레이, 커브드(curved) 디스플레이, 폴딩(folding) 또는/및 롤링(rolling) 가능한 플렉서블 디스플레이 등으로 구현될 수도 있다.

그 밖에 전자 장치(100'')는 구현 예에 따라 카메라(미도시), 센서(미도시), 튜너(미도시) 및 복조부(미도시) 등을 더 포함할 수도 있다.

일 실시 예에 따르면, 프로세서(130)는 고역 음향 신호에 대해서는 빔 포밍(Beam forming) 방식을 이용하고, 중저역 음향 신호에 대해서는 심리 음향 모델을 이용하여 출력을 제어할 수 있다. 여기서, 고역 음향 신호는 임계 주파수 이상의 음향 신호이고, 중저역 음향 신호는 임계 주파수 미만의 음향 신호일 수 있다. 예를 들어, 프로세서(130)는 입력된 음향 신호에 대해 임계 주파수를 기준으로 하는 하이 패스 필터(High Pass Filter)를 적용하여 고역 음향 신호를 획득하고, 음향 신호에 대해 임계 주파수를 기준으로 하는 로우 패스 필터(Low Pass Filter)를 적용하여 중저역 음향 신호를 획득할 수 있다. 경우에 따라 프로세서(130)는 외부로부터 인코딩된 신호가 입력되면, 디코딩을 수행할 수 있다. 예를 들어, 프로세서(130)는 인코딩된 신호가 SDI 신호라면, 인코딩된 SDI 신호를 디코딩하여 패러럴(parallel) 디지털 데이터로 변환하고, 상술한 필터를 이용하여 가청 주파수 대역을 재생 음역 별로 구분하고 각 재생 음역을 별개의 스피커 유닛이 재생하도록 제어할 수 있다.

도 3에 도시된 실시 예에 따르면, 프로세서(130)는 고역 음향 신호에 대해서는(S310:Y), 빔 포밍(Beam forming) 방식을 이용하여 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 복수의 트위터 유닛을 제어할 수 있다. 여기서, 고역 음향 신호는 임계 주파수 이상의 음향 신호일 수 있다. 임계 주파수는 고역 음향 신호의 빔 포밍의 성능에 기초하여 결정될 수 있다. 예를 들어, 임계 주파수는 2kHz일 수 있으나, 이에 한정되는 것은 아니다.

상술한 바와 같이 고역 음향 신호에 대해서는 HRTF(Head Related Transfer Function)를 이용한 Crosstalk 제거 방식이 이용되지 않을 수 있다. 고역 음향 신호의 경우 원하는 청취 위치에서의 고역 위상 제어가 쉽지 않고, 고역으로 갈수록 사용자 청취 위치에 민감하기 때문이다(예를 들어, 좁은 Sweet Spot). 이에 따라 고역 음향 신호를 재생하는 트위터 유닛의 최적 개수로 스피커 어레이를 구성하고 작은 길이의 스피커 어레이에서도 효과적인 빔 포밍 방식을 이용할 수 있다.

또한, 프로세서(130)는 중저역 음향 신호에 대해서는(S330:Y), 심리 음향 모델(Psychoacoustic Model)을 이용하여 R 채널 신호 및 L 채널 신호를 출력하도록 복수의 미드레인지 유닛을 제어할 수 있다. 여기서, 중저역 음향 신호는 임계 주파수 미만의 음향 신호일 수 있다. 심리 음향 모델은 HRTF(Head Related Transfer Function)을 포함할 수 있다. HRTF는 동일한 소리를 전방위에서 재생시켜 방향에 따른 주파수 응답을 측정하여 3차원 함수로 정리한 것을 의미한다. 구체적으로, HRTF는 음원과 고막 사이의 음향학적 전달 함수로서, 두 귀 간의 시간차와 두 귀 간의 레벨차, 귓바퀴의 형상(pinna)을 포함하여 소리가 전달되어 온 공간의 특성을 나타내는 많은 정보가 담겨 있을 수 있다. 특히 HRTF는 위와 아래의 음상 정위에 결정적인 영향을 미치는 귓바퀴에 대한 정보를 포함하며, 그 뒷바퀴에 대한 모델링이 쉽지 않아 주로 측정을 통해 획득될 수 있다.

상술한 바와 같이 중프로세서(130)는 역 음향 신호에 대해서는 빔 포밍을 이용하지 않고 HRTF를 이용할 수 있다. HRTF를 이용한 Crosstalk 제거 방식은 중저역 음향 신호에 대해서는 효과적이기 때문이다.

도 4에 도시된 실시 예에 따르면, 프로세서(130)는 전자 장치(100)를 기준으로 사용자의 방향(또는 사용자의 각도)을 식별할 수 있다(S410).

예를 들어, 프로세서(130)는 마이크 어레이(140)에 포함된 복수의 마이크를 통해 사용자 음성을 이용하여 사용자의 방향을 식별할 수 있다. 예를 들어, 사용자의 방향은 전자 장치(100)를 기준으로 사용자가 위치하는 각도일 수 있다. 여기에서, 사용자의 각도는 전자 장치(100)와 수평인 각도를 0도로 하고, 반시계 방향으로 각도가 360도(0도와 동일)까지 증가하는 형태일 수 있으나, 이에 한정되는 것은 아니다. 예를 들어, 사용자의 각도는 전자 장치(100)의 정면 방향을 0도로 하고 시계 방향을 + 방향, 반시계 방향을 - 방향으로 하여 180도까지 증가하는 형태일 수도 있다.

프로세서(130)는 고역 음향 신호에 대해 식별된 사용자의 방향에 대응되는 빔 포밍 필터를 적용할 수 있다(S420). 빔 포밍 필터는 음향 신호를 처리하여 특정한 위치에 포커싱시키기 위한 필터일 수 있다. 일 예에 따라 프로세서(130)는 사용자의 방향에 대응되는 필터 계수(또는 파라미터)를 식별하고, 식별된 필터 계수를 포함하는 빔 포밍 필터를 고역 음향 신호에 대해 적용할 수 있다. 다른 예에 따라 프로세서(130)는 사용자의 방향에 대응되는 기 설계된 빔 포밍 필터를 식별하고, 식별된 빔 포밍 필터를 고역 음향 신호에 대해 적용할 수 있다.

일 예에 따라 프로세서(130)는 사용자 방향에 기초하여 복수의 트위터 유닛 각각에 대응되는 빔 포밍 필터를 식별하고, 복수의 트위터 유닛 각각을 통해 출력되는 고역 음향 신호에 대응되는 빔 포밍 필터를 적용할 수 있다.

이어서, 프로세서(130)는 빔 포밍 필터가 적용된 R 채널 신호 및 L 채널 신호를 출력하도록 복수의 트위터 유닛을 제어할 수 있다(S430).

예를 들어, 프로세서(130)는 식별된 사용자 방향에 기초하여 고역 음향 신호에 대해 빔 포밍 필터를 적용하여 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 복수의 트위터 유닛을 제어할 수 있다.

또한, 프로세서(130)는 중저역 음향 신호에 대해 식별된 사용자의 방향에 대응되는 HRTF 필터를 적용할 수 있다(S440). 여기서, HRTF 필터란 HRTF 기능을 지원하는 필터일 수 있다. 일 예에 따라 프로세서(130)는 사용자의 방향에 대응되는 HRTF 필터 계수(또는 파라미터)를 식별하고, 식별된 필터 계수를 포함하는 HRTF 필터를 중저역 음향 신호에 대해 적용할 수 있다. 다른 예에 따라 프로세서(130)는 사용자의 방향에 대응되는 기 설계된 HRTF 필터를 식별하고, 식별된 HRTF 필터를 중저역 음향 신호에 대해 적용할 수 있다.

일 예에 따라 프로세서(130)는 사용자 방향에 기초하여 복수의 미드레인지 유닛 각각에 대응되는 HRTF 필터를 식별하고, 복수의 미드레인지 유닛 각각을 통해 출력되는 중저역 음향 신호에 대응되는 HRTF 필터를 적용할 수 있다.

이어서, 프로세서(130)는 HRTF 필터가 적용된 R 채널 신호 및 L 채널 신호를 출력하도록 복수의 미드레인지 유닛을 제어할 수 있다.

예를 들어, 프로세서(130)는 식별된 사용자 방향에 기초하여 R 채널 신호 및 L 채널 신호의 크로스토크가 제거되도록 HRTF 필터를 적용할 수 있다.

일 예에 따라 메모리(120)에는 복수의 사용자 방향 각각에 대응되는 빔 포밍 필터 및 복수의 사용자 방향 각각에 대응되는 HRTF 필터가 저장되어 있을 수 있다. 예를 들어, 메모리(120)에는 전자 장치(100)를 기준으로 제1 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제1 빔 포밍 필터 및 제1 방향과 상이한 제2 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제2 빔 포밍 필터가 저장되어 있을 수 있다. 이 경우, 제1 빔 포밍 필터 및 제2 빔 포밍 필터는 복수의 트위터 유닛 각각에 대응되는 필터를 포함할 수 있다.

또한, 메모리(120)에는 전자 장치(100)를 기준으로 제1 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제1 HRTF 필터 및 제1 방향과 상이한 제2 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제2 HRTF 필터가 저장되어 있을 수 있다. 이 경우, 제1 HRTF 필터 및 제2 HRTF 필터는 복수의 미드레인지 유닛 각각에 대응되는 필터를 포함할 수 있다.

도 5에 도시된 실시 예에 따르면, 프로세서(130)는 사용자 방향이 제1 방향에 대응되면(S510:Y), 복수의 트위터 유닛을 통해 출력되는 고역 음향 신호의 R 채널 신호 및 L 채널 신호에 제1 빔 포밍 필터를 적용할 수 있다(S520). 이에 따라 R 채널 신호가 제1 방향에 위치하는 사용자의 오른쪽 귀 방향으로 지향 출력되고 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력될 수 있다. 또한, 프로세서(130)는 복수의 미드레인지 유닛을 통해 출력되는 중저역 음향 신호의 R 채널 신호 및 L 채널 신호에 제1 HRTF 필터를 적용할 수 있다.

반면, 프로세서(130)는 사용자 방향이 제2 방향에 대응되면(S540:Y), 복수의 트위터 유닛을 통해 출력되는 고역 음향 신호의 R 채널 신호 및 L 채널 신호에 제2 빔 포밍 필터를 적용할 수 있다(S550). 이에 따라 R 채널 신호가 제2 방향에 위치하는 사용자의 오른쪽 귀 방향으로 지향 출력되고 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력될 수 있다. 또한, 프로세서(130)는 복수의 미드레인지 유닛을 통해 출력되는 중저역 음향 신호의 R 채널 신호 및 L 채널 신호에 제2 HRTF 필터를 적용할 수 있다.

일 예에 따라 메모리(120)에는 복수의 사용자 방향 각각에 대응되며, 복수의 트위터 유닛 각각에 대응되는 빔 포밍 필터 및 복수의 미드레인지 유닛 각각에 대응되는 HRTF 필터가 저장되어 있을 수 있다. 예를 들어, 메모리(120)에는 복수의 트위터 유닛 각각에 대해, 제1 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제1 빔 포밍 필터가 저장되어 있을 수 있다. 또한 메모리(120)에는 복수의 트위터 유닛 각각에 대해, 제2 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제2 빔 포밍 필터가 저장되어 있을 수 있다.

또한, 메모리(120)에는 복수의 미드레인지 유닛 각각에 대해, 제1 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제1 HRTF 필터가 저장되어 있을 수 있다. 또한 메모리(120)에는 복수의 미드레인지 유닛 각각에 대해, 제2 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제2 HRTF 필터가 저장되어 있을 수 있다.

프로세서(130)는 사용자 방향이 제1 방향으로 식별되면, 복수의 트위터 유닛 각각에 대응되는 R 채널 신호에 적용될 제1 빔 포밍 필터를 식별하고, 식별된 제1 빔 포밍 필터를 복수의 트위터 유닛 각각을 통해 출력될 R 채널 신호에 적용할 수 있다. 또한, 프로세서(130)는 복수의 트위터 유닛 각각에 대응되는 L 채널 신호에 적용될 제1 빔 포밍 필터를 식별하고, 식별된 제1 빔 포밍 필터를 복수의 트위터 유닛 각각을 통해 출력될 L 채널 신호에 적용할 수 있다.

또한, 프로세서(130)는 사용자 방향이 제1 방향으로 식별되면, 복수의 미드레인지 유닛 각각에 대응되는 R 채널 신호에 적용될 제1 HRTF 필터를 식별하고, 식별된 제1 HRTF 필터를 복수의 미드레인지 유닛 각각을 통해 출력될 R 채널 신호에 적용할 수 있다. 또한, 프로세서(130)는 복수의 미드레인지 유닛 각각에 대응되는 L 채널 신호에 적용될 제1 HRTF 필터를 식별하고, 식별된 제1 HRTF 필터를 복수의 미드레인지 유닛 각각을 통해 출력될 L 채널 신호에 적용할 수 있다.

프로세서(130)는 사용자 방향이 제2 방향으로 식별되면, 복수의 트위터 유닛 각각에 대응되는 R 채널 신호에 적용될 제2 빔 포밍 필터를 식별하고, 식별된 제2 빔 포밍 필터를 복수의 트위터 유닛 각각을 통해 출력될 R 채널 신호에 적용할 수 있다. 또한, 프로세서(130)는 복수의 트위터 유닛 각각에 대응되는 L 채널 신호에 적용될 제2 빔 포밍 필터를 식별하고, 식별된 제2 빔 포밍 필터를 복수의 트위터 유닛 각각을 통해 출력될 L 채널 신호에 적용할 수 있다.

또한, 프로세서(130)는 사용자 방향이 제2 방향으로 식별되면, 복수의 미드레인지 유닛 각각에 대응되는 R 채널 신호에 적용될 제2 HRTF 필터를 식별하고, 식별된 제2 HRTF 필터를 복수의 미드레인지 유닛 각각을 통해 출력될 R 채널 신호에 적용할 수 있다. 또한, 프로세서(130)는 복수의 트위터 유닛 각각에 대응되는 L 채널 신호에 적용될 제2 HRTF 필터를 식별하고, 식별된 제2 HRTF 필터를 복수의 미드레인지 유닛 각각을 통해 출력될 L 채널 신호에 적용할 수 있다.

일 예에 따라 메모리(120)는 복수의 사용자 방향에 대응되는 복수의 빔 포밍 필터 셋이 저장되어 있을 수 있다. 예를 들어, 빔 포밍 필터 셋에 포함된 빔 포밍 필터의 개수는 복수의 트위터 유닛의 개수와 동일할 수 있다. 또한, 빔 포밍 필터 셋에 포함된 복수의 빔 포밍 필터 각각은 복수의 트위터 유닛 각각에 대응될 수 있다. 즉, 빔 포밍 필터를 통과한 음향 신호는 빔 포밍 필터에 대응되는 트위터 유닛을 통해 출력될 수 있다.

즉, 음향 신호가 빔 포밍 필터 셋에 포함된 복수의 빔 포밍 필터를 통과한 후 복수의 트위터 유닛을 통해 출력되면, 출력된 음향 신호들 간의 중첩과 상쇄로 의해, 음향 신호가 빔 포밍 필터 셋에 대응되는 거리에 포커싱되도록 음장이 형성될 수 있다. 이를 위해, 음향 신호가 특정한 거리에 포커싱되도록, 빔 포밍 필터 셋에 포함된 복수의 빔 포밍 필터의 계수가 미리 결정될 수 있다.

이 경우, 메모리(120)는 복수의 사용자 방향 별로 R 채널 신호를 위한 빔 포밍 필터 셋 및 L 채널 신호를 위한 빔 포밍 필터 셋이 저장되어 있을 수 있다.

여기에서, R 채널 신호를 위한 빔 포밍 필터 셋에 포함된 복수의 빔 포밍 필터의 계수는 음향 신호가 전자 장치(100)를 기준으로 특정 방향에 위치한 사용자의 오른쪽 귀의 위치에 포커싱되도록 미리 결정될 수 있다. 또한, L 채널 신호를 위한 빔 포밍 필터 셋에 포함된 복수의 빔 포밍 필터의 계수는 음향 신호가 전자 장치(100)를 기준으로 특정 방향에 위치한 사용자의 왼쪽 귀 위치에 포커싱되도록 미리 결정될 수 있다.

이에 따라, R 채널 신호를 위한 빔 포밍 필터 셋을 통과한 후 출력된 R 채널 신호는 전자 장치(100)를 기준으로 특정 방향에 위치한 사용자의 오른쪽 귀로 들어가고, L 채널 신호를 위한 빔 포밍 필터 셋을 통과한 후 출력된 L 채널 신호는 전자 장치(100)로부터 특정한 거리만큼 떨어진 사용자의 왼쪽 귀로 들어갈 수 있게 된다.

프로세서(130)는 메모리(120)에 저장된 복수의 빔 포밍 필터 셋 중 전자 장치(100)를 기준으로 사용자의 방향에 대응되는 빔 포밍 필터 셋을 이용하여 R 채널 신호 및 L 채널 신호를 출력하도록 복수의 트위터 유닛을 제어할 수 있다.

이를 위해, 프로세서(130)는 메모리(120)에 저장된 복수의 빔 포밍 필터 셋 중 사용자의 방향에 대응되는 R 채널 신호를 위한 빔 포밍 필터 셋 및 L 채널 신호를 위한 빔 포밍 필터 셋을 식별할 수 있다.

그리고, 프로세서(130)는 R 채널 신호를 R 채널 신호를 위한 빔 포밍 필터 셋에 포함된 복수의 빔 포밍 필터에 각각 입력할 수 있다. 예를 들어, 프로세서(130)는 버퍼 등을 이용하여 R 채널 신호를 복수 개 생성하고, 복수의 R 채널 신호를 복수의 빔 포밍 필터에 입력할 수 있다. 이어서, 프로세서(130)는 복수의 빔 포밍 필터를 통과한 복수의 R 채널 신호를 복수의 트위터 유닛을 통해 출력할 수 있다.

또한, 프로세서(130)는 L 채널 신호를 L 채널 신호를 위한 빔 포밍 필터 셋에 포함된 복수의 빔 포밍 필터에 각각 입력할 수 있다. 예를 들어, 프로세서(130)는 버퍼 등을 이용하여 L 채널 신호를 복수 개 생성하고, 복수의 L 채널 신호를 복수의 빔 포밍 필터에 입력할 수 있다. 이어서, 프로세서(130)는 복수의 빔 포밍 필터를 통과한 복수의 L 채널 신호를 복수의 트위터 유닛을 통해 출력할 수 있다.

이에 따라, 전자 장치(100)에서 출력된 R, L 음향 신호는 각각 사용자의 우측 및 좌측에 포커싱되어, 사용자에게 입체 음향 효과를 제공할 수 있다.

프로세서(130)는 DOA(Direction of Arrival) 기법 등을 이용하여 사용자의 방향을 식별할 수 있다.

예를 들어, 프로세서(130)는 마이크 어레이(140)에 포함된 복수의 마이크를 통해 수신된 사용자 음성 신호를 분석하여 사용자의 발화 각도를 추정하고, 이에 기초하여 사용자 위치를 식별할 수 있다. 이 경우, 사용자 음성은 임의의 발화 또는 기 설정된 트리거 워드 중 적어도 하나를 포함할 수 있다.

DOA 기법은 마이크 어레이(140)에 포함된 복수의 마이크 중 각각의 마이크를 통해 수신되는 음성 신호 간의 상관 관계를 이용하여 음성 신호에 대한 방향 정보를 획득하는 기법이다. 구체적으로, DOA 기법에 따르면, 음성 신호가 복수의 마이크에 특정 입사각으로 수신되는 경우, 프로세서(130)는 각 마이크에 음성 신호가 도착하는 거리의 차이에 따른 지연 거리 및 지연 시간 등을 바탕으로 음성 신호의 입사각을 획득하고, 획득된 입사각을 바탕으로 수신된 음성 신호에 대한 방향 정보를 획득할 수 있다.

예를 들어, 프로세서(130)는 복수의 마이크를 통해 수신된 음성 신호를 지연시키고, 지연된 음성 신호들 간의 상호 상관 값을 산출할 수 있다. 이 경우, 프로세서(130)는 상호 상관 값이 최대가 되는 지연 시간을 결정할 수 있다. 그리고, 프로세서(130)는 결정된 지연 시간, 음성 신호의 속도(가령, 음속) 및 마이크 간의 거리를 이용하여 음성 신호의 입사각을 추정할 수 있다.

예를 들어, 프로세서(130)는 특정 방향의 음성 신호가 제1 마이크로 수신되는 제1 수신 시간 및 제2 마이크로 수신되는 제2 수신 시간과의 시간 차이에 기초하여 음성 신호가 수신되는 방향을 결정할 수 있다. 이를 위해, 메모리(120)에는 미리 측정된 수신 시간 차이 값과 수신 방향 상의 상관 관계 데이터가 저장되어 있을수 있다. 예를 들어, 프로세서(140)는 제1 수신 시간과 제2 수신 시간 사이의 수신 시간 차이(예를 들면, 0초)에 기초하여 모든 방향("0도"에서 "360" 사이의 방향) 중 해당 수신 시간 차이에 대응되는 특정 방향(예를 들면, "90도")을 상관 관계 데이터로부터 획득할 수 있다.

이 외에도, 프로세서(140)는 MUSIC(Multiple signal Classification), GCCPHAT(Generalized Cross Correlation with Phase Transform) 등과 같은 다양한 입사각 추정 알고리즘을 이용하여 음성 신호에 대한 방향 정보를 획득할 수 있다.

도 6a 및 도 6b는 일 실시 예에 따른 빔 포밍 구현 예를 설명하기 위한 도면들이다. 도 6a 및 도 6b에서는 이해를 돕기 위하여 음향 신호의 빔 포밍 특성을 빛의 형상으로 도시하였다.

도 6a에 도시된 바와 같이 스피커 어레이에 포함된 복수의 트위터 유닛에 빔 포밍을 적용하여 고역 음향 신호를 사용자의 왼쪽 귀 방향 및 오른 쪽 귀 방향 즉, 좁은 범위로 방사함으로써 높은 지향 특성을 가지게 됨으로써 크로스토크가 제거될 수 있게 된다.

도 6b는 도 1b에 도시된 바와 같이 5 개의 트위터 유닛을 이용하여 3kHz 신호에 대해 빔 포밍 시뮬레이션 한 결과를 나타낸다.

일 실시 예에 따르면 사용자의 위치에 따라 가변적으로 빔 포밍을 적용할 수 있다.

예를 들어, 도 7a 및 도 7b에 도시된 바와 같이 사용자가 전자 장치(100)를 기준으로 정면에 위치한 경우 및 우측 약 30도 방향으로 위치한 경우 각각에 대응되도록 복수의 트위터 유닛에 빔 포밍을 적용할 수 있다. 이에 따라 사용자 위치가 가변되더라도 사용자의 왼쪽 귀 방향 및 오른 쪽 귀 방향으로 고역 음향 신호가 방사되도록 하여 크로스토크가 제거될 수 있게 된다.

도 7c는 도 1b에 도시된 바와 같은 5개의 트위터 유닛을 이용하여 3kHz 신호에 대해 도 7b의 사용자 위치에서 빔 포밍 시뮬레이션한 결과를 나타낸다.

일 예에 따르면, 도 8a에 도시된 바와 같이 음원 위치를 기준으로 사용자 방향에 대응되는 HRTF 필터를 미리 설계하여 적용할 수 있다. 특히, 음원 위치를 기준으로 복수의 사용자 방향 각각 대응되는 HRTF 필터, 예를 들어, 각 트위터 유닛 별 필터 값이 미리 설계되어 있을 수 있다. 예를 들어, 실제 청취 공간에서의 HRTF의 Inverse Matrix가 필터 값으로 적용될 수 있다.

도 8b는 일 예시에 따른 HRTF(예를 들어, HRIR)를 나타내는 도면으로 Azimuth = 70 도, Elvation = 0에서의 L 채널 및 R 채널에 대응되는 HRIR을 나타낸다.

일 예에 따르면, 도 9a 및 도 9b에 도시된 바와 같이 사용자 방향에 대응되는 HRIR(Head Related Impulse Response)를 선택하고 딜레이를 조정하여 사용자 위치에 적합한 크로스토크 제거를 수행할 수 있다.

예를 들어, 주파수 f에서 선형 시간 불변 시스템의 전달 함수 H(f)는 H(f) = output(f) / input(f)으로 정의될 수 있다. 이에 따라 주어진 소스 위치로부터 HRTF를 얻기 위해 사용되는 일 방안은 소스에 배치된 임펄스 Δ(t)에 대해 고막에서 헤드 관련 임펄스 반응(HRIR), h(t)을 측정하는 것이다. HRTF H(f)는 HRIR h(t)의 푸리에 변환일 수 있다.

예를 들어 전자 장치(100)를 기준으로 중앙에서 멀어지는 방향일수록 사용자 기준 복수의 스피커 간 각도가 작아지게 되며, 한쪽 스피커의 거리가 점점 멀어지게 되면 게인 및/또는 딜레이 보정이 필요하게 된다. 다만, 사용자의 방향에 대응되도록 미리 산출된 값(예를 들어, 게인 및/또는 딜레이가 기 보정된 값)이 저장되어 있고 해당 방향에 대응되는 기 산출된 값을 그대로 적용할 수 있음은 물론이다.

상술한 다양한 실시 예들에 따르면, 체적이 작은 음향 재생 기기에 최적화된 크로스토크 제거 방법을 제공할 수 있다. 또한, 이어폰/헤드셋 착용시와 유사한 입체 음향 효과를 제공할 수 있게 된다. 또한, 이어폰/헤드셋 착용시 발생하는 답답함 없이 동일한 수준의 입체 음향 효과를 제공할 수 있게 된다.

한편, 상술한 본 개시의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 설치 가능한 어플리케이션 형태로 구현될 수 있다. 또는 상술한 본 개시의 다양한 실시 예들에 따른 방법들은 딥 러닝 기반의 인공 신경망(또는 심층 인공 신경망) 즉, 학습 네트워크 모델을 이용하여 수행될 수 있다.

또한, 상술한 본 개시의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 대한 소프트웨어 업그레이드, 또는 하드웨어 업그레이드 만으로도 구현될 수 있다.

또한, 상술한 본 개시의 다양한 실시 예들은 전자 장치에 구비된 임베디드 서버, 또는 전자 장치의 외부 서버를 통해 수행되는 것도 가능하다.

한편, 본 개시의 일시 예에 따르면, 이상에서 설명된 다양한 실시 예들은 기기(machine)(예: 컴퓨터)로 읽을 수 있는 저장 매체(machine-readable storage media)에 저장된 명령어를 포함하는 소프트웨어로 구현될 수 있다. 기기는, 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작이 가능한 장치로서, 개시된 실시 예들에 따른 전자 장치(예: 전자 장치(A))를 포함할 수 있다. 명령이 프로세서에 의해 실행될 경우, 프로세서가 직접, 또는 프로세서의 제어 하에 다른 구성요소들을 이용하여 명령에 해당하는 기능을 수행할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 신호(signal)를 포함하지 않으며 실재(tangible)한다는 것을 의미할 뿐 데이터가 저장매체에 반영구적 또는 임시적으로 저장됨을 구분하지 않는다.

또한, 본 개시의 일 실시 예에 따르면, 이상에서 설명된 다양한 실시 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 온라인으로 배포될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

또한, 상술한 다양한 실시 예들에 따른 구성 요소(예: 모듈 또는 프로그램) 각각은 단수 또는 복수의 개체로 구성될 수 있으며, 전술한 해당 서브 구성 요소들 중 일부 서브 구성 요소가 생략되거나, 또는 다른 서브 구성 요소가 다양한 실시 예에 더 포함될 수 있다. 대체적으로 또는 추가적으로, 일부 구성 요소들(예: 모듈 또는 프로그램)은 하나의 개체로 통합되어, 통합되기 이전의 각각의 해당 구성 요소에 의해 수행되는 기능을 동일 또는 유사하게 수행할 수 있다. 다양한 실시 예들에 따른, 모듈, 프로그램 또는 다른 구성 요소에 의해 수행되는 동작들은 순차적, 병렬적, 반복적 또는 휴리스틱하게 실행되거나, 적어도 일부 동작이 다른 순서로 실행되거나, 생략되거나, 또는 다른 동작이 추가될 수 있다.

이상에서는 본 개시의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시에 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.

Claims

전자 장치에 있어서,

복수의 스피커 유닛을 포함하는 스피커 어레이;

적어도 하나의 명령어를 저장하는 메모리; 및

상기 스피커 어레이 및 상기 메모리와 연결되어 상기 전자 장치를 제어하는 하나 이상의 프로세서;를 포함하며,

상기 복수의 스피커 유닛은,

임계 주파수 이상의 고역 음향 신호를 출력하는 복수의 트위터(tweeter) 유닛 및 상기 임계 주파수 미만의 중저역 음향 신호를 출력하는 복수의 미드레인지(midrange) 유닛을 포함하며,

상기 하나 이상의 프로세서는,

상기 적어도 하나의 명령어를 실행함으로써,

상기 고역 음향 신호에 대해 빔 포밍(Beam forming) 방식을 이용하여 R(Right) 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L(Left) 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어하고,

상기 중저역 음향 신호에 대해 심리 음향 모델을 이용하여 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어하는, 전자 장치.
제1항에 있어서,

상기 하나 이상의 프로세서는,

상기 전자 장치를 기준으로 사용자의 방향을 식별하고,

상기 고역 음향 신호에 대해 상기 식별된 사용자의 방향에 대응되는 빔 포밍 필터를 적용하고 상기 빔 포밍 필터가 적용된 R 채널 신호 및 L 채널 신호를 출력하도록 상기 복수의 트위터 유닛을 제어하고,

상기 중저역 음향 신호에 대해 상기 식별된 사용자의 방향에 대응되는 HRTF(Head Related Transfer Function) 필터를 적용하고, 상기 HRTF 필터가 적용된 R 채널 신호 및 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어하는, 전자 장치.
제2항에 있어서,

복수의 마이크를 포함하는 마이크 어레이;를 더 포함하며,

상기 하나 이상의 프로세서는,

상기 복수의 마이크를 통해 사용자 음성이 수신된 시간 차에 기초하여 상기 사용자의 방향을 식별하고,

상기 식별된 사용자 방향에 기초하여 상기 고역 음향 신호에 대해 빔 포밍 방식을 이용하여 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어하는, 전자 장치.
제3항에 있어서,

상기 메모리는,

상기 전자 장치를 기준으로 제1 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제1 빔 포밍 필터 및 상기 제1 방향과 상이한 제2 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제2 빔 포밍 필터를 저장하며,

상기 하나 이상의 프로세서는,

상기 사용자 방향이 상기 제1 방향에 대응되면, 상기 고역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제1 빔 포밍 필터를 적용하여 상기 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 상기 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어하고,

상기 사용자 방향이 상기 제2 방향에 대응되면, 상기 고역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제2 빔 포밍 필터를 적용하여 상기 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 상기 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어하는, 전자 장치.
제2항에 있어서,

상기 메모리는,

상기 전자 장치를 기준으로 제1 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제1 HRTF 필터 및 상기 제1 방향과 상이한 제2 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제2 HRTF 필터를 저장하며,

상기 하나 이상의 프로세서는,

상기 사용자 방향이 상기 제1 방향에 대응되면, 상기 중저역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제1 HRTF 필터를 적용하여 상기 제1 HRTF 필터가 적용된 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어하고,

상기 사용자 방향이 상기 제2 방향에 대응되면, 상기 중저역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제2 HRTF 필터를 적용하여 상기 제2 HRTF 필터가 적용된 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어하는, 전자 장치.
제1항에 있어서,

상기 복수의 스피커 유닛은,

상기 스피커 어레이의 중앙 부분에 배치된 복수의 제1 트위터 유닛, 상기 복수의 제1 트위터 유닛의 우측 및 좌측으로 이격 배치된 복수의 제2 트위터 유닛, 및 상기 복수의 제2 트위터 유닛 일측에 배치된 복수의 미드레인지 유닛을 포함하는, 전자 장치.
제6항에 있어서,

상기 복수의 제1 트위터 유닛은, 일렬로 배치된 3개의 트위터 유닛을 포함하고,

상기 복수의 제2 트위터 유닛은, 상기 3개의 트위터 유닛의 우측에 배치된 우측 트위터 유닛 및 상기 3개의 트위터 유닛의 좌측에 배치된 좌측 트위터 유닛을 포함하고,

상기 복수의 미드레인지 유닛은, 상기 우측 트위터 유닛의 우측에 배치된 제1 미드레인지 유닛 및 상기 좌측 트위터 유닛의 좌측에 배치된 제2 미드레인지 유닛을 포함하는, 전자 장치.
제1항에 있어서,

상기 하나 이상의 프로세서는,

음향 신호에 대해 하이 패스 필터(High Pass Filter)를 적용하여 상기 고역 음향 신호를 획득하고, 상기 음향 신호에 대해 로우 패스 필터(Low Pass Filter)를 적용하여 상기 중저역 음향 신호를 획득하는, 전자 장치.
복수의 스피커 유닛을 포함하는 스피커 어레이를 포함하는 전자 장치의 음향 출력 방법에 있어서,

임계 주파수 이상의 고역 음향 신호에 대해 빔 포밍(Beam forming) 방식을 이용하여 R(Right) 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L(Left) 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 복수의 트위터 유닛을 제어하는 단계; 및

상기 임계 주파수 미만의 중저역 음향 신호에 대해 심리 음향 모델을 이용하여 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 복수의 미드레인지 유닛을 제어하는 단계;를 포함하는 음향 출력 방법.
제9항에 있어서,

상기 전자 장치를 기준으로 사용자의 방향을 식별하는 단계;를 더 포함하며,

상기 복수의 트위터 유닛을 제어하는 단계는,

상기 고역 음향 신호에 대해 상기 식별된 사용자의 방향에 대응되는 빔 포밍 필터를 적용하고 상기 빔 포밍 필터가 적용된 R 채널 신호 및 L 채널 신호를 출력하도록 상기 복수의 트위터 유닛을 제어하고,

상기 복수의 미드레인지 유닛을 제어하는 단계는,

상기 중저역 음향 신호에 대해 상기 식별된 사용자의 방향에 대응되는 HRTF(Head Related Transfer Function) 필터를 적용하고, 상기 HRTF 필터가 적용된 R 채널 신호 및 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어하는, 음향 출력 방법.
제10항에 있어서,

상기 전자 장치는, 복수의 마이크를 포함하는 마이크 어레이;를 더 포함하며,

상기 사용자 방향을 식별하는 단계는,

상기 복수의 마이크를 통해 사용자 음성이 수신된 시간 차에 기초하여 상기 사용자의 방향을 식별하고,

상기 복수의 트위터 유닛을 제어하는 단계는,

상기 식별된 사용자 방향에 기초하여 상기 고역 음향 신호에 대해 빔 포밍 방식을 이용하여 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어하는, 음향 출력 방법.
제11항에 있어서,

상기 전자 장치는,

상기 전자 장치를 기준으로 제1 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제1 빔 포밍 필터 및 상기 복수의 트위터 유닛을 제어하는 단계는, 상기 제1 방향과 상이한 제2 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제2 빔 포밍 필터를 저장하며,

상기 복수의 트위터 유닛을 제어하는 단계는,

상기 사용자 방향이 상기 제1 방향에 대응되면, 상기 고역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제1 빔 포밍 필터를 적용하여 상기 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 상기 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어하는 단계; 및

상기 사용자 방향이 상기 제2 방향에 대응되면, 상기 고역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제2 빔 포밍 필터를 적용하여 상기 R 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 상기 L 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 상기 복수의 트위터 유닛을 제어하는 단계;를 포함하는, 음향 출력 방법.
제10항에 있어서,

상기 전자 장치는,

상기 전자 장치를 기준으로 제1 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제1 HRTF 필터 및 상기 제1 방향과 상이한 제2 방향의 R 채널 신호 및 L 채널 신호에 각각에 대응되는 제2 HRTF 필터를 저장하며,

상기 복수의 미드레인지 유닛을 제어하는 단계는,

상기 사용자 방향이 상기 제1 방향에 대응되면, 상기 중저역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제1 HRTF 필터를 적용하여 상기 제1 HRTF 필터가 적용된 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어하는 단계; 및

상기 사용자 방향이 상기 제2 방향에 대응되면, 상기 중저역 음향 신호의 상기 R 채널 신호 및 상기 L 채널 신호에 상기 제2 HRTF 필터를 적용하여 상기 제2 HRTF 필터가 적용된 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 상기 복수의 미드레인지 유닛을 제어하는 단계;를 포함하는, 음향 출력 방법.
제9항에 있어서,

상기 복수의 스피커 유닛은,

상기 스피커 어레이의 중앙 부분에 배치된 복수의 제1 트위터 유닛, 상기 복수의 제1 트위터 유닛의 우측 및 좌측으로 이격 배치된 복수의 제2 트위터 유닛, 및 상기 복수의 제2 트위터 유닛 일측에 배치된 복수의 미드레인지 유닛을 포함하는, 음향 출력 방법.
복수의 스피커 유닛을 포함하는 스피커 어레이를 포함하는 전자 장치의 하나 이상의 프로세서에 의해 실행되는 경우 상기 전자 장치가 동작을 수행하도록 하는 컴퓨터 명령을 저장하는 비일시적 컴퓨터 판독 가능 매체에 있어서,

상기 동작은,

임계 주파수 이상의 고역 음향 신호에 대해 빔 포밍(Beam forming) 방식을 이용하여 R(Right) 채널 신호가 사용자의 오른쪽 귀 방향으로 지향 출력되고 L(Left) 채널 신호가 사용자의 왼쪽 귀 방향으로 지향 출력되도록 복수의 트위터 유닛을 제어하는 단계; 및

상기 임계 주파수 미만의 중저역 음향 신호에 대해 심리 음향 모델을 이용하여 상기 R 채널 신호 및 상기 L 채널 신호를 출력하도록 복수의 미드레인지 유닛을 제어하는 단계;를 포함하는, 비일시적 컴퓨터 판독 가능 매체.