KR20230071003A - 전자 장치 및 전자 장치의 동작 방법 - Google Patents
전자 장치 및 전자 장치의 동작 방법 Download PDFInfo
- Publication number
- KR20230071003A KR20230071003A KR1020220005476A KR20220005476A KR20230071003A KR 20230071003 A KR20230071003 A KR 20230071003A KR 1020220005476 A KR1020220005476 A KR 1020220005476A KR 20220005476 A KR20220005476 A KR 20220005476A KR 20230071003 A KR20230071003 A KR 20230071003A
- Authority
- KR
- South Korea
- Prior art keywords
- electronic device
- microphones
- input
- signal
- microphone
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 26
- 238000011017 operating method Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims 1
- 238000004891 communication Methods 0.000 description 54
- 238000012545 processing Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003155 kinesthetic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/403—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Otolaryngology (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
일 실시예에 따른 전자 장치는 전자 장치에서 상이한 위치들에 배치된 복수의 마이크들, 마이크들 각각에 입력되는 입력 신호들을 수집하고, 입력 신호들로부터 마이크들 각각에 대응하는 DOA 정보를 획득하고, DOA 정보를 이용하여 입력 신호들의 발생 방향들을 산출하고, 입력 신호들의 발생 방향들에 기초하여 마이크들 별 입력 신호의 가중치를 조절하고, 마이크들 별로 조절된 가중치를 반영하여 마이크들 별 출력 신호를 생성하는 프로세서, 및 마이크들 별 출력 신호를 출력하는 스피커를 포함할 수 있다.
Description
아래의 개시는 전자 장치 및 전자 장치의 동작 방법에 관한 것이다.
전자 장치를 이용한 통화 시에 화자의 목소리 외에 다양한 원인에 의한 노이즈 신호 및/또는 에코 신호가 발생할 수 있다. 이러한 노이즈 신호 및/또는 에코 신호는 통화 품질에 영향을 주어 성능 열화를 발생시킬 수 있으므로 노이즈 신호 및/또는 에코 신호의 제거를 통해 강건성을 확보할 수 있다.
노이즈 신호는 DOA(direction of arrival) 정보가 없는 확산 노이즈(diffuse noise) 신호와 DOA 정보가 있는 간섭 노이즈(interference noise) 신호로 구분될 수 있다. 이 중 DOA 정보가 없는 확산 노이즈 신호는 빔포밍(beamforing)에 의해 제거될 수 있지만, 예를 들어, 근접한 사람 목소리, 또는 TV 드라마 소리와 같이 DOA 정보가 있는 간섭 노이즈 신호는 제거가 불가능하다.
본 발명의 다양한 실시예에 따르면, DOA(Direction of arrival) 정보를 이용하여 전자 장치를 이용한 영상 통화 시에 화자의 음성 신호 이외의 지향성 노이즈 신호를 원활하게 제거할 수 있다.
본 발명의 다양한 실시예에 따르면, 전자 장치에서의 마이크들의 실장 위치로 인한 성능 열화를 개선할 수 있다.
본 발명의 다양한 실시예에 따르면, 전자 장치에서 에코 신호로 인한 성능 열화를 개선할 수 있다.
일 실시예에 따르면, 전자 장치는 상기 전자 장치에서 상이한 위치들에 배치된 복수의 마이크들, 상기 마이크들 각각에 입력되는 입력 신호들을 수집하고, 상기 입력 신호들로부터 상기 마이크들 각각에 대응하는 DOA(direction of arrival) 정보를 획득하고, 상기 DOA 정보를 이용하여 상기 입력 신호들의 발생 방향들을 산출하고, 상기 입력 신호들의 발생 방향들에 기초하여, 상기 마이크들 별 입력 신호의 가중치를 조절하고, 상기 마이크들 별로 조절된 가중치를 반영하여 상기 마이크들 별 출력 신호를 생성하는 프로세서, 및 상기 마이크들 별 출력 신호를 출력하는 스피커를 포함할 수 있다.
일 실시예에 따르면, 복수의 마이크들을 포함하는 전자 장치의 동작 방법은 상기 전자 장치에서 상이한 위치들에 배치된 마이크들 각각에 입력되는 입력 신호들을 수집하는 동작, 상기 입력 신호들로부터 상기 마이크들 각각에 대응하는 DOA 정보를 획득하는 동작, 상기 DOA 정보를 이용하여 상기 입력 신호들의 발생 방향들을 산출하는 동작, 상기 입력 신호들의 발생 방향들에 기초하여, 상기 마이크들 별 입력 신호의 가중치를 조절하는 동작, 및 상기 마이크들 별로 조절된 가중치를 반영하여 상기 마이크들 별 출력 신호를 생성하는 동작, 및 상기 마이크들 별 출력 신호를 출력하는 동작을 포함할 수 있다.
일 실시예에 따른 전자 장치는 복수의 마이크들에 대응하는 DOA 정보를 이용하여 화자의 음성 신호 이외의 지향성 노이즈를 제거할 수 있다.
일 실시예에 따른 전자 장치는 복수의 마이크들에 대응하는 DOA 정보에 기초하여 산출한 입력 신호들의 발생 방향에 의해 화자의 위치가 아닌 방향에서 발생한 신호에 대한 마이크들 별 입력 신호의 가중치를 조절하여 간섭 노이즈를 추가로 제거함으로써 통화 품질을 개선할 수 있다.
일 실시예에 따른 전자 장치는 에코 참조 정보에 의해 입력 신호에 에코 신호가 포함되어 있는지 여부를 결정하고, 에코 신호의 DOA 정보를 제거하여 화자의 음성 신호에 해당하는 신호의 DOA 정보를 획득되도록 함으로써 에코 신호에 의한 성능 열화를 개선할 수 있다.
도 1은 다양한 실시예들에 따른 네트워크 환경 내의 전자 장치의 블록도이다.
도 2는 일 실시예에 따른 전자 장치의 블록도이다.
도 3은 일 실시예에 따른 전자 장치의 동작 방법을 나타낸 흐름도이다.
도 4는 일 실시예에 따른 DOA 정보를 이용하여 입력 신호들의 발생 방향들을 산출하는 방법을 설명하기 위한 도면이다.
도 5는 일 실시예에 따라 마이크들 별 출력 신호를 생성하는 방법을 설명하기 위한 도면이다.
도 6은 일 실시예에 따른 가중치 테이블(600)의 일 예시를 도시한 도면이다.
도 7은 다른 실시예에 따른 전자 장치의 동작 방법을 나타낸 흐름도이다.
도 8은 일 실시예에 따른 에코(echo) 신호의 일 예시를 나타낸 그래프이다.
도 9는 다른 실시예에 따른 전자 장치의 동작 방법을 나타낸 흐름도이다.
도 2는 일 실시예에 따른 전자 장치의 블록도이다.
도 3은 일 실시예에 따른 전자 장치의 동작 방법을 나타낸 흐름도이다.
도 4는 일 실시예에 따른 DOA 정보를 이용하여 입력 신호들의 발생 방향들을 산출하는 방법을 설명하기 위한 도면이다.
도 5는 일 실시예에 따라 마이크들 별 출력 신호를 생성하는 방법을 설명하기 위한 도면이다.
도 6은 일 실시예에 따른 가중치 테이블(600)의 일 예시를 도시한 도면이다.
도 7은 다른 실시예에 따른 전자 장치의 동작 방법을 나타낸 흐름도이다.
도 8은 일 실시예에 따른 에코(echo) 신호의 일 예시를 나타낸 그래프이다.
도 9는 다른 실시예에 따른 전자 장치의 동작 방법을 나타낸 흐름도이다.
이하, 실시예들을 첨부된 도면들을 참조하여 상세하게 설명한다. 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고, 이에 대한 중복되는 설명은 생략하기로 한다.
도 1은, 다양한 실시예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다. 도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108) 중 적어도 하나와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일 실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 전자 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 전자 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 모듈(150)은, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(155)은 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 지문 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 또는 인증할 수 있다.
무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 전자 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일실시예에 따르면, 무선 통신 모듈(192)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.
다양한 실시예에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일실시예에 따르면, 명령 또는 데이터는 제2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다.
일실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제2 네트워크(199) 내에 포함될 수 있다. 전자 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
도 2는 일 실시예에 따른 전자 장치의 블록도이다. 도 2를 참조하면, 일 실시예에 따른 전자 장치(200)(예: 도 1의 전자 장치(101))는 복수의 마이크들(210)(예: 도 1의 입력 모듈(150)), 프로세서(220)(예: 도 1의 프로세서(120)), 스피커(230)(예: 도 1의 음향 출력 모듈(150)), 메모리(240)(예: 도 1의 메모리(130)) 및 통신 인터페이스(250)(예: 도 1의 통신 모듈(190))를 포함할 수 있다. 복수의 마이크들(210), 프로세서(220), 스피커(230), 메모리(240) 및 통신 인터페이스(250)는 예를 들어, 통신 버스(205)를 통해 서로 통신할 수도 있고, 또는 마이크들(210), 프로세서(220), 스피커(230), 메모리(240) 및 통신 인터페이스(250) 각각에게 할당된 IP(Internet Protocol)를 통해 서로 통신할 수도 있다.
복수의 마이크들(210)은 전자 장치(200)에서 상이한 위치들에 배치되어 입력 신호들을 수신할 수 있다. 복수의 마이크들(210)이 배치되는 상이한 위치들은 예를 들어, 전자 장치의 전면 상단 및/또는 하단의 제1 위치, 전자 장치의 좌/우 측면의 제2 위치, 및 전자 장치의 후면 상단 및/또는 하단의 제3 위치를 포함할 수 있으며, 반드시 이에 한정되지는 않는다. 복수의 마이크들(210) 중 제1 위치에 배치된 마이크를 '제1 마이크'라 부르고, 제1 마이크에 입력되는 신호를 '제1 입력 신호'라 부를 수 있다. 복수의 마이크들(210) 중 제2 위치에 배치된 마이크를 '제2 마이크'라 부르고, 제2 마이크에 입력되는 신호를 '제2 입력 신호'라 부를 수 있다. 복수의 마이크들(210) 중 제3 위치에 배치된 마이크를 '제3 마이크'라 부르고, 제3 마이크에 입력되는 신호를 '제3 입력 신호'라 부를 수 있다. 복수의 마이크들(210)의 개수는 예를 들어, 세 개 이상일 수 있으며, 반드시 이에 한정되지는 않는다.
프로세서(220)는 마이크들(210) 각각에 입력되는 입력 신호들을 수집할 수 있다. 프로세서(220)는 입력 신호들로부터 마이크들(210) 각각에 대응하는 DOA(direction of arrival) 정보를 획득할 수 있다. 프로세서(220)는 DOA 정보를 이용하여 입력 신호들의 발생 방향들을 산출할 수 있다. 프로세서(220)가 DOA 정보를 이용하여 입력 신호들의 발생 방향들을 산출하는 방법은 아래의 도 4를 참조하여 보다 구체적으로 설명한다.
프로세서(220)는 입력 신호들의 발생 방향들에 기초하여, 마이크들(210) 별 입력 신호의 가중치를 조절할 수 있다. 프로세서(220)는 입력 신호들의 발생 방향들에 기초하여, 예를 들어, 전자 장치(200)에 대응하는 화자(예: 도 5의 화자(501)의 위치가 아닌 방향에서 발생한 입력 신호의 가중치를 기준치보다 작게 보정하고, 화자(501)의 위치에 해당하는 방향에서 발생한 입력 신호의 가중치를 기준치보다 크게 보정할 수 있다. 여기서, '전자 장치(200)에 대응하는 화자(501)의 위치'는 예를 들어, 화자(501)가 영상 통화를 위해 전자 장치(200)의 전면에 배치된 카메라(예: 도 1의 카메라 모듈(180)) 및/또는 디스플레이(예: 도 1의 디스플레이 모듈(160))의 정면을 바라보는 위치로 이해될 수 있다. 전자 장치(200)에 대응하는 화자(501)의 위치는 예를 들어, 고정된 위치일 수도 있고, 또는 이동하는 위치일수도 있다.
또는 프로세서(220)는 입력 신호들의 발생 방향들에 기초하여, 마이크들(210) 중 제1 위치에 배치된 제1 마이크에 대한 제1 입력 신호 및 제1 위치와 상이한 제2 위치에 배치된 제2 마이크에 대한 제2 입력 신호가 모두 전자 장치(200)에 대응하는 화자(501)의 위치에 해당하는 방향에서 발생한 경우, 제1 입력 신호의 가중치 및 제2 입력 신호의 가중치를 동일하게 설정할 수 있다.
프로세서(220)는 마이크들(210) 별로 조절된 가중치를 반영하여 마이크들(210) 별 출력 신호를 생성할 수 있다.
프로세서(220)는 예를 들어, 전자 장치(200)에 대응하는 화자(501)의 위치를 제외한 나머지 위치들(예: 전면 상단부, 측면 및 후면)의 마이크들(210)의 DOA 정보를 이용하여 소리가 발생하는 방향을 계산하고, 소리가 발생한 방향을 기초로 화자(501)의 위치가 아닌 방향에서 발생한 신호에 대한 마이크들(210) 별 입력 신호의 가중치를 조절하여 간섭 노이즈를 추가로 제거함으로써 통화 품질을 개선할 수 있습니다. 프로세서(220)가 마이크들(210) 별 출력 신호를 생성하는 방법은 아래의 도 5를 참조하여 보다 구체적으로 설명한다.
프로세서(220)는 예를 들어, 입력 신호들의 발생 방향들에 해당하는 마이크들(210)을 위해 미리 마련된 가중치 테이블(예: 도 6의 가중치 테이블(600))에 기초하여 마이크들(210) 별 입력 신호의 가중치를 조절할 수 있다. 프로세서(220)는 가중치 테이블(600)에서 전자 장치에 대응하는 화자(501)의 위치에 대비되는 제2 마이크의 위치에 따라 제2 마이크의 입력 신호의 가중치를 조절할 수 있다. 여기서, 프로세서(220)는 입력 신호들의 발생 방향들에 해당하는 마이크들(210)을 위해 미리 마련된 가중치 테이블(600)에 기초하여 마이크들 별 입력 신호의 가중치를 조절할 수 있다. 프로세서(220)가 가중치 테이블(600)을 이용하여 마이크들 별 입력 신호의 가중치를 조절하여 출력 신호를 생성하는 실시예는 아래의 도 7을 참조하여 보다 구체적으로 설명한다.
실시예에 따라서, 프로세서(220)는 입력 신호에 에코(Echo) 신호가 포함되어 있는지 여부를 결정할 수 있다. '에코 신호'는 대화 상대방으로부터 수신된 신호가 전자 장치의 스피커로 전달되어야 하지만, 의도하지 않게 마이크로 잘못 전달된 신호를 지칭하는 것으로 이해될 수 있다. 일 실시예에서 스피커(230)의 위치가 고정되므로 에코 신호의 DOA 정보 또한 고정될 수 있다. 에코 신호에 대하여는 아래의 도 8을 참조하여 보다 구체적으로 설명한다.
프로세서(220)는 예를 들어, 미리 설정된 에코 참조(Echo reference) 정보를 이용하여 입력 신호에 에코 신호가 포함되어 있는지 여부를 결정할 수 있다. 에코 참조 정보에는 입력 신호에 에코 신호가 있는지 여부 및 해당 에코 신호가 어느 것인지를 미리 알 수 있는 정보가 포함될 수 있다. 에코 참조 정보는 예를 들어, 에코 신호의 입력 시간 및 에코 신호의 DOA 정보 중 적어도 하나를 포함할 수 있으며, 반드시 이에 한정되지는 않는다.
프로세서(220)는 에코 참조 정보에 의해 입력 신호들 중 적어도 하나의 입력 신호에 에코 신호가 포함되는지 여부를 파악할 수 있다. 프로세서(220)는 입력 신호들 중 적어도 하나의 입력 신호에 에코 신호가 포함된 것으로 결정되면, 해당 입력 신호에서 에코 신호의 DOA 정보를 제거하여 마이크들(210) 각각에 대응하는 DOA 정보를 획득할 수 있다. 프로세서(220)가 입력 신호에서 에코 신호를 제거하는 실시예는 아래의 도 9를 참조하여 보다 구체적으로 설명한다.
스피커(230)는 프로세서(220)가 생성한 마이크들 별 출력 신호를 출력할 수 있다. 스피커(230)의 개수는 단수일 수 있고, 또는 복수일 수도 있다.
메모리(240)는 프로세서(220)가 획득한 마이크들(210) 각각에 대응하는 DOA 정보를 저장할 수 있다. 메모리(240)는 프로세서(220)가 산출한 입력 신호들의 발생 방향을 저장할 수 있다. 또한, 메모리(240)는 프로세서(220)가 생성한 마이크들(210) 별 출력 신호를 저장할 수 있다.
이 밖에도, 메모리(240)는 상술한 프로세서(220)의 처리 과정에서 생성되는 다양한 정보를 저장할 수 있다. 이 밖에도, 메모리(240)는 각종 데이터와 프로그램 등을 저장할 수 있다. 메모리(240)는 휘발성 메모리 또는 비휘발성 메모리를 포함할 수 있다. 메모리(240)는 하드 디스크 등과 같은 대용량 저장 매체를 구비하여 각종 데이터를 저장할 수 있다.
실시예에 따라서, 통신 인터페이스(250)는 프로세서(220)가 산출한 마이크들(210) 각각에 대응하는 DOA 정보, 입력 신호들의 발생 방향들 및/또는 프로세서(220)가 생성한 마이크들(210) 별 출력 신호를 전자 장치(200)의 외부로 전송할 수 있다.
또한, 프로세서(220)는 도 2 내지 도 9를 통해 후술하는 적어도 하나의 방법 또는 적어도 하나의 방법에 대응되는 기법을 수행할 수 있다. 프로세서(220)는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 전자 장치일 수 있다. 예를 들어, 목적하는 동작들은 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다. 예를 들어, 하드웨어로 구현된 전자 장치(200)는 마이크로프로세서(microprocessor), 중앙 처리 장치(Central Processing Unit; CPU), 그래픽 처리 장치(Graphic Processing Unit; GPU), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array), NPU(Neural Processing Unit) 등을 포함할 수 있다.
도 3은 일 실시예에 따른 전자 장치의 동작 방법을 나타낸 흐름도이다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다.
도 3을 참조하면, 일 실시예에 따른 복수의 마이크들(예: 도 1의 입력 모듈(150), 도 2의 복수의 마이크들(210))을 포함하는 전자 장치(예: 도 1의 전자 장치(101), 도 2의 전자 장치(200))는 동작 310 내지 동작 350을 통해 마이크들 별 출력 신호를 출력할 수 있다.
동작 310에서, 전자 장치(200)는 전자 장치(200)에서 상이한 위치들에 배치된 마이크들(210) 각각에 입력되는 입력 신호들을 수집할 수 있다. 상이한 위치들은 예를 들어, 전자 장치(200)의 전면 중심부의 제1 위치, 전자 장치(200)의 측면의 제2 위치, 및 전자 장치(200)의 후면의 제3 위치를 포함할 수 있으며, 반드시 이에 한정되지는 않는다.
동작 320에서, 전자 장치(200)는 동작 310에서 수집한 입력 신호들로부터 마이크들(210) 각각에 대응하는 DOA 정보를 획득할 수 있다. 전자 장치(200)는 예를 들어, 상이한 위치들에 배치된 3개 이상의 마이크들(210)로 입력되는 신호들의 위상 차를 이용하여 마이크들(210) 각각에 대응하는 DOA 정보를 산출할 수 있다. 전자 장치(200)는 입력 신호에 에코 신호가 포함되어 있는지 여부를 결정할 수 있다. 전자 장치(200)는 예를 들어, 미리 설정된 에코 참조 정보를 이용하여 입력 신호에 에코 신호가 포함되어 있는지 여부를 결정할 수 있다. 에코 참조 정보는 예를 들어, 에코 신호의 입력 시간 및 에코 신호의 DOA 정보 중 적어도 하나를 포함할 수 있다. 전자 장치(200)는 입력 신호들 중 적어도 하나의 입력 신호에 에코 신호가 포함된 것으로 결정되면, 해당 입력 신호에서 에코 신호의 DOA 정보를 제거할 수 있다.
동작 330에서, 전자 장치(200)는 DOA 정보를 이용하여 입력 신호들의 발생 방향들을 산출할 수 있다. 전자 장치(200)는 예를 들어, 화상 통화 시에 화자(예: 도 5의 화자(501))가 전자 장치(200)의 전면에 대해 위치할 가능성이 있는 범위(예를 들어, 전자 장치(200)의 전면 중심부 대비 ±30도 범위, 또는 ± 90 도 범위)를 미리 정의해 두고, 해당 각도 범위 내에서 수신되는 신호를 '인-빔(In-Beam) 신호'라고 정의할 수 있다.
동작 340에서, 전자 장치(200)는 동작 330에서 산출한 입력 신호들의 발생 방향들에 기초하여, 마이크들(210) 별 입력 신호의 가중치를 조절할 수 있다.
동작 350에서, 전자 장치(200)는 동작 340에서 조절된 마이크들(210) 별 입력 신호의 가중치를 반영하여 마이크들(210) 별 출력 신호를 생성할 수 있다.
전자 장치(200)는 DOA 정보에 의해 입력 신호들이 인-빔 신호에 해당하는지 여부에 의해 마이크들(210) 별 출력 신호를 생성할 수 있다. 전자 장치(200)는 입력 신호들의 발생 방향들 중 인-빔 신호에 해당하는 신호는 화자의 음성 신호라고 결정하고, 인-빔 신호에 해당하지 않는 신호는 화자의 음성 신호가 아닌 간섭 노이즈 신호라고 결정할 수 있다.
예를 들어, 동작 330에서 입력 신호들이 인-빔 신호에 해당한다고 결정된 경우, 전자 장치(200)는 동작 340에서 가중치 고려없이 각 마이크에 대한 입력 신호들을 필터링하여 단순히 합산하는 방식(예: FSB(Filter Sum Beamforming) 방식)으로 마이크들(210) 별 출력 신호를 생성할 수 있다. 또는 동작 330에서 입력 신호들이 인-빔 신호에 해당하지 않는다고 결정된 경우, 전자 장치(200)는 동작 340에서 입력 신호들의 발생 방향들에 기초하여, 마이크들(210) 별 입력 신호의 가중치를 조절할 수 있다. 전자 장치(200)는 예를 들어, 입력 신호들의 발생 방향들에 기초하여, 전자 장치(200)에 대응하는 화자의 위치가 아닌 방향에서 발생한 입력 신호의 가중치를 기준치보다 크게 보정하고, 화자의 위치에 해당하는 방향에서 발생한 입력 신호의 가중치를 기준치보다 작게 보정할 수 있다. 전자 장치는 마이크들(210) 별로 조절된 가중치를 반영하여 마이크들(210) 별 출력 신호를 생성할 수 있다.
또는 전자 장치(200)는 입력 신호들의 발생 방향들에 해당하는 마이크들(210)을 위해 미리 마련된 가중치 테이블(600)에 기초하여 마이크들(210) 별 입력 신호의 가중치를 조절할 수 있다. 전자 장치(200)는 가중치 테이블(600)에서 전자 장치(200)에 대응하는 화자의 위치에 대비되는 제2 마이크의 위치에 따라 제2 마이크의 입력 신호의 가중치를 조절할 수 있다. 전자 장치(200)가 가중치 테이블(600)에 기초하여 가중치를 조절하는 방법은 아래의 도 6 및 도 7을 참조하여 보다 구체적으로 설명한다.
동작 350에서, 전자 장치(200)는 동작 340에서 생성한 마이크들(210) 별 출력 신호를 출력할 수 있다.
도 4는 일 실시예에 따른 DOA 정보를 이용하여 입력 신호들의 발생 방향들을 산출하는 방법을 설명하기 위한 도면이다. 도 4를 참조하면, 일 실시예에 따라 음성 소스(acoustic source)(405)로부터 마이크들(410, 420)에 입력되는 입력 신호들의 발생 방향에 해당하는 각도()[rad], 마이크들(410, 420) 간의 거리(D)[m] 및 도달 경로 차이()[m]가 도시된다.
예를 들어, 음성 소스(405)로부터 전달된 입력 신호들이 마이크들(410, 420)에 도달하는 시간에는 차이가 있고, 이에 따라 각 마이크에 입력되는 입력 신호들 간에는 위상차가 발생할 수 있다. 전자 장치(예: 도 1의 전자 장치(101), 도 2의 전자 장치(200))는 마이크들(410, 420)에 도달하는 입력 신호들의 위상차에 의해 마이크들(410, 420)에 대해 음성 소스(405)가 위치하는 방향(각도)를 산출할 수 있다.
두 개의 마이크들(제1 마이크(410), 제2 마이크(420))에 입력된 신호들의 위상차의 분산(variance)는 마이크들(410,420) 간의 거리(D)가 길수록 커질 수 있다. 또한, 마이크들(410,420)에서 음성 소스(405)까지의 각도()가 증가할수록 분산도 증가할 수 있다.
전자 장치(200)는 이러한 결과를 기초로, 마이크들(410,420)에 입력되는 신호들에 대한 위상차의 분산을 계산함으로써 마이크들(410,420) 간의 거리(D)를 검출할 수 있다. 여기서, 마이크들(410,420)에 입력되는 신호들에 대한 위상차는 ⅰ) 선형 곡선이지만 2π이내로 감싸지고, ⅱ) 주파수가 감소하면 0에 근접한다는 특성을 가질 수 있다.
따라서, 마이크들(410,420)에 입력되는 신호들에 대한 위상차를 표현하는 가능한 선형 곡선은 예를 들어, 아래의 수학식 1과 같은 형태로 표현될 수 있다.
전자 장치(200)는 전술한 내용을 기초로, 음성 소스(405)로부터 마이크들(410,420)에 입력되는 입력 신호들의 발생 방향들을 산출할 수 있다.
여기서, 는 마이크들(410,420)에 입력 신호가 도달하는 도착 시간의 차이에 해당하고, c[m/s]는 마이크들(410,420)에 입력되는 신호의 속도(sound speed)에 해당할 수 있다. 전술한 기울기()를 사용하면, 도착 시간의 차이()는 와 같이 나타낼 수 있다.
전자 장치(200)는 입력 신호들의 발생 방향에 해당하는 각도()에 의해 마이크들의 위치들(예를 들어, 전자 장치(200)의 전면, 좌/우 측면, 및 후면)을 구분하고, 화자(예: 도 5의 화자(501))의 위치가 아닌 방향에서 입력되는 간섭 노이즈를 제거하여 통화 품질을 개선할 수 있다.
도 5는 일 실시예에 따라 마이크들 별 출력 신호를 생성하는 방법을 설명하기 위한 도면이다. 도 5를 참조하면, 일 실시예에 따른 전자 장치(500)(예: 도 1의 전자 장치(101), 도 2의 전자 장치(200)))를 이용하여 화상 통화를 수행하는 화자(speaker)(501)의 다양한 위치들을 나타낸 도면들(530,540,550)이 도시된다. 전자 장치(200)는 예를 들어, 태블릿(Tablet)이거나, 또는 가로 모드 지원이 기본인 사용자 단말일 수 있으며, 반드시 이에 한정되지는 않는다. 전자 장치(200)는 예를 들어, 전면 중심부에 위치하는 제1 마이크(510), 측면에 위치하는 제2 마이크(520), 및 후면에 위치하는 제3 마이크(미도시)를 포함할 수 있다.
각 도면들(530, 540,550)과 같은 상황에서 제1 마이크(520)와 화자(501) 간의 거리가 동일하므로 제1 마이크(520)에 입력되는 화자(501)의 음성 신호의 크기 또한 모두 유사할 수 있다. 보다 구체적으로, 제1 마이크(510)는 전자 장치(200)의 전면 중심부에 위치하므로 제1 마이크(510)로 입력되는 신호는 LCD(Liquid Crystal Display) 화면에 대한 화자(501)의 위치가 도면(530)과 같이 -90 도인 경우, 도면(540)과 같이 0도인 경우, 및 도면(550)과 같이 +90도인 경우에 모두 유사할 수 있다. 이와 달리, 도면들(530,540,550)과 같은 상황에서 제2 마이크(520)와 화자(501) 간의 거리는 달라질 수 있고, 제2 마이크(520)로 입력되는 신호는 화자(501)의 이동 위치에 따라 차이가 크게 발생할 수 있다.
예를 들어, 전자 장치(200) 전면의 LCD(Liquid Crystal Display) 화면에 대한 화자(501)의 위치가 도면(530)과 같이 270도(-90도)인 경우, 도면(540)과 같이 0도인 경우, 및 도면(550)과 같이 90도인 경우가 발생할 수 있다.
도면(540)과 같이 LCD 화면에 대한 화자(501)의 위치가 0도인 경우, 제1 마이크(520)와 화자(501) 간의 거리와 제2 마이크(520)와 화자(501) 간의 거리는 크게 차이가 나지 않고, 이에 따라 각 마이크에 입력되는 화자(501)의 음성 신호의 크기 또한 크게 차이가 나지 않을 수 있다.
이와 달리, 도면(530)과 같이 LCD 화면에 대한 화자(501)의 위치가 270도(-90도)인 경우, 제2 마이크(520)와 화자(501) 간의 거리가 가장 가깝고, 이에 따라 제2 마이크(520)에 입력되는 화자(501)의 음성 신호의 크기가 가장 클 수 있다. 또는, 도면(550)과 같이 LCD 화면에 대한 화자(501)의 위치가 90도인 경우, 제2 마이크(520)와 화자(501) 간의 거리가 가장 멀고, 이에 따라 제2 마이크(520)에 입력되는 화자(501)의 음성 신호의 크기가 가장 작을 수 있다. 이와 같이, 전자 장치(200)의 측면에 제2 마이크가 위치하는 경우, 전자 장치(200)의 전면을 바라보는 화자의 위치가 이동함에 따라 제2 마이크(520)로 입력되는 신호의 크기 차이가 발생되고, 이로 인해 빔 패턴의 틀어짐이 발생할 수 있다. 전자 장치(200)는 예를 들어, 가중치 테이블(예: 도 6의 가중치 테이블(600))을 기초로, 제2 마이크(520)에 대한 가중치를 보정하여 빔 패턴의 강건성을 확보할 수 있다.
전자 장치(200)에 대한 화자(501)의 위치는 마이크들(510,520) 각각에 대응하는 DOA 정보에 의해 확인되므로, 전자 장치(200)는 마이크들(510,520)에 대한 입력 신호들의 발생 방향들에 기초하여 제2 마이크(520)에 입력되는 신호의 가중치를 조절할 수 있다.
전자 장치(200)는 입력 신호들의 발생 방향들에 기초하여, 예를 들어, 전자 장치(200)에 대응하는 화자(501)의 위치가 아닌 방향에서 발생한 입력 신호의 가중치를 기준치보다 크게 보정하고, 화자(501)의 위치에 해당하는 방향에서 발생한 입력 신호의 가중치를 기준치보다 작게 보정할 수 있다.
전자 장치(200)는 예를 들어, 입력 신호들의 발생 방향들에 해당하는 마이크들(510,520)을 위해 미리 마련된 가중치 테이블(600)에 기초하여 마이크들(510,520) 별 입력 신호의 가중치를 조절할 수 있다.
예를 들어, 도면(540)와 같이 LCD 화면에 대한 화자(501)의 위치가 0도인 경우, 전자 장치(200)에서 제1 마이크(510)와 제2 마이크(520)에 입력되는 신호가 모두 화자(501)의 위치에 해당하는 방향에서 발생할 수 있다. 이 경우, 전자 장치(200)는 가중치 테이블(600)의 첫번째 줄과 같이 제1 마이크(510)의 입력 신호의 가중치와 제2 마이크(520)의 입력 신호의 가중치를 45%:45%(1:1)로 동일하게 설정할 수 있다.
제1 마이크(510)와 제2 마이크(520)의 가중치 비율이 1:1로 동일하게 설정된 경우, 전자 장치(200)는 제2 마이크(520)가 화자(501) 대비 어느 위치에 있는지 따라 제2 마이크(520)의 가중치를 기준치보다 더 크게 또는 작게 보정할 수 있다.
예를 들어, 도면(550)과 같이 LCD 화면에 대한 화자(501)의 위치가 90도인 경우, 전자 장치(200)는 가중치 테이블(600)의 마지막 줄과 같이 화자(501)의 위치에 해당하는 방향에서 발생한 제1 마이크(510)의 입력 신호의 가중치를 기준치(45%)보다 작은 10%로 보정하고, 화자(501)의 위치가 아닌 방향에서 발생한 제2 마이크(520)의 입력 신호의 가중치를 기준치(45%)보다 큰 80%로 보정할 수 있다.
또는 도면(530)과 같이 LCD 화면에 대한 화자(501)의 위치가 270도(-90도)인 경우, 전자 장치(200)는 화자(501)의 위치에 해당하는 방향에서 발생한 제2 마이크(520)의 입력 신호의 가중치를 기준치보다 작게 보정하고, 화자(501)의 위치가 아닌 방향에서 발생한 제1 마이크(510)의 입력 신호의 가중치를 기준치보다 크게 보정할 수 있다.
도 6은 일 실시예에 따른 가중치 테이블의 일 예시를 도시한 도면이다. 도 6을 참조하면, 일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101), 도 2의 전자 장치(200), 도 5의 전자 장치(500)) 전면의 화면 또는 카메라에 대한 화자(501)의 다양한 위치들이 각도 형태로 나타난 가중치 테이블(600)이 도시된다.
가중치 테이블(600)에서 제1 마이크(예: 도 4의 제1 마이크(410), 도 5의 제1 마이크(510))는 도 5를 통해 전술한 것과 같이 전자 장치(500)의 전면부 중심부에 위치한 마이크일 수 있고, 제2 마이크(예: 도 4의 제2 마이크(420), 도 5의 제2 마이크(520))는 전자 장치(500)의 좌측 및/또는 우측 측면에 위치한 마이크일 수 있다. 도 5에 도시되지 않았으나, 일 실시예에서 제3 마이크는 전자 장치(500)의 후면에 위치한 마이크일 수 있다. 후면에 위치한 제3 마이크는 화자(예: 도 5의 화자(501))의 음성 신호 보다는 DOA 정보의 확보 및/또는 노이즈 제거를 위한 참조를 위해 사용될 수 있다. 제3 마이크는 강건성 확보에 큰 영향이 없으므로 일 실시예에서는 제3 마이크에 대응하는 가중치를 화자(501)의 다양한 위치들과 무관한 값(예: 10%)으로 고정하여 사용할 수 있다.
도 7은 다른 실시예에 따른 전자 장치의 동작 방법을 나타낸 흐름도이다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다.
도 7을 참조하면, 일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101), 도 2의 전자 장치(200), 도 5의 전자 장치(500))는 동작 710 내지 동작 770을 통해 마이크들(예: 도 1의 입력 모듈(150), 도 2의 복수의 마이크들(210), 도 4의 마이크들(410,420), 도 5의 마이크들(510,520)) 별 출력 신호를 출력할 수 있다.
동작 710에서, 전자 장치(200)는 상이한 위치들에 배치된 마이크들(510,520)의 입력 신호들을 수집할 수 있다.
동작 720에서, 전자 장치(200)는 동작 710에서 수집한 입력 신호들로부터 마이크들(510,520) 각각에 대응하는 DOA 정보를 획득할 수 있다.
동작 730에서, 전자 장치(200)는 동작 710에서 수집한 입력 신호가 인-빔(in-beam) 신호인지를 결정할 수 있다. 전자 장치(200)는 입력 신호들의 발생 방향들 중 인-빔 신호에 해당하는 신호는 화자의 음성 신호라고 결정하고, 인-빔 신호에 해당하지 않는 신호는 화자의 음성 신호가 아닌 간섭 노이즈 신호라고 결정할 수 있다. 동작 730에서 입력 신호가 인-빔 신호라고 결정되면(Yes), 동작 740에서 전자 장치(200)는 예를 들어, FSB(Filter Sum Beamforming) 방식에 의해 각 마이크에 대한 입력 신호들을 필터링 후 단순히 합산하여 빔 포밍(beam forming)을 수행하고, 동작 760에서, 동작 740의 빔 포밍 결과에 따라 마이크들(510,520) 별 출력 신호를 생성할 수 있다. 동작 770에서, 전자 장치(200)는 동작 760에서 생성한 마이크들(510,520) 별 출력 신호를 해당하는 마이크들(510,520)로 전달하여 출력할 수 있다.
동작 730에서 입력 신호가 인-빔 신호가 아니라고 결정되면(No), 동작 750에서 전자 장치(200)는 마이크들(510,520) 별 입력 신호의 가중치를 조절할 수 있다. 동작 750에서, 전자 장치(200)는 입력 신호들의 발생 방향들에 해당하는 마이크들(예: 제1 입력 신호가 입력되는 제1 마이크, 제2 입력 신호가 입력되는 제2 마이크, 제3 입력 신호가 입력되는 제3 마이크)을 위해 미리 마련된 가중치 테이블(600)에 기초하여 마이크들(510,520) 별 입력 신호의 가중치를 조절할 수 있다. 전자 장치(200)는 입력 신호들의 발생 방향들을 기초로 가중치 테이블(600)을 참조하여, 전자 장치(200)에 대응하는 화자의 위치가 아닌 방향에서 발생한 입력 신호의 가중치는 기준치보다 크게 보정하고, 화자의 위치에 해당하는 방향에서 발생한 입력 신호의 가중치는 기준치보다 작게 보정할 수 있다.
동작 760에서, 전자 장치(200)는 동작 750에서 조절된 가중치를 반영하여 마이크들(510,520) 별 출력 신호를 생성할 수 있다.
동작 770에서, 전자 장치(200)는 동작 760에서 생성한 마이크들(510,520) 별 출력 신호를 해당하는 마이크들(510,520)로 전달하여 출력할 수 있다.
도 8은 일 실시예에 따른 에코(echo) 신호의 일 예시를 나타낸 그래프이다. 도 8을 참조하면, 일 실시예에 따른 테스트 신호(810) 및 테스트 신호(810)에 대응하는 에코 신호(830)의 DOA 정보 및 각도를 나타낸 그래프(800)가 도시된다.
예를 들어, 마이크들에 대한 입력 신호들 중 적어도 하나의 입력 신호에 에코 신호(830)가 존재하고, 마이크들과 스피커 간의 거리가 가까운 경우, 마이크들에 대한 입력 신호에서 에코 신호(830)가 지배적(Dominant)으로 작용할 수도 있다. 다시 말해, 에코 신호(830)와 에코 신호(830)보다 상대적으로 멀리서 입력되는 신호가 함께 마이크로 입력되는 경우, 전자 장치(예: 도 1의 전자 장치(101), 도 2의 전자 장치(200), 도 5의 전자 장치(500))는 이들 신호 중 어느 신호가 에코 신호(830)에 해당하는지를 판단하기 어려울 수 있다.
일 실시예에서는 그래프(800)에 도시된 것과 같이, 에코(Echo) 신호(830)에 DOA 정보가 포함되고, 에코 신호(830)의 DOA 정보가 변화하지 않는 점에 착안하여 에코 신호의 DOA 정보에 해당하는 위치의 마이크에 신호 세기가 큰 신호가 유입되는 경우, 해당 에코 신호의 DOA 정보를 제거하여(혹은 비중을 낮춰서) 화자(예: 도 5의 화자(501))의 음성 신호에 해당하는 DOA 정보만 계산함으로써 에코 신호(830)에 대한 전자 장치(200)의 강건성을 확보할 수 있다.
도 9는 다른 실시예에 따른 전자 장치의 동작 방법을 나타낸 흐름도이다. 이하 실시예에서 각 동작들은 순차적으로 수행될 수도 있으나, 반드시 순차적으로 수행되는 것은 아니다. 예를 들어, 각 동작들의 순서가 변경될 수도 있으며, 적어도 두 동작들이 병렬적으로 수행될 수도 있다.
도 9를 참조하면, 일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101), 도 2의 전자 장치(200), 도 5의 전자 장치(500))는 동작 910 내지 동작 970을 통해 마이크들(예: 도 1의 입력 모듈(150), 도 2의 복수의 마이크들(210), 도 4의 마이크들(410,420), 도 5의 마이크들(510,520)) 별 출력 신호를 출력할 수 있다.
동작 910에서, 전자 장치(200)는 마이크들(510,520)의 입력 신호들을 수집할 수 있다.
동작 920에서, 전자 장치(200)는 동작 910에서 수집한 입력 신호들 중 적어도 하나의 입력 신호에 에코 신호(예: 도 8의 에코 신호(830))가 포함되어 있는지 여부를 결정할 수 있다. 이때, 전자 장치(200)는 미리 마련된 에코 참조 정보(905)를 이용하여 동작 910에서 수집한 입력 신호들 중 적어도 하나의 입력 신호에 에코 신호(830)가 포함되어 있는지 여부를 결정할 수 있다.
동작 920에서 적어도 하나의 입력 신호에 에코 신호(830)가 포함되어 있다고 결정된 경우(Yes), 동작 930에서 전자 장치(200)는 해당 입력 신호 중 에코 신호(830)의 DOA 정보를 제거하고, 동작 940에서 에코 신호(830)의 DOA 정보가 제거된 입력 신호들로부터 DOA 정보를 획득할 수 있다.
이와 달리, 동작 920에서 적어도 하나의 입력 신호에 에코 신호(830)가 포함되어 있지 않다고 결정된 경우(No), 동작 930에서 전자 장치(200)는 동작 810에서 수집한 입력 신호들로부터 마이크들(510,520) 각각에 대응하는 DOA 정보를 획득할 수 있다.
동작 950에서, 전자 장치(200)는 동작 940에서 획득한 DOA 정보를 이용하여 입력 신호들의 발생 방향들을 산출할 수 있다. 동작 950에서, 전자 장치(200)는 예를 들어, 입력 신호들의 발생 방향들에 의해 입력 신호들이 전술한 인-빔 신호에 해당하는지 여부를 판단하여 인-빔 신호에 해당하는 지향성 신호는 유지하고, 인-빔 신호에 해당하지 않는 지향성 노이즈(예: 화자 이의의 다른 사람의 목소리, tv 소리)는 제거하거나, 또는 입력 신호에 반영하는 비중을 낮출 수 있다.
동작 960에서, 전자 장치(200)는 동작 950에서 산출한 입력 신호들의 발생 방향들에 기초하여, 마이크들(510,520) 별 출력 신호를 생성할 수 있다.
동작 970에서, 전자 장치(200)는 동작 960에서 생성한 마이크들(510,520) 별 출력 신호를 해당 마이크로 전달하여 출력할 수 있다.
일 실시예에 따르면, 전자 장치(101,200,500)는 상기 전자 장치(101,200,500)에서 상이한 위치들에 배치된 복수의 마이크들(150,210), 상기 마이크들(150,210) 각각에 입력되는 입력 신호들을 수집하고, 상기 입력 신호들로부터 상기 마이크들(150,210) 각각에 대응하는 DOA(direction of arrival) 정보를 획득하고, 상기 DOA 정보를 이용하여 상기 입력 신호들의 발생 방향들을 산출하고, 상기 입력 신호들의 발생 방향들에 기초하여, 상기 마이크들(150,210) 별 입력 신호의 가중치를 조절하고, 상기 마이크들(150,210) 별로 조절된 가중치를 반영하여 상기 마이크들(150,210) 별 출력 신호를 생성하는 프로세서(120,220), 및 상기 마이크들(150,210) 별 출력 신호를 출력하는 스피커(150,230)를 포함할 수 있다.
일 실시예에 따르면, 상기 프로세서(120,220)는 상기 입력 신호들의 발생 방향들에 기초하여, 상기 마이크들(150,210) 별 입력 신호의 가중치를 조절하고, 상기 마이크들(150,210) 별로 조절된 가중치를 반영하여 상기 마이크들(150,210) 별 출력 신호를 생성할 수 있다.
일 실시예에 따르면, 상기 프로세서(120,220)는 상기 입력 신호들의 발생 방향들에 기초하여, 상기 전자 장치(101,200,500)에 대응하는 화자(501)의 위치가 아닌 방향에서 발생한 입력 신호의 가중치를 기준치보다 크게 보정하고, 상기 화자(501)의 위치에 해당하는 방향에서 발생한 입력 신호의 가중치를 상기 기준치보다 작게 보정할 수 있다.
일 실시예에 따르면, 상기 프로세서(120,220)는 상기 입력 신호들의 발생 방향들에 기초하여, 상기 마이크들(150,210) 중 제1 위치에 배치된 제1 마이크(410,510)에 대한 제1 입력 신호 및 상기 제1 위치와 상이한 제2 위치에 배치된 제2 마이크(420,520)에 대한 제2 입력 신호가 모두 상기 전자 장치(101,200,500)에 대응하는 화자(501)의 위치에 해당하는 방향에서 발생한 경우, 상기 제1 입력 신호의 가중치 및 상기 제2 입력 신호의 가중치를 동일하게 설정할 수 있다.
일 실시예에 따르면, 상기 프로세서(120,220)는 상기 입력 신호들의 발생 방향들에 해당하는 상기 마이크들(150,210)을 위해 미리 마련된 가중치 테이블(600)에 기초하여 상기 마이크들(150,210) 별 입력 신호의 가중치를 조절할 수 있다.
일 실시예에 따르면, 상기 프로세서(120,220)는 상기 가중치 테이블(600)에서 상기 전자 장치(101,200,500)에 대응하는 화자(501)의 위치에 대비되는 제2 마이크(420,520)의 위치에 따라 상기 제2 마이크(420,520)의 입력 신호의 가중치를 조절할 수 있다.
일 실시예에 따르면, 상기 프로세서(120,220)는 상기 입력 신호들 중 적어도 하나의 입력 신호에 에코(Echo) 신호가 포함되어 있는지 여부를 결정하고, 상기 입력 신호에 상기 에코 신호(830)가 포함된 것으로 결정되면, 상기 입력 신호에서 상기 에코 신호(830)의 DOA 정보를 제거할 수 있다.
일 실시예에 따르면, 상기 프로세서(120,220)는 미리 설정된 에코 참조(Echo reference) 정보를 이용하여 상기 입력 신호에 상기 에코 신호(830)가 포함되어 있는지 여부를 결정할 수 있다.
일 실시예에 따르면, 상기 에코 참조 정보는 상기 에코 신호(830)의 입력 시간 및 상기 에코 신호(830)의 DOA 정보 중 적어도 하나를 포함할 수 있다.
일 실시예에 따르면, 상기 상이한 위치들은 상기 전자 장치(101,200,500)의 전면 중심부의 제1 위치, 상기 전자 장치(101,200,500)의 측면의 제2 위치, 및 상기 전자 장치(101,200,500)의 후면의 제3 위치를 포함할 수 있다.
일 실시예에 따르면, 복수의 마이크들(150,210)을 포함하는 전자 장치(101,200,500)의 동작 방법은 상기 전자 장치(101,200,500)에서 상이한 위치들에 배치된 마이크들(150,210) 각각에 입력되는 입력 신호들을 수집하는 동작 310, 상기 입력 신호들로부터 상기 마이크들(150,210) 각각에 대응하는 DOA(direction of arrival) 정보를 획득하는 동작 320, 상기 DOA 정보를 이용하여 상기 입력 신호들의 발생 방향들을 산출하는 동작 330, 상기 입력 신호들의 발생 방향들에 기초하여, 상기 마이크들(150,210) 별 입력 신호의 가중치를 조절하는 동작 340, 상기 마이크들(150,210) 별로 조절된 가중치를 반영하여 상기 마이크들(150,210) 별 출력 신호를 생성하는 동작 350 및 마이크들 별 출력 신호를 출력하는 동작 360을 포함할 수 있다.
일 실시예에 따르면, 상기 가중치를 조절하는 동작은 상기 입력 신호들의 발생 방향들에 기초하여, 상기 전자 장치(101,200,500)에 대응하는 화자(501)의 위치가 아닌 방향에서 발생한 입력 신호의 가중치를 기준치보다 크게 보정하는 동작, 및 상기 화자(501)의 위치에 해당하는 방향에서 발생한 입력 신호의 가중치를 상기 기준치보다 작게 보정하는 동작을 포함할 수 있다.
일 실시예에 따르면, 상기 가중치를 조절하는 동작은 상기 입력 신호들의 발생 방향들에 해당하는 상기 마이크들(150,210)을 위해 미리 마련된 가중치 테이블(600)에 기초하여 상기 마이크들(150,210) 별 입력 신호의 가중치를 조절하는 동작을 포함할 수 있다.
일 실시예에 따르면, 상기 가중치를 조절하는 동작은 상기 가중치 테이블(600)에서 상기 전자 장치(101,200,500)에 대응하는 화자(501)의 위치에 대비되는 제2 마이크(420,520)의 위치에 따라 상기 제2 마이크(420,520)의 입력 신호의 가중치를 조절하는 동작을 포함할 수 있다.
일 실시예에 따르면, 상기 DOA 정보를 획득하는 동작은 상기 입력 신호들 중 적어도 하나의 입력 신호에 에코 신호(830)가 포함되어 있는지 여부를 결정하는 동작, 및 상기 입력 신호에 상기 에코 신호(830)가 포함된 것으로 결정되면, 상기 입력 신호에서 상기 에코 신호(830)의 DOA 정보를 제거하는 동작을 포함할 수 있다.
일 실시예에 따르면, 상기 에코 신호(830)의 DOA 정보가 포함되어 있는지 여부를 결정하는 동작은 미리 설정된 에코 참조(Echo reference) 정보를 이용하여 상기 입력 신호에 상기 에코 신호(830)가 포함되어 있는지 여부를 결정하는 동작을 포함할 수 있다.
일 실시예에 따르면, 상기 에코 참조 정보는 상기 에코 신호(830)의 입력 시간 및 상기 에코 신호(830)의 DOA 정보 중 적어도 하나를 포함할 수 있다.
일 실시예에 따르면, 상기 상이한 위치들은 상기 전자 장치(101,200,500)의 전면 중심부의 제1 위치, 상기 전자 장치(101,200,500)의 측면의 제2 위치, 및 상기 전자 장치(101,200,500)의 후면의 제3 위치를 포함할 수 있다.
200: 전자 장치
205: 통신 버스
210: 마이크들
220: 프로세서
230: 스피커
240; 메모리
250: 통신 인터페이스
205: 통신 버스
210: 마이크들
220: 프로세서
230: 스피커
240; 메모리
250: 통신 인터페이스
Claims (18)
- 전자 장치에 있어서,
상기 전자 장치에서 상이한 위치들에 배치된 복수의 마이크들;
상기 마이크들 각각에 입력되는 입력 신호들을 수집하고, 상기 입력 신호들로부터 상기 마이크들 각각에 대응하는 DOA(direction of arrival) 정보를 획득하고, 상기 DOA 정보를 이용하여 상기 입력 신호들의 발생 방향들을 산출하고, 상기 입력 신호들의 발생 방향들에 기초하여, 상기 마이크들 별 입력 신호의 가중치를 조절하고, 상기 마이크들 별로 조절된 가중치를 반영하여 상기 마이크들 별 출력 신호를 생성하는 프로세서; 및
상기 마이크들 별 출력 신호를 출력하는 스피커
를 포함하는, 전자 장치. - 제1항에 있어서,
상기 프로세서는
상기 입력 신호들의 발생 방향들에 기초하여,
상기 전자 장치에 대응하는 화자의 위치가 아닌 방향에서 발생한 입력 신호의 가중치를 기준치보다 작게 보정하고,
상기 화자의 위치에 해당하는 방향에서 발생한 입력 신호의 가중치를 상기 기준치보다 크게 보정하는, 전자 장치. - 제2항에 있어서,
상기 프로세서는
상기 입력 신호들의 발생 방향들에 기초하여,
상기 마이크들 중 제1 위치에 배치된 제1 마이크에 대한 제1 입력 신호 및 상기 제1 위치와 상이한 제2 위치에 배치된 제2 마이크에 대한 제2 입력 신호가 모두 상기 전자 장치에 대응하는 화자의 위치에 해당하는 방향에서 발생한 경우, 상기 제1 입력 신호의 가중치 및 상기 제2 입력 신호의 가중치를 동일하게 설정하는, 전자 장치. - 제3항에 있어서,
상기 프로세서는
상기 입력 신호들의 발생 방향들에 해당하는 상기 마이크들을 위해 미리 마련된 가중치 테이블에 기초하여 상기 마이크들 별 입력 신호의 가중치를 조절하는, 전자 장치. - 제4항에 있어서,
상기 프로세서는
상기 가중치 테이블에서 상기 전자 장치에 대응하는 화자의 위치에 대비되는 제2 마이크의 위치에 따라 상기 제2 마이크의 입력 신호의 가중치를 조절하는, 전자 장치. - 제1항에 있어서,
상기 프로세서는
상기 입력 신호들 중 적어도 하나의 입력 신호에 에코(Echo) 신호가 포함되어 있는지 여부를 결정하고,
상기 입력 신호에 상기 에코 신호가 포함된 것으로 결정되면, 상기 입력 신호에서 상기 에코 신호의 DOA 정보를 제거하는, 전자 장치. - 제6항에 있어서,
상기 프로세서는
미리 설정된 에코 참조(Echo reference) 정보를 이용하여 상기 입력 신호에 상기 에코 신호가 포함되어 있는지 여부를 결정하는, 전자 장치. - 제7항에 있어서,
상기 에코 참조 정보는
상기 에코 신호의 입력 시간 및 상기 에코 신호의 DOA 정보 중 적어도 하나를 포함하는, 전자 장치. - 제1항에 있어서,
상기 상이한 위치들은
상기 전자 장치의 전면 상단부의 제1 위치, 상기 전자 장치의 측면의 제2 위치, 및 상기 전자 장치의 후면의 제3 위치를 포함하는, 전자 장치. - 복수의 마이크들을 포함하는 전자 장치의 동작 방법에 있어서,
상기 전자 장치에서 상이한 위치들에 배치된 마이크들 각각에 입력되는 입력 신호들을 수집하는 동작;
상기 입력 신호들로부터 상기 마이크들 각각에 대응하는 DOA(direction of arrival) 정보를 획득하는 동작;
상기 DOA 정보를 이용하여 상기 입력 신호들의 발생 방향들을 산출하는 동작;
상기 입력 신호들의 발생 방향들에 기초하여, 상기 마이크들 별 입력 신호의 가중치를 조절하는 동작;
상기 마이크들 별로 조절된 가중치를 반영하여 상기 마이크들 별 출력 신호를 생성하는 동작; 및
상기 마이크들 별 출력 신호를 출력하는 동작
을 포함하는, 전자 장치의 동작 방법. - 제10항에 있어서,
상기 가중치를 조절하는 동작은
상기 입력 신호들의 발생 방향들에 기초하여,
상기 전자 장치에 대응하는 화자의 위치가 아닌 방향에서 발생한 입력 신호의 가중치를 기준치보다 작게 보정하는 동작; 및
상기 화자의 위치에 해당하는 방향에서 발생한 입력 신호의 가중치를 상기 기준치보다 크게 보정하는 동작
을 포함하는, 전자 장치의 동작 방법. - 제11항에 있어서,
상기 가중치를 조절하는 동작은
상기 입력 신호들의 발생 방향들에 해당하는 상기 마이크들을 위해 미리 마련된 가중치 테이블에 기초하여 상기 마이크들 별 입력 신호의 가중치를 조절하는 동작
을 포함하는, 전자 장치의 동작 방법. - 제12항에 있어서,
상기 가중치를 조절하는 동작은
상기 가중치 테이블에서 상기 전자 장치에 대응하는 화자의 위치에 대비되는 제2 마이크의 위치에 따라 상기 제2 마이크의 입력 신호의 가중치를 조절하는 동작
을 포함하는, 전자 장치의 동작 방법. - 제10항에 있어서,
상기 DOA 정보를 획득하는 동작은
상기 입력 신호들 중 적어도 하나의 입력 신호에 에코(Echo) 신호가 포함되어 있는지 여부를 결정하는 동작; 및
상기 입력 신호에 상기 에코 신호가 포함된 것으로 결정되면, 상기 입력 신호에서 상기 에코 신호의 DOA 정보를 제거하는 동작
을 포함하는, 전자 장치의 동작 방법. - 제14항에 있어서,
상기 에코 신호의 DOA 정보가 포함되어 있는지 여부를 결정하는 동작은
미리 설정된 에코 참조(Echo reference) 정보를 이용하여 상기 입력 신호에 상기 에코 신호가 포함되어 있는지 여부를 결정하는 동작
을 포함하는, 전자 장치의 동작 방법. - 제15항에 있어서,
상기 에코 참조 정보는
상기 에코 신호의 입력 시간 및 상기 에코 신호의 DOA 정보 중 적어도 하나를 포함하는, 전자 장치의 동작 방법. - 제10항에 있어서,
상기 상이한 위치들은
상기 전자 장치의 전면 상단부의 제1 위치, 상기 전자 장치의 측면의 제2 위치, 및 상기 전자 장치의 후면의 제3 위치를 포함하는, 전자 장치의 동작 방법. - 하드웨어와 결합되어 제10항 내지 제17항 중 어느 하나의 항의 방법을 실행시키기 위하여 컴퓨터로 판독 가능한 기록매체에 저장된 컴퓨터 프로그램.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/KR2022/017815 WO2023085872A1 (ko) | 2021-11-15 | 2022-11-14 | 전자 장치 및 전자 장치의 동작 방법 |
US18/149,930 US20230156399A1 (en) | 2021-11-15 | 2023-01-04 | Electronic device and method of operating the same |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20210157020 | 2021-11-15 | ||
KR1020210157020 | 2021-11-15 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230071003A true KR20230071003A (ko) | 2023-05-23 |
Family
ID=86544198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220005476A KR20230071003A (ko) | 2021-11-15 | 2022-01-13 | 전자 장치 및 전자 장치의 동작 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20230071003A (ko) |
-
2022
- 2022-01-13 KR KR1020220005476A patent/KR20230071003A/ko unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12026017B2 (en) | Electronic device including flexible display and method for operating same | |
US20230413002A1 (en) | Electronic device for applying directionality to audio signal, and method therefor | |
KR20220102436A (ko) | 웨어러블 전자 장치의 가속도 센서를 이용하여 사용자의 자세를 판단하는 방법 및 그 전자 장치 | |
KR20220102492A (ko) | 오디오 데이터를 처리하기 위한 오디오 장치 및 그의 동작 방법 | |
KR20220017332A (ko) | 오디오 데이터를 처리하는 전자 장치와 이의 동작 방법 | |
EP4391583A1 (en) | Wearable device | |
US12047444B2 (en) | Electronic device and method for recording audio data acquired from multiple devices | |
US12081932B2 (en) | Electronic device for reducing internal noise and method thereof | |
US20220225009A1 (en) | Method for controlling electronic devices based on battery residual capacity and electronic device therefor | |
EP4284033A1 (en) | Electronic device for processing audio data, and operation method thereof | |
KR20230071003A (ko) | 전자 장치 및 전자 장치의 동작 방법 | |
KR20220103548A (ko) | 오디오 데이터를 처리하는 전자 장치 및 그 동작 방법 | |
KR20220134308A (ko) | 음성 신호 처리를 위한 전자 장치 및 방법 | |
US20230156399A1 (en) | Electronic device and method of operating the same | |
KR20220090716A (ko) | 전자 장치 및 전자 장치에서 외부 장치들을 공간별로 그룹핑 하는 방법 | |
EP4152767A1 (en) | Wearable electronic device, and method for operating wearable electronic device | |
WO2023085872A1 (ko) | 전자 장치 및 전자 장치의 동작 방법 | |
US20230412978A1 (en) | Electronic device for listening to external sound and operating method of electronic device | |
US20230262387A1 (en) | Audio data processing method and device thereof | |
KR20240050963A (ko) | 음향 효과를 제공하기 위한 전자 장치 및 그 동작 방법, 저장 매체 | |
KR20240013626A (ko) | 블루투스 환경에서 전파 출력 제어 장치 및 방법 | |
KR20220102448A (ko) | 다중 장치 간 통신 방법 및 이를 위한 전자 장치 | |
KR20220061740A (ko) | 통신 연결을 통하여 데이터를 전송하는 전자 장치와 이의 동작 방법 | |
KR20220139103A (ko) | 무선 이어폰 장치 및 그 제어 방법 | |
KR20230103814A (ko) | 웨어러블 장치 |