WO2014119835A1

WO2014119835A1 - 이동 단말기, 및 그 동작방법

Info

Publication number: WO2014119835A1
Application number: PCT/KR2013/008131
Authority: WO
Inventors: 신주연
Original assignee: 엘지전자 주식회사
Priority date: 2013-01-31
Filing date: 2013-09-09
Publication date: 2014-08-07
Also published as: US9380262B2; KR102060712B1; KR20140098511A; US20150358579A1

Abstract

본 발명은 이동 단말기, 및 그 동작방법에 관한 것이다. 본 발명의 실시예에 따른 이동 단말기의 동작 방법은, 카메라로부터의 촬영 이미지와, 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하는 단계와, 복수의 마이크를 통해, 화자로부터의 오디오 신호를 수신하는 단계와, 형성된 오디오 빔에 기초하여, 수신되는 오디오 신호를 신호 처리하는 단계를 포함한다. 이에 의해, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

Description

이동 단말기, 및 그 동작방법

본 발명은 이동 단말기, 및 그 동작방법에 관한 것이며, 더욱 상세하게는 사용자의 이용 편의성을 향상시킬 수 있는 이동 단말기, 및 그 동작방법에 관한 것이다.

이동 단말기는 휴대가 가능하면서 음성 및 영상 통화를 수행할 수 있는 기능, 정보를 입,출력할 수 있는 기능 및 데이터를 저장할 수 있는 기능 등을 하나 이상 갖춘 휴대용 기기이다. 이러한 이동 단말기는 그 기능이 다양화됨에 따라, 사진이나 동영상의 촬영, 음악 파일이나 동영상 파일의 재생, 게임, 방송의 수신, 무선 인터넷, 메시지 송수신 등과 같은 복잡한 기능들을 갖추게 되었으며, 종합적인 멀티미디어 기기(multimedia player) 형태로 구현되고 있다. 이러한 멀티미디어 기기의 형태로 구현된 이동 단말기는, 복잡한 기능을 구현하기 위해 하드웨어나 소프트웨어적 측면에서 새로운 시도들이 다양하게 적용되고 있다.

본 발명의 목적은, 사용자의 이용 편의성을 향상시킬 수 있는 이동 단말기, 및 그 동작방법을 제공함에 있다.

한편, 본 발명의 다른 목적은, 화자의 위치에 대응하여, 오디오 빔을 형성하여, 최적의 오디오 신호를 수신할 수 있는 이동 단말기, 및 그 동작방법을 제공함에 있다.

상기 목적을 달성하기 위한 본 발명의 실시예에 따른 이동 단말기의 동작 방법은, 카메라로부터의 촬영 이미지와, 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하는 단계와, 복수의 마이크를 통해, 화자로부터의 오디오 신호를 수신하는 단계와, 형성된 오디오 빔에 기초하여, 수신되는 오디오 신호를 신호 처리하는 단계를 포함한다.

또한, 상기 목적을 달성하기 위한 본 발명의 실시예에 따른 이동 단말기의 동작 방법은, 카메라, 모션 센서, 및 복수개의 마이크를 구비하는 이동 단말기의 동작 방법에 있어서, 오디오 수신 모드로 진입하는 단계와, 카메라, 모션 센서 및 복수개의 마이크를 활성화하는 단계와, 카메라로부터의 촬영 이미지와 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하는 단계와, 오디오 빔 형성 완료시, 이를 나타내는 오브젝트를 표시하는 단계를 포함한다.

또한, 상기 목적을 달성하기 위한 본 발명의 실시예에 따른 이동 단말기는, 카메라와, 이동 단말기의 움직임 정보를 감지하는 모션 센서와, 오디오 신호를 수집하는 복수개의 마이크와, 카메라로부터의 촬영 이미지와, 모션 센서로부터의 움직임 정보 중 적어도 하나에 기초하여, 화자의 위치를 결정하며, 화자의 위치에 대응하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하며, 복수의 마이크를 통해, 수신되는 오디오 신호를, 형성된 오디오 빔에 기초하여, 신호 처리하는 빔 처리부를 포함한다.

본 발명의 일실시예에 따르면, 이동 단말기는, 카메라로부터의 촬영 이미지와 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자의 위치를 결정하고, 화자의 위치에 대응하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하며, 형성된 오디오 빔에 기초하여, 복수의 마이크를 통해, 화자로부터의 오디오 신호를 수신하여, 오디오 신호 처리함으로써, 화자의 위치에 대응하는 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

특히, 오디오 입력 모드에서, 화자를 촬영한 이미지 중 화자의 입 위치에 대응하여, 화자의 입이 움직이기 전에, 오디오 빔 형성을 완료할 수 있으며, 이에 의해, 화자가 오디오 신호 출력하는 순간부터, 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

한편, 화자가 이동하는 경우, 이동된 화자를 촬영한 촬영 이미지에 기초하거나, 이동된 화자를 촬영한 촬영 이미지, 및 수신되는 오디오 신호에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트함으로써, 적응적으로 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

한편, 이동 단말기가 이동하는 경우, 이동된 화자를 촬영한 촬영 이미지, 및 수신되는 오디오 신호에 기초에 기초하거나, 이동된 화자를 촬영한 촬영 이미지, 모션 센서로부터의 이동 단말기의 움직임 정보, 및 수신되는 오디오 신호에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트함으로써, 적응적으로 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

한편, 이동 단말기에 대해, 복수의 화자가 위치하는 경우, 각 화자의 위치에 대응하는, 복수의 오디오 빔을 형성하고, 복수의 화자 중 입을 움직이는 화자에 대응하는, 오디오 빔을 활성화시킴으로써, 신속하고 정확하게, 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

한편, 이동 단말기에 대해, 복수의 화자가 위치한 상태에서, 화자 외의 다른 화자의 오디오 신호 입력이 있는 경우, 카메라로부터의 촬영 이미지, 및 다른 화자로부터의 오디오 신호에 기초하여, 제2 오디오 빔을 형성하고, 이를 기반으로, 오디오 신호를 수신하여 신호 처리함으로써, 적응적으로 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

도 1은 본 발명의 이동 단말기에서 오디오 수신 모드가 수행되는 것을 예시한다.

도 2는 본 발명의 일실시예에 따른 이동 단말기의 블럭도이다.

도 3은 도 2의 이동 단말기를 전면에서 바라본 사시도이다.

도 4는 도 3에 도시한 이동 단말기의 후면 사시도이다.

도 5a 내지 도 5c는 본 발명과 관련한, 오디오 빔포밍시 활용되는 요소들을 예시하는 도면이다.

도 5d는 본 발명과 관련한 오디오 빔포밍 처리를 위한 간략한 블록도를 도시한다.

도 6은 본 발명의 일 실시예에 따른 이동 단말기의 동작 방법을 보여주는 순서도이다.

도 7a 내지 도 15c는 도 6의 이동 단말기의 동작 방법의 다양한 예를 설명하기 위해 참조되는 도면이다.

이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.

본 명세서에서 기술되는 이동 단말기에는, 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(notebook computer), 디지털방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 카메라, 네비게이션, 타블렛 컴퓨터(tablet computer), 이북(e-book) 단말기 등이 포함된다. 또한, 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 단순히 본 명세서 작성의 용이함만이 고려되어 부여되는 것으로서, 그 자체로 특별히 중요한 의미 또는 역할을 부여하는 것은 아니다. 따라서, 상기 "모듈" 및 "부"는 서로 혼용되어 사용될 수도 있다.

도면을 참조하면, 도 1의 이동 단말기(100)는, 오디오 수신 모드 중 스피커 모드(speaker mode)로 동작하는 것을 예시한다. 도면에서는 스피커 모드에 따른 스피커 모드 화면(530), 특히 스피커 모드를 나타내는 오브젝트(535)가 이동 단말기(100)에 표시되는 것을 예시한다.

스피커 모드(speaker mode)로 동작시, 이동 단말기(100)는, 구비되는 복수의 마이크를 활성화시킬 수 있다. 이때, 화자(50)는, 이동 단말기(100)를 화자(50)와 소정 거리 이격시키면서, 예를 들어, 도면과 같이, 이동 단말기(100)의 디스플레이를 보면서, 상대방과의 통화를 수행할 수 있다.

본 발명의 실시예에 따른, 이동 단말기(100)는, 카메라(도 2의 121), 복수의 마이크(도 2의 123), 및 모션 센서(도 2의 145)를 구비하는 이동 단말기로서, 스피커 모드(speaker mode)와 같은, 오디오 수신 모드 중, 화자로부터의 오디오 신호 수신시, 최적의 오디오 신호를 수신하기 위해, 오디오 빔을 형성하는 것으로 한다.

특히, 이동 단말기(100)는, 오디오 빔 형성을 위해, 카메라(도 2의 121)에서, 화자(50)를 촬영한 촬영 이미지와, 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자의 위치를 결정하고, 화자의 위치에 대응하는 오디오 빔을 형성할 수 있다. 여기서, 화자의 위치는, x,y,z축 상의 위치 정보일 수 있으나, 이동 단말기(100)의 위치 대비, 상대적인, 화자의 위치일 수 있다.

즉, 화자의 위치 정보는, 이동 단말기(100)와 화자(50)와의 거리 정보 또는 이동 단말기(100)를 기준으로, 이동 단말기(100)와 화자(50) 사이의 각도 정보 등을 포함하는 개념일 수 있다.

그리고, 이러한 화자의 위치 정보에 기초하여, 이동 단말기(100)는, 복수의 마이크(도 2의 123)에서 수신되는 오디오 신호에 대한 최적의 신호 처리를 위한, 오디오 빔(audio beam)을 형성할 수 있다.

예를 들어, 이동 단말기(100)를 기준으로, 화자(50)가 정면에 위치하여 직교하는 경우, 이동 단말기(100) 주변의 오디오 필드에서, 화자(50)가 위치하는 각도(90도)에서의, 매그니튜드(magnitude)가 가장 크도록 설정하고, 다른 각도는 점차 작아지는 매그니튜드를 가지도록 설정할 수 있다.

다른 예로, 이동 단말기(100)를 기준으로, 화자(50)가 정면이 아닌, 우측에 위치하는 경우, 이동 단말기(100) 주변의 오디오 필드에서, 화자가 위치하는, 대략 105도 각도에서의, 매그니튜드(magnitude)가 가장 크도록 설정하고, 대략 105도 각도를 중심으로 다른 각도는 점차 작아지는 매그니튜드를 가지도록 설정할 수 있다.

한편, 이동 단말기(100)는, 화자의 입이 움직이기 전에, 이러한 오디오 빔을, 생성하고, 화자의 입이 움직여서, 오디오 신호가 수신되는 경우, 형성된 오디오 빔을 통해, 오디오 신호 처리를 수행할 수 있다. 이에 의해, 화자(50)가 음성을 출력하는 순간부터, 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

한편, 본 발명의 실시예에 따른 이동 단말기(100)는, 화자가 이동하는 경우, 이동 단말기가 이동하는 경우, 또는 복수의 화자가 위치하는 경우, 카메라로부터의 촬영 이미지, 모션 센서로부터의 이동 단말기의 움직임 정보, 및 마이크로부터 수신되는 오디오 신호에 기초하여, 오디오 빔을 형성함으로써, 신속하고 정확하게, 최적의 오디오 신호를 수신할 수 있게 된다. 이에 따라, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

본 발명의 실시예에 따른 이동 단말기(100)에서의 오디오 빔 형성의 다양한 방법에 대해서는, 도 5 이하를 참조하여 상세히 기술한다.

도 2는 본 발명의 일실시예에 따른 이동 단말기의 블럭도이다. 도 2를 참조하여 본 발명의 일 실시 예에 따른 이동 단말기를 기능에 따른 구성요소 관점에서 살펴보면 다음과 같다.

도 2를 참조하면, 이동 단말기(100)는 무선 통신부(110), A/V(Audio/Video) 입력부(120), 사용자 입력부(130), 센싱부(140), 출력부(150), 메모리(160), 인터페이스부(170), 프로세서(180), 및 전원 공급부(190)를 포함할 수 있다. 이와 같은 구성요소들은 실제 응용에서 구현될 때 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다.

무선 통신부(110)는 방송수신 모듈(111), 이동통신 모듈(113), 무선 인터넷 모듈(115), 근거리 통신 모듈(117), 및 GPS 모듈(119) 등을 포함할 수 있다.

방송수신 모듈(111)은 방송 채널을 통하여 외부의 방송관리 서버로부터 방송 신호 및 방송관련 정보 중 적어도 하나를 수신한다. 이때, 방송 채널은 위성 채널, 지상파 채널 등을 포함할 수 있다. 방송관리 서버는, 방송 신호 및 방송 관련 정보 중 적어도 하나를 생성하여 송신하는 서버나, 기 생성된 방송 신호 및 방송관련 정보 중 적어도 하나를 제공받아 단말기에 송신하는 서버를 의미할 수 있다.

방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다. 방송관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 방송관련 정보는, 이동통신망을 통하여도 제공될 수 있으며, 이 경우에는 이동통신 모듈(113)에 의해 수신될 수 있다. 방송관련 정보는 다양한 형태로 존재할 수 있다.

방송수신 모듈(111)은, 각종 방송 시스템을 이용하여 방송 신호를 수신하는데, 특히, DMB-T(Digital Multimedia Broadcasting-Terrestrial), DMB-S(Digital Multimedia Broadcasting-Satellite), MediaFLO(Media Forward Link Only), DVB-H(Digital Video Broadcast-Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등의 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 또한, 방송수신 모듈(111)은, 이와 같은 디지털 방송 시스템뿐만 아니라 방송 신호를 제공하는 모든 방송 시스템에 적합하도록 구성될 수 있다. 방송수신 모듈(111)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는 메모리(160)에 저장될 수 있다.

이동통신 모듈(113)은, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기서, 무선 신호는, 음성 호 신호, 화상 통화 호 신호, 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.

무선 인터넷 모듈(115)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 무선 인터넷 모듈(115)은 이동 단말기(100)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다.

근거리 통신 모듈(117)은 근거리 통신을 위한 모듈을 말한다. 근거리 통신 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), 지그비(ZigBee), NFC(Near Field Communication) 등이 이용될 수 있다.

GPS(Global Position System) 모듈(119)은 복수 개의 GPS 인공위성으로부터 위치 정보를 수신한다.

A/V(Audio/Video) 입력부(120)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(121)와 마이크(123) 등이 포함될 수 있다. 카메라(121)는 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 그리고, 처리된 화상 프레임은 디스플레이(151)에 표시될 수 있다.

카메라(121)에서 처리된 화상 프레임은 메모리(160)에 저장되거나 무선 통신부(110)를 통하여 외부로 전송될 수 있다. 카메라(121)는 단말기의 구성 태양에 따라 2개 이상이 구비될 수도 있다.

마이크(123)는, 오디오 수신 모드, 예를 들어, 통화모드, 녹음모드, 또는 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 오디오 신호를 입력받아 전기적인 음성 데이터로 처리한다. 그리고, 처리된 음성 데이터는 통화 모드인 경우 이동통신 모듈(113)을 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크 (123)는 외부의 오디오 신호를 입력받는 과정에서 발생하는 잡음(noise)를 제거하기 위한 다양한 잡음 제거 알고리즘이 사용될 수 있다.

한편, 마이크(123)는, 서로 다른 위치에, 복수개로서 배치될 수 있다. 각 마이크에서 수신되는 오디오 신호는 프로세서(180) 등에서 오디오 신호 처리될 수 있다.

사용자 입력부(130)는 사용자가 단말기의 동작 제어를 위하여 입력하는 키 입력 데이터를 발생시킨다. 사용자 입력부(130)는 사용자의 누름 또는 터치 조작에 의해 명령 또는 정보를 입력받을 수 있는 키 패드(key pad), 돔 스위치(dome switch), 터치 패드(정압/정전) 등으로 구성될 수 있다. 또한, 사용자 입력부(130)는 키를 회전시키는 조그 휠 또는 조그 방식이나 조이스틱과 같이 조작하는 방식이나, 핑거 마우스 등으로 구성될 수 있다. 특히, 터치 패드가 후술하는 디스플레이(151)와 상호 레이어 구조를 이룰 경우, 이를 터치스크린(touch screen)이라 부를 수 있다.

센싱부(140)는 이동 단말기(100)의 개폐 상태, 이동 단말기(100)의 위치, 사용자 접촉 유무 등과 같이 이동 단말기(100)의 현 상태를 감지하여 이동 단말기(100)의 동작을 제어하기 위한 센싱 신호를 발생시킨다. 예를 들어 이동 단말기(100)가 슬라이드 폰 형태인 경우 슬라이드 폰의 개폐 여부를 센싱할 수 있다. 또한, 전원 공급부(190)의 전원 공급 여부, 인터페이스부(170)의 외부 기기 결합 여부 등과 관련된 센싱 기능을 담당할 수 있다.

센싱부(140)는 근접센서(141), 압력센서(143), 및 모션 센서(145) 등을 포함할 수 있다. 근접센서(141)는 이동 단말기(100)로 접근하는 물체나, 이동 단말기(100)의 근방에 존재하는 물체의 유무 등을 기계적 접촉이 없이 검출할 수 있도록 한다. 근접센서(141)는, 교류자계의 변화나 정자계의 변화를 이용하거나, 혹은 정전용량의 변화율 등을 이용하여 근접물체를 검출할 수 있다. 근접센서(141)는 구성 태양에 따라 2개 이상이 구비될 수 있다.

압력센서(143)는 이동 단말기(100)에 압력이 가해지는지 여부와, 그 압력의 크기 등을 검출할 수 있다. 압력센서(143)는 사용환경에 따라 이동 단말기(100)에서 압력의 검출이 필요한 부위에 설치될 수 있다. 만일, 압력센서(143)가 디스플레이(151)에 설치되는 경우, 압력센서(143)에서 출력되는 신호에 따라, 디스플레이(151)를 통한 터치 입력과, 터치 입력보다 더 큰 압력이 가해지는 압력터치 입력을 식별할 수 있다. 또한, 압력센서(143)에서 출력되는 신호에 따라, 압력터치 입력시 디스플레이(151)에 가해지는 압력의 크기도 알 수 있다.

모션 센서(145)는 가속도 센서, 자이로 센서 등을 이용하여 이동 단말기(100)의 위치나 움직임 등을 감지한다. 모션 센서(145)에 사용될 수 있는 가속도 센서는 어느 한 방향의 가속도 변화에 대해서 이를 전기 신호로 바꾸어 주는 소자로서, MEMS(micro-electromechanical systems) 기술의 발달과 더불어 널리 사용되고 있다.

가속도 센서에는, 자동차의 에어백 시스템에 내장되어 충돌을 감지하는데 사용하는 큰 값의 가속도를 측정하는 것부터, 사람 손의 미세한 동작을 인식하여 게임 등의 입력 수단으로 사용하는 미세한 값의 가속도를 측정하는 것까지 다양한 종류가 있다. 가속도 센서는 보통 2축이나 3축을 하나의 패키지에 실장하여 구성되며, 사용 환경에 따라서는 Z축 한 축만 필요한 경우도 있다. 따라서, 어떤 이유로 Z축 방향 대신 X축 또는 Y축 방향의 가속도 센서를 써야 할 경우에는 별도의 조각 기판을 사용하여 가속도 센서를 주 기판에 세워서 실장할 수도 있다.

또한, 자이로 센서는 각속도를 측정하는 센서로서, 기준 방향에 대해 돌아간 방향을 감지할 수 있다.

출력부(150)는 오디오 신호 또는 비디오 신호 또는 알람(alarm) 신호의 출력을 위한 것이다. 출력부(150)에는 디스플레이(151), 음향출력 모듈(153), 알람부(155), 및 햅틱 모듈(157) 등이 포함될 수 있다.

디스플레이(151)는 이동 단말기(100)에서 처리되는 정보를 표시 출력한다. 예를 들어 이동 단말기(100)가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 그리고 이동 단말기(100)가 화상 통화 모드 또는 촬영 모드인 경우, 촬영되거나 수신된 영상을 각각 혹은 동시에 표시할 수 있으며, UI, GUI를 표시한다.

한편, 전술한 바와 같이, 디스플레이(151)와 터치패드가 상호 레이어 구조를 이루어 터치스크린으로 구성되는 경우, 디스플레이(151)는 출력 장치 이외에 사용자의 터치에 의한 정보의 입력이 가능한 입력 장치로도 사용될 수 있다.

만일, 디스플레이(151)가 터치스크린으로 구성되는 경우, 터치스크린 패널, 터치스크린 패널 제어기 등을 포함할 수 있다. 이 경우, 터치스크린 패널은 외부에 부착되는 투명한 패널로서, 이동 단말기(100)의 내부 버스에 연결될 수 있다. 터치스크린 패널은 접촉 결과를 주시하고 있다가, 터치입력이 있는 경우 대응하는 신호들을 터치스크린 패널 제어기로 보낸다. 터치스크린 패널 제어기는 그 신호들을 처리한 다음 대응하는 데이터를 프로세서(180)로 전송하여, 프로세서(180)가 터치입력이 있었는지 여부와 터치스크린의 어느 영역이 터치 되었는지 여부를 알 수 있도록 한다.

디스플레이(151)는 전자종이(e-Paper)로 구성될 수도 있다. 전자종이(e-Paper)는 일종의 반사형 디스플레이로서, 기존의 종이와 잉크처럼 높은 해상도, 넓은 시야각, 밝은 흰색 배경으로 우수한 시각 특성을 가진다. 전자종이(e-Paper)는 플라스틱, 금속, 종이 등 어떠한 기판상에도 구현이 가능하고, 전원을 차단한 후에도 화상이 유지되고 백라이트(back light) 전원이 없어 이동 단말기(100)의 배터리 수명이 오래 유지될 수 있다. 전자종이로는 정전화가 충전된 반구형 트위스트 볼을 이용하거나, 전기영동법 및 마이크로 캡슐 등을 이용할 수 있다.

이외에도 디스플레이(151)는 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 중에서 적어도 하나를 포함할 수도 있다. 그리고, 이동 단말기(100)의 구현 형태에 따라 디스플레이(151)가 2개 이상 존재할 수도 있다. 예를 들어, 이동 단말기(100)에 외부 디스플레이(미도시)와 내부 디스플레이(미도시)가 동시에 구비될 수 있다.

음향출력 모듈(153)은 호 신호 수신, 통화 모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리(160)에 저장된 오디오 데이터를 출력한다. 또한, 음향출력 모듈(153)은 이동 단말기(100)에서 수행되는 기능, 예를 들어, 호 신호 수신음, 메시지 수신음 등과 관련된 오디오 신호를 출력한다. 이러한 음향출력 모듈(153)에는 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.

알람부(155)는 이동 단말기(100)의 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기(100)에서 발생하는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력 등이 있다. 알람부(155)는 오디오 신호나 비디오 신호 이외에 다른 형태로 이벤트 발생을 알리기 위한 신호를 출력한다. 예를 들면, 진동 형태로 신호를 출력할 수 있다. 알람부(155)는 호 신호가 수신되거나 메시지가 수신된 경우, 이를 알리기 위해 신호를 출력할 수 있다. 또한, 알람부(155)는 키 신호가 입력된 경우, 키 신호 입력에 대한 피드백으로 신호를 출력할 수 있다. 이러한 알람부(155)가 출력하는 신호를 통해 사용자는 이벤트 발생을 인지할 수 있다. 이동 단말기(100)에서 이벤트 발생 알림을 위한 신호는 디스플레이(151)나 음향출력 모듈(153)를 통해서도 출력될 수 있다.

햅틱 모듈(haptic module)(157)은 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(157)이 발생시키는 촉각 효과의 대표적인 예로는 진동 효과가 있다. 햅틱 모듈(157)이 촉각 효과로 진동을 발생시키는 경우, 햅택 모듈(157)이 발생하는 진동의 세기와 패턴 등은 변환가능하며, 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다.

햅틱 모듈(157)은 진동 외에도, 접촉 피부 면에 대해 수직 운동하는 핀 배열에 의한 자극에 의한 효과, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력을 통한 자극에 의한 효과, 피부 표면을 스치는 자극에 의한 효과, 전극(eletrode)의 접촉을 통한 자극에 의한 효과, 정전기력을 이용한 자극에 의한 효과, 흡열이나 발열이 가능한 소자를 이용한 냉/온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다. 햅틱 모듈(157)은 직접적인 접촉을 통해 촉각 효과의 전달할 수 있을 뿐만 아니라, 사용자의 손가락이나 팔 등의 근감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(157)은 이동 단말기(100)의 구성 태양에 따라 2개 이상이 구비될 수 있다.

메모리(160)는 프로세서(180)의 처리 및 제어를 위한 프로그램이 저장될 수도 있고, 입력되거나 출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)의 임시 저장을 위한 기능을 수행할 수도 있다.

메모리(160)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램, 롬 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 또한, 이동 단말기(100)는 인터넷(internet)상에서 메모리(150)의 저장 기능을 수행하는 웹 스토리지(web storage)를 운영할 수도 있다.

인터페이스부(170)는 이동 단말기(100)에 연결되는 모든 외부기기와의 인터페이스 역할을 수행한다. 이동 단말기(100)에 연결되는 외부기기의 예로는, 유/무선 헤드셋, 외부 충전기, 유/무선 데이터 포트, 메모리 카드(Memory card), SIM(Subscriber Identification Module) 카드, UIM(User Identity Module) 카드 등과 같은 카드 소켓, 오디오 I/O(Input/Output) 단자, 비디오 I/O(Input/Output) 단자, 이어폰 등이 있다. 인터페이스부(170)는 이러한 외부 기기로부터 데이터를 전송받거나 전원을 공급받아 이동 단말기(100) 내부의 각 구성 요소에 전달할 수 있고, 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 할 수 있다.

인터페이스부(170)는 이동 단말기(100)가 외부 크래들(cradle)과 연결될 때 연결된 크래들로부터의 전원이 이동 단말기(100)에 공급되는 통로가 되거나, 사용자에 의해 크래들에서 입력되는 각종 명령 신호가 이동 단말기(100)로 전달되는 통로가 될 수 있다.

프로세서(180)는 통상적으로 상기 각부의 동작을 제어하여 이동 단말기(100)의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 또한, 프로세서(180)는 멀티 미디어 재생을 위한 멀티미디어 재생 모듈(181)을 구비할 수도 있다. 멀티미디어 재생 모듈(181)은 프로세서(180) 내에 하드웨어로 구성될 수도 있고, 프로세서(180)와 별도로 소프트웨어로 구성될 수도 있다. 한편, 프로세서(180)는, 애플리케이션 구동을 위한 애플리케이션 프로세서(미도시)를 구비할 수 있다. 또는 애플리케이션 프로세서(미도시)는 프로세서(180)와 별도로 마련되는 것도 가능하다.

그리고, 전원 공급부(190)는 프로세서(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.

이와 같은 구성의 이동 단말기(100)는 유무선 통신 시스템 및 위성 기반 통신 시스템을 포함하여, 프레임(frame) 또는 패킷(packet)을 통하여 데이터(data)를 전송할 수 있는 통신 시스템에서 동작 가능하도록 구성될 수 있다.

도 3은 도 2의 이동 단말기를 전면에서 바라본 사시도이고, 도 4는 도 3에 도시한 이동 단말기의 후면 사시도이다. 이하에서는 도 3 및 도 4를 참조하여, 본 발명과 관련된 이동 단말기를 외형에 따른 구성요소 관점에서 살펴 보기로 한다. 또한, 이하에서는 설명의 편의상, 폴더 타입, 바 타입, 스윙타입, 슬라이더 타입 등과 같은 여러 타입의 이동 단말기들 중에서 전면 터치스크린이 구비되어 있는, 바 타입의 이동 단말기를 예로 들어 설명한다. 그러나, 본 발명은 바 타입의 이동 단말기에 한정되는 것은 아니고 전술한 타입을 포함한 모든 타입의 이동 단말기에 적용될 수 있다.

도 3을 참조하면, 이동 단말기(100)의 외관을 이루는 케이스는, 프론트 케이스(100-1)와 리어 케이스(100-2)에 의해 형성된다. 프론트 케이스(100-1)와 리어 케이스(100-2)에 의해 형성된 공간에는 각종 전자부품들이 내장된다.

본체, 구체적으로 프론트 케이스(100-1)에는 디스플레이(151), 제1 음향출력모듈(153a), 제1 카메라(121a), 및 제1 내지 제3 사용자 입력부(130a, 130b, 130c)가 배치될 수 있다. 그리고, 리어 케이스(100-2)의 측면에는 제4 사용자 입력부(130d), 제5 사용자 입력부(130e), 및 제1 내지 제3 마이크(123a, 123b, 123c)가 배치될 수 있다.

디스플레이(151)는 터치패드가 레이어 구조로 중첩됨으로써, 디스플레이(151)가 터치스크린으로 동작하여 사용자의 터치에 의한 정보의 입력이 가능하도록 구성할 수도 있다.

제1 음향출력 모듈(153a)은 리시버 또는 스피커의 형태로 구현될 수 있다. 제1 카메라(121a)는 사용자 등에 대한 이미지 또는 동영상을 촬영하기에 적절한 형태로 구현될 수 있다. 그리고, 마이크(123)는 사용자의 음성, 기타 소리 등을 입력받기 적절한 형태로 구현될 수 있다.

제1 내지 제5 사용자 입력부(130a, 130b, 130c, 130d, 130e)와 후술하는 제6 및 제7 사용자 입력부(130f, 130g)는 사용자 입력부(130)라 통칭할 수 있으며, 사용자가 촉각적인 느낌을 주면서 조작하게 되는 방식(tactile manner)이라면 어떤 방식이든 채용될 수 있다.

예를 들어, 사용자 입력부(130)는 사용자의 누름 또는 터치 조작에 의해 명령 또는 정보를 입력받을 수 있는 돔 스위치 또는 터치 패드로 구현되거나, 키를 회전시키는 휠 또는 조그 방식이나 조이스틱과 같이 조작하는 방식 등으로도 구현될 수 있다. 기능적인 면에서, 제1 내지 제3 사용자 입력부(130a, 130b, 130c)는 시작, 종료, 스크롤 등과 같은 명령을 입력하기 위한 것이고, 제4 사용자 입력부(130d)는 동작 모드의 선택 등을 입력하기 위한 것이다. 또한, 제5 사용자 입력부(130e)는 이동 단말기(100) 내의 특수한 기능을 활성화하기 위한 핫 키(hot-key)로서 작동할 수 있다.

제1 내지 제2 마이크(123a, 123b)는, 리어 케이스(100-2)의 상측, 즉, 이동 단말기(100)의 상측에, 오디오 신호 수집을 위해 배치되며, 제3 마이크(123c)는, 리어 케이스(100-2)의 하측, 즉, 이동 단말기(100)의 하측에, 오디오 신호 수집을 위해 배치될 수 있다.

도 4를 참조하면, 리어 케이스(100-2)의 후면에는 제2 카메라(121b), 및 제4 마이크(123d)가 추가로 장착될 수 있으며, 리어 케이스(100-2)의 측면에는 제6 및 제7 사용자 입력부(130f, 130g)와, 인터페이스부(170)가 배치될 수 있다.

제2 카메라(121b)는 제1 카메라(121a)와 실질적으로 반대되는 촬영 방향을 가지며, 제1 카메라(121a)와 서로 다른 화소를 가질 수 있다. 제2 카메라(121b)에 인접하게는 플래쉬(미도시)와 거울(미도시)이 추가로 배치될 수도 있다. 또한, 제2 카메라(121b) 인접하게 다른 카메라를 더 설치하여 3차원 입체 영상의 촬영을 위해 사용할 수도 있다.

플래쉬는 제2 카메라(121b)로 피사체를 촬영하는 경우에 상기 피사체를 향해 빛을 비추게 된다. 거울은 사용자가 제2 카메라(121b)를 이용하여 자신을 촬영(셀프 촬영)하고자 하는 경우에, 사용자 자신의 얼굴 등을 비춰볼 수 있게 한다.

리어 케이스(100-2)에는 제2 음향출력 모듈(미도시)가 추가로 배치될 수도 있다. 제2 음향출력 모듈은 제1 음향출력 모듈(153a)와 함께 스테레오 기능을 구현할 수 있으며, 스피커폰 모드로 통화를 위해 사용될 수도 있다.

인터페이스부(170)는 외부 기기와 데이터가 교환되는 통로로 사용될 수 있다. 그리고, 프론트 케이스(100-1) 및 리어 케이스(100-2)의 일 영역에는 통화 등을 위한 안테나 외에 방송신호 수신용 안테나(미도시)가 배치될 수 있다. 안테나는 리어 케이스(100-2)에서 인출 가능하게 설치될 수 있다.

리어 케이스(100-2) 측에는 이동 단말기(100)에 전원을 공급하기 위한 전원공급부(190)가 장착될 수 있다. 전원공급부(190)는, 예를 들어 충전 가능한 배터리로서, 충전 등을 위하여 리어 케이스(100-2)에 착탈 가능하게 결합될 수 있다.

제4 마이크(123d)는, 리어 케이스(100-2)의 전면, 즉, 이동 단말기(100)의 뒷면에, 오디오 신호 수집을 위해 배치될 수 있다.

한편, 본 실시 예에서, 제2 카메라(121b) 등이 리어 케이스(100-2)에 배치되는 것으로 설명하였으나, 반드시 이에 제한되는 것은 아니다. 또한, 제2 카메라(121b)가 별도로 구비되지 않더라도, 제1 카메라(121a)를 회전 가능하게 형성되어 제2 카메라(121b)의 촬영 방향까지 촬영 가능하도록 구성될 수도 있다.

먼저, 도 5a는, 이동 단말기(100)의 오디오 수신 모드에서, 카메라(121a)가 활성화되어, 화자(50)를 촬영한 촬영 이미지(500)를 획득하는 것을 예시한다. 특히, 도 5a는 오디오 수신 모드 중 스피커 모드(speaker mode)로 동작하는 것을 예시한다. 이에 따라, 이동 단말기(100)는, 스피커 모드를 나타내는 오브젝트(535)를 포함하는 스피커 모드 화면(530)을 표시할 수 있다.

다음, 도 5b는, 이동 단말기(100)의 이동시, 모션 센서(145)로부터 x,y,z 축의 위치 정보(Ip), 회전 등의 움직임에 따른 (가)속도 정보(Om)을 포함하는 모션 정보(Imot)를 획득하는 것을 예시한다.

다음, 도 5c는, 이동 단말기(100)의 오디오 수신 모드, 특히, 스피커 모드(speaker mode)에서, 화자(50)가 음성(Va)을 출력하는 경우, 각 마이크(123a,123b,123c,123d)에서, 각각 해당 오디오 신호(Vm1,Vm2,Vm3,Vm4)를 수집하는 것을 예시한다.

본 발명의 실시예에 따르면, 복수개의 마이크(123a,123b,123c,123d)를 구비하는 이동 단말기(100)에서, 최적의 오디오 신호 수집을 위해, 화자의 위치, 움직임, 이동 단말기의 움직임 등을 고려하여, 오디오 빔을 형성한다. 이를 위해, 도 5a 내지 도 5c는에서 도시한 바와 같이, 카메라(121)로부터 획득한 촬영 이미지, 모션 센서(145)로부터 획득한 모션 정보(Imot), 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호 중 적어도 하나에 기초하여, 오디오 빔을 형성할 수 있다.

도 5d는 본 발명과 관련한 오디오 빔포밍 처리를 위한 간략한 블록도를 도시한다. 도면을 참조하면, 영상표시장치(100) 내에, 오디오 빔 형성 등을 위한 빔 처리부(175)가 구비될 수 있다.

빔 처리부(175)는, 카메라(121)로부터 획득한 촬영 이미지, 모션 센서(145)로부터 획득한 모션 정보(Imot), 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호를 수신할 수 있다.

일예로, 빔 처리부(175)는, 이동 단말기와 화자가 이동 없이 고정된 경우, 모션 센서(145)로부터 움직임이 포착되지 않으므로, 화자를 촬영한 이미지, 특히, 화자의 입 위치에 기초하여, 오디오 빔 형성을 완료할 수 있다.

다른 예로, 빔 처리부(175)는, 이동 단말기는 고정이고, 화자가 이동하는 경우, 이동된 화자를 촬영한 촬영 이미지에 기초하거나, 이동된 화자를 촬영한 촬영 이미지, 및 수신되는 오디오 신호에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성할 수 있다.

또 다른 예로, 빔 처리부(175)는, 이동 단말기가 이동하는 경우, 이동된 화자를 촬영한 촬영 이미지, 및 수신되는 오디오 신호에 기초에 기초하거나, 이동된 화자를 촬영한 촬영 이미지, 모션 센서로부터의 이동 단말기의 움직임 정보, 및 수신되는 오디오 신호에 기초하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성할 수 있다.

또 다른 예로, 빔 처리부(175)는, 이동 단말기에 대해, 복수의 화자가 위치하는 경우, 각 화자의 위치에 대응하는, 복수의 오디오 빔을 형성할 수 있다.

또 다른 예로, 빔 처리부(175)는, 복수의 화자가 위치한 상태에서, 이미 오디오 빔이 형성된 화자 외의 다른 화자의 오디오 신호 입력이 있는 경우, 카메라로부터의 촬영 이미지, 및 다른 화자로부터의 오디오 신호에 기초하여, 제2 오디오 빔을 형성할 수 있다.

빔 처리부(175) 또는 프로세서(180)는 형성된 오디오 빔을 바탕으로, 오디오 수신 모드에서, 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호의 신호 처리를 수행할 수 있다. 예를 들어, 오디오 빔의 대역폭, 대역에 따른 매그니튜드(magnitude) 설정값에 따라, 수신되는 오디오 신호의 매그니튜드(magnitude)를 조정하거나, 위상값(phase)을 조정할 수 있다.

한편, 스피커 모드에서, 음량 출력 모듈(153)은, 형성된 오디오 빔에 따라 수신되어 신호 처리된 오디오 신호를 출력할 수 있다.

한편, 도 5d는, 빔 처리부(175)가 프로세서(180)와 별도인 것을 예시하나, 빔 처리부(175)가 프로세서(180) 내에 구비되는 것도 가능하다.

도 6은 본 발명의 일 실시예에 따른 이동 단말기의 동작 방법을 보여주는 순서도이고, 도 7a 내지 도 15c는 도 6의 이동 단말기의 동작 방법의 다양한 예를 설명하기 위해 참조되는 도면이다.

먼저, 도 6을 참조하면, 이동 단말기(100)는, 오디오 수신 모드에서, 카메라를 통해 촬영되는 촬영 이미지를 수신한다(S610). 그리고, 모션 센서로부터 모션 정보를 수신한다(S630).

이동 단말기(100)는, 오디오 수신 모드에서, 카메라(121), 모션 센서(145) 복수의 마이크(123a,123b,123c,123d)를 활성화시킬 수 있다. 그리고, 이동 단말기(100)는, 촬영되는 이미지, 센싱되는 위치 정보, 속도 정보 등의 모션 정보를 수신한다.

다음, 촬영 이미지와 모션 정보 중 적어도 하나에 기초하여, 화자 위치를 결정한다(S640). 그리고, 화자의 위치에 대응하여, 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성한다(S650).

이동 단말기(100) 내의 빔 처리부(175)는, 카메라(121)로부터 획득한 촬영 이미지, 모션 센서(145)로부터 획득한 모션 정보(Imot), 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호를 수신할 수 있다.

그리고, 빔 처리부(175)는, 도 5d에 대한 설명에서 기술한 다양한 예와 같이, 카메라(121)로부터 획득한 촬영 이미지, 모션 센서(145)로부터 획득한 모션 정보(Imot), 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호 중 적어도 하나에 기초하여, 오디오 빔(audio beam)을 형성할 수 있다.

예를 들어, 이동 단말기(100)를 기준으로, 화자(50)가 정면에 위치하는 경우, 이동 단말기(100) 주변의 오디오 필드에서, 화자(50)가 위치하는 각도에서의, 매그니튜드(magnitude)가 가장 크도록 설정하고, 다른 각도는 점차 작아지는 매그니튜드를 가지도록 설정할 수 있다.

다른 예로, 이동 단말기(100)를 기준으로, 화자(50)가 정면이 아닌, 대략 15도 각도에 위치하는 경우, 이동 단말기(100) 주변의 오디오 필드에서, 화자가 위치하는, 대략 15도 각도에서의, 매그니튜드(magnitude)가 가장 크도록 설정하고, 대략 15도 각도를 중심으로 다른 각도는 점차 작아지는 매그니튜드를 가지도록 설정할 수 있다.

다음, 복수의 마이크를 통해, 화자로부터 오디오 신호를 수신한다(S660). 그리고 형성된 오디오 빔에 기초하여, 수신되는 오디오 신호를 신호 처리한다(S670).

이동 단말기(100)는, 각 마이크(123a,123b,123c,123d)를 통해, 화자가 음성을 출력하는 경우, 화자로부터의 오디오 신호를 수신할 수 있다.

그리고, 이동 단말기(100) 내의 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔을 바탕으로, 오디오 수신 모드에서, 각 마이크(123a,123b,123c,123d)에서, 수집되는 오디오 신호의 신호 처리를 수행할 수 있다. 예를 들어, 오디오 빔의 대역폭, 대역에 따른 매그니튜드(magnitude) 설정값에 따라, 수신되는 오디오 신호의 매그니튜드(magnitude)를 조정하거나, 위상값(phase)을 조정할 수 있다.

이에 의해, 화자(50)의 위치에 대응하여, 최적의 오디오 신호를 수신할 수 있게 되며, 따라서, 사용자의 이용 편의성을 향상시킬 수 있게 된다.

이하에서는, 도 7a 내지 도 12f를 참조하여, 도 6의 다양한 동작방법의 다양한 예를 설명한다.

도 7a는, 이동 단말기와 화자가 이동 없이 고정된 경우, 이동 단말기(100)의 오디오 수신 모드에서, 카메라(121a)가 활성화되어, 화자(50)를 촬영한 촬영 이미지(500)를 획득하는 것을 예시한다. 특히, 도 7a는 오디오 수신 모드 중 스피커 모드(speaker mode)로 동작하는 것을 예시한다. 이에 따라, 이동 단말기(100)는, 스피커 모드를 나타내는 오브젝트(535)를 포함하는 스피커 모드 화면(530)을 표시할 수 있다.

이동 단말기(100) 내의 빔 처리부(175)는, 화자(50)를 촬영한 촬영 이미지(500)에 기초하여, 화자(50)의 위치 정보를 연산할 수 있다. 특히, 촬영된 이미지(500) 내의 화자(510)의 입(520)의 위치 정보를 연산할 수 있다.

이러한 위치 정보는, 이동 단말기(100) 대비, 화자의 입의 위치 정보로서, x,y,z축 상의 위치 정보일 수 있다.

도 7b는, x,y,z축 공간상에, P 위치에, 화자, 특히 화자의 입이 위치하는 것을 예시한다.

이동 단말기(100) 내의 빔 처리부(175)는, 연산된 화자(50)의 위치 정보에 기초하여, 화자(50)로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성할 수 있다.

오디오 빔은, x,y,z 축 공간상에 배치되는, 화자의 위치에 대응하여 형성될 수 있다. 예를 들어, 오디오 빔은, x,y,z 축 기반의 직교 좌표계를 기준으로, 화자의 위치에 대응하는, 오디오 필드로 구현될 수 있다. 이러한 오디오 필드는, 위치(x,y,z 좌표)에 따른, 매그니튜드가 다른 것으로 설정될 수 있다.

다른 예로, 오디오 빔은, 이동 단말기를 중심으로, 거리 및 각도로 표현되는 회전 좌표계(cylindrical coordinates)를 기준으로, 화자의 위치에 대응하는 오디오 필드로 구현될 수 있다. 이하에서는, 회전 좌표계를 중심으로 기술한다.

도 8b는 회전 좌표계를 중심으로 한 오디오 빔(806)을 예시한다. 이동 단말기가 P0에 위치에 있고, 화자가 P1 위치에 있는 경우, 이동 단말기와 화자는 회전 좌표계 상에서, 90도(θ1)의 각도를 이루며, 그에 따라, 이동 단말기(100) 내의 빔 처리부(175)는, 도 8b와 같은, 오디오 빔(806)을 형성할 수 있다. 도면을 보면, 90도 각도에서의, 오디오 신호 처리를 위한 매그니튜드(Am1)가 가장 크고, 다른 각도에서는 순차적으로 작아지는 것을 알 수 있다.

도 8b의 오디오 빔(806)이 형성된 경우, 프로세서(180)는, 도 7c와 같이, 스피커 모드 화면(530)상에, 오디오 빔 형성 완료를 나타내는 오브젝트(710)를 표시할 수 있다. 이에 의해, 화자는, 오디오 빔 형성 완료를 인식할 수 있게 된다. 그리고, 오디오 빔 형성 완료와 함께, 음성을 출력할 수 있게 된다.

도 7d는 오디오 빔 형성 완료에 따라, 화자(50)가 음성(715)을 출력하는 것을 예시한다. 카메라(121a)는, 화자를 촬영한 이미지(502)를 획득할 수 있다. 이때 촬영된 이미지(502)는, 화자(512)의 개구된 입 이미지(522)를 포함한다.

빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(502)와 마이크(123a,...,123d)를 통해 수신되는 오디오 신호에 기초하여, 화자가 오디오를 출력하고 있음을 파악할 수 있으며, 형성된 오디오 빔(806)에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 예를 들어, 이동 단말기(100)의 상측에 배치되는 마이크(123a,123b)에서 수신되는 오디오 신호의 게인(또는 매그니튜드)을 높게 설정하고, 이동 단말기(100)의 후면에 배치되는 마이크(123d)에서 수신되는 오디오 신호의 게인을 낮게 설정할 수 있다.

한편, 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔에 따른, 신호 처리 후, 잡음 제거 등의 후처리를 수행할 수 있다. 이에 의해, 최적의 오디오 신호를 획득할 수 있게 된다.

한편, 프로세서(180)는, 도 7d와 같이, 스피커 모드 화면(530) 상에, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(720)를 표시할 수 있다. 이에 의해, 오디오 수신 모드가 정상적으로 동작하고 있음을 파악할 수 있게 된다.

도 8a는, 이동 단말기는 고정이고, 화자가 좌측으로 이동(이동 단말기를 기준으로 우측으로 이동)하는 경우, 이동 단말기(100)의 오디오 수신 모드에서, 카메라(121a)가 활성화되어, 이동하는 화자(50)를 촬영한 촬영 이미지(501)를 획득하는 것을 예시한다.

도 7a 내지 도 7d에서, 90도 방향을 기준으로 오디오 빔(806)이 형성된 상태에서, 도 8a와 같이, 화자가 이동하는 경우, 오디오 빔을 업데이트할 필요가 발생한다.

이러한 경우, 프로세서(180)는, 이동하는 화자를 촬영한 이미지(501)를 기반으로, 화자 이동을 감지하고, 오디오 빔 미 형성을 나타내는 오브젝트(715)를 도면과 같이 표시하도록 제어할 수 있다.

그리고, 빔 처리부(175)는, 화자 이동에 대응하여, 오디오 빔을 업데이트한다.

이동 단말기(100) 내의 빔 처리부(175)는, 화자(50)를 촬영한 촬영 이미지(501)에 기초하여, 화자(50)의 위치 정보를 연산할 수 있다. 특히, 촬영된 이미지(501) 내의 화자(511)의 입(521)의 위치 정보를 연산할 수 있다.

화자(50)가 La 만큼 좌측으로 이동한 경우, 빔 처리부(175)는, 화자(50)를 촬영한 촬영 이미지(501)에 기초하여, 이동 단말기 대비 우측으로 이동한 것으로 판단하고, 도 8b와 같은 오디오 빔(808)을 형성할 수 있다.

이동 단말기가 P0에 위치에 있고, 화자가 P2 위치에 있는 경우, 이동 단말기와 화자는 회전 좌표계 상에서, 105도(θ2)의 각도를 이루며, 그에 따라, 이동 단말기(100) 내의 빔 처리부(175)는, 도 8b와 같은, 오디오 빔(808)을 형성할 수 있다. 도면을 보면, 105도 각도에서의, 오디오 신호 처리를 위한 매그니튜드(Am2)가 가장 크고, 다른 각도에서는 순차적으로 작아지는 것을 알 수 있다.

도 8b의 오디오 빔(808)이 형성된 경우, 프로세서(180)는, 도 8c와 같이, 스피커 모드 화면(530) 상에, 오디오 빔 형성 완료를 나타내는 오브젝트(710)를 표시할 수 있다. 이에 의해, 화자는, 화자 이동에 대응하는 오디오 빔 형성 완료를 인식할 수 있게 된다. 그리고, 오디오 빔 형성 완료와 함께, 음성을 출력할 수 있게 된다.

도 8d는 오디오 빔 형성 완료에 따라, 화자(50)가 음성(815)을 출력하는 것을 예시한다. 카메라(121a)는, 화자를 촬영한 이미지(501)를 획득할 수 있다. 이때 촬영된 이미지(501)는, 화자(511)의 개구된 입 이미지(522)를 포함한다.

빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(501)와 마이크(123a,...,123d)를 통해 수신되는 오디오 신호에 기초하여, 화자가 오디오를 출력하고 있음을 파악할 수 있으며, 형성된 오디오 빔(808)에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 예를 들어, 이동 단말기(100)의 상측에 배치되는 마이크 중 제2 마이크(123b) 보다 제1 마이크(123a)에서 수신되는 오디오 신호의 게인(또는 매그니튜드)을 더 높게 설정할 수 있다.

한편, 프로세서(180)는, 도 8d와 같이, 스피커 모드 화면(530) 상에, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(720)를 표시할 수 있다. 이에 의해, 오디오 수신 모드가 정상적으로 동작하고 있음을 파악할 수 있게 된다.

도 9a는 도 8a와 유사하나, 화자 이동이 아닌 이동 단말기의 이동에서 그 차이가 있다. 도 9a는 이동 단말기(100)가 우측으로 이동하는 경우, 이동 단말기(100)의 오디오 수신 모드에서, 카메라(121a)가 활성화되어, 이동하는 화자(50)를 촬영한 촬영 이미지(501)를 획득하는 것을 예시한다. 특히, 이동 단말기(100)가 La 만큼 우측으로 이동한 것을 예시한다.

도 7a 내지 도 7d에서, 90도 방향을 기준으로 오디오 빔(806)이 형성된 상태에서, 도 9a와 같이, 이동 단말기(100)가 이동하는 경우, 오디오 빔을 업데이트할 필요가 발생한다.

이러한 경우, 프로세서(180)는, 이동하는 화자를 촬영한 이미지(501), 및 모션 센서(145)의 모션 정보를 기반으로, 이동 단말기(100)의 이동을 감지하고, 오디오 빔 미 형성을 나타내는 오브젝트(715)를 도면과 같이 표시하도록 제어할 수 있다.

그리고, 빔 처리부(175)는, 이동 단말기(100)의 이동에 대응하여, 오디오 빔을 업데이트한다.

이동 단말기(100)가 La 만큼 우측으로 이동한 경우, 빔 처리부(175)는, 화자(50)를 촬영한 촬영 이미지(501), 및 모션 센서(145)에서 획득되는 우측 이동 정보를 포함하는 모션 정보에 기초하여, 도 8b와 같은 오디오 빔(808)을 형성할 수 있다.

도 8b의 오디오 빔(808)이 형성된 경우, 프로세서(180)는, 도 9b와 같이, 스피커 모드 화면(530) 상에, 오디오 빔 형성 완료를 나타내는 오브젝트(710)를 표시할 수 있다. 이에 의해, 화자는, 화자 이동에 대응하는 오디오 빔 형성 완료를 인식할 수 있게 된다. 그리고, 오디오 빔 형성 완료와 함께, 음성을 출력할 수 있게 된다.

도 9c는 오디오 빔 형성 완료에 따라, 화자(50)가 음성(915)을 출력하는 것을 예시한다. 카메라(121a)는, 화자를 촬영한 이미지(501)를 획득할 수 있다. 이때 촬영된 이미지(501)는, 화자(511)의 개구된 입 이미지(522)를 포함한다.

한편, 프로세서(180)는, 도 9c와 같이, 스피커 모드 화면(530) 상에, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(720)를 표시할 수 있다. 이에 의해, 오디오 수신 모드가 정상적으로 동작하고 있음을 파악할 수 있게 된다.

도 10a 내지 도 10d는 화자 정지시와 화자 이동시에 따른 오디오 빔을 비교 설명하기 위한 도면이다.

도 10a는, 화자 정지시(standing mode), 스피커 모드(speaker mode)로 동작하는 것을 예시한다. 상술한 바에 따라, 카메라(121a)에서 촬영된 이미지(100)에 기초하여, 도 10c와 같은, 오디오 빔을 형성할 수 있다.

도 10b는, 화자 이동시(walking mode), 스피커 모드(speaker mode)로 동작하는 것을 예시한다. 상술한 바에 따다라, 카메라(121a)에서 촬영된 이미지(100), 및 모션 센서(145)로부터의 모션 정보(Imot)에 기초하여, 도 10d와 같은, 오디오 빔을 형성할 수 있다.

도 10c의 오디오 빔(1030)과 도 10d의 오디오 빔(1040)을 비교하면, 화자 이동시의 오디오 빔의 대역폭이, 더 큰 것을 알 수 있다. 즉, 도 10d의 오디오 빔(1040)이 대부분의 각도에서, 일정한, 매그니튜드를 가지는 것을 알 수 있다. 도 10c는 특정 각도에서, 소정값 이상의 매그니튜드를 가지는 것을 알 수 있다. 한편, 화자 이동시의 오디오 빔의 최대 매그니튜드(Amy) 값이, 화자 정지시의 오디오 빔의 최대 매그니튜드(Amx) 값보다 더 큰 것이 바람직하다. 화자 이동시에는, 오디오 수집이 더 어려우므로, 매그니튜드를 더 크게 설정하는 것이 바람직하다.

도 11a 내지 도 11b는 화자가 이동 단말기를 쥐고 있는 경우와 테이블 상에 놓고 있는 경우를 비교 설명하기 위한 도면이다.

도 11a와 같이, 화자(50)가 손(55)으로 이동 단말기(100)를 들고 스피커 모드로 통화하는 경우와, 도 11b와 같이, 이동 단말기(100)가 테이블(1105) 상에 놓인 상태에서, 스피커 모드로 통화하는 경우, 모두, 카메라를 이용한 촬영 이미지(500,1100)에 기초하여, 오디오 빔을 형성할 수 있다. 이동 단말기(100)가 그립 센서(미도시)를 구비하는 경우, 이를 감지하고, 감지된 그립 정보, 및 촬영된 이미지에 기초하여, 오디오 빔을 형성할 수 있다. 도 11a의 경우, 이동 단말기(100)가 조금씩 흔들릴 수 있으므로, 도 11b의 경우 보다, 오디오 빔의 대역폭이 더 큰 것이 바람직하다. 즉, 도 11b에 따른 오디오 빔의 대역폭은, 도 10c에서 예시된 대역폭보다 더 작을 수 있다.

도 12a 내지 도 12f는, 복수의 화자가 있는 경우의 오디오 빔 형성을 설명하기 위해 참조되는 도면이다.

도 12a는 도 10a와 같이, 한 명의 화자(50)가, 이동 단말기(100)를 들고, 스피커 모드로 통화하는 경우, 한 명의 화자(50)를 중심으로 한 오디오 빔 형성이 완료된 것을 예시한다. 이동 단말기(100)는, 오디오 빔 형성 완료를 나타내는 오브젝트(710)를 표시할 수 있다. 빔 처리부(175)는, 카메라(121a)에서 촬영된 이미지(500)에 기초하여, 오디오 빔을 형성한다.

다음, 도 12b는, 복수의 화자(50a,50b)가 있는 경우, 어느 한 화자(50a)를 기준으로 오디오 빔 형성이 완료된 것을 예시한다. 이동 단말기(100)는, 오디오 빔 형성 완료를 나타내는 오브젝트(710)를 표시할 수 있다.

빔 처리부(175)는, 카메라(121a)에서 촬영된 이미지(500)에 기초하여, 오디오 빔을 형성한다. 특히, 빔 처리부(175)는, 이미지(500) 내의 복수의 화자 이미지(1220,1222) 중 중앙에 더 가까이 배치된 제1 화자(50a)를 파악하고, 해당하는 화자(50a)를 기준으로 오디오 빔을 형성할 수 있다.

도 12c는 오디오 빔 형성 완료에 따라, 제1 화자(50a)가 음성(1215)을 출력하는 것을 예시한다. 빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(502)와 마이크(123a,...,123d)를 통해 수신되는 오디오 신호에 기초하여, 제1 화자(50a)가 오디오를 출력하고 있음을 파악할 수 있으며, 형성된 오디오 빔(도 12e의 806)에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다

한편, 프로세서(180)는, 도 12c와 같이, 스피커 모드 화면(530) 상에, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(720)를 표시할 수 있다. 이에 의해, 오디오 수신 모드가 정상적으로 동작하고 있음을 파악할 수 있게 된다.

다음, 도 12d는, 제1 화자(50a)가 아닌 제2 화자(50b)가 음성(1216)을 출력하는 것을 예시한다.

빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(1200) 중 제2 화자 이미지 내의 입(1224)가 개구된 경우, 및 형성된 오디오 빔에 적합하지 않은, 오디오 신호가, 마이크(121)를 통해 수신되는 경우, 오디오 빔을 재형성할 것을 결정할 수 있다.

그리고, 프로세서(180)는, 도 12d와 같이, 오디오 빔 가변 중임을 나타내는 오브젝트(1212)를 표시할 수 있다.

빔 처리부(175)는, 제2 화자(50b)가 음성(1216)을 출력하는 경우, 바로, 촬영된 이미지(1200)에서, 제2 화자(50b)의 위치와, 제2 화자(50b)로부터의 음성(1216)에 의한 오디오 신호에 기초하여, 제2 오디오 빔(도 12e의 806)을 생성한다. 즉, 제1 오디오 빔(도 12e의 806)에서, 제2 오디오 빔(도 12e의 809)으로 전환한다.

즉, 제2 화자(50b)는, 제1 화자(50a) 대비 우측에 위치하므로, 이동 단말기(100)와 제2 화자(50b)는 회전 좌표계 상에서, 75도(θ3)의 각도를 이루며, 그에 따라, 이동 단말기(100) 내의 빔 처리부(175)는, 도 12e와 같은, 오디오 빔(809)을 형성할 수 있다. 도면을 보면, 75도 각도에서의, 오디오 신호 처리를 위한 매그니튜드(Am3)가 가장 크고, 다른 각도에서는 순차적으로 작아지는 것을 알 수 있다.

다음, 도 12f는, 제2 오디오 빔 형성 완료에 따라, 제2 화자(50b)가 음성(1217)을 출력하는 것을 예시한다. 카메라(121a)는, 복수 화자를 촬영한 이미지(1200)를 획득할 수 있다. 이때 촬영된 이미지(1200)는, 제2 화자(1222)의 개구된 입 이미지(1224)를 포함한다.

빔 처리부(175) 또는 프로세서(180)는, 촬영된 이미지(1200)와 마이크(123a,...,123d)를 통해 수신되는 오디오 신호에 기초하여, 제2 화자(50b)가 오디오를 출력하고 있음을 파악할 수 있으며, 형성된 오디오 빔(809)에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 예를 들어, 이동 단말기(100)의 상측에 배치되는 마이크 중 제1 마이크(123a) 보다 제2 마이크(123b)에서 수신되는 오디오 신호의 게인(또는 매그니튜드)을 더 높게 설정할 수 있다.

한편, 빔 처리부(175) 또는 프로세서(180)는, 형성된 제2 오디오 빔에 따른, 신호 처리 후, 잡음 제거 등의 후처리를 수행할 수 있다. 이에 의해, 최적의 오디오 신호를 획득할 수 있게 된다.

한편, 프로세서(180)는, 도 8d와 같이, 스피커 모드 화면상에, 형성된 제2 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(720)를 표시할 수 있다. 이에 의해, 오디오 수신 모드가 정상적으로 동작하고 있음을 파악할 수 있게 된다.

한편, 도 12b에서와 달리, 복수의 화자에 대해, 각각의 위치 정보에 기초하여, 각각의 오디오 빔을 형성하는 것도 가능하다. 즉, 제1 화자(50a)에 대해, 제1 오디오 빔(도 12e의 806)을 형성하고, 제2 화자(50b)에 대해, 제2 오디오 빔(도 12e의 809)를 형성한 후, 음성을 출력하는 화자에 대해, 대응하는 오디오 빔을 선택하여, 적용하는 것이 가능하다.

즉, 도 12c와 같이, 제1 화자(50a)가 음성(1215)를 출력하는 경우, 촬영 이미지(1200), 수신되는 오디오 신호 등에 기초하여, 제1 화자(50a)를 위해 생성된 제1 오디오 빔을 바탕으로 수신되는 오디오 신호를 신호 처리하는 것이 가능하다.

또는, 도 12d나 도 12f와 같이, 제2 화자(50b)가 음성(1216 또는 1217)를 출력하는 경우, 촬영 이미지(1200), 수신되는 오디오 신호 등에 기초하여, 제2 화자(50b)를 위해 생성된 제2 오디오 빔을 바탕으로 수신되는 오디오 신호를 신호 처리하는 것이 가능하다. 이러한 방법은, 즉각적인 대응이 가능하므로, 오디오 신호 손실 없이, 대응하는 오디오 빔에 따라 신호 처리가 가능하다는 장점이 있다.

다음, 도 13a 내지 도 15c는, 오디오 수신 모드의 다른 예를 예시하는 도면이다.

오디오 수신 모드는, 통화 모드, 녹음모드, 또는 음성인식 모드를 포함할 수 있다. 특히, 통화 모드는, 스피커 모드를 포함할 수 있다. 도 7a 내지 도 12f는 통화 모드 중 스피커 모드를 중심으로 기술하였는데, 이하에서는 다른 모드에 대해 기술한다.

먼저, 도 13a는 음성 통화(voice talk) 모드를 예시한다. 이에 따라, 이동 단말기(100)는 음성 통화 모드를 나타내는 오브젝트(1435)를 포함하는 음성 통화 모드 화면(1430)을 표시할 수 있다. 이때, 카메라(121a)가 화자(50)를 촬영할 수 있으며, 촬영된 이미지에 기초하여, 오디오 빔을 형성할 수 있다. 도면에서는, 화자가 이동 단말기 화면을 보고 있는 것을 예시하나, 화자의 귀에, 이동 단말기가 부착되는 경우에도, 카메라(121a)가 활성화될 수 있으며, 화자의 귀 이미지에 기초하여, 오디오 빔을 형성할 수 있다.

다음, 도 13b는, 오디오 빔 형성이 완료되어, 오디오 빔 형성 완료를 나타내는 오브젝트(1413)가 표시되는 것을 예시한다. 한편, 도면과 달리, 오디오 빔 형성 완료를 나타내는 비프(beep)음 등의 오디오 신호가 출력되는 것도 가능하다.

다음, 도 13c는, 오디오 빔 형성 완료에 따라, 화자(50)가 음성(1415)을 출력하는 것을 예시한다. 이때, 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 한편, 이동 단말기(100)는, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(1417)를 표시할 수 있다. 또는, 도면과 달리, 오디오 신호 처리가 정상 수행되고 있음을 나타내는 비프(beep)음 등의 오디오 신호가 출력되는 것도 가능하다. 한편, 카메라(121a)는, 계속하여, 화자를 촬영한 이미지(1401)를 획득할 수 있다. 이때 촬영된 이미지(1401)는, 화자 이미지(1411)의 개구된 입 이미지(1421)를 포함할 수 있다.

다음, 도 14a는 녹음(voice recording) 모드를 예시한다. 이에 따라, 이동 단말기(100)는 녹음 모드를 나타내는 오브젝트(1535)를 포함하는 녹음 모드 화면(1530)을 표시할 수 있다. 이때, 카메라(121a)가 화자(50)를 촬영할 수 있으며, 촬영된 이미지에 기초하여, 오디오 빔을 형성할 수 있다.

다음, 도 14b는, 오디오 빔 형성이 완료되어, 오디오 빔 형성 완료를 나타내는 오브젝트(1513)가 표시되는 것을 예시한다.

다음, 도 14c는, 오디오 빔 형성 완료에 따라, 화자(50)가 음성(1515)을 출력하는 것을 예시한다. 이때, 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 한편, 이동 단말기(100)는, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(1517)를 표시할 수 있다. 한편, 카메라(121a)는, 계속하여, 화자를 촬영한 이미지(1501)를 획득할 수 있다. 이때 촬영된 이미지(1501)는, 화자 이미지(1511)의 개구된 입 이미지(1521)를 포함할 수 있다.

다음, 도 15a는 음성 인식(voice recognition) 모드를 예시한다. 이에 따라, 이동 단말기(100)는 음성 인식 모드를 나타내는 오브젝트(1635)를 포함하는 음성 인식 모드 화면(1630)을 표시할 수 있다. 이때, 카메라(121a)가 화자(50)를 촬영할 수 있으며, 촬영된 이미지에 기초하여, 오디오 빔을 형성할 수 있다.

다음, 도 15b는, 오디오 빔 형성이 완료되어, 오디오 빔 형성 완료를 나타내는 오브젝트(1613)가 표시되는 것을 예시한다.

다음, 도 15c는, 오디오 빔 형성 완료에 따라, 화자(50)가 음성(1615)을 출력하는 것을 예시한다. 이때, 빔 처리부(175) 또는 프로세서(180)는, 형성된 오디오 빔에 따라, 각 마이크(123a,...,123d)로부터 수신되는 오디오 신호를 신호 처리할 수 있다. 한편, 이동 단말기(100)는, 형성된 오디오 빔에 따라 오디오 신호 처리가 수행되고 있음을 나타내는 오브젝트(1617)를 표시할 수 있다. 한편, 카메라(121a)는, 계속하여, 화자를 촬영한 이미지(1601)를 획득할 수 있다. 이때 촬영된 이미지(1601)는, 화자 이미지(1611)의 개구된 입 이미지(1621)를 포함할 수 있다.

한편, 도 7a 내지 도 12f에서 상술한, 화자 이동히는 경우, 이동 단말기 이동하는 경우, 복수의 화자가 위치하는 경우 등은, 각각, 오디오 수신 모드 중 통화 모드, 녹음모드, 또는 음성인식 모드 하에서도 동일 또는 유사하게 적용될 수 있다.

본 발명에 따른 이동 단말기, 및 그 동작방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

예를 들어, 본 발명의 실시예에 따른 오디오 빔 형성 방법은, 영상표시장치, 특히, TV 등에도 채택이 가능하다. 카메라를 구비하는 TV에서, 카메라로부터의 촬영 이미지에 기초하여, TV는 화자의 위치에 대응하는 오디오 빔을 형성할 수 있다. 또는, 카메라로부터의 촬영 이미지 및 TV에 구비되는 마이크에서 수신되는 화자의 음성 신호에 기초하여, TV는 화자의 위치에 대응하는 오디오 빔을 형성할 수 있다. 또는, TV를 원격제어하는 원격제어장치에 구비되는 마이크에서의 오디오 신호, 원격제어장치에 구비되는 모션 센서로부터의 움직임 정보에 기초하여, 원격제어장치가, 화자의 위치에 대응하는 오디오 빔을 형성할 수 있다. 또는, 카메라로부터의 촬영 이미지 및 TV에 구비되는 마이크에서 수신되는 화자의 음성 신호에 기초하여, TV 또는 원격제어장치가, 화자의 위치에 대응하는 오디오 빔을 형성할 수 있다.

한편, 본 발명의 이동 단말기의 동작 방법은, 영상표시장치에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims

카메라, 모션 센서, 및 복수개의 마이크를 구비하는 이동 단말기의 동작 방법에 있어서,

상기 카메라로부터의 촬영 이미지와, 상기 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하는 단계;

상기 복수의 마이크를 통해, 상기 화자로부터의 오디오 신호를 수신하는 단계; 및

상기 형성된 오디오 빔에 기초하여, 상기 수신되는 오디오 신호를 신호 처리하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 오디오 빔 형성 완료시, 이를 나타내는 오브젝트를 표시하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

오디오 수신 모드로 진입하는 단계; 및

상기 오디오 수신 모드 진입시, 상기 카메라, 상기 모션 센서, 상기 복수의 마이크를 활성화하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 오디오 빔 형성 단계는,

상기 오디오 입력 모드에서, 상기 화자를 촬영한 이미지 중 상기 화자의 입 위치에 대응하여, 상기 오디오 빔을 형성하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 카메라로부터의 촬영 이미지와, 상기 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 화자의 위치를 결정하는 단계;를 더 포함하고,

상기 오디오 빔을 형성 단계는, 상기 화자 위치에 대응하여, 상기 오디오 빔을 형성하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 오디오 빔 형성 이후, 상기 화자가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 오디오 빔 형성, 및 상기 오디오 신호 수신 이후, 상기 화자가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지, 및 상기 수신되는 오디오 신호에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 오디오 빔 형성 이후, 상기 이동 단말기가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지, 및 상기 모션 센서로부터의 상기 이동 단말기의 움직임 정보에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 오디오 빔 형성, 및 상기 오디오 신호 수신 이후, 상기 이동 단말기가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지, 상기 모션 센서로부터의 상기 이동 단말기의 움직임 정보, 및 상기 수신되는 오디오 신호에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 오디오 빔 형성 단계는,

상기 촬영된 이미지 내에 복수의 화자가 포함되는 경우, 상기 이미지 내의 중앙에 더 가까이 배치되는, 화자에, 대응하여, 오디오 빔을 형성하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 오디오 빔 형성 단계는,

상기 촬영된 이미지 내에 복수의 화자가 포함되는 경우, 각 화자의 위치에 대응하는, 복수의 오디오 빔을 형성하고,

상기 형성된 복수의 오디오 빔 중, 상기 복수의 화자 중 입을 움직이는 화자에 대응하는, 오디오 빔을 활성화시키는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 오디오 빔 형성 이후, 상기 화자 외에 다른 화자로부터의 오디오 신호 입력이 있는 경우, 상기 카메라로부터의 촬영 이미지, 및 상기 다른 화자로부터의 오디오 신호에 기초하여, 제2 오디오 빔을 형성하는 단계;를 더 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
제1항에 있어서,

상기 화자가 이동하는 경우, 상기 화자 이동에 따른 오디오 빔을 업데이트하는 단계;를 더 포함하며,

상기 화자 이동시의 오디오 빔의 대역폭은, 상기 화자의 정지시의 오디오 빔의 대역폭보다, 더 큰 것을 특징으로 하는 이동 단말기의 동작 방법.
카메라, 모션 센서, 및 복수개의 마이크를 구비하는 이동 단말기의 동작 방법에 있어서,

오디오 수신 모드로 진입하는 단계;

상기 카메라, 모션 센서 및 복수개의 마이크를 활성화하는 단계;

상기 카메라로부터의 촬영 이미지와, 상기 모션 센서로부터의 모션 정보 중 적어도 하나에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하는 단계; 및

상기 오디오 빔 형성 완료시, 이를 나타내는 오브젝트를 표시하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 동작 방법.
카메라;

이동 단말기의 움직임 정보를 감지하는 모션 센서;

오디오 신호를 수집하는 복수개의 마이크; 및

상기 카메라로부터의 촬영 이미지와, 상기 모션 센서로부터의 움직임 정보 중 적어도 하나에 기초하여, 화자의 위치를 결정하며, 상기 화자의 위치에 대응하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 형성하며, 상기 복수의 마이크를 통해, 상기 수신되는 오디오 신호를, 상기 형성된 오디오 빔에 기초하여, 신호 처리하는 빔 처리부;를 포함하는 것을 특징으로 하는 이동 단말기.
제15항에 있어서,

상기 오디오 빔 형성 완료시, 이를 나타내는 오브젝트를 표시하는 디스플레이;를 더 포함하는 것을 특징으로 하는 이동 단말기.
제15항에 있어서,

오디오 수신 모드 진입시, 상기 카메라, 상기 모션 센서, 상기 복수의 마이크를 활성화시키는 프로세서;를 더 포함하는 것을 특징으로 하는 이동 단말기.
제15항에 있어서,

상기 빔 처리부는,

상기 오디오 빔 형성, 및 상기 오디오 신호 수신 이후, 상기 화자가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지, 및 상기 수신되는 오디오 신호에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 것을 특징으로 하는 이동 단말기.
제15항에 있어서,

상기 빔 처리부는,

상기 오디오 빔 형성, 및 상기 오디오 신호 수신 이후, 상기 이동 단말기가 이동하는 경우, 상기 이동된 화자를 촬영한 촬영 이미지, 상기 모션 센서로부터의 상기 이동 단말기의 움직임 정보, 및 상기 수신되는 오디오 신호에 기초하여, 상기 화자로부터의 오디오 신호를 수집하기 위한 오디오 빔을 업데이트하는 것을 특징으로 하는 이동 단말기.
제15항에 있어서,

상기 빔 처리부는,

상기 오디오 빔 형성 이후, 상기 화자 외에 다른 화자로부터의 오디오 신호 입력이 있는 경우, 상기 카메라로부터의 촬영 이미지, 및 상기 다른 화자로부터의 오디오 신호에 기초하여, 제2 오디오 빔을 형성하는 것을 특징으로 하는 이동 단말기.