KR101951419B1

KR101951419B1 - 이동 단말기 및 그의 오디오/비디오 듀얼 포커싱 방법

Info

Publication number: KR101951419B1
Application number: KR1020120068210A
Authority: KR
Inventors: 이건섭; 이용희; 송호성; 김준태; 손영주
Original assignee: 엘지전자 주식회사
Priority date: 2012-06-25
Filing date: 2012-06-25
Publication date: 2019-02-22
Also published as: KR20140000586A

Abstract

본 발명은 동영상 촬영 또는 재생시 영상에 기반하여 오디오를 효과적으로 취음할 수 있는 이동 단말기 및 그의 오디오 줌잉방법에 관한 것으로, 소정의 취음 범위에서 피사체의 소리를 취음하면서 피사체를 촬영할 때 상기 피사체의 촬영 위치나 범위 또는 촬영 모드를 변경하는 이벤트 발생가 발생되면 해당 이벤트에 따라 취음 각도를 변경하여 취음 범위를 자동 조절하여 피사체의 소리를 취음한다.

Description

이동 단말기 및 그의 오디오/비디오 듀얼 포커싱 방법{MOBILE TERMINAL AND AUDIO/VIDEO DUAL FOCUSING METHOD THEREOF}

본 발명은 동영상 촬영 및 재생시 피사체와 다른 위치에 오디오 포커싱을 적용하여 피사체의 소리를 취음할 수 있는 이동 단말기 및 오디오/비디오 듀얼 포커싱 (Audio/Video Dual Focusing) 방법에 관한 것이다.

이동 단말기에는 카메라를 이용하여 피사체를 촬영하기 위한 다양한 기능을 제공하고 있다. 사용자는 카메라의 제어 옵션(control options)을 조작하여 특정 피사체를 중심으로 영상을 확대하거나, 영상의 초점을 수동/자동으로 조절하거나 또는 얼굴인식 기등을 이용하여 원하는 영상을 촬영을 수행한다.

예를들어 사용자는 피사체의 위치에 따라 이동 단말기의 전면 혹은 후면 카메라를 선택적으로 사용하여 촬영을 수행할 수 있으며, 특히 장면(예, 풍경, 사람)에 따라 모드(인물모드 또는 장면모드)를 변환하여 촬영을 수행할 수 있다. 또한, 사용자는 재생시에도 화면의 특정 영역을 중심으로 선택적으로 확대하거나 초점을 재조정 할 수 있다.

상기와 같은 다양한 촬영 기법을 이용하여 관심 피사체 또는 장면을 촬영할 때 피사체가 발생하는 음성 또는 소리는 마이크로 폰 어레이에 의해 취음되어 저장된다.

그런데, 다양한 촬영 기법을 이용하여 관심 피사체 또는 장면을 촬영할 때 종래에는 피사체가 발생하는 소리뿐만 아니라 주변의 소리 및 잡음도 함께 취음 (Capturing)되는 단점이 있다. 이러한 문제점을 해소하기 위하여 터치 또는 레이저 포인터에 의해 화면상의 음원(관심 피사체 혹은 특정 영역)을 포인팅하여, 상기 포인팅된 피사체나 영역의 소리를 선택적으로 취음하고 있다.

하지만, 상기 수동 포인팅에 의한 취음방법은 사용자가 일일이 음원을 포인팅해야 하는 단점이 있으며, 특히 촬영 영상과 연동없이 단지 특정 피사체 또는 영역의 소리를 취음하기 때문에 동영상 재생시 영상과 소리가 일치하지 않는 한계가 있다. 특히 종래의 취음 방법은 피사체가 화면의 중앙부근에 위치하고, 소리 역시 해당 피사체에서 발생된다는 가정하에 상기 피사체로부터 발생하는 소리만을 항상 포커싱하여(고정하여) 취음하고 있다.

그런데, 상기와 같은 취음 방법은 피사체의 위치와 해당 피사체가 발생하는 사운드의 위치가 상이할 경우에는 상당히 제한적인 취음 성능을 나타낸다. 예를 들어, 가수나 강사가 마이크를 사용해 노래나 강의를 하는 실제 상황에서는 비록 가수나 강사가 화면 중앙에 위치하고 있더라고 해당 노래나 목소리를 전달하는 스피커는 다른 위치에 존재하는 경우가 많다.

이러한 경우 가수나 강사의 위치를 기준으로 소리를 취음하면 상기 가수나 강사의 목소리가 제거되는 역효과가 발생한다. 이러한 단점을 극복하기 위하여 스피커에서 발생하는 소리를 전부 촬영하기 위해서 와이드(Wide) 화면으로 촬영하면 오히려 불필요한 배경 화면과 주변 잡음이 포함되는 단점이 있었다.

따라서, 본 발명의 목적은 촬영 및 재생하고자 하는 피사체와 다른 위치에 소리 지향성을 형성하여 해당 피사체의 사운드를 최적으로 취음할 수 있는 이동 단말기 및 그의 오디오/비디오 듀얼 포커싱 방법을 제공하는데 있다.

본 발명의 다른 목적은 화면안과 밖에 존재하는 음원들의 정보를 시각적으로 제공하여 사용자가 취음 위치와 방향을 선택할 수 있는 이동 단말기 및 그의 오디오/비디오 듀얼 포커싱 방법을 제공하는데 있다.

상기와 같은 목적을 달성하기 위하여 본 발명에 따른 이동 단말기의 오디오/비디오 듀얼 포커싱 방법, 촬영 모드에서 피사체에 포커싱하여 영상을 촬영하는 단계; 상기 피사체의 소리를 출력하는 화면안밖의 음원들을 자동 인식하여 화면 일측의 오디오 썸네일에 표시하는 단계; 상기 오디오 썸네일에서 사용자에 의해 선택된 음원에 지향성을 형성하여 오디오 포커싱을 수행하는 단계; 및 상기 오디오 포커싱된 음원을 취음하는 단계;를 포함한다.

상기 오디오 썸네일은 반투명 형태로 표시된다.

상기 오디오 썸네일은 터치시 확대되어 촬영 영상에 오버레이된다.

상기 오디오 썸네일은 화면안밖에 존재하는 음원의 위치와 크기를 표시한다.

상기 오디오 썸네일에서 화면안의 음원은 취음 영역으로 표시되고, 상기 화면밖의 음원들을 아이콘 형태로 표시된다.

상기 음원 아이콘은 음원의 위치와 대응되어 표시되며, 상기 음원의 추가 또는 삭제에 따라 추가 또는 삭제된다.

상기 음원 아이콘은 서로 다른 모양 및 색상을 갖는다.

상기 음원 아이콘은 음원의 방향, 위치 및 소리의 크기를 나타낸다.

상기 음원은 오디오 썸네일에서 선택되거나 또는 촬영 영상에 오버레이된 오디오 썸네일에서 선택된다.

상기 음원은 오디오 썸네일에서 사용자에 의해 직접 선택되거나 화면밖의 특정 음원을 피사체로 드래그하여 선택된다.

상기와 같은 목적을 달성하기 위하여 본 발명에 따른 이동 단말기는, 촬영 모드에서 피사체에 포커싱된 영상을 표시하는 디스플레이부; 및 피사체의 소리를 출력하는 화면안밖의 음원들을 자동 인식하여 화면 일측의 오디오 썸네일에 표시하고, 오디오 썸네일에서 사용자에 의해 선택된 음원에 오디오 포커싱을 수행하여 해당 음원을 취음하는 제어부;를 포함한다.

상기 오디오 썸네일은 반투명 형태로 표시된다.

상기 제어부는 오디오 썸네일이 선택되면 오디오 썸네일을 확대하여 촬영 영상에 오버레이한다.

상기 제어부는 오디오 썸네일에 화면안밖에 존재하는 음원의 위치와 크기를 표시한다.

상기 제어부는 음원의 위치와 대응되어 음원 아이콘을 표시하고, 상기 음원의 추가 또는 삭제에 따라 음원 아이콘을 추가 또는 삭제한다.

상기 음원 아이콘은 서로 다른 모양 및 색상을 갖는다.

상기 음원은 오디오 썸네일에서 사용자에 의해 직접 선택되거나 화면밖의 특정 음원을 피사체로 드래그하여 선택한다.

본 발명은 촬영 또는 재생하고자 하는 피사체와 다른 위치에 사운드 위치가 존재할 경우 상기 사운드 위치에 소리 지향성을 형성함으로써 해당 피사체의 사운드를 최적으로 취음할 수 있는 효과가 있다.

또한, 본 발명은 정면 방향에 위치하는 피사체를 촬영 또는 재생하면서 동시에 화면 내 혹은 외에 존재하는 사운드의 정보(음원의 위치, 크기 및 방향을)를 시각적으로 제공함으로써 사용자가 취음 위치와 방향을 적절히 선택하여 피사체의 사운드를 최적으로 취음할 수 있는 효과가 있다.

도 1은 본 발명의 일 실시예에 관련된 이동 단말기의 블록 구성도.
도 2는 본 발명의 일 실시예에 관련된 이동 단말기가 동작할 수 있는 무선 통신 시스템에 대한 블록도.
도 3은 촬영 모드에서 오디오 줌잉 기술의 적용 예.
도 4는 촬영 화면에서 취음 각도와 취음 범위간 관계를 나타낸 도면.
도 5는 종래 피사체의 위치와 피사체에서 발생되는 소리의 위치가 다른 경우 소리를 취음하는 일 예를 나타낸 도면.
도 6은 본 발명의 실시예에 따른 오디오/비디오 듀얼 포커싱 방법의 개념도.
도 7은 본 발명의 실시예에 따른 오디오/비디오 듀얼 포커싱 방법에 의해 영상을 촬영할 때 사운드의 위치를 표시하는 일 예.
도 8은 촬영 화면에서 제어 아이콘을 활성화하는 예.
도 9는 오디오 썸네일을 촬영 영상에 오버레이하는 예.
도 10a 및 도 10b는 촬영 영상에 오버레이된 오디오 썸네일에 사운드 아이콘을 표시하는 예.
도 11은 오디오 썸네일에서 취음할 대상을 선택하는 예.
도 12는 음원 포커싱과 피사체 포커싱을 동시에 수행하는 예.
도 13은 본 발명의 실시예에 따른 이동 단말의 오디오/비디오 듀얼 포커싱 방법을 나타낸 순서도.

이하, 본 발명과 관련된 이동 단말기에 대하여 도면을 참조하여 보다 상세하게 설명한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 단순히 본 명세서 작성의 용이함만이 고려되어 부여되는 것으로서, 그 자체로 특별히 중요한 의미 또는 역할을 부여하는 것은 아니다. 따라서, 상기 "모듈" 및 "부"는 서로 혼용되어 사용될 수도 있음을 유념해야 한다.

단말기는 다양한 형태로 구현될 수 있다. 예를 들어, 본 명세서에서 기술되는 단말기에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(notebook computer), 디지털방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션 등과 같은 이동 단말기와, 디지털 TV, 데스크탑 컴퓨터 등과 같은 고정 단말기가 있다. 이하의 설명에서는 상기 단말기가 이동 단말기인 것으로 가정하고 설명한다. 그러나, 이하의 설명에 따른 구성은 이동용을 위해 특별히 구성된 구성요소를 제외한다면 상기 고정 단말기에도 적용될 수도 있음을 본 기술분야의 당업자라면 쉽게 알 수 있을 것이다.

도 1은 본 발명의 일 실시예와 관련된 이동 단말기의 블록 구성도(block diagram)이다.

상기 이동 단말기(100)는 무선 통신부(110), A/V(Audio/Video) 입력부(120), 사용자 입력부(130), 센싱부(140), 출력부(150), 메모리(160), 인터페이스부(170), 제어부(180) 및 전원 공급부(190) 등을 포함할 수 있다. 도 1은 다양한 구성요소를 가지고 있는 이동 단말기를 나타내고 있다. 그러나 도시된 구성요소 모두가 필수구성요소인 것은 아니다. 도시된 구성요소 보다 많은 구성요소에 의해 이동 단말기가 구현될 수도 있고, 그 보다 적은 구성요소에 의해서도 이동 단말기가 구현될 수 있다.

이하 상기 구성요소들에 대해 차례로 살펴본다.

무선 통신부(110)는 이동 단말기(100)와 무선 통신 시스템 간의 무선 통신 또는 이동 단말기(100)와 이동 단말기(100)가 위치한 네트웍간의 무선 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 예를 들어, 무선 통신부(110)는 방송 수신 모듈(111), 이동통신 모듈(112), 무선 인터넷 모듈(113), 근거리 통신 모듈(114) 및 위치정보 모듈(115) 등을 포함할 수 있다.

방송 수신 모듈(111)은 방송 채널을 통하여 외부의 방송 관리 서버로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 상기 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 상기 방송 관리 서버는, 방송 신호 및/또는 방송 관련 정보를 생성하여 송신하는 서버 또는 기 생성된 방송 신호 및/또는 방송 관련 정보를 제공받아 단말기에 송신하는 서버를 의미할 수 있다. 상기 방송 관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 상기 방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다.

한편, 상기 방송 관련 정보는, 이동통신망을 통하여도 제공될 수 있으며, 이러한 경우에는 상기 이동통신 모듈(112)에 의해 수신될 수 있다.

상기 방송 관련 정보는 다양한 형태로 존재할 수 있다. 예를 들어, DMB(Digital Multimedia Broadcasting)의 EPG(Electronic Program Guide) 또는 DVB-H(Digital Video Broadcast-Handheld)의 ESG(Electronic Service Guide) 등의 형태로 존재할 수 있다.

상기 방송 수신 모듈(111)은, 각종 방송 시스템을 이용하여 방송 신호를 수신하는데, 특히, DMB-T(Digital Multimedia Broadcasting-Terrestrial), DMB-S(Digital Multimedia Broadcasting-Satellite), MediaFLO(Media Forward Link Only), DVB-H(Digital Video Broadcast-Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등의 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 물론, 상기 방송 수신 모듈(111)은, 상술한 디지털 방송 시스템뿐만 아니라 방송 신호를 제공하는 모든 방송 시스템에 적합하도록 구성된다.

방송 수신 모듈(111)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는 메모리(160)에 저장될 수 있다.

또한, 이동통신 모듈(112)은, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기에서, 상기 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.

무선 인터넷 모듈(113)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 무선 인터넷 모듈(113)은 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN (Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다.

근거리 통신 모듈(114)은 근거리 통신을 위한 모듈을 말한다. 근거리 통신 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), ZigBee 등이 이용될 수 있다.

또한, 위치정보 모듈(115)은 이동 단말기의 위치를 확인하거나 얻기 위한 모듈이다. 상기 위치정보 모듈(115)의 대표적인 예로는 GPS(Global Position System) 모듈이 있다. 현재 기술에 의하면, 상기 GPS모듈은 3개 이상의 위성으로부터 떨어진 거리 정보와 정확한 시간 정보를 산출한 다음 상기 산출된 정보에 삼각법을 적용함으로써, 위도, 경도, 및 고도에 따른 3차원의 현 위치 정보를 정확히 산출할 수 있다. 현재, 3개의 위성을 이용하여 위치 및 시간 정보를 산출하고, 또 다른 1개의 위성을 이용하여 상기 산출된 위치 및 시간 정보의 오차를 수정하는 방법이 널리 사용되고 있다. 또한, GPS 모듈은 현 위치를 실시간으로 계속 산출함으로써 속도 정보를 산출할 수 있다.

한편, A/V(Audio/Video) 입력부(120)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(121)와 마이크(122) 등이 포함될 수 있다. 카메라(121)은 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 그리고, 처리된 화상 프레임은 디스플레이 모듈(151)에 표시될 수 있다.

카메라(121)에서 처리된 화상 프레임은 메모리(160)에 저장되거나 무선 통신부(110)를 통하여 외부로 전송될 수 있다. 카메라(121)은 단말기의 구성 태양에 따라 2개 이상이 구비될 수도 있다.

마이크(122)는 통화모드 또는 녹음모드, 음성인식 모드 등에서 마이크로폰 (Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 그리고, 처리된 음성 데이터는 통화 모드인 경우 이동통신 모듈(112)를 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(122)는 외부의 음향 신호를 입력 받는 과정에서 발생되는 잡음(noise)를 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.

사용자 입력부(130)는 사용자가 단말기의 동작 제어를 위한 입력 데이터를 발생시킨다. 사용자 입력부(130)는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다. 특히, 터치 패드가 후술하는 디스플레이 모듈(151)과 상호 레이어 구조를 이룰 경우, 이를 터치 스크린이라 부를 수 있다.

센싱부(140)는 이동 단말기(100)의 개폐 상태, 이동 단말기(100)의 위치, 사용자 접촉 유무, 이동 단말기의 방위, 이동 단말기의 가속/감속 등과 같이 이동 단말기 (100)의 현 상태를 감지하여 이동 단말기(100)의 동작을 제어하기 위한 센싱 신호를 발생시킨다. 예를 들어 이동 단말기(100)가 슬라이드 폰 형태인 경우 슬라이드 폰의 개폐 여부를 센싱할 수 있다. 또한, 전원 공급부(190)의 전원 공급 여부, 인터페이스부(170)의 외부 기기 결합 여부 등과 관련된 센싱 기능을 담당한다. 한편, 상기 센싱부(140)는 근접 센서(141)를 포함할 수 있다. 이에 대해서는 나중에 터치스크린과 관련되어 후술된다.

또한, 상기 센싱부(140)는 사용자가 이동할 때 이동방향을 계산하는 지자기 센서, 회전방향을 계산하는 자이로 센서 및 가속도센서를 포함한다.

인터페이스부(170)는 이동 단말기(100)에 연결되는 모든 외부기기와의 인터페이스 역할을 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O(Input/Output) 포트, 이어폰 포트 등이 포함될 수 있다.

여기에서, 식별 모듈은 이동 단말기(100)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(User Identify Module; 'UIM'), 가입자 인증 모듈(Subscriber Identify Module; 'SIM'), 범용 사용자 인증 모듈(Universal Subscriber Identity Module; 'USIM') 등을 포함할 수 있다. 또한, 식별 모듈이 구비된 장치(이하 '식별 장치')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 장치는 포트를 통하여 단말기(100)와 연결될 수 있다. 이와 같은 인터페이스부(170)는 외부 기기로부터 데이터를 전송받거나 전원을 공급받아 이동 단말기(100) 내부의 각 구성 요소에 전달하거나 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 한다.

또한, 상기 인터페이스부(170)는 이동단말기(100)가 외부 크래들(cradle)과 연결될 때 상기 크래들로부터의 전원이 상기 이동단말기(100)에 공급되는 통로가 되거나, 사용자에 의해 상기 크래들에서 입력되는 각종 명령 신호가 상기 이동단말기로 전달되는 통로가 될 수 있다. 상기 크래들로부터 입력되는 각종 명령 신호 또는 상기 전원은 상기 이동단말기가 상기 크래들에 정확히 장착되었음을 인지하기 위한 신호로 동작될 수도 있다.

출력부(150)는 오디오 신호 또는 비디오 신호 또는 알람(alarm) 신호의 출력을 위한 것으로, 이에는 디스플레이 모듈(151), 음향 출력 모듈(152), 및 알람부(153) 등이 포함될 수 있다.

디스플레이 모듈(151)는 이동 단말기(100)에서 처리되는 정보를 표시 출력한다. 예를 들어 이동 단말기가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다.

한편, 전술한 바와 같이, 디스플레이 모듈(151)과 터치패드가 상호 레이어 구조를 이루어 터치 스크린으로 구성되는 경우, 디스플레이 모듈(151)은 출력 장치 이외에 입력 장치로도 사용될 수 있다. 디스플레이 모듈(151)은 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 중에서 적어도 하나를 포함할 수 있다. 이들 중 일부 디스플레이는 이를 통해 외부를 볼 수 있도록 투명하도록 구성될 수 있다. 이는 투명 디스플레이라 호칭될 수 있는데, 상기 투명 디스플레이의 대표적인 예로는 TOLED(transparent organic light emitting diode) 등이 있다. 그리고 이동 단말기(100)의 구현 형태에 따라 디스플레이 모듈(151)이 2개 이상 존재할 수도 있다. 예를 들어, 이동 단말기(100)에 외부 디스플레이 모듈(미도시)과 내부 디스플레이 모듈(미도시)이 동시에 구비될 수 있다. 상기 터치스크린은 터치 입력 위치 및 면적 뿐만 아니라 터치 입력 압력까지도 검출할 수 있도록 구성될 수 있다.

음향 출력 모듈(152)은 호신호 수신, 통화모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리(160)에 저장된 오디오 데이터를 출력한다. 또한, 음향 출력 모듈(152)은 이동 단말기(100)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력한다. 이러한 음향 출력 모듈(152)에는 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.

알람부(153)는 이동 단말기(100)의 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기에서 발생되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 터치 입력 등이 있다. 알람부(153)는 오디오 신호나 비디오 신호 이외에 다른 형태로 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 예를 들면, 진동 형태로 신호를 출력할 수 있다. 호 신호가 수신되거나 메시지가 수신된 경우, 이를 알리기 위해 알람부(153)는 진동을 출력할 수 있다. 또는, 키 신호가 입력된 경우, 키 신호 입력에 대한 피드백으로 알람부(153)는 진동을 출력할 수 있다. 상기와 같은 진동 출력을 통해 사용자는 이벤트 발생을 인지할 수 있다. 물론 이벤트 발생 알림을 위한 신호는 디스플레이 모듈(151)이나 음향 출력 모듈(152)을 통해서도 출력될 수 있다.

메모리(160)는 제어부(180)의 처리 및 제어를 위한 프로그램이 저장될 수도 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)의 임시 저장을 위한 기능을 수행할 수도 있다. 또한, 상기 메모리(160)에는 상기 터치스크린 상의 터치 입력시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.

메모리(160)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM (Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory) 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 또한, 이동 단말기(100)는 인터넷(internet)상에서 상기 메모리(160)의 저장 기능을 수행하는 웹 스토리지(web storage)를 운영할 수도 있다.

그리고 제어부(180)는 통상적으로 이동 단말기의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 또한, 제어부(180)는 멀티 미디어 재생을 위한 멀티미디어 모듈(181)을 구비할 수도 있다. 멀티미디어 모듈(181)은 제어부(180) 내에 구현될 수도 있고, 제어부(180)와 별도로 구현될 수도 있다.

상기 제어부(180)는 상기 터치스크린 상에서 행해지는 필기 입력 또는 그림 그리기 입력을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식 처리를 행할 수 있다.

전원 공급부(190)는 배터리로서 제어부(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.

여기에 설명되는 다양한 실시예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다.

하드웨어적인 구현에 의하면, 여기에 설명되는 실시예는 ASICs (application specific integrated circuits), DSPs (digital signal processors), DSPDs (digital signal processing devices), PLDs (programmable logic devices), FPGAs (field programmable gate arrays, 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 그러한 실시예들이 제어부(180)에 의해 구현될 수 있다.

소프트웨어적인 구현에 의하면, 절차나 기능과 같은 실시예들은 적어도 하나의 기능 또는 작동을 수행하게 하는 별개의 소프트웨어 모듈과 함께 구현될 수 있다. 소프트웨어 코드는 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션에 의해 구현될 수 있다. 또한, 소프트웨어 코드는 메모리(160)에 저장되고, 제어부(180)에 의해 실행될 수 있다.

도 1에 도시된 단말기(100)는, 유무선 통신 시스템 및 위성 기반 통신 시스템을 포함하여, 프레임(frame) 또는 패킷(packet)을 통하여 데이터(data)를 전송할 수 있는 통신 시스템에서 동작 가능하도록 구성될 수 있다.

이하에서는, 도 2를 참조하여, 본 발명에 관련된 단말기가 동작 가능한 통신 시스템에 대하여 살펴보겠다.

통신 시스템은, 서로 다른 무선 인터페이스 및/또는 물리 계층을 이용할 수도 있다. 예를 들어, 통신 시스템에 의해 이용 가능한 무선 인터페이스에는, 주파수 분할 다중 접속(Frequency Division Multiple Access; 'FDMA'), 시분할 다중 접속(Time Division Multiple Access; 'TDMA'), 코드 분할 다중 접속(Code Division Multiple Access; 'CDMA'), 범용 이동통신 시스템(Universal Mobile Telecommunications Systems; 'UMTS')(특히, LTE(Long Term Evolution)), 이동통신 글로벌 시스템(Global System for Mobile Communications; 'GSM') 등이 포함될 수 있다. 이하에서는, 설명의 편의를 위하여, CDMA에 한정하여 설명하도록 한다. 그러나, 본 발명은, CDMA 무선 통신 시스템을 포함한 모든 통신 시스템 적용될 있음은 당연하다.

도 2에 도시된 바와 같이, CDMA 무선 통신 시스템은, 복수의 단말기들(100), 복수의 기지국(Base Station; 'BS')(270), 기지국 제어부(Base Station Controllers; 'BSCs')(275), 이동 스위칭 센터(Mobile Switching Center; 'MSC')(280)를 포함할 수 있다. MSC(280)는, 일반 전화 교환망(Public Switched Telephone Network; 'PSTN')(290)과 연결되도록 구성되고, BSCs(275)와도 연결되도록 구성된다. BSCs(275)는, 백홀 라인(backhaul line)을 통하여, BS(270)과 짝을 이루어 연결될 수 있다. 백홀 라인은, E1/T1, ATM, IP, PPP, Frame Relay, HDSL, ADSL 또는 xDSL 중 적어도 하나에 따라서 구비될 수 있다. 따라서, 복수의 BSCs(275)가 도 2에 도시된 시스템에 포함될 수 있다.

각각의 BS(270)는, 적어도 하나의 섹터를 포함할 수 있고, 각각의 섹터는, 전방향성 안테나 또는 BS(270)으로부터 방사상의 특정 방향을 가리키는 안테나를 포함할 수 있다. 또한, 각각의 섹터는, 다양한 형태의 안테나를 두 개 이상 포함할 수도 있다. 각각의 BS(270)는, 복수의 주파수 할당을 지원하도록 구성될 수 있고, 복수의 주파수 할당 각각은, 특정 스펙트럼(예를 들어, 1.25MHz, 5MHz 등)을 갖는다.

섹터와 주파수 할당의 교차는, CDMA 채널이라고 불릴 수 있다. BS(270)은, 기지국 송수신 하부 시스템(Base Station Transceiver Subsystem; 'BTSs')이라고 불릴수 있다. 이러한 경우, "기지국"이라는 단어는, 하나의 BSC(275) 및 적어도 하나의 BS(270)을 합하여 불릴 수도 있다. 기지국은, 또한 "셀 사이트"를 나타낼 수도 있다. 또는, 특정 BS(270)에 대한 복수의 섹터들 각각은, 복수의 셀 사이트로 불릴 수도 있다.

도 2에 도시된 바와 같이, 방송 송신부(Broadcasting Transmitter; 'BT')(295)는, 시스템 내에서 동작하는 단말기들(100)에게 방송 신호를 송신한다. 도 1에 도시된 방송수신 모듈(111)은, BT(295)에 의해 전송되는 방송 신호를 수신하기 위해 단말기(100) 내에 구비된다.

뿐만 아니라, 도 2에서는, 여러 개의 위성 위치 확인 시스템(Global Positioning System; 'GPS') 위성(300)을 도시한다. 상기 위성들(300)은, 복수의 단말기(100) 중 적어도 하나의 단말기의 위치를 파악하는 것을 돕는다. 도 2에서는 두 개의 위성이 도시되어 있지만, 유용한 위치 정보는, 두 개 이하 또는 이상의 위성들에 의해 획득될 수도 있다. 도 1에 도시된 위치정보 모듈(115)은, 원하는 위치 정보를 획득하기 위하여 위성들(300)과 협력한다. 여기에서는, GPS 추적 기술뿐만 아니라 위치를 추적할 수 있는 모든 기술들을 이용하여 위치를 추적할 수 있다. 또한, GPS 위성들(300) 중 적어도 하나는, 선택적으로 또는 추가로 위성 DMB 전송을 담당할 수도 있다.

무선 통신 시스템의 전형적인 동작 중, BS(270)은, 다양한 단말기들(100)로부터 역 링크 신호를 수신한다. 이때, 단말기들(100)은, 호를 연결 중이거나, 메시지를 송수신 중이거나 또는 다른 통신 동작을 수행하고 있다. 특정 기지국(270)에 의해 수신된 역 링크 신호들 각각은, 특정 기지국(270)에 의해 내에서 처리된다. 상기 처리 결과 생성된 데이터는, 연결된 BSC(275)로 송신된다. BSC(275)는, 기지국들(270) 간의 소프트 핸드오프(soft handoff)들의 조직화를 포함하여, 호 자원 할당 및 이동성 관리 기능을 제공한다. 또한, BSC(275)는, 상기 수신된 데이터를 MSC(280)으로 송신하고, MSC(280)은, PSTN(290)과의 연결을 위하여 추가적인 전송 서비스를 제공한다. 유사하게, PSTN(290)은 MSC(280)과 연결하고, MSC(280)은 BSCs(275)와 연결하고, BSCs(275)는 단말기들(100)로 순 링크 신호를 전송하도록 BS들(270)을 제어한다.

본 발명은 영상 촬영 및 재생시 최적의 영상을 얻기 위해 사용자가 관심 피사체들의 위치, 범위 및 상황을 선택하는 이벤트(events)와 오디오 줌잉(Audio Zooming) 기법을 조합한 다양한 취음 방법을 제공한다.

상기 오디오 줌잉 기법은 마이크를 통해 음원의 사운드를 취음한 후 오디오 줌잉을 적용하여 원하는 사운드만을 선택적으로 녹음하는 일련의 동작을 의미한다. 예를 들어, 사용자가 클로즈업하거나 초점을 맞춘 피사체의 위치와 크기에 자동으로 연동하여 그 피사체의 위치에 지향성을 향하게 하거나 취음 범위를 최적화함으로써 관심 피사체의 오디오를 최적으로 취음하면서 촬영 또는 재생한다. 상기 재생시의 영상은 오디오 줌잉 기술이 적용되어 저장된 영상 또는 오디오 줌잉 기술이 적용되지 않은 상태에서 저장된 영상을 모두 포함한다.

또한, 본 발명은 화면 포커싱, 줌 배율 등을 조절하는 카메라의 기본적인 UI 시나리오와 충돌하지 않도록 하면서, 사용자가 하나 혹은 다수의 취음 위치 및 범위를 섬세하고 편리하게 조절할 수 있는 표현 기법을 제공함으로써, 관심 피사체의 오디오를 최적으로 촬영 혹은 재생할 수 있는 방안을 제공한다.

일 실시예로서 본 발명은 동영상 촬영 및 재생시에 화면 줌인/아웃과 연동하여 소리를 취음하는 기술을 제공한다.

또 다른 실시예로서 본 발명은 동영상 촬영 및 재생 시에 특정 영역을 줌인/아웃 하는 경우에 해당 영역의 소리를 줌인/아웃 하여 취음하는 기술을 제공한다.

상기 하나 혹은 다수의 취음 위치 및 범위에 대한 조절은, 촬영 또는 재생 영상에 대한 사용자의 행위(behavior) 또는 제스처와 같이 접촉 또는 비접촉 방식으로 이루어진다. 상기 접촉 또는 비접촉 방식에 의한 입력은 싱글터치, 멀티터치, 다지점 터치, 플리킹 및 터치 & 드래그를 포함한다. 특히 상기 하나 혹은 다수의 취음 위치 및 범위를 조절할 경우 각 피사체간의 음 세기비율을 가시적으로 표시할 수 있다.

상기 촬영 또는 재생 영상은 이동 단말기의 디스플레이부에 표시되거나 이동 단말기와 별도로 홀로그램상에 표시될 수 있다. 이러한 입력 및 표시방법은 후술하는 모든 실시예에 공통적으로 적용된다.

또한, 본 발명은 촬영 또는 재생하고자 하는 피사체와 다른 위치에 음원이 존재할 경우 상기 음원의 위치에 소리 지향성을 형성하여 해당 피사체의 사운드를 최적으로 취음할 수 있는 방안을 제공한다.

또한, 본 발명은 정면 방향에 위치하는 피사체를 촬영 또는 재생하면서 화면내에 존재하는 음원들의 위치와 크기를 화면에 표시해 주는 오디오 썸네일(Audio Thumbnail) 기법과 화면 밖에 존재하는 음원의 방향과 크기를 표시해 주는 증강현실(Augmented Reality : AR)기법을 이용하여 사용자가 특정 음원을 선택할 수 있는 방안을 제공한다.

이를 위하여 본 발명은 피사체와 피사체가 발생하는 사운드의 위치가 상이할 경우 화면 포커싱과 다른 위치에 오디오 포커싱을 독립적으로 동시에 적용할 수 있는 기술을 제공한다.

일반적으로 동영상 촬영시 음원의 소리를 취음하기 위해서는 사용자 기준으로 수평축 및 수직축상에 존재하는 음원들간의 선별적인 지향성이 필요하다. 상기 지향성은 다수의 마이크를 통해 취음된 사운드(예:소리 또는 목소리)에 대하여 빔 포밍(Beam-forming)과 같은 신호처리를 통해 수행된다. 상기 빔 포밍은 취음할 범위를 사운드 빔으로 형성하여 지향성을 생성하는 것을 의미한다. 이하 설명하는 오디오 줌잉 방법은 촬영모드를 예로들어 설명하였지만 이에 한정되지 않고 재생모드에서도 동일하게 적용된다.

도 3은 촬영 모드에서 오디오 줌잉 기술의 적용 예이다.

도 3에 도시된 바와같이, 영상 촬영시 다수의 마이크(122)들에 의해 취음된 (Captured) 오디오 정보는 빔포밍 및 노이즈 제거와 같은 오디오 줌잉 기술이 적용된 후 카메라(121)에 의해 촬영된 영상정보와 합성되고, 합성된 영상은 소정 포멧으로 압축된 후 메모리(160)에 저장된다. 특히 상기 빔포밍을 처리하는 유닛은 사용자가 선택한 피사체에 적응적으로 사운드 빔(Sound beam)을 형성하여 취음 범위를 설정하는 부분으로 노이즈를 제거하는 유닛과 함께 제어부(180)의 신호처리부(미도시)를 형성한다.

도 4는 촬영 화면에서 취음 각도와 취음 범위간 관계를 나타낸다.

도 4에 도시된 바와같이, 촬영 화면에서 취음 범위는 피사체 방향으로 형성되는 사운드 빔의 각도 즉, 취음 각도에 의해 형성되는 가로 방향 범위를 나타내고, 상기 취음 범위에 의해 형성되는 소정 형상의 영역을 취음 영역이라고 한다. 상기 취음 영역의 크기와 모양은 사용자의 터치 입력에 따라 설정된다. 상기 사운드 빔은 관심 피사체로의 지향성을 나타낸다. 상기 사운드 빔은 실제 표시되는 것이 아니라 도 3에서 빔포밍 유닛에 의한 동작을 나타낸다.

상기 취음 각도가 증가하면 취음 범위에 의해 취음 영역도 증가되기 때문에 넓은(wide) 범위에서 사운드를 취음할 수 있으며, 취음 각도가 감소하면 취음 범위와 취음 영역도 감소되어 좁은(narrow) 범위에서 사운드를 집중적으로 취음할 수 있다.

도 5는 종래 피사체의 위치와 피사체에서 발생되는 소리의 위치가 다른 경우 소리를 취음하는 일 예를 나타낸다.

가수나 강사가 마이크를 사용해 노래나 강의를 하는 경우에는 비록 가수나 강사가 화면 중앙에 위치하고 있더라고 해당 노래나 목소리를 전달하는 스피커는 다른 위치에 존재하고 있는 경우가 많다. 이러한 경우에 상술한 오디오 줌잉을 적용하면 오히려 해당 객체(가수 또는 강사)들의 얼굴에 취음 범위 및 취음 영역이 설정되기 때문에 오히려 상기 스피커를 통해 출력되는 해당 객체의 목소리가 제대로 취음되지 않는 경향이 있다. 즉, 화면의 정 중앙 영역에 존재하는 피사체로부터 발생하는 소리만을 항상 고정하여 취음하는 종래 기술은 객체간의 사운드 발생위치가 서로 틀린 상황에서는 상당히 제한적인 성능을 나타내게 된다.

그런데, 도 5에 도시된 바와같이, 화면 오른쪽에 강사의 모습을 촬영 또는 재생하면서 화면 왼쪽의 스피커에서 발생하는 소리를 모두 포착하기 위해 와이드 화면으로 촬영 또는 재생할 경우에는 불필요한 배경 화면과 주변 잡음이 포함되는 문제점이 발생한다.

도 6은 본 발명의 실시예에 따른 오디오/비디오 듀얼 포커싱 방법의 개념도이다.

도 6에 도시된 바오같이, 본 발명은 피사체(예;강사)와 피사체가 발생하는 사운드(예:스피커)의 위치가 상이할 경우, 피사체에 대한 화면 포커싱과 사운드에 대한 오디오 포커싱을 독립적으로 동시에 적용한다. 즉, 카메라(121) 정면의 피사체 방향으로 영상 포커싱을 수행하여 피사체를 촬영하고, 왼쪽 스피커(122)방향으로 오디오 지향성을 형성하여 좁은 취음 범위로 상기 스피커에서 발생되는 소리를 취음한다.

이러한 오디오/비디오 듀얼 포커싱 방법은 화면의 정 중앙에 피사체를 위치시켜 촬영하기 때문에 피사체를 기준으로 자유롭게 화면의 줌 인/아웃(Zoom.out)을 수행할 수 있으며, 특히 피사체와 음원의 발생 위치간의 차이에서 오는 감성적인 차이(gap)을 없애줄 수 있는 장점이 있다.

상기 오디오/비디오 듀얼 포커싱 방법을 구현하기 위하여 본 발명은 피사체와 다른 위치에서 발생하는 소리를 자동으로 찾아 주는 보이스 감지/트래킹 (Detecting/Tracking) 알고리즘을 사용하며, 카메라(121)를 기준으로 임의의 방향에 존재하는 음원만을 선택적으로 취음하는 기술(steering) 즉, 빔포밍 기술을 사용한다. 상기 각종 기술 및 알고리즘은 제어부(180)에 의해 수행된다.

또한, 본 발명은 보이스 감지/트래킹 (Detecting/Tracking) 알고리즘에 의해 찾은 다수의 음원들의 위치를 화면상에 표시해주고 사용자가 선택할 수 있도록 하는 다양한 사용자 인터페이스(UI)를 제공한다.

도 7은 본 발명의 실시예에 따른 오디오/비디오 듀얼 포커싱 방법에 의해 영상을 촬영할 때 사운드의 위치를 표시하는 일 예이다.

도 7에 도시된 바와같이, 피사체를 포커싱하여 촬영할 때 본 발명은 촬영 화면(메인 화면)의 일측에, 화면안 또는 화면밖에 존재하는 사운드의 위치 정보(음원의 위치, 크기 및 방향)을 알려주기 위한 오디오 썸네일(200)을 표시한다.

상기 화면안에 존재하는 사운드와 화면밖에 존재하는 사운드는 서로 다른 형태로 표시된다. 일 에로, 화면안에 존재하는 사운드(A)는 취음 영역의 형태로 표시되고, 상기 화면밖에 존재하는 사운드의 위치는 아이콘 형태로 표시된다.

상기 오디오 썸네일(200)은 증강 현실(Augmented Reality) 기법에 의해 반투명 형태로 표시되며, 소정 시간동안 표시되다가 자동으로 사라지며, 해당 위치를 터치하면 다시 표시된다.

따라서,상기 오디오 썸네일(200)에 표시된 사운드 아이콘을 보고, 사용자는 현재 화면을 기준으로 좌측 상방향에 보이지 않는(Invisible) 사운드가 존재함을 알 수 있게 된다.

도 8은 촬영 화면에서 제어 아이콘을 활성화하는 예이다.

도 8에 도시된 바와 같이, 사용자가 오디오 썸네일(200) 이외의 일반 영역(메인 화면)을 터치하면, 화면의 일측, 예를들면 좌측에 복수의 캠코더 제어 아이콘(201)이 표시된다.

사용자는 피사체를 촬영하면서 특정 캠코더 제어 아이콘(201)을 선택하여 피사체를 중심으로 영상을 확대하거나 영상의 초점을 수동/자동으로 조절할 수 있다.

도 9는 오디오 썸네일을 촬영 영상에 오버레이(overlay)하는 예이다.

촬영 화면에 표시된 오디오 썸네일(200)은 크기가 작기 때문에 음원의 대략적인 정보만 알 수 있다. 상기 오디오 썸네일(200)은 사용자의 터치 입력에 의해 크기가 확대되어 촬영 영상에 겹쳐져 표시되며, 동일한 터치 입력이 다시 감지되면 원래의 크기로 축소된다.

사용자는 반투명 형태로 표시되는 확대된 오디오 썸네일(200)에는 화면밖의 음원을 나타내는 음원(사운드) 아이콘(202)과 화면내의 음원을 나타내는 취음 영역(203)이 표시된다. 따라서, 사용자는 음원 아이콘(202) 및 취음 영역(203)을 보고 사운드(음원)의 위치, 크기 및 방향은 물론 사운드의 세기등을 정확하게 알 수 있다.

도 10a 및 도 10b는 촬영 영상에 오버레이된 오디오 썸네일(200)에 사운드 아이콘을 표시하는 예이다.

피사체와 다른 위치에서 발생하는 사운드가 화면밖에 있어 보이지 않는 경우 음원 아이콘(202)은 다양한 위치에 표시될 수 있다. 따라서, 도 10a에 도시된 바와같이, 촬영시 사운드의 위치가 변경되거나 새로운 사운드가 추가 또는 제거되면 음원 아이콘(202)의 위치는 실제 사운드의 존재 위치에 따라 변경되거나 추가 또는 제거된다. 상기 음원 아이콘(202)에는 소리의 세기가 함께 표시된다.

다른 예로, 상기 사운드 아이콘은 고정된 위치에서 사운드의 존재 위치를 나타낼 수도 있다. 도 10b에 도시된 바와같이, 위치가 고정된 사운드 아이콘을 이용하여 실제 사운드의 위치를 표시하는 경우에는 음원 아이콘(202)의 일측에 실제 사운드의 존재 방향을 표시한다. 특히 음원 아이콘(202)는 다양한 모양 및 색으로 표시될 수 있다.

도 11은 오디오 썸네일에서 취음할 대상을 선택하는 예이다.

촬영 영상에 오버레이된 오디오 썸네일(200)에는 화면밖의 음원을 나타내는 적어도 하나의 사운드 아이콘(202)과 화면내의 음원을 나타내는 취음 영역(203)이 표시된다.

따라서, 사용자는 원하는 음원 아이콘(202)을 선택하거나 또는 취음 영역(203)을 선택하여 취음 대상을 고정한 후 피사체의 영상을 촬영한다.

다른 실시예로 사용자는 목표 음원의 위치로 카메라를 이동시킨 후 화면상에서 직접 선택하여 취음할 음원을 고정한 후 원하는 피사체의 영상을 촬영할 수도 있다.

도 12는 음원 포커싱과 피사체 포커싱을 동시에 수행하는 예이다.

도 12에 도시된 바와같이, 본 발명은 촬영 영상에 오버레이된 오디오 썸네일(200) 또는 오버레이되지 않은 오디오 썸네일(200)에서 음원 아이콘(202)을 터치하여 촬영할 피사체로 드래그함으로써 음원 포커싱과 피사체 포커싱을 동시에 수행한다. 즉, 화면밖에 존재하는 음원을 취음할 경우에는 해당 음원을 나타내는 음원 아이콘(202)를 터치한 후 촬영할 피사체로 이동시킴으로써 해당 피사체를 중심으로 촬영하면서 해당 피사체의 소리는 외부에 위치하는 음원, 즉 스피커를 통하여 취음한다.

도 13은 본 발명의 실시예에 따른 이동 단말의 오디오/비디오 듀얼 포커싱 방법을 나타낸 순서도이다.

사용자가 촬영 모드를 선택하면 제어부(180)는 디스플레이부(151)를 제어하여 사용자가 포커싱한 피사체를 메인 화면에 표시한다(S10).

제어부(180)는 보이스 감지/트래킹 (Detecting/Tracking) 알고리즘을 이용하여 화면안 및 화면밖에 존재하는 음원의 위치를 자동으로 확인한 후 해당 음원 위치를 아이콘 또는 취음 영역 형태로 오디오 썸네일(200)에 표시한다(S11).

사용자에 의해 오디오 썸네일(200)이 선택되면 제어부(180)는 상기 오디오 썸네일(200)을 확대한 후 그 확대된 오디오 썸네일(200)을 증강현실 기법에 따라 촬영 화면에 오버레이한다(S13). 상기 오디오 썸네일(200)에는 화면안 및 화면밖에 존재하는 음원의 위치를 나타내는 적어도 하나 이상의 음원 아이콘(202)과 취음 영역(203)이 포함되어 있기 때문에 사용자는 음원의 갯수, 위치, 방향 및 소리의 세기등을 쉽게 파악할 수 있다. 상기 음원 아이콘(202)은 서로 다른 형태 및 색으로 표시될 수 있다.

이후 상기 오디오 썸네일(200)에서 특정 음원이 선택되면 제어부(180)는 피사체에 화면 포커싱을 수행하면서 빔 포밍을 기술을 통해 선택된 음원의 방향으로 좁은 오디어 지향성을 형성하여 오디오 포커싱을 수행함으로써 오디오/비디오 듀얼 포커싱을 수행한다(S15). 상기 특정 음원의 선택은 특정 오디오 아이콘(200) 또는 취음 영역(203)을 선택하거나 오디오 아이콘(200)을 피사체로 드래그 하는 동작에 의해 이루어진다. 상기 동작은 촬영동작이 졸요될 때 가지 반복적으로 수행된다(S16).

본 발명은 설명의 편의를 위하여 촬영시의 오디오/비디오 듀얼 포커싱 방법에 대하여 기술하였지만, 이에 한정되지 않고 재생시 정면 방향에 위치하는 피사체를 재생하면서 동시에 화면 내 또는 화면밖에 존재하는 사운드의 정보(음원의 위치, 크기 및 방향을)를 표시하여 사용자가 피사체에 대한 사운드 취음을 편집할 수 있다. 따라서, 상기 오디오/비디오 듀얼 포커싱 방법을 수행하기 위한 상술한 모든 제어동작은 재생시의 동일하게 적용된다.

상술한 바와같이 본 발명은 촬영 또는 재생하고자 하는 피사체와 다른 위치에 사운드 위치가 존재할 경우 상기 사운드 위치에 소리 지향성을 형성함으로써 해당 피사체의 사운드를 최적으로 취음할 수 있다. 특히 본 발명은 정면 방향에 위치하는 피사체를 촬영하면서 동시에 화면 내 또는 화면밖에 존재하는 사운드의 정보(음원의 위치, 크기 및 방향을)를 표시함으로써 사용자가 취음하고자 하는 음원을 직접 선택하여 피사체의 사운드를 취음할 수 있다.

또한, 본 발명의 일 실시예에 의하면, 전술한 방법은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 컴퓨터는, 단말기의 제어부를 포함할 수도 있다.

상기와 같이 설명된 이동 단말기 및 그의 오디오/비디오 듀얼 포커싱 방법은 상기 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

121 : 카메라 122 : 마이크
151 : 디스플레이부 160 : 메모리
180 : 제어부 200 : 오디오 썸네일
201 : 캠코더 제어 아이콘 202 : 사운드 아이콘
203 : 취음 영역

Claims

삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
카메라;
촬영 모드에서 피사체에 포커싱된 촬영 영상을 표시하는 디스플레이부; 및
기 설정된 알고리즘을 이용하여, 상기 촬영 영상 외부에 존재하는 외부 음원을 감지하고, 상기 카메라를 기준으로 상기 외부 음원의 위치를 인식하며,
상기 촬영 영상 중 상기 외부 음원이 위치하는 곳과 대응되는 위치에 상기 외부 음원에 대응되는 그래픽 객체를 출력시키는 제어부를 포함하고,
상기 제어부는,
상기 외부 음원에 대응되는 그래픽 객체가 기 설정된 방식으로 선택되면, 상기 피사체에 대한 포커싱이 유지되도록 상기 카메라를 제어하면서, 상기 외부 음원에서 발생되는 소리가 취음 되도록 상기 외부 음원에 지향성을 형성하여 오디오 포커싱을 수행하는 것을 특징으로 하는 이동 단말기.
제11항에 있어서, 상기 그래픽 객체는 반투명 형태로 표시되는 것을 특징으로 하는 이동 단말기.
제11항에 있어서, 상기 제어부는
상기 그래픽 객체가 선택되면, 상기 그래픽 객체를 확대하여, 상기 확대된 그래픽 객체를 촬영 영상에 오버레이하는 것을 특징으로 하는 이동 단말기.
제11항에 있어서, 상기 제어부는
상기 촬영 영상 외부에 존재하는 상기 외부 음원의 위치와 크기에 대응되도록 상기 그래픽 객체의 표시 위치 및 외관을 다르게 표시하는 것을 특징으로 하는 이동 단말기.
제11항에 있어서,
상기 제어부는, 상기 촬영 영상 내에 위치한 음원을 감지하고,
상기 촬영 영상 내에 위치한 내부 음원은 취음 영역으로 표시하는 것을 특징으로 하는 이동 단말기.
삭제
제11항에 있어서, 상기 촬영 영상 외부에 복수의 외부 음원이 존재하는 경우,
복수의 외부 음원 각각에 대응되는 복수의 그래픽 객체가 표시되도록 상기 디스플레이부를 제어하는 것을 특징으로 하는 이동 단말기.
제11항에 있어서, 상기 그래픽 객체는,
상기 외부 음원의 방향, 위치 및 소리의 크기 정보를 포함하는 것을 특징으로 하는 이동 단말기.
삭제
제11항에 있어서, 상기 제어부는, 상기 그래픽 객체가 상기 피사체로 드래그되는 경우, 상기 외부 음원에 지향성을 형성하여 상기 오디오 포커싱을 수행하는 것을 특징으로 하는 더 포함하는 이동 단말기.