KR20150009053A

KR20150009053A - 이동 단말기 및 그것의 제어 방법

Info

Publication number: KR20150009053A
Application number: KR1020130081695A
Authority: KR
Inventors: 이정빈; 한미란; 이슬아; 이정윤
Original assignee: 엘지전자 주식회사
Priority date: 2013-07-11
Filing date: 2013-07-11
Publication date: 2015-01-26
Also published as: US20150019969A1; US9639251B2; CN104284219A; EP2824665A1; KR102108893B1

Abstract

본 발명은 동영상을 재생할 수 있는 이동 단말기 및 그것의 제어 방법에 관한 것이다. 본 발명의 일 실시 예에 따른 이동 단말기는, 동영상을 출력하는 디스플레이부; 상기 동영상에 포함된 구간을 선택받는 사용자 입력부; 및 상기 선택받은 구간에서 출력되는 소리 정보에 대응하는 시각 정보를 상기 디스플레이부에 출력하는 제어부;를 포함하며, 상기 제어부는, 상기 선택받은 구간에서 출력되는 음성 정보를 텍스트 정보로 변환하여 상기 디스플레이부에 출력하는 것을 특징으로 한다.

Description

이동 단말기 및 그것의 제어 방법{MOBILE TERMINAL AND CONTROL METHOD THEREOF}

본 발명은 이동 단말기에 관한 것으로, 좀 더 구체적으로 동영상을 재생할 수 있는 이동 단말기 및 그것의 제어 방법에 관한 것이다.

단말기(terminal)는 이동 가능 여부에 따라 이동 단말기(mobile/portable terminal) 및 고정 단말기(stationary terminal)로 나뉠 수 있다. 다시 이동 단말기는 사용자의 직접 휴대 가능 여부에 따라 휴대(형) 단말기(handheld terminal) 및 거치형 단말기(vehicle mount terminal)로 나뉠 수 있다.

이와 같은 단말기는 기능이 다양화됨에 따라, 예를 들어, 사진이나 동영상의 촬영, 음악이나 동영상 파일의 재생, 게임, 방송의 수신 등의 복합적인 기능들을 갖춘 멀티미디어 기기(Multimedia player) 형태로 구현되고 있다. 나아가 단말기의 기능 지지 및 증대를 위해, 단말기의 구조적인 부분 및 소프트웨어적인 부분을 개량하는 것이 고려될 수 있다.

이러한 개량에 힘입어, 단말기에서 재생되는 동영상 내의 특정 장면을 동영상이 재생되는 구간을 조절할 수 있는 검색 바(bar)를 통해 찾을 수 있다. 구체적으로, 특정 장면을 찾기 위해서는 검색 바를 임의의 위치까지 이동시켜 동영상을 재생해보아야 한다.

이 경우, 검색 바의 이동에 따라 출력되는 음성이나 이미지만으로 원하는 장면을 검색해야 한다는 어려움이 존재한다. 예를 들면, 검색 바를 빠르게 이동시키는 중에는 이미지만이 출력되고 음성은 들리지 않거나 빠르게 들리는 경우가 많아 원하는 장면을 찾기 어려워진다.

이러한 문제점을 해결하기 위하여, 본 발명은 음성을 텍스트로 변환해주는 STT(Speech To Text) 기술과 오디오 줌인(Audio Zooming) 기술 등을 단말기에 적용하고자 한다.

오디오 줌인(Audio Zooming) 기술은 녹음 시 지향성 마이크 또는 복수 개의 마이크를 사용하여, 소리가 출력되는 방향을 자세히 구분하여 녹음할 수 있는 기술이다.

일반적으로 음원의 소리를 취음(Capture)하기 위해서는 사용자 기준으로 수평축 또는 수직축 상의 음원들 간의 선별적인 지향성이 필요하다. 상기 선별적인 지향성을 제공하기 위해 이동 단말기의 배면에 복수의 마이크를 서로 직교하거나 십자형태로 배치하고, 2개의 마이크만 사용하는 경우는 가로 또는 세로 직선 방향으로 서로 떨어뜨려 배치한다.

특히, 상기 지향성은 다수의 마이크를 통해 취음된 사운드(예:소리 또는 목소리)에 대하여 빔 포밍(Beam-forming)과 같은 신호처리를 통해 수행된다. 상기 빔 포밍은 취음할 범위를 사운드 빔으로 형성하여 지향성을 생성하는 것을 의미한다.

도 1a는 본 발명에 적용 가능한 오디오 줌잉 방법의 개념도이다.

도 1a에 도시된 바와 같이, 영상 촬영시 다수의 마이크(122)들에 의해 취음된 (Captured) 오디오 정보는 빔 포밍 및 노이즈 제거와 같은 오디오 줌잉 기술이 적용된 후 카메라(121)에 의해 촬영된 영상정보와 합성되고, 합성된 영상은 소정 포멧으로 압축된 후 메모리(160)에 저장된다.

특히 상기 빔포밍을 처리하는 유닛은 사용자가 선택한 피사체에 적응적으로 사운드 빔(Sound beam)을 형성하여 취음 범위를 설정하는 부분으로 노이즈를 제거하는 유닛과 함께 제어부(180)의 신호처리부(미도시)를 형성한다.

또한, 영상 재생시에는 상기 합성된 영상이 영상정보와 오디오 정보로 분리한 후 그 분리된 오디오 정보에 오디오 줌잉 기술을 적용하여 선택적으로 피사체의 소리를 취음함으로써 영상 편집을 수행할 수 있다.

본 발명의 목적은 동영상 내의 특정 장면을 찾는데 있어서 사용자의 편의를 향상시킬 수 있는 이동 단말기 및 그것의 제어 방법을 제공하는 데 있다.

본 발명의 일 실시 예에 따른 이동 단말기는, 동영상을 출력하는 디스플레이부; 상기 동영상에 포함된 구간을 선택받는 사용자 입력부; 및 상기 선택받은 구간에서 출력되는 소리 정보에 대응하는 시각 정보를 상기 디스플레이부에 출력하는 제어부;를 포함하며, 상기 제어부는, 상기 선택받은 구간에서 출력되는 음성 정보를 텍스트 정보로 변환하여 상기 디스플레이부에 출력할 수 있다.

실시 예에 있어서, 상기 제어부는, 상기 동영상에 포함된 구간을 선택하는 탐색 속도에 따라 상기 소리 정보에 대응하는 시각 정보를 다르게 출력할 수 있다.

실시 예에 있어서, 상기 제어부는, 상기 텍스트 정보를 상기 음성 정보의 발화자에 인접시켜 상기 디스플레이부에 출력할 수 있다.

실시 예에 있어서, 상기 제어부는, 상기 음성 정보의 발화자가 하이라이트 되도록 상기 디스플레이부를 제어할 수 있다.

실시 예에 있어서, 상기 제어부는, 상기 탐색 속도에 따라 선정된 상기 텍스트 정보의 키 워드를 상기 디스플레이부에 출력할 수 있다.

실시 예에 있어서, 상기 사용자 입력부는, 상기 디스플레이부에 출력된 검색 바(bar)에 가해지는 드래그 입력으로 컨텐츠 탐색 모드로 진입하여 상기 동영상에 포함된 구간을 선택받으며, 상기 검색 바의 위치는 상기 동영상의 재생 시점에 각각 대응하는 것을 특징으로 한다.

실시 예에 있어서, 상기 제어부는, 상기 선택받은 구간에서 출력되는 음성 정보를 텍스트 정보로 변환하여, 상기 음성 정보가 출력되는 상기 동영상의 재생 시점에 대응하는 상기 검색 바의 위치에 상기 텍스트 정보를 출력할 수 있다.

실시 예에 있어서, 상기 제어부는, 소리 정보가 출력되는 상기 동영상의 재생 시점에 대응하는 상기 검색 바의 위치에, 상기 소리 정보에 대응하는 시각 정보를 출력할 수 있다.

실시 예에 있어서, 상기 디스플레이부는, 상기 동영상의 재생 시 출력되는 복수의 소리 정보 각각에 대응하는 복수의 소리 바(bar)를 출력하며, 상기 제어부는, 상기 각각의 소리 바에 대하여, 상기 동영상의 재생 시점에 각각 대응하는 상기 소리 바의 위치에, 상기 재생 시점에서 출력되는 소리 정보에 대응하는 시각 정보를 출력할 수 있다.

본 발명의 일 실시 예에 따른 이동 단말기의 제어 방법은, (a) 동영상에 포함된 구간을 선택받는 단계; (b) 상기 선택받은 구간에서 출력되는 소리 정보에 대응하는 시각 정보를 디스플레이부에 출력하는 단계;를 포함하며, 상기 (b) 단계는, 상기 선택받은 구간에서 출력되는 음성 정보를 텍스트 정보로 변환하여 상기 디스플레이부에 출력하는 단계;를 포함할 수 있다.

실시 예에 있어서, 상기 (b) 단계는, 상기 동영상에 포함된 구간을 선택하는 탐색 속도에 따라 상기 소리 정보에 대응하는 시각 정보를 다르게 출력하는 단계;를 포함할 수 있다.

실시 예에 있어서, 상기 (b) 단계는, 상기 텍스트 정보를 상기 음성 정보의 발화자에 인접시켜 상기 디스플레이부에 출력하는 단계;를 포함할 수 있다.

실시 예에 있어서, 상기 (b) 단계는, 상기 음성 정보의 발화자가 하이라이트 되도록 상기 디스플레이부를 제어하는 단계;를 포함할 수 있다.

실시 예에 있어서, 상기 (b) 단계는, 상기 탐색 속도에 따라 선정된 상기 텍스트 정보의 키 워드를 상기 디스플레이부에 출력하는 단계;를 포함할 수 있다.

실시 예에 있어서, 상기 (a) 단계는, 상기 디스플레이부에 출력된 검색 바(bar)에 가해지는 드래그 입력으로 컨텐츠 탐색 모드로 진입하여 상기 동영상에 포함된 구간을 선택받는 단계;를 포함하며, 상기 검색 바의 위치는 상기 동영상의 재생 시점에 각각 대응하는 것을 특징으로 한다.

실시 예에 있어서, 상기 (b) 단계는, 상기 선택받은 구간에서 출력되는 음성 정보를 텍스트 정보로 변환하여, 상기 음성 정보가 출력되는 상기 동영상의 재생 시점에 대응하는 상기 검색 바의 위치에 상기 텍스트 정보를 출력하는 단계;를 포함할 수 있다.

실시 예에 있어서, 상기 (b) 단계는, 소리 정보가 출력되는 재생 시점에 대응하는 상기 검색 바의 위치에, 상기 소리 정보에 대응하는 시각 정보를 출력하는 단계;를 포함할 수 있다.

실시 예에 있어서, 상기 (a) 단계는, 상기 동영상의 재생 시 출력되는 복수의 소리 정보 각각에 대응하는 복수의 소리 바(bar)를 출력하는 단계;를 포함하며, 상기 (b) 단계는, 상기 각각의 소리 바에 대하여, 상기 동영상의 재생 시점에 각각 대응하는 상기 소리 바의 위치에, 상기 재생 시점에서 출력되는 소리 정보에 대응하는 시각 정보를 출력하는 단계;를 포함할 수 있다.

본 발명에 의하면, 동영상 내의 음성이 텍스트로 출력되므로, 원하는 장면을 빠르고 정확하게 검색할 수 있다.

또한, 음성 텍스트의 발화자를 포커싱(focusing)하여 출력하거나, 검색 바에 가해지는 속도가 빨라지면 음성 텍스트의 키 워드만을 제공할 수도 있다. 이에 따라, 동영상 장면의 시인성을 향상시킬 수 있다.

그리고, 동영상을 재생해보지 않고도 빠르고 간편하게 원하는 장면을 검색할 수 있으며, 복수의 음성 중 원하는 음성만을 선별하여 검색하는 음성별 동영상 검색도 가능해진다.

그 결과, 사용자의 편의가 향상될 수 있다.

도 1a는 본 발명에 적용 가능한 오디오 줌잉 방법의 개념도이다.
도 1b는 본 명세서에 개시된 일 실시 예에 따른 이동 단말기를 나타내는 블록도이다.
도 2a 및 도 2b는 본 발명에 따른 이동 단말기가 동작 가능한 통신 시스템의 개념도이다.
도 3a는 본 발명과 관련된 이동 단말기의 일 예를 전면에서 바라본 사시도이다.
도 3b는 도 3a에 도시된 이동 단말기의 후면 사시도이다.
도 4는 본 발명에 따른 이동 단말기의 일 실시 예를 설명하기 위한 순서도이다.
도 5 내지 도 7은 음성 정보를 텍스트 정보로 변환하여 출력하는 사용자 인터페이스의 실시 예를 보여주는 개념도이다.
도 8 내지 도 9는 소리 정보에 대응하는 시각 정보를 출력하는 사용자 인터페이스의 실시 예를 보여주는 개념도이다.
도 10 내지 도 13은 복수의 소리 정보 각각에 대응하는 시각 정보를 출력하는 사용자 인터페이스의 실시 예를 보여주는 개념도이다.
도 14 및 도 15는 소리 정보를 포함하고 있는 동영상을 검색하기 위한 사용자 인터페이스의 실시 예를 보여주는 개념도이다.

이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다.

본 명세서에서 설명되는 이동 단말기에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 네비게이션, 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook) 등이 포함될 수 있다. 그러나, 본 명세서에 기재된 실시 예에 따른 구성은 이동 단말기에만 적용 가능한 경우를 제외하면, 디지털 TV, 데스크탑 컴퓨터 등과 같은 고정 단말기에도 적용될 수도 있음을 본 기술분야의 당업자라면 쉽게 알 수 있을 것이다.

도 1b는 본 명세서에 개시된 일 실시 예에 따른 이동 단말기(100)를 나타내는 블록도이다.

상기 이동 단말기(100)는 무선 통신부(110), A/V(Audio/Video) 입력부(120), 사용자 입력부(130), 감지부(140), 출력부(150), 메모리(160), 인터페이스부(170), 제어부(180) 및 전원 공급부(190) 등을 포함할 수 있다. 도 1b에 도시된 구성요소들이 필수적인 것은 아니어서, 그보다 많은 구성요소들을 갖거나 그보다 적은 구성요소들을 갖는 이동 단말기가 구현될 수도 있다.

이하, 상기 구성요소들에 대해 차례로 살펴본다.

무선 통신부(110)는 이동 단말기(100)와 무선 통신 시스템 사이 또는 이동 단말기(100)와 이동 단말기(100)가 위치한 네트워크 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 예를 들어, 무선 통신부(110)는 방송 수신 모듈(111), 이동통신 모듈(112), 무선 인터넷 모듈(113), 근거리 통신 모듈(114) 및 위치정보 모듈(115) 중 적어도 하나를 포함할 수 있다.

방송 수신 모듈(111)은 방송 채널을 통하여 외부의 방송 관리 서버로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다.

상기 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 상기 방송 관리 서버는, 방송 신호 및/또는 방송 관련 정보를 생성하여 송신하는 서버 또는 기 생성된 방송 신호 및/또는 방송 관련 정보를 제공받아 단말기에 송신하는 서버를 의미할 수 있다. 상기 방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다.

상기 방송 관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 상기 방송 관련 정보는, 이동통신망을 통하여도 제공될 수 있다. 이러한 경우에는 상기 이동통신 모듈(112)에 의해 수신될 수 있다.

상기 방송 관련 정보는 다양한 형태로 존재할 수 있다. 예를 들어, DMB(Digital Multimedia Broadcasting)의 EPG(Electronic Program Guide) 또는 DVB-H(Digital Video Broadcast-Handheld)의 ESG(Electronic Service Guide) 등의 형태로 존재할 수 있다.

상기 방송 수신 모듈(111)은, 예를 들어, DMB-T(Digital Multimedia Broadcasting-Terrestrial), DMB-S(Digital Multimedia Broadcasting-Satellite), MediaFLO(Media Forward Link Only), DVB-H(Digital Video Broadcast-Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등의 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 물론, 상기 방송 수신 모듈(111)은, 상술한 디지털 방송 시스템뿐만 아니라 다른 방송 시스템에 적합하도록 구성될 수도 있다.

방송 수신 모듈(111)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는 메모리(160)에 저장될 수 있다.

이동통신 모듈(112)은, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 상기 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.

상기 이동통신 모듈(112)은 화상통화모드 및 음성통화모드를 구현하도록 이루어진다. 화상통화모드는 상대방의 영상을 보면서 통화하는 상태를 지칭하고, 음성통화모드는 상대방의 영상을 보지 않으면서 통화를 하는 상태를 지칭한다. 화상통화모드 및 음성통화모드를 구현하기 위하여 이동통신 모듈(112)은 음성 및 영상 중 적어도 하나를 송수신하도록 형성된다.

무선 인터넷 모듈(113)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 이동 단말기(100)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN(Wireless LAN), WiFi(Wireless Fidelity) Direct, DLNA(Digital Living Network Alliance), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다.

근거리 통신 모듈(114)은 근거리 통신을 위한 모듈을 말한다. 근거리 통신(short range communication) 기술로 블루투스(Bluetooth™), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication) 등이 이용될 수 있다.

위치정보 모듈(115)은 이동 단말기의 위치를 획득하기 위한 모듈로서, 그의 대표적인 예로는 GPS(Global Position System) 모듈 또는 WiFi(Wireless Fidelity) 모듈이 있다.

도 1b를 참조하면, A/V(Audio/Video) 입력부(120)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 여기에는 카메라(121)와 마이크(122) 등이 포함될 수 있다. 카메라는(121)는 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(151)에 표시될 수 있다.

카메라(121)에서 처리된 화상 프레임은 메모리(160)에 저장되거나 무선 통신부(110)를 통하여 외부 기기로 전송될 수 있다. 또한, 카메라(121)에서 획득되는 화상 프레임으로부터 사용자의 위치 정보 등이 산출될 수 있다. 카메라(121)는 사용 환경에 따라 2개 이상이 구비될 수도 있다.

마이크(122)는 통화모드 또는 녹음모드, 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 처리된 음성 데이터는 통화모드인 경우 이동통신 모듈(112)을 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(122)에는 외부의 음향 신호를 입력 받는 과정에서 발생되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.

사용자 입력부(130)는 사용자로부터 인가되는 이동 단말기(100)의 동작을 제어하기 위한 제어명령에 따른 입력 데이터를 발생시킨다. 사용자 입력부(130)는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다.

감지부(또는 센싱부, 140)는 이동 단말기(100)의 개폐 상태, 이동 단말기(100)의 위치, 사용자 접촉 유무, 이동 단말기의 방위, 이동 단말기의 가속/감속 등과 같이 이동 단말기(100)의 현 상태를 감지하여 이동 단말기(100)의 동작을 제어하기 위한 감지 신호 (또는 센싱 신호)를 발생시킨다. 예를 들어 감지부(140)는 이동 단말기(100)가 슬라이드 폰 형태인 경우 슬라이드 폰의 개폐 여부를 감지할 수 있다. 또한, 감지부(140)는 전원 공급부(190)의 전원 공급 여부, 인터페이스부(170)의 외부 기기 결합 여부 등을 감지할 수도 있다.

출력부(150)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 이에는 디스플레이부(151), 음향 출력 모듈(153), 알람부(154) 및 햅틱 모듈(155) 등이 포함될 수 있다.

디스플레이부(151)는 이동 단말기(100)에서 처리되는 정보를 표시(출력)한다. 예를 들어, 이동 단말기가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 이동 단말기(100)가 화상 통화 모드 또는 촬영 모드인 경우에 디스플레이부(151)는 촬영 또는/및 수신된 영상 또는 UI, GUI를 표시한다.

디스플레이부(151)는 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전자잉크 디스플레이(e-ink display) 중에서 적어도 하나를 포함할 수 있다.

이들 중 일부 디스플레이는 그를 통해 외부를 볼 수 있도록 투명형 또는 광투과형으로 구성될 수 있다. 이는 투명 디스플레이라 호칭될 수 있는데, 상기 투명 디스플레이의 대표적인 예로는 TOLED(Transparant OLED) 등이 있다. 디스플레이부(151)의 후방 구조 또한 광 투과형 구조로 구성될 수 있다. 이러한 구조에 의하여, 사용자는 단말기 바디의 디스플레이부(151)가 차지하는 영역을 통해 단말기 바디(body)의 후방에 위치한 사물을 볼 수 있다.

이동 단말기(100)의 구현 형태에 따라 디스플레이부(151)가 2개 이상 존재할 수 있다. 예를 들어, 이동 단말기(100)에는 복수의 디스플레이부들이 하나의 면에 이격되거나 일체로 배치될 수 있고, 또한 서로 다른 면에 각각 배치될 수도 있다.

또한, 상기 디스플레이부(151)는 입체영상을 표시하는 입체 디스플레이부(152)로서 구성될 수 있다.

여기서, 입체영상은 3차원 입체영상(3-dimensional stereoscopic image)을 나타내며, 3차원 입체 영상(3-dimensional stereoscopic image)은 모니터나 스크린 상에서 사물이 위치한 점진적 깊이(depth)와 실체(reality)를 현실 공간과 동일하게 느낄 수 있도록 한 영상이다. 3차원 입체 영상은 양안시차(binocular disparity)를 이용하여 구현된다. 양안시차란 떨어져 있는 두 눈의 위치에 의하여 이루어지는 시차를 의미하는 것으로, 두 눈이 서로 다른 2차원 화상을 보고 그 화상들이 망막을 통하여 뇌로 전달되어 융합되면 입체 영상의 깊이 및 실제감을 느낄 수 있게 된다.

상기 입체 디스플레이부(152)에는 스테레오스코픽 방식(안경 방식), 오토 스테레오스코픽 방식(무안경 방식), 프로젝션 방식(홀로그래픽 방식) 등의 3차원 디스플레이 방식이 적용될 수 있다. 가정용 텔레비전 수신기 등에 많이 이용되는 스테레오스코픽 방식에는 휘스톤 스테레오스코프 방식 등이 있다.

상기 오토 스테레오스코픽 방식의 예로서, 패럴렉스 배리어(parallex barrier) 방식, 렌티큘러(lenticular) 방식, 집적영상(integral imaging) 방식, 스위츠블 렌즈(switchable lens) 등이 있다. 프로젝션 방식에는 반사형 홀로그래픽 방식, 투과형 홀로그래픽 방식 등이 있다.

일반적으로 3차원 입체 영상은 좌 영상(좌안용 영상)과 우 영상(우안용 영상)으로 구성된다. 좌 영상과 우 영상이 3차원 입체 영상으로 합쳐지는 방식에 따라, 좌 영상과 우 영상을 한 프레임 내 상하로 배치하는 탑-다운(top-down) 방식, 좌 영상과 우 영상을 한 프레임 내 좌우로 배치하는 L-to-R(left-to-right, side by side) 방식, 좌 영상과 우 영상의 조각들을 타일 형태로 배치하는 체커 보드(checker board) 방식, 좌 영상과 우 영상을 열 단위 또는 행 단위로 번갈아 배치하는 인터레이스드(interlaced) 방식, 그리고 좌 영상과 우 영상을 시간 별로 번갈아 표시하는 시분할(time sequential, frame by frame) 방식 등으로 나뉜다.

또한, 3차원 썸네일 영상은 원본 영상 프레임의 좌 영상 및 우 영상으로부터 각각 좌 영상 썸네일 및 우 영상 썸네일을 생성하고, 이를 합쳐서 하나의 3차원 썸네일 영상을 생성할 수 있다. 일반적으로 썸네일(thumbnail)은 축소된 화상 또는 축소된 정지영상을 의미한다. 이렇게 생성된 좌 영상 썸네일과 우 영상 썸네일은 좌 영상과 우 영상의 시차에 대응하는 깊이감(depth)만큼 화면 상에서 좌우 거리차를 두고 표시됨으로써 입체적인 공간감을 나타낼 수 있다.

3차원 입체영상의 구현에 필요한 좌 영상과 우 영상은 입체 처리부(미도시)에 의하여 입체 디스플레이부(152)에 표시될 수 있다. 입체 처리부는 3D 영상을 입력받아 이로부터 좌 영상과 우 영상을 추출하거나, 2D 영상을 입력받아 이를 좌 영상과 우 영상으로 전환하도록 이루어진다.

한편, 디스플레이부(151)와 터치 동작을 감지하는 센서(이하, '터치 센서'라 함)가 상호 레이어 구조를 이루는 경우(이하, '터치 스크린'이라 함)에, 디스플레이부(151)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 터치 센서는, 예를 들어, 터치 필름, 터치 시트, 터치 패드 등의 형태를 가질 수 있다.

터치 센서는 디스플레이부(151)의 특정 부위에 가해진 압력 또는 디스플레이부(151)의 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력신호로 변환하도록 구성될 수 있다. 터치 센서는 터치 대상체가 터치 센서 상에 터치 되는 위치 및 면적뿐만 아니라, 터치 시의 압력까지도 검출할 수 있도록 구성될 수 있다. 여기에서, 터치 대상체는 상기 터치 센서에 터치를 인가하는 물체로서, 예를 들어, 손가락, 터치펜 또는 스타일러스 펜(Stylus pen), 포인터 등이 될 수 있다.

터치 센서에 대한 터치 입력이 있는 경우, 그에 대응하는 신호(들)는 터치 제어기로 보내진다. 터치 제어기는 그 신호(들)를 처리한 다음 대응하는 데이터를 제어부(180)로 전송한다. 이로써, 제어부(180)는 디스플레이부(151)의 어느 영역이 터치 되었는지 여부 등을 알 수 있게 된다.

도 1b를 참조하면, 상기 터치 스크린에 의해 감싸지는 이동 단말기의 내부 영역 또는 상기 터치 스크린의 근처에 근접 센서(141)가 배치될 수 있다. 근접 센서(141)는 상기 센싱부(140)의 일 예로서 구비될 수 있다. 상기 근접 센서(141)는 소정의 검출면에 접근하는 물체, 혹은 근방에 존재하는 물체의 유무를 전자계의 힘 또는 적외선을 이용하여 기계적 접촉이 없이 검출하는 센서를 말한다. 근접 센서(141)는 접촉식 센서보다는 그 수명이 길며 그 활용도 또한 높다.

상기 근접 센서(141)의 예로는 투과형 광전 센서, 직접 반사형 광전 센서, 미러 반사형 광전 센서, 고주파 발진형 근접 센서, 정전 용량형 근접 센서, 자기형 근접 센서, 적외선 근접 센서 등이 있다. 상기 터치 스크린이 정전식인 경우에는 전도성을 갖는 물체(이하, 포인터라 함)의 근접에 따른 전계의 변화로 상기 포인터의 근접을 검출하도록 구성된다. 이 경우 상기 터치 스크린(터치 센서)은 근접 센서로 분류될 수도 있다.

이하에서는 설명의 편의를 위해, 상기 터치 스크린 상에 포인터가 접촉되지 않으면서 근접되어 상기 포인터가 상기 터치 스크린 상에 위치함이 인식되도록 하는 행위를 "근접 터치(proximity touch)"라고 칭하고, 상기 터치 스크린 상에 포인터가 실제로 접촉되는 행위를 "접촉 터치(contact touch)"라고 칭한다. 상기 터치 스크린 상에서 포인터로 근접 터치가 되는 위치라 함은, 상기 포인터가 근접 터치될 때 상기 포인터가 상기 터치 스크린에 대해 수직으로 대응되는 위치를 의미한다.

상기 근접센서(141)는, 근접 터치와, 근접 터치 패턴(예를 들어, 근접 터치 거리, 근접 터치 방향, 근접 터치 속도, 근접 터치 시간, 근접 터치 위치, 근접 터치 이동 상태 등)을 감지한다. 상기 감지된 근접 터치 동작 및 근접 터치 패턴에 상응하는 정보는 터치 스크린상에 출력될 수 있다.

입체 디스플레이부(152)와 터치 센서가 상호 레이어 구조를 이루는 경우(이하, '입체 터치스크린'이라 함)나, 입체 디스플레이부(152)와 터치 동작을 감지하는 3차원 센서가 서로 조합되는 경우에는 상기 입체 디스플레이부(152)는 3차원의 입력 장치로도 사용될 수 있다.

상기 3차원 센서의 예로서, 상기 센싱부(140)는 근접 센서(141), 입체 터치센싱부(142), 초음파 센싱부(143), 카메라 센싱부(144)를 포함할 수 있다.

근접센서(141)는 전자계의 힘 또는 적외선을 이용하여 기계적 접촉이 없이 터치를 가하는 감지대상(예를 들어, 사용자의 손가락이나 스타일러스 펜)와 검출면과의 거리를 측정한다. 단말기는 이러한 거리를 이용하여 입체영상의 어느 부분이 터치되었는지를 인식하게 된다. 특히, 터치스크린이 정전식인 경우에는 상기 감지대상의 근접에 따른 전계의 변화로 상기 감지대상의 근접 정도를 검출하고, 이러한 근접 정도를 이용하여 3차원상의 터치를 인식하도록 구성된다.

입체 터치센싱부(142)는 터치 스크린상에 가해지는 터치의 세기나 지속시간을 감지하도록 이루어진다. 예를 들어, 입체 터치센싱부(142)는 터치를 가하는 압력을 감지하고, 가압력이 강하면 이를 단말기의 내부를 향하여 터치 스크린과 보다 멀리 위치한 객체에 대한 터치로 인식한다.

초음파 센싱부(143)는 초음파를 이용하여, 감지대상의 위치정보를 인식하도록 이루어진다.

초음파 센싱부(143)는, 예를 들어 광 센서와 복수의 초음파 센서로 이루어질 수 있다. 광 센서는 광을 감지하도록 형성되며, 초음파 센서는 초음파를 감지하도록 형성된다. 광이 초음파보다 매우 빠르기 때문에, 광이 광 센서에 도달하는 시간은 초음파가 초음파 센서에 도달하는 시간보다 매우 빠르다. 따라서, 광을 기준 신호로 초음파가 도달하는 시간과의 시간차를 이용하여 파동 발생원의 위치를 산출할 수 있게 된다.

카메라 센싱부(144)는 카메라(121), 포토 센서, 레이저 센서 중 적어도 하나를 포함한다.

예를 들어, 카메라(121)와 레이저 센서는 서로 조합되어, 3차원 입체영상에 대한 감지대상의 터치를 감지한다. 카메라에 의하여 촬영된 2차원 영상에 레이저 센서에 의하여 감지된 거리정보가 더해지면, 3차원 정보가 획득될 수 있다.

또 다른 예로서, 포토 센서가 디스플레이 소자에 적층될 수 있다. 포토 센서는 터치 스크린에 근접한 감지대상의 움직임을 스캐닝하도록 이루어진다. 보다 구체적으로, 포토 센서는 행/열에 Photo Diode와 TR(Transistor)를 실장하여 Photo Diode에 인가되는 빛의 양에 따라 변화되는 전기적 신호를 이용하여 포토 센서 위에 올려지는 내용물을 스캔한다. 즉, 포토 센서는 빛의 변화량에 따른 감지대상의 좌표 계산을 수행하며, 이를 통하여 감지대상의 위치정보를 획득하게 된다.

음향 출력 모듈(153)은 호신호 수신, 통화모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리(160)에 저장된 오디오 데이터를 출력할 수 있다. 음향 출력 모듈(153)은 이동 단말기(100)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력하기도 한다. 이러한 음향 출력 모듈(153)에는 리시버(receiver), 스피커(speaker), 버저(buzzer) 등이 포함될 수 있다.

알람부(154)는 이동 단말기(100)의 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기(100)에서 발생 되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 터치 입력 등이 있다. 알람부(154)는 비디오 신호나 오디오 신호 이외에 다른 형태, 예를 들어 진동을 이용하여, 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 상기 비디오 신호나 오디오 신호는 디스플레이부(151)나 음향 출력 모듈(153)을 통해서도 출력될 수 있어서, 디스플레이부(151) 및 음향 출력 모듈(153)은 알람부(154)의 일부로 분류될 수도 있다.

햅틱 모듈(haptic module)(155)은 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(155)이 발생시키는 촉각 효과의 대표적인 예로는 진동이 될 수 있다. 햅택 모듈(155)이 발생하는 진동의 세기와 패턴 등은 사용자의 선택 또는 제어부의 설정에 의해 제어될 수 있다. 예를 들어, 상기 햅틱 모듈(155)은 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다.

햅틱 모듈(155)은, 진동 외에도, 접촉 피부면에 대해 수직 운동하는 핀 배열, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력, 피부 표면에 대한 스침, 전극(eletrode)의 접촉, 정전기력 등의 자극에 의한 효과와, 흡열이나 발열 가능한 소자를 이용한 냉온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다.

햅틱 모듈(155)은 직접적인 접촉을 통해 촉각 효과의 전달할 수 있을 뿐만 아니라, 사용자가 손가락이나 팔 등의 근 감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(155)은 이동 단말기(100)의 구성 태양에 따라 2개 이상이 구비될 수 있다.

메모리(160)는 제어부(180)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리(160)는 상기 터치 스크린 상의 터치 입력시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.

메모리(160)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(random access memory; RAM), SRAM(static random access memory), 롬(read-only memory; ROM), EEPROM(electrically erasable programmable read-only memory), PROM(programmable read-only memory), 자기 메모리, 자기 디스크 및 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 이동 단말기(100)는 인터넷(internet)상에서 상기 메모리(160)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작될 수도 있다.

인터페이스부(170)는 이동 단말기(100)에 연결되는 모든 외부 기기와의 통로 역할을 한다. 인터페이스부(170)는 외부 기기로부터 데이터를 전송받거나, 전원을 공급받아 이동 단말기(100) 내부의 각 구성요소에 전달하거나, 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트(port), 외부 충전기 포트(port), 유/무선 데이터 포트(port), 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트(port), 오디오 I/O(Input/Output) 포트(port), 비디오 I/O(Input/Output) 포트(port), 이어폰 포트(port) 등이 인터페이스부(170)에 포함될 수 있다.

한편, 식별 모듈은 이동 단말기(100)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(user identify module; UIM), 가입자 인증 모듈(subscriber identity module; SIM), 범용 사용자 인증 모듈(universal subscriber identity module; USIM) 등을 포함할 수 있다. 식별 모듈이 구비된 장치(이하 '식별 장치')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 장치는 상기 인터페이스부(170)를 통하여 단말기(100)와 연결될 수 있다.

또한, 상기 인터페이스부(170)는 이동 단말기(100)가 외부 크래들(cradle)과 연결될 때 상기 크래들로부터의 전원이 상기 이동 단말기(100)에 공급되는 통로가 되거나, 사용자에 의해 상기 크래들에서 입력되는 각종 명령 신호가 상기 이동 단말기(100)로 전달되는 통로가 될 수 있다. 상기 크래들로부터 입력되는 각종 명령 신호 또는 상기 전원은 상기 이동 단말기(100)가 상기 크래들에 정확히 장착되었음을 인지하기 위한 신호로 동작될 수 있다.

제어부(controller, 180)는 통상적으로 이동 단말기(100)의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등과 관련된 제어 및 처리를 수행한다. 제어부(180)는 멀티미디어 재생을 위한 멀티미디어 모듈(181)을 구비할 수도 있다. 멀티미디어 모듈(181)은 제어부(180) 내에 구현될 수도 있고, 제어부(180)와 별도로 구현될 수도 있다.

또한, 상기 제어부(180)는 상기 터치 스크린 상에서 행해지는 필기 입력 또는 그림 그리기 입력을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식 처리를 행할 수 있다.

또한, 상기 제어부(180)는 상기 이동 단말기의 상태가 설정된 조건을 만족하면, 애플리케이션들에 대한 사용자의 제어 명령의 입력을 제한하는 잠금 상태를 실행할 수 있다. 또한, 상기 제어부(180)는 상기 잠금 상태에서 상기 디스플레이부(151)를 통해 감지되는 터치 입력에 근거하여 상기 잠금 상태에서 표시되는 잠금화면을 제어할 수 있다.

전원 공급부(190)는 제어부(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가 받아 각 구성요소들의 동작에 필요한 전원을 공급한다.

여기에 설명되는 다양한 실시 예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다.

하드웨어적인 구현에 의하면, 여기에 설명되는 실시 예는 ASICs(application specific integrated circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시 예들은 제어부(180) 자체로 구현될 수 있다.

소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시 예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다.

소프트웨어 코드는 적절한 프로그램 언어로 쓰여진 소프트웨어 애플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 메모리(160)에 저장되고, 제어부(180)에 의해 실행될 수 있다.

다음으로, 본 발명에 따른 이동 단말기(100)를 통해 실시 가능한 통신 시스템에 대하여 살펴본다.

도 2a 및 도 2b는 본 발명에 따른 이동 단말기(100)가 동작 가능한 통신 시스템의 개념도이다.

먼저, 도 2a를 살펴보면, 통신 시스템은, 서로 다른 무선 인터페이스 및/또는 물리 계층을 이용할 수도 있다. 예를 들어, 통신 시스템에 의해 이용 가능한 무선 인터페이스에는, 주파수 분할 다중 접속(Frequency Division Multiple Access, FDMA), 시분할 다중 접속(Time Division Multiple Access, TDMA), 코드 분할 다중 접속(Code Division Multiple Access, CDMA), 범용 이동통신 시스템(Universal Mobile Telecommunications Systems, UMTS)(특히, LTE(Long Term Evolution)), 이동통신 글로벌 시스템(Global System for Mobile Communications, GSM) 등이 포함될 수 있다.

이하에서는, 설명의 편의를 위하여, CDMA에 한정하여 설명하도록 한다. 그러나, 본 발명은, CDMA 무선 통신 시스템을 포함한 모든 통신 시스템 적용될 수 있음은 자명하다.

도 2a에 도시된 바와 같이, CDMA 무선 통신 시스템은, 적어도 하나의 단말기(100), 적어도 하나의 기지국(Base Station, BS)(270), 적어도 하나의 기지국 제어부(Base Station Controllers, BSCs)(275), 이동 스위칭 센터(Mobile Switching Center, MSC)(280)를 포함할 수 있다. MSC(280)는, 일반 전화 교환망(Public Switched Telephone Network, PSTN)(290) 및 BSCs(275)와 연결되도록 구성된다. BSCs(275)는, 백홀 라인(backhaul line)을 통하여, BS(270)와 짝을 이루어 연결될 수 있다. 백홀 라인은, E1/T1, ATM, IP, PPP, Frame Relay, HDSL, ADSL 또는 xDSL 중 적어도 하나에 따라서 구비될 수 있다. 따라서, 복수의 BSCs(275)가 도 2a에 도시된 시스템에 포함될 수 있다.

복수의 BS(270) 각각은 적어도 하나의 섹터를 포함할 수 있고, 각각의 섹터는, 전방향성 안테나 또는 BS(270)로부터 방사상의 특정 방향을 가리키는 안테나를 포함할 수 있다. 또한, 각각의 섹터는, 다양한 형태의 안테나를 두 개 이상 포함할 수도 있다. 각각의 BS(270)는, 복수의 주파수 할당을 지원하도록 구성될 수 있고, 복수의 주파수 할당은 각각 특정 스펙트럼(예를 들어, 1.25MHz, 5MHz 등)을 가질 수 있다.

섹터와 주파수 할당의 교차는, CDMA 채널이라고 불릴 수 있다. BS(270)은 는, 기지국 송수신 하부 시스템(Base Station Transceiver Subsystem, BTSs)이라고 불릴수 있다. 이러한 경우, 하나의 BSC(275) 및 적어도 하나의 BS(270)를 합하여 “기지국”이라고 칭할 수 있다. 기지국은, 또한 "셀 사이트"를 나타낼 수도 있다. 또는, 특정 BS(270)에 대한 복수의 섹터들 각각은, 복수의 셀 사이트로 불릴 수도 있다.

도 2a에 도시된 바와 같이, 방송 송신부(Broadcasting Transmitter, BT)(295)는, 시스템 내에서 동작하는 단말기들(100)에게 방송 신호를 송신한다. 도 1b에 도시된 방송 수신 모듈(111)은, BT(295)에 의해 전송되는 방송 신호를 수신하기 위해 단말기(100) 내에 구비된다.

뿐만 아니라, 도 2a에서는, 위성 위치 확인 시스템(Global Positioning System, GPS)의 위성(300)을 도시한다. 상기 위성(300)은, 이동 단말기(100)의 위치를 파악하는 것을 돕는다. 도 2a에서는 두 개의 위성이 도시되어 있지만, 유용한 위치 정보는, 두 개 이하 또는 이상의 위성들에 의해 획득될 수도 있다. 도 1b에 도시된 위치정보 모듈(115)은, 원하는 위치 정보를 획득하기 위하여 도 2a에 도시된 위성(300)과 협력한다. 여기에서는, GPS 추적 기술뿐만 아니라 위치를 추적할 수 있는 모든 기술들을 이용하여 이동 단말기(100)의 위치가 추적될 수 있다. 또한, GPS 위성(300) 중 적어도 하나는, 선택적으로 또는 추가로 위성 DMB 전송을 담당할 수도 있다.

무선 통신 시스템의 전형적인 동작 중, BS(270)는, 이동 단말기(100)로부터 역 링크 신호를 수신한다. 이때, 이동 단말기(100)는, 호를 연결 중이거나, 메시지를 송수신 중이거나 또는 다른 통신 동작을 수행하고 있다. 특정 기지국(270)에 의해 수신된 역 링크 신호들 각각은, 특정 기지국(270)에 의해 내에서 처리된다. 상기 처리 결과 생성된 데이터는, 연결된 BSC(275)로 송신된다. BSC(275)는, 기지국들(270) 간의 소프트 핸드오프(soft handoff)들의 조직화를 포함하여, 호 자원 할당 및 이동성 관리 기능을 제공한다. 또한, BSCs(275)는, 상기 수신된 데이터를 MSC(280)로 송신하고, MSC(280)는, PSTN(290)과의 연결을 위하여 추가적인 전송 서비스를 제공한다. 또한, 이와 유사하게 PSTN(290)은 MSC(280)와 연결되고, MSC(280)는 BSCs(275)와 연결되고, BSCs(275)는 이동 단말기(100)로 순 링크 신호가 전송되도록 BS(270)를 제어할 수 있다.

다음으로, 도 2b에서는 와이파이 위치추적 시스템(WPS: WiFi(Wireless Fidelity) Positioning System)을 이용하여, 이동 단말기의 위치정보를 획득하는 방법에 대하여 살펴본다.

와이파이 위치추적 시스템(WPS: WiFi Positioning System, 300)은 이동 단말기(100)에 구비된 WiFi모듈 및 상기 WiFi모듈과 무선신호를 송신 또는 수신하는 무선 AP(Wireless Access Point, 320)를 이용하여, 이동 단말기(100)의 위치를 추적하는 기술로서, WiFi를 이용한 WLAN(Wireless Local Area Network)기반의 위치 측위 기술을 의미한다.

와이파이 위치추적 시스템(300)은 와이파이 위치측위 서버(310), 이동 단말기(100), 상기 이동 단말기(100)와 접속된 무선 AP(330), 임의의 무선 AP정보가 저장된 데이터 베이스(330)를 포함할 수 있다.

와이파이 위치측위 서버(310)는 이동 단말기(100)의 위치정보 요청 메시지(또는 신호)에 근거하여, 이동 단말기(100)와 접속된 무선 AP(320)의 정보를 추출한다. 상기 이동 단말기(100)와 접속된 무선 AP(320)의 정보는 이동 단말기(100)를 통해 상기 와이파이 위치측위 서버(310)로 전송되거나, 무선 AP(320)에서 와이파이 위치측위 서버(310)로 전송될 수 있다.

상기 이동 단말기(100)의 위치정보 요청 메시지에 근거하여, 추출되는 무선 AP의 정보는 MAC Address, SSID, RSSI, 채널정보, Privacy, Network Type, 신호세기(Signal Strength) 및 노이즈 세기(Noise Strength )중 적어도 하나일 수 있다.

와이파이 위치측위 서버(310)는 위와 같이, 이동 단말기(100)와 접속된 무선 AP(320)의 정보를 수신하여, 미리 구축된 데이터베이스(330)에 포함된 정보와 상기 수신된 무선 AP(320) 정보를 비교하여, 상기 이동 단말기(100)의 위치정보를 추출(또는 분석)한다.

한편, 도 2b에서는 일 예로서, 이동 단말기(100)와 접속되어 있는 무선 AP를 제1, 제2 및 제3 무선 AP(320)로 도시하였다. 그러나, 이동 단말기(100)와 접속되는 무선 AP의 수는 이동 단말기(100)가 위치한 무선 통신환경에 따라 다양하게 변경될 수 있다. 와이파이 위치추척 시스템(300)은 이동 단말기(100)가 적어도 하나의 무선 AP와 접속되는 경우, 이동 단말기(100)의 위치를 추적하는 것이 가능하다.

다음으로, 임의의 무선 AP정보가 저장되어 있는 데이터 베이스(330)에 대하여 보다 구체적으로 살펴보면, 상기 데이터 베이스(330)에는 서로 다른 위치에 배치된 임의의 무선 AP들의 다양한 정보가 저장될 수 있다.

상기 데이터 베이스(300)에 저장되는 임의의 무선 AP들의 정보는 MAC Address, SSID, RSSI, 채널정보, Privacy, Network Type, 무선 AP의 위경도 좌표, 무선 AP가 위치한 건물명, 층수, 실내 상세 위치정보(GPS 좌표 이용가능), AP소유자의 주소, 전화번호 등의 정보일 수 있다.

이와 같이, 상기 데이터베이스(330)에는 임의의 무선 AP정보 및 상기 임의의 무선 AP에 대응되는 위치정보가 함께 저장되어 있으므로, 와이파이 위치측위 서버(310)는 상기 데이터베이스(330)에서 이동 단말기(100)에 접속된 무선 AP(320)의 정보와 대응되는 무선 AP정보를 검색하고, 검색된 무선 AP정보에 매칭된 위치정보 추출함으로써, 이동 단말기(100)의 위치정보를 추출할 수 있다.

그리고, 이렇게 추출된 이동 단말기(100)의 위치정보는 상기 와이파이 위치측위 서버(310)를 통해 이동 단말기(100)로 전송됨으로써, 이동 단말기(100)는 위치정보를 획득할 수 있다.

이하, 상기 도 1b에서 살펴본 본 발명의 일 실시 예에 따른 이동 단말기 또는 이동 단말기의 구성요소들이 배치된 이동 단말기 또는 이동 단말기의 구조를 살펴본다.

도 3a는 본 발명과 관련된 이동 단말기(100)의 일 예를 전면에서 바라본 사시도이다.

개시된 이동 단말기(100)는 바 형태의 단말기 바디를 구비하고 있다. 다만, 본 발명은 여기에 한정되지 않고, 와치 타입, 클립 타입, 안경 타입 또는 2 이상의 바디들이 상대 이동 가능하게 결합되는 폴더 타입, 플립 타입, 슬라이드 타입, 스윙 타입, 스위블 타입 등 다양한 구조에 적용될 수 있다.

바디는 외관을 이루는 케이스(프레임, 하우징, 커버 등)를 포함한다. 본 실시예에서, 케이스는 프론트 케이스(101)와 리어 케이스(102)로 구분될 수 있다. 프론트 케이스(101)와 리어 케이스(102)의 사이에 형성된 공간에는 각종 전자부품들이 내장된다. 프론트 케이스(101)와 리어 케이스(102) 사이에는 적어도 하나의 중간 케이스가 추가로 배치될 수 있으며, 배터리(191)를 덮는 배터리 커버(103)가 리어 케이스(102)에 착탈 가능하게 구성될 수도 있다.

케이스들은 합성수지를 사출하여 형성되거나 금속, 예를 들어 스테인레스 스틸(STS), 알루미늄(Al), 티타늄(Ti) 등으로 형성될 수도 있다.

단말기 바디의 전면에는 디스플레이부(151), 제1음향출력모듈(153a), 제1카메라(121a), 제1조작유닛(131) 등이 배치되며, 측면에는 마이크(122), 인터페이스부(170), 제2조작유닛(132) 등이 구비될 수 있다.

디스플레이부(151)는 이동 단말기(100)에서 처리되는 정보를 표시(출력)하도록 이루어진다. 디스플레이부(151)는 정보를 시각적으로 표현하는 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전자잉크 디스플레이(e-ink display) 중에서 적어도 하나를 포함할 수 있다.

상기 디스플레이부(151)는 터치 방식에 의하여 제어 명령을 입력 받을 수 있게 터치감지수단을 포함할 수 있다. 디스플레이부(151) 상의 어느 한 곳에 대하여 터치가 이루어지면 터치감지수단은 이를 감지하고 그 터치된 위치에 대응하는 내용이 입력되게 구성될 수 있다. 터치 방식에 의하여 입력되는 내용은 문자 또는 숫자이거나, 각종 모드에서의 지시 또는 지정 가능한 메뉴항목 등일 수 있다.

터치감지수단은 디스플레이부(151)에서 출력되는 시각 정보가 보일 수 있도록 투광성으로 형성되며, 밝은 곳에서 터치스크린의 시인성(visibility)을 높이기 위한 구조가 포함될 수 있다. 도 3a에 의하면, 디스플레이부(151)는 프론트 케이스(101)의 전면(front surface)의 대부분을 차지한다.

디스플레이부(151)의 양단부 중 일 단부에 인접한 영역에는 제1음향출력모듈(153a)과 제1카메라(121a)가 배치되고, 다른 단부에 인접한 영역에는 제1조작유닛(131)과 마이크(122)가 배치된다. 제2조작유닛(132, 도 3b 참조), 인터페이스부(170) 등은 단말기 바디의 측면에 배치될 수 있다.

제1음향출력모듈(153a)은 통화음을 사용자의 귀에 전달시키는 리시버(receiver) 또는 각종 알람음이나 멀티미디어의 재생음을 출력하는 라우드 스피커(loud speaker)의 형태로 구현될 수 있다.

제1음향출력모듈(153a)로부터 발생되는 사운드는 구조물 간의 조립틈을 따라 방출되도록 구성될 수 있다. 이 경우, 외관상 음향 출력을 위하여 독립적으로 형성되는 홀이 보이지 않거나, 숨겨져 이동 단말기(100)의 외관이 보다 심플해질 수 있다. 다만, 본 발명은 이에 한정되는 것은 아니며, 상기 사운드의 방출을 위한 홀이 윈도우에 형성될 수 있다.

제1카메라(121a)는 화상통화 모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(151)에 표시될 수 있다.

사용자 입력부(130)는 이동 단말기(100)의 동작을 제어하기 위한 명령을 입력 받기 위해 조작되는 것으로서, 제1 및 제2조작유닛(131, 132)을 포함할 수 있다. 제1 및 제2조작유닛(131, 132)은 조작부(manipulating portion)로도 통칭될 수 있으며, 터치, 푸쉬, 스크롤 등 사용자가 촉각적인 느낌을 가면서 조작하게 되는 방식(tactile manner)이라면 어떤 방식이든 채용될 수 있다.

본 도면에서는 제1 조작유닛(131)이 터치키(touch key)인 것을 기준으로 예시하나, 본 발명은 이에 한정되는 것은 아니다. 예를 들어 제1 조작유닛(131)은 푸시키(mechanical key)가 되거나, 터치키와 푸시키의 조합으로 구성될 수 있다.

제1 및/또는 제2조작유닛들(131, 132)에 의하여 입력되는 내용은 다양하게 설정될 수 있다. 예를 들어, 제1조작유닛(131)은 메뉴, 홈키, 취소, 검색 등과 같은 명령을 입력 받고, 제2조작유닛(132)은 제1음향출력모듈(153a)에서 출력되는 음향의 크기 조절 또는 디스플레이부(151)의 터치 인식 모드로의 전환 등과 같은 명령을 입력 받을 수 있다.

마이크(122)는 사용자의 음성, 기타 소리 등을 입력 받도록 형성된다. 마이크(122)는 복수의 개소에 구비되어 스테레오 음향을 입력 받도록 구성될 수 있다.

인터페이스부(170)는 이동 단말기(100)가 외부기기와 데이터 교환 등을 할 수 있게 하는 통로가 된다. 예를 들어, 인터페이스부(170)는 유선 또는 무선으로 이어폰과 연결하기 위한 접속단자, 근거리 통신을 위한 포트{예를 들어 적외선 포트(IrDA Port), 블루투스 포트(Bluetooth Port), 무선 랜 포트(Wireless LAN Port) 등}, 또는 이동 단말기(100)에 전원을 공급하기 위한 전원공급 단자들 중 적어도 하나일 수 있다. 이러한 인터페이스부(170)는 SIM(Subscriber Identification Module) 또는 UIM(User Identity Module), 정보 저장을 위한 메모리 카드 등의 외장형 카드를 수용하는 소켓의 형태로 구현될 수 있다.

도 3b는 도 3a에 도시된 이동 단말기(100)의 후면 사시도이다.

도 3b를 참조하면, 단말기 바디의 후면, 다시 말해서 리어 케이스(102)에는 제2카메라(121b)가 추가로 장착될 수 있다. 제2카메라(121b)는 제1카메라(121a, 도 3a 참조)와 실질적으로 반대되는 촬영 방향을 가지며, 제1카메라(121a)와 서로 다른 화소를 가지는 카메라일 수 있다.

예를 들어, 제1카메라(121a)는 화상 통화 등의 경우에 사용자의 얼굴을 촬영하여 상대방에 전송함에 무리가 없도록 저 화소를 가지며, 제2카메라(121b)는 일반적인 피사체를 촬영하고 바로 전송하지는 않는 경우가 많기에 고 화소를 가지는 것이 바람직하다. 제1 및 제2카메라(121a, 121b)는 회전 또는 팝업(pop-up) 가능하게 단말기 바디에 설치될 수도 있다.

제2카메라(121b)에 인접하게는 플래시(123)와 거울(124)이 추가로 배치된다. 플래시(123)는 제2카메라(121b)로 피사체를 촬영하는 경우에 피사체를 향해 빛을 비추게 된다. 거울(124)은 사용자가 제2카메라(121b)를 이용하여 자신을 촬영(셀프 촬영)하고자 하는 경우에, 사용자 자신의 얼굴 등을 비춰볼 수 있게 한다.

단말기 바디의 후면에는 제2음향출력모듈(153b)이 추가로 배치될 수도 있다. 제2음향출력모듈(153b)은 제1음향출력모듈(153a, 도 3a 참조)과 함께 스테레오 기능을 구현할 수 있으며, 통화시 스피커폰 모드의 구현을 위하여 사용될 수도 있다.

단말기 바디의 측면에는 통화 등을 위한 안테나 외에 방송신호 수신용 안테나(미도시)가 추가적으로 배치될 수 있다. 방송수신모듈(111, 도 1b 참조)의 일부를 이루는 안테나는 단말기 바디에서 인출 가능하게 설치될 수 있다.

단말기 바디에는 이동 단말기(100)에 전원을 공급하기 위한 전원공급부(190, 도 1b 참조)가 구비된다. 전원공급부(190)는 단말기 바디에 내장되거나, 단말기 바디의 외부에서 착탈 가능하게 구성되는 배터리(191)를 포함할 수 있다. 본 도면에서는 배터리 커버(103)가 배터리(191)를 덮도록 리어 케이스(102)에 결합되어 배터리(191)의 이탈을 제한하고, 배터리(191)를 외부 충격과 이물질로부터 보호하는 것을 예시하고 있다.

이에 따라, 이하에서 동영상 내의 특정 장면을 검색하는데 있어서 사용자의 편의를 향상시킬 수 있는 이동 단말기(100) 및 그것의 제어 방법에 대해 첨부된 도면을 참조하여 설명한다.

도 4는 본 발명에 따른 이동 단말기(100, 도 1b 참조)의 일 실시 예를 설명하기 위한 순서도이다. 이동 단말기(100)는 디스플레이부(151), 사용자 입력부(130) 및 제어부(180)를 포함한다.

도 4를 참조하면, 우선, 동영상에 포함된 구간을 선택받는 단계(S110)가 진행된다.

실시 예로서, 동영상에 포함된 구간은 디스플레이부(151)에 가해지는 터치 입력으로 선택받거나, 물리적 키의 입력으로 선택받을 수도 있다.

이어서, 선택받은 구간에서 출력되는 소리 정보에 대응하는 시각 정보를 디스플레이부(151)에 출력하는 단계(S120)가 진행된다.

구체적으로, 소리 정보에는 사람의 음성이나 사람 이외의 생물이나 물체로부터 발생하는 소리 등이 포함될 수 있다. 시각 정보에는 사람의 음성을 변환시킨 텍스트를 포함하는 말풍선이나, 동물 소리에 대응하는 아이콘이나 이모티콘 등이 포함될 수 있다.

이때, 구간을 선택받는데 걸리는 시간에 따라 소리 정보에 대응하는 시각 정보를 다르게 출력할 수 있다.

실시 예로서, 사전에 설정한 일정 시간보다 빠르게 구간을 선택받은 경우, 선택한 구간에서 출력되는 음성 정보 중 일부만을 텍스트로 변환하여 출력할 수 있다.

도 5 내지 도 7은 음성 정보를 텍스트 정보로 변환하여 출력하는 사용자 인터페이스의 실시 예를 보여주는 개념도이다.

도 5의 (a)를 참조하면, 검색 바(bar, 510)에 가해지는 드래그 입력으로 동영상에 포함된 구간을 선택받을 수 있으며, 선택받은 구간에서 출력되는 음성 정보는 텍스트 정보(520)로 변환되어 출력될 수 있다.

구체적으로, 검색 바(510)에 드래그 입력을 가하면 동영상 탐색 모드로 자동 전환될 수 있다. 또한, 검색 바(510)의 위치는 동영상의 재생 시점에 각각 대응된다. 사용자는 동영상이 시작되는 시점부터 드래그 입력을 가하거나, 동영상의 임의의 시점부터 드래그 입력을 가하여 동영상에 포함된 구간을 선택할 수 있다.

이어서, 검색 바(510)의 위치에 대응하는 동영상의 재생 시점에서 출력되는 음성 정보를 텍스트 정보(520)로 변환한 후, 음성 정보의 발화자에 인접시켜 출력할 수 있다.

실시 예로서, 선택 구간에서 출력되는 발화자가 말한 음성을 텍스트로 변환한 후, 텍스트를 포함하고 있는 말풍선(520)을 발화자(530)를 향하도록 출력할 수 있다.

또한, 음성 정보의 발화자(530)가 하이라이트 되도록 출력할 수 있다. 실시 예로서, 배경에 흐릿한 이미지 효과를 더하여 발화자(530)를 선명하게 출력할 수 있다. 또는, 발화자(530)를 동영상에 출력되는 다른 사람보다 크게 출력하거나 다른 색상으로 출력할 수도 있다.

실시 예로서, 시각 정보와 함께 음성 정보도 출력될 수 있다. 즉, 발화자의 음성과 발화자의 음성을 변환시킨 텍스트 정보가 함께 출력될 수도 있다.

또 다른 실시 예로서, 사용자가 드래그 입력을 중지한 경우에도 검색 바에 터치를 유지하는 경우, 동영상이 계속 재생될 수 있다. 이때, 일반 재생 속도보다 빠르게 또는 느리게 재생될 수 있다.

도 5의 (b)를 참조하면, 선택받은 구간에서 출력되는 음성 정보를 텍스트 정보(520)로 변환하여, 음성 정보가 출력되는 동영상의 재생 시점에 대응하는 검색 바의 위치(512)에 텍스트 정보(520)를 출력할 수 있다.

구체적으로, 선택 구간에서 출력되는 발화자가 말한 음성을 텍스트로 변환한 후, 텍스트를 포함하고 있는 말풍선(520)을 음성이 출력되는 시점에 대응하는 검색 바의 위치(512)에 출력할 수 있다.

이때 앞서 설명한 바와 같이, 발화자(530)를 강조하여 출력할 수 있다. 예를 들면, 발화자(530)를 다른 사람들보다 크게 표시하거나 발화자(530)임을 나타내주는 인디케이터를 함께 출력할 수 있다.

도 5의 (c)를 참조하면, 선택 구간에 복수의 발화자(530, 540)가 존재하는 경우 각각의 발화자(530, 540)가 말한 음성을 텍스트로 변환한 후, 각각의 텍스트를 포함하고 있는 복수의 말풍선(532, 542)을 발화자를 향하도록 출력할 수 있다. 즉, 복수의 발화자(530, 540)가 대화를 나누는 장면이 출력될 수 있다.

즉, 도 5에 개시된 본 발명에 의하면, 사용자는 동영상에서 찾고자 하는 장면을 변환된 텍스트 정보를 통해 빠르고 정확하게 검색할 수 있다.

한편, 구간을 선택받는데 걸리는 시간에 따라 선정된 텍스트 정보의 키 워드를 시각 정보로서 출력할 수 있다.

도 6의 (a)를 참조하면, 사용자가 사전에 설정한 일정 속도 이하로 검색 바(610)에 드래그 입력을 가하면, 출력된 음성 전체를 텍스트(620)로 변환하여 출력할 수 있다. 이에 따라, 사용자는 동영상에서 출력되는 음성 내용 전체를 구체적으로 탐색할 수 있다.

도 6의 (b)를 참조하면, 사용자가 사전에 설정한 일정 속도 이상으로 검색 바(610)에 드래그 입력을 가하면, 출력된 음성 전체를 텍스트로 변환할 수 있다. 이어서, 변환된 텍스트 중 키 워드를 선정한 후 하이라이트 시킨 텍스트(622)를 출력할 수 있다.

예를 들면, 선정된 키 워드를 다른 텍스트보다 크게 표시하거나 다른 텍스트와 상이한 색상이나 글씨체로 출력할 수 있다. 또는, 선정된 키 워드에 밑줄을 그어 출력할 수도 있다.

도 6의 (c)를 참조하면, 사용자가 사전에 설정한 일정 속도 이상으로 검색 바(610)에 드래그 입력을 가하면, 출력된 음성 중 일부만을 텍스트(624)로 변환하여 출력할 수 있다.

예를 들면, 출력된 음성 중 동영상에서 자주 출력되는 음성만을 텍스트(624)로 변환하여 출력할 수 있다. 또는, 출력된 음성 중 핵심 내용인 키 워드를 선정하여 키 워드(624)만을 출력할 수도 있다. 변환된 텍스트(624)는 비교적 큰 글씨체나 눈에 띄는 색상으로 출력될 수 있다.

즉, 도 6의 (b) 및 (c)에 의하면, 빠른 동영상의 탐색 시에도 사용자의 가독성을 높여줄 수 있다.

실시 예로서, 드래그 입력을 가하는 속도와 출력되는 음성의 길이를 비교하여, 음성 전체 또는 음성의 일부만을 텍스트로 변환하여 출력할 수 있다. 구체적으로, 사용자가 빠른 드래그 입력을 가했으나 출력되는 음성의 길이가 짧은 경우, 전체 음성을 텍스트로 변환하여 출력할 수 있다.

한편, 출력되는 음성의 특성에 따라 음성을 변환한 텍스트를 포함하고 있는 말풍선을 다르게 출력할 수 있다. 구체적으로, 출력되는 음성의 발화자, 크기, 어조 등에 따라 말풍선의 모양이나 색상, 크기 등을 다르게 출력할 수 있다.

도 7의 (a)를 참조하면, 발화자 A(710)가 말하는 내용과 또 다른 발화자인 B(720)과 말하는 내용을 서로 다른 모양의 말풍선(712, 722)으로 출력할 수 있다.

도 7의 (b)를 참조하면, 발화자 A(710)가 동영상의 이전 장면들에서 보다 큰 소리로 말한 경우 또는 사전에 설정한 데시벨(dB) 이상으로 말한 경우, 크기를 증가시킨 말풍선(714)을 출력할 수 있다. 또는 말풍선(714)에 담긴 텍스트의 크기를 증가시켜 출력할 수도 있다.

도 7의 (c)를 참조하면, 발화자 A(710)가 동영상의 이전 장면들에서와 비교하여 다른 어조로 말한 경우 또는 사전에 설정한 어조로 말한 경우, 색상을 변화시킨 말풍선(716)을 출력할 수 있다.

또한, 출력되는 음성의 발화자, 크기, 어조 등을 동시에 고려할 수 있다.

도 7의 (d)를 참조하면, 발화자 A(710)가 큰 소리의 화난 어조로 말한 경우, 기존 말풍선과 다른 모양의 말풍선(718)을 출력할 수 있다.

한편, 특정한 의미를 담고 있지 않은 사람의 음성, 사람 이외의 생물이나 물체로부터 발생하는 소리 정보도 시각 정보로 변환하여 출력할 수 있다. 구체적인 실시 예로서, 아기의 울음소리, 동물이 내는 소리, 비가 오는 소리, 물체가 떨어지는 소리 등을 이에 대응하는 시각 정보로 변환하여 출력할 수 있다.

실시 예로서, 소리 정보에 대응하는 시각 정보로 이모티콘을 출력할 수 있다. 이때, 소리 정보의 특성에 따라 다른 표정의 이모티콘을 출력할 수 있다.

도 8 내지 도 9는 소리 정보에 대응하는 시각 정보를 출력하는 사용자 인터페이스의 실시 예를 보여주는 개념도이다.

도 8의 (a)를 참조하면, 강아지(810)가 짖는 소리에 대응하는 시각 정보(820)를 강아지(810)와 인접 배치하여 출력할 수 있다. 예를 들면, 강아지(810)가 내는 소리에 대응하는 시각 정보는 강아지가 그려진 이모티콘(820)으로 출력될 수 있다.

또한, 강아지가 내는 소리의 특성에 따라 이모티콘(820)에 그려진 강아지의 표정을 다르게 출력할 수 있다. 예를 들면, 강아지가 큰 소리로 심하게 짖는 경우나 작은 소리로 짖는 경우, 서로 다른 표정을 출력하여 소리의 특성을 직감하도록 할 수 있다.

도 8의 (b)를 참조하면, 소리 정보가 출력되는 동영상의 재생 시점에 대응하는 검색 바(830)의 위치(832, 834)에, 소리 정보에 대응하는 시각 정보(840, 850)를 출력할 수 있다.

구체적으로, 사용자가 검색 바(830)에 드래그 입력을 가하면 소리 정보가 출력되는 검색 바의 위치(832, 834)에 강아지 이모티콘(840, 850)이 출력될 수 있다. 이를 통해, 사용자는 소리 정보가 출력되는 동영상의 구간을 쉽게 파악할 수 있다.

또한 앞서 설명한 바와 같이, 강아지가 내는 소리의 데시벨이나 패턴을 분석하여 다양한 표정의 이모티콘(840, 850)을 출력할 수 있다. 예를 들면, 강아지가 사납게 짖는 경우, 사나운 표정의 강아지 이모티콘(840)이 출력될 수 있다. 또는, 강아지가 주인을 향해 가볍게 짖는 경우, 웃는 표정의 강아지 이모티콘(850)이 출력될 수 있다.

또 다른 실시 예로서, 드래그 입력이 가해진 검색 바에만, 소리 정보에 대응하는 시각 정보를 출력할 수도 있다. 이에 따라, 도 8의 (b)의 경우, 사용자의 드래그 입력이 가해진 구간 내에 존재하는 사나운 표정의 강아지 이모티콘(840)만이 출력될 수 있다.

도 9의 (a)를 참조하면, 아기(910)의 음성에 대응하는 이모티콘(912)을 출력할 수 있다. 앞서 설명한 바와 같이, 아기의 음성을 분석하여 우는 표정, 웃는 표정 등 다양한 표정의 이모티콘을 출력할 수 있다.

도 9의 (b)를 참조하면, 고양이(920)가 내는 소리에 대응하는 이모티콘(922)을 출력할 수 있다. 앞서 설명한 바와 같이, 고양이가 내는 소리의 데시벨이나 패턴을 분석하여 다양한 표정의 이모티콘을 출력할 수 있다.

도 9의 (c)를 참조하면, 노래가 출력되는 경우 이에 대응하는 시각 정보(930)를 출력할 수 있다. 구체적으로, 노래의 가사(930)가 드래그 입력에 따른 구간별로 출력될 수 있다.

이때, 출력된 가사(930)에 의해 가려지는 영역을 최소화하기 위해, 화면(151)의 가장자리에 가사(930)를 출력할 수 있다. 또는, 가사가 존재함을 나타내주는 아이콘(940)을 사용자가 터치하는 경우, 가사(930)를 출력할 수도 있다.

실시 예로서, 가수가 함께 출력되는 경우, 노래의 가사를 포함하는 말풍선을 가수를 향하도록 출력할 수 있다. 또는, 가수임을 나타내주는 아이콘이 함께 출력될 수 있다.

또 다른 실시 예로서, 노래의 제목이나 작사, 작곡가, 가수의 이름 등의 정보가 함께 출력될 수 있다.

도 9의 (d)를 참조하면, 발화자가 동영상에 출력되지 않고 해설(narration)이 출력되는 경우, 해설의 스크립트(script, 950)를 출력할 수 있다.

도 9의 (c)의 경우처럼, 스크립트(950)에 의해 가려지는 영역을 최소화하기 위해, 화면(151)에 출력되는 객체가 존재하지 않거나 비교적 적은 영역에 스크립트(950)를 출력할 수 있다. 또는, 스크립트가 존재함을 나타내주는 아이콘(960)을 사용자가 터치하는 경우, 스크립트(950)를 출력할 수도 있다.

한편, 동영상의 재생 시 출력되는 복수의 소리 정보 각각에 대응하는 복수의 소리 바(bar)가 출력될 수 있다. 실시 예로서, 발화자별로 이에 대응하는 소리 바를 출력할 수 있다. 이에 따라, 사용자는 원하는 발화자의 음성만을 검색할 수 있다.

또한, 각각의 소리 바에 대하여, 동영상의 재생 시점에 각각 대응하는 소리 바의 위치에, 재생 시점에서 출력되는 소리 정보에 대응하는 시각 정보가 출력될 수 있다. 이를 위해, 단말기(100)에는 복수의 마이크가 설치되어 있을 수 있다.

도 10 내지 도 13은 복수의 소리 정보 각각에 대응하는 시각 정보를 출력하는 사용자 인터페이스의 실시 예를 보여주는 개념도이다.

도 10의 (a)를 참조하면, 복수의 발화자(1010, 1020, 1030)가 존재하는 경우, 각각의 발화자 별로 출력되는 소리를 검색할 수 있는 소리 바(1012, 1022, 1032)가 출력될 수 있다.

구체적으로, 발화자(1010, 1020, 1030)와 발화자의 음성을 검색할 수 있는 각각의 소리 바(1012, 1022, 1032)에는 발화자를 구별해주는 객체(1014, 1024, 1034)가 출력될 수 있다. 즉, 발화자 A(1010)와 A가 말하는 음성을 검색할 수 있는 소리 바(1012)에는 A임을 나타내주는 아이콘(1014)이 함께 출력될 수 있다.

이때, 소리 바가 출력되는 복수의 발화자는 출력되는 소리의 데시벨이 큰 순서대로 선정되거나, 사용자가 사전에 설정한 발화자가 선정될 수 있다. 또는, 사전에 설정한 일정 데시벨 이상의 음성을 출력하는 발화자가 선정될 수 있다.

실시 예로서, 각각의 소리 바는 소리 바에 의해 가려지는 객체(예를 들면, 발화자)를 최소화할 수 있는 영역에 출력될 수 있다. 또는, 소리 바와 동영상의 이미지를 함께 확인할 수 있도록, 소리 바에 흐릿한 이미지 효과를 더하여 출력할 수 있다.

도 10의 (b)를 참조하면, 사용자가 각각의 소리 바(1012, 1022, 1032)에 드래그 입력을 가하면, 발화자 별로 출력되는 음성이 텍스트로 변환되어 출력될 수 있다. 구체적으로, 사용자는 적어도 하나 이상의 소리 바(1012, 1032)에 따로 또는 동시에 드래그 입력을 가하여 음성 텍스트(1016, 1036)를 검색할 수 있다.

이때, 드래그 입력이 가해진 소리 바(1012, 1032)에 대응하는 발화자(1010, 1030)는 하이라이트 되어 출력될 수 있다. 예를 들면, 텍스트를 담고 있는 말풍선(1016, 1036)의 색상과 동일한 색상으로 음성의 발화자(1010, 1030)를 출력할 수 있다.

또 다른 실시 예로, 드래그 입력이 가해진 소리 바(1012, 1032)에서 출력되는 음성의 발화자(1010, 1030)는 다른 색상이나 크기로 출력될 수 있다.

도 10의 (c)를 참조하면, 텍스트를 담고 있는 말풍선(1016, 1036)의 모양과 동일한 모양으로 발화자를 구별해주는 객체(1014, 1034)를 출력할 수 있다.

또 다른 실시 예로, 발화자를 구별해주는 객체(1014, 1034)를 강조하여 출력할 수 있다. 즉, 발화자임을 나타내주는 아이콘(1014, 1034)을 크게 출력하거나, 강조되는 다른 색상으로 출력할 수 있다.

도 11의 (a)를 참조하면, 선택한 발화자에 대한 소리 바만을 출력할 수 있다. 구체적으로, 발화자 A(1110)와 B(1120)를 터치하여 선택하면, A와 B에 대한 소리 바(1112, 1122)만이 출력될 수 있다.

또 다른 실시 예로, 화면(151)에 핀치 아웃 등의 입력을 가해 화면을 확대한 후, 발화자를 터치하여 선택할 수도 있다.

도 11의 (b)를 참조하면, 특정 소리 바를 선택하여 화면(151)에서 사라지게 할 수 있다. 구체적으로, 발화자 A의 소리 바(1112)에 화면(151) 바깥쪽을 향하는 드래그 입력이나 소리 바(1112)에 수직 방향인 드래그 입력을 가하여, 화면(151)에서 발화자 A의 소리 바(1112)를 사라지게 할 수 있다. 또는, 발화자 A의 소리 바(1112)를 터치하여, 화면(151)에서 사라지게 할 수도 있다.

도 12의 (a)를 참조하면, 발화자 A(1210)가 말한 음성을 검색할 수 있는 소리 바(1212)에 드래그 입력을 가하면, A가 말한 음성이 텍스트(1214)로 변환되어 출력된다. 마찬가지로, 발화자 B(1220)가 말한 음성을 검색할 수 있는 소리 바(1222)에 드래그 입력을 가하면, B(1220)가 말한 음성이 텍스트(1224)로 변환되어 출력된다. 각각의 소리 바(1212, 1222)에는 동시에 또는 따로 드래그 입력이 가해질 수 있다.

도 12의 (b) 및 (c)를 참조하면, 발화자 A 및 B 각각에 대응하는 소리 바(1212, 1222)에 하나로 합쳐지는 드래그 입력을 가하여, 하나의 소리 바(1240)로 출력할 수 있다. 또한 동일한 방식으로, 합쳐진 소리 바(1240)에 분리되는 드래그 입력을 가하여 복수의 소리 바(1212, 1222)로 되돌릴 수 있다. 즉, 도 12의 (c)에서 도 12의 (b)로 되돌아 갈 수 있다.

또 다른 실시 예로, 소리 바를 편집할 수 있는 편집 모드로 진입한 후, 합치고자 하는 복수의 소리 바를 터치하여 선택할 수 있다. 이에 따라, 선택된 복수의 소리 바에 대응하는 하나의 소리 바가 출력될 수 있다.

구체적인 실시 예로, 사용자가 편집 모드에서 B의 소리 바(1222)와 C의 소리 바(1232)를 터치하면, B의 소리 바(1222)와 C의 소리 바(1232)를 합친 하나의 소리 바가 출력될 수 있다. 이때, 사용자는 두 개 이상의 소리 바를 합칠 수도 있다.

도 12의 (d)를 참조하면, 도 12의 (c)에서 합쳐진 소리 바(1240)에 드래그 입력을 가하면, 도 12의 (a)에서 각각의 소리 바에 출력되던 텍스트(1214, 1224)가 하나의 소리 바에 출력되어 진다. 실시 예로서, 각각의 텍스트(1214, 1224)에는 발화자를 나타내는 객체(1216, 1226)가 함께 표시될 수 있다.

또 다른 실시 예로서, 합쳐진 소리 바에 대응하는 음성 중 더 큰 데시벨을 갖는 음성에 대응하는 텍스트만이 출력될 수도 있다. 또는, 사용자가 선정한 음성에 대응하는 텍스트만이 출력될 수도 있다.

도 13의 (a)를 참조하면, 감지되는 복수의 소리 각각에 대응하는 소리 바들(1310, 1320, 1330, 1340)이 출력될 수 있다. 이때, 사용자는 검색을 원하지 않는 소리 바(1310, 1330, 1340)는 음소거(mute)하여 원하는 소리 만을 검색할 수 있다.

예를 들면, 소리 바의 편집 모드에서 음소거 하기 원하는 소리 바(1310, 1330, 1340)를 터치하여 선택할 수 있다.

도 13의 (b)를 참조하면, 음소거 하지 않은 선택한 소리 바(1320)만이 출력되어 지며 사용자는 선택한 소리 바(1320)에 드래그 입력을 가할 수 있다. 이에 따라, 선택한 소리 정보에 대응하는 텍스트(1322)가 소리 바(1320)에 출력될 수 있다.

도 13의 (c)를 참조하면, 텍스트(1322)와 텍스트의 음성도 함께 출력될 수 있다. 이때, 사용자는 텍스트를 포함하고 있는 말풍선(1322)에 핀치 아웃 입력을 가하여, 말풍선(1322)의 크기를 증가시킬 수 있다. 또한, 말풍선(1332)의 크기 증가에 따라, 이에 포함된 텍스트 글씨의 크기도 증가할 수 있다. 이에 따라, 출력되는 음성의 크기도 증가할 수 있다.

한편, 사용자는 검색하고자 하는 소리 정보에 대응하는 시각 정보를 입력하여, 이러한 소리 정보를 포함하고 있는 동영상의 목록을 검출할 수 있다.

도 14 및 도 15는 소리 정보를 포함하고 있는 동영상을 검색하기 위한 사용자 인터페이스의 실시 예를 보여주는 개념도이다.

도 14의 (a)를 참조하면, 검색하고자 하는 음성을 텍스트(1410)로 입력하면, 입력된 텍스트(1410)를 음성으로 포함하고 있는 동영상의 목록이 썸네일 형태로 출력될 수 있다.

구체적으로, 각각의 동영상 목록에는 입력된 텍스트(1410)를 포함하고 있는 전체 문장(1420,1430)이 출력될 수 있다. 이때, 사용자가 동영상의 썸네일(1440)을 터치하면, 해당 동영상의 텍스트를 포함하고 있는 구간이 재생될 수 있다. 또한, 사용자가 사운드 버튼(1450)을 터치하면, 텍스트를 포함하고 있는 해당 동영상의 음성이 출력될 수 있다.

도 14의 (b)를 참조하면, 검색하고자 하는 이모티콘을 입력하면, 입력된 이모티콘에 대응하는 소리 정보를 포함하고 있는 동영상의 목록이 썸네일 형태로 출력될 수 있다.

예를 들면, 사용자가 웃는 얼굴의 이모티콘(1460)을 입력하면, 웃음소리를 포함하고 있는 동영상의 목록이 썸네일 형태로 출력될 수 있다. 도 14의 (a)의 경우와 마찬가지로, 사용자가 동영상의 썸네일(1470)을 터치하면, 해당 동영상이 웃음소리를 포함한 구간부터 재생될 수 있다. 또한, 사용자가 사운드 버튼(1480)을 터치하면, 해당 동영상에 포함된 웃음소리만을 미리 들어볼 수 있다.

또 다른 실시 예로서, 동영상에 입력된 텍스트나 이모티콘에 대응하는 소리 정보를 포함하는 구간이 복수 개인 경우, 각각의 구간에 대응하는 복수의 텍스트나 이모티콘이 출력될 수 있다.

이에 따라, 도 14의 (b)의 경우, 동영상 목록에 웃음소리가 출력되는 두 개의 구간에 대응하는 복수의 이모티콘(1490)이 출력될 수 있다.

도 15의 (a)를 참조하면, 검색하고자 하는 음성의 텍스트(1510)와 이모티콘(1520)을 함께 입력할 수 있다. 이에 따라, 입력한 텍스트(1510)와 이모티콘(1520)에 대응하는 소리를 포함하고 있는 동영상의 목록이 썸네일 형태로 출력될 수 있다.

도 15의 (b)를 참조하면, 도 15의 (a)에서 사용자가 출력된 썸네일(1530) 중 하나를 터치하여 선택하면, 해당 동영상의 재생 시점에 각각 대응하는 검색 바(1540)가 출력될 수 있다.

구체적으로, 입력한 텍스트(1510)와 이모티콘(1520)에 대응하는 소리가 출력되는 동영상의 재생 시점에 대응하는 소리 바(1540)의 위치에, 해당 텍스트와 이모티콘(1510, 1520)이 출력될 수 있다. 이때, 각각의 텍스트와 이모티콘(1510, 1520)에 대응하는 동영상의 재생 시각이 소리 바(1540)에 함께 출력될 수 있다.

도 15의 (c)를 참조하면, 도 15의 (b)에서 사용자가 해당 텍스트 중 적어도 하나(1550)를 터치하면, 해당 텍스트를 포함하고 있는 동영상의 전체 문장(1560)이 출력될 수 있다. 또한, 전체 문장(1560)을 다시 터치하면, 전체 문장(1560)이 출력되는 구간부터 동영상이 재생될 수 있다.

그 결과, 사용자의 편의가 향상될 수 있다.

또한, 본 명세서에 개시된 일 실시 예에 의하면, 전술한 방법은, 프로그램이 기록된 매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 매체의 예로는, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.

상기와 같이 설명된 이동 단말기는 상기 설명된 실시 예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시 예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

Claims

동영상을 출력하는 디스플레이부;
상기 동영상에 포함된 구간을 선택받는 사용자 입력부; 및
상기 선택받은 구간에서 출력되는 소리 정보에 대응하는 시각 정보를 상기 디스플레이부에 출력하는 제어부;를 포함하며,
상기 제어부는,
상기 선택받은 구간에서 출력되는 음성 정보를 텍스트 정보로 변환하여 상기 디스플레이부에 출력하는 것을 특징으로 하는 이동 단말기.
제 1항에 있어서,
상기 제어부는,
상기 동영상에 포함된 구간을 선택하는 탐색 속도에 따라 상기 소리 정보에 대응하는 시각 정보를 다르게 출력하는 것을 특징으로 하는 이동 단말기.
제 1항에 있어서,
상기 제어부는,
상기 텍스트 정보를 상기 음성 정보의 발화자에 인접시켜 상기 디스플레이부에 출력하는 것을 특징으로 하는 이동 단말기.
제 3항에 있어서,
상기 제어부는,
상기 음성 정보의 발화자가 하이라이트 되도록 상기 디스플레이부를 제어하는 것을 특징으로 하는 이동 단말기.
제 2항에 있어서,
상기 제어부는,
상기 탐색 속도에 따라 선정된 상기 텍스트 정보의 키 워드를 상기 디스플레이부에 출력하는 것을 특징으로 하는 이동 단말기.
제 1항에 있어서,
상기 사용자 입력부는,
상기 디스플레이부에 출력된 검색 바(bar)에 가해지는 드래그 입력으로 컨텐츠 탐색 모드로 진입하여 상기 동영상에 포함된 구간을 선택받으며,
상기 검색 바의 위치는 상기 동영상의 재생 시점에 각각 대응하는 것을 특징으로 하는 이동 단말기.
제 6항에 있어서,
상기 제어부는,
상기 선택받은 구간에서 출력되는 음성 정보를 텍스트 정보로 변환하여, 상기 음성 정보가 출력되는 상기 동영상의 재생 시점에 대응하는 상기 검색 바의 위치에 상기 텍스트 정보를 출력하는 것을 특징으로 하는 이동 단말기.
제 6항에 있어서,
상기 제어부는,
소리 정보가 출력되는 상기 동영상의 재생 시점에 대응하는 상기 검색 바의 위치에, 상기 소리 정보에 대응하는 시각 정보를 출력하는 것을 특징으로 하는 이동 단말기.
제 1항에 있어서,
상기 디스플레이부는,
상기 동영상의 재생 시 출력되는 복수의 소리 정보 각각에 대응하는 복수의 소리 바(bar)를 출력하며,
상기 제어부는,
상기 각각의 소리 바에 대하여,
상기 동영상의 재생 시점에 각각 대응하는 상기 소리 바의 위치에, 상기 재생 시점에서 출력되는 소리 정보에 대응하는 시각 정보를 출력하는 것을 특징으로 하는 이동 단말기.
(a) 동영상에 포함된 구간을 선택받는 단계;
(b) 상기 선택받은 구간에서 출력되는 소리 정보에 대응하는 시각 정보를 디스플레이부에 출력하는 단계;를 포함하며,
상기 (b) 단계는,
상기 선택받은 구간에서 출력되는 음성 정보를 텍스트 정보로 변환하여 상기 디스플레이부에 출력하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 제어 방법.
제 10항에 있어서,
상기 (b) 단계는,
상기 동영상에 포함된 구간을 선택하는 탐색 속도에 따라 상기 소리 정보에 대응하는 시각 정보를 다르게 출력하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 제어 방법.
제 10항에 있어서,
상기 (b) 단계는,
상기 텍스트 정보를 상기 음성 정보의 발화자에 인접시켜 상기 디스플레이부에 출력하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 제어 방법.
제 12항에 있어서,
상기 (b) 단계는,
상기 음성 정보의 발화자가 하이라이트 되도록 상기 디스플레이부를 제어하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 제어 방법.
제 11항에 있어서,
상기 (b) 단계는,
상기 탐색 속도에 따라 선정된 상기 텍스트 정보의 키 워드를 상기 디스플레이부에 출력하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 제어 방법.
제 10항에 있어서,
상기 (a) 단계는,
상기 디스플레이부에 출력된 검색 바(bar)에 가해지는 드래그 입력으로 컨텐츠 탐색 모드로 진입하여 상기 동영상에 포함된 구간을 선택받는 단계;를 포함하며,
상기 검색 바의 위치는 상기 동영상의 재생 시점에 각각 대응하는 것을 특징으로 하는 이동 단말기의 제어 방법.
제 15항에 있어서,
상기 (b) 단계는,
상기 선택받은 구간에서 출력되는 음성 정보를 텍스트 정보로 변환하여, 상기 음성 정보가 출력되는 상기 동영상의 재생 시점에 대응하는 상기 검색 바의 위치에 상기 텍스트 정보를 출력하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 제어 방법.
제 15항에 있어서,
상기 (b) 단계는,
소리 정보가 출력되는 재생 시점에 대응하는 상기 검색 바의 위치에, 상기 소리 정보에 대응하는 시각 정보를 출력하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 제어 방법.
제 10항에 있어서,
상기 (a) 단계는,
상기 동영상의 재생 시 출력되는 복수의 소리 정보 각각에 대응하는 복수의 소리 바(bar)를 출력하는 단계;를 포함하며,
상기 (b) 단계는,
상기 각각의 소리 바에 대하여,
상기 동영상의 재생 시점에 각각 대응하는 상기 소리 바의 위치에, 상기 재생 시점에서 출력되는 소리 정보에 대응하는 시각 정보를 출력하는 단계;를 포함하는 것을 특징으로 하는 이동 단말기의 제어 방법.