KR20140079937A - 터치 센서를 탑재한 모바일 디바이스 및 그 제어 방법 - Google Patents

터치 센서를 탑재한 모바일 디바이스 및 그 제어 방법 Download PDF

Info

Publication number
KR20140079937A
KR20140079937A KR1020120149155A KR20120149155A KR20140079937A KR 20140079937 A KR20140079937 A KR 20140079937A KR 1020120149155 A KR1020120149155 A KR 1020120149155A KR 20120149155 A KR20120149155 A KR 20120149155A KR 20140079937 A KR20140079937 A KR 20140079937A
Authority
KR
South Korea
Prior art keywords
area
character
mobile device
voice
user
Prior art date
Application number
KR1020120149155A
Other languages
English (en)
Other versions
KR101949742B1 (ko
Inventor
신용경
조현정
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020120149155A priority Critical patent/KR101949742B1/ko
Publication of KR20140079937A publication Critical patent/KR20140079937A/ko
Application granted granted Critical
Publication of KR101949742B1 publication Critical patent/KR101949742B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0354Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of 2D relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
    • G06F3/03547Touch pads, in which fingers can move on a surface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/041Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
    • G06F3/0412Digitisers structurally integrated in a display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/041Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
    • G06F3/0416Control or interface arrangements specially adapted for digitisers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/048Indexing scheme relating to G06F3/048
    • G06F2203/04803Split screen, i.e. subdividing the display area or the window area into separate subareas

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Telephone Function (AREA)

Abstract

터치 센서를 탑재한 모바일 디바이스 및 그 제어 방법이 개시된다. 본 발명의 일실시예에 의한 터치 센서를 탑재한 모바일 디바이스는, 임의의 기능 실행 중 제1영역을 인식하는 터치 센서와, 유저로부터 음성 데이터를 수신하는 오디오 데이터 수신 모듈과, 상기 수신된 음성 데이터를 분석하는 음성 인식 엔진과, 최초 인식된 음성에 대응하는 제1문자 및 마지막에 인식된 음성에 대응하는 제2문자를 추출하는 디텍팅 모듈과, 상기 인식된 제1영역내에서의 상기 추출된 제1문자 및 제2문자의 위치를 기초로 제2영역을 계산하는 컨트롤러와, 그리고 상기 제1문자를 시작점으로 하고 상기 제2문자를 종료점으로 하는 상기 제2영역을 표시하는 디스플레이 모듈을 포함한다.

Description

터치 센서를 탑재한 모바일 디바이스 및 그 제어 방법{MOBILE DEVICE FOR HAVING TOUCH SENSOR AND METHOD FOR CONTROLLING THE SAME}
본 발명은 다양한 종류의 모바일 디바이스 또는 멀티미디어 디바이스에 적용 가능한 기술에 관한 것으로서, 보다 상세하게는 터치 센서를 탑재한 모바일 디바이스 및 그 제어 방법에 대한 것이다.
터치 센서 관련 기술의 발전 및 제품화에 따른 비용 절감으로, 상당히 많은 모바일 디바이스에 터치 센서가 탑재되고 있다. 상기 모바일 디바이스는, 예를 들어 휴대폰, 스마트폰, 태블릿 PC, 노트북, 넷북 등에 해당한다.
보다 구체적으로 예를 들면, 대부분의 스마트폰은 화면이 작아서 손가락 터치 만으로 사용자가 원하는 영역을 한번에 정확하게 선택하는 것이 사실상 불가능하다.
종래 기술에 따라, 텍스트를 편집하는 어플리케이션(예를 들어, 브라우져, 에디터, 메모장, 문자 입력 기능 등)에서 텍스트를 선택하여 추가 작업(예를 들어, 복사, 붙여 넣기, 삭제 등)을 하기 위해서는 다음과 같은 순서가 필요하다.
유저가 원하는 영역을 손가락으로 터치하면, 단어나 문장이 대략적으로 선택되어 진다. 그러나 시작점이나 종료점이 유저가 원하는 위치가 아닐 경우, 해당 부분을 롱 프레스(long press)하여 상기 해당 부분이 확대된다.
그러나, 이와 같은 종래 기술에 의할 경우 다음과 같은 문제점이 있다.
우선, 롱 프레스 입력 및 추가 터치로 인하여 약 2-3초 정도의 시간 딜레이가 발생하고, 나아가 확대된 영역을 유저가 다시 터치한다고 하여도시 화면 크기의 제한으로 인하여 다시 오류가 발생할 확률이 매우 높다.
본 발명의 일실시예가 이루고자 하는 기술적 과제는, 특정 영역의 텍스트를 보다 효율적으로 처리하기 위하여 음성 인식 및 터치 센서를 모두 이용하여 멀티 모달 인터페이스를 제공하는 것이다.
또한, 본 발명의 다른 일실시예가 이루고자 하는 기술적 과제는, 당시 멀티 모달 인터페이스를 적용함으로써, 텍스트 처리 프로세스의 속도를 개선하고자 하는 것이다.
그리고, 본 발명의 또 다른 일실시예가 이루고자 하는 기술적 과제는, 음성 인식 결과값이 중복되는 경우를 극복하기 위한 해결 방안 내지는 솔루션을 구체적으로 정의하는 것이다.
본 발명의 일실시예에 의한 터치 센서를 탑재한 모바일 디바이스의 제어 방법은, 임의의 기능 실행 중 터치 센서로 인식된 제1영역을 설정하는 단계와, 유저로부터 음성 데이터를 수신하는 단계와, 상기 수신된 음성 데이터를 분석하여, 최초 인식된 음성에 대응하는 제1문자 및 마지막에 인식된 음성에 대응하는 제2문자를 추출하는 단계와, 상기 설정된 제1영역내에서의 상기 추출된 제1문자 및 제2문자의 위치를 기초로 제2영역을 설정하는 단계와, 상기 제1문자를 시작점으로 하고 상기 제2문자를 종료점으로 하는 상기 제2영역을 메모리에 저장하는 단계와, 그리고 상기 저장된 제2영역내 적어도 하나 이상의 문자를 출력하는 단계를 포함하도록 설계한다.
그리고, 본 발명의 일실시예에 의한 터치 센서를 탑재한 모바일 디바이스는 임의의 기능 실행 중 제1영역을 인식하는 터치 센서와, 유저로부터 음성 데이터를 수신하는 오디오 데이터 수신 모듈과, 상기 수신된 음성 데이터를 분석하는 음성 인식 엔진과, 최초 인식된 음성에 대응하는 제1문자 및 마지막에 인식된 음성에 대응하는 제2문자를 추출하는 디텍팅 모듈과, 상기 인식된 제1영역내에서의 상기 추출된 제1문자 및 제2문자의 위치를 기초로 제2영역을 계산하는 컨트롤러와, 그리고 상기 제1문자를 시작점으로 하고 상기 제2문자를 종료점으로 하는 상기 제2영역을 표시하는 디스플레이 모듈을 포함한다..
본 발명의 일실시예에 의하면, 특정 영역의 텍스트를 보다 효율적으로 처리하기 위하여 음성 인식 및 터치 센서를 모두 이용하여 멀티 모달 인터페이스를 제공한다.
또한, 본 발명의 다른 일실시예에 의하면, 당시 멀티 모달 인터페이스를 적용함으로써, 텍스트 처리 프로세스의 속도를 개선하는 기술적 효과가 있다.
그리고, 본 발명의 또 다른 일실시예에 의하면, 음성 인식 결과값이 중복되는 경우를 극복하기 위한 해결 방안 내지는 솔루션을 구체적으로 정의하는 장점이 있다.
도 1은 본 발명의 일실시예에 의한 모바일 디바이스의 구성 모듈들을 상세히 도시한 블록도 이다.
도 2는 본 발명의 일실시예에 의한 모바일 디바이스의 외관 중 일측면을 도시한 사시 도면이다.
도 3은 본 발명의 일실시예에 의한 모바일 디바이스의 외관 중 다른 일측면을 도시한 사시 도면이다.
도 4는 본 발명의 다른 일실시예에 의한 모바일 디바이스의 구성 모듈들을 상세히 도시한 블록도 이다.
도 5는 본 발명의 다른 일실시예에 따라 변경된 음성 인식 엔진의 구성 모듈들을 상세히 도시한 블록도 이다.
도 6은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역을 설정하는 프로세스의 일예를 설명하기 위한 도면이다.
도 7은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역을 설정하는 프로세스의 다른 일예를 설명하기 위한 도면이다.
도 8은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역을 설정하는 프로세스의 또 다른 일예를 설명하기 위한 도면이다.
도 9는 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역에서 제2영역을 재설정하는 프로세스의 일예를 설명하기 위한 도면이다.
도 10은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역에서 제2영역을 재설정하는 프로세스의 다른 일예를 설명하기 위한 도면이다.
도 11은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역에서 제2영역을 재설정하는 프로세스의 또 다른 일예를 설명하기 위한 도면이다.
도 12 및 도 13은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역 및 제2영역을 구별하여 표시하는 일예를 설명하기 위한 도면들이다.
도 14는 본 발명의 다른 일실시예에 의한 모바일 디바이스가 최종 확정된 제2영역을 이용하는 일예를 설명하기 위한 도면이다.
도 15는 본 발명의 다른 일실시예에 의한 모바일 디바이스의 제어 방법을 도시한 플로우 차트이다.
도 16 내지 도 18은 본 발명의 또 다른 일실시예에 의한 모바일 디바이스가 제1영역을 설정하는 프로세스의 일예를 설명하기 위한 도면이다.
그리고, 도 19 및 도 20은 본 발명의 또 다른 일실시예에 의한 모바일 디바이스가 제1영역을 설정하는 프로세스의 다른 일예를 설명하기 위한 도면이다.
이하에서는 도면을 참조하여 본 발명을 더욱 상세하게 설명한다.
이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 단순히 본 명세서 작성의 용이함을 고려하여 부여되는 것으로서, 상기 "모듈" 및 "부"는 서로 혼용되어 사용될 수도 있다.
본 발명에서 기술되는 모바일 디바이스는, 예를 들어 범용의 OS 커널 상에, 다양한 애플리케이션이 자유롭게 추가되거나 삭제 가능하므로, 사용자 친화적인 다양한 기능이 수행될 수 있다. 보다 구체적으로 예를 들면, 스마트폰, 태블릿 PC 등으로 구현 가능하다.
나아가, 이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시예를 상세하게 설명하지만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다.
본 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 관례 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 그 의미를 기재할 것이다. 따라서 본 명세서에서 사용되는 용어는, 단순한 용어의 명칭이 아닌 그 용어가 가지는 실질적인 의미와 본 명세서의 전반에 걸친 내용을 토대로 해석되어야 함을 밝혀두고자 한다.
도 1은 본 발명의 일실시예에 의한 모바일 디바이스의 구성 모듈들을 상세히 도시한 블록도 이다.
상기 모바일 디바이스(100)는 무선 통신부(110), A/V(Audio/Video) 입력부(120), 사용자 입력부(130), 센싱부(140), 출력부(150), 메모리(160), 인터페이스부(170), 제어부(180) 및 전원 공급부(190) 등을 포함할 수 있다. 도 1에 도시된 구성요소들이 필수적인 것은 아니어서, 그보다 많은 구성요소들을 갖거나 그보다 적은 구성요소들을 갖는 이동 단말기가 구현될 수도 있다.
이하, 상기 구성요소들에 대해 차례로 살펴본다.
무선 통신부(110)는 모바일 디바이스(100)와 무선 통신 시스템 사이 또는 모바일 디바이스(100)와 다른 이동 단말기가 위치한 네트워크 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 예를 들어, 무선 통신부(110)는 방송 수신 모듈(111), 이동통신 모듈(112), 무선 인터넷 모듈(113), 근거리 통신 모듈(114) 및 위치정보 모듈(115) 등을 포함할 수 있다.
방송 수신 모듈(111)은 방송 채널을 통하여 외부의 방송 관리 서버로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다.
상기 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 상기 방송 관리 서버는, 방송 신호 및/또는 방송 관련 정보를 생성하여 송신하는 서버 또는 기 생성된 방송 신호 및/또는 방송 관련 정보를 제공받아 단말기에 송신하는 서버를 의미할 수 있다. 상기 방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다.
상기 방송 관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 상기 방송 관련 정보는, 이동통신망을 통하여도 제공될 수 있다. 이러한 경우에는 상기 이동통신 모듈(112)에 의해 수신될 수 있다.
상기 방송 관련 정보는 다양한 형태로 존재할 수 있다. 예를 들어, DMB(Digital Multimedia Broadcasting)의 EPG(Electronic Program Guide) 또는 DVB-H(Digital Video Broadcast-Handheld)의 ESG(Electronic Service Guide) 등의 형태로 존재할 수 있다.
상기 방송 수신 모듈(111)은, 예를 들어, DMB-T(Digital Multimedia Broadcasting-Terrestrial), DMB-S(Digital Multimedia Broadcasting-Satellite), MediaFLO(Media Forward Link Only), DVB-H(Digital Video Broadcast-Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등의 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 물론, 상기 방송 수신 모듈(111)은, 상술한 디지털 방송 시스템뿐만 아니라 다른 방송 시스템에 적합하도록 구성될 수도 있다.
방송 수신 모듈(111)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는 메모리(160)에 저장될 수 있다.
이동통신 모듈(112)은, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 상기 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
무선 인터넷 모듈(113)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 모바일 디바이스(100)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다.
근거리 통신 모듈(114)은 근거리 통신을 위한 모듈을 말한다. 근거리 통신(short range communication) 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), ZigBee 등이 이용될 수 있다.
위치정보 모듈(115)은 모바일 디바이스(이동 단말기)의 위치를 획득하기 위한 모듈로서, 그의 대표적인 예로는 GPS(Global Position System) 모듈이 있다.
도 1을 참조하면, A/V(Audio/Video) 입력부(120)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(121)와 마이크(122) 등이 포함될 수 있다. 카메라(121)는 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(151)에 표시될 수 있다.
카메라(121)에서 처리된 화상 프레임은 메모리(160)에 저장되거나 무선 통신부(110)를 통하여 외부로 전송될 수 있다. 카메라(121)는 사용 환경에 따라 2개 이상이 구비될 수도 있다.
마이크(122)는 통화모드 또는 녹음모드, 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 처리된 음성 데이터는 통화 모드인 경우 이동통신 모듈(112)을 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(122)에는 외부의 음향 신호를 입력받는 과정에서 발생되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.
사용자 입력부(130)는 사용자가 단말기의 동작 제어를 위한 입력 데이터를 발생시킨다. 사용자 입력부(130)는 키 패드(key pad) 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다.
센싱부(140)는 모바일 디바이스(100)의 개폐 상태, 모바일 디바이스(100)의 위치, 사용자 접촉 유무, 이동 단말기의 방위, 이동 단말기의 가속/감속 등과 같이 모바일 디바이스(100)의 현 상태를 감지하여 모바일 디바이스(100)의 동작을 제어하기 위한 센싱 신호를 발생시킨다. 예를 들어 모바일 디바이스(100)가 슬라이드 폰 형태인 경우 슬라이드 폰의 개폐 여부를 센싱할 수 있다. 또한, 전원 공급부(190)의 전원 공급 여부, 인터페이스부(170)의 외부 기기 결합 여부 등을 센싱할 수도 있다. 한편, 상기 센싱부(140)는 근접 센서(141)를 포함할 수 있다.
출력부(150)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 이에는 디스플레이부(151), 음향 출력 모듈(152), 알람부(153), 및 햅틱 모듈(154) 등이 포함될 수 있다.
디스플레이부(151)는 모바일 디바이스(100)에서 처리되는 정보를 표시(출력)한다. 예를 들어, 이동 단말기가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 모바일 디바이스(100)가 화상 통화 모드 또는 촬영 모드인 경우에는 촬영 또는/및 수신된 영상 또는 UI, GUI를 표시한다.
디스플레이부(151)는 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 중에서 적어도 하나를 포함할 수 있다.
이들 중 일부 디스플레이는 그를 통해 외부를 볼 수 있도록 투명형 또는 광투과형으로 구성될 수 있다. 이는 투명 디스플레이라 호칭될 수 있는데, 상기 투명 디스플레이의 대표적인 예로는 TOLED(Transparant OLED) 등이 있다. 디스플레이부(151)의 후방 구조 또한 광 투과형 구조로 구성될 수 있다. 이러한 구조에 의하여, 사용자는 단말기 바디의 디스플레이부(151)가 차지하는 영역을 통해 단말기 바디의 후방에 위치한 사물을 볼 수 있다.
모바일 디바이스(100)의 구현 형태에 따라 디스플레이부(151)이 2개 이상 존재할 수 있다. 예를 들어, 모바일 디바이스(100)에는 복수의 디스플레이부들이 하나의 면에 이격되거나 일체로 배치될 수 있고, 또한 서로 다른 면에 각각 배치될 수도 있다.
디스플레이부(151)와 터치 동작을 감지하는 센서(이하, '터치 센서'라 함)가 상호 레이어 구조를 이루는 경우(이하, '터치 스크린'이라 함)에, 디스플레이부(151)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 터치 센서는, 예를 들어, 터치 필름, 터치 시트, 터치 패드 등의 형태를 가질 수 있다.
터치 센서는 디스플레이부(151)의 특정 부위에 가해진 압력 또는 디스플레이부(151)의 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력신호로 변환하도록 구성될 수 있다. 터치 센서는 터치 되는 위치 및 면적뿐만 아니라, 터치 시의 압력까지도 검출할 수 있도록 구성될 수 있다.
터치 센서에 대한 터치 입력이 있는 경우, 그에 대응하는 신호(들)는 터치 제어기로 보내진다. 터치 제어기는 그 신호(들)를 처리한 다음 대응하는 데이터를 제어부(180)로 전송한다. 이로써, 제어부(180)는 디스플레이부(151)의 어느 영역이 터치 되었는지 여부 등을 알 수 있게 된다.
도 1을 참조하면, 상기 터치스크린에 의해 감싸지는 이동 단말기의 내부 영역 또는 상기 터치 스크린의 근처에 근접 센서(141)가 배치될 수 있다. 상기 근접 센서는 소정의 검출면에 접근하는 물체, 혹은 근방에 존재하는 물체의 유무를 전자계의 힘 또는 적외선을 이용하여 기계적 접촉이 없이 검출하는 센서를 말한다. 근접 센서는 접촉식 센서보다는 그 수명이 길며 그 활용도 또한 높다.
상기 근접 센서의 예로는 투과형 광전 센서, 직접 반사형 광전 센서, 미러 반사형 광전 센서, 고주파 발진형 근접 센서, 정전용량형 근접 센서, 자기형 근접 센서, 적외선 근접 센서 등이 있다. 상기 터치스크린이 정전식인 경우에는 상기 포인터의 근접에 따른 전계의 변화로 상기 포인터의 근접을 검출하도록 구성된다. 이 경우 상기 터치 스크린(터치 센서)은 근접 센서로 분류될 수도 있다.
이하에서는 설명의 편의를 위해, 상기 터치스크린 상에 포인터가 접촉되지 않으면서 근접되어 상기 포인터가 상기 터치스크린 상에 위치함이 인식되도록 하는 행위를 "근접 터치(proximity touch)"라고 칭하고, 상기 터치스크린 상에 포인터가 실제로 접촉되는 행위를 "접촉 터치(contact touch)"라고 칭한다. 상기 터치스크린 상에서 포인터로 근접 터치가 되는 위치라 함은, 상기 포인터가 근접 터치될 때 상기 포인터가 상기 터치스크린에 대해 수직으로 대응되는 위치를 의미한다.
상기 근접센서는, 근접 터치와, 근접 터치 패턴(예를 들어, 근접 터치 거리, 근접 터치 방향, 근접 터치 속도, 근접 터치 시간, 근접 터치 위치, 근접 터치 이동 상태 등)을 감지한다. 상기 감지된 근접 터치 동작 및 근접 터치 패턴에 상응하는 정보는 터치 스크린상에 출력될 수 있다.
음향 출력 모듈(152)은 호신호 수신, 통화모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리(160)에 저장된 오디오 데이터를 출력할 수 있다. 음향 출력 모듈(152)은 모바일 디바이스(100)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력하기도 한다. 이러한 음향 출력 모듈(152)에는 리시버(Receiver), 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.
알람부(153)는 모바일 디바이스(100)의 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기에서 발생 되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 터치 입력 등이 있다. 알람부(153)는 비디오 신호나 오디오 신호 이외에 다른 형태, 예를 들어 진동으로 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 상기 비디오 신호나 오디오 신호는 디스플레이부(151)나 음성 출력 모듈(152)을 통해서도 출력될 수 있어서, 그들(151,152)은 알람부(153)의 일부로 분류될 수도 있다.
햅틱 모듈(haptic module)(154)은 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(154)이 발생시키는 촉각 효과의 대표적인 예로는 진동이 있다. 햅택 모듈(154)이 발생하는 진동의 세기와 패턴 등은 제어가능하다. 예를 들어, 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다.
햅틱 모듈(154)은, 진동 외에도, 접촉 피부면에 대해 수직 운동하는 핀 배열, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력, 피부 표면에 대한 스침, 전극(eletrode)의 접촉, 정전기력 등의 자극에 의한 효과와, 흡열이나 발열 가능한 소자를 이용한 냉온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다.
햅틱 모듈(154)은 직접적인 접촉을 통해 촉각 효과의 전달할 수 있을 뿐만 아니라, 사용자가 손가락이나 팔 등의 근 감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(154)은 모바일 디바이스(100)의 구성 태양에 따라 2개 이상이 구비될 수 있다.
메모리(160)는 제어부(180)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리(160)는 상기 터치스크린 상의 터치 입력시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.
메모리(160)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 모바일 디바이스(100)는 인터넷(internet)상에서 상기 메모리(160)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다.
인터페이스부(170)는 모바일 디바이스기(100)에 연결되는 모든 외부기기와의 통로 역할을 한다. 인터페이스부(170)는 외부 기기로부터 데이터를 전송받거나, 전원을 공급받아 모바일 디바이스(100) 내부의 각 구성 요소에 전달하거나, 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O(Input/Output) 포트, 이어폰 포트 등이 인터페이스부(170)에 포함될 수 있다.
식별 모듈은 모바일 디바이스(100)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(User Identify Module, UIM), 가입자 인증 모듈(Subscriber Identify Module, SIM), 범용 사용자 인증 모듈(Universal Subscriber Identity Module, USIM) 등을 포함할 수 있다. 식별 모듈이 구비된 장치(이하 '식별 장치')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 장치는 포트를 통하여 모바일 디바이스(100)와 연결될 수 있다.
상기 인터페이스부는 모바일 디바이스(100)가 외부 크래들(cradle)과 연결될 때 상기 크래들로부터의 전원이 상기 모바일 디바이스(100)에 공급되는 통로가 되거나, 사용자에 의해 상기 크래들에서 입력되는 각종 명령 신호가 상기 모바일 디바이스로 전달되는 통로가 될 수 있다. 상기 크래들로부터 입력되는 각종 명령 신호 또는 상기 전원은 상기 모바일 디바이스(이동단말기)가 상기 크래들에 정확히 장착되었음을 인지하기 위한 신호로 동작될 수도 있다.
제어부(controller, 180)는 통상적으로 모바일 디바이스(이동 단말기)의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 제어부(180)는 멀티 미디어 재생을 위한 멀티미디어 모듈(181)을 구비할 수도 있다. 멀티미디어 모듈(181)은 제어부(180) 내에 구현될 수도 있고, 제어부(180)와 별도로 구현될 수도 있다.
상기 제어부(180)는 상기 터치스크린 상에서 행해지는 필기 입력 또는 그림 그리기 입력을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식 처리를 행할 수 있다.
전원 공급부(190)는 제어부(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.
여기에 설명되는 다양한 실시예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다.
하드웨어적인 구현에 의하면, 여기에 설명되는 실시예는 ASICs (application specific integrated circuits), DSPs (digital signal processors), DSPDs (digital signal processing devices), PLDs (programmable logic devices), FPGAs (field programmable gate arrays, 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시예들이 제어부(180) 자체로 구현될 수 있다.
소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다. 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 메모리(160)에 저장되고, 제어부(180)에 의해 실행될 수 있다.
도 2는 본 발명의 일실시예에 의한 모바일 디바이스의 외관 중 일측면을 도시한 사시 도면이다.
도 2에 도시된 모바일 디바이스(100)는 바 형태의 단말기 바디를 구비하고 있다. 다만, 본 발명은 여기에 한정되지 않고, 2 이상의 바디들이 상대 이동 가능하게 결합되는 슬라이드 타입, 폴더 타입, 스윙 타입, 스위블 타입 등 다양한 구조에 적용이 가능하다.
바디는 외관을 이루는 케이스(케이싱, 하우징, 커버 등)를 포함한다. 본 실시예에서, 케이스는 프론트 케이스(101)와 리어 케이스(102)로 구분될 수 있다. 프론트 케이스(101)와 리어 케이스(102)의 사이에 형성된 공간에는 각종 전자부품들이 내장된다. 프론트 케이스(101)와 리어 케이스(102) 사이에는 적어도 하나의 중간 케이스가 추가로 배치될 수도 있다.
케이스들은 합성수지를 사출하여 형성되거나 금속 재질, 예를 들어 스테인레스 스틸(STS) 또는 티타늄(Ti) 등과 같은 금속 재질을 갖도록 형성될 수도 있다.
단말기 바디, 주로 프론트 케이스(101)에는 디스플레이부(151), 음향출력부(152), 카메라(121), 사용자 입력부(130/131,132), 마이크(122), 인터페이스(170) 등이 배치될 수 있다.
디스플레이부(151)는 프론트 케이스(101)의 주면의 대부분을 차지한다. 디스플레이부(151)의 양단부 중 일 단부에 인접한 영역에는 음향출력부(151)와 카메라(121)가 배치되고, 다른 단부에 인접한 영역에는 사용자 입력부(131)와 마이크(122)가 배치된다. 사용자 입력부(132)와 인터페이스(170) 등은 프론트 케이스(101) 및 리어 케이스(102)의 측면들에 배치될 수 있다.
사용자 입력부(130)는 모바일 디바이스(100)의 동작을 제어하기 위한 명령을 입력받기 위해 조작되는 것으로서, 복수의 조작 유닛들(131,132)을 포함할 수 있다. 조작 유닛들(131,132)은 조작부(manipulating portion)로도 통칭 될 수 있으며, 사용자가 촉각 적인 느낌을 가면서 조작하게 되는 방식(tactile manner)이라면 어떤 방식이든 채용될 수 있다.
제1 또는 제2조작 유닛들(131, 132)에 의하여 입력되는 내용은 다양하게 설정될 수 있다. 예를 들어, 제1 조작 유닛(131)은 시작, 종료, 스크롤 등과 같은 명령을 입력받고, 제2 조작 유닛(132)은 음향출력부(152)에서 출력되는 음향의 크기 조절 또는 디스플레이부(151)의 터치 인식 모드로의 전환 등과 같은 명령을 입력받을 수 있다.
도 3은 본 발명의 일실시예에 의한 모바일 디바이스의 외관 중 다른 일측면을 도시한 사시 도면이다.
도 3에 도시된 바와 같이, 모바일 디바이스(단말기) 바디의 후면, 다시 말해서 리어 케이스(102)에는 카메라(121')가 추가로 장착될 수 있다. 카메라(121')는 카메라(121, 도 2 참조)와 실질적으로 반대되는 촬영 방향을 가지며, 카메라(121)와 서로 다른 화소를 가지는 카메라일 수 있다.
예를 들어, 카메라(121)는 화상 통화 등의 경우에 사용자의 얼굴을 촬영하여 상대방에 전송함에 무리가 없도록 저 화소를 가지며, 카메라(121')는 일반적인 피사체를 촬영하고 바로 전송하지는 않는 경우가 많기에 고 화소를 가지는 것이 바람직하다. 카메라(121,121')는 회전 또는 팝업(pop-up) 가능하게 단말기 바디에 설치될 수도 있다.
카메라(121')에 인접하게는 플래쉬(123)와 거울(124)이 추가로 배치된다. 플래쉬(123)는 카메라(121')로 피사체를 촬영하는 경우에 피사체를 향해 빛을 비추게 된다. 거울(124)은 사용자가 카메라(121')를 이용하여 자신을 촬영(셀프 촬영)하고자 하는 경우에, 사용자 자신의 얼굴 등을 비춰볼 수 있게 한다.
단말기 바디의 후면에는 음향 출력부(152')가 추가로 배치될 수도 있다. 음향 출력부(152')는 음향 출력부(152, 도 2 참조)와 함께 스테레오 기능을 구현할 수 있으며, 통화시 스피커폰 모드의 구현을 위하여 사용될 수도 있다.
단말기 바디의 측면에는 통화 등을 위한 안테나 외에 방송신호 수신용 안테나(116)가 추가적으로 배치될 수 있다. 방송수신모듈(111, 도 1 참조)의 일부를 이루는 안테나(116)는 단말기 바디에서 인출 가능하게 설치될 수 있다.
단말기 바디에는 모바일 디바이스(100)에 전원을 공급하기 위한 전원공급부(190)가 장착된다. 전원공급부(190)는 단말기 바디에 내장되거나, 단말기 바디의 외부에서 직접 탈착될 수 있게 구성될 수 있다.
리어 케이스(102)에는 터치를 감지하기 위한 터치 패드(135)가 추가로 장착될 수 있다. 터치 패드(135) 또한 디스플레이부(151)와 마찬가지로 광 투과형으로 구성될 수 있다. 이 경우에, 디스플레이부(151)가 양면에서 시각 정보를 출력하도록 구성된다면, 터치 패드(135)를 통해서도 상기 시각 정보를 인지할 수 있게 된다. 상기 양면에 출력되는 정보는 상기 터치 패드(135)에 의해 모두 제어될 수도 있다. 이와 달리, 터치 패드(135)에는 디스플레이가 추가로 장착되어, 리어 케이스(102)에도 터치 스크린이 배치될 수도 있다.
도 4는 본 발명의 다른 일실시예에 의한 모바일 디바이스의 구성 모듈들을 상세히 도시한 블록도 이다. 전술한 도 1 내지 도 3을 참조하여, 도 4의 모바일 디바이스의 모듈을 일부 추가하거나 변경 가능하며, 본 발명의 권리범위는 도 1 내지 도 4 등에 기재된 요소들로 결정되는 것이 아니라, 원칙적으로 특허청구범위에 기재된 사항에 따라 해석되어야 한다.
도 4에 도시된 바와 같이, 모바일 디바이스(400)는 음성 인식 엔진(410), 터치 센서(420), 오디오 데이터 수신 모듈(430), 디텍팅 모듈(440), 디스플레이 모듈(450), 메모리(460), 제1변환 모듈(470), 제2변환 모듈(480) 그리고 컨트롤러(490) 등을 포함하여 이루어 진다. 다만, 당업자의 필요에 따라 일부 모듈을 추가하거나 삭제하는 것도 가능하며, 본 발명의 권리범위는 원칙적으로 특허청구범위에 기재된 사항에 따라 결정되어야 한다.
터치 센서(420)는, 임의의 기능 실행 중 제1영역을 인식하도록 설계된다. 예를 들어, 유저의 손가락의 싱글 터치, 멀티 터치에 모두 적용 가능하며, 펜을 이용하여 제1영역을 선택하는 경우도 포함된다. 또한, 상기 임의의 기능에는 특별한 제한이 없으며, 문자 등을 포함하는 영역을 텍스트화할 수 있는 모든 경우에 적용 가능하다.
오디오 데이터 수신 모듈(430)은, 유저로부터 음성 데이터를 수신하도록 설계되며, 전술하여 설명한 터치 및 음성 데이터의 수신은 동시에 발생할 수도 있고 순차적으로 발생할 수도 있다.
음성 인식 엔진(410)은, 상기 수신된 음성 데이터를 분석하도록 설계되어 있으며, 보다 구체적인 모듈 및 기능에 대해서는 이하 도 5를 참조하여 상세히 설명하도록 하겠다.
디텍팅 모듈(440)은, 최초 인식된 음성에 대응하는 제1문자 및 마지막에 인식된 음성에 대응하는 제2문자를 추출한다. 상기 제1문자 및 상기 제2문자는, 예를 들어 숫자, 한글, 외국어 등에 해당한다.
컨트롤러(490)는, 상기 인식된 제1영역내에서의 상기 추출된 제1문자 및 제2문자의 위치를 기초로 제2영역을 계산한다. 나아가, 도 4에 도시된 적어도 하나 이상의 모듈들의 기능을 전반적으로 관리하는 기능도 수행한다.
디스플레이 모듈(450)은, 상기 제1문자를 시작점으로 하고 상기 제2문자를 종료점으로 하는 상기 제2영역을 표시하도록 설계된다.
따라서, 이와 같이 설계하는 경우, 유저가 copy to paste 하기를 원하는 특정 영역을 오류 없이 신속하게 확정지을 수 있는 기술적 효과가 있다. 종래 기술에 비해 1초 이상 시간이 단축된다.
메모리(460)는 상기 제2영역에 대한 정보를 저장하고 있으며, 상기 제1변환 모듈(470)은 상기 저장된 제2영역내 적어도 하나 이상의 문자를 텍스트 포맷으로 변환한다.
제2변환 모듈(480)은, 상기 제1영역 및 상기 제2영역 각각의 사이즈 또는 칼라를 다르게 변환한다. 이와 관련하여, 이하 도 12 및 도 13을 참조하여 보다 상세히 후술하도록 하겠다.
상기 제2영역이 2개 이상 존재하는 경우, 상기 디스플레이 모듈(450)은 복수개의 제2영역들을 모두 디스플레이 하도록 설계된다. 예를 들어, 유저가 발화한 음성이 상기 제1영역내에 중복하여 존재하는 경우를 해결하기 위한 솔루션이다. 이와 관련된 다양한 실시예들에 대하여 아래 보다 구체적으로 설명하도록 하겠다.
상기 컨트롤러(490)는, 상기 디스플레이 모듈(450)을 제어하여, 상기 복수개의 제2영역들 각각을 인디케이트 하는 ID(identifier)를 더 디스플레이 하도록 설계한다. 이하, 도 10에서 보다 상세히 설명하도록 하겠다.
상기 컨트롤러(490)는, 상기 제2영역이 2개 이상 존재하는 경우, 최초 인식된 음성에 대응하는 제1문자 및 상기 제1문자 다음으로 연속하여 인식된 음성에 대응하는 문자를 이용하여, 상기 제2영역의 시작점을 재설정한다. 나아가, 상기 컨트롤러(490)는, 마지막에 인식된 음성에 대응하는 제2문자 및 상기 제2문자 이전에 연속하여 인식된 음성에 대응하는 문자를 이용하여, 상기 제2영역의 종료점을 재설정한다. 이와 관련하여, 이하 도 11을 참조하여 보다 상세히 후술하도록 하겠다.
도 5는 본 발명의 다른 일실시예에 따라 변경된 음성 인식 엔진의 구성 모듈들을 상세히 도시한 블록도 이다. 이전 도 4에서 도시된 음성 인식 엔진을 보다 상세히 설명하도록 하겠다. 물론, 당업자의 필요에 따라 다른 음성 인식 엔진을 활용하는 것도 모두 본 발명의 권리범위에 속한다.
음성 인식 부분은 크게 2가지로 나누어 설명할 수가 있다. 전처리부(510)는 인식 구간 추출 모듈(511) 및 잡음 처리 모듈(512)을 포함하며, 인식부(520)는 특징 추출 모듈(521), 비교 모듈(522), 음성 모델 DB(523) 및 인식 결과 출력 모듈(524) 등을 포함하여 이루어 진다.
상기 전처리부(510)의 인식 구간 추출 모듈(511)은 사용자가 발성한 음성으로부터 인식에 필요한 구간만을 추출하고, 잡음 처리 모듈(512)은 외부 잡음 등으로 인한 노이즈 등을 제거한다.
상기 인식부(520)의 특징 추출 모듈(521)은 특징 벡터를 분석하고, 비교 모듈(522)은 추출된 특징 벡터와 음성 모델 DB(523)에 저장된 값을 비교하고, 인식 결과 출력 모듈(524)은 가장 유사한 음성에 대응한 출력값을 오디오 또는 비디오 형태로 출력한다.
또한, 특징 벡터를 추출하는 구체적인 방법으로는, 모든 주파수 대역에 동일하게 비중을 두어 분석하는 LPC(Linear Predictive Coding) 추출법, 또는 사람의 음성 인지 양상이 선형적이지 않고 로그 스케일과 비슷한 멜 스케일을 따른다는 특성을 반영한 MFCC(Mel Frequency Cepstral Coefficients) 추출법, 음성과 잡음을 뚜렷하게 구별하기 위해 고주파 성분을 강조해 주는 고역강조 추출법, 음성을 짧은 구간으로 나누어 분석할때 생기는 단절로 인한 왜곡현상을 최소화 하는 창함수 추출법 등이 있다.
전술한 음성 인식 엔진을 도입하여, 유저로부터 수신된 보이스 중 음절 단위로 디텍트 하는 것도 가능하고 또는 단어 단위로 디텍트 하는 것도 모두 가능한 장점이 있다.
도 6은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역을 설정하는 프로세스의 일예를 설명하기 위한 도면이다. 이하, 도 6을 참조하여, 모바일 디바이스를 사용하는 유저의 싱글 터치로 제1영역을 설정하는 프로세스를 설명하도록 하겠다.
우선, 도 6의 (a)에 도시된 바와 같이, 모바일 디바이스(600)는 텍스트 메시지와 관련된 기능을 실행하고 있다. 예컨대, 택배와 관련된 텍스트 메시지(610)를 수신한 경우로 가정해 보겠다.
이 때, 유저는 손가락(620)을 이용하여, 상기 텍스트 메시지(610) 중 원하는 영역을 대략적으로 선택할 수가 있다. 따라서, 도 6의 (b)에 도시된 바와 같이, 모바일 디바이스(601)는 전체 텍스트 메시지(611) 중에서, 유저가 원하는 것으로 추정되는 특정 영역(621)을 제1영역으로 임시 설정한다.
그러나, 이와 같은 프로세스 만으로는 유저가 원하는 보다 정확한 특정 영역을 설정할 수가 없다. 예를 들어, 유저는 "전화번호" 의 텍스트만 이용하고 싶을 가능성도 있고, "010-xxxx-xxxx" 숫자만을 이용하고 싶을 가능성도 있기 때문이다. 따라서, 이를 보완하기 위한 솔루션이 분명히 필요하며, 이와 관련하여, 도 9 이하 등을 참조하여 설명하도록 하겠다.
도 7은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역을 설정하는 프로세스의 다른 일예를 설명하기 위한 도면이다. 이하, 도 7을 참조하여, 모바일 디바이스를 사용하는 유저의 멀티 터치로 제1영역을 설정하는 프로세스를 설명하도록 하겠다.
우선, 도 7의 (a)에 도시된 바와 같이, 모바일 디바이스(700)는 웹브라우져, 인터넷 등과 관련된 기능을 실행하고 있다. 예컨대, 인터넷 뉴스를 제공하는 홈페이지(710)를 디스플레이 하는 경우로 가정해 보겠다.
이 때, 유저는 2개의 손가락들(720)을 이용하여, 상기 홈페이지(710) 중 원하는 영역을 대략적으로 선택할 수가 있다. 따라서, 도 7의 (b)에 도시된 바와 같이, 모바일 디바이스(701)는 전체 홈페이지(711) 영역 중에서, 유저가 원하는 것으로 추정되는 특정 영역(721)을 제1영역으로 임시 설정한다.
그러나, 이와 같은 프로세스 만으로는 유저가 원하는 보다 정확한 특정 영역을 설정할 수가 없다. 예를 들어, 유저는 1번째 라인부터 2번째 라인까지 텍스트로 이용하고 싶을 가능성도 있고, 2번째 라인부터 3번째 라인까지 텍스트로 이용하고 싶을 가능성도 있고, 또는 3번째 라인부터 4번째 라인까지 텍스트로 이용하고 싶을 가능성도 있기 때문이다. 따라서, 이를 보완하기 위한 솔루션이 분명히 필요하며, 이와 관련하여, 도 9 이하 등을 참조하여 설명하도록 하겠다.
도 8은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역을 설정하는 프로세스의 또 다른 일예를 설명하기 위한 도면이다. 이하, 도 8을 참조하여, 모바일 디바이스를 사용하는 유저가 펜(pen)을 이용하여 제1영역을 설정하는 프로세스를 설명하도록 하겠다.
우선, 도 8의 (a)에 도시된 바와 같이, 모바일 디바이스(800)는 웹브라우져, 인터넷 등과 관련된 기능을 실행하고 있다. 예컨대, 그림과 텍스트를 포함하는 이미지 파일(810)이 디스플레이된 경우로 가정해 보겠다.
이 때, 유저는 적어도 하나 이상의 펜(820)을 이용하여, 상기 이미지 파일(810) 중 원하는 영역에 대응하는 원 모양(830)을 대략적으로 그려 볼 수가 있다. 따라서, 도 8의 (b)에 도시된 바와 같이, 모바일 디바이스(801)는 이미지 파일(811) 영역 중에서, 유저가 원하는 것으로 추정되는 특정 영역(831)을 제1영역으로 임시 설정한다.
그러나, 센싱 성능이 매우 좋은 펜(820)을 이용하여도 유저는 자신이 원하는 영역을 정확하게 그리기 어려울 가능성이 있으며, 또한 오류가 발생할 가능성이 여전히 존재한다. 따라서, 이를 보완하기 위한 솔루션이 분명히 필요하며, 이와 관련하여, 도 9 이하 등을 참조하여 설명하도록 하겠다.
도 9는 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역에서 제2영역을 재설정하는 프로세스의 일예를 설명하기 위한 도면이다. 이하, 도 9를 참조하여, 터치 센서에 의해 제1영역이 임시적으로 설정된 이후, 음성 인식 엔진을 통해 제2영역이 최종적으로 확정되는 프로세스를 설명하도록 하겠다.
우선, 도 9의 (a)에 도시된 바와 같이, 모바일 디바이스(900)는 텍스트 문자 메시지(910)를 출력하고 있다. 이 때, 유저(920)가 카피 앤 페이스트를 위한 영역을 선택하고자 할 대, 임의의 지점(930)을 터치한다. 물론, 도 9의 (a)에서는 유저의 원터치를 예시하였으나, 멀티 터치 또는 펜으로 선택하는 경우도 본 발명을 적용할 수가 있다.
나아가, 유저는 터치와 동시에 또는 터치 이후에 원하는 영역의 시작점과 종료점을 음성으로 입력한다(940). 예를 들어, "0" 으로 시작하여 "8" 로 끝나는 영역만 최종 선택하고자 하는 경우로 가정한다.
따라서, 본 발명에 의한 모바일 디바이스의 음성 인식 엔진의 분석을 통해, 도 9의 (b)에 도시된 바와 같이, 터치된 영역(930) 중에서 "0948" 부분만 최종적으로 선택 및 하이라이트 된다.
이와 같이 설계할 경우, 터치만으로 매우 좁은 영역에 대한 인식이 어려운 경우의 문제점들을 모두 해결할 수 있는 기술적 효과가 있다.
도 10은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역에서 제2영역을 재설정하는 프로세스의 다른 일예를 설명하기 위한 도면이다. 도 9에서는 터치된 영역내에 동일한 글자가 존재하지 않는 경우를 가정하였다. 그러나, 도 10에서는 터치된 영역내에 동일한 글자가 반복되는 경우의 문제점을 해결하기 위한 솔루션을 제시한다.
예를 들어, 도 10의 (a)에 도시된 바와 같이, 모바일 디바이스(1000)는 이미지 파일 또는 웹브라우져 화면(1010)을 출력하고 있다. 이 때, 유저(1020)는 손이나 펜을 이용하여 자신이 원하는 부분을 대략적으로 드로우(1030)하는 것으로 충분하다.
나아가, 상기 드로우된 영역(1030) 중 텍스트 포맷으로 처리하고자 하는 시작점과 종료점을 음성으로 유저는 발화한다(1040). 다만, 도 10의 (a)에서 "간" 으로 시작하여 "기" 로 종료하는 영역은 복수개 존재한다.
따라서, 도 10의 (b)에 도시된 바와 같이, 유저가 신속하게 액세스 및 선택할 수 있도록 최종 선택하고자 하는 영역의 후보 2그룹을 각각 표시한다. 예컨대, "간단하고 배우기" 의 제1그룹(1050)과 "간단하고 배우기 쉬워 인기" 의 제2그룹(1051)을 모두 디스플레이 하고, 유저는 해당 그룹을 용이하게 터치하여 선택 가능하다.
다른 실시예로서, 도 10의 (c)에 도시된 바와 같이, 각 그룹을 선택하는 ID(인디케이터)를 추가적으로 부여하는 것도 본 발명의 다른 권리범위에 속한다. 예를 들어, 도 10의 (c)에 도시된 바와 같이, 제1그룹을 선택하기 위한 넘버(1060) 및 제2그룹을 선택하기 위한 넘버(1061)를 표시함으로써, 유저가 각 그룹을 직접 터치하지 않고, 숫자 1 또는 숫자 2를 입력하여 원하는 그룹을 선택하는 것도 가능하다.
도 11은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역에서 제2영역을 재설정하는 프로세스의 또 다른 일예를 설명하기 위한 도면이다. 도 10에서는 유저가 시작점과 종료점을 위한 한글자씩만 발성하는 것을 가정하였으나, 정확도를 높이기 위하여 유저가 식별 가능한 단위 단위로 음성을 입력하도록 설계하는 것도 가능하다. 이와 관련하여, 이하 도 11을 참조하여 보다 상세히 후술하도록 하겠다.
우선, 도 11의 (a)에 도시된 바와 같이, 모바일 디바이스(1100)는 웹브라우져 화면(1110)을 디스플레이 하고 있다. 이 때, 유저(1120)는 원하는 부분(1130)을 1차적으로 선택한다. 나아가, 유저는 선택된 부분(1130)내에, 종료점에 해당하는 "기" 글자가 2번 반복하는 것을 확인할 수가 있다.
따라서, 최종 선택되기를 원하는 영역의 첫글자는 "간" 으로만 발성하지만, 마지막 글자에 대해서는 "인기" 로 단어 단위로 발성함으로써, 식별력을 강화하도록 한다. 예를 들어, 도 11의 (b)에 도시된 바와 같이, "간단하고 배우기" 의 영역이 아닌 "간단하고 배우기 쉬워 인기"(1150) 부분이 최종 영역으로 선택되어 진다.
즉, 도 11과 같이 동작하도록 설계하는 경우, 도 10의 (b) 또는 (c)의 프로세스를 모두 생략할 수 있는 장점이 있다.
도 12 및 도 13은 본 발명의 다른 일실시예에 의한 모바일 디바이스가 제1영역 및 제2영역을 구별하여 표시하는 일예를 설명하기 위한 도면들이다.
도 12에 도시된 바와 같이, 모바일 디바이스(1200)는 임의의 화면(1210)을 출력하고 있다. 이 때, 유저(1220)는 특정 영역(1230)을 터치하고, 해당 영역은 예컨대 기존 글씨 보다 약 1.5배 확대된다. 이와 같이 설계하여, 유저가 터치 부분을 다시 한번 재설정하는 기회를 제공한다.
또한, 도 12에 도시된 터치 이후 유저가 특정 첫글자와 마지막 글자를 발성한 경우, 도 13에 도시된 바와 같이, 모바일 디바이스(1300)는 전체 화면(1310) 중에서 특정 텍스트 부분(1330)을 보다 강조하여 표시한다. 예를 들어, 기존 글씨 보다 약 2배 확대 표시함으로써, 유저는 터치로 임시 선택된 영역(1230)과 음성으로 최종 선택된 영역(1330)을 용이하게 구별할 수 있는 장점이 있다.
도 14는 본 발명의 다른 일실시예에 의한 모바일 디바이스가 최종 확정된 제2영역을 이용하는 일예를 설명하기 위한 도면이다.
우선, 도 14의 (a)에 도시된 바와 같이, 터치 센싱 및 음성 인식의 멀티 모달 인터페이스를 통해 특정 영역(1410)이 선택되 것으로 가정하겠다. 이와 관련하여, 이전 도면들에서 충분히 설명한 바 당업자는 반복 실시가 가능하다. 또한, 도 14의 (a)에 도시된 특정 영역(1410)은 메모리에 임시 저장되며, 텍스트 포맷으로 저장된다.
나아가, 도 14의 (b)에 도시된 바와 같이, 유저가 문자 메시지 기능(1420)을 실행 중, 도 14의 (a)에서 최종 선택된 특정 텍스트를 불러 와서 문자 입력 창(1430)에 붙이는 것이 가능하다. 물론, 도 14에서는 문자 메시지 기능을 예시하였으나, 메모장 또는 노트 등에서도 동일한 기능을 적용할 수가 있다.
도 15는 본 발명의 다른 일실시예에 의한 모바일 디바이스의 제어 방법을 도시한 플로우 차트이다. 당업자라면, 이전 도 1 내지 도 14를 참조하여, 도 15를 보충 해석 가능하다.
본 발명의 다른 일실시예에 의한 모바일 디바이스는, 임의의 기능 실행 중 터치 센서로 인식된 제1영역을 설정하고(S1510), 유저로부터 음성 데이터를 수신한다(S1520).
상기 수신된 음성 데이터를 분석하여, 최초 인식된 음성에 대응하는 제1문자 및 마지막에 인식된 음성에 대응하는 제2문자를 추출하고(S1530), 상기 설정된 제1영역내에서의 상기 추출된 제1문자 및 제2문자의 위치를 기초로 제2영역을 설정한다(S1540).
상기 제1문자를 시작점으로 하고 상기 제2문자를 종료점으로 하는 상기 제2영역을 메모리에 저장하고(S1550), 그리고 상기 저장된 제2영역내 적어도 하나 이상의 문자를 출력한다(S1560).
도 15에 도시하지는 않았으나, 상기 저장된 제2영역내 적어도 하나 이상의 문자를 텍스트 포맷으로 변환하는 단계를 더 포함하도록 설계 가능하다. 상기 적어도 하나 이상의 문자는 예를 들어 글자, 숫자 또는 기호 중 어느 하나에 대응한다.
도 15에 도시하지는 않았으나, 상기 제1영역 및 상기 제2영역 각각의 사이즈 또는 칼라를 다르게 변환하는 단계, 상기 제2영역이 2개 이상 존재하는 경우, 복수개의 제2영역들을 모두 디스플레이 하는 단계 또는 상기 복수개의 제2영역들 각각을 인디케이트 하는 ID(identifier)를 디스플레이 하는 단계를 각각 더 포함하도록 설계 가능하다.
상기 S1540 단계는, 상기 제2영역이 2개 이상 존재하는 경우, 최초 인식된 음성에 대응하는 제1문자 및 상기 제1문자 다음으로 연속하여 인식된 음성에 대응하는 문자를 이용하여, 상기 제2영역의 시작점을 재설정하도록 설계한다.
상기 S1540 단계는, 상기 제2영역이 2개 이상 존재하는 경우, 마지막에 인식된 음성에 대응하는 제2문자 및 상기 제2문자 이전에 연속하여 인식된 음성에 대응하는 문자를 이용하여, 상기 제2영역의 종료점을 재설정하도록 설계한다.
도 16 내지 도 18은 본 발명의 또 다른 일실시예에 의한 모바일 디바이스가 제1영역을 설정하는 프로세스의 일예를 설명하기 위한 도면이다. 이전 도면들에서는 주로 터치 방식으로 제1영역이 설정되는 것을 가정하였으나, 이하 도 16 내지 도 18에 도시된 바와 같이 유저의 시선을 트래킹 하는 방식을 도입하는 것도 본 발명의 권리범위에 속한다.
우선, 도 16에 도시된 바와 같이, 시선 추적 기능을 탑재한 디바이스는 가시광을 이용하여 사용자(1610)의 얼굴을 포함하는 전체 영상을 획득하고, 상기 획득한 전체 영상으로부터 상기 얼굴 영역을 검출할 수 있다.
이를 위해, 광각 카메라 및 협각 카메라를 포함하는 시선 영상 획득부(1620)를 이용할 수 있다. 시선 영상 획득부(1620)는 사용자(1610)의 얼굴 및 눈 위치(이하, 얼굴 영역이라 함)를 검출하기 위한 광각 카메라와 확대된 눈 영상을 얻을 수 있는 초점 조절이 가능한 고 배율 렌즈가 장착된 협각 카메라, 그리고 협각 카메라를 패닝/틸팅/포커싱 할 수 있는 3개의 모터를 포함할 수 있다.
즉, 시선 영상 획득부(1620)는 사용자의 얼굴전체를 촬영하는 광각 카메라와 시선 추적을 위해 사용자의 눈을 확대하여 촬영할 수 있도록 하는 초점 조절이 가능한 고 배율 렌즈를 탑재한 협각 카메라를 포함할 수 있다.
광각 카메라와 협각 카메라는 광축이 평행한 구조를 가지며 USB(Universal Serial Bus) 인터페이스의 CMOS(Complementary Metal Oxide Semiconductor) 혹은 CCD(Charge Coupled Device) 센서를 사용할 수 있다.
또한, 협각 카메라는 정확한 시선 추적 정확도를 높이기 위해 2메가 픽셀 급 카메라가 사용될 수 있다. 얼굴 영역을 검출하기 위한 광각 카메라에서는 가시광선 파장대의 영상을 취득하고 확대된 눈 영상을 취득하기 위한 협각 카메라에서는 적외선 파장대의 영상을 취득한다.
시선 추적 처리부(1640)는 상기 검출된 얼굴 영역으로부터 얼굴 폭, 눈간 거리, 및 눈과 화면 간 거리를 획득하고, 상기 획득한 얼굴 폭, 눈간 거리, 및 눈과 화면 간 거리 중에서 적어도 하나를 이용하여, 얼굴에 대응하는 확대된 눈의 영상을 획득할 수 있다.
구체적으로, 시선 추적 처리부(1640)는 상기 획득한 얼굴 폭, 눈간 거리, 및 눈과 화면 간 거리 중에서 적어도 하나를 이용하여, 상기 협각 카메라의 동작을 제어하여 선명한 눈의 영상을 획득할 수 있다.
또한, 시선 추적 처리부(1640)는 상기 획득한 눈의 영상을 이용하여, 사용자(1610)의 시선을 추적할 수 있다.
구체적으로, 시선 추적 처리부(1640)는 화면 상의 모퉁이 네 곳에 위치하는 적외선 조명부(1630)가 조사하는 각막 반사광(specular reflection)이, 상기 눈의 영상으로 획득한 동공 영역을 통해 반사되는 빛을 수집하여 사용자(1610)의 시선을 추적할 수 있다.
본 발명의 일실시예에 따르면, 사용자는 별도의 장치를 착용하지 않고도 원거리에서 IPTV를 제어할 수 있다.
따라서, 사용자의 시선이 일정 이상 머문 포인트를 기준으로 일정 영역을 전술하여 설명한 제1영역으로 확정한다.
도 17은, 도 16에 도시된 디바이스를 보다 상세히 도시한 블록도이다.
본 발명의 일실시예에 따른 시선 추적 디바이스는 적외선 조명부(1710), 시선 영상 획득부(1720) 및 시선 추적 처리부(1730)를 포함할 수 있다.
적외선 조명부(1710)는 적외선의 각막 반사광(specular reflection)을 조사할 수 있다. 적외선 조명부(1710)는 850nm 파장대의 다수의 적외선 LED(Light Emitting Diode) 배열 형태로 구성되며, 일례로 TV 프레임에 부착되거나, 내장된 형태로 네 개의 적외선 조명이 사용될 수 있다.
적외선 LED는 시청자를 비추는 역할과 동시에 시선 추적을 위해 4개의 각막 반사광(specular reflection)을 발생시키는데 사용될 수 있다.
또한 일반적인 TV시청 거리인 1 ~ 3미터 범위 내에서 시선 추적에 적합한 시청자의 눈 영상을 촬영하기에 충분한 조명을 구성한다.
시선 영상 획득부(1720)는 가시광을 이용하여 사용자의 얼굴을 포함하는 전체 영상을 획득하고, 상기 얼굴에 대응하는 확대된 눈의 영상을 획득할 수 있다.
시선 영상 획득부(1720)는 상기 전체 영상을 획득하는 광각 카메라 및 확대된 눈의 영상을 획득하는 협각 카메라를 포함할 수 있다.
즉, 시선 영상 획득부(1720)는 광각카메라에서 초기에 넓은 화각에서 대략적인 얼굴 영역을 검출하고, 이 위치로 협각 카메라를 패닝, 틸팅한후, 원거리의 시청자의 얼굴 및 눈 위치를 보다 정확하게 측정할 수 있다.
시선 추적 처리부(1730)는 상기 획득한 전체 영상 및 상기 확대된 눈의 영상을 이용하여, 상기 사용자의 시선을 추적할 수 있다.
이를 위해, 시선 추적 처리부(1730)는 광각 카메라 및 협각 카메라의 영상 취득 및 처리와 패닝, 틸팅, 포커싱을 위한 모터를 콘트롤 하며, 또한 적외선 조명부(1710)을 콘트롤하는 기능을 수행할 수 있다.
본 발명의 일실시예에 따른 시선 추적 처리부(1730)는 상기 획득한 전체 영상에서 아다부스트(Adaboost) 알고리즘 및 캠쉬프트(CamShift) 알고리즘을 적용하여, 상기 얼굴 영역을 검출할 수 있다.
구체적으로, 본 발명의 일실시예에 따른 시선 추적 처리부(1730)는 광각 카메라에서 초기에 아다부스트 알고리즘으로 얼굴 영역을 검출 한 후, 캠쉬프트 알고리즘을 사용하여 히스토그램 유사도를 측정하고 비교하며 이를 업데이트 함으로써 얼굴 영역을 추적할 수 있다.
또한, 본 발명의 일실시예에 따른 시선 추적 처리부(1730)는 상기 검출된 얼굴 영역에서 아다부스트(Adaboost) 알고리즘 및 적응적 템플릿(adaptive template) 알고리즘을 적용하여, 상기 눈간 거리 및 상기 눈과 화면 간 거리 중에서 적어도 하나를 산출할 수 있다.
구체적으로, 본 발명의 일실시예에 따른 시선 추적 처리부(1730)는 광각 카메라에서 초기에 아다부스트 알고리즘으로 눈 영역을 검출 한 후, 적응적 템플릿 매칭 알고리즘을 사용하여 유사도를 측정하고 비교하며 이를 업데이트 함으로써 시선을 정확하게 추적할 수 있다.
또한, 본 발명의 일실시예에 따른 시선 추적 처리부(1730)는 상기 획득한 얼굴의 전체 영상에 기초하여, 상기 확대된 눈의 영상을 획득하도록 상기 협각 카메라의 움직임을 제어할 수 있다.
이후, 본 발명의 일실시예에 따른 시선 추적 처리부(1730)는 상기 획득한 확대된 눈의 영상에 기초하여, 상기 사용자의 동공 영역을 검출하고, 상기 검출된 동공 영역에서 동공 중심위치를 검출할 수 있다. 또한, 본 발명의 일실시예에 따른 시선 추적 처리부(1730)는 상기 동공 영역에서 반사되는 상기 각막 반사광을 검출하여 상기 사용자의 시선을 추적할 수 있다.
본 발명의 일실시예에 따른 시선 추적 처리부(1730)는 상기 동공 영역을 검출하기 위해서, 원형검출 알고리즘, 이진화 처리, 및 라벨링 처리 중에서 적어도 하나를 이용할 수 있다.
이전 도 16 및 도 17(도 1 내지 도 15 보조 참조)을 참조하여, 도 18에 도시된 프로세스(시선 추적에 의한 제1영역 설정 방법)를 설명하도록 하겠다.
본 발명의 일실시예에 따른 시선 추적 방법은 가시광을 이용하여 사용자의 얼굴을 포함하는 전체 영상을 획득할 수 있다(S1810).
본 발명의 일실시예에 따른 시선 추적 방법은 상기 획득한 전체 영상으로부터 상기 얼굴 영역을 검출할 수 있다(S1820).
본 발명의 일실시예에 따른 시선 추적 방법은 상기 얼굴 영역을 검출하기 위해서 광각 카메라를 이용할 수 있고, 상기 획득한 얼굴 영역을 이용하여 얼굴 폭, 눈간 거리, 및 눈과 화면 간 거리를 획득할 수 있다.
일례로, 본 발명의 일실시예에 따른 시선 추적 방법은 상기 획득한 전체 영상에서 아다부스트(Adaboost) 알고리즘 및 캠쉬프트(CamShift) 알고리즘을 적용하여, 상기 얼굴 영역을 검출할 수 있다.
본 발명의 일실시예에 따른 시선 추적 방법은 상기 획득한 얼굴 영역에 기초하여 확대된 눈의 영상을 획득할 수 있다(S1830).
본 발명의 일실시예에 따른 시선 추적 방법은 상기 확대된 눈의 영상을 획득하기 위해서, 협각 카메라를 이용할 수 있다.
즉, 상기 획득한 얼굴 폭, 눈간 거리, 및 눈과 화면 간 거리 중에서 적어도 하나를 이용하여, 상기 협각 카메라를 패닝/틸팅/포커싱하여, 보다 세밀한 눈의 영상을 획득할 수 있다.
다시 말해, 본 발명의 일실시예에 따른 시선 추적 방법은 상기 획득한 얼굴 폭, 눈간 거리, 및 눈과 화면 간 거리 중에서 적어도 하나를 이용하여, 협각 카메라의 움직임을 제어하고, 상기 협각 카메라로부터 얼굴에 대응하는 확대된 눈의 영상을 획득할 수 있다.
다음으로, 본 발명의 일실시예에 따른 시선 추적 방법은 상기 획득한 눈의 영상을 이용하여, 상기 사용자의 시선을 추적할 수 있다(S1840).
구체적으로, 본 발명의 일실시예에 따른 시선 추적 방법은 상기 검출된 동공 영역에서 동공 중심위치를 검출하고, 상기 동공 영역에서 반사되는 상기 각막 반사광을 검출하며, 상기 산출된 동공 중심위치 및 상기 각막 반사광을 이용하여, 상기 사용자의 시선을 추적할 수 있다.
나아가, 기설정된 시간 동안 사용자의 시선이 고정되었는지 여부를 판단한다(S1850). 상기 판단 결과 기설정된 시간 동안 사용자의 시선의 움직임이 없는 경우, 제1영역을 확정한다(S1860). 예를 들어, 사용자의 시선이 위치한 포인트를 중심으로 X축 방향의 5cm(예시임) 그리고 Y축 방향의 5cm(예시임) 간격을 제1영역으로 추정할 수도 있다. 물론, 상기 예시된 수치는 화면의 크기 등에 따라 다르게 설정 가능하다.
도 19 및 도 20은 본 발명의 또 다른 일실시예에 의한 모바일 디바이스가 제1영역을 설정하는 프로세스의 다른 일예를 설명하기 위한 도면이다. 이전 도면들에서는 주로 터치 방식으로 제1영역이 설정되는 것을 가정하였으나, 이하 도 19 및 도 20에 도시된 바와 같이 리모트 컨트롤러의 모션을 트래킹 하는 방식을 도입하는 것도 본 발명의 권리범위에 속한다.
도 19는 본 발명의 일실시예에 의한 리모트 컨트롤러의 외관을 간략히 도시한 도면이다.
도 19 (a)에 도시된 바와 같이, 멀티미디어 디바이스(1900)의 스크린 상에, 리모트 컨트롤러(1910)의 움직임에 대응하는 포인터(1901)가 표시된다. 사용자는 리모트 컨트롤러(1910)를 좌우(도 19의 (b)), 상하(도 19의 (c))로 움직이거나 회전할 수 있다. 이와 같은 리모트 컨트롤러(1910)는, 3D 공간상의 움직임에 따라 해당 포인터(1901)가 이동되어 표시되므로, 공간 리모콘이라 명명할 수도 있다.
도 19의 (b)에 도시된 바와 같이, 사용자가 리모트 컨트롤러(1910)를 왼쪽으로 이동 시키면, 멀티미디어 디바이스(1900)의 스크린 상에 표시된 포인터(1901)도 왼쪽으로 이동한다. 한편, 리모트 컨트롤러(1910)의 센서를 통하여 감지된 리모트 컨트롤러(1910)의 움직임에 관한 정보는 멀티미디어 디바이스(1900)로 전송된다. 상기 멀티미디어 디바이스(1900)는, 리모트 컨트롤러(1910)의 움직임에 관한 정보로부터 포인터(1901)의 좌표를 산출할 수 있다. 상기 멀티미디어 디바이스(1900)는, 산출한 좌표에 대응하도록 포인터(1901)를 표시할 수 있다.
한편, 도 19의 (c)에 도시된 바와 같이, 사용자가 리모트 컨트롤러(1910)를 아래쪽으로 이동 시키면, 멀티미디어 디바이스(1900)의 스크린 상에 표시된 포인터(1901)도 아래쪽으로 이동한다.
따라서, 본 발명의 일실시예에 의한 리모트 컨트롤러(1910)를 이용하여, 상기 멀티미디어 디바이스(1900)의 스크린내 특정 영역을 신속하게 선택하는 것이 가능하다.
도 20은 도 19에 도시된 리모트 컨트롤러의 구성요소들을 상세히 도시한 블록도이다.
도 20에 도시된 바와 같이, 리모트 컨트롤러(2010)는, 무선통신부(2014), 사용자 입력부(2015), 센서부(2017), 출력부(2016), 전원공급부(2011), 저장부(2012), 그리고 제어부(2013) 등을 포함한다.
무선통신부(2014)는 임의의 외부 장치와 통신 가능하도록 설계된다. 특히, 본 발명의 일실시예에 의하면, RF 모듈(2014a)은 멀티미디어 디바이스(2000)와 데이터 통신이 이루어 지도록 설계하고, IR 모듈(2014b)은 외부 전자 장치(2030, 예를 들어 STB)와 적외선 통신이 이루어 지도록 설계한다. 물론, 상기 RF 모듈(2014a) 또는 상기 IR 모듈(2014b) 중 어느 하나만 무선통신부(2014)에 포함되도록 설계하는 것도 가능하다.
따라서, 멀티미디어 디바이스(2000)로부터 수신한 IR 적외선 코드값을, STB(2030)로 포워딩 하는 중계기 역할을 수행하도록, 리모트 컨트롤러(2010)를 구현하는 것이 가능하다.
나아가, 본 발명의 일실시예에 의하면, 리모트 컨트롤러(2010)는, 멀티미디어 디바이스(2000)로, 리모트 컨트롤러(2010)의 움직임 등에 관한 정보가 담긴 신호를 RF 모듈(2014a)을 통하여 전송한다.
또한, 리모트 컨트롤러(2010)는, 멀티미디어 디바이스(2000)가 전송한 신호를 RF 모듈(2014a)을 통하여 수신할 수 있다. 또한, 리모트 컨트롤러(2010)는 필요에 따라 IR 모듈(2014b)을 통하여 멀티미디어 디바이스(2000)로 전원 온/오프, 채널 변경, 볼륨 변경 등에 관한 명령을 전송할 수 있다.
사용자 입력부(2015)는 키패드, 버튼, 터치 패드, 또는 터치 스크린 등으로 구성될 수 있다.
센서부(2017)는 자이로 센서(2017a) 또는 가속도 센서(2017b)를 구비할 수 있다. 자이로 센서(2017a)는 리모트 컨트롤러(2010)의 움직임에 관한 정보를 센싱할 수 있다. 일례로, 자이로 센서(2017a)는 리모트 컨트롤러(2010)의 동작에 관한 정보를 x, y, z 축을 기준으로 센싱할 수 있다. 가속도 센서(2017b)는 리모트 컨트롤러(2010)의 이동속도 등에 관한 정보를 센싱할 수 있다. 한편, 거리측정센서를 더 구비할 수 있으며, 이에 의해, 멀티미디어 디바이스(2000)와의 거리를 센싱할 수 있다.
출력부(2016)는 사용자 입력부(2015)의 조작에 대응하거나 멀티미디어 디바이스(2000)에서 전송한 신호에 대응하는 영상 또는 음성 신호를 출력할 수 있다. 일례로, 출력부(2016)는 사용자 입력부(2015)가 조작되거나 무선 통신부(2014)를 통하여 멀티미디어 디바이스(2000)와 신호가 송수신 되면 점등되는 LED 모듈(2016a), 진동을 발생하는 진동 모듈(2016b), 음향을 출력하는 음향 출력 모듈(2016c), 또는 영상을 출력하는 디스플레이 모듈(2016d)을 구비할 수 있다.
전원공급부(2011)는 리모트 컨트롤러(2010)의 각 구성요소에 전원을 공급한다. 전원공급부(2011)는 리모트 컨트롤러(2010)가 소정 시간 동안 움직이지 않은 경우 전원 공급을 중단함으로써 전원 낭비를 줄일 수 있다.
저장부(2012)는 리모트 컨트롤러(2010)의 제어 또는 동작에 필요한 여러 종류의 프로그램, 애플리케이션 데이터 등이 저장될 수 있다. 그리고, 제어부(2013)는 리모트 컨트롤러(2010)의 제어에 관련된 제반사항을 제어한다. 예를 들어, 상기 제어부(2013)는, 사용자 입력부(2015)의 소정 키 조작에 대응하는 신호 또는 센서부(2017)에서 센싱한 리모트 컨트롤러(2010)의 움직임에 대응하는 신호를 무선 통신부(2014)를 통하여 멀티미디어 디바이스(2000) 또는 STB(2030)로 전송할 수 있다.
따라서, 이와 같이 설계하는 경우, 리모트 컨트롤러의 모션에 따라 움직이는 인디케이터를 이용하여, 유저가 원하는 제1영역을 신속하게 설정하는 것이 가능한 기술적 효과가 있다.
현재 종래 기술에 의한 모바일 디바이스만을 이용하여 빠르게 타이핑하다보면 오류가 많이 생기거나, Copy & Paste를 하는 경우가 많은데, 일정 영역을 선택하는 것은 더욱 어렵다. 따라서, 새로 타이핑하여 입력하는 경우가 더 많다.
이와 같은 문제점을 해결하기 위한 본 발명의 일실시예에 의하면, 음성인식과 터치 UX(또는 시선 추적, 리모트 컨트롤러의 모션 트래킹 등)를 복합한 멀티모달 형식의 텍스트 영역을 지정하고, Copy & Paste 기능을 사용하면 보다 신속하게 텍스트 기능을 제공할 수 있다.
스마트폰에 내재되어 있는 앱에서 뿐 만 아니라, 외부 마켓에서 다운로드 받아 사용하는 앱, 소셜 네트워크 앱등에서도 기본적으로 텍스트 입력, 출력 하는 경우에도 모두 적용 가능하다. 본 발명의 일실시예에 의하면, 편리하고 직관적인 UX를 줄 수 있으며 또한 텍스트 선택의 오류를 원천적으로 제거할 수 있는 기술적 효과가 있다. 또한, 본 발명은 스마트 폰 뿐만 아니라, 테블릿 PC나 차량에 탑재되는 네비게이션 UI에도 적용할 수 있다.
본 발명의 일실시예에 따른 장치 및 제어 방법은, 전술한 도면과 도면을 결합하여, 또는 당업자에게 자명한 사항을 결합하여 다른 실시예를 구현할 수도 있으며, 이 역시 본 발명의 권리범위에 속한다.
한편, 본 발명의 전자 장치의 동작방법은 전자 장치에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해돼서는 안 될 것이다.
400 : 모바일 디바이스
410 : 음성 인식 엔진
420 : 터치 센서
430 : 오디오 데이터 수신 모듈
440 : 디텍팅 모듈
450 : 디스플레이 모듈
460 : 메모리
470 : 제1변환 모듈
480 : 제2변환 모듈
490 : 컨트롤러

Claims (15)

  1. 터치 센서를 탑재한 모바일 디바이스의 제어 방법에 있어서,
    임의의 기능 실행 중 터치 센서로 인식된 제1영역을 설정하는 단계;
    유저로부터 음성 데이터를 수신하는 단계;
    상기 수신된 음성 데이터를 분석하여, 최초 인식된 음성에 대응하는 제1문자 및 마지막에 인식된 음성에 대응하는 제2문자를 추출하는 단계;
    상기 설정된 제1영역내에서의 상기 추출된 제1문자 및 제2문자의 위치를 기초로 제2영역을 설정하는 단계;
    상기 제1문자를 시작점으로 하고 상기 제2문자를 종료점으로 하는 상기 제2영역을 메모리에 저장하는 단계; 그리고
    상기 저장된 제2영역내 적어도 하나 이상의 문자를 출력하는 단계
    를 포함하는 터치 센서를 탑재한 모바일 디바이스의 제어 방법.
  2. 제1항에 있어서,
    상기 저장된 제2영역내 적어도 하나 이상의 문자를 텍스트 포맷으로 변환하는 단계-상기 적어도 하나 이상의 문자는 글자, 숫자 또는 기호 중 어느 하나에 대응함-
    를 더 포함하는 모바일 디바이스의 제어 방법.
  3. 제1항에 있어서,
    상기 제1영역 및 상기 제2영역 각각의 사이즈 또는 칼라를 다르게 변환하는 단계
    를 더 포함하는 모바일 디바이스의 제어 방법.
  4. 제1항에 있어서,
    상기 제2영역이 2개 이상 존재하는 경우, 복수개의 제2영역들을 모두 디스플레이 하는 단계
    를 더 포함하는 모바일 디바이스의 제어 방법.
  5. 제4항에 있어서,
    상기 복수개의 제2영역들 각각을 인디케이트 하는 ID(identifier)를 디스플레이 하는 단계
    를 더 포함하는 모바일 디바이스의 제어 방법.
  6. 제1항에 있어서,
    상기 제2영역을 설정하는 단계는,
    상기 제2영역이 2개 이상 존재하는 경우,
    최초 인식된 음성에 대응하는 제1문자 및 상기 제1문자 다음으로 연속하여 인식된 음성에 대응하는 문자를 이용하여, 상기 제2영역의 시작점을 재설정하도록 설계된 모바일 디바이스의 제어 방법.
  7. 제6항에 있어서,
    상기 제2영역을 설정하는 단계는,
    상기 제2영역이 2개 이상 존재하는 경우,
    마지막에 인식된 음성에 대응하는 제2문자 및 상기 제2문자 이전에 연속하여 인식된 음성에 대응하는 문자를 이용하여, 상기 제2영역의 종료점을 재설정하도록 설계된 모바일 디바이스의 제어 방법.
  8. 제1항 내지 제7항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
  9. 터치 센서를 탑재한 모바일 디바이스에 있어서,
    임의의 기능 실행 중 제1영역을 인식하는 터치 센서;
    유저로부터 음성 데이터를 수신하는 오디오 데이터 수신 모듈;
    상기 수신된 음성 데이터를 분석하는 음성 인식 엔진;
    최초 인식된 음성에 대응하는 제1문자 및 마지막에 인식된 음성에 대응하는 제2문자를 추출하는 디텍팅 모듈;
    상기 인식된 제1영역내에서의 상기 추출된 제1문자 및 제2문자의 위치를 기초로 제2영역을 계산하는 컨트롤러; 그리고
    상기 제1문자를 시작점으로 하고 상기 제2문자를 종료점으로 하는 상기 제2영역을 표시하는 디스플레이 모듈
    을 포함하는 터치 센서를 탑재한 모바일 디바이스.
  10. 제9항에 있어서,
    상기 제2영역에 대한 정보를 저장하는 메모리;
    상기 저장된 제2영역내 적어도 하나 이상의 문자를 텍스트 포맷으로 변환하는 제1변환 모듈-상기 적어도 하나 이상의 문자는 글자, 숫자 또는 기호 중 어느 하나에 대응함-
    을 더 포함하는 모바일 디바이스.
  11. 제10항에 있어서,
    상기 제1영역 및 상기 제2영역 각각의 사이즈 또는 칼라를 다르게 변환하는 제2변환 모듈
    을 더 포함하는 모바일 디바이스.
  12. 제9항에 있어서,
    상기 제2영역이 2개 이상 존재하는 경우,
    상기 디스플레이 모듈은 복수개의 제2영역들을 모두 디스플레이 하도록 설계된 모바일 디바이스.
  13. 제12항에 있어서,
    상기 컨트롤러는,
    상기 디스플레이 모듈을 제어하여, 상기 복수개의 제2영역들 각각을 인디케이트 하는 ID(identifier)를 더 디스플레이 하도록 설계된 모바일 디바이스.
  14. 제9항에 있어서,
    상기 컨트롤러는,
    상기 제2영역이 2개 이상 존재하는 경우,
    최초 인식된 음성에 대응하는 제1문자 및 상기 제1문자 다음으로 연속하여 인식된 음성에 대응하는 문자를 이용하여, 상기 제2영역의 시작점을 재설정하도록 설계된 모바일 디바이스.
  15. 제14항에 있어서,
    상기 컨트롤러는,
    상기 제2영역이 2개 이상 존재하는 경우,
    마지막에 인식된 음성에 대응하는 제2문자 및 상기 제2문자 이전에 연속하여 인식된 음성에 대응하는 문자를 이용하여,
    상기 제2영역의 종료점을 재설정하도록 설계된 모바일 디바이스.
KR1020120149155A 2012-12-20 2012-12-20 터치 센서를 탑재한 모바일 디바이스 및 그 제어 방법 KR101949742B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120149155A KR101949742B1 (ko) 2012-12-20 2012-12-20 터치 센서를 탑재한 모바일 디바이스 및 그 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120149155A KR101949742B1 (ko) 2012-12-20 2012-12-20 터치 센서를 탑재한 모바일 디바이스 및 그 제어 방법

Publications (2)

Publication Number Publication Date
KR20140079937A true KR20140079937A (ko) 2014-06-30
KR101949742B1 KR101949742B1 (ko) 2019-02-19

Family

ID=51130779

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120149155A KR101949742B1 (ko) 2012-12-20 2012-12-20 터치 센서를 탑재한 모바일 디바이스 및 그 제어 방법

Country Status (1)

Country Link
KR (1) KR101949742B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105788608A (zh) * 2016-03-03 2016-07-20 渤海大学 基于神经网络的汉语声韵母可视化方法
WO2021133417A1 (en) * 2019-12-27 2021-07-01 Intelligent Waves Llc Character editing on a physical device via interaction with a virtual device user interface

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123288A (ja) * 2000-10-12 2002-04-26 Canon Inc 携帯電話、ユーザインタフェース装置、コンテンツ表示方法、記憶媒体
KR20100116462A (ko) * 2009-04-22 2010-11-01 삼성전자주식회사 휴대 단말기의 입력 처리 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123288A (ja) * 2000-10-12 2002-04-26 Canon Inc 携帯電話、ユーザインタフェース装置、コンテンツ表示方法、記憶媒体
KR20100116462A (ko) * 2009-04-22 2010-11-01 삼성전자주식회사 휴대 단말기의 입력 처리 장치 및 방법

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105788608A (zh) * 2016-03-03 2016-07-20 渤海大学 基于神经网络的汉语声韵母可视化方法
CN105788608B (zh) * 2016-03-03 2019-03-26 渤海大学 基于神经网络的汉语声韵母可视化方法
WO2021133417A1 (en) * 2019-12-27 2021-07-01 Intelligent Waves Llc Character editing on a physical device via interaction with a virtual device user interface
US11157089B2 (en) 2019-12-27 2021-10-26 Hypori Llc Character editing on a physical device via interaction with a virtual device user interface

Also Published As

Publication number Publication date
KR101949742B1 (ko) 2019-02-19

Similar Documents

Publication Publication Date Title
US8928723B2 (en) Mobile terminal and control method thereof
US9147395B2 (en) Mobile terminal and method for recognizing voice thereof
KR102148002B1 (ko) 대상물의 자동적 인식과 캡쳐
US10241743B2 (en) Mobile terminal for matching displayed text with recorded external audio and method of controlling the mobile terminal
KR101850035B1 (ko) 이동 단말기 및 그 제어방법
KR102182398B1 (ko) 전자 기기 및 그 제어 방법
KR101850034B1 (ko) 이동 단말기 및 그 제어방법
US20150091794A1 (en) Mobile terminal and control method therof
KR20140043644A (ko) 이동 단말기 및 그것의 제어방법
KR20130122334A (ko) 이동 단말기 및 그 제어방법
KR101725388B1 (ko) 이동 단말기 및 그 제어방법
KR20160023661A (ko) 이동 단말기 및 이동 단말기의 제어 방법
KR101648509B1 (ko) 이동 단말기 및 그 제어방법
KR101526575B1 (ko) 입력 시스템 및 그 제어 방법
KR101987461B1 (ko) 이동 단말기 및 이동 단말기의 제어 방법
KR101949742B1 (ko) 터치 센서를 탑재한 모바일 디바이스 및 그 제어 방법
KR101587099B1 (ko) 단말기 및 그 제어 방법
KR101730367B1 (ko) 이동 단말기 및 그 제어방법
KR20140095227A (ko) 이동 단말기 및 그 제어방법
KR20140094868A (ko) 이동 단말기 및 그 제어방법
KR101529927B1 (ko) 단말기 및 그 제어 방법
KR101634386B1 (ko) 이동 통신 단말기에서의 콘텐츠 표시방법 및 이를 적용한 이동 통신 단말기
KR20150092624A (ko) 전자 기기 및 그 제어 방법
KR20130032568A (ko) 버튼 어셈블리 및 이를 포함하는 이동 단말기
KR101635880B1 (ko) 이동 단말기 및 그 제어 방법

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant