KR101537693B1 - Terminal and method for controlling the same - Google Patents
Terminal and method for controlling the same Download PDFInfo
- Publication number
- KR101537693B1 KR101537693B1 KR1020080117077A KR20080117077A KR101537693B1 KR 101537693 B1 KR101537693 B1 KR 101537693B1 KR 1020080117077 A KR1020080117077 A KR 1020080117077A KR 20080117077 A KR20080117077 A KR 20080117077A KR 101537693 B1 KR101537693 B1 KR 101537693B1
- Authority
- KR
- South Korea
- Prior art keywords
- information
- voice
- input
- error
- user
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 230000006870 function Effects 0.000 claims description 93
- 230000004044 response Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 abstract description 23
- 230000003252 repetitive effect Effects 0.000 abstract description 2
- 238000001994 activation Methods 0.000 description 24
- 230000004913 activation Effects 0.000 description 23
- 238000004891 communication Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 210000003811 finger Anatomy 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 7
- 238000010295 mobile communication Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 6
- 230000033001 locomotion Effects 0.000 description 5
- 238000003672 processing method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 229910001220 stainless steel Inorganic materials 0.000 description 2
- 239000010935 stainless steel Substances 0.000 description 2
- 239000010936 titanium Substances 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 230000005672 electromagnetic field Effects 0.000 description 1
- 239000010408 film Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000001746 injection moulding Methods 0.000 description 1
- 239000007769 metal material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000015541 sensory perception of touch Effects 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 229920003002 synthetic resin Polymers 0.000 description 1
- 239000000057 synthetic resin Substances 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/34—Microprocessors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/38—Displays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
Abstract
본 발명은 음성인식 중 발생할 수 있는 반복적인 에러를 회피할 수 있도록 하는 단말기 및 그 제어 방법에 관한 것으로, 사용자로부터 음성정보를 입력받는 마이크와, 상기 음성정보에서 음성인식 에러가 있는 음성정보를 정확한 음성정보로 정정한 후, 그 에러의 발생과 처리에 관련된 정보들을 저장하는 제어부와, 상기 제어부의 제어에 따라 상기 에러의 발생과 처리에 관련된 정보들을 데이터베이스로 저장하는 메모리를 포함한다.The present invention relates to a terminal capable of avoiding repetitive errors that may occur during speech recognition, and a control method thereof, and more particularly, to a terminal and a control method thereof that are capable of accurately detecting voice information with a voice recognition error in the voice information, And a memory for storing information related to the generation and processing of the error in the database according to the control of the control unit.
Description
본 발명은 음성인식 중 발생할 수 있는 반복적인 에러를 회피할 수 있도록 하는 단말기 및 그 제어 방법에 관한 것이다.The present invention relates to a terminal that can avoid repetitive errors that may occur during voice recognition, and a control method thereof.
단말기는 이동 가능 여부에 따라 이동 단말기(mobile/portable terminal) 및 고정 단말기(stationary terminal)으로 나뉠 수 있다. 다시 이동 단말기는 사용자의 직접 휴대 가능 여부에 따라 휴대(형) 단말기(handheld terminal) 및 거치형 단말기(vehicle mount terminal)로 나뉠 수 있다. The terminal can move And can be divided into a mobile / portable terminal and a stationary terminal depending on whether the mobile terminal is a mobile terminal or a mobile terminal. The mobile terminal can be divided into a handheld terminal and a vehicle mount terminal according to whether the user can directly carry the mobile terminal.
이와 같은 단말기(terminal)는 기능이 다양화됨에 따라 예를 들어, 사진이나 동영상의 촬영, 음악이나 동영상 파일의 재생, 게임, 방송의 수신 등의 복합적인 기능들을 갖춘 멀티미디어 기기(Multimedia player) 형태로 구현되고 있다. Such a terminal has various functions, for example, in the form of a multimedia device having multiple functions such as photographing and photographing of a moving picture, reproduction of a music or video file, reception of a game and broadcasting, etc. .
이러한 단말기의 기능 지지 및 증대를 위해, 단말기의 구조적인 부분 및/또는 소프트웨어적인 부분을 개량하는 것이 고려될 수 있다.In order to support and enhance the functionality of such terminals, it may be considered to improve the structural and / or software parts of the terminal.
또한, 최근에는 음성인식 기능을 이동 단말기에 적용하려는 노력이 이루어지고 있다. 그러나, 항상 완벽한 음성인식을 기대할 수 없기 때문에 에러가 발생할 수 있으며, 특히 동일한 에러가 반복적으로 발생할 경우 에러 상황을 벗어나지 못 하거나, 매번 동일한 에러처리 루틴을 실행해야 하는 문제점이 있다.In recent years, efforts have been made to apply a voice recognition function to a mobile terminal. However, an error may occur because a complete speech recognition can not always be expected. In particular, when the same error repeatedly occurs, there is a problem that the error situation can not be escaped or the same error processing routine must be executed every time.
본 발명은 음성인식 중 반복적으로 발생할 수 있는 동일한 에러를 회피할 수 있도록 하는 단말기 및 그 제어 방법에 관한 것이다.The present invention relates to a terminal capable of avoiding the same error that may repeatedly occur during speech recognition and a control method thereof.
또한, 본 발명은 음성인식 중 동일한 에러가 반복적으로 발생할 경우 사용자가 직접 정보를 입력할 수 있도록 하므로써 에러 상황을 벗어날 수 있도록 하는 단말기 및 그 제어 방법에 관한 것이다.In addition, the present invention relates to a terminal and a control method thereof, which allow a user to input information directly when an identical error occurs repeatedly during speech recognition, thereby allowing an error situation to be escaped.
또한, 본 발명은 음성인식 중 동일한 에러가 반복적으로 발생할 경우 음성 인식을 위한 최소 단위로 정보를 입력할 수 있도록 함으로써 에러를 처리할 수 있도록 하는 단말기 및 그 제어 방법에 관한 것이다.In addition, the present invention relates to a terminal capable of processing an error by allowing information to be input as a minimum unit for voice recognition when the same error repeatedly occurs during voice recognition, and a control method thereof.
또한, 본 발명은 에러 상황을 벗어날 경우의 처리 방법에 대한 기록을 저장하고 동일한 에러가 발생할 경우 상기 저장된 방법을 이용하여 에러를 처리할 수 있도록 하는 단말기 및 그 제어 방법에 관한 것이다.The present invention also relates to a terminal and a control method thereof for storing a record of a processing method when an error situation occurs, and for handling an error using the stored method when the same error occurs.
상기한 과제를 실현하기 위한 본 발명의 일예와 관련된 단말기는 사용자로부터 음성정보를 입력받는 마이크와, 상기 음성정보에서 음성인식 에러가 있는 음성정보를 정확한 음성정보로 정정한 후, 그 에러의 발생과 처리에 관련된 정보들을 저장하는 제어부와, 상기 제어부의 제어에 따라 상기 에러의 발생과 처리에 관련된 정보들을 데이터베이스로 저장하는 메모리를 포함한다.A terminal related to an embodiment of the present invention for realizing the above-mentioned problem is characterized in that a microphone for inputting voice information from a user and voice information having a voice recognition error in the voice information are corrected to correct voice information, And a memory for storing information related to the generation and processing of the error in the database under the control of the control unit.
또한, 상기한 과제를 실현하기 위한 본 발명은 사용자로부터 음성정보를 입 력받고, 상기 음성정보에 대한 음성인식 에러가 검출되면, 상기 에러가 발생한 음성정보를 정확한 음성정보로 정정하도록 처리한다. 그리고, 상기 에러의 처리가 완료되면 그 에러의 발생과 처리에 관련된 정보를 특정 데이터베이스에 저장함으로써 동일한 에러가 발생할 때 참조할 수 있도록 이루어진다.According to another aspect of the present invention, there is provided a method for correcting voice information in which an error has occurred, the method comprising: receiving voice information from a user and detecting a voice recognition error in the voice information; When the error processing is completed, information related to the occurrence and processing of the error is stored in a specific database so that the same information can be referred to when the same error occurs.
상기와 같이 구성되는 본 발명의 적어도 하나의 실시예에 관련된 단말기는 에러 상황을 벗어날 경우의 처리 방법에 대한 기록을 저장하고, 동일한 에러가 발생할 경우, 상기 저장된 방법을 이용하여 에러를 처리할 수 있도록 한다.The terminal according to at least one embodiment of the present invention configured as described above stores a record of a method of processing when an error condition is exited, and when the same error occurs, the terminal can process the error using the stored method do.
또한, 본 발명은 음성인식 중 에러가 발생한 음성정보를 최소 단위로 분할하여 재입력받거나, 사용자로부터 키입력이나 터치입력 방식으로 직접 재입력받아 에러를 정정할 수 있도록 한다.In addition, the present invention divides voice information in which an error occurred during speech recognition into a minimum unit and re-inputs the same, or directly inputs a key input or a touch input method from a user to correct an error.
이하, 본 발명과 관련된 이동 단말기에 대하여 도면을 참조하여 보다 상세하게 설명한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. Hereinafter, a mobile terminal related to the present invention will be described in detail with reference to the drawings. The suffix "module" and " part "for the components used in the following description are given or mixed in consideration of ease of specification, and do not have their own meaning or role.
본 명세서에서 설명되는 이동 단말기에는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 디지털방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션 등이 포함될 수 있다. 그러나, 본 명세서에 기재된 실시예에 따른 구성은 이동 단말기에만 적용 가능한 경우를 제외하면, 디지털 TV, 데스크탑 컴퓨터 등과 같은 고정 단말기에도 적용될 수도 있음을 본 기술분야의 당업자라면 쉽게 알 수 있을 것이다.The mobile terminal described in this specification may include a mobile phone, a smart phone, a laptop computer, a digital broadcasting terminal, a PDA (Personal Digital Assistants), a PMP (Portable Multimedia Player), navigation and the like. However, it will be understood by those skilled in the art that the configuration according to the embodiments described herein may be applied to a fixed terminal such as a digital TV, a desktop computer, and the like, unless the configuration is applicable only to a mobile terminal.
도1은 본 발명의 일 실시예와 관련된 이동 단말기의 블록 구성도(block diagram)이다.1 is a block diagram of a mobile terminal according to an embodiment of the present invention.
상기 이동 단말기(100)는 무선 통신부(110), A/V(Audio/Video) 입력부(120), 사용자 입력부(130), 센싱부(140), 출력부(150), 메모리(160), 인터페이스부(170), 제어부(180) 및 전원 공급부(190) 등을 포함할 수 있다. 도 1에 도시된 구성요소들이 필수적인 것은 아니어서, 그보다 많은 구성요소들을 갖거나 그보다 적은 구성요소들을 갖는 이동 단말기가 구현될 수도 있다.The
이하, 상기 구성요소들에 대해 차례로 살펴본다.Hereinafter, the components will be described in order.
무선 통신부(110)는 이동 단말기(100)와 무선 통신 시스템 사이 또는 이동 단말기(100)와 이동 단말기(100)가 위치한 네트워크 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 예를 들어, 무선 통신부(110)는 방송 수신 모듈(111), 이동통신 모듈(112), 무선 인터넷 모듈(113), 근거리 통신 모듈(114) 및 위치정보 모듈(115) 등을 포함할 수 있다.The
방송 수신 모듈(111)은 방송 채널을 통하여 외부의 방송 관리 서버로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. The
상기 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 상기 방송 관리 서버는, 방송 신호 및/또는 방송 관련 정보를 생성하여 송신하는 서버 또는 기 생성된 방송 신호 및/또는 방송 관련 정보를 제공받아 단말기에 송신하는 서버를 의미할 수 있다. 상기 방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다. The broadcast channel may include a satellite channel and a terrestrial channel. The broadcast management server may refer to a server for generating and transmitting broadcast signals and / or broadcast related information, or a server for receiving broadcast signals and / or broadcast related information generated by the broadcast management server and transmitting the generated broadcast signals and / or broadcast related information. The broadcast signal may include a TV broadcast signal, a radio broadcast signal, a data broadcast signal, and a broadcast signal in which a data broadcast signal is combined with a TV broadcast signal or a radio broadcast signal.
상기 방송 관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 상기 방송 관련 정보는, 이동통신망을 통하여도 제공될 수 있다. 이러한 경우에는 상기 이동통신 모듈(112)에 의해 수신될 수 있다.The broadcast-related information may refer to a broadcast channel, a broadcast program, or information related to a broadcast service provider. The broadcast-related information may also be provided through a mobile communication network. In this case, it may be received by the
상기 방송 관련 정보는 다양한 형태로 존재할 수 있다. 예를 들어, DMB(Digital Multimedia Broadcasting)의 EPG(Electronic Program Guide) 또는 DVB-H(Digital Video Broadcast-Handheld)의 ESG(Electronic Service Guide) 등의 형태로 존재할 수 있다.The broadcast-related information may exist in various forms. For example, an EPG (Electronic Program Guide) of DMB (Digital Multimedia Broadcasting) or an ESG (Electronic Service Guide) of Digital Video Broadcast-Handheld (DVB-H).
상기 방송 수신 모듈(111)은, 예를 들어, DMB-T(Digital Multimedia Broadcasting-Terrestrial), DMB-S(Digital Multimedia Broadcasting-Satellite), MediaFLO(Media Forward Link Only), DVB-H(Digital Video Broadcast-Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등의 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 물론, 상기 방송 수신 모듈(111)은, 상술한 디지털 방송 시스템뿐만 아니라 다른 방송 시스템에 적합하도록 구성될 수도 있다.For example, the
방송 수신 모듈(111)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는 메모리(160)에 저장될 수 있다.The broadcast signal and / or broadcast related information received through the
이동통신 모듈(112)은, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 상기 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다. The
무선 인터넷 모듈(113)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 이동 단말기(100)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다. The
근거리 통신 모듈(114)은 근거리 통신을 위한 모듈을 말한다. 근거리 통신(short range communication) 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), ZigBee 등이 이용될 수 있다.The short-
위치정보 모듈(115)은 이동 단말기의 위치를 획득하기 위한 모듈로서, 그의 대표적인 예로는 GPS(Global Position System) 모듈이 있다.The
도1을 참조하면, A/V(Audio/Video) 입력부(120)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(121)와 마이크(122) 등이 포함될 수 있다. 카메라(121)는 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(151)에 표시될 수 있다.Referring to FIG. 1, an A / V (Audio / Video)
카메라(121)에서 처리된 화상 프레임은 메모리(160)에 저장되거나 무선 통신부(110)를 통하여 외부로 전송될 수 있다. 카메라(121)는 사용 환경에 따라 2개 이상이 구비될 수도 있다.The image frame processed by the
마이크(122)는 통화모드 또는 녹음모드, 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 처리된 음성 데이터는 통화 모드인 경우 이동통신 모듈(112)을 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(122)에는 외부의 음향 신호를 입력받는 과정에서 발생되는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.The
사용자 입력부(130)는 사용자가 단말기의 동작 제어를 위한 입력 데이터를 발생시킨다. 사용자 입력부(130)는 키 패드(key pad) 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다. The
센싱부(140)는 이동 단말기(100)의 개폐 상태, 이동 단말기(100)의 위치, 사용자 접촉 유무, 이동 단말기의 방위, 이동 단말기의 가속/감속 등과 같이 이동 단말기(100)의 현 상태를 감지하여 이동 단말기(100)의 동작을 제어하기 위한 센싱 신호를 발생시킨다. 예를 들어 이동 단말기(100)가 슬라이드 폰 형태인 경우 슬라이드 폰의 개폐 여부를 센싱할 수 있다. 또한, 전원 공급부(190)의 전원 공급 여부, 인터페이스부(170)의 외부 기기 결합 여부 등을 센싱할 수도 있다. 한편, 상기 센싱부(140)는 근접 센서(141)를 포함할 수 있다. The
출력부(150)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 이에는 디스플레이부(151), 음향 출력 모듈(152), 알람부(153), 및 햅틱 모듈(154) 등이 포함될 수 있다.The
디스플레이부(151)는 이동 단말기(100)에서 처리되는 정보를 표시(출력)한다. 예를 들어, 이동 단말기가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 이동 단말기(100)가 화상 통화 모드 또는 촬영 모드인 경우에는 촬영 또는/및 수신된 영상 또는 UI, GUI를 표시한다. The
디스플레이부(151)는 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 중에서 적어도 하나를 포함할 수 있다. The
이들 중 일부 디스플레이는 그를 통해 외부를 볼 수 있도록 투명형 또는 광투과형으로 구성될 수 있다. 이는 투명 디스플레이라 호칭될 수 있는데, 상기 투명 디스플레이의 대표적인 예로는 TOLED(Transparant OLED) 등이 있다. 디스플레이부(151)의 후방 구조 또한 광 투과형 구조로 구성될 수 있다. 이러한 구조에 의하여, 사용자는 단말기 바디의 디스플레이부(151)가 차지하는 영역을 통해 단말기 바디의 후방에 위치한 사물을 볼 수 있다.Some of these displays may be transparent or light transmissive so that they can be seen through. This can be referred to as a transparent display, and a typical example of the transparent display is TOLED (Transparent OLED) and the like. The rear structure of the
이동 단말기(100)의 구현 형태에 따라 디스플레이부(151)이 2개 이상 존재할 수 있다. 예를 들어, 이동 단말기(100)에는 복수의 디스플레이부들이 하나의 면에 이격되거나 일체로 배치될 수 있고, 또한 서로 다른 면에 각각 배치될 수도 있다. There may be two or
디스플레이부(151)와 터치 동작을 감지하는 센서(이하, '터치 센서'라 함)가 상호 레이어 구조를 이루는 경우(이하, '터치 스크린'이라 함)에, 디스플레이부(151)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 터치 센서는, 예를 들어, 터치 필름, 터치 시트, 터치 패드 등의 형태를 가질 수 있다.(Hereinafter, referred to as a 'touch screen') in which a
터치 센서는 디스플레이부(151)의 특정 부위에 가해진 압력 또는 디스플레이부(151)의 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력신호로 변환하도록 구성될 수 있다. 터치 센서는 터치 되는 위치 및 면적뿐만 아니라, 터치 시의 압력까지도 검출할 수 있도록 구성될 수 있다. The touch sensor may be configured to convert a change in a pressure applied to a specific portion of the
터치 센서에 대한 터치 입력이 있는 경우, 그에 대응하는 신호(들)는 터치 제어기로 보내진다. 터치 제어기는 그 신호(들)를 처리한 다음 대응하는 데이터를 제어부(180)로 전송한다. 이로써, 제어부(180)는 디스플레이부(151)의 어느 영역이 터치 되었는지 여부 등을 알 수 있게 된다.If there is a touch input to the touch sensor, the corresponding signal (s) is sent to the touch controller. The touch controller processes the signal (s) and transmits the corresponding data to the
도1을 참조하면, 상기 터치스크린에 의해 감싸지는 이동 단말기의 내부 영역 또는 상기 터치 스크린의 근처에 근접 센서(141)가 배치될 수 있다. 상기 근접 센서는 소정의 검출면에 접근하는 물체, 혹은 근방에 존재하는 물체의 유무를 전자계의 힘 또는 적외선을 이용하여 기계적 접촉이 없이 검출하는 센서를 말한다. 근접 센서는 접촉식 센서보다는 그 수명이 길며 그 활용도 또한 높다. Referring to FIG. 1, a
상기 근접 센서의 예로는 투과형 광전 센서, 직접 반사형 광전 센서, 미러 반사형 광전 센서, 고주파 발진형 근접 센서, 정전용량형 근접 센서, 자기형 근접 센서, 적외선 근접 센서 등이 있다. 상기 터치스크린이 정전식인 경우에는 상기 포인터의 근접에 따른 전계의 변화로 상기 포인터의 근접을 검출하도록 구성된다. 이 경우 상기 터치 스크린(터치 센서)은 근접 센서로 분류될 수도 있다.Examples of the proximity sensor include a transmission type photoelectric sensor, a direct reflection type photoelectric sensor, a mirror reflection type photoelectric sensor, a high frequency oscillation type proximity sensor, a capacitive proximity sensor, a magnetic proximity sensor, and an infrared proximity sensor. And to detect the proximity of the pointer by the change of the electric field along the proximity of the pointer when the touch screen is electrostatic. In this case, the touch screen (touch sensor) may be classified as a proximity sensor.
이하에서는 설명의 편의를 위해, 상기 터치스크린 상에 포인터가 접촉되지 않으면서 근접되어 상기 포인터가 상기 터치스크린 상에 위치함이 인식되도록 하는 행위를 "근접 터치(proximity touch)"라고 칭하고, 상기 터치스크린 상에 포인터가 실제로 접촉되는 행위를 "접촉 터치(contact touch)"라고 칭한다. 상기 터치스크린 상에서 포인터로 근접 터치가 되는 위치라 함은, 상기 포인터가 근접 터치될 때 상기 포인터가 상기 터치스크린에 대해 수직으로 대응되는 위치를 의미한다.Hereinafter, for convenience of explanation, the act of recognizing that the pointer is positioned on the touch screen while the pointer is not in contact with the touch screen is referred to as "proximity touch & The act of actually touching the pointer on the screen is called "contact touch. &Quot; The position where the pointer is proximately touched on the touch screen means a position where the pointer is vertically corresponding to the touch screen when the pointer is touched.
상기 근접센서는, 근접 터치와, 근접 터치 패턴(예를 들어, 근접 터치 거리, 근접 터치 방향, 근접 터치 속도, 근접 터치 시간, 근접 터치 위치, 근접 터치 이동 상태 등)을 감지한다. 상기 감지된 근접 터치 동작 및 근접 터치 패턴에 상응하는 정보는 터치 스크린상에 출력될 수 있다. The proximity sensor detects a proximity touch and a proximity touch pattern (e.g., a proximity touch distance, a proximity touch direction, a proximity touch speed, a proximity touch time, a proximity touch position, a proximity touch movement state, and the like). Information corresponding to the detected proximity touch operation and the proximity touch pattern may be output on the touch screen.
음향 출력 모듈(152)은 호신호 수신, 통화모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리(160)에 저장된 오디오 데이터를 출력할 수 있다. 음향 출력 모듈(152)은 이동 단말기(100)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력하기도 한다. 이러한 음향 출력 모듈(152)에는 리시버(Receiver), 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.The
알람부(153)는 이동 단말기(100)의 이벤트 발생을 알리기 위한 신호를 출력 한다. 이동 단말기에서 발생 되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 터치 입력 등이 있다. 알람부(153)는 비디오 신호나 오디오 신호 이외에 다른 형태, 예를 들어 진동으로 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 상기 비디오 신호나 오디오 신호는 디스플레이부(151)나 음성 출력 모듈(152)을 통해서도 출력될 수 있어서, 그들(151,152)은 알람부(153)의 일부로 분류될 수도 있다.The
햅틱 모듈(haptic module)(154)은 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(154)이 발생시키는 촉각 효과의 대표적인 예로는 진동이 있다. 햅택 모듈(154)이 발생하는 진동의 세기와 패턴 등은 제어가능하다. 예를 들어, 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다. The
햅틱 모듈(154)은, 진동 외에도, 접촉 피부면에 대해 수직 운동하는 핀 배열, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력, 피부 표면에 대한 스침, 전극(eletrode)의 접촉, 정전기력 등의 자극에 의한 효과와, 흡열이나 발열 가능한 소자를 이용한 냉온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다. In addition to the vibration, the
햅틱 모듈(154)은 직접적인 접촉을 통해 촉각 효과의 전달할 수 있을 뿐만 아니라, 사용자가 손가락이나 팔 등의 근 감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(154)은 휴대 단말기(100)의 구성 태양에 따라 2개 이상이 구비될 수 있다.The
메모리(160)는 제어부(180)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리(160)는 상기 터치스크린 상의 터치 입력시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.The
메모리(160)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 이동 단말기(100)는 인터넷(internet)상에서 상기 메모리(160)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다.The
인터페이스부(170)는 이동 단말기(100)에 연결되는 모든 외부기기와의 통로 역할을 한다. 인터페이스부(170)는 외부 기기로부터 데이터를 전송받거나, 전원을 공급받아 이동 단말기(100) 내부의 각 구성 요소에 전달하거나, 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O(Input/Output) 포트, 이어폰 포트 등이 인터페이스부(170)에 포함될 수 있다. The
식별 모듈은 이동 단말기(100)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(User Identify Module, UIM), 가입자 인증 모 듈(Subscriber Identify Module, SIM), 범용 사용자 인증 모듈(Universal Subscriber Identity Module, USIM) 등을 포함할 수 있다. 식별 모듈이 구비된 장치(이하 '식별 장치')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 장치는 포트를 통하여 단말기(100)와 연결될 수 있다. The identification module is a chip for storing various information for authenticating the usage right of the
상기 인터페이스부는 이동단말기(100)가 외부 크래들(cradle)과 연결될 때 상기 크래들로부터의 전원이 상기 이동단말기(100)에 공급되는 통로가 되거나, 사용자에 의해 상기 크래들에서 입력되는 각종 명령 신호가 상기 이동단말기로 전달되는 통로가 될 수 있다. 상기 크래들로부터 입력되는 각종 명령 신호 또는 상기 전원은 상기 이동단말기가 상기 크래들에 정확히 장착되었음을 인지하기 위한 신호로 동작될 수도 있다.When the
제어부(controller, 180)는 통상적으로 이동 단말기의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 제어부(180)는 멀티 미디어 재생을 위한 멀티미디어 모듈(181)을 구비할 수도 있다. 멀티미디어 모듈(181)은 제어부(180) 내에 구현될 수도 있고, 제어부(180)와 별도로 구현될 수도 있다.The
상기 제어부(180)는 상기 터치스크린 상에서 행해지는 필기 입력 또는 그림 그리기 입력을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식 처리를 행할 수 있다. The
전원 공급부(190)는 제어부(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.The
여기에 설명되는 다양한 실시예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다.The various embodiments described herein may be embodied in a recording medium readable by a computer or similar device using, for example, software, hardware, or a combination thereof.
하드웨어적인 구현에 의하면, 여기에 설명되는 실시예는 ASICs (application specific integrated circuits), DSPs (digital signal processors), DSPDs (digital signal processing devices), PLDs (programmable logic devices), FPGAs (field programmable gate arrays, 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시예들이 제어부(180) 자체로 구현될 수 있다.According to a hardware implementation, the embodiments described herein may be implemented as application specific integrated circuits (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices (PLDs), field programmable gate arrays May be implemented using at least one of a processor, controllers, micro-controllers, microprocessors, and other electronic units for performing other functions. In some cases, The embodiments described may be implemented by the
소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다. 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션으로 소프트웨어 코드가 구현될 수 있다. 상기 소프트웨어 코드는 메모리(160)에 저장되고, 제어부(180)에 의해 실행될 수 있다.According to a software implementation, embodiments such as the procedures and functions described herein may be implemented with separate software modules. Each of the software modules may perform one or more of the functions and operations described herein. Software code can be implemented in a software application written in a suitable programming language. The software code is stored in the
도2a는 본 발명과 관련된 이동 단말기 또는 휴대 단말기의 일 예를 전면에서 바라본 사시도이다.2A is a perspective view of an example of a mobile terminal or a mobile terminal according to the present invention.
개시된 휴대 단말기(100)는 바 형태의 단말기 바디를 구비하고 있다. 다만, 본 발명은 여기에 한정되지 않고, 2 이상의 바디들이 상대 이동 가능하게 결합되는 슬라이드 타입, 폴더 타입, 스윙 타입, 스위블 타입 등 다양한 구조에 적용이 가능하다. The disclosed
바디는 외관을 이루는 케이스(케이싱, 하우징, 커버 등)를 포함한다. 본 실시예에서, 케이스는 프론트 케이스(101)와 리어 케이스(102)로 구분될 수 있다. 프론트 케이스(101)와 리어 케이스(102)의 사이에 형성된 공간에는 각종 전자부품들이 내장된다. 프론트 케이스(101)와 리어 케이스(102) 사이에는 적어도 하나의 중간 케이스가 추가로 배치될 수도 있다.The body includes a case (a casing, a housing, a cover, and the like) which forms an appearance. In this embodiment, the case may be divided into a
케이스들은 합성수지를 사출하여 형성되거나 금속 재질, 예를 들어 스테인레스 스틸(STS) 또는 티타늄(Ti) 등과 같은 금속 재질을 갖도록 형성될 수도 있다.The cases may be formed by injection molding a synthetic resin, or may be formed to have a metal material such as stainless steel (STS) or titanium (Ti) or the like.
단말기 바디, 주로 프론트 케이스(101)에는 디스플레이부(151), 음향출력부(152), 카메라(121), 사용자 입력부(130/131,132), 마이크(122), 인터페이스(170) 등이 배치될 수 있다.The
디스플레이부(151)는 프론트 케이스(101)의 주면의 대부분을 차지한다. 디스플레이부(151)의 양단부 중 일 단부에 인접한 영역에는 음향출력부(151)와 카메라(121)가 배치되고, 다른 단부에 인접한 영역에는 사용자 입력부(131)와 마이크(122)가 배치된다. 사용자 입력부(132)와 인터페이스(170) 등은 프론트 케이스(101) 및 리어 케이스(102)의 측면들에 배치될 수 있다.The
사용자 입력부(130)는 휴대 단말기(100)의 동작을 제어하기 위한 명령을 입력받기 위해 조작되는 것으로서, 복수의 조작 유닛들(131,132)을 포함할 수 있다. 조작 유닛들(131,132)은 조작부(manipulating portion)로도 통칭 될 수 있으며, 사용자가 촉각 적인 느낌을 가면서 조작하게 되는 방식(tactile manner)이라면 어떤 방식이든 채용될 수 있다.The
제1 또는 제2조작 유닛들(131, 132)에 의하여 입력되는 내용은 다양하게 설정될 수 있다. 예를 들어, 제1 조작 유닛(131)은 시작, 종료, 스크롤 등과 같은 명령을 입력받고, 제2 조작 유닛(132)은 음향출력부(152)에서 출력되는 음향의 크기 조절 또는 디스플레이부(151)의 터치 인식 모드로의 전환 등과 같은 명령을 입력받을 수 있다.The contents inputted by the first or
도2b는 도2a에 도시된 휴대 단말기의 후면 사시도이다. FIG. 2B is a rear perspective view of the portable terminal shown in FIG. 2A.
도2b를 참조하면, 단말기 바디의 후면, 다시 말해서 리어 케이스(102)에는 카메라(121')가 추가로 장착될 수 있다. 카메라(121')는 카메라(121, 도 2a 참조)와 실질적으로 반대되는 촬영 방향을 가지며, 카메라(121)와 서로 다른 화소를 가지는 카메라일 수 있다. Referring to FIG. 2B, a camera 121 'may be further mounted on the rear surface of the terminal body, that is, the
예를 들어, 카메라(121)는 화상 통화 등의 경우에 사용자의 얼굴을 촬영하여 상대방에 전송함에 무리가 없도록 저 화소를 가지며, 카메라(121')는 일반적인 피사체를 촬영하고 바로 전송하지는 않는 경우가 많기에 고 화소를 가지는 것이 바람직하다. 카메라(121,121')는 회전 또는 팝업(pop-up) 가능하게 단말기 바디에 설치될 수도 있다.For example, the
카메라(121')에 인접하게는 플래쉬(123)와 거울(124)이 추가로 배치된다. 플래쉬(123)는 카메라(121')로 피사체를 촬영하는 경우에 피사체를 향해 빛을 비추게 된다. 거울(124)은 사용자가 카메라(121')를 이용하여 자신을 촬영(셀프 촬영)하고자 하는 경우에, 사용자 자신의 얼굴 등을 비춰볼 수 있게 한다.A
단말기 바디의 후면에는 음향 출력부(152')가 추가로 배치될 수도 있다. 음향 출력부(152')는 음향 출력부(152, 도 2a 참조)와 함께 스테레오 기능을 구현할 수 있으며, 통화시 스피커폰 모드의 구현을 위하여 사용될 수도 있다.An acoustic output 152 'may be additionally disposed on the rear surface of the terminal body. The sound output unit 152 'may implement the stereo function together with the sound output unit 152 (see FIG. 2A), and may be used for the implementation of the speakerphone mode during a call.
단말기 바디의 측면에는 통화 등을 위한 안테나 외에 방송신호 수신용 안테나(116)가 추가적으로 배치될 수 있다. 방송수신모듈(111, 도 1 참조)의 일부를 이루는 안테나(116)는 단말기 바디에서 인출 가능하게 설치될 수 있다.In addition to the antenna for talking and the like, a broadcast
단말기 바디에는 휴대 단말기(100)에 전원을 공급하기 위한 전원공급부(190)가 장착된다. 전원공급부(190)는 단말기 바디에 내장되거나, 단말기 바디의 외부에서 직접 탈착될 수 있게 구성될 수 있다.A
리어 케이스(102)에는 터치를 감지하기 위한 터치 패드(135)가 추가로 장착될 수 있다. 터치 패드(135) 또한 디스플레이부(151)와 마찬가지로 광 투과형으로 구성될 수 있다. 이 경우에, 디스플레이부(151)가 양면에서 시각 정보를 출력하도록 구성된다면, 터치 패드(135)를 통해서도 상기 시각 정보를 인지할 수 있게 된다. 상기 양면에 출력되는 정보는 상기 터치 패드(135)에 의해 모두 제어될 수도 있다. 이와 달리, 터치 패드(135)에는 디스플레이가 추가로 장착되어, 리어 케이스(102)에도 터치 스크린이 배치될 수도 있다.The
터치 패드(135)는 프론트 케이스(101)의 디스플레이부(151)와 상호 관련되어 작동한다. 터치 패드(135)는 디스플레이부(151)의 후방에 평행하게 배치될 수 있 다. 이러한 터치 패드(135)는 디스플레이부(151)와 동일하거나 작은 크기를 가질 수 있다.The
이하, 도3a 및 3b를 참조하여 디스플레이부(151)와 터치 패드(135)의 서로 연관된 작동 방식에 대하여 살펴본다.Hereinafter, a related operation of the
도3a 및 3b는 본 발명과 관련된 휴대 단말기의 일 작동 상태를 설명하기 위한 휴대 단말기의 정면도들이다.3A and 3B are front views of a portable terminal for explaining an operation state of the portable terminal according to the present invention.
디스플레이부(151)에는 다양한 종류의 시각 정보들이 표시될 수 있다. 이들 정보들은 문자, 숫자, 기호, 그래픽, 또는 아이콘 등의 형태로 표시될 수 있다.Various types of time information can be displayed on the
이러한 정보의 입력을 위하여 상기 문자, 숫자, 기호, 그래픽 또는 아이콘 들 중 적어도 하나는 일정한 배열을 이루어 표시됨으로써 키패드의 형태로 구현될 수 있다. 이러한 키패드는 소위 '소프트키'라 불릴 수 있다. At least one of the letters, numbers, symbols, graphics, or icons may be displayed in a predetermined arrangement for inputting such information, thereby being implemented as a keypad. Such a keypad may be called a so-called " soft key ".
도3a는 단말기 바디의 전면을 통해 소프트키에 가해진 터치를 입력받는 것을 나타내고 있다. FIG. 3A shows a touch input to a soft key through a front surface of a terminal body.
디스플레이부(151)는 전체 영역으로 작동되거나, 복수의 영역들로 나뉘어져 작동될 수 있다. 후자의 경우, 상기 복수의 영역들은 서로 연관되게 작동되도록 구성될 수 있다.The
예를 들어, 디스플레이부(151)의 상부와 하부에는 출력창(151a)과 입력창(151b)이 각각 표시된다. 출력창(151a)과 입력창(151b)은 각각 정보의 출력 또는 입력을 위해 할당되는 영역이다. 입력창(151b)에는 전화 번호 등의 입력을 위한 숫자가 표시된 소프트키(151c)가 출력된다. 소프트키(151c)가 터치되면, 터치된 소프 트키에 대응되는 숫자 등이 출력창(151a)에 표시된다. 제1조작 유닛(131)이 조작되면 출력창(151a)에 표시된 전화번호에 대한 호 연결이 시도된다.For example, an
도3b는 단말기 바디의 후면을 통하여 소프트키에 가해진 터치를 입력받는 것을 나타낸다. 도 3a가 단말기 바디를 세로로 배치시킨 경우(portrait)라면, 도 3b는 단말기 바디를 가로로 배치시킨 경우(landscape)를 나타낸다. 디스플레이부(151)는 단말기 바디의 배치 방향에 따라 출력 화면이 변환되도록 구성될 수 있다.FIG. 3B shows the input of a touch applied to the soft key through the rear surface of the terminal body. FIG. 3A shows a case where the terminal body is vertically arranged, and FIG. 3B shows a case where the terminal body is arranged horizontally. The
도3b는 휴대 단말기에서 텍스트 입력 모드가 작동되는 것을 나타낸다. 디스플레이부(151)에는 출력창(151a')과 입력창(151b')이 표시된다. 입력창(151b')에는 문자, 기호, 숫자들 중 적어도 하나가 표시된 소프트키(151c')들이 복수로 배열될 수 있다. 소프트키(151c')들은 쿼티(QWERTY)키의 형태로 배열될 수 있다.3B shows that the text input mode is activated in the portable terminal. The
터치 패드(135, 도 2b 참조)를 통하여 소프트키(151c')들이 터치 되면, 터치된 소프트키에 대응되는 문자, 숫자, 기호 등이 출력창(151a')에 표시되게 된다. 이와 같이, 터치 패드(135)를 통한 터치 입력은 디스플레이부(151)을 통한 터치 입력에 비하여 터치시 소프트키(151c')가 손가락에 의해 가려지는 것을 방지할 수 있는 이점이 있다. 디스플레이부(151)와 터치 패드(135)가 투명하게 형성되는 경우에는, 단말기 바디의 후면에 위치한 손가락들을 육안으로 확인할 수 있으므로, 보다 정확한 터치 입력이 가능하다.When the
이상의 실시예들에 개시된 입력 방식뿐만 아니라, 디스플레이부(151) 또는 터치 패드(135)는 스크롤(scroll)에 의해 터치 입력받도록 구성될 수 있다. 사용자 는 디스플레이부(151) 또는 터치 패드(135)를 스크롤 함으로써 디스플레이부(151)에 표시된 개체, 예를 들어 아이콘 등에 위치한 커서 또는 포인터를 이동시킬 수 있다. 나아가, 손가락을 디스플레이부(151) 또는 터치 패드(135) 상에서 이동시키는 경우, 손가락이 움직이는 경로가 디스플레이부(151)에 시각적으로 표시될 수도 있다. 이는 디스플레이부(151)에 표시되는 이미지를 편집함에 유용할 것이다.The
디스플레이부(151)(터치 스크린) 및 터치 패드(135)가 일정 시간 범위 내에서 함께 터치되는 경우에 대응하여, 단말기의 일 기능이 실행될 수도 있다. 함께 터치되는 경우로는, 사용자가 엄지 및 검지를 이용하여 단말기 바디를 집는(clamping) 경우가 있을 수 있다. 상기 일 기능은, 예를 들어, 디스플레이부(151) 또는 터치 패드(135)에 대한 활성화 또는 비활성화 등이 있을 수 있다.One function of the terminal may be executed in response to a case where the display unit 151 (touch screen) and the
도1을 참조하여 설명한 근접 센서(141)에 대하여, 도4를 참조하면서 보다 구체적으로 살펴본다.The
도4는 근접 센서의 근접 깊이를 설명하기 위한 개념도이다.4 is a conceptual diagram for explaining the proximity depth of the proximity sensor.
도4에 도시한 바와 같이 사용자의 손가락, 펜 등과 같은 포인터가 상기 터치스크린에 근접하는 경우, 상기 터치스크린 내부 또는 근방에 배치된 상기 근접센서(141)가 이를 감지하여 근접신호를 출력한다. As shown in FIG. 4, when a pointer such as a user's finger, a pen, or the like approaches the touch screen, the
상기 근접 센서(141)는 상기 근접 터치되는 포인터와 상기 터치스크린 간의 거리(이하 "근접 깊이"라고 함)에 따라 서로 다른 근접 신호를 출력하도록 구성될 수 있다. The
도4에서는 예컨대 3개의 근접 깊이를 감지할 수 있는 근접 센서가 배치된 터 치스크린의 단면이 예시되고 있다. 3개 미만 또는 4개 이상의 근접 깊이를 감지하는 근접 센서도 가능함은 물론이다.In Fig. 4, for example, a cross section of a touch screen on which a proximity sensor capable of sensing three proximity depths is disposed is illustrated. Of course, proximity sensors that detect less than three or more than four proximity depths are also possible.
구체적으로 살펴보면, 상기 포인터가 상기 터치스크린 상에 완전히 접촉되는 경우(d0)에는 접촉 터치로 인식된다. 상기 포인터가 상기 터치스크린 상에서 d1 거리 미만으로 이격되어 위치하는 경우에는 제 1 근접 깊이의 근접 터치로 인식된다. 상기 포인터가 상기 터치스크린 상에서 d1 거리 이상 d2 거리 미만으로 이격되어 위치하는 경우에는 제 2 근접 깊이의 근접 터치로 인식된다. 상기 포인터가 상기 터치스크린 상에서 d2 거리 이상 d3 거리 미만으로 이격되어 위치하는 경우에는 제 3 근접 깊이의 근접 터치로 인식된다. 상기 포인터가 상기 터치스크린 상에서 d3 거리 이상으로 이격되어 위치하는 경우에는 근접 터치가 해제된 것으로 인식된다.Specifically, when the pointer is completely in contact with the touch screen (d0), it is recognized as a contact touch. If the pointer is located on the touch screen at a distance less than the distance d1, it is recognized as a proximity touch of the first proximity depth. If the pointer is located on the touch screen at a distance d1 or less and less than the distance d2, the pointer is recognized as a proximity touch of the second proximity depth. If the pointer is located on the touch screen at a distance d2 or more and less than the distance d3, it is recognized as a proximity touch of the third proximity depth. If the pointer is located at a distance d3 or more on the touch screen, it is recognized that the proximity touch is released.
따라서, 상기 제어부(180)는 상기 포인터의 근접 깊이 및 근접 위치 등에 따라 상기 근접 터치를 다양한 입력 신호로 인식할 수 있고, 상기 다양한 입력 신호에 따른 다양한 동작 제어를 수행할 수 있다. Accordingly, the
본 발명에 관련된 이동 단말기에는 음성인식을 위한 알고리즘과 STT(Speech To Text)를 위한 알고리즘이 메모리(160)에 저장되어 있으며, 이동 단말기에 구비된 임의의 기능 및 상기 음성인식 기능과 STT 기능을 연계하여 사용자가 입력하는 음성을 텍스트로 변환할 수 있다. 그리고, 상기 변환된 텍스트를 상기 기능의 실행 화면에 출력할 수 있다. 여기서, 상기 특정 기능은 텍스트 메시지나 메일과 같이 텍스트를 작성하는 기능을 포함하고, 상기 텍스트 메시지나 메일 작성 기능이 실행 됨에 따라, 제어부(180)는 음성인식 기능의 활성화 및 STT 기능을 자동으로 작동시킬 수 있다.In the mobile terminal according to the present invention, an algorithm for speech recognition and an algorithm for STT (Speech To Text) are stored in the
도5는 본 발명에 관련된 이동 단말기의 음성명령을 이용한 메뉴 제어방법을 설명하는 일 예의 흐름도이다. 도1이 다음의 설명을 위해 또한 언급될 것이다. 도 5를 참조하면, 상기 제어부(180)는 상기 음성인식 기능이 활성화되었는지의 여부를 판단한다(S101). 5 is a flowchart illustrating an example of a menu control method using voice commands of a mobile terminal according to an embodiment of the present invention. Figure 1 will also be referred to for the following discussion. Referring to FIG. 5, the
상기 음성인식기능은 사용자가 상기 이동 단말기에 구비된 특정 하드웨어 버튼, 또는 상기 디스플레이 모듈(151)에 표시된 소프트웨어 버튼을 선택하거나, 또는 상기 디스플레이 모듈(151)에 표시된 특정 메뉴의 조작에 의해 활성화될 수 있다. 또는, 특정 사운드나 음향, 근거리나 원거리의 무선신호, 또는 사용자의 손짓이나 몸짓(Gesture)을 포함한 신체의 동작 정보에 의해서도 활성화될 수 있다.The voice recognition function can be activated by a user by selecting a specific hardware button provided on the mobile terminal or a software button displayed on the
상기 특정 사운드나 음향은 특정레벨 이상을 갖는 일종의 충격음을 포함할 수 있다. 상기 특정레벨 이상의 사운드나 음향은 간단한 음향레벨 검출 알고리즘을 이용해서 검출할 수 있다. The specific sound or sound may include a kind of impact sound having a specific level or more. Sounds or sounds above the specified level can be detected using a simple sound level detection algorithm.
상기 음향레벨 검출 알고리즘은 음성인식 알고리즘보다 상대적으로 간단하며 이에 따라, 상기 이동 단말기의 자원을 적게 소모할 수 있다. 상기 음향레벨 검출 알고리즘(또는 회로)은 음성인식 알고리즘(또는 회로)과 별도로 구성할 수 있고, 음성인식 알고리즘의 일부 기능을 제한하는 방식으로 구현할 수도 있다.The sound level detection algorithm is relatively simpler than the speech recognition algorithm and thus can consume less resources of the mobile terminal. The sound level detection algorithm (or circuit) may be configured separately from the speech recognition algorithm (or circuit), or may be implemented in a manner that restricts some functions of the speech recognition algorithm.
상기 무선신호는 상기 무선 통신부(110)를 통해 수신될 수 있으며, 상기 사용자의 손짓이나 몸짓은 상기 센싱부(140)를 통해 수신될 수 있다. 본 발명의 일 실시 예에 있어서, 상기 무선 통신부(110), 상기 사용자 입력부(130), 및 상기 센싱부(140)를 통칭하여 신호 입력부라고 할 수 있다.상기 음성인식기능은 또한 유사한 방법으로 종료될 수 있다. The wireless signal may be received through the
상기 사용자의 상기 음성인식기능에 대한 활성화는, 자신이 상기 이동 단말기를 제어하기 위한 음성명령어를 사용하려 한다는 것을 잘 알 수 있기 해 주기 때문에 유리하다. 즉, 상기 사용자는 처음에 상기 이동 단말기의 물리적 조작을 수행하고, 상기 이동 단말기 내에 음성명령어 또는 지시어를 입력하려고 한다는 것을 직감으로 인식하기 때문에, 보다 명확히 또는 느리게 말함으로써 특정기능을 활성화시킨다. 상기 사용자가 보다 느리게 또는 보다 명확히 말함으로써, 상기 음성명령어를 정확히 인식할 수 있는 가능성이 높아진다. 즉, 본 발명의 일 실시 예에 있어서, 상기 음성인식기능은 상기 이동 단말기 내부로 말을 하여 활성화되는 것이 아니라, 상기 이동 단말기 상의 버튼을 조작함으로써 활성화된다.The activation of the voice recognition function of the user is advantageous because it allows the user to know that he or she intends to use voice commands for controlling the mobile terminal. That is, the user first recognizes that he / she intends to perform a physical operation of the mobile terminal and input a voice command or an instruction into the mobile terminal, and thus activates a specific function by saying more clearly or slowly. The user speaks more slowly or more clearly, thereby increasing the likelihood of correctly recognizing the voice command. That is, in one embodiment of the present invention, the voice recognition function is not activated by speaking into the mobile terminal but is activated by operating a button on the mobile terminal.
상기 제어부(180)는 상기 사용자가 특정버튼 또는 상기 터치스크린의 일부를 터치한 횟수, 및 상기 사용자가 상기 터치스크린의 일부 또는 특정버튼을 터치한 시간에 근거하여, 상기 음성인식기능의 활성화를 시작하거나 종료할 수 있다. 상기 사용자는 또한 상기 제어부(180)가 본 발명에 의해 제공되는 적절한 메뉴 옵션을 이용하여 상기 음성인식기능을 활성화시키는 방법을 설정할 수 있다. 예를 들어, 상기 사용자는 (1)상기 음성활성화 버튼이 선택된 횟수(X)에 기초한 음성인식활성화 설정, (2)상기 음성활성화 버튼이 선택된 시간(X)에 기초한 음성인식활성화 설정, (3) 상기 버튼들(X, Y)가 선택될 때의 음성인식활성화 설정, 등을 포함하는 상기 이동 단말 상의 메뉴 옵션을 선택할 수 있다. 이후, 상기 사용자는 상기 제어부(180)가 상기 음성활성화기능이 활성화되었다고 판단하는 방법을 가변 설정하기 위해 상기 X 및 Y값들을 입력할 수 있다. 즉, 본 발명의 일 실시 예에 따르면, 상기 사용자는 자신의 이동 단말기의 상기 음성활성화 기능과 활발히 연계하여, 상기 제어부(180)가 상기 사용자의 음성명령어에 해당하는 정확한 기능을 판단할 수 있는 가능성을 높여준다. 이로 인하여 상기 사용자는 그의 필요에 따라 상기 음성활성화기능을 조절할 수 있다. The
상기 제어부(180)는 상기 설정된 버튼(들)이 터치되거나 선택되면, 상기 음성인식기능의 활성화 상태를 유지시키고, 상기 설정된 버튼(들)이 해제되면 상기 음성인식기능을 정지시킬 수 있다. 또한, 상기 제어부(180)는 상기 설정된 버튼(들)이 터치되거나 선택된 후 소정의 시간동안 상기 음성인식기능의 활성화를 유지시킬 수 있고, 상기 소정의 시간이 지나면 상기 음성인식기능을 정지시키거나 종료할 수 있다. 다른 실시 예에 있어서, 상기 제어부(180)는 상기 음성인식기능이 상기 활성화 상태에서 유지되는 동안, 상기 메모리(160) 내에 수신된 음성명령어들을 저장할 수 있다.The
도5에서, 상기 음성명령의 의미를 인식하기 위해 참조하는 데이터베이스의 영역은 상기 이동 단말기 상의 특정 기능이나 메뉴에 관련된 영역으로 특정될 수 있다(S102). 예를 들어, 상기 특정되는 영역(domain)은 현재 상기 디스플레이부(151)에 출력된 메뉴들이나 그 메뉴들 중 선택된 특정 메뉴의 서브 메뉴들에 관련된 영역으로 특정될 수 있다. 상기와 같이 음성명령을 인식하기 위해 참조할 데 이터베이스의 영역이 특정됨으로써, 음성명령에 대한 인식률을 더욱 높일 수 있게 된다. 상기 영역의 예로, 전자메일 영역, 수신된 호 영역, 및 멀티미디어 영역, 등을 들 수 있다.In FIG. 5, the area of the database referred to in order to recognize the meaning of the voice command may be specified as an area related to a specific function or menu on the mobile terminal (S102). For example, the specified domain may be specified as an area related to menus output to the
상기 서브 메뉴들에 관련된 정보들은 데이터베이스로 구성될 수 있다.상기 정보들은 키 워드 형태일 수 있으며, 한가지 기능이나 메뉴에 대하여 복수의 정보가 대응될 수 있다. 또한, 상기 데이터베이스는 정보의 특성에 따라 복수로 구성될 수 있으며, 상기 메모리(160)에 저장될 수 있다. The information related to the submenus may be a database. The information may be in the form of a key word, and a plurality of information may correspond to one function or menu. In addition, the database may be composed of a plurality of databases according to the characteristics of information, and may be stored in the
또한, 상기 각 데이터베이스에 구성된 정보들은 학습을 통해 갱신될 수 있다. 또한, 상기 각 데이터베이스의 영역은 음성명령의 인식률 향상을 위하여, 현재 출력되고 있는 기능이나 메뉴들에 관련된 영역으로 특정될 수 있다. 또한, 상기 영역은 메뉴의 단계가 깊어짐에 따라 변경될 수 있다.In addition, the information configured in each database may be updated through learning. In addition, the area of each database may be specified as an area related to a currently displayed function or menu in order to improve the recognition rate of a voice command. Also, the area may be changed as the steps of the menu become deeper.
일단 상기 음성인식기능이 활성화되고 (S101에서의 Yes) 상기 영역이 특정화되면(S102), 상기 제어부(180)는 상기 사용자가 음성명령어를 입력했는지 판단한다(S103). 상기 제어부(108)가 상기 사용자가 음성명령어를 입력했다고 판단하면 (S103에서의 Yes), 상기 제어부(108)는 특정 데이터베이스에 기초하여 상기 마이크(122)를 통해 입력된 음성명령어 또는 지시어의 문맥 및 내용을 분석하여, 상기 음성명령어의 의미를 판단한다(S104).Once the voice recognition function is activated (Yes in S101) and the area is specified (S102), the
상기 제어부(108)는 상기 접속된 영역의 언어 유형 및 음향 유형에 기초하여 상기 음성지시어 또는 명령어의 의미를 판단할 수 있다. 구체적으로, 상기 언어 유형은 단어 자체와 관련되고, 상기 음향유형은 상기 단어가 발화된 방법에 대응한 다 (예를 들어, 발화된 단어 또는 구의 주파수 성분). 상기 언어 및 음향 유형들을 상기 이동 단말기(100)의 특정 영역 및 상태와 함께 이용함으로써, 상기 제어부(108)는 상기 입력된 음성명령어 또는 지시어의 의미를 효과적으로 판단할 수 있다.The control unit 108 may determine the meaning of the voice directive or the command based on the language type and the acoustic type of the connected area. Specifically, the language type is associated with the word itself, and the acoustic type corresponds to the way the word was uttered (e.g., the frequency component of a uttered word or phrase). By using the language and sound types together with the specific area and state of the
상기 제어부(108)는 상기 음성명령의 의미판단을 상기 입력된 음성명령을 임시 저장해두었다가 음성인식 기능의 활성화가 종료되면 곧바로 시작하거나, 음성인식 기능의 활성화 상태에서 음성명령이 입력됨과 동시에 수행할 수 있다. The control unit 108 temporarily saves the input voice command and can start the voice recognition function immediately after the activation of the voice recognition function is completed or can be performed simultaneously with the voice command being input in the activated state of the voice recognition function have.
한편, 상기 음성명령어가 완전히 입력되지 않았을 경우(S103의 아니오), 상기 제어부(180)는 다른 기능을 여전히 수행할 수 있다. 예를 들어, 상기 사용자가 메뉴 옵션들을 터치함으로써 다른 기능을 수행하거나, 상기 이동 단말기 상의 버튼을 누를 경우(S109의 예), 상기 제어부(180)는 해당 선택된 기능을 수행한다(S110).On the other hand, if the voice command is not completely input (NO in S103), the
상기 제어부(180)는 상기 음성명령의 의미가 판단되면(S104) 그 결과값을 출력할 수 있다(S105). 상기 결과값은 상기 음성명령의 의미에 대응하는 기능이나 서비스에 관련된 메뉴를 실행시키거나, 단말기의 특정 구성요소를 제어하기 위한 제어신호, 또는 상기 인식된 음성명령에 관련된 정보를 표시하기 위한 데이터를 포함할 수 있다.If the meaning of the voice command is determined (S104), the
한편, 상기 제어부(180)는 상기 결과값을 출력하거나 실행할 때, 그 결과값이 정확한지 여부에 대하여 사용자의 확인을 받을 수 있다(S106). 예를 들어, 상기 제어부(180)는 상기 음성명령의 인식률이 낮거나 복수의 의미로 인식될 경우, 각 의미에 관련된 복수의 메뉴들을 출력한 후, 사용자의 선택을 받아 실행할 수 있다(S107). 또는 단순히 인식률이 높은 특정 메뉴의 실행 여부를 묻고, 사용자의 선택이나 응답을 받아 해당하는 기능이나 메뉴를 실행하거나 표시할 수 있다. Meanwhile, when the result is output or executed, the
상기 제어부(180)는 상기 특정 메뉴에 대한 실행 여부를 메시지나 음성을 출력하여 사용자에게 확인할 수 있다(예: 텍스트 메시지 작성 기능을 실행할까요? 예/아니오 로 응답해 주세요). 상기 제어부(180)는 사용자의 응답에 따라 특정 메뉴 혹은 옵션에 해당하는 기능을 실행하거나 실행하지 않는다. 사용자가 특정 시간주기(예를 들어, 5초) 내에 응답하지 않으면, 제어부(180)는 또한 상기 특정 메뉴 혹은 옵션을 즉시 실행할 수 있다. 즉, 제어부(180)는 사용자로부터 응답이 없을 경우 응답 없음을 긍정적인 응답으로 판단하여 자동으로 상기 기능 혹은 메뉴를 실행할 수 있다. The
즉, 음성명령 입력을 재 수신하거나 소정 레벨 이상의 인식률을 갖는 다수의 메뉴 혹은 비슷한 의미를 갖는 것으로 판단될 수 있는 다수의 메뉴들을 표시하여 에러 처리 과정을 수행할 수 있다. 사용자는 상기 다수의 메뉴 중 하나를 선택한다. 또한, 상기 제어부(180)는 소정 레벨 이상의 인식률을 갖는 기능 혹은 메뉴의 개수가 기설정된 개수(예를 들어, 2개)보다 적을 경우 해당 기능 혹은 메뉴를 자동적으로 실행할 수 있다. That is, it is possible to re-receive a voice command input or display a plurality of menus having a recognition rate of a predetermined level or higher or a plurality of menus that can be judged to have a similar meaning, thereby performing an error processing procedure. The user selects one of the plurality of menus. If the number of functions or menus having a recognition rate higher than a predetermined level is less than a predetermined number (for example, two), the
도6a는 본 발명의 일실시예에 따르는 이동 단말기의 음성인식 기능을 활성화하는 방법을 설명하기 위한 개략도이다. 상기 디스플레이 스크린(410)에 도시 된 바와 같이, 상기 사용자는 소프트 버튼(411)을 터치함으로써 상기 음성인식 기능을 활성화할 수 있다. 상기 사용자는 또한 상기 소프트 버튼(411)을 해제함으로써 상기 음성인식 기능을 종료시킬 수 있다. 보다 구체적으로, 상기 사용자는 상기 소프트 버튼(411)을 터치함으로써 상기 음성인식 기능을 활성화시키고, 상기 음성명령어가 완료될 때까지 상기 소프트 버튼(411) 또는 하드 버튼(412)를 계속 터치할 수 있다. 즉, 상기 사용자는 상기 음성명령어가 완료될 때, 상기 소프트 버튼(411) 또는 하드 버튼(412)을 해제할 수 있다. 따라서, 상기 제어부(180)는 상기 음성명령어가 입력될 시점과 완료된 시점을 알 수 있게 된다. 상술한 바와 같이, 상기 사용자는 이러한 판단을 직접적으로 할 수 있기 때문에, 상기 입력된 음성명령어에 대한 해석의 정확도를 높일 수 있다.6A is a schematic diagram for explaining a method of activating a voice recognition function of a mobile terminal according to an embodiment of the present invention. As shown in the
예를 들어, 상기 제어부(180)는 상기 사용자가 상기 소프트 버튼(411)을 처음 터치하면 상기 음성 활성화의 시작을 인식하고, 이후 상기 사용자가 상기 소프트 버튼(411)을 두 번 터치하면 상기 음성 인식의 완료를 인식할 수 있도록 구성될 수 있다. 다른 선택 방법들이 또한 가능하다. 게다가, 도6a의 상기 디스플레이 스크린(410)에 도시 된 바와 같이, 상기 음성 활성화 및 비활성화는 상기 소프트 버튼(411)을 사용하지 않고, 상기 단말기 상의 하드 버튼(412)을 조작함으로써 수행될 수 있다.For example, when the user touches the
게다가, 상기 디스플레이 스크린(410)에서 보여진 상기 소프트 버튼(411)은 상기 사용자가 상기 음성인식 기능을 활성화/비활성화 하기 위해 누르거나 해제하는 단일 소프트 버튼일 수 있거나, 1. 음성 활성화의 시작, 2. 음성 활성화 정지와 같은 메뉴 리스트를 생성하는 메뉴 버튼일 수 있다. 상기 소프트 버튼(411)은 또한 예를 들어, 대기 상태 동안 표시될 수 있다.In addition, the
다른 예에 있어서, 상기 디스플레이 스크린(420)에 도시 된 바와 같이, 상기 사용자는 상기 스크린의 임의의 위치를 터치함으로써 상기 음성인식 기능을 활성화하고 비활성화할 수 있다. 상기 디스플레이 스크린(430)은 상기 사용자가 특정 레벨 이상의 음향이나 음향효과를 생성함으로써, 상기 음성인식 기능을 활성화하고 비활성화하는 또 다른 예를 보여준다. 예를 들어, 상기 사용자는 충격음을 생성하기 위해 손뼉을 칠 수 있다.In another example, as shown in the
따라서, 본 발명의 일 실시예에 따르면, 상기 음성인식 기능은 두 가지 모드로 구현될 수 있다. 예를 들어, 상기 음성인식 기능은 일정 레벨 이상의 특정 음향이나 음향효과를 검출하기 위한 제 1 모드, 및 음성명령어를 인식하고 상기 음성명령어의 의미를 판단하기 위한 제 2 모드 내에서 구현될 수 있다. 만일 상기 음향 또는 음향효과가 상기 제 1 모드 내에서 일정 레벨 이상일 경우, 상기 제 2 모드가 활성화되어 상기 음성명령어를 인식한다Therefore, according to an embodiment of the present invention, the speech recognition function can be implemented in two modes. For example, the speech recognition function may be implemented in a first mode for detecting a specific sound or sound effect above a certain level, and a second mode for recognizing a voice command and determining the meaning of the voice command. If the sound or sound effect is above a certain level in the first mode, the second mode is activated to recognize the voice command
상기 디스플레이 스크린(440)은 상기 사용자가 상기 음성인식 기능을 활성화 및 비활성화하기 위한 또 다른 방법을 보여준다. 본 예에 있어서, 상기 제어부(180)는 상기 음성 활성화 기능을 시작하고 종료시키기 위한 상기 사용자의 신체 동작을 해석하도록 구성된다. 예를 들어, 상기 디스플레이 스크린(440)에 도시 된 바와 같이, 상기 제어부(180)는 상기 디스플레이를 향하여 상기 사용자가 손을 움직이는 행위를 상기 음성인식 기능을 활성화하는 명령어로 해석하고, 상기 디스플레이로부터 상기 사용자가 손을 이격시키는 행위를 상기 음성활성화 기능을 종료시 키는 명령어로 해석한다. 근거리 또는 원거리 무선신호는 상기 음성인식 기능을 시작하고 정지시키기 위해 또한 사용될 수 있다.The
따라서, 본 발명의 일 실시예에 따르면, 상기 음성활성화 기능이 시작되고 정지되기 때문에, 상기 음성인식 기능이 계속 수행되지 않는다. 즉, 상기 음성인식 기능이 계속적으로 상기 활성화 상태에서 유지될 경우, 상기 이동 단말기 상의 자원의 양은 본 발명의 상기 실시예와 비교했을 때 증가한다.Therefore, according to the embodiment of the present invention, since the voice activation function is started and stopped, the voice recognition function is not continuously performed. That is, when the voice recognition function is continuously maintained in the activated state, the amount of resources on the mobile terminal increases in comparison with the embodiment of the present invention.
게다가, 도5를 참조하여 설명했듯이, 상기 음성인식 기능이 활성화되면, 상기 제어부(180)는 음성명령어 인식을 위한 참조(reference)로써 이용되는 특정 데이터베이스의 영역(domain)을 상기 디스플레이(151) 상의 메뉴 리스트와 관련된 영역으로 특정한다. 이후, 특정 메뉴가 상기 메뉴 리스트로부터 선택되거나 실행될 경우, 상기 데이터베이스의 상기 영역은 상기 특정 메뉴의 상기 선택된 메뉴 또는 하위 메뉴들과 관련된 정보로 특정될 수 있다.5, when the voice recognition function is activated, the
게다가, 상기 특정 메뉴가 음성명령어 또는 터치입력을 통해 선택되거나 실행될 경우, 상기 제어부(180)는 상기 특정 메뉴의 하위 메뉴들과 관련된 도움말 정보를 음성 메시지, 또는 팝업 창, 또는 풍선 형태로 출력할 수 있다. 예를 들어, 도 6b에서와 같이, 상기 사용자가 터치 또는 음성 동작을 통해 상기 '멀티미디어 메뉴'를 선택할 경우, 상기 제어부(180)는 상기 '멀티미디어 메뉴'의 상기 하위 메뉴들 (예를 들어, 방송, 카메라, 텍스트 뷰어, 게임, 기타)과 관련된 정보를 풍선 모양의 도움말 정보(441)로써 디스플레이 한다. 선택적으로, 상기 제어부(180)는 상기 도움말 정보를 포함하는 음성 신호(442)를 출력할 수 있다. 상기 사용자는 이 후 음성명령어를 사용하거나, 터치 동작으로 상기 디스플레이 된 도움말 옵션들 중 하나를 선택할 수 있다.In addition, when the specific menu is selected or executed through a voice command or a touch input, the
도6c는 사용자가 자신의 신체 동작 (본 예에서는, 사용자의 손짓)을 이용하여, 메뉴 아이템을 선택하는 실시예를 보여준다. 보다 자세히, 상기 사용자가 자신의 손가락을 상기 메뉴 아이템(443) 근처로 움직이면, 상기 제어부(180)는 상기 메뉴(443)과 관련된 하위 메뉴들(444)을 디스플레이 한다. 상기 제어부(180)는 예를 들어, 상기 센싱부(140)를 통해 상기 사용자의 신체 움직임 정보를 인식할 수 있다. 게다가, 상기 디스플레이 된 도움말 정보는 투명도 또는 휘도가 상기 사용자의 거리에 따라 제어될 수 있도록 디스플레이 될 수 있다. 즉, 상기 사용자의 손이 가까워질수록, 상기 디스플레이 된 아이템들의 하이라이트 정도가 심해질 수 있다.6C shows an embodiment in which a user selects a menu item using his / her body motion (in this example, the user's hand gesture). More specifically, if the user moves his or her finger near the
상술한 바와 같이, 상기 제어부(180)는 서로 다른 다양한 방법들에 기초하여 상기 음성인식 기능의 시작 및 정지를 판단하도록 구성될 수 있다. 예를 들어, 상기 사용자는 소프트 또는 하드 버튼들을 선택/조작할 수 있고, 상기 터치 스크린 상의 임의의 위치를 터치할 수 있다. 상기 제어부(180)는 또한 소정 시간 동안 상기 음성인식 기능의 활성화를 유지시키고, 이후 상기 소정 시간의 경과 후, 상기 활성화를 자동적으로 종료시킬 수 있다. 또한, 상기 제어부(180)는 특정 버튼 또는 터치 동작이 수행될 동안만 상기 활성화를 유지시키고, 상기 입력이 해제될 경우, 상기 활성화를 자동적으로 종료시킬 수 있다. 상기 제어부(180)는 또한 상기 음성명령어가 소정 시간동안 더 이상 입력되지 않을 경우, 상기 활성화 과정을 종료시킬 수 있다.As described above, the
도7a는 본 발명의 일 실시예에 따르는 이동 단말기 내에서 음성명령어를 인식하는 방법을 보여주는 흐름도이다. 도7A를 참조하면, 상기 음성인식 기능이 활성화될 경우, 상기 제어부(180)는 음성명령어 인식을 위한 참조(reference)로써 사용될 수 있는 데이터베이스의 영역(domain)을 상기 디스플레이(151) 상에 표시되는 메뉴나 상기 메뉴의 하위 메뉴들, 또는 현재 실행된 기능이나 메뉴와 관련된 영역으로 특정한다 (S201). 상기 사용자는 또한 정확한 메뉴 이름을 이용하거나, 자연어 (예를 들어, 영어)를 이용하여, 상기 음성명령어를 입력한다(S202).7A is a flowchart illustrating a method of recognizing voice commands in a mobile terminal according to an embodiment of the present invention. 7A, when the voice recognition function is activated, the
상기 제어부(180)는 이후 상기 메모리(160) 내에 상기 입력된 음성명령어를 저장한다 (S203). 게다가, 상기 음성명령어가 특정화된 영역 하에서 입력될 경우, 상기 제어부(180)는 음성인식 알고리즘을 이용하여, 상기 특정화된 영역에 기초한 상기 음성명령어의 문맥 및 내용을 분석한다. 또한, 상기 음성명령어는 분석을 위한 텍스트 타입 정보로 전환될 수 있고(S204), 이후, 상기 메모리(160)의 특정 데이터베이스 내에 저장될 수 있다. 그러나, 상기 음성명령어를 텍스트 타입 정보로 변환하는 단계는 생략될 수 있다.The
이후, 상기 음성명령어의 상기 문맥 및 내용을 분석하기 위해, 상기 제어부(180)는 상기 음성명령어의 특정 단어 또는 키워드를 검출한다 (S205). 상기 검출된 단어들 또는 키워드들에 기초하여, 상기 제어부(180)는 상기 음성명령어의 상기 문맥 및 내용을 분석하고, 상기 특정 데이터베이스 내에 저장된 정보를 참조하여 상기 음성명령어의 의미를 판단한다 (S206).Then, in order to analyze the context and contents of the voice command, the
게다가, 상술한 바와 같이, 참조로 사용되는 상기 데이터베이스는 특정화된 영역을 포함하고, 상기 데이터베이스에 기초하여 판단된 상기 음성명령어의 의미에 해당하는 기능들 또는 메뉴들이 실행된다 (S207). 예컨대, 텍스트 메시지작성 기능을 실행한 후 STT 기능을 이용하여 텍스트를 입력했다고 가정할 경우, 상기 음성명령의 인식을 위한 정보범위의 우선순위는, 텍스트의 수정에 관련된 명령들이나, 메시지의 전송을 위한 상대방의 검색이나 전송에 관련된 명령들로 설정될 수 있다. 또한, 음성인식을 위한 상기 데이터베이스가 현재 실행된 기능이나 메뉴와 관련된 각 기능으로 특정화되기 때문에, 상기 인식률 및 상기 음성명령어를 인식하는 속도가 개선되고, 상기 단말기 상에서 이용되는 자원의 양이 감소될 수 있다. 게다가, 상기 인식률은 특정 메뉴로 기설정된 이름과의 일치율을 의미한다.In addition, as described above, the database used as a reference includes the specified area, and functions or menus corresponding to the meaning of the voice command determined based on the database are executed (S207). For example, if it is assumed that text is input by using the STT function after executing the text message creation function, the priority order of the information range for recognizing the voice command may be a command for modifying the text, And may be set to commands related to the search or transmission of the other party. In addition, since the database for speech recognition is characterized by each function associated with the currently executed function or menu, the recognition rate and the speed of recognizing the voice command are improved and the amount of resources used on the terminal can be reduced have. In addition, the recognition rate means a matching rate with a predetermined name in a specific menu.
입력된 음성명령어에 대한 상기 인식률은 또한 상기 음성명령어의 특정 기능들 또는 메뉴들과 관련된 정보의 개수에 의해 판단될 수 있다. 따라서, 상기 입력된 음성명령어에 대한 상기 인식률은, 상기 정보가 상기 음성명령어 내에 포함된 특정 기능 또는 메뉴 (예를 들어, 메뉴 이름)와 정확히 일치할 경우, 개선된다.The recognition rate for the input voice command may also be determined by the number of information associated with the particular functions or menus of the voice command. Thus, the recognition rate for the input voice command is improved if the information exactly matches a particular function or menu (e.g., a menu name) included in the voice command.
보다 자세히 설명하면, 도7b는 본 발명의 일 실시예에 따르는 단말기의 음성명령어를 인식하는 방법을 보여주는 개략도이다. 도7b에서 보여진 바와 같이, 상기 사용자는 '나는 텍스트 메시지의 전송을 원해요(I want to send text messages)' 라는 6개의 단어로 이루어진 자연어로 음성명령어를 입력한다. 이 경우, 상기 인식률은 특정 메뉴 (예를 들어, text message)과 관련된 의미있는 단어들 (예를 들어, send, text, messages)의 개수에 기초하여 판단될 수 있다. 게다가, 상기 제어부(180)는 상기 음성명령어 내에 포함된 상기 단어들이 특정 기능 또 는 메뉴와 관련된 의미있는 단어들인지의 여부를, 상기 데이터베이스 내에 저장된 상기 정보에 기초하여 판단할 수 있다. 예를 들어, 상기 특정 메뉴와 무관한 상기 자연어 음성명령어에 포함된 의미없는 단어들은 주어(I) 및 전치사(to) 등일 수 있다.More specifically, FIG. 7B is a schematic diagram illustrating a method of recognizing voice commands of a terminal according to an embodiment of the present invention. As shown in FIG. 7B, the user inputs a voice command in a natural language consisting of six words 'I want to send text messages'. In this case, the recognition rate may be determined based on the number of meaningful words (e.g., send, text, messages) associated with a particular menu (e.g., text message). In addition, the
또한, 상기 자연어는 사람들에 의해 일반적으로 사용되는 언어이고, 인공어와는 반대의 개념을 지닌다. 게다가, 상기 자연어는 자연어 처리 알고리즘을 사용하여 처리될 수 있다. 상기 자연어는 특정 메뉴와 관련된 정확한 이름을 포함하거나 포함하지 않을 수 있는데, 이는 음성명령어를 완전히 정확하게 인식하는데 있어서 어려움을 야기시킬 수 있다. 따라서, 본 발명의 일 실시예에 따르면, 음성명령어가 일정 레벨 이상의 인식률을 지닐 경우 (예를 들어, 80%), 상기 제어부(180)는 상기 인식이 정확하다고 판단한다.In addition, the natural language is a language commonly used by people, and has a concept opposite to an artificial language. In addition, the natural language can be processed using a natural language processing algorithm. The natural language may or may not include the exact name associated with a particular menu, which may cause difficulty in fully recognizing the voice command. Therefore, according to an embodiment of the present invention, when the voice command has a recognition rate of a predetermined level or higher (for example, 80%), the
게다가, 상기 제어부(180)가 복수개의 메뉴들이 유사한 의미를 지닌다고 판단할 경우, 상기 제어부(180)는 상기 복수개의 메뉴들을 디스플레이하고, 상기 사용자는 상기 디스플레이 된 메뉴들 중 하나를 선택하여 그의 기능들이 실행될 수 있도록 할 수 있다. 게다가, 상대적으로 높은 인식률을 지닌 메뉴가 우선적으로 디스플레이 되고, 다른 메뉴들보다 보다 뚜렷하게 디스플레이 될 수 있다.In addition, when the
예를 들어, 도8은 본 발명의 일 실시예에 따르는 이동 단말기의 음성 인식률에 대한 메뉴들을 디스플레이 하는 방법을 보여주는 개략도이다. 도8에 도시 된 바와 같이, 상대적으로 높은 인식률을 지닌 메뉴 아이콘은 상기 디스플레이 스크린(510)의 중앙 부분에 디스플레이 되거나, 상기 디스플레이 스크린(520)에 도시 된 바와 같이 보다 크게 또는 보다 진하게 디스플레이 될 수 있다. 상기 보다 높은 인식률을 지닌 메뉴 아이콘은 또한 우선적으로 디스플레이 되고, 이후 상대적으로 낮은 인식률을 지닌 메뉴들이 순차적으로 디스플레이 된다.For example, FIG. 8 is a schematic diagram illustrating a method for displaying menus for a voice recognition rate of a mobile terminal according to an embodiment of the present invention. 8, a menu icon with a relatively high recognition rate may be displayed in the center portion of the
게다가, 상기 제어부(180)는 상기 메뉴들의 크기, 위치, 색깔, 휘도 중 적어도 하나를 변경하거나, 보다 높은 인식률의 순서로 하이라이트 처리함으로써, 상기 복수개의 메뉴들을 뚜렷하게 디스플레이 할 수 있다. 상기 메뉴들의 투명도는 적절하게 변경되거나 제어될 수 있다.In addition, the
게다가, 도8의 하부에 도시 된 바와 같이, 사용자에 의해 상대적으로 높은 선택률을 지닌 메뉴는 업데이트 되거나, 인식률을 지니도록 설정될 수 있다. 즉, 상기 제어부(180)는 상기 사용자 선택의 내역(history)을 저장하고(S231), 학습과정을 수행하여(S232), 사용자에 의해 선택된 메뉴옵션에 대한 특정 인식률을 다른 메뉴 옵션들보다 높이 설정한다(S233). 즉, 메뉴가 사용자에 의해 선택된 횟수가 상기 메뉴의 인식률에 적용될 수 있다. 따라서, 이후에 동일하거나 유사한 발음 또는 내용으로 입력되는 음성명령은 사용자가 특정 메뉴를 선택한 횟수에 따라 서로 다른 인식률을 지닐 수 있다.In addition, as shown in the lower portion of Fig. 8, the menu having a relatively high selection rate by the user can be updated or set to have a recognition rate. That is, the
예를 들어, 상기 제어부(180)는 상기 사용자가 특정기능을 수행한 시간을 저장할 수 있다. 예를 들어, 사용자는 월요일부터 금요일까지 깨어난 순간 전자메일 또는 놓친 메시지들을 체크할 수 있다. 이러한 시간 정보는 상기 인식률을 개선하기 위해 사용될 수 있다. 상기 이동 단말기의 상태 (예를 들어, 대기 모드, 등)는 상기 인식률을 개선하기 위해 사용될 수 있다. 예를 들어, 상기 사용자는 자신 의 이동 단말기의 전원을 켤 때 처음으로 전자메일 또는 놓친 메시지를 체크할 수 있고, 이 때 상기 이동 단말기는 닫힌 상태에서 열린 상태가 된다.For example, the
도9는 본 발명의 다른 실시예에 따르는 이동 단말기의 음성명령 인식방법을 설명하기 위한 예시도이다. 도9에 도시 된 바와 같이, 상기 사용자는 상기 음성인식기능을 활성화하고, 상기 음성명령어(I want to send text messages)를 입력한다. 상기 제어부(180)는 이후 음성명령어 인식을 위한 데이터베이스의 영역을 상기 디스플레이 된 서브메뉴와 관련된 영역으로 특정한다. 이후, 상기 제어부(180)는 상기 음성명령어를 해석하고(S241), 본 예시에서는, 특정값(예를 들어, 80%)이상의 가능성을 지닌 복수의 메뉴들을 디스플레이 한다(S242). 도9의 상기 디스플레이 스크린(610)에서 도시 된 바와 같이, 상기 제어부는 4개의 멀티미디어 메뉴들을 디스플레이 한다.9 is a diagram for explaining a voice command recognition method of a mobile terminal according to another embodiment of the present invention. As shown in FIG. 9, the user activates the voice recognition function and inputs the voice command (I want to send text messages). The
상기 제어부(180)는 또한 가장 높은 가능성을 갖는 메뉴(예를 들어, 본 예시에 있어서는 'Send Text' 메뉴 옵션(621))를 뚜렷하게 디스플레이 한다. 상기 사용자는 이후 상기 디스플레이 된 메뉴들 중 임의의 하나를 선택하여 상기 선택된 메뉴에 해당하는 기능을 수행할 수 있다. 도9에 도시 된 바와 같이, 상기 사용자는 상기 Send Text 메뉴 옵션(621)을 선택하고, 상기 제어부(180)는 상기 디스플레이 스크린(620) 내에 도시 된 바와 같이, 상기 선택된 Send Text 메뉴 옵션(621) 내의 서브 메뉴들을 디스플레이 한다.The
게다가, 도9의 하부 내의 단계 S242에 도시 된 바와 같이, 또한 상기 제어부(180)는 오직 하나의 메뉴만이 상기 소정의 가능성 보다 높다고 판단될 경우에, 기능을 즉시 수행할 수 있다. 즉, 상기 제어부(180)는 상기 Send Text 메뉴 옵션(621)이 소정의 임계값 이상의 높은 인식률 또는 가능성을 지닌 유일한 메뉴라고 판단될 경우, 상기 사용자가 상기 Send Text 메뉴 옵션(621)을 선택할 필요 없이, 상기 디스플레이 스크린(620) 내에서 보여진 바와 같이, 상기 Send Text 관련 메뉴들을 즉시 디스플레이 한다. Further, as shown in step S242 in the lower portion of Fig. 9, the
게다가, 도6b와 관련하여 상술된 바와 같이, 상기 제어부(180)는 또한 동작 상태 또는 모드 (예를 들어, 음성인식 기능을 지칭하는 모드)에 따라 음성명령어 또는 터치 입력을 통해 특정 메뉴가 선택되거나 실행된 경우에, 상기 사용자에게 서브 메뉴들과 관련된 도움말 정보를 음성이나 텍스트 형식의 풍선 도움말로 출력할 수 있다. 게다가, 상기 사용자는 환경 설정 메뉴들 내에 제공되는 적절한 메뉴 옵션들을 이용하여 상기 도움말을 출력하기 위한 상기 동작 모드를 설정할 수 있다. 따라서, 사용자는 본 발명의 상기 단말기를 높은 수준의 기술을 구비하지 않고서도 동작시킬 수 있다. 즉, 대부분의 노령의 사용자들은 단말기에 제공되는 다양한 서로 다른 메뉴들을 동작시키는 데 숙련이 되어 있지 않을 수 있다. 그러나, 본 발명의 상기 단말기를 가지고서, 상기 단말기로 제공되는 복잡한 사용자 인터페이스들과 친숙하지 않은 사용자라도 상기 이동 단말기를 쉽게 동작시킬 수 있다.Further, as described above in connection with FIG. 6B, the
게다가, 상기 제어부(180)가 상기 음성명령어가 복수개의 의미를 지닌다고 인식할 경우(예를 들어, 자연어 음성명령어(예를 들어, I want to send text messages)가 정확한 메뉴 이름을 포함하지 않을 경우, 즉, 메뉴가 '메시지 전송' 카테고리에 속하지만 'Send photo', 'Send mail', 'outbox' 중에서 정확한 이름을 포함하고 있지 않을 경우), 상기 제어부(180)는 일정값 (예를 들어, 80%) 이상의 인식률을 지닌 복수개의 메뉴들을 디스플레이 한다.In addition, when the
도10은 본 발명의 일 실시 예에 따르는 이동 단말기의 음성명령어를 인식하기 위해 상기 제어부(180)에 의해 사용되는 복수의 데이터베이스들을 보여주는 개략도이다. 본 실시 예에서, 상기 데이터베이스들은 상기 제어부(180)가 음성명령어의 의미를 판단하기 위해 사용하는 정보를 저장하고, 정보의 특성에 따라 임의의 개수의 데이터베이스들일 수 있다. 게다가, 정보 특성에 따라 구성된 상기 각 데이터베이스들은 상기 제어부(180)의 제어를 받아 지속적인 학습을 통해 업데이트 될 수 있다. 10 is a schematic diagram showing a plurality of databases used by the
예를 들어, 상기 학습 과정이란 사용자의 음성을 그에 해당하는 단어와 대응시키는 것으로, 예를 들어, 사용자가 "waiting"이라고 발음했으나 "eighteen"이라고 인식되었을 경우, 사용자가 "eighteen"을 "waiting"로 수정함으로써, 이후 상기 사용자에 의해 입력되는 동일한 발음이 "waiting"로 인식될 수 있도록 하는 것이다. For example, when the user pronounces " waiting "but is recognized as" eighteen ", the user changes the word "waiting" So that the same pronunciation input by the user thereafter can be recognized as "waiting ".
도10에서 도시된 바와 같이, 정보 특성에 따르는 상기 각 데이터베이스들은 제 1 데이터베이스(161), 제 2 데이터베이스(162), 제 3 데이터베이스(163), 및 제 4 데이터베이스(164)를 포함한다. 본 실시 예에서, 상기 제 1 데이터베이스(161)은 상기 마이크를 통해 입력 받은 음성을 음소, 음절, 또는 형태소 단위로 인식하기 위한 음성 정보를 저장하고, 상기 제 2 데이터베이스(162)는 상기 인식된 음성정보를 바탕으로 음성명령의 전체적인 의미를 판단하기 위한 정보(예 : 문법, 발음 정 확도, 문장 구조 등)를 저장한다. 그리고, 상기 제 3 데이터베이스(163)는 상기 이동 단말기의 기능이나 서비스를 위한 메뉴에 관련된 정보들을 저장하고, 상기 제 4 데이터베이스(164)는 상기 판단된 음성명령의 의미를 사용자로부터 확인 받기 위해 상기 단말기로부터 출력할 메시지 또는 음성 정보를 저장한다. 또한, 본 발명은 음성명령 인식 기능이나 STT 기능이 적용되고 있는 동작상태나 동작모드를 특정 모양의 인디케이터(Indicator)나 아이콘을 이용해 표시할 수 있다. 상기 인디케이터나 아이콘의 출력 시 특정 음향이나 음성을 출력하여 사용자에게 통보할 수 있다.As shown in FIG. 10, each of the databases according to the information characteristic includes a
이하에서는 상기와 같이 구성된 단말기에서 구현될 수 있는 제어 방법에 관련된 실시 예들에 대하여 첨부된 도면을 참조하여 설명한다. 후술하는 실시 예들은 단독으로 또는 서로 조합되어 사용될 수 있다. 또한, 후술하는 실시 예들이 상술한 사용자 인터페이스(UI)와 조합되어 사용될 수도 있다. 아울러, 상술한 내용과 중복되는 부분에 대한 설명은 편의상 생략될 수 있다.Hereinafter, embodiments related to a control method that can be implemented in the terminal configured as above will be described with reference to the accompanying drawings. The following embodiments can be used alone or in combination with each other. In addition, the embodiments described below may be used in combination with the above-described user interface (UI). In addition, the description of the parts overlapping with those described above can be omitted for convenience.
도11은 본 발명에 관련된 단말기의 음성인식 중 발생된 에러를 처리하는 방법을 보인 흐름도이다.11 is a flowchart illustrating a method for processing an error generated during speech recognition of a terminal according to the present invention.
이에 도시된 바와 같이 사용자가 음성을 입력하였을 때(S301) 제어부(180)가 상기 음성을 정확히 인식하지 못하였다고 가정한다. 즉, 음성인식 에러가 발생하였다고 가정한다(S302). 상기 사용자는 음성으로 특정 메뉴를 실행하기 위한 명령어나 특정 메뉴의 정보항목에 해당하는 정보를 입력할 수 있다.As shown, when the user inputs a voice (S301), it is assumed that the
상기 에러가 발생했는지 여부는 여러가지 방법으로 판단할 수 있다. Whether or not the error has occurred can be determined by various methods.
예를 들어, 에러 발생을 판단하는 한 가지 방법으로서, 제어부(180)에서 인식한 음성을 확인하는 메시지를 출력하고, 그 메시지에 대한 사용자의 확인을 받아 판단할 수 있다. 다른 한 가지 방법으로서, 제어부(180)에서 음성 인식률을 검출하고, 그 인식률이 특정값 이하로 떨어지는지 여부로 판단할 수 있다.For example, as one method of determining the occurrence of an error, a message for confirming the voice recognized by the
상기와 같이 음성인식 에러가 발생하면 제어부(180)는 상기 에러를 처리하기 위한 알고리즘을 실행한다(S303).When a voice recognition error occurs as described above, the
상기 에러를 처리하기 위한 알고리즘에는 여러가지가 있을 수 있다. There are various algorithms for handling the error.
예를 들어, 상기 인식하지 못하는 음성 정보를 특정 단위(예 : 단어, 절)로 나누어 입력받을 수 있도록 함으로써 에러를 처리하는 알고리즘을 제공할 수 있다. 또는, 동일한 에러가 연속해서 발생할 경우에 사용자가 키입력이나 터치입력을 통해 직접 정확한 정보를 입력할 수 있도록 함으로써 에러를 처리하는 알고리즘을 제공할 수 있다. For example, it is possible to provide an algorithm for processing errors by dividing the unrecognized voice information into specific units (e.g., words, phrases). Alternatively, when the same error occurs consecutively, the user can input the correct information directly through key input or touch input, thereby providing an algorithm for handling the error.
그리고, 상기 에러 처리 알고리즘의 실행 결과를 학습할 수 있다(S304). 즉, 상기 에러 발생과 그 처리 방법을 특정 데이터베이스에 저장해두고, 동일한 에러가 다시 발생할 경우에 자동으로 에러를 처리할 수 있도록 한다.Then, the execution result of the error processing algorithm can be learned (S304). That is, the error occurrence and the processing method thereof are stored in a specific database, and the error can be automatically processed when the same error occurs again.
도12a 와 도12b는 본 발명에 관련된 단말기에서 에러발생을 검출하는 방법들의 일 예를 보인 예시도이다. 편의상 음성으로 알람을 설정할 때 발생된 에러를 검출하는 방법에 대하여 설명한다.12A and 12B are diagrams illustrating an example of methods for detecting an error occurrence in a terminal according to the present invention. For convenience, a method of detecting an error generated when setting an alarm by voice will be described.
도12a에 도시된 바와 같이, 사용자는 알람 메뉴를 선택한 후 그 메뉴에 입력할 정보들(예 : 날짜, 시간)을 음성으로 입력할 수 있다. 예를 들어, 알람 메뉴 선 택 후, ″2008년 5월 10일 오전11시(May tenth, two thousand eight, eleven AM)″라고 음성 정보(711)를 입력할 경우, 제어부(180)는 상기 문장으로 입력된 음성 정보들을 인식하여(712), 상기 메뉴의 각 정보 항목(예 : 날짜, 시간)에 해당하는 정보를 자동으로 입력한다. 이때, 제어부(180)는 상기 알람 메뉴가 선택될 때 사용자가 입력해야 될 정보를 안내하는 메시지(710)를 출력할 수 있다. 그리고, 시간 정보(713)의 음성인식 에러가 발생하였다고 가정한다.As shown in FIG. 12A, the user can select the alarm menu and then input the information (e.g., date, time) to be input to the menu by voice. For example, when the
상기 각 정보 항목을 입력할 때, 제어부(180)는 그 입력되는 정보가 정확한지 여부를 사용자에게 확인할 수 있다. 즉, 제어부(180)에서 인식한 음성정보에 에러가 있는지 사용자의 응답을 받아 확인할 수 있다. When inputting the information items, the
예를 들어, 도12b에 도시된 바와 같이, 상기 인식한 정보가 사용자가 입력한 정보인지 확인하는 질문을 출력할 수 있다. 상기 질문은 입력된 정보 전체를 한꺼번에 묻는 형식(721)일수도 있고, 한 항목씩 묻는 형식(722)일수도 있다. 이때 상기 질문에 사용자가 긍정 응답을 해야만(723의 예) 다음 단계로 진행할 수 있고(725), 부정응답을 할 경우에는 정보를 재 입력할 수 있다(724). For example, as shown in FIG. 12B, a question may be output to confirm whether the recognized information is information input by a user. The question may be a
또는, 각 항목에 대한 정보를 입력할 때 매번 질문하지 않고(즉, 사용자의 응답을 기다리지 않고) 다음 항목의 정보를 자동으로 입력할 수 있다(726). 이때 사용자는 에러가 있을 경우에 정보 입력을 중지시킬수 있다. 즉, 사용자가 정보입력을 중지하는 명령을 입력할 경우(727의 예) 정보를 재입력할 수 있고(728), 정보입력 중지명령을 입력하지 않을 경우 다음 단계로 자동 진행할 수 있다(729).Alternatively, the information of the next item can be automatically input (726) without asking each time when inputting the information for each item (that is, without waiting for the user's response). At this time, the user can stop the information input when there is an error. That is, if the user inputs a command to stop inputting information (Yes in 727), the information can be re-entered (728). If the user does not input the information input stop command, the system can automatically proceed to the next step (729).
상술한 방법은 음성 인식률이 특정 비율(예 : 80%) 이상이고, 전체 음성 정 보 중 일부의 정보에만 에러가 있는 경우에, 사용자의 확인을 통해서 에러를 검출할 수 있는 방법이다. The above-described method is a method that can detect an error through confirmation by the user when the voice recognition rate is not less than a certain rate (for example, 80%) and only some of the entire voice information has an error.
그런데, 음성 인식률이 특정 비율보다 작을 경우(730의 예), 제어부(180)는 자동으로 에러를 검출할 수 있다. 상기와 같이 입력된 음성정보의 음성 인식률이 낮을 경우, 또는 메뉴의 정보 항목들과 관련이 없는 음성정보가 입력될 경우, 제어부(180)는 음성정보 전체의 재 입력을 요구할 수 있다(731).However, when the voice recognition rate is smaller than a specific ratio (YES in 730), the
도13a와 도13b는 본 발명에 관련된 단말기에서 발생된 음성인식 에러를 처리하는 방법들의 일 예를 보인 예시도이다. 편의상 음성으로 알람을 설정할 때 발생된 에러를 처리하는 방법에 대하여 설명한다.13A and 13B are diagrams illustrating an example of methods for processing a voice recognition error generated in a terminal related to the present invention. For convenience, a method for handling an error generated when setting an alarm by voice will be described.
도13a에 도시된 바와 같이, 사용자가 입력한 음성정보가 정확히 인식되지 않았을 경우, 사용자는 그 정확하게 입력되지 않은 정보항목(713)를 터치입력으로 선택할 수 있다. 그리고, 그 정보항목에 해당하는 정확한 정보(741)를 음성으로 재 입력할 수 있다. 제어부(180)는 새로 입력받은 음성정보를 인식하여 상기 정보항목(742)을 정정한다.As shown in FIG. 13A, when the voice information inputted by the user is not correctly recognized, the user can select the
또한, 사용자로부터 입력받은 음성정보를 정확히 인식하지 못했을 경우, 제어부(180)는 상기 음성정보를 특정 단위(예 : 단어, 절)로 분할한 후, 그 분할된 각 정보들이 정확한지 여부를 묻는 질문을 출력할 수 있다. 그리고, 그 정보가 정확하지 않을 경우에는 정확한 정보로 수정하도록 요구할 수 있다. 예를 들어, 상기 단어(word) 단위로 질문을 한다는 것은 ″달(month)→일(day)→년(year)→시간(time)″으로 각 정보를 나타내는 단어 단위로 나누어 질문한다는 의미이고, 상 기 절(phrase) 단위로 질문을 한다는 것은 ″달 + 일(month + day)″와 같이 2개 이상의 정보들을 묶어서 질문한다는 의미이다.If the voice information input from the user is not correctly recognized, the
또한, 상기 제어부(180)는 상기 특정 메뉴(예 : 알람)에 입력할 정보 항목들을 분할하여, 각 항목별로 정확한 정보를 재 입력하도록 요구할 수 있다. 예를 들어, 도13b에 도시된 바와 같이, ″달을 말해주세(Tell me the Month)(751)″와 같이 메시지를 출력한 후, 사용자가 그 메시지에 응답하여 달(month)(752)을 음성으로 입력하면, 그 입력받은 응답으로 해당하는 정보항목(753)을 정정한다. 그 다음 연속해서 ″일을 말해주세요(Tell me the date)(754)″와 같이 다음 정보의 입력을 요구하고 그에 해당하는 정보를 입력받을 수 있다.In addition, the
상기 각 에러 처리 방법에서 상기 정정할 정보들은 음성으로 재 입력할 수도 있고, 키나 터치에 의해서 입력할 수도 있다. 그리고, 제어부(180)는 재입력을 요구한 정보항목, 또는 사용자가 선택적으로 입력하는 정보항목을 하이라이트시켜 표시할 수 있다. 상기 하이라이트 방법은, 예를 들어, 정보항목을 깜박이거나 밑줄 표시, 또는 백그라운드 컬러를 이용해 표시할 수 있다.In each of the above error processing methods, the information to be corrected may be re-input by voice or input by a key or touch. Then, the
도14a와 도14b는 본 발명에 따라 음성인식 에러가 반복해서 발생할 경우의 처리 방법들을 보인 예시도이다. FIGS. 14A and 14B are exemplary diagrams showing processing methods when a speech recognition error occurs repeatedly according to the present invention.
도14a에 도시된 바와 같이 음성인식 에러가 발생한 경우(S401), 제어부(180)는 음성정보를 재 입력받아 음성인식을 수행할 수 있다(S402). 상기 재 입력받은 음성정보에 의해 에러정정이 완료되면(S403의 예), 제어부(180)는 그 에러처리 결과를 저장한다(S406). When a voice recognition error occurs as shown in FIG. 14A (S401), the
만약, 에러정정이 완료되지 않을 경우, 즉, 동일한 음성인식 에러가 재 발생할 경우(S403의 아니오), 제어부(180)는 기설정된 특정 횟수만큼 음성정보를 재 입력받을 수 있다(S404의 아니오). 그러나, 동일한 음성인식 에러를 처리하기 위하여 기설정된 특정 횟수 이상 정보를 재입력 받은 후에도 에러가 처리되지 않을 경우(S404의 예), 제어부(180)는 에러 처리 루틴을 벗어나기 위한 동작을 수행한다(S405). 예를 들어, 제어부(180)는 음성인식을 이용한 정보입력을 포기할 수 있다. 그리고, 키입력 또는 터치입력을 이용하여 사용자로부터 직접 정보를 입력받도록 할 수 있다(S405). If the error correction is not completed, that is, if the same voice recognition error occurs again (NO in S403), the
이를 위하여 제어부(180)는 도14b에 도시된 바와 같이 소프트 키패드(761)를 화면에 디스플레이할 수 있다. 이에 따라, 사용자는 상기 소프트 키패드 또는 하드 키패드를 이용하여 특정 정보를 직접 입력하여 에러를 정정할 수 있다.For this, the
상술한 바와 같이 음성정보의 재입력 또는 사용자의 직접적인 키입력에 의해 에러의 처리가 완료되면, 제어부(180)는 그 에러처리 정보를 특정 데이터베이스(165)에 저장할 수 있다(S406). 즉, 상기 에러처리 과정을 학습할 수 있다.When the processing of the error is completed by re-inputting the voice information or by directly inputting the user's key as described above, the
도15는 본 발명에 관련된 단말기에서 처리된 음성인식 에러를 학습하는 과정을 설명하기 위한 예시도이다. 15 is an exemplary diagram for explaining a process of learning speech recognition errors processed in a terminal according to the present invention.
상술한 바와 같이 음성인식 에러가 발생된 후 그 에러의 처리가 완료되면 제어부(180)는 그 처리 과정에서 발생한 정보들을 학습함으로써 추후에 동일한 에러를 회피하는데 참조할 수 있다. 왜냐하면, 사용자마다 특정 단어나 문장을 발음할 때 습관적으로 동일한 방식으로 입력하기 때문이다.As described above, after the speech recognition error is generated and the processing of the error is completed, the
상기 에러 처리 과정의 학습을 위하여 제어부(180)는 상기 에러 처리 과정에서 발생한 정보들을 특정 테이블 형식으로 정리하여 데이터베이스(165)에 저장할 수 있다. 상기 데이터베이스는 잘못 인식된 문장(771), 에러가 발생된 단어 또는 절(772), 최종적으로 정정이 완료된 단어 또는 절(773), 또는 최종적으로 정정이 완료된 문장(774)에 관련된 정보들이 테이블 형식으로 저장될 수 있다. In order to learn the error process, the
예를 들어, 사용자가 특정 문장을 음성으로 입력하였을 때, 상기 입력된 문장에 대한 음성인식 에러가 발생할 경우, 제어부(180)는 상기 문장에서 에러가 발생된 단어 또는 절을 검출한다. 상기 입력된 음성정보에서 에러가 발생된 부분을 검출하기 위하여, 상기 도12 또는 도13에서 설명한 방법을 선택적으로 이용할 수 있다. 그리고, 상기 검출된 단어 또는 절에 해당하는 정확한 정보를 입력받아 에러가 정정되면 그 정확한 정보를 저장한다. 이에 따라, 제어부(180)는 상기 음성인식 에러가 발생한 정보의 발음을 학습하게 되는 것이다.For example, when a user inputs a specific sentence by voice and a voice recognition error occurs with respect to the inputted sentence, the
이후 사용자로부터 동일한 단어, 절, 또는 문장이 입력될 경우에 상기 저장된 데이터베이스 정보를 참조하여 에러를 처리할 수 있게 된다.When the same word, phrase, or sentence is input from the user, the error can be handled by referring to the stored database information.
또한, 본 발명의 일실시예에 의하면, 전술한 방법은, 프로그램이 기록된 매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 매체의 예로는, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.Further, according to an embodiment of the present invention, the above-described method can be implemented as a code that can be read by a processor on a medium on which the program is recorded. Examples of the medium that can be read by the processor include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, etc., and may be implemented in the form of a carrier wave (e.g., transmission over the Internet) .
상기와 같이 설명된 이동 단말기는 상기 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.The mobile terminal described above can be applied to not only the configuration and method of the embodiments described above but also all or some of the embodiments may be selectively combined so that various modifications may be made to the embodiments It is possible.
도 1은 본 발명의 일 실시예와 관련된 이동 단말기의 블록 구성도.1 is a block diagram of a mobile terminal according to an embodiment of the present invention;
도 2a은 본 발명의 일 실시예에 관련된 휴대 단말기의 전면 사시도.FIG. 2A is a front perspective view of a portable terminal according to an embodiment of the present invention; FIG.
도 2b는 본 발명의 일 실시예에 관련된 휴대 단말기의 후면 사시도.FIG. 2B is a rear perspective view of a portable terminal according to an embodiment of the present invention; FIG.
도 3a 및 3b는 본 발명과 관련된 휴대 단말기의 일 작동 상태를 설명하기 위한 휴대 단말기의 정면도들.3A and 3B are front views of a portable terminal for explaining an operation state of the portable terminal according to the present invention.
도 4는 근접 센서의 근접 깊이를 설명하기 위한 개념도.4 is a conceptual diagram for explaining the proximity depth of the proximity sensor;
도 5는 본 발명에 관련된 이동 단말기의 음성을 이용한 메뉴 제어방법을 설명하는 일 예의 흐름도.5 is a flowchart of an example of a menu control method using voice in a mobile terminal according to the present invention.
도 6a는 본 발명에 관련된 이동 단말기의 음성인식 기능을 활성화하는 방법을 설명하기 위한 예시도.FIG. 6A is an exemplary view for explaining a method of activating a voice recognition function of a mobile terminal according to the present invention; FIG.
도 6b와 도 6c는 본 발명에 관련된 이동 단말기의 도움말 정보 출력방법을 설명하기 위한 예시도.6B and 6C are diagrams for explaining a help information output method of the mobile terminal according to the present invention;
도 7a는 본 발명에 관련된 이동 단말기의 음성명령 인식방법을 설명하기 위한 흐름도.FIG. 7A is a flowchart for explaining a voice command recognition method of a mobile terminal according to the present invention; FIG.
도 7b는 본 발명에 관련된 이동 단말기의 음성인식 방법을 설명하기 위한 예시도.FIG. 7B is an exemplary diagram for explaining a speech recognition method of a mobile terminal according to the present invention; FIG.
도 8은 본 발명에 관련된 이동 단말기의 음성 인식률에 따른 메뉴 표시 방법을 설명하기 위한 예시도.8 is a diagram for explaining a menu display method according to a voice recognition rate of a mobile terminal according to the present invention.
도 9는 본 발명에 관련된 이동 단말기의 음성명령 인식방법을 설명하기 위 한 예시도.FIG. 9 is an exemplary diagram for explaining a voice command recognition method of a mobile terminal according to the present invention; FIG.
도 10은 본 발명에 관련된 이동 단말기의 음성명령 인식을 위한 데이터베이스의 구성을 설명하기 위한 예시도.10 is an exemplary diagram illustrating a configuration of a database for voice command recognition of a mobile terminal according to the present invention.
도 11은 본 발명에 관련된 단말기의 음성인식 중 발생된 에러를 처리하는 방법을 보인 흐름도.11 is a flow chart illustrating a method for processing errors generated during speech recognition of a terminal according to the present invention.
도 12a 와 도 12b는 본 발명에 관련된 단말기에서 에러발생을 검출하는 방법들의 일 예를 보인 예시도.12A and 12B illustrate examples of methods of detecting an error occurrence in a terminal according to the present invention.
도 13a와 도 13b는 본 발명에 관련된 단말기에서 발생된 음성인식 에러를 처리하는 방법들의 일 예를 보인 예시도.13A and 13B illustrate examples of methods of processing a voice recognition error generated in a terminal according to the present invention.
도 14a와 도 14b는 본 발명에 따라 음성인식 에러가 반복해서 발생할 경우의 처리 방법들을 보인 예시도.14A and 14B are diagrams showing examples of processing methods when a speech recognition error occurs repeatedly according to the present invention.
도 15는 본 발명에 관련된 단말기에서 처리된 음성인식 에러를 학습하는 과정을 설명하기 위한 예시도.15 is an exemplary diagram for explaining a process of learning a speech recognition error processed in a terminal according to the present invention;
Claims (16)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080117077A KR101537693B1 (en) | 2008-11-24 | 2008-11-24 | Terminal and method for controlling the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080117077A KR101537693B1 (en) | 2008-11-24 | 2008-11-24 | Terminal and method for controlling the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100058318A KR20100058318A (en) | 2010-06-03 |
KR101537693B1 true KR101537693B1 (en) | 2015-07-20 |
Family
ID=42359985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080117077A KR101537693B1 (en) | 2008-11-24 | 2008-11-24 | Terminal and method for controlling the same |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101537693B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10621985B2 (en) | 2017-11-01 | 2020-04-14 | Hyundai Motor Company | Voice recognition device and method for vehicle |
KR20220048075A (en) * | 2020-10-12 | 2022-04-19 | 광운대학교 산학협력단 | System for automatically generating code using voice recognition and method for automatically generating code using the same |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101992191B1 (en) * | 2012-11-01 | 2019-06-24 | 엘지전자 주식회사 | Mobile terminal and method for controlling thereof |
KR101464833B1 (en) * | 2012-12-20 | 2014-11-25 | 주식회사 팬택 | Mobile device and method for voice recognition processing using the same |
KR102527107B1 (en) * | 2018-08-08 | 2023-05-02 | 삼성전자주식회사 | Method for executing function based on voice and electronic device for supporting the same |
JP7363075B2 (en) * | 2019-04-01 | 2023-10-18 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and information processing program |
CN110265017B (en) * | 2019-06-27 | 2021-08-17 | 百度在线网络技术(北京)有限公司 | Voice processing method and device |
KR102106738B1 (en) * | 2019-10-28 | 2020-05-04 | 이광선 | speech to text translation method for generating subtitle of moving picture in server |
KR20210149969A (en) * | 2020-06-02 | 2021-12-10 | 삼성전자주식회사 | Electronic device and method for modifying content |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070060491A (en) * | 2005-12-08 | 2007-06-13 | 한국전자통신연구원 | Method and apparatus for exceptional case handling in spoken dialog system |
KR20080056571A (en) * | 2006-12-18 | 2008-06-23 | 엘지전자 주식회사 | Speech recognition method and system |
-
2008
- 2008-11-24 KR KR1020080117077A patent/KR101537693B1/en not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070060491A (en) * | 2005-12-08 | 2007-06-13 | 한국전자통신연구원 | Method and apparatus for exceptional case handling in spoken dialog system |
KR20080056571A (en) * | 2006-12-18 | 2008-06-23 | 엘지전자 주식회사 | Speech recognition method and system |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10621985B2 (en) | 2017-11-01 | 2020-04-14 | Hyundai Motor Company | Voice recognition device and method for vehicle |
KR20220048075A (en) * | 2020-10-12 | 2022-04-19 | 광운대학교 산학협력단 | System for automatically generating code using voice recognition and method for automatically generating code using the same |
KR102396187B1 (en) * | 2020-10-12 | 2022-05-09 | 광운대학교 산학협력단 | System for automatically generating code using voice recognition and method for automatically generating code using the same |
Also Published As
Publication number | Publication date |
---|---|
KR20100058318A (en) | 2010-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101545582B1 (en) | Terminal and method for controlling the same | |
US8498670B2 (en) | Mobile terminal and text input method thereof | |
KR101612788B1 (en) | Mobile terminal and method for controlling the same | |
KR100988397B1 (en) | Mobile terminal and text correcting method in the same | |
KR101537693B1 (en) | Terminal and method for controlling the same | |
EP2109298B1 (en) | Mobile terminal and menu control method thereof | |
KR101513615B1 (en) | Mobile terminal and voice recognition method | |
US8428654B2 (en) | Mobile terminal and method for displaying menu thereof | |
US8423087B2 (en) | Mobile terminal with touch screen and method of processing message using the same | |
KR20090107364A (en) | Mobile terminal and its menu control method | |
KR20090123697A (en) | Mobile terminal and text correction method | |
KR101502004B1 (en) | Mobile terminal and method for recognition voice command thereof | |
KR20090115599A (en) | Mobile terminal and its information processing method | |
KR101504212B1 (en) | Terminal and method for controlling the same | |
KR101513635B1 (en) | Terminal and method for controlling the same | |
KR101495183B1 (en) | Terminal and method for controlling the same | |
KR101631939B1 (en) | Mobile terminal and method for controlling the same | |
KR101521923B1 (en) | Terminal and method for controlling the same | |
KR101513629B1 (en) | Terminal and method for controlling the same | |
KR101521927B1 (en) | Terminal and method for controlling the same | |
KR101631913B1 (en) | Mobile terminal and method for controlling the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
LAPS | Lapse due to unpaid annual fee |