KR100988397B1 - 이동 단말기 및 그의 텍스트 수정방법 - Google Patents

이동 단말기 및 그의 텍스트 수정방법 Download PDF

Info

Publication number
KR100988397B1
KR100988397B1 KR1020080053713A KR20080053713A KR100988397B1 KR 100988397 B1 KR100988397 B1 KR 100988397B1 KR 1020080053713 A KR1020080053713 A KR 1020080053713A KR 20080053713 A KR20080053713 A KR 20080053713A KR 100988397 B1 KR100988397 B1 KR 100988397B1
Authority
KR
South Korea
Prior art keywords
word
text
voice
display
displaying
Prior art date
Application number
KR1020080053713A
Other languages
English (en)
Other versions
KR20090130350A (ko
Inventor
신종호
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020080053713A priority Critical patent/KR100988397B1/ko
Priority to US12/355,068 priority patent/US8543394B2/en
Priority to EP09000720A priority patent/EP2133869A3/en
Priority to CN2009101287987A priority patent/CN101605171B/zh
Publication of KR20090130350A publication Critical patent/KR20090130350A/ko
Application granted granted Critical
Publication of KR100988397B1 publication Critical patent/KR100988397B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/1615Constructional details or arrangements for portable computers with several enclosures having relative motions, each enclosure supporting at least one I/O or computing function
    • G06F1/1624Constructional details or arrangements for portable computers with several enclosures having relative motions, each enclosure supporting at least one I/O or computing function with sliding enclosures, e.g. sliding keyboard or display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/1626Constructional details or arrangements for portable computers with a single-body enclosure integrating a flat display, e.g. Personal Digital Assistants [PDAs]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/1633Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
    • G06F1/1637Details related to the display arrangement, including those related to the mounting of the display in the housing
    • G06F1/1643Details related to the display arrangement, including those related to the mounting of the display in the housing the display being associated to a digitizer, e.g. laptops that can be used as penpads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/1633Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
    • G06F1/1684Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0236Character input methods using selection techniques to select from displayed items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. SMS or e-mail
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/22Details of telephonic subscriber devices including a touch pad, a touch sensor or a touch detector
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/60Details of telephonic subscriber devices logging of communication history, e.g. outgoing or incoming calls, missed calls, messages or URLs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/70Details of telephonic subscriber devices methods for entering alphabetical characters, e.g. multi-tap or dictionary disambiguation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 발명은 이동 단말기에서 음성을 텍스트로 변환할 경우, 그 텍스트에서 수정해야될 워드를 쉽게 선택하여 편집한 후, 그 편집된 워드로 텍스트를 수정할 수 있도록 하는 방법 및 이를 구비한 이동 단말기에 관한 것으로, 음성을 입력받기 위한 음성수신부와, 상기 음성수신부에서 입력받은 음성을 텍스트로 변환하기 위한 제어부와, 상기 변환된 텍스트를 표시하기 위한 디스플레이부와, 상기 디스플레이부에 표시된 텍스트에 포함된 워드(word)를 터치 방식으로 선택하는 입력부를 포함하며, 상기 제어부는 상기 입력부를 통해 선택된 워드와 그 워드에 해당하는 후보 워드의 유사도에 근거하여, 상기 선택된 워드에 해당하는 다수의 후보워드들을 상기 선택된 워드로부터 근접하여 배열되게 표시하며, 상기 후보워드들에 키패드의 숫자 키에 대응하는 넘버를 순차로 부가하여 표시하거나 상기 후보워드들이 상기 선택된 워드와의 유사한 정도를 나타내는 확률값을 부가하여 표시하도록 구성된다.

Description

이동 단말기 및 그의 텍스트 수정방법{MOBILE TERMINAL AND TEXT CORRECTING METHOD IN THE SAME}
본 발명은 이동 단말기에서 음성을 텍스트로 변환할 경우, 그 텍스트에서 수정해야될 워드를 쉽게 선택하여 편집한 후, 그 편집된 워드로 텍스트를 수정할 수 있도록 하는 방법 및 이를 구비한 이동 단말기에 관한 것이다.
이동 단말기는 다양한 기능을 수행할 수 있도록 구성될 수 있다.
그러한 다양한 기능들의 예로 데이터 및 음성 통신 기능, 카메라를 통해 사진이나 동영상을 촬영하는 기능, 음성 저장 기능, 스피커 시스템을 통한 음악 파일의 재생 기능, 이미지나 비디오의 디스플레이 기능 등이 있다. 일부 이동 단말기는 게임을 실행할 수 있는 추가적 기능을 포함하고, 다른 일부 이동 단말기는 멀티미디어 기기로서 구현되기도 한다. 더욱이 최근의 이동 단말기는 방송이나 멀티캐스트(multicast) 신호를 수신하여 비디오나 텔레비전 프로그램을 시청할 수 있다.
또한, 상기 이동 단말기의 기능 지지 및 증대를 위한 노력들이 계속되고 있다. 상술한 노력은 이동 단말기를 형성하는 구조적인 구성요소의 변화 및 개량뿐만 아니라 소프트웨어나 하드웨어의 개량도 포함한다. 이러한 디자인 형태로서는 폴더 형태, 슬라이드 형태, 바 형태 또는 로테이션 형태의 디자인이 이동 단말기에 적용되고 있다.
또한, 최근에는 음성인식 기능을 이동 단말기에 적용하려는 노력이 이루어지고 있다. 예컨대, 이동 단말기에서 음성을 텍스트로 변환하는 STT(Speech To Text) 기능을 이용하여 문자 메시지(Text Message)를 작성할 수 있도록 함으로써 사용자가 텍스트를 간편하게 입력할 수 있도록 한다.
그러나, 항상 완벽한 음성인식을 기대할 수 없기 때문에 오인식된 텍스트가 출력될 수 있으며, 그 텍스트의 오인식된 한 워드를 선택하는데 어려움이 있다. 또한, 워드의 문자가 작기 때문에 선택한 워드를 수정하거나 편집하는데 불편함이 있다.
본 발명은 이동 단말기에서 작성된 텍스트를 수정해야될 경우, 그 텍스트에서 수정해야될 워드를 사용자가 쉽게 선택할 수 있도록 표시하는 방법 및 이를 구비한 이동 단말기를 제공하기 위한 것이다.
또한 본 발명은 이동 단말기에서 작성된 텍스트를 수정하기 위해서 선택된 워드를 사용자가 쉽게 편집할 수 있도록 표시하는 방법 및 이를 구비한 이동 단말기를 제공하기 위한 것이다.
또한 본 발명은 이동 단말기에서 작성된 텍스트를 음성이나 복수의 입력수단을 이용해 워드 단위로 선택하는 방법 및 이를 구비한 이동 단말기를 제공하기 위한 것이다.
또한 본 발명은 이동 단말기에서 작성된 텍스트에서 특정 워드가 선택될 경우, 그 선택된 워드와 발음이 유사한 후보 워드들을 표시할 때, 그 후보 워드들의 음성 인식률 또는 확률에 따라, 상기 선택된 워드와의 거리를 조절하여 표시하는 방법 및 이를 구비한 이동 단말기를 제공하기 위한 것이다.
상기한 과제를 실현하기 위한 본 발명의 일 예와 관련된 이동 단말기는 음성을 입력받기 위한 음성수신부와, 상기 음성수신부에서 입력받은 음성을 텍스트로 변환하기 위한 제어부와, 상기 변환된 텍스트를 표시하기 위한 디스플레이부와, 상기 디스플레이부에 표시된 텍스트에 포함된 워드(word)를 터치 방식으로 선택하는 입력부를 포함하며, 상기 제어부는 상기 입력부를 통해 선택된 워드와 그 워드에 해당하는 후보 워드의 유사도에 근거하여, 상기 선택된 워드에 해당하는 다수의 후보워드들을 상기 선택된 워드로부터 근접하여 배열되게 표시하며, 상기 후보워드들에 키패드의 숫자 키에 대응하는 넘버를 순차로 부가하여 표시하거나 상기 후보워드들이 상기 선택된 워드와의 유사한 정도를 나타내는 확률값을 부가하여 표시하도록 구성된다.
또한, 상기한 과제를 실현하기 위한 본 발명은 음성을 입력받고, 상기 입력받는 음성을 텍스트로 변환하여 표시하고, 상기 표시된 텍스트에 포함된 워드가 선택되면 그 워드에 해당하는 후보 워드와의 유사한 정도에 근거하여, 상기 선택된 워드에 해당하는 다수의 후보 워드들을 상기 선택된 워드로부터 근접하여 배열되게 표시하도록 이루어진다.
상기와 같이 구성되는 본 발명에 관련된 이동 단말기는 음성을 인식하여 변환된 텍스트에서 수정해야될 워드를 사용자가 쉽게 선택할 수 있도록 표시할 수 있다.
또한 상기와 같이 구성되는 본 발명에 관련된 이동 단말기는 음성을 인식하여 변환된 텍스트에서 특정 워드를 음성이나 복수의 입력수단을 이용해 선택할 수 있도록 하는 효과가 있다.
또한 상기와 같이 구성되는 본 발명에 관련된 이동 단말기는 텍스트를 수정하기 위해서 선택된 워드를 사용자가 쉽게 편집하거나 변경할 수 있도록 표시할 수 있다.
또한 상기와 같이 구성되는 본 발명에 관련된 이동 단말기는 텍스트를 수정하기 위해서 선택된 워드를 변경할 수 있는 후보 워드들을 음성 인식률 또는 확률과 함께 표시할 수 있으며, 그 확률에 따라 상기 선택된 워드와의 거리를 다르게 조절하여 표시할 수 있다.
이하, 발명에 따른 다양한 실시예들을 첨부한 도면을 참조하여 상세히 설명하기로 한다. 다만, 본 발명의 요지를 흐릴 수 있다고 판단되는 공지기술 및 그 구성에 대한 구체적인 설명은 생략하기로 한다. 또한, 도면을 참조하여 본 발명을 설명함에 있어서, 동일한 기능을 수행하는 구성 요소에 대하여는 동일한 부호를 부여하여 설명하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈", "유닛" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다.
이하, 본 발명과 관련된 이동 단말기에 대하여 도면을 참조하여 보다 상세하게 설명한다.
도1은 본 발명의 일 실시예와 관련된 이동 단말기의 블록 구성도(block diagram)이다.
이동 단말기는 다양한 형태로 구현될 수 있다. 예를 들어, 본 명세서에서 기술되는 이동 단말기는 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(notebook computer), 디지털방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션, 등이 있다.
도시된 이동 단말기(100)는 무선 통신부(110), A/V(Audio/Video) 입력부(120), 사용자 입력부(130), 센싱부(140), 출력부(150), 메모리(160), 인터페이스부(170), 제어부(180) 및 전원 공급부(190) 등을 포함할 수 있다. 도1은 다양한 구성요소를 가지고 있는 이동 단말기를 나타내고 있다. 그러나 도시된 구성요소 모두가 필수구성요소인 것은 아니다. 도시된 구성요소 보다 많은 구성요소에 의해 이동 단말기가 구현될 수도 있고, 그 보다 적은 구성요소에 의해서도 이동 단말기가 구현될 수 있다.
이하 상기 구성요소들에 대해 차례로 살펴본다.
무선 통신부(110)는 이동 단말기(100)와 무선 통신 시스템 간의 무선 통신 또는 이동 단말기(100)와 이동 단말기(100)가 위치한 네트웍간의 무선 통신을 하게 하는 하나 이상의 구성요소를 포함할 수 있다. 예를 들어, 무선 통신부(110)는 방송 수신 모듈(111), 이동통신 모듈(112), 무선 인터넷 모듈(113), 근거리 통신 모듈(114) 및 위치정보 모듈(115) 등을 포함할 수 있다.
방송 수신 모듈(111)은 방송 채널을 통하여 외부의 방송 관리 서버로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 상기 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 상기 방송 관리 서버는, 방송 신호 및/또는 방송 관련 정보를 생성하여 송신하는 서버 또는 기 생성된 방송 신호 및/또는 방송 관련 정보를 제공받아 단말기에 송신하는 서버를 의미할 수 있다. 상기 방송 관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 상기 방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다.
한편, 상기 방송 관련 정보는, 이동통신망을 통하여도 제공될 수 있으며, 이러한 경우에는 상기 이동통신 모듈(112)에 의해 수신될 수 있다.
상기 방송 관련 정보는 다양한 형태로 존재할 수 있다. 예를 들어, DMB(Digital Multimedia Broadcasting)의 EPG(Electronic Program Guide) 또는 DVB-H(Digital Video Broadcast-Handheld)의 ESG(Electronic Service Guide) 등의 형태로 존재할 수 있다.
상기 방송 수신 모듈(111)은, 각종 방송 시스템을 이용하여 방송 신호를 수신하는데, 특히, DMB-T(Digital Multimedia Broadcasting-Terrestrial), DMB-S(Digital Multimedia Broadcasting-Satellite), MediaFLO(Media Forward Link Only), DVB-H(Digital Video Broadcast-Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등의 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 물론, 상기 방송 수신 모듈(111)은, 상술한 디지털 방송 시스템뿐만 아니라 방송 신호를 제공하는 모든 방송 시스템에 적합하도록 구성된다.
방송 수신 모듈(111)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는 메모리(160)에 저장될 수 있다.
또한, 이동통신 모듈(112)은, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기에서, 상기 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
무선 인터넷 모듈(113)은 무선 인터넷 접속을 위한 모듈을 말하는 것으로, 무선 인터넷 모듈(113)은 내장되거나 외장될 수 있다.
근거리 통신 모듈(114)은 근거리 통신을 위한 모듈을 말한다. 근거리 통신 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), ZigBee 등이 이용될 수 있다.
또한, 위치정보 모듈(115)은 이동 단말기의 위치를 확인하거나 얻기 위한 모듈이다. 일례로 GPS(Global Position System) 모듈이 있다. GPS 모듈은 복수 개의 인공위성으로부터 위치 정보를 수신한다. 여기에서, 위치 정보는 위도 및 경도로 표시되는 좌표 정보를 포함할 수 있다. 예를 들어, GPS 모듈은, 3개 이상의 위성으로부터 정확한 시간과 거리를 측정하여 3개의 각각 다른 거리를 삼각 방법에 따라서 현 위치를 정확히 계산할 수 있다. 3개의 위성으로부터 거리와 시간 정보를 얻고 1개 위성으로 오차를 수정하는 방법이 사용될 수 있다. 특히, GPS 모듈은 위성으로부터 수신한 위치 정보로부터, 위도, 경도, 고도의 위치뿐만 아니라 3차원의 속도 정보와 함께 정확한 시간까지 얻을 수 있다.
한편, A/V(Audio/Video) 입력부(120)는 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(121)와 마이크(122) 등이 포함될 수 있다. 카메라(121)은 화상 통화모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 그리고, 처리된 화상 프레임은 디스플레이부(151)에 표시될 수 있다.
카메라(121)에서 처리된 화상 프레임은 메모리(160)에 저장되거나 무선 통신부(110)를 통하여 외부로 전송될 수 있다. 카메라(121)은 단말기의 구성 태양에 따라 2개 이상이 구비될 수도 있다.
마이크(122)는 음성을 입력받기 위한 음성수신부로서, 통화모드 또는 녹음모드, 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 그리고, 처리된 음성 데이터는 통화 모드인 경우 이동통신 모듈(112)를 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(122)는 외부의 음향 신호를 입력 받는 과정에서 발생되는 잡음(noise)를 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.
사용자 입력부(130)는 사용자가 단말기의 동작 제어를 위한 입력 데이터를 발생시킨다. 사용자 입력부(130)는 키 패드(key pad) 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠, 조그 스위치 등으로 구성될 수 있다. 특히, 터치 패드가 후술하는 디스플레이부(151)과 상호 레이어 구조를 이룰 경우, 이를 터치 스크린이라 부를 수 있다.
센싱부(140)는 이동 단말기(100)의 개폐 상태, 이동 단말기(100)의 위치, 사용자 접촉 유무, 이동 단말기의 방위, 이동 단말기의 가속/감속 등과 같이 이동 단말기(100)의 현 상태를 감지하여 이동 단말기(100)의 동작을 제어하기 위한 센싱 신호를 발생시킨다. 예를 들어 이동 단말기(100)가 슬라이드 폰 형태인 경우 슬라이드 폰의 개폐 여부를 센싱할 수 있다. 또한, 전원 공급부(190)의 전원 공급 여부, 인터페이스부(170)의 외부 기기 결합 여부 등과 관련된 센싱 기능을 담당한다.
인터페이스부(170)는 이동 단말기(100)에 연결되는 모든 외부기기와의 인터페이스 역할을 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모듈이 구비된 장치를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O(Input/Output) 포트, 이어폰 포트 등이 포함될 수 있다.
여기에서, 식별 모듈은 이동 단말기(100)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(User Identify Module; 'UIM'), 가입자 인증 모듈(Subscriber Identify Module; 'SIM'), 범용 사용자 인증 모듈(Universal Subscriber Identity Module; 'USIM') 등을 포함할 수 있다. 또한, 식별 모듈이 구비된 장치(이하 '식별 장치')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 장치는 포트를 통하여 단말기(100)와 연결될 수 있다. 이와 같은 인터페이스부(170)는 외부 기기로부터 데이터를 전송받거나 전원을 공급받아 이동 단말기(100) 내부의 각 구성 요소에 전달하거나 이동 단말기(100) 내부의 데이터가 외부 기기로 전송되도록 한다.
출력부(150)는 오디오 신호 또는 비디오 신호 또는 알람(alarm) 신호의 출력을 위한 것으로, 이에는 디스플레이부(151)과 음향 출력 모듈(152), 알람부(153) 등이 포함될 수 있다.
디스플레이부(151)는 이동 단말기(100)에서 처리되는 정보를 표시 출력한다. 예를 들어 이동 단말기가 통화 모드인 경우 통화와 관련된 UI(User Interface) 또는 GUI(Graphic User Interface)를 표시한다. 그리고 이동 단말기(100)가 화상 통화 모드 또는 촬영 모드인 경우 촬영 또는/및 수신된 영상 또는 UI, GUI를 표시한다.
한편, 전술한 바와 같이, 디스플레이부(13)과 터치패드가 상호 레이어 구조를 이루어 터치 스크린으로 구성되는 경우, 디스플레이부(151)은 출력 장치 이외에 입력 장치로도 사용될 수 있다. 디스플레이부(151)은 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 중에서 적어도 하나를 포함할 수 있다. 그리고 이동 단말기(100)의 구현 형태에 따라 디스플레이부(151)이 2개 이상 존재할 수도 있다. 예를 들어, 이동 단말기(100)에 외부 디스플레이부(미도시)과 내부 디스플레이부(미도시)이 동시에 구비될 수 있다.
음향 출력 모듈(152)는 호신호 수신, 통화모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(110)로부터 수신되거나 메모리(160)에 저장된 오디오 데이터를 출력한다. 또한, 음향 출력 모듈(152)은 이동 단말기(100)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력한다. 이러한 음향 출력 모듈(152)에는 스피커(speaker), 버저(Buzzer) 등이 포함될 수 있다.
알람부(153)는 이동 단말기(100)의 이벤트 발생을 알리기 위한 신호를 출력한다. 이동 단말기에서 발생되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력 등이 있다. 알람부(153)은 오디오 신호나 비디오 신호 이외에 다른 형태로 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 예를 들면, 진동 형태로 신호를 출력할 수 있다. 호 신호가 수신되거나 메시지가 수신된 경우, 이를 알리기 위해 알람부(153)은 진동을 출력할 수 있다. 또는, 키 신호가 입력된 경우, 키 신호 입력에 대한 피드백으로 알람부(153)은 진동을 출력할 수 있다. 상기와 같은 진동 출력을 통해 사용자는 이벤트 발생을 인지할 수 있다. 물론 이벤트 발생 알림을 위한 신호는 디스플레이부(151)이나 음성 출력 모듈(152)을 통해서도 출력될 수 있다.
메모리(160)는 제어부(180)의 처리 및 제어를 위한 프로그램이 저장될 수도 있고, 입/출력되는 데이터들(예를 들어, 폰북, 메시지, 정지영상, 동영상 등)의 임시 저장을 위한 기능을 수행할 수도 있다.
메모리(160)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory) 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 또한, 이동 단말기(100)는 인터넷(internet)상에서 메모리(150)의 저장 기능을 수행하는 웹 스토리지(web storage)를 운영할 수도 있다.
그리고 제어부(180)는 통상적으로 이동 단말기의 전반적인 동작을 제어한다. 예를 들어 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 또한, 제어부(180)는 멀티 미디어 재생을 위한 멀티미디어 모듈(181)을 구비할 수도 있다. 멀티미디어 모듈(181)은 제어부(180) 내에 구현될 수도 있고, 제어부(180)와 별도로 구현될 수도 있다.
전원 공급부(190)는 제어부(180)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.
여기에 설명되는 다양한 실시예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터로 읽을 수 있는 기록매체 내에서 구현될 수 있다.
하드웨어적인 구현에 의하면, 여기에 설명되는 실시예는 ASICs (application specific integrated circuits), DSPs (digital signal processors), DSPDs (digital signal processing devices), PLDs (programmable logic devices), FPGAs (field programmable gate arrays, 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기능 수행을 위한 전기적인 유닛 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 그러한 실시예들이 제어부(180)에 의해 구현될 수 있다.
소프트웨어적인 구현에 의하면, 절차나 기능과 같은 실시예들은 적어도 하나의 기능 또는 작동을 수행하게 하는 별개의 소프트웨어 모듈과 함께 구현될 수 있다. 소프트웨어 코드는 적절한 프로그램 언어로 쓰여진 소프트웨어 어플리케이션에 의해 구현될 수 있다. 또한, 소프트웨어 코드는 메모리(160)에 저장되고, 제어부(180)에 의해 실행될 수 있다.
이상에서는 본 발명과 관련된 이동 단말기를 기능에 따른 구성요소 관점에서 살펴보았다. 이하에서는 도 2 및 도 3을 더욱 참조하여, 본 발명과 관련된 이동 단말기를 외형에 따른 구성요소 관점에서 더욱 살펴보겠다. 이하에서는 설명의 간명함을 위해 폴더 타입, 바 타입, 스윙타입, 슬라이더 타입, 등과 같은 여러 타입 의 이동 단말기들 중에서 슬라이더 타입의 이동 단말기를 예로 들어 설명한다. 따라서 본 발명은 슬라이더 타입의 이동 단말기에 한정되는 것은 아니고 상기 전술한 타입을 포함한 모든 타입의 이동 단말기에 적용될 수 있다.
도2는 본 발명과 관련된 이동 단말기의 일 예를 전면에서 바라본 사시도이다. 본 발명의 이동 단말기는 제1바디(200)와, 상기 제1바디(200)에 적어도 일 방향을 따라 슬라이딩 가능하게 구성된 제2바디(205)를 포함한다.
제1바디(200)가 제2바디(205)와 중첩되게 배치된 상태를 닫힌 상태(closed configuration)라 칭할 수 있으며, 본 도면에 도시된 바와 같이 제1바디(200)가 제2바디(205)의 적어도 일 부분을 노출한 상태를 열린 상태(open configuration)라 칭할 수 있다.
상기 이동 단말기는 닫힌 상태에서 주로 대기 모드로 작동하지만 사용자의 조작에 의해 대기 모드가 해제되기도 한다. 그리고, 상기 이동 단말기는 열린 상태에서 주로 통화 모드 등으로 작동하지만 사용자의 조작 또는 소정 시간의 경과에 의해 대기 모드로 전환되기도 한다.
상기 제1 바디(200)의 외관을 이루는 케이스(케이싱, 하우징, 커버 등)는 제 1 프론트 케이스(220)와 제1 리어 케이스(225)에 의해 형성된다. 상기 제1 프론트 케이스(220)와 제1 리어 케이스(225)에 의해 형성된 공간에는 각종 전자부품들이 내장된다. 제1 프론트 케이스(220)와 제1 리어 케이스(225) 사이에는 적어도 하나의 중간 케이스들이 추가로 배치될 수도 있다.
상기 케이스들은 합성수지를 사출하여 형성되거나 금속 재질, 예를 들어 스 테인레스 스틸(STS) 또는 티타늄(Ti) 등과 같은 금속 재질을 갖도록 형성될 수도 있다.
제1 바디(200), 구체적으로 제1 프론트 케이스(220)에는 디스플레이부(151), 음향출력모듈(152), 카메라(121) 또는 제1 사용자 입력부(210)가 배치될 수 있다.
상기 디스플레이부(151)은 정보를 시각적으로 표현하는 LCD(liquid crystal display), OLED(Organic Light Emitting Diodes), TOLED(Transparent OLED), FOLED(Flexible OLED)등을 포함한다.
그리고 상기 디스플레이부(151)에는 터치패드가 레이어 구조로 중첩됨으로써, 상기 디스플레이부(151)이 터치 스크린으로 동작하여 사용자의 터치에 의한 정보의 입력 또한 가능하게 할 수도 있다.
상기 음향출력모듈(152)은 스피커의 형태로 구현될 수 있다.
카메라(121)은 사용자 등에 대한 이미지 또는 동영상을 촬영하기에 적절하도록 구현될 수 있다.
제1 바디(200)와 마찬가지로, 제2 바디(205)의 외관을 이루는 케이스는 제 2 프론트 케이스(230)와 제 2 리어 케이스(235)에 의해 형성된다.
제2 바디(205), 구체적으로 제2 프론트 케이스(230)의 전면(front face)에는 제2 사용자 입력부(215)가 배치될 수 있다.
제2 프론트 케이스(230) 또는 제2 리어 케이스(235) 중 적어도 하나에는 제3 사용자 입력부(245), 마이크(122), 인터페이스부(170)가 배치될 수 있다.
상기 제1 내지 제3 사용자 입력부(210, 215, 245)는 사용자 입력부(manipulating portion)(130)라 통칭될 수 있으며, 사용자가 촉각적인 느낌을 주면서 조작하게 되는 방식(tactile manner)이라면 어떤 방식이든 채용될 수 있다.
예를 들어, 상기 사용자 입력부는 사용자의 푸시 또는 터치 조작에 의해 명령 또는 정보를 입력받을 수 있는 돔 스위치 또는 터치 패드로 구현되거나, 키를 회전시키는 휠 또는 조그 방식이나 조이스틱과 같이 조작하는 방식 등으로도 구현될 수 있다.
기능적인 면에서, 제1 사용자 입력부(210)는 시작, 종료, 스크롤 등과 같은 명령을 입력하기 위한 것이고, 제2 사용자 입력부(215)는 숫자 또는 문자, 심볼(symbol) 등을 입력하기 위한 것이다.
또한, 제3 사용자 입력부(245)는 상기 휴대단말기 내의 특수한 기능을 활성화하기 위한 핫 키(hot-key)로서 작동할 수 있다.
상기 마이크(122)는 사용자의 음성, 기타 소리 등을 입력 받기에 적절한 형태로 구현될 수 있다.
상기 인터페이스부(170)는 본 발명과 관련된 이동 단말기가 외부 기기와 데이터 교환 등을 할 수 있게 하는 통로가 된다. 예를 들어, 상기 인터페이스부(170)는 유선 또는 무선으로, 이어폰과 연결하기 위한 접속단자, 근거리 통신을 위한 포트{예를 들어 적외선 포트(IrDA port), 블루투스 포트(Bluetooth port), 무선 랜 포트(wireless Lan port)등}, 또는 상기 이동 단말기에 전원을 공급하기 위한 전원공급 단자들 중 적어도 하나일 수 있다.
상기 인터페이스부(170)는 SIM(subscriber identification module) 또는 UIM(user identity module), 정보 저장을 위한 메모리 카드 등의 외장형 카드를 수용하는 카드 소켓일 수도 있다.
제2 리어 케이스(235) 측에는 상기 이동 단말기에 전원을 공급하기 위한 전원공급부(190)가 장착된다.
상기 전원공급부(190)는, 예를 들어 충전 가능한 배터리로서 충전 등을 위하여 착탈 가능하게 결합될 수 있다.
도3은 도2의 이동 단말기의 후면 사시도이다.
도3을 참조하면, 제2 바디(205)의 제2 리어 케이스(235)의 후면에는 카메라(121)가 추가로 장착될 수 있다. 상기 제2 바디(205)의 카메라(121)는 제1 바디(200)의 카메라(121)와 실질적으로 반대되는 촬영 방향을 가지며, 제1 바디(200)의 카메라(121)와 카메라(121)와 서로 다른 화소를 가질 수 있다.
예를 들어, 제1 바디(200)의 카메라(121)는 화상 통화 등의 경우에 사용자의 얼굴을 촬영하여 상대방에 전송함에 무리가 없도록 저화소를 가지며, 제2 바디의 카메라(121)는 일반적인 피사체를 촬영하고 바로 전송하지는 않는 경우가 많기에 고 화소를 가지는 것이 바람직하다.
제2 바디(205)의 카메라(121)에 인접하게는 플래쉬(250)와 거울(255)가 추가로 배치될 수 있다. 상기 플래쉬(250)는 제2바디(205)의 카메라(121)로 피사체를 촬영하는 경우에 상기 피사체를 향해 빛을 비추게 된다. 상기 거울(255)는 사용자가 제2바디(205)의 카메라(121)을 이용하여 자신을 촬영(셀프 촬영)하고자 하는 경 우에, 사용자 자신의 얼굴 등을 비춰볼 수 있게 한다.
제2 리어 케이스(235)에는 음향출력모듈 (152)가 추가로 배치될 수도 있다.
상기 제2 바디(205)의 음향출력모듈(152)는 제1 바디(200)의 음향출력모듈(152)과 함께 스테레오 기능을 구현할 수 있으며, 스피커폰 모드로 통화를 위하여 사용될 수도 있다.
또한, 제2 리어 케이스(235)의 일 측에는 통화 등을 위한 안테나 외에 방송신호 수신용 안테나(260)가 배치될 수 있다. 상기 안테나(260)는 제2 바디(205)에서 인출 가능하게 설치될 수 있다.
제1 바디(200)의 제1 리어 케이스(225) 측에는 제1 바디(200)와 제2 바디(205)를 슬라이딩 가능하게 결합하는 슬라이드 모듈(265)의 일 부분이 배치된다.
슬라이드 모듈(265)의 다른 부분은 제2 바디(205)의 제2 프론트 케이스(230) 측에 배치되어, 본 도면에서와 같이 외부로 드러나지 않는 형태일 수 있다.
이상에서는 제2 카메라(121) 등이 제2 바디(205)에 배치되는 것으로 설명하였으나, 반드시 그에 제한되는 것은 아니다.
예를 들어, 제2 바디의 카메라(121) 등과 같이 제2 리어 케이스(235)에 배치되는 것으로 설명한 구성들(260, 121 내지 250, 152) 중 적어도 하나 이상이 제1 바디(200), 주로는 제1 리어 케이스(225)에 장착되는 것도 가능하다. 그러한 경우라면, 상기 닫힌 상태에서 제1 리어 케이스(225)에 배치되는 구성(들)이 제2바디(205)에 의해 보호되는 이점이 있다. 나아가, 제2 바디의 카메라(121)가 별도로 구비되지 않더라도, 제1 바디의 카메라(121)가 회전 가능하게 형성되어 제2 바디의 카메라(121)의 촬영 방향까지 촬영이 가능하도록 구성될 수도 있다.
도1 내지 도3에 도시된 단말기(100)는, 유무선 통신 시스템 및 위성 기반 통신 시스템을 포함하여, 프레임(frame) 또는 패킷(packet)을 통하여 데이터(data)를 전송할 수 있는 통신 시스템에서 동작 가능하도록 구성될 수 있다.
이하에서는, 도4를 참조하여, 본 발명에 관련된 단말기가 동작 가능한 통신 시스템에 대하여 살펴보겠다.
통신 시스템은, 서로 다른 무선 인터페이스 및/또는 물리 계층을 이용할 수도 있다. 예를 들어, 통신 시스템에 의해 이용 가능한 무선 인터페이스에는, 주파수 분할 다중 접속(Frequency Division Multiple Access; 'FDMA'), 시분할 다중 접속(Time Division Multiple Access; 'TDMA'), 코드 분할 다중 접속(Code Division Multiple Access; 'CDMA'), 범용 이동통신 시스템(Universal Mobile Telecommunications Systems; 'UMTS')(특히, LTE(Long Term Evolution), 이동통신 글로벌 시스템(Global System for Mobile Communications; 'GSM') 등이 포함될 수 있다. 이하에서는, 설명의 편의를 위하여, CDMA에 한정하여 설명하도록 한다. 그러나, 본 발명은, CDMA 무선 통신 시스템을 포함한 모든 통신 시스템 적용될 있음은 당연하다.
도4에 도시된 바와 같이, CDMA 무선 통신 시스템은, 복수의 단말기들(100), 복수의 기지국(Base Station; 'BS')(270), 기지국 제어부(Base Station Controllers; 'BSCs')(275), 이동 스위칭 센터(Mobile Switching Center; 'MSC')(280)를 포함할 수 있다. MSC(280)는, 일반 전화 교환망(Public Switched Telephone Network; 'PSTN')(290)과 연결되도록 구성되고, BSCs(275)와도 연결되도록 구성된다. BSCs(275)는, 백홀 라인(backhaul line)을 통하여, BS(270)과 짝을 이루어 연결될 수 있다. 백홀 라인은, E1/T1, ATM, IP, PPP, Frame Relay, HDSL, ADSL 또는 xDSL 중 적어도 하나에 따라서 구비될 수 있다. 따라서, 복수의 BSCs(275)가 도 4에 도시된 시스템에 포함될 수 있다.
각각의 BS(270)는, 적어도 하나의 섹터를 포함할 수 있고, 각각의 섹터는, 전방향성 안테나 또는 BS(270)으로부터 방사상의 특정 방향을 가리키는 안테나를 포함할 수 있다. 또한, 각각의 섹터는, 다양한 형태의 안테나를 두 개 이상 포함할 수도 있다. 각각의 BS(270)는, 복수의 주파수 할당을 지원하도록 구성될 수 있고, 복수의 주파수 할당 각각은, 특정 스펙트럼(예를 들어, 1.25MHz, 5MHz 등)을 갖는다.
섹터와 주파수 할당의 교차는, CDMA 채널이라고 불릴 수 있다. BS(270)은, 기지국 송수신 하부 시스템(Base Station Transceiver Subsystem; 'BTSs')이라고 불릴수 있다. 이러한 경우, "기지국"이라는 단어는, 하나의 BSC(275) 및 적어도 하나의 BS(270)을 합하여 불릴 수도 있다. 기지국은, 또한 "셀 사이트"를 나타낼 수도 있다. 또는, 특정 BS(270)에 대한 복수의 섹터들 각각은, 복수의 셀 사이트로 불릴 수도 있다.
도4에 도시된 바와 같이, 방송 송신부(Broadcasting Transmitter; 'BT')(295)는, 시스템 내에서 동작하는 단말기들(100)에게 방송 신호를 송신한다. 도 1에 도시된 방송용 모듈(111)은, BT(295)에 의해 전송되는 방송 신호를 수신하 기 위해 단말기(100) 내에 구비된다.
뿐만 아니라, 도4에서는, 여러 개의 위성 위치 확인 시스템(Global Positioning System; 'GPS') 위성(300)을 도시한다. 상기 위성들(300)은, 복수의 단말기(100) 중 적어도 하나의 단말기의 위치를 파악하는 것을 돕는다. 도4에서는 두 개의 위성이 도시되어 있지만, 유용한 위치 정보는, 두 개 이하 또는 이상의 위성들에 의해 획득될 수도 있다. 도1에 도시된 GPS 모듈(115)은, 원하는 위치 정보를 획득하기 위하여 위성들(300)과 협력한다. 여기에서는, GPS 추적 기술뿐만 아니라 위치를 추적할 수 있는 모든 기술들을 이용하여 위치를 추적할 수 있다. 또한, GPS 위성들(300) 중 적어도 하나는, 선택적으로 또는 추가로 위성 DMB 전송을 담당할 수도 있다.
무선 통신 시스템의 전형적인 동작 중, BS(270)은, 다양한 단말기들(100)로부터 역 링크 신호를 수신한다. 이때, 단말기들(100)은, 호를 연결 중이거나, 메시지를 송수신 중이거나 또는 다른 통신 동작을 수행중에 있다. 특정 기지국(270)에 의해 수신된 역 링크 신호들 각각은, 특정 기지국(270)에 의해 내에서 처리된다. 상기 처리 결과 생성된 데이터는, 연결된 BSC(275)로 송신된다. BSC(275)는, 기지국들(270) 간의 소프트 핸드오프(soft handoff)들의 조직화를 포함하여, 호 자원 할당 및 이동성 관리 기능을 제공한다. 또한, BSC(275)는, 상기 수신된 데이터를 MSC(280)으로 송신하고, MSC(280)은, PSTN(290)과의 연결을 위하여 추가적인 전송 서비스를 제공한다. 유사하게, PSTN(290)은 MSC(280)과 연결하고, MSC(280)은 BSCs(275)와 연결하고, BSCs(275)는 단말기들(100)로 순 링크 신호를 전송하도록 BS들(270)을 제어한다.
본 발명에 관련된 이동 단말기에는 음성인식을 위한 알고리즘과 STT(Speech To Text)를 위한 알고리즘이 메모리(160)에 저장되어 있으며, 이동 단말기에 구비된 임의의 기능 및 상기 음성인식 기능과 STT 기능을 연계하여 사용자가 입력하는 음성을 텍스트로 변환할 수 있다. 그리고, 상기 변환된 텍스트를 상기 기능의 실행 화면에 출력할 수 있다. 여기서, 상기 특정 기능은 텍스트 메시지나 메일과 같이 텍스트를 작성하는 기능을 포함하고, 상기 텍스트 메시지나 메일 작성 기능이 실행됨에 따라, 제어부(180)는 음성인식 기능의 활성화 및 STT 기능을 자동으로 작동시킬 수 있다.
도5는 본 발명에 관련된 이동 단말기의 음성을 이용한 메뉴 제어방법을 설명하는 일 예의 흐름도로서, 이동 단말기의 제어부(180)는 활성화 제어신호를 입력받아 음성인식 기능의 활성화를 시작할 수 있다(S101). 상기 활성화 제어신호는 음성인식 기능의 활성화를 종료시킬 경우에도 이용될 수 있다.
상기 활성화 제어신호는 단말기에 구비된 특정 하드웨어 버튼, 또는 디스플레이부(151)에 표시된 소프트웨어 버튼, 또는 터치 입력, 또는 디스플레이부(151)에 표시된 특정 메뉴의 조작에 의해 생성될 수 있다. 또는, 특정 사운드나 음향, 근거리나 원거리의 무선신호, 또는 사용자의 손짓이나 몸짓(Gesture)을 포함한 신체의 동작 정보에 의해서도 생성될 수 있다.
상기 특정 사운드나 음향은 박수 소리와 같이 특정레벨 이상을 갖는 일종의 충격음을 포함할 수 있다. 상기 특정레벨 이상의 사운드나 음향은 간단한 음향레벨 검출 알고리즘(도시하지 않음)을 이용해서 검출할 수 있다.
상기 음향레벨 검출 알고리즘은 음성인식 알고리즘보다 상대적으로 간단하며 단말기의 자원을 적게 소모할 수 있다. 상기 음향레벨 검출 알고리즘(또는 회로)은 음성인식 알고리즘(또는 회로)과 별도로 구성할 수 있고, 음성인식 알고리즘의 일부 기능을 제한하는 방식으로 구현할 수도 있다.
상기 무선신호는 무선 통신부(110)를 통해 입력받을 수 있으며, 상기 사용자의 손짓이나 몸짓은 센싱부(140)를 통해 입력받을 수 있다. 상기 활성화 제어신호를 입력받는 무선 통신부(110), 사용자 입력부(130), 센싱부(140)를 통칭하여 신호 입력부라고 할 수 있다.
상기 음성인식 기능이 활성화되면, 제어부(180)는 특정 데이터베이스를 참조하여, 마이크(122)를 통해 입력받은 상기 음성데이터나 음성명령의 문맥(context)이나 내용(content)을 분석하고, 그 음성명령에 포함된 의미를 판단할 수 있다(S103, S104).
여기서, 상기 음성명령의 의미를 인식하기 위해 참조하는 데이터베이스는, 상기 음성인식 기능이 활성화되면서 그 정보범위(domain)가 특정 기능이나 메뉴에 관련된 정보들로 특정될 수 있다(S102). 예를 들어, 상기 특정되는 정보범위는 현재 디스플레이부(151)에 출력된 메뉴들이나 그 메뉴들 중 선택된 특정 메뉴의 서브 메뉴들에 관련된 정보들로 특정될 수 있다. 상기와 같이 음성명령을 인식하기 위해 참조할 데이터베이스의 정보범위가 특정됨으로써, 음성명령에 대한 인식률을 더욱 높일 수 있게 된다.
상기 서브 메뉴들에 관련된 정보들은 데이터베이스로 구성될 수 있다.
상기 정보들은 키 워드 형태일 수 있으며, 한가지 기능이나 메뉴에 대하여 복수의 정보가 대응될 수 있다. 또한, 상기 데이터베이스는 정보의 특성에 따라 복수로 구성될 수 있으며, 메모리(160)에 저장될 수 있다. 또한, 상기 각 데이터베이스에 구성된 정보들은 학습을 통해 갱신될 수 있다. 또한, 상기 각 데이터베이스의 정보들은 음성명령의 인식률 향상을 위하여, 현재 출력되고 있는 기능이나 메뉴들에 관련된 정보들로 특정될 수 있다. 또한, 상기 정보범위는 메뉴의 단계(depth)가 깊어짐에 따라 변경될 수 있다.
상기 음성명령의 의미판단 동작은, 상기 입력된 음성명령을 임시 저장해두었다가 음성인식 기능의 활성화가 종료되면 곧바로 시작하거나, 음성인식 기능의 활성화 상태에서 음성명령이 입력됨과 동시에 수행할 수 있다.
한편, 상기 음성인식 기능이 활성화 상태에 있더라도, 제어부(180)는 터치나 버튼의 입력을 검출하는 알고리즘을 계속해서 구동할 수 있다. 따라서, 상기 제어부(180)는 음성인식 기능이 활성화된 상태에서도, 음성명령 이외의 터치나 버튼과 같은 다른 입력수단을 통해서 특정 메뉴를 선택받거나 실행할 수 있다(S109, S110).
상기 제어부(180)는 상기 음성명령의 의미가 판단되면 그 결과를 출력할 수 있다(S105). 상기 결과는 상기 음성명령의 의미에 대응하는 기능이나 서비스에 관련된 메뉴를 실행시키거나, 단말기의 특정 구성요소를 제어하기 위한 제어신호, 또 는 상기 인식된 음성명령에 관련된 정보를 표시하기 위한 데이터를 포함할 수 있다.
한편, 상기 제어부(180)는 상기 결과를 출력하거나 실행할 때, 그 결과가 정확한지 여부에 대하여 사용자의 확인을 받을 수 있다(S106). 예를 들어, 상기 제어부(180)는 상기 음성명령의 인식률이 낮거나 복수의 의미로 인식될 경우, 각 의미에 관련된 복수의 메뉴들을 출력한 후, 사용자의 선택을 받아 실행할 수 있다. 또는 단순히 인식률이 높은 특정 메뉴의 실행 여부를 묻고, 사용자의 선택이나 응답을 받아 해당하는 기능이나 메뉴를 실행하거나 표시할 수 있다.
상기 특정 메뉴에 대한 실행 여부는 메시지나 음성을 출력하여 사용자에게 확인할 수 있다(예 : 텍스트 메시지작성 기능을 실행할까요? 예/아니오 로 응답해 주세요. 응답이 없으면 5초 후에 자동으로 텍스트 메시지작성 기능을 실행합니다).
이에 따라, 사용자는 음성이나 다른 입력수단을 이용하여 응답(예 : 1. 그래(Yes), 2.아니오(No))할 수 있으며, 상기 다른 입력수단으로는 하드웨어 버튼이나 소프트웨어 버튼, 또는 터치 방식으로 입력할 수 있다. 만약, 사용자의 응답이 없을 경우, 제어부(180)는 긍정 응답으로 판단하여 상기 기능이나 메뉴를 자동으로 실행할 수 있다(S107).
만약, 사용자의 응답이 부정적인 경우, 즉 상기 음성명령의 의미를 정확하게 판단하지 못하였을 경우에는 에러처리 과정을 수행할 수 있다(S108).
상기 에러처리 과정은 음성명령을 다시 입력받거나, 특정 인식률 이상을 갖는 복수의 메뉴들(또는, 유사한 의미로 해석될 수 있는 복수의 메뉴들)을 표시한 후, 사용자에 의해 어느 하나의 메뉴를 선택받을 수 있다. 만약, 특정 인식률 이상을 갖는 기능이나 메뉴가 특정 개수(예 : 2개) 미만인 경우 그 기능이나 메뉴를 자동으로 실행할 수 있다.
도6a는 본 발명에 관련된 이동 단말기의 음성인식 기능을 활성화하는 방법을 설명하기 위한 예시도이다.
상기 음성인식 기능을 계속 활성화 상태로 유지할 경우, 음성인식 알고리즘의 계속된 구동에 따라 자원소모와 전력소모가 증가하게 된다. 따라서, 이동 단말기의 불필요한 전력소모를 방지하고, 자원소모를 줄이기 위해서 음성인식 기능의 활성화 시작과 종료를 제어할 필요가 있다. 따라서, 본 발명에서는 사용자 입력부(130)에 구비된 임의의 버튼을 입력받아 활성화를 제어할 수 있다(410).
상기 임의의 버튼은 하드웨어 버튼일 수도 있고, 디스플레이부(151)에 표시된 소프트웨어 버튼이나 아이콘(411)일 수 있다. 상기 소프트웨어 버튼은 대기상태에서의 메뉴호출 버튼을 포함한다. 즉, 대기상태에서 메뉴호출 버튼이 입력되면, 제어부(180)는 메뉴 리스트를 출력하면서 동시에 음성인식 기능을 활성화할 수 있다.
또한, 상기 제어부(180)는 디스플레이부(151)에 아무것도 표시되지 않은 임의의 영역(버튼이나 메뉴 아이콘이 표시되지 않은 영역)이 터치될 경우, 상기 음성인식 기능의 활성화를 제어할 수 있다(420).
또한, 상기 제어부(180)는 특정레벨 이상의 사운드나 음향이 입력될 경우, 상기 음성인식 기능의 활성화를 제어할 수 있다(430). 예를 들어, 상기 음성인식 기능을 2가지 모드로 구동할 수 있다. 즉, 단순히 특정레벨 이상의 사운드나 음향을 검출하는 제1 모드와, 음성명령을 인식하여 그 음성명령의 의미를 판단하는 제2 모드로 구동할 수 있으며, 상기 제1 모드에서 특정레벨 이상의 사운드나 음향이 입력될 경우 제2 모드를 활성화함으로써 음성명령을 인식할 수 있다.
또한, 상기 음성인식 기능의 활성화는 근거리나 원거리의 무선신호, 또는 사용자의 손짓이나 몸짓(Gesture)을 포함한 신체의 동작 정보가 입력될 경우 제어할 수 있다(440).
한편, 상기와 같이 음성인식 기능이 활성화됨에 따라, 제어부(180)는 음성인식을 위해 참조할 수 있는 특정 데이터베이스의 정보범위를 상기 디스플레이부(151)에 표시된 메뉴 리스트에 관련된 정보들로 특정할 수 있다. 만약, 상기 메뉴 리스트에서 특정 메뉴가 선택되거나 실행될 경우, 상기 데이터베이스의 정보범위는 그 선택된 메뉴나 그 하위 메뉴들에 관련된 정보들로 특정될 수 있다.
또한, 상기 특정 메뉴가 음성명령이나 터치 입력에 의해서 선택되거나 실행될 경우, 제어부(180)는 하위 메뉴들에 관련된 도움말 정보를 음성이나 풍선 도움말 형식으로 출력할 수 있다. 예를 들어, 도6b에 도시된 바와 같이, '멀티미디어 메뉴'가 선택될 경우, 그 하위 메뉴들(예 : 방송, 카메라, 텍스트 뷰어, 게임 등)에 관련된 정보가 도움말 정보(441, 442)로서 출력될 수 있다. 또는, 도6c에 도시된 바와 같이, 특정 메뉴를 선택하기 위해 손가락을 특정 메뉴(443)에 접근시키는 경우, 서브 메뉴 리스트(444)를 출력할 수 있다. 상기 도움말 정보는 디스플레이부(151)에 출력될 때 접근 거리에 따라 투명도나 명암이 조절될 수 있다.
상기 제어부(180)는 활성화 상태를 일정시간 동안 유지한 후 자동으로 활성화 상태를 종료시킬 수 있다. 또한, 상기 제어부(180)는 특정 버튼이나 터치가 입력되고 있는 동안에만 활성화 상태를 유지한 후, 그 입력이 해제되면 활성화 상태를 종료시킬 수 있다. 또한, 상기 제어부(180)는 활성화 상태가 시작된 후, 특정시간 이상 음성이 입력되지 않으면 자동으로 활성화 상태를 종료시킬 수 있다.
도7a는 본 발명에 관련된 이동 단말기의 음성명령 인식방법을 설명하기 위한 흐름도이다.
상기와 같이 음성인식 기능이 활성화됨에 따라, 제어부(180)는 음성인식에 참조할 수 있는 데이터베이스의 정보범위를 디스플레이부(151)에 표시된 메뉴들이나 그 서브 메뉴들, 또는 현재 실행된 기능이나 메뉴에 관련된 정보들로 특정할 수 있다(S201). 상기 음성인식 기능이 활성화된 후 입력받은 음성명령은 메모리(160)의 특정 데이터베이스에 저장될 수 있다(S202, S203).
상기와 같이 정보범위가 특정된 상태에서 음성명령을 입력받으면, 제어부(180)는 음성인식 알고리즘을 이용하여, 상기 데이터베이스의 특정된 정보범위 내에서 음성명령의 내용과 문맥을 분석한다. 상기 음성명령을 분석하기 위하여 텍스트 형식의 정보로 변환할 수 있으며, 그 텍스트 형식의 정보를 메모리(160)의 특정 데이터베이스에 저장할 수 있다(S204). 그러나, 상기 음성명령을 반드시 텍스트 형식의 정보로 변환해야 하는 것은 아니다.
상기 제어부(180)는 내용과 문맥의 분석을 위하여, 상기 음성명령에 포함된 특정 단어 또는 키 워드를 검출할 수 있다(S205). 상기 검출된 단어 또는 키 워드 를 바탕으로, 특정 데이터베이스에 저장된 정보를 참조하여, 상기 음성명령의 내용이나 문맥을 분석하고 그 의미를 판단할 수 있다(S206). 그리고, 상기 참조되는 데이터베이스는 그 정보범위가 현재 실행된 기능이나 메뉴에 관련된 정보범위로 특정될 수 있으며, 그 데이터베이스를 참조하여 판단된 음성명령의 의미에 해당하는 기능이나 메뉴를 실행할 수 있다(S207).
예컨대, 텍스트 메시지작성 기능을 실행한 후 STT 기능을 이용하여 텍스트를 입력했다고 가정할 경우, 상기 음성명령의 인식을 위한 정보범위의 우선순위는, 텍스트의 수정에 관련된 명령들이나, 메시지의 전송을 위한 상대방의 검색이나 전송에 관련된 명령들로 설정될 수 있다. 상기와 같이 음성인식을 위한 정보범위가 특정 메뉴들에 관련된 정보들로 특정됨으로써, 음성인식을 위한 속도와 인식률이 향상되고 자원소모를 줄일 수 있게 된다. 상기 인식률은 특정 메뉴에 설정된 명칭과 일치하는 정도를 의미할 수 있다.
상기 음성명령의 인식률은 상기 음성명령에 포함된 정보 중, 특정 기능이나 메뉴에 관련된 정보들의 개수에 의해서 판단할 수 있다. 따라서, 상기 음성명령의 인식률은 특정 기능이나 메뉴와 정확히 일치하는 정보(예 : 메뉴 명칭)이 음성명령에 포함되어 있을 경우에 음성명령 인식률이 높아질 수 있다.
예를 들어, 도7b에 도시된 바와 같이 상기 음성명령이 6개의 단어로 이루어진 자연어(예 : I want to send text message)로 입력되었다고 가정할 경우, 특정 메뉴(예 : text message)에 관련된 의미있는 단어(예 : send, text, message)의 개수에 의해서 인식률을 판단할 수 있다. 상기 음성명령에 포함된 단어가 특정 기능 이나 메뉴에 관련된 의미있는 단어인지 여부는 데이터베이스에 저장된 정보에 따라 다를 수 있다. 예컨대, 상기 자연어 음성명령에서(예 : I want to I want to send text message) 메뉴와 관련없는 의미없는 단어는 문법적으로는 주어(I) 또는 전치사(to)가 될 수 있다.
상기 자연어는 사람들이 일상적으로 쓰는 언어를 인공적으로 만들어진 언어인 인공어와 구분하여 부르는 개념으로서, 자연어 처리 알고리즘을 이용해 처리할 수 있다. 상기 자연어에는 특정 메뉴에 관련된 정확한 명칭이 포함될 수도 있고 포함되지 않을 수도 있기 때문에, 사실상 음성명령을 100% 정확하게 인식하는 것은 어려울 수 있다. 따라서, 인식률이 특정 값(예 : 80%) 이상이면 정확하다고 판단할 수 있으며, 상기 인식률을 갖는 의미가 복수로 있을 경우(즉, 비슷한 인식률을 갖는 여러가지 의미로 해석될 수 있는 음성명령이 입력된 경우)에는 해당하는 메뉴들을 표시하고, 그 중 사용자의 선택을 받아 적어도 한가지 기능이나 메뉴를 실행할 수 있다.
상기 메뉴들을 표시함에 있어서 인식률이 상대적으로 높은 메뉴의 순서로 표시할 수 있다. 예를 들어, 도8에 도시된 바와 같이 인식률이 높은 메뉴 아이콘을 화면의 중심에 더욱 가깝게 표시할 수 있다(510). 또는 인식률이 높은 메뉴 아이콘을 더욱 크게 표시하거나 더욱 진하게 표시할 수 있다(520). 또한, 상기 복수의 메뉴 중 인식률이 높은 순서에 따라, 크기, 위치, 컬러, 명암 중 적어도 하나를 다르게 표시할 수 있으며, 하이라이트 시키거나 투명도를 조정할 수도 있다.
이때, 상기 복수로 표시된 메뉴 중 사용자의 선택도가 높은 메뉴의 인식률을 더 높게 변경할 수 있다. 즉, 상기 인식률은 사용자가 자주 선택하는 메뉴에 대하여 그 선택 회수를 학습할 수 있고, 그 선택된 메뉴에 대한 인식률을 변경할 수 있다. 따라서, 이 후에 동일하거나 유사한 발음 또는 내용으로 입력되는 음성명령에 대하여 인식률이 달라질 수 있다.
도9는 본 발명에 관련된 이동 단말기의 음성명령 인식방법을 설명하기 위한 예시도이다.
이동 단말기가 대기상태에 있는 것으로 가정하고, 상기 대기상태에서 사용자에 의해 특정 메뉴(예 : 메시지)가 선택될 경우, 제어부(180)는 상기 선택된 메뉴의 서브 메뉴들을 디스플레이한다(610). 그리고, 내부적으로 음성인식 기능의 활성화를 시작한다. 상기 음성인식 기능의 활성화가 시작되면, 제어부(180)는 기설정된 환경설정 옵션에 따라, 상기 음성명령의 인식을 위한 데이터베이스의 정보범위를 상기 디스플레이된 서브 메뉴들(610)에 관련된 정보들로 특정하여 설정할 수 있다.
상기와 같이 서브 메뉴들이 디스플레이된 상태에서 제어부(180)는 사용자의 음성명령, 또는 터치나 버튼을 입력받아 특정 메뉴(621)를 선택할 수 있다. 상기와 같이 음성명령 또는 터치나 버튼 입력을 받아 특정 메뉴(621)가 선택되면, 제어부(180)는 그 서브 메뉴들을 디스플레이할 수 있다(620).
상기 서브메뉴가 디스플레이된 상태(620)에서 자연어 음성명령(예 : I want to send text message)이 입력될 경우, 제어부(180)는 상기 음성명령의 내용과 문맥에 따라, 특정 기능이나 메뉴에 관련된 의미 있는 단어 또는 키 워드(예 : send, text, message)를 검출하고, 특정 데이터베이스에서 상기 서브 메뉴들에 관련된 정 보들과 비교하여 인식률이 가장 높은 의미를 판단한다.
그리고, 상기 판단된 의미에 관련된 메뉴(예 : send text)를 실행한다.
또한, 제어부(180)는 단말기의 동작상태나 동작모드(예 : 음성인식 기능을 안내하는 모드)에 따라, 특정 메뉴가 음성명령이나 터치 입력에 의해서 선택되거나 실행될 경우, 제어부(180)는 하위 메뉴들에 관련된 도움말 정보를 음성이나 텍스트 형식의 풍선 도움말로 출력할 수 있다.
상기 도움말을 출력하는 동작모드는 환경설정 메뉴에 관련된 옵션을 구비하여 설정할 수 있다. 이에 따라, 본 발명은 음성명령에 대한 사용자의 숙련도에 관계없이, 버튼이나 터치 입력 및 음성명령에 의해서 특정 기능이나 서비스에 관련된 메뉴를 제어할 수 있다.
한편, 상기 음성명령의 의미가 복수로 인식된 경우, 즉, 자연어 음성명령에 정확한 메뉴의 명칭이 포함되어 있지 않은 경우, 예를 들어, "메시지 전송" 카테고리에 포함되지만, "send photo", "sned shotmail", "outbox" 중, 사용자가 선택하기를 원하는 메뉴가 정확히 어떤 메뉴에 관련된 것인지 판단되지 않을 경우, 제어부(180)는 특정 값(예 : 80%) 이상의 인식률을 갖는 복수의 메뉴를 표시할 수 있다. 그러나, 특정 값 이상의 인식률을 갖는 메뉴가 둘 미만인 경우에는 해당 기능이나 메뉴를 자동으로 실행시킬 수 있다.
도10은 본 발명에 관련된 이동 단말기의 음성명령 인식을 위한 데이터베이스의 구성을 설명하기 위한 예시도이다.
상기 데이터베이스는 음성명령의 의미를 판단하기 위한 정보들을 저장하는 것으로, 그 정보들의 특성에 따라 복수의 데이터베이스를 구성할 수 있다. 상기 정보들의 특성에 따라 구성된 각 데이터베이스는 제어부(180)의 제어를 받아 지속적인 학습을 통해 정보를 업데이트 할 수 있다.
상기 데이터베이스의 학습이란, 사용자가 발음하는 음성을 그에 해당하는 단어와 대응시키는 것으로, 예를 들어, 사용자가 "waiting"이라고 발음했으나 "eighteen"이라고 인식되었을 경우, 사용자가 "eighteen"을 "waiting"로 수정해 줌으로써, 이후부터 동일한 발음에 대하여 "waiting"으로 인식될 수 있도록 학습하는 것이다. 상기 학습을 통해 데이터베이스의 각 정보들에 복수의 음성정보가 대응될 수 있다.
상기 정보들의 특성에 따른 각 데이터베이스는, 마이크를 통해 입력받은 음성을 음소, 음절, 또는 형태소 단위로 인식하기 위한 음성 정보를 저장하는 제1 데이터베이스(161), 상기 인식된 음성정보를 바탕으로 음성명령의 전체적인 의미를 판단하기 위한 정보(예 : 문법, 발음 정확도, 문장 구조 등)를 저장하는 제2 데이터베이스(162), 이동 단말기에 구비된 기능이나 서비스를 위한 메뉴에 관련된 정보들을 저장하는 제3 데이터베이스(163), 상기 판단된 음성명령의 의미를 사용자로부터 확인받기 위해 단말기에서 출력할 메시지 또는 음성 정보를 저장하는 제4 데이터베이스(164)를 포함할 수 있다.
상기 제3 데이터베이스(163)는 상술한 음성명령 인식을 위해 설정된 정보범위에 따라, 특정 카테고리의 메뉴들에 관련된 정보로 특정될 수 있다. 상기 각 데이터베이스에는 음성(발음) 정보 및 그 음성(발음) 정보에 대응하는 음소, 음절, 형태소, 단어, 키 워드, 또는 문장 정보가 저장될 수 있다.
따라서, 제어부(180)는 상기 복수의 데이터베이스(161 ~ 164) 중 적어도 어느 하나를 이용하여, 음성명령에 포함된 의미를 판단하는 동작을 수행하고, 그 판단된 음성명령의 의미에 해당하는 기능이나 서비스에 관련된 메뉴를 실행할 수 있다. 또한, 본 발명은 음성명령 인식 기능이나 STT 기능이 적용되고 있는 동작상태나 동작모드를 특정 모양의 인디케이터(Indicator)나 아이콘을 이용해 표시할 수 있다. 상기 인디케이터나 아이콘의 출력 시 특정 음향이나 음성을 출력하여 사용자에게 통보할 수 있다.
도11은 본 발명에 관련된 이동 단말기의 텍스트 수정 방법의 일 예를 설명하는 흐름도로서, 사용자가 텍스트 메시지 작성 기능을 실행한 후 STT(speech to text) 기능을 이용하여 음성으로 메시지 내용을 작성한다고 가정한다.
이에 도시된 바와 같이 제어부(180)는 사용자가 음성을 입력하면(S301), 그 음성을 텍스트로 변환하여 화면에 디스플레이한다(S302). 상기와 같이 음성을 텍스트로 변환하기 위하여 제어부는 임의의 STT 알고리즘을 사용할 수 있다.
상기 사용자로부터 입력받은 음성의 텍스트 변환이 완료되면, 제어부(180)는 상기 변환된 텍스트를 디스플레이한다(S303). 상기 텍스트는 복수의 워드로 구성된 문장일 수 있으며, 만약, 상기 디스플레이된 텍스트에 잘못 인식된 워드가 포함되어 있을 경우, 사용자는 상기 잘못 인식된 텍스트를 수정하기 위하여 어느 한 워드를 선택할 수 있다(S304).
사용자는 상기 텍스트에서 수정할 어느 하나의 워드를 선택하기 위하여, 기설정된 키, 터치, 접근, 손가락 제스처(Finger Gesture), 특정 부분에 가해지는 압력, 자세(기울기 방향), 또는 음성 명령을 이용할 수 있다. 이를 위해 본 발명의 이동 단말기는 근접(proximity) 검출 센서, 압력 검출 센서, 자세 검출 센서를 구비할 수 있다.
제어부(180)는 상기 사용자가 선택한 워드를 텍스트 내의 다른 워드보다 상대적으로 강조하여 표시할 수 있다. 예컨대, 상기 선택된 워드의 컬러나 밝기를 변경하거나, 다른 워드보다 더 두껍거나 크게 표시하거나, 깜박이도록 표시하거나, 밑줄을 표시하여 강조할 수 있다.
그리고, 제어부(180)는 상기 사용자가 선택한 워드와 유사한 발음을 갖는 워드(이하, 후보 워드라고 함)들을 표시할 수 있다(S305). 예컨대, 상기 선택된 워드가 'sea'이라면, 그 워드와 유사한 발음을 갖는 후보 워드들로서, 'see', 'set', 'saw' 등이 표시될 수 있다. 이때, 상기 후보 워드들이 반드시 데이터베이스로 미리 설정되어 있어야 하는 것은 아니며, 음성인식 단계에서 인식한 특정 인식률 이상을 갖는 워드들 중, 상위의 인식률을 갖는 워드부터 순차로 표시할 수 있다.
제어부(180)는 사용자로부터 상기 후보 워드들 중 하나(예 : see)를 선택받고(S306), 상기 텍스트 내에서 선택된 워드(예 : sea)를 상기 선택된 후보 워드(예 : see)로 변경할 수 있다(S307). 사용자는 상기 후보 워드들 중 하나를 선택하기 위하여 기설정된 키, 터치, 접근, 손가락 제스처(Finger Gesture), 특정 부분에 가해지는 압력, 자세(기울기 방향), 또는 음성 명령을 이용할 수 있다.
상기 텍스트 내에서 특정 워드를 선택받아 다른 후보 워드로 변경하는 과정은 반복적으로 수행될 수 있으며, 사용자는 상술한 다양한 입력 방법을 이용하여 텍스트 수정을 완료할 수 있다. 상기 텍스트의 수정이 완료되면, 제어부(180)는 수정된 텍스트를 디스플레이한다.
도12a 내지 도12b는 본 발명에 관련된 이동 단말기의 화면에 표시된 텍스트를 수정하기 위하여 임의의 워드를 선택받는 방법을 설명하기 위한 일 예시도이다.
사용자가 이동 단말기에서 텍스트 메시지나 이-메일 작성 기능을 실행한 후 그 메시지의 내용을 음성으로 입력한다고 가정한다.
도12a에 도시된 바와 같이, 제어부(180)는 메모리(160)에 저장된 임의의 STT(Speech To Text) 알고리즘을 이용해 사용자가 입력하는 음성을 텍스트로 변환하고, 그 변환된 텍스트를 메시지 작성 화면이나 이-메일 작성 화면에 표시한다. 이때, 제어부(180)는 음성 인식률이 특정 기준치 이하인 워드를 텍스트 내의 다른 워드들보다 강조하여 표시할 수 있으며, 그 워드에 커서(810)를 자동으로 위치시켜 표시할 수도 있다.
또한, 도12b의 (a)에 도시된 바와 같이, 사용자는 수정해야될 워드를 선택하기 위하여 방향키(830)를 입력하여 상기 커서를 다른 워드로 이동시킬 수 있으며, 특정 키(하드웨어 키 또는 소프트웨어 키)를 입력하여 상기 커서가 위치하고 있는 워드를 선택할 수 있다. 그 이외에도 기설정된 입력 방식, 예컨대, 하드웨어 또는 소프트웨어 키, 터치, 접근, 손가락 제스처(Finger Gesture), 특정 부분에 가해지는 압력, 또는 이동 단말기의 자세(기울기 방향)를 이용해 사용자로부터 수정하고 자 하는 워드를 선택받을 수 있다.
그리고, 상기 선택된 워드를 다른 워드들보다 상대적으로 강조시켜 표시할 수 있다(820). 예컨대, 사용자가 상기 다양한 입력 방법들 중 한가지 방법을 이용하여 수정하고자 하는 워드(예 : sea)를 선택하였다면, 제어부(180)는 상기 선택된 워드의 컬러나 밝기를 변경하거나, 더 두껍거나 크게 표시하거나, 깜박이도록 표시하거나, 밑줄을 추가로 표시할 수 있다.
또한, 도12b의 (b)에 도시된 바와 같이, 제어부(180)는 사용자가 입력하는 음성을 이용해 상기 텍스트에서 수정해야될 워드를 곧바로 선택받을 수 있다. 마찬가지로, 제어부(180)는 상기 선택받은 워드를 다른 워드들보다 상대적으로 강조시켜 표시할 수 있다.
상기와 같이 텍스트 내에서 사용자가 수정하고자 하는 임의의 한 워드가 선택되면, 제어부(180)는 그 선택된 워드와 유사한 발음을 갖는 워드(후보 워드)들을 표시할 수 있다.
도13a 내지 도13b는 본 발명에 관련된 이동 단말기의 화면에 표시된 텍스트에서 사용자로부터 선택된 특정 워드에 대한 후보 워드들을 표시하는 방법을 설명하기 위한 일 예시도이다.
도13a에 도시된 바와 같이, 상기 선택된 특정 워드(또는, 수정해야될 워드)에 대한 후보 워드들(이하, 후보 워드 리스트라고 기재함)은 화면의 일 측 영역에 팝 업 윈도우(840) 형태로 표시될 수 있다. 도13a에 도시된 바와 같이 상기 후보 워드들에는 순차로 넘버(예 : 1,2,3)를 부가하여 키패드의 숫자 키로 후보 워드를 선택할 수 있도록 할 수 있다.
예컨대, 상기 선택된 워드가 'sea'라면, 그 선택된 워드와 유사한 발음을 갖 는 후보 워드 리스트(예 : see, set, saw)가 팝 업 윈도우(840)에 표시된다. 이때, 상기 팝 업 윈도우에 표시된 후보 워드 리스트는 확률(정확하게 음성 인식된 워드일 확률, 또는 음성 인식률)이 높은 순서로 표시될 수 있다.
또한, 도13b에 도시된 바와 같이, 상기 선택된 특정 워드(예 : sea)를 중심으로 그 주위에 각기 특정 간격을 갖는 후보 워드들을 표시할 수 있다. 상기 후보 워드들은 각각의 확률(850, 정확하게 음성 인식된 워드일 확률, 또는 음성 인식률)에 따라 상기 특정 워드로부터의 거리가 다르게 표시될 수 있다. 예컨대, 확률(850)이 높은 후보 워드일수록 상기 특정 워드와의 거리가 가깝게 표시되고, 확률이 낮은 후보 워드일수록 상기 특정 워드와의 거리가 멀게 표시될 수 있다. 이하 이러한 형태를 트리 다이아그램이라고 할 수 있다.
상기 각 후보 워드들의 확률은 문법적으로 판단될 수도 있고 학습에 의해서도 판단될 수 있다. 또한 상기 각 후보 워드들의 확률은 학습을 통해 자동으로 변경될 수도 있고 사용자에 의해 수동으로 변경될 수도 있다. 즉, 사용자가 특정 후보 워드를 선택한 후, 슬라이드 바를 이동시키는 것처럼, 상기 선택된 특정 워드에 가깝도록 끌어당기거나 위치를 이동시킬 수 있으며, 그 위치의 이동에 따라 확률이 변경될 수 있다.
이때, 제어부(180)는 상기 각 후보 워드들에 대한 확률을 추가로 표시할 수 있으며, 상기 각 후보 워드들이 서로 겹쳐 표시되지 않도록 방사형으로 펼쳐서 표시할 수 있지만, 반드시 특정 모양을 추종하여 표시할 필요는 없다.
상기와 같이 후보 워드 리스트가 표시되면, 도14a 내지 도14b에 도시된 바와 같이, 사용자는 그 후보 워드 리스트 중 한 후보 워드를 선택하여, 상기 선택된 특정 워드(예 : sea)를 변경할 수 있다. 즉, 도14a에 도시된 바와 같이 사용자가 상 기 후보 워드들 중 하나(예 : 1.see)를 선택하면, 제어부(180)는 상기 텍스트에서 선택된 워드(예 : sea)를 상기 후보 워드 리스트에서 선택된 특정 후보 워드(예 : see)로 변경한다.
여기서, 상기 후보 워드 리스트에서 특정 후보 워드가 선택되면, 제어부(180)는 후보 워드 리스트를 삭제하고, 상기 텍스트에서 선택된 워드(예 : sea)가 상기 후보 워드(예 : see)로 변경 완료되면, 텍스트 내에서 그 변경된 워드(예 : see)를 다른 워드에 대하여 상대적으로 강조하여 표시할 수 있다(860).
또한, 도14b의 (a)에 도시된 바와 같이, 사용자가 텍스트에서 수정해야될 워드(예 : sea)를 선택한 후, (b)에 도시된 바와 같이 그 선택된 워드를 수정할 워드(예 : see)를 음성으로 입력하면, 제어부(180)는 (c)에 도시된 바와 같이 상기 텍스트에서 선택된 워드(예 : sea)를 상기 음성 입력된 워드(예 : see)로 곧바로 변경한다.
만약, 텍스트 내에 추가로 수정해야될 워드가 있으면, 상술한 방법에 의해 수정해야될 워드에 대한 후보 워드들 중 하나를 선택하여 변경하는 과정을 반복 수행할 수 있다.
이상으로 음성을 텍스트로 변환할 때 정확하게 인식되지 않은 특정 워드(또는, 수정해야될 특정 워드)를 수정하는 방법으로서, 상기 수정해야될 특정 워드에 대한 후보 워드 리스트를 표시하고, 그 후보 워드 리스트 중 하나를 선택하여 상기 특정 워드를 변경하는 방법에 대하여 설명하였다. 이하, 상기 수정해야될 특정 워드를 선택한 후 그 워드를 구성하는 각 문자의 편집 방법에 대하여 설명한다.
도15는 본 발명에 관련된 이동 단말기의 텍스트 수정 방법의 다른 일 예를 설명하는 흐름도로서, STT(speech to text) 기능을 이용하여 작성된 텍스트에서 선택된 워드의 문자를 편집하여 수정하는 방법에 대하여 설명한다.
상술한 바와 같이 제어부(180)는 사용자가 음성을 입력하면(S401), 그 음성을 텍스트로 변환하여 디스플레이 한다(S402).
상기 텍스트는 한 문장이 될 수도 있고 그 이상의 문장이 될 수도 있다. 사용자는 상기 디스플레이된 텍스트를 확인한 후, 부정확하게 인식된 워드(이하, 수정해야될 워드로 기재함)가 포함되어 있다면, 그 텍스트에서 수정해야될 워드를 선택한다. 상기 수정해야될 워드를 선택하고 편집하기 위하여, 사용자는 기설정된 키, 터치, 접근, 손가락 제스처(Finger Gesture), 특정 부분에 가해지는 압력, 이동 단말기의 자세(기울기 방향), 또는 음성 명령을 이용할 수 있다.
상기와 같이 텍스트에서 수정해야될 워드가 선택되면(S403), 제어부(180)는 상기 수정해야될 워드를 변경할 수 있는 후보 워드 리스트를 표시할 수 있으며, 사용자는 상기 후보 워드 리스트의 표시에 관계없이 상기 수정해야될 워드의 문자를 편집할 수 있다. 즉, 제어부(180)는 기설정된 환경설정 옵션, 또는 사용자가 입력한 명령에 따라, 상기 선택된 워드를 편집할 수 있는 화면을 표시할 수 있다(S404).
예컨대, 사용자는 상기 선택된 워드의 문자를 편집하기 위하여 기설정된 음성 명령(예 : Modify)을 입력할 수 있다. 상기 음성 명령은 수정을 지시하는 명령의 의미와 수정할 워드를 선택하는 명령의 의미를 동시에 가질 수 있다. 제어 부(180)는 상기 음성 명령에 이어서 사용자로부터 상기 텍스트에서 선택받고자 하는 특정 워드를 연속으로 입력받으면, 그 특정 워드를 편집할 수 있는 화면을 표시한다.
또 다른 예로서, 사용자의 워드 선택 수단(예 : 손가락, 스타일러스펜)이 상기 텍스트에 접근하면, 제어부(180)는 상기 선택 수단이 접근하고 있는 특정 워드를, 그 선택 수단의 접근 거리에 따라, 텍스트 내의 다른 워드들보다 강조하여 표시한다. 그리고, 사용자의 워드 선택이 확정되면 그 확정된 워드를 편집할 수 있는 화면을 표시한다. 이때, 사용자가 상기 선택 수단을 이용해 접근중인 어느 한 워드를 터치함으로써 워드 선택을 확정할 수 있다.
또 다른 예로서, 상기 워드 선택 수단이 텍스트를 가볍게 터치하면, 또는 터치한 상태로 텍스트 위를 이동하면, 제어부(180)는 상기 선택 수단이 터치되고 있는 특정 워드를 다른 워드들보다 강조하여 표시할 수 있다. 일반적으로 상기와 같이 특정 객체를 터치한 상태로 이동시키는 동작을 드레그라고 한다. 그리고, 사용자가 그 강조된 워드를 참조한 후 워드 선택을 확정하면 그 워드를 편집할 수 있는 화면을 표시할 수 있다. 이때, 사용자가 상기 터치중인 어느 한 워드에 압력을 가함으로써 워드 선택을 확정할 수 있다.
상기와 같이 본 발명의 이동 단말기는 워드 선택을 위한 사용자의 예비동작(예 : 워드 접근 동작, 또는 압력이 기준치 이하인 가벼운 터치 동작)과 확정동작(예 : 접근한 워드를 터치하는 동작, 또는 기준치 이상의 압력을 가하는 터치 동작)을 구분한다. 상기 기재된 방법 이외에도 다양한 방법으로 예비동작과 확정동작을 구분할 수 있다.
상기 워드를 편집할 수 있도록 표시하는 모드를 워드 편집 모드라고 한다.
상기 워드 편집 모드는 기설정된 환경설정 옵션에 따라, 워드가 선택되면 자동으로 실행될 수도 있고(이하, 자동 워드 편집 모드라고 기재함), 워드가 선택된 후 사용자로부터 수동으로 기설정된 특정 명령이 입력될 때 실행될 수도 있다(이하, 수동 워드 편집 모드라고 기재함).
이때, 상기 워드 편집 모드에서, 제어부(180)는 편집되고 있는 워드를 텍스트 내의 다른 워드들보다 강조하여 표시할 수 있고, 상기 워드의 편집이 완료되면(S405), 그 편집된 워드로 텍스트를 수정한다(S406).
도16a와 도16b는 본 발명에 관련된 이동 단말기에 디스플레이된 특정 워드를 편집하는 방법을 설명하기 위한 일 예시도이다.
도16a의 (a)에 도시된 바와 같이, 제어부(180)는 사용자가 음성을 입력하면 그 음성을 텍스트로 변환하여 디스플레이한다. 이때 제어부(180)는 부정확하게 인식된 워드, 즉 음성 인식률이 기설정된 특정 기준치 이하인 워드(또는, 수정해야될 확률이 높은 워드)를 다른 워드보다 강조하여 표시할 수 있다.
사용자는 상기 디스플레이된 강조된 워드 정보를 참조할 수 있으며, 상기 텍스트에서 수정해야될 워드를 선택할 수 있다. 사용자는 상기 강조된 워드를 선택할 수도 있고 강조되지 않은 워드를 선택할 수도 있다.
이에 따라, 도16a의 (b)에 도시된 바와 같이, 제어부(180)는 상기 사용자로부터 선택된 워드(수정해야될 워드)를 다른 워드들보다 상대적으로 강조시켜 표시할 수 있다. 예컨대, 상기 선택된 워드의 컬러나 밝기를 변경하거나, 선택된 워드 를 다른 워드보다 상대적으로 더 두껍거나 크게 표시하거나, 깜박이거나 밑줄과 같은 효과를 적용하여 강조할 수 있다.
또한, 상기 수정해야될 워드의 선택을 위해 사용자의 선택 수단이 텍스트에 접근하면, 도16a의 (c)에 도시된 바와 같이, 제어부(180)는 상기 선택 수단이 접근하고 있는 특정 워드(예 : sea)를, 그 선택 수단의 접근 거리에 따라, 상대적으로 강조하여 표시할 수 있다. 그리고, 상기 선택 수단에 의해 특정 워드가 터치되면 그 터치된 워드를 수정해야될 워드로 확정한다. 또한, 기설정된 특정 기준치 이상의 압력이 가해질 경우에 상기 수정해야될 워드가 확정될 수도 있다.
상기 수정해야될 워드가 확정 선택되면, 제어부(180)는 기설정된 환경설정 옵션에 따라, 별도의 워드 편집 화면을 표시할 수도 있고, 또는 확정 선택된 워드에 박스를 표시하여, 텍스트 내의 다른 워드와 구분하는 방식으로 워드 편집화면(또는 편집창)(870)을 표시할 수도 있다. 이때, 제어부(180)는 상기 워드 편집 화면이나 텍스트의 투명도를 조정하여 서로 오버랩시켜 표시할 수도 있다.
상기 워드 편집이 완료되면, 도16a의 (d)에 도시된 바와 같이, 제어부(180)는 사용자로부터 상술한 워드 선택 방법들 중 어느 한가지 방식으로 워드 편집 완료 명령을 입력받아 편집을 완료할 수 있다. 또는, 화면에 표시된 소프트웨어 키(예 : EDIT key)를 입력받아 워드 편집을 완료할 수도 있다.
도16b는 상기 도16a에서 선택된 워드를 편집하는 방법을 설명하기 위한 일 예시도로서, 상기 디스플레이된 텍스트에서 수정해야될 워드의 선택이 확정되면, 도16b의 (a)에 도시된 바와 같이, 제어부(180)는 그 선택된 워드를 변경할 수 있는 후보 워드 리스트(841)를 표시할 수 있다. 그러나, 상기 후보 워드 리스트(841)에도 변경 가능한 워드가 없을 경우, 사용자는 기설정된 특정 키(예 : EDIT 키, 831)를 입력하여, 상기 선택된 워드를 사용자가 직접 편집할 수 있다.
제어부(180)는 상기 특정 키(831)가 입력되면, 도16b의 (b)에 도시된 바와 같이, 디스플레이부(151)에 문자 입력을 위한 소프트웨어 키패드(832)를 표시할 수 있다. 여기서, 상기 키패드(832)는 편집중인 언어의 종류(예 : 한글, 영어, 숫자, 특수 문자)에 따라 자동으로 표시될 수 있다. 사용자는 상기 디스플레이부(151)에 표시된 소프트웨어 키패드(832)를 이용하여 상기 선택된 워드를 편집할 수 있다. 또한, 도16b의 (c)에 도시된 바와 같이, 기구비되어 있는 제2 사용자 입력부(215)를 이용하여 상기 선택된 워드를 편집할 수도 있다.
도17a와 도17b는 본 발명에 관련된 이동 단말기에 디스플레이된 특정 워드를 편집하는 방법을 설명하기 위한 또 다른 일 예시도이다.
도17a의 (a)에 도시된 바와 같이, 제어부(180)는 사용자로부터 입력받은 음성을 텍스트로 변환하여 디스플레이하고, 그 변환된 텍스트 중에서 음성 인식률이 기설정된 특정 기준치 이하인 워드(또는, 수정해야될 확률이 높은 워드)(820)를 다른 워드보다 강조하여 표시할 수 있다.
사용자는 상기 디스플레이된 정보를 참조하여 수정해야될 워드를 선택할 수 있으며, 상기 표시 정보에 관계없이 수정해야될 워드를 선택할 수도 있다. 상기 수정해야될 워드가 선택되면 제어부(180)는 후보 워드 리스트(841)를 표시할 수 있다. 그러나, 상기 후보 워드 리스트에 수정 가능한 워드가 없다면, 사용자는 상기 후보 워드 리스트의 표시에 관계없이 워드 편집 모드를 실행할 수 있다.
상기 워드 편집 모드의 실행을 위하여, 상기 수정해야될 워드(예 : sea)를 선택한 상태에서, 사용자는 기설정된 입력 방식(예 : 키 조작, 터치, 압력, 음성, 접근)으로 워드 편집을 위한 명령을 입력할 수도 있고, 상기 수정해야될 워드를 더블 터치(또는 롱 터치)하여 워드 편집 모드를 실행할 수도 있다.
상기 워드 편집 모드에서 제어부(180)는 상기 선택된 워드(수정해야될 워드)를 별도의 워드 편집 화면으로 표시할 수 있다. 또는, 도17a의 (b),(c)에 도시된 바와 같이 선택된 워드에 박스(870)를 표시하여, 텍스트 내의 다른 워드와 구분하는 형식으로 워드 편집 화면을 표시할 수도 있다.
사용자는 상기 워드 편집이 완료되면, 도17a의 (d)에 도시된 바와 같이, 상술한 워드 선택 방법들 중 어느 한가지 방식으로 편집을 완료할 수 있다. 또는, 화면에 디스플레이된 특정 키(예 : EDIT key)를 입력받아 워드 편집을 완료할 수도 있다.
도17b는 상기 도17a에서 선택된 워드를 편집하는 방법을 설명하기 위한 일 예시도로서, 상기 디스플레이된 텍스트에서 수정해야될 워드의 선택이 확정되면, 상술한 바와 같이, 제어부(180)는 그 선택된 워드를 변경할 수 있는 후보 워드 리스트(841)를 표시할 수 있다. 그러나, 상기 후보 워드 리스트(841)에도 변경 가능한 워드가 없을 경우, 사용자는 기설정된 특정 키(예 : EDIT key, 831)를 입력하여, 상기 선택된 워드를 사용자가 직접 편집할 수 있다.
제어부(180)는 상기 특정 키(831)가 입력되면, 도17b의 (a)에 도시된 바와 같이, 디스플레이부(151)에 문자 입력을 위한 소프트웨어 키패드(832)를 표시할 수 있다. 여기서, 상기 키패드(832)는 편집중인 언어의 종류(예 : 한글, 영어, 숫자, 특수 문자)에 따라 자동으로 표시될 수 있다. 사용자는 상기 디스플레이부(151)에 표시된 소프트웨어 키패드(832)를 이용하여 상기 선택된 워드를 편집할 수 있으며, 도17b의 (b)에 도시된 바와 같이, 기구비되어 있는 제2 사용자 입력부(215)를 이용하여 상기 선택된 워드를 편집할 수도 있다.
본 발명의 일실시 예에 의하면, 전술한 방법은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 컴퓨터는, 단말기의 제어부(180)를 포함할 수도 있다.
상기와 같이 설명된 이동 단말기는 상기 설명된 실시 예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시 예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
도 1은 본 발명의 일 실시예와 관련된 이동 단말기의 블록 구성도.
도 2는 본 발명과 관련된 이동 단말기의 일 예를 전면에서 바라본 사시도.
도 3은 도2의 이동 단말기의 후면 사시도.
도 4는 본 발명에 관련된 단말기가 동작 가능한 통신 시스템의 예시도.
도 5는 본 발명에 관련된 이동 단말기의 음성을 이용한 메뉴 제어방법을 설명하는 일 예의 흐름도.
도 6a는 본 발명에 관련된 이동 단말기의 음성인식 기능을 활성화하는 방법을 설명하기 위한 예시도.
도 6b와 도 6c는 본 발명에 관련된 이동 단말기의 도움말 정보 출력방법을 설명하기 위한 예시도.
도 7a는 본 발명에 관련된 이동 단말기의 음성명령 인식방법을 설명하기 위한 흐름도.
도 7b는 본 발명에 관련된 이동 단말기의 음성인식 방법을 설명하기 위한 예시도.
도 8은 본 발명에 관련된 이동 단말기의 음성 인식률에 따른 메뉴 표시 방법을 설명하기 위한 예시도.
도 9는 본 발명에 관련된 이동 단말기의 음성명령 인식방법을 설명하기 위한 예시도.
도 10은 본 발명에 관련된 이동 단말기의 음성명령 인식을 위한 데이터베이 스의 구성을 설명하기 위한 예시도.
도 11은 본 발명에 관련된 이동 단말기의 텍스트 수정 방법의 일 예를 설명하는 흐름도.
도 12a와 도 12b는 본 발명에 관련된 이동 단말기의 화면에 표시된 텍스트를 수정하기 위하여 임의의 워드를 선택받는 방법을 설명하기 위한 일 예시도.
도 13a와 도 13b는 본 발명에 관련된 이동 단말기의 화면에 표시된 텍스트에서 사용자로부터 선택된 특정 워드에 대한 후보 워드들을 표시하는 방법을 설명하기 위한 일 예시도.
도 14a와 도 14b는 본 발명에 관련된 이동 단말기 화면에 표시된 텍스트를 후보 워드 리스트에서 선택한 후보 워드로 변경하는 방법을 보인 예시도.
도 15는 본 발명에 관련된 이동 단말기의 텍스트 수정 방법의 다른 일 예를 설명하는 흐름도.
도 16a와 도 16b는 본 발명에 관련된 이동 단말기에 디스플레이된 특정 워드를 편집하는 방법을 설명하기 위한 일 예시도.
도 17a와 도 17b는 본 발명에 관련된 이동 단말기에 디스플레이된 특정 워드를 편집하는 방법을 설명하기 위한 또 다른 일 예시도.

Claims (28)

  1. 음성을 입력받기 위한 음성수신부와;
    상기 음성수신부에서 입력받은 음성을 텍스트로 변환하기 위한 제어부와;
    상기 변환된 텍스트를 표시하기 위한 디스플레이부와;
    상기 디스플레이부에 표시된 텍스트에 포함된 워드(word)를 터치 방식으로 선택하는 입력부를 포함하며,
    상기 제어부는 상기 입력부를 통해 선택된 워드와 그 워드에 해당하는 후보 워드의 유사도에 근거하여, 상기 선택된 워드에 해당하는 다수의 후보워드들을 상기 선택된 워드로부터 근접하여 배열되게 표시하며, 상기 후보워드들에 키패드의 숫자 키에 대응하는 넘버를 순차로 부가하여 표시하거나 상기 후보워드들이 상기 선택된 워드와의 유사한 정도를 나타내는 확률값을 부가하여 표시하도록 상기 디스플레이부를 제어하는 것을 특징으로 하는 이동 단말기.
  2. 제 1 항에 있어서, 상기 디스플레이부는,
    상기 선택된 워드와 가장 높은 유사성을 갖는 해당 후보 워드를 상기 선택된 워드와 가장 근접하게 표시하며, 가장 낮은 유사성을 갖는 해당 후보 워드를 상기 선택된 워드로부터 가장 멀리 배열되어 표시하도록 구성되는 것을 특징으로 하는 이동 단말기.
  3. 삭제
  4. 삭제
  5. 제 1 항에 있어서, 상기 제어부는,
    상기 해당 후보 워드가 상기 선택된 워드와 얼마나 유사한지에 근거하여 트리 다이아그램(tree diagram)의 제 1 위치에 대하여 상기 선택된 워드가 위치하도록 하고 상기 다수의 후보 워드들이 상기 트리 다이아그램의 다른 위치에 위치하도록 하면서 상기 트리 다이아그램을 표시하도록 구성되는 것을 특징으로 하는 이동단말기.
  6. 제 1 항에 있어서, 상기 제어부는,
    상기 선택된 워드를 사용자에 의해 선택되는 해당 후보 워드로 변경하도록 구성되는 것을 특징으로 하는 이동단말기.
  7. 삭제
  8. 삭제
  9. 제 1 항에 있어서, 상기 디스플레이부는,
    편집창(editing window)을 표시하도록 하는 명령에 근거하여 상기 선택된 워드의 편집을 가능하게 하는 편집창을 표시하도록 구성되는 것을 특징으로 하는 이동단말기.
  10. 제 1 항에 있어서, 상기 디스플레이부는,
    상기 디스플레이부에 표시된 텍스트로부터 상기 선택된 워드를 구별하여 표시하도록 구성되는 것을 특징으로 하는 이동단말기.
  11. 음성을 입력받는 단계와;
    상기 입력받는 음성을 텍스트로 변환하는 단계와;
    상기 변환된 텍스트를 표시하는 단계와;
    상기 표시된 텍스트에 포함된 워드가 터치 방식으로 선택되면 그 워드의 선택을 나타내는 신호를 수신하는 단계를 포함하며,
    상기 표시된 텍스트에서 선택되는 워드와 그 워드에 해당하는 후보 워드의 유사도에 근거하여, 상기 선택된 워드에 해당하는 다수의 후보 워드들을 상기 선택된 워드로부터 근접하여 배열되게 표시하며, 상기 후보워드들에 키패드의 숫자 키에 대응하는 넘버를 순차로 부가하여 표시하거나 상기 후보워드들이 상기 선택된 워드와의 유사한 정도를 나타내는 확률값을 부가하여 표시하는 단계;를 포함하여 이루어진 것을 특징으로 하는 이동단말기 제어 방법.
  12. 제 11 항에 있어서, 상기 후보 워드들을 표시하는 단계에서는,
    상기 선택된 워드와 가장 높은 유사성을 갖는 해당 후보 워드를 상기 선택된 워드에 가장 근접하게 표시하며, 가장 낮은 유사성을 갖는 해당 후보 워드를 상기 선택된 워드에 가장 멀리 배열되게 표시하는 것을 특징으로 하는 이동단말기 제어 방법.
  13. 삭제
  14. 삭제
  15. 제 11 항에 있어서, 상기 후보 워드들을 표시하는 단계는,
    상기 해당 후보 워드가 상기 선택된 워드와 얼마나 유사한지에 근거하여 트리 다이아그램(tree diagram)의 제 1 위치에 대하여 상기 선택된 워드가 위치하도록 하고 상기 다수의 후보 워드들이 상기 트리 다이아그램의 다른 위치에 위치하도록 하면서 상기 트리 다이아그램을 표시하는 단계를 더 포함하는 것을 특징으로 하는 이동단말기 제어 방법.
  16. 제 11 항에 있어서,
    상기 선택된 워드를 사용자로부터 선택받는 해당 후보 워드로 변경하는 단계를 더 포함하는 것을 특징으로 하는 이동단말기 제어 방법.
  17. 삭제
  18. 삭제
  19. 제 11 항에 있어서, 상기 후보 워드들을 표시하는 단계는,
    편집창(editing window)을 표시하도록 하는 명령에 근거하여 상기 선택된 워드의 편집을 가능하게 하는 편집창을 표시하는 단계를 더 포함하는 것을 특징으로 하는 이동단말기 제어 방법.
  20. 제 11 항에 있어서, 상기 후보 워드들을 표시하는 단계는,
    디스플레이부에 표시된 텍스트로부터 상기 선택된 워드를 구별하여 표시하는 단계를 더 포함하는 것을 특징으로 하는 이동단말기 제어 방법.
  21. 음성을 입력받기 위한 음성수신부와;
    상기 음성수신부에서 입력받은 음성을 텍스트로 변환하기 위한 제어부와;
    상기 변환된 텍스트를 표시하기 위한 디스플레이부와;
    상기 표시된 텍스트에 포함된 워드를 터치 방식으로 선택하기 위한 입력부를 포함하며,
    상기 제어부는 상기 음성수신부가 상기 입력부를 통해 선택된 워드의 편집 동작을 요청하는 입력 음성 명령을 수신하도록 제어하고, 상기 디스플레이부가 상기 수신된 입력 음성 명령에 근거하여 상기 표시된 텍스트와 구분되거나 상기 텍스트에 오버랩되는 별도의 편집창을 표시하고, 상기 편집창 내에 상기 텍스트에서 선택된 워드를 표시하고, 상기 편집창 내에 있는 워드의 편집이 완료되면, 상기 편집창을 제거하고 상기 편집이 완료된 워드로 상기 텍스트의 선택된 워드를 변환하여 표시하도록 제어하는 것을 특징으로 하는 이동단말기.
  22. 삭제
  23. 삭제
  24. 삭제
  25. 음성을 입력받는 단계와;
    상기 입력받는 음성을 텍스트로 변환하는 단계와;
    상기 변환된 텍스트를 표시하는 단계와;
    상기 표시된 텍스트에 포함된 워드가 선택되면 그 워드의 선택을 나타내는 신호를 수신하는 단계를 포함하며,
    상기 수신하는 단계는 상기 선택된 워드의 편집 동작을 요청하는 입력 음성 명령을 수신하는 단계를 더 포함하며,
    상기 표시하는 단계는 상기 수신된 입력 음성 명령에 근거하여 상기 표시된 텍스트와 구분되거나 상기 텍스트에 오버랩되는 별도의 편집창을 표시하고, 상기 편집창 내에 상기 텍스트에서 선택된 워드를 표시하고, 상기 편집창 내에 있는 워드의 편집이 완료되면, 상기 편집창을 제거하고 상기 편집이 완료된 워드로 상기 텍스트의 선택된 워드를 변환하여 표시하는 단계를 더 포함하는 것을 특징으로 하는 이동단말기 제어 방법.
  26. 삭제
  27. 삭제
  28. 삭제
KR1020080053713A 2008-06-09 2008-06-09 이동 단말기 및 그의 텍스트 수정방법 KR100988397B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020080053713A KR100988397B1 (ko) 2008-06-09 2008-06-09 이동 단말기 및 그의 텍스트 수정방법
US12/355,068 US8543394B2 (en) 2008-06-09 2009-01-16 Mobile terminal and text correcting method in the same
EP09000720A EP2133869A3 (en) 2008-06-09 2009-01-20 Mobile terminal and text correcting method in the same
CN2009101287987A CN101605171B (zh) 2008-06-09 2009-03-13 移动终端及其中的文本校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080053713A KR100988397B1 (ko) 2008-06-09 2008-06-09 이동 단말기 및 그의 텍스트 수정방법

Publications (2)

Publication Number Publication Date
KR20090130350A KR20090130350A (ko) 2009-12-23
KR100988397B1 true KR100988397B1 (ko) 2010-10-19

Family

ID=40941644

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080053713A KR100988397B1 (ko) 2008-06-09 2008-06-09 이동 단말기 및 그의 텍스트 수정방법

Country Status (4)

Country Link
US (1) US8543394B2 (ko)
EP (1) EP2133869A3 (ko)
KR (1) KR100988397B1 (ko)
CN (1) CN101605171B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019135599A1 (ko) * 2018-01-05 2019-07-11 삼성전자 주식회사 음성 명령을 처리하기 위한 전자 문서 표시 방법 및 그 전자 장치

Families Citing this family (239)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US20170169700A9 (en) * 2005-09-01 2017-06-15 Simplexgrinnell Lp System and method for emergency message preview and transmission
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8595642B1 (en) 2007-10-04 2013-11-26 Great Northern Research, LLC Multiple shell multi faceted graphical user interface
US8165886B1 (en) 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
KR20090107365A (ko) * 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
KR101481408B1 (ko) 2008-06-04 2015-01-14 주식회사 팬택 이동통신 단말기에서의 최근 통화 목록을 이용한 단축다이얼 기능 제공 장치 및 방법
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
KR102339297B1 (ko) 2008-11-10 2021-12-14 구글 엘엘씨 멀티센서 음성 검출
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US20100201617A1 (en) * 2009-02-06 2010-08-12 Inventec Corporation Real-time Translation display interface and display method thereof
US9280971B2 (en) * 2009-02-27 2016-03-08 Blackberry Limited Mobile wireless communications device with speech to text conversion and related methods
US8605039B2 (en) * 2009-03-06 2013-12-10 Zimpl Ab Text input
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10540976B2 (en) * 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8494852B2 (en) 2010-01-05 2013-07-23 Google Inc. Word-level correction of speech input
US9053098B2 (en) 2010-01-14 2015-06-09 Abbyy Development Llc Insertion of translation in displayed text consisting of grammatical variations pertaining to gender, number and tense
US9031831B1 (en) * 2010-01-14 2015-05-12 Abbyy Development Llc Method and system for looking up words on a display screen by OCR comprising a set of base forms of recognized inflected words
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8676581B2 (en) * 2010-01-22 2014-03-18 Microsoft Corporation Speech recognition analysis via identification information
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20120010870A1 (en) * 2010-07-09 2012-01-12 Vladimir Selegey Electronic dictionary and dictionary writing system
KR101735836B1 (ko) * 2010-12-13 2017-05-15 삼성전자주식회사 휴대단말기의 메뉴실행 장치 및 방법
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
EP2506202A1 (en) * 2011-03-29 2012-10-03 Research In Motion Limited Mobile wireless communications device for selecting a payment account to use with a payment processing system based upon a microphone or device profile and associated methods
US9263045B2 (en) 2011-05-17 2016-02-16 Microsoft Technology Licensing, Llc Multi-mode text input
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US9185225B1 (en) * 2011-06-08 2015-11-10 Cellco Partnership Method and apparatus for modifying digital messages containing at least audio
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8468022B2 (en) 2011-09-30 2013-06-18 Google Inc. Voice control for asynchronous notifications
KR101590332B1 (ko) * 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
CN102681695B (zh) * 2012-04-25 2016-12-07 北京三星通信技术研究有限公司 光标控制方法及装置
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
CN102723080B (zh) * 2012-06-25 2014-06-11 惠州市德赛西威汽车电子有限公司 一种语音识别测试系统及方法
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
KR101971513B1 (ko) * 2012-07-05 2019-04-23 삼성전자주식회사 전자 장치 및 이의 음성 인식 오류 수정 방법
KR20140008835A (ko) * 2012-07-12 2014-01-22 삼성전자주식회사 음성 인식 오류 수정 방법 및 이를 적용한 방송 수신 장치
KR101911251B1 (ko) * 2012-07-13 2018-10-24 엘지전자 주식회사 휴대 단말기 및 그 제어 방법
KR20140014510A (ko) * 2012-07-24 2014-02-06 삼성전자주식회사 음성 인식에 의하여 형성된 문자의 편집 방법 및 그 단말
US9298295B2 (en) * 2012-07-25 2016-03-29 Facebook, Inc. Gestures for auto-correct
US10838513B2 (en) 2012-08-06 2020-11-17 Nokia Technologies Oy Responding to selection of a displayed character string
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
CN103714048B (zh) 2012-09-29 2017-07-21 国际商业机器公司 用于校正文本的方法和系统
KR102009423B1 (ko) 2012-10-08 2019-08-09 삼성전자주식회사 음성 인식을 이용한 미리 설정된 동작 모드의 수행 방법 및 장치
US8713433B1 (en) * 2012-10-16 2014-04-29 Google Inc. Feature-based autocorrection
WO2014060053A1 (de) 2012-10-16 2014-04-24 Audi Ag Bearbeiten eines textes während einer fahrt in einem kraftfahrzeug
KR101992191B1 (ko) * 2012-11-01 2019-06-24 엘지전자 주식회사 이동 단말기 및 그 제어방법
KR102023008B1 (ko) * 2012-12-10 2019-09-19 엘지전자 주식회사 음성-텍스트 변환 디스플레이 장치 및 그 방법
WO2014111959A2 (en) 2013-01-21 2014-07-24 Keypoint Technologies India Pvt. Ltd. Text input system and method
IN2013CH00469A (ko) * 2013-01-21 2015-07-31 Keypoint Technologies India Pvt Ltd
US10199051B2 (en) 2013-02-07 2019-02-05 Apple Inc. Voice trigger for a digital assistant
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
CN105027197B (zh) 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
US8768687B1 (en) * 2013-04-29 2014-07-01 Google Inc. Machine translation of indirect speech
KR102052971B1 (ko) * 2013-05-14 2020-01-08 엘지전자 주식회사 지문 스캔너를 포함하는 포터블 디바이스 및 그 제어 방법
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
KR101809808B1 (ko) 2013-06-13 2017-12-15 애플 인크. 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법
CN104281600B (zh) * 2013-07-05 2018-12-28 腾讯科技(深圳)有限公司 智能选词的方法和装置
KR102179056B1 (ko) * 2013-07-19 2020-11-16 엘지전자 주식회사 이동 단말기 및 그것의 제어방법
DE112014003653B4 (de) 2013-08-06 2024-04-18 Apple Inc. Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen
GB2518002B (en) * 2013-09-10 2017-03-29 Jaguar Land Rover Ltd Vehicle interface system
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
CN104732975A (zh) * 2013-12-20 2015-06-24 华为技术有限公司 一种语音即时通讯方法及装置
DE112015001468T5 (de) * 2014-03-27 2016-12-15 Sony Corporation Elektronische Vorrichtung und Verfahren zum Identifizieren von Eingabebefehlen eines Benutzers
US9082407B1 (en) * 2014-04-15 2015-07-14 Google Inc. Systems and methods for providing prompts for voice commands
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
EP3480811A1 (en) 2014-05-30 2019-05-08 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
CN105446572A (zh) * 2014-08-13 2016-03-30 阿里巴巴集团控股有限公司 一种用于屏幕显示设备的文字编辑方法及装置
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
KR102245747B1 (ko) 2014-11-20 2021-04-28 삼성전자주식회사 사용자 명령어 등록을 위한 디스플레이 장치 및 방법
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
CN105869632A (zh) * 2015-01-22 2016-08-17 北京三星通信技术研究有限公司 基于语音识别的文本修订方法和装置
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
EP3089159B1 (en) 2015-04-28 2019-08-28 Google LLC Correcting voice recognition using selective re-speak
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
DE102015212413A1 (de) 2015-07-02 2017-01-05 Volkswagen Aktiengesellschaft Verfahren und Vorrichtung zum Auswählen eines Bestandteils einer Spracheingabe
US10424293B1 (en) * 2015-07-21 2019-09-24 Amazon Technologies, Inc. Using audio input and output to interact with text-based interactive content
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
CN105206274A (zh) * 2015-10-30 2015-12-30 北京奇艺世纪科技有限公司 一种语音识别的后处理方法及装置和语音识别系统
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
JP2017146437A (ja) * 2016-02-17 2017-08-24 本田技研工業株式会社 音声入力処理装置
KR102561711B1 (ko) * 2016-02-26 2023-08-01 삼성전자주식회사 컨텐트를 인식하는 방법 및 장치
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
DK201670539A1 (en) * 2016-03-14 2017-10-02 Apple Inc Dictation that allows editing
US11176930B1 (en) * 2016-03-28 2021-11-16 Amazon Technologies, Inc. Storing audio commands for time-delayed execution
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10831366B2 (en) * 2016-12-29 2020-11-10 Google Llc Modality learning on mobile devices
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
CN108874797B (zh) * 2017-05-08 2020-07-03 北京字节跳动网络技术有限公司 语音处理方法和装置
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
KR101955225B1 (ko) * 2017-11-03 2019-03-08 주식회사 셀바스에이아이 전자의무기록 서비스의 편집 인터페이스를 제공하는 방법 및 장치
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
KR20190088737A (ko) * 2018-01-19 2019-07-29 현대자동차주식회사 음성 인식 장치 및 그 제어 방법
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
CN110544473B (zh) * 2018-05-28 2022-11-08 百度在线网络技术(北京)有限公司 语音交互方法和装置
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
KR102592907B1 (ko) * 2018-06-22 2023-10-23 삼성전자주식회사 텍스트 입력 디바이스 및 그 방법
JP7243106B2 (ja) * 2018-09-27 2023-03-22 富士通株式会社 修正候補提示方法、修正候補提示プログラムおよび情報処理装置
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
JP7119857B2 (ja) * 2018-09-28 2022-08-17 富士通株式会社 編集プログラム、編集方法および編集装置
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
JP2020185870A (ja) * 2019-05-14 2020-11-19 株式会社東海理化電機製作所 制御装置、制御システム及び制御プログラム
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators
CN110767234B (zh) * 2019-10-31 2022-12-23 抖音视界有限公司 音频信息处理方法、装置、电子设备及存储介质
EP4139784A1 (en) * 2020-04-21 2023-03-01 Google LLC Hierarchical context specific actions from ambient speech
CN112669845B (zh) * 2020-12-25 2024-04-12 竹间智能科技(上海)有限公司 语音识别结果的校正方法及装置、电子设备、存储介质
JP7357030B2 (ja) * 2021-08-25 2023-10-05 ソフトバンク株式会社 通信端末、プログラム、及び表示方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040008546A (ko) * 2002-07-18 2004-01-31 엘지전자 주식회사 연속 음성인식 기기의 오인식 수정 방법
KR20060058006A (ko) * 2004-11-24 2006-05-29 마이크로소프트 코포레이션 문자들의 조작을 제어하는 방법 및 시스템

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4582441A (en) * 1984-08-22 1986-04-15 International Business Machines Corporation Text editing with voice prompting
US5855000A (en) 1995-09-08 1998-12-29 Carnegie Mellon University Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input
US5899976A (en) 1996-10-31 1999-05-04 Microsoft Corporation Method and system for buffering recognized words during speech recognition
US5909667A (en) * 1997-03-05 1999-06-01 International Business Machines Corporation Method and apparatus for fast voice selection of error words in dictated text
US6282507B1 (en) 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6611802B2 (en) * 1999-06-11 2003-08-26 International Business Machines Corporation Method and system for proofreading and correcting dictated text
US7444286B2 (en) 2001-09-05 2008-10-28 Roth Daniel L Speech recognition using re-utterance recognition
US6993482B2 (en) * 2002-12-18 2006-01-31 Motorola, Inc. Method and apparatus for displaying speech recognition results
US20050049868A1 (en) * 2003-08-25 2005-03-03 Bellsouth Intellectual Property Corporation Speech recognition error identification method and system
US20080275704A1 (en) 2004-08-06 2008-11-06 Koninklijke Philips Electronics, N.V. Method for a System of Performing a Dialogue Communication with a User

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040008546A (ko) * 2002-07-18 2004-01-31 엘지전자 주식회사 연속 음성인식 기기의 오인식 수정 방법
KR20060058006A (ko) * 2004-11-24 2006-05-29 마이크로소프트 코포레이션 문자들의 조작을 제어하는 방법 및 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019135599A1 (ko) * 2018-01-05 2019-07-11 삼성전자 주식회사 음성 명령을 처리하기 위한 전자 문서 표시 방법 및 그 전자 장치
US11720324B2 (en) 2018-01-05 2023-08-08 Samsung Electronics Co., Ltd. Method for displaying electronic document for processing voice command, and electronic device therefor

Also Published As

Publication number Publication date
CN101605171B (zh) 2012-07-18
CN101605171A (zh) 2009-12-16
KR20090130350A (ko) 2009-12-23
EP2133869A2 (en) 2009-12-16
EP2133869A3 (en) 2010-05-19
US8543394B2 (en) 2013-09-24
US20090306980A1 (en) 2009-12-10

Similar Documents

Publication Publication Date Title
KR100988397B1 (ko) 이동 단말기 및 그의 텍스트 수정방법
KR101462932B1 (ko) 이동 단말기 및 그의 텍스트 수정방법
KR101513615B1 (ko) 이동 단말기 및 그 음성 인식 방법
KR101502003B1 (ko) 이동 단말기 및 그 텍스트 입력 방법
US9129011B2 (en) Mobile terminal and control method thereof
US8428654B2 (en) Mobile terminal and method for displaying menu thereof
KR20090107364A (ko) 이동 단말기 및 그 메뉴 제어방법
KR20090107365A (ko) 이동 단말기 및 그 메뉴 제어방법
KR20090114749A (ko) 이동 단말기 및 그 화상통화 제어방법
KR101502004B1 (ko) 이동 단말기 및 그의 음성 명령 인식 방법
KR20090115599A (ko) 이동 단말기 및 그 정보 처리방법
KR101537693B1 (ko) 단말기 및 그 제어 방법
KR101521909B1 (ko) 이동 단말기 및 그 메뉴 제어방법
KR101513635B1 (ko) 단말기 및 그 제어 방법
KR101495183B1 (ko) 단말기 및 그 제어 방법
KR101451661B1 (ko) 이동 단말기 및 그 메뉴 제어 방법
KR101521908B1 (ko) 이동 단말기 및 그 메뉴 제어방법
KR101521927B1 (ko) 단말기 및 그 제어 방법

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130924

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140924

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150924

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160923

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170922

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee