KR100819928B1 - Apparatus for speech recognition of wireless terminal and method of thereof - Google Patents

Apparatus for speech recognition of wireless terminal and method of thereof Download PDF

Info

Publication number
KR100819928B1
KR100819928B1 KR1020070040652A KR20070040652A KR100819928B1 KR 100819928 B1 KR100819928 B1 KR 100819928B1 KR 1020070040652 A KR1020070040652 A KR 1020070040652A KR 20070040652 A KR20070040652 A KR 20070040652A KR 100819928 B1 KR100819928 B1 KR 100819928B1
Authority
KR
South Korea
Prior art keywords
voice
unit
speech
recognition
word
Prior art date
Application number
KR1020070040652A
Other languages
Korean (ko)
Inventor
김세윤
이윤수
Original Assignee
(주)부성큐
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)부성큐 filed Critical (주)부성큐
Priority to KR1020070040652A priority Critical patent/KR100819928B1/en
Application granted granted Critical
Publication of KR100819928B1 publication Critical patent/KR100819928B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers; Analogous equipment at exchanges
    • H04M1/26Devices for signalling identity of wanted subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers; Analogous equipment at exchanges
    • H04M1/72Substation extension arrangements; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selecting
    • H04M1/725Cordless telephones
    • H04M1/72519Portable communication terminals with improved user interface to control a main telephone operation mode or to indicate the communication status
    • H04M1/72522With means for supporting locally a plurality of applications to increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Abstract

A voice recognition device of a portable terminal and a method thereof are provided to increase a voice recognition rate of the terminal connected to a wireless network, thus a user can receive stock information, weather, news, a lot of daily information, and contents services by inputting voices without inputting buttons as well as confirm received messages(mail). A voice recognition device(200) comprises as follows. A word combiner(210) extracts a voice section by detecting starting and ending points of an inputted voice, and combines phonemes and syllables detected from the voice section to form the combined phonemes and syllables into words. A word recognizer(220) recognizes the combined words to configure the words as sentences. A voice recognizer(230) recognizes the configured sentences as voice commands. A code converter(240) converts the recognized voice commands into control codes by applying a Korean alphabet standard code table stored in a memory unit(190).

Description

휴대 단말기의 음성 인식장치 및 그 방법{APPARATUS FOR SPEECH RECOGNITION OF WIRELESS TERMINAL AND METHOD OF THEREOF} A voice recognition device and method for a wireless terminal {APPARATUS FOR SPEECH RECOGNITION OF WIRELESS TERMINAL AND METHOD OF THEREOF}

도 1은 본 발명의 실시예에 따른 휴대 단말기의 음성 인식장치를 도시한 도면이다. 1 is a diagram showing a speech recognition apparatus of a portable terminal according to an embodiment of the invention.

도 2는 도 1에 도시된 음성인식부 및 코드변환부의 상세 구성을 도시한 도면이다. Figure 2 is a diagram showing a speech recognition unit and the code conversion section detailed construction shown in Fig.

도 3은 본 발명의 실시예에 따른 휴대 단말기의 음성 인식과정을 도시한 흐름도이다. Figure 3 is a flow chart of a speech recognition process of a mobile terminal according to an embodiment of the present invention.

도 4는 본 발명의 실시예에 따른 휴대 단말기의 음성 인식과정에서 음성 명령어의 인식과정을 도시한 흐름도이다. Figure 4 is a flow chart illustrating the recognition process of the speech command from the speech recognition process of a mobile terminal according to an embodiment of the present invention.

<도면의 주요 부분에 대한 부호의 설명> <Description of the Related Art>

110 : 키 입력부 120 : 오디오 처리부 110: a key input unit 120: audio processing unit

130 : 제어부 140 : 변복조부 130: control unit 140: demodulation unit

150 : 송수신부 160 : 영상입력부 150: reception unit 160: image input

170 : 영상처리부 200 : 음성 인식장치 170: image processing unit 200: Voice recognition unit

210 : 단어 조합부 220 : 단어 인식부 210: word combinations 220: word recognizer

230 : 음성인식부 240 : 코드변환부 230: Voice recognition unit 240: code conversion unit

본 발명은 휴대 단말기의 음성 인식장치에 관한 것으로, 더 상세하게는 무선망에 접속되는 휴대 단말기의 음성 인식율을 높여 음성 명령어의 입력을 통해 제반 동작을 실행시키고, 인식된 음성 명령어를 제어코드로 변환한 다음 무선망을 통해 서비스 센터에 전송하여 다양한 정보 서비스를 키 버튼의 입력이 수반되지 않는 상태에서 음성 명령어의 입력으로 제공받을 수 있도록 하는 휴대 단말기의 음성 인식장치 및 방법에 관한 것이다. The present invention is converted to that, and more specifically to improve the speech recognition rate of the wireless terminal connected to a wireless network and execute the various operations by the input of a voice command, control the recognized voice instruction according to a speech recognition device of then relates to a speech recognition apparatus and method for a mobile terminal that allows the transmission over a radio network to a service center a variety of information services on the condition that does not involve the type of the key buttons may be provided as an input to the voice command.

급속한 보급률을 보이고 있는 휴대 단말기는 고유의 음성 통화 서비스는 물론이고 데이터 전송 서비스와 메일, 증권, 뉴스, 날씨, 생활정보 등의 부가 서비스 및 상대방의 얼굴을 보면서 통화하는 영상 통화 서비스를 제공하는 멀티미디어 통신기기로 자리 매김을 하고 있다. Mobile terminal a unique voice services showed a rapid penetration, as well as multimedia communications to provide video calling service call while viewing the data transmission services and distribution, securities, news, weather, lifestyle additional information, such as services and the other face It has established itself as a unit.

이러한 휴대 단말기에는 MP3 파일, 사진 파일, 동영상 파일 및 수신되는 각종 데이터 파일을 저장할 수 있는 대용량의 메모리가 적용되고 있으며, 음성 인식기능이 적용되어 사용상에 편리성을 제공하고 있다. This portable terminal has been applied to the large-capacity memory to store MP3 files, photo files, video files and receive various data files, voice recognition is applied provides the convenience in the use thereof.

음성 인식기능은 사용자의 음성을 프로세서가 분석하여 이를 인식 또는 이해하는 것으로, 발음에 따라 입 모양과 혀의 위치 변화로 특정한 주파수를 갖는 인간의 발성 음성을 전기신호로 변환한 다음 음성의 주파수 특성을 추출하여 발음을 인식하는 기술이다. A speech recognition function is to convert the human speech sound having a specific frequency to the shape of the mouth and change in position of the tongue in accordance with that, pronounced by the processor analyzes recognize or understand this, the user's voice into an electric signal, and then frequency characteristics of the speech extracted by a technique that recognizes the pronunciation.

이와 같은 음성 인식기능은 전화기의 다이얼링, 장난감 제어, 어학 학습, 가전기기의 제어 등과 같은 다양한 분야에 응용되고 있으며, 휴대 단말기에서는 사용자의 음성 인식을 통해 다이얼링을 제공하는 수준에 그치고 있다. In the speech recognition feature has been applied to such diverse fields such as dialing the phone, toys control, language learning, and control of home appliances, mobile devices are stopped in a level that provides the dialing through your voice recognition.

음성 다이얼링은 음성으로 기 설정된 특정 단어를 입력하면 음성을 인식한 후 그 인식된 음성에 설정된 전화번호를 자동 다이얼링하는 기능으로서, 운전시와 같이 다른 일을 하고 있어 손을 쓰기가 불편한 경우에 이용된다. Voice dialing is used for to enter the group specific word is set to negative and then recognize the voice as a function of automatically dialing the telephone number set in the recognized speech, there are other jobs, such as when driving a write hand uncomfortable if .

이와 같은 음성 다이얼링은 단순하게 몇개의 전화번호를 각각 특정한 단어로 설정하여 저장시켜 놓은 후 해당 단어를 음성으로 말함으로서 자동 다이얼링을 제공하기 때문에 저장된 몇개의 전화번호에 대해서만 음성 인식 다이얼링이 가능하며, 그외 등록되지 않은 다른 전화번호에 대해서는 음성인식이 제공되지 못하는 문제점이 있다. Such Voice Dialing is simple, move to save by setting some of the telephone numbers to each specific words possible voice recognition dialing only a few phone numbers saved because it provides automatic dialing by saying the word voice, and so on for non-registered phone number there are other problems that can not be provided by voice recognition.

그리고, 메모리의 용량 문제로 음성 다이얼링을 등록할 수 있는 전화번호의 갯수에 한계가 있어 음성 다이얼링의 효용성이 크지 않은 단점이 있다. And, there is a limit to the number of a memory capacity issues of the telephone number to register the voice dialing has the disadvantage of not greater efficacy voice dialing.

또한, 음성 인식기술은 주변 소음 등에 매우 열악하여 현재의 기술로는 아직 100%의 인식 성공율을 보장할 수 없기 때문에 음성인식에 의해 수행되는 작업에 빈번한 오류가 발생하고 있다. Further, speech recognition technology has been very poor and the frequency error in the operations performed by the speech recognition, because with current technology is to guarantee the recognition success rate of 100% still on the ambient noise.

이러한 작업의 오류 발생율을 줄이기 위한 방편으로서, 음성 인식의 결과에 대하여 사용자에게 확인을 요구하거나, 음성 인식의 결과에 따라서 복수개의 대안으로 이루어지는 목록을 사용자에게 제시함으로써, 사용자의 확인 또는 선택에 따라 최종 인식 단어를 결정하는 방법이 사용되고 있다. By a means for reducing the error rate of these operations, for confirmation to the user about the result of voice recognition, or presents a list composed of a plurality of alternatives based on the result of the speech recognition to a user, according to verify or select the user's end this method of determining the recognized words are used.

상기한 사용자의 확인에 따른 음성 인식이나 사용자가 제시된 대안을 선택함에 따른 음성 인식은 휴대 단말기 자체의 완전한 음성 인식을 제공하지 못하며, 항상 사용자의 선택이 함께 이루어져야 하는 문제점이 있다. Speech recognition according to selecting voice recognition or alternative user is presented according to the confirmation of the user is not always complete the speech recognition of the portable terminal itself, there is a problem that must be made all the time with the selection of the user.

또한, 통신 서비스의 발달에 따라 휴대 단말기에 인터넷 접속을 제공하여 웹 사이트의 검색이나 컨텐츠의 검색, 전자우편, 주식거래, 게임 등을 이용할 수 있도록 하고 있으나, 현재의 휴대 단말기에 적용되어 있는 음성 인식기술은 인식율이 너무 낮아 모바일 환경에서 음성을 이용하여 인터넷을 통해 상기한 다양한 서비스를 제공받는데 많은 어려움이 있다. In addition, according to the development of telecommunications service providers access to the Internet on a mobile device to search the search or content of the web site, e-mail, stock trading, however, and so the games available, voice recognition, which is currently applied to the mobile terminal technology receive recognition rate is too low to provide a variety of services through the Internet using your voice in a mobile environment there are many difficulties.

본 발명은 상기한 문제점을 해결하기 위하여 발명한 것으로, 그 목적은 무선망에 접속되는 휴대 단말기의 음성 인식율을 높여 수신된 메시지(메일)의 확인과 무선 인터넷망으로부터 증권정보, 날씨, 뉴스, 각종 생활정보, 컨텐츠 서비스를 버튼 입력없이 음성의 입력으로 제공받을 수 있도록 하는 것이다. The present invention has been invented to solve the above problems, and its object is stock information, weather, news from the check with a wireless Internet network in the message (mail) received increasing the voice recognition rate of a wireless terminal connected to a wireless network, various to live information, so it can receive the input of the audio content services without button input.

또한, 본 발명의 다른 목적은 휴대 단말기의 제반적인 동작을 음성 명령어의 인식으로 실행시키고, 수신된 메시지(메일)의 확인과 전송하고자 하는 메시지(메일)의 편집 및 편집된 메시지(메일)의 전송을 음성 명령어의 입력으로 실행하도록 하는 것이다. It is another object of the present invention is to run the overall operation of the mobile terminal to recognize the voice command, receiving transmission of a message (e-mail) message (message) edited and the edited message (e-mail) of the check and to transfer the to to to run to the input of a voice command.

또한, 본 발명의 다른 목적은 사용자의 음성 명령어를 인식하여 제어코드로 변환한 다음 인터넷 망에 전송하여 필요로 하는 정보 서비스를 요청하고, 그에 따른 다양한 정보 서비스를 키 버튼의 입력이 수반되지 않는 상태에서 제공받을 수 있도록 하는 것이다. It is another object of the present invention does not involve the input of various information service request for information services that the recognizing the user's voice command converted to a control code, and then need to transfer to the Internet network, and hence the key button, It will be provided to allow in.

상기한 목적을 달성하기 위한 본 발명의 특징에 따른 휴대 단말기의 음성 인식장치는 휴대 단말기에 있어서, The voice recognition device in the wireless terminal in accordance with an aspect of the present invention for achieving the above object is according to a wireless terminal,

숫자 및 문자를 입력하기 위한 다수개의 키와 기능키로 구성되는 키 입력부; A key input unit comprising a plurality of keys and function keys for inputting numbers and characters;

마이크로 입력되는 아날로그 음성신호를 디지털 음성신호로 변환하고, 제어부에서 제공되는 디지털 음성신호를 아날로그 음성신호로 변환하여 스피커로 송출시키는 오디오 처리부; An audio processor for converting an analog audio signal that is input to the micro digital voice signal and converts the digital voice signal provided from the control unit to an analog audio signal delivered to the speaker;

무선망을 통해 송수신되는 음성신호 및 데이터 패킷을 부호화 및 복호화하는 변복조부; The modem unit for encoding and decoding a speech signal and data packets which are sent and received through a wireless network;

안테나를 통해 무선망과 접속하며, 상기 부호화된 음성신호 및 데이터 패킷의 주파수를 상승 변환 및 고조파 증폭하여 무선망으로 송출하고, 무선망에서 수신되는 신호를 저잡음 증폭 및 주파수 하강 변환하는 송수신부; Via an antenna connected to the radio network, and transmitting and receiving unit to the frequency of the encoded audio signal and a data packet up-converting and amplifying the harmonic conversion and sent to the radio network, the low noise amplifier and a frequency falling signal received from the radio network;

주변의 영상을 입력하며, 내장되는 DSP를 통해 디지털 신호로 변환하는 영상 입력부; And enter the surrounding image, an image input unit for converting into a digital signal through the DSP to be incorporated;

JPEG 코덱, MPEG 코덱, Wavelet 코덱 중 어느 하나 이상의 영상 코덱을 포함하며 영상 입력부에서 인가되는 영상신호를 프레임 단위로 처리하고 표시부의 특성 및 디스플레이 규격에 맞추에 출력하는 영상처리부; JPEG codec, MPEG codec, an image processing unit that includes any one or more of the codec, Wavelet codec, video processing, and the video signal that is applied from the image input in frame units, and outputs to match the characteristics of the display and the display size;

상기 영상 처리부에서 인가되는 프레임 단위의 영상과 제어부에서 인가되는 메시지(메일), 컨텐츠, 뉴스, 날씨, 생활정보 데이터를 문자나 텍스트로 표시하는 표시부를 포함하며, Comprising a display unit for displaying the image processor messages to be applied in the image and the control unit of the frame unit is applied in (e-mail), the content, news, weather, life information data as a character or text,

마이크로 입력되는 사용자 음성에서 음성의 시작점과 끝점을 검출하여 음성구간을 추출하고, 음성구간의 음소 및 음절을 조합하여 단어로 형성하며 단어의 조합으로 구성되는 문장을 음성 명령어로 인식하는 음성 인식장치; A voice recognition device for detecting the start and end points of the speech in the user's voice to be micro-type extracting a voice section, and a combination of a phoneme and a syllable of speech section to form into words and recognizing the sentence composed of a set of words in the voice instruction;

휴대 단말기의 운용 프로그램과 음성인식 명령어를 제어코드로 변환하기 위한 표준 코드 테이블, 휴대 단말기의 운용 과정에서 발생되는 데이터 패킷을 저장하는 메모리부; Standard code table for converting the operational program and the speech recognition instruction of the mobile terminal to the control code, a memory for storing a data packet generated in the operating process of the portable terminal;

설정된 운용 프로그램에 따라 휴대 단말기의 제반적인 동작을 제어하며, 음성 인식모드에서 음성 명령어의 인식 결과에 따라 해당 정보를 엑세스하여 음성 송출 및 표시를 제공하거나 무선망에 해당하는 서비스를 요청하고 수신되는 서비스 정보를 표시부 및 음성으로 송출시키는 제어부를 더 포함한다. According to the set operation programs and controls the overall operation of the portable terminal, the service is to access the information in accordance with the recognition result of the speech command from the speech recognition mode providing voice transmission and display, or requesting the service to the radio network receives a control section for sending the information to the display unit, and further includes speech.

또한, 본 발명의 특징에 따른 휴대 단말기의 음성 인식방법은 (a) 휴대 단말기의 대기상태에서 음성입력이 검출되면 시스템을 초기화한 후 음성 인식모드를 활성화하는 과정; Further, the speech recognition method of a portable terminal in accordance with aspects of the present invention is (a) then when the voice input is detected in the standby state of the portable terminal to initialize the system, the process of activating a voice recognition mode;

(b) 마이크로 입력되는 음성의 어절을 조합하여 단어로 생성하고, 단어의 속성과 어절간 의존관계를 분석하여 단어의 의미를 파악하는 과정; (B) micro-input step of generating a word in combination Eojeol of speech, and to analyze the properties and control segmental dependency of the word determine the meaning of the word;

(c) 상기 (b) 과정에서 의미가 파악되어진 단어를 조합하여 문장으로 생성하는 과정; (C) the process to a combination of words means a grasp been created with words in the (b) process;

(d) 상기 (c) 과정에서 단어의 조합으로 생성된 문장을 음성 명령어로 인식하고, 설정된 한글 표준 코드 테이블을 적용하여 음성 명령어의 실질적인 의미를 분석하는 과정; (D) the process of analyzing the actual meaning of the voice command by applying a Hangul standard code table recognition, and set the generated sentence in the (c) process a set of words in the voice instruction;

(e) 상기 (d) 과정에서 의미가 분석된 음성 명령어의 파일을 생성하고, 이를 제어코드로 변환하는 과정 및; (E) generating a file of the voice command means is analyzed in the process (d), and converts it to a control code, and;

(f) 상기 (e) 과정에서 변환된 제어코드에 따른 운용 프로그램의 작동으로 인식된 음성 명령에 매칭되는 정보를 엑세스하여 스피커를 통해 송출함과 동시에 표시부를 통해 표시하는 과정을 포함한다. (F) it includes a step of displaying through the display and at the same time transmitted through the speaker to access the information that is matched to the voice command recognized by the operation of the operation program corresponding to the control code converter in the (e) process.

아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. In the following detailed description that the present invention can be easily implemented by those of ordinary skill, in which with respect to the embodiment of the present invention with reference to the accompanying drawings.

그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. However, the invention is not to be implemented in many different forms and limited to the embodiments set forth herein.

그리고, 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다. And, in order to clearly describe the present invention in the drawings be regarded as was described in nature and not restrictive. Like reference numerals designate like elements throughout the specification.

또한, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. In addition, it is assuming that any part "includes" a certain component, which is not to exclude other components not specifically described against which means that it is possible to further include other components.

이제 본 발명의 실시예에 따른 휴대 단말기의 음성 인식장치 및 방법에 대하여 도면을 참고로 하여 상세하게 설명한다. It will be described in detail with reference to the drawings with respect to a speech recognition apparatus and method for a portable terminal according to an embodiment of the invention.

도 1은 본 발명의 실시예에 따른 휴대 단말기의 음성 인식장치를 도시한 도 면이다. 1 is a side the voice recognition device of a portable terminal according to an embodiment of the present invention shown.

도시된 바와 같이, 본 발명은 키 입력부(110)와 오디오 처리부(120), 제어부(130), 변복조부(140), 송수신부(150), 영상 입력부(160), 영상 처리부(170), 표시부(180), 메모리부(190) 및 음성 인식장치(200)를 포함한다. The present invention is a key input unit 110 and the audio processing unit 120, a controller 130, a modem part 140, a transceiver 150, a video input unit 160, image processor 170, a display as shown 180, a memory unit 190 and the voice recognition device 200. the

키 입력부(110)는 숫자 및 문자를 입력하기 위한 다수개의 키와 휴대 단말기의 사용상 특정의 기능을 설정하기 위한 기능키를 포함하며, 상기 기능키에는 휴대 단말기를 음성 인식모드로 진입시키는 기능키가 더 포함될 수 있다. A key input unit 110 includes function keys for entering a plurality of keys and comprising a function key for setting in use a particular function of the mobile terminal, wherein the function key on the mobile terminal for inputting numbers and characters by speech recognition mode It may further be included.

오디오 처리부(120)는 패킷 데이터를 처리하는 데이터 코덱과 음성 등의 오디오 신호를 처리하는 오디오 코덱을 포함하며, 마이크(Mic)로 입력되는 사용자의 아날로그 음성신호를 오디오 코덱을 통해 디지털 신호로 변환하여 제어부(130)가 인식할 수 있도록 하고, 제어부(130)에서 제공되는 디지털 음성신호를 아날로그 음성신호로 변환하여 스피커(Spk)를 통해 송출한다. An audio processing unit 120 comprises an audio codec for processing an audio signal such as a data codec and a voice processing packet data, converts the analog speech signal of the user input to the microphone (Mic) into a digital signal through the audio codec, so that the controller 130 can recognize, and converts the digital voice signal provided from the controller 130 into an analog audio signal and sends out through the speakers (Spk).

또한, 무선망을 통해 수신되는 메시지(메일) 등의 데이터 패킷이 사용자에게 정보 제공을 위한 데이터 패킷인 경우 제어부(130)에서 제공되는 데이터 패킷을 데이터 코덱을 통해 아날로그 신호로 변환하여 스피커(Spk)를 통해 음성 안내로 제공한다. In addition, the conversion when the data packets of the messages (email) is received via a wireless network is a data packet for a user to provide information to the data packet provided by the controller 130 into analog signals through the data codec, a speaker (Spk) to provide voice guidance through.

제어부(110)는 설정된 운용 프로그램에 따라 휴대 단말기의 제반적인 동작을 제어하며, 사용자의 음성 명령의 인식 혹은 키 입력부(110)에 구비된 기능키에 의해 음성 인식모드로 진입하여 음성 명령어의 인식에 따라 수신 메시지(메일)를 표시부(180)를 통해 표시하고, 필요에 따라 스피커(Spk)를 통해 음성으로 송출하며, 무선망에 필요로 하는 서비스를 요청하고 그에 따라 수신되는 증권정보, 뉴스, 날씨, 생활정보 등을 수신하여 표시부(180)를 통해 표시하고 동시에 스피커(Spk)를 통해 음성으로 송출한다. Control unit 110 enters a voice recognition mode by the function key provided in the recognition or the key input unit 110 of the portable control the overall operation of the terminal, the user's voice command according to the set operating program for recognition of a voice command depending display the received messages (email) via the display unit 180 and, and transmitting the voice through a speaker (Spk) if necessary, securities request a service that requires a radio network and is received accordingly, information, news, weather, will be displayed through the display unit 180 receives the living information and the like transmitted by voice through the speaker (Spk) at the same time.

변복조부(140)는 무선망으로 송신되는 음성신호 및 데이터 패킷을 부호화하여 송수신부(150)에 인가하고, 송수신부(150)를 통해 수신되는 음성신호 및 데이터 패킷을 복호화하여 제어부(130)에 제공한다. A modem part 140, a controller 130 is applied to the transceiver 150 for encoding the voice signal and the data packet, it decodes the voice signal and the data packets received via the transceiver 150 to be transmitted to the radio network to provide.

송수신부(150)는 안테나(ANT)를 통해 무선망과 접속하며, 변복조부(140)에서 부호화된 음성신호 및 데이터 패킷의 주파수를 상승 변환 및 고조파 증폭하여 안테나(ANT)를 통해 송출하고, 무선망으로부터 안테나(ANT)를 통해 수신되는 신호를 저잡음 증폭 및 주파수를 하강 변환하여 변복조부(140)에 제공한다. Transmitting and receiving unit 150 and connected to the wireless network via the antenna (ANT), by the frequency of the audio signal and a data packet encoded in the modulation and demodulation unit 140 up-converting and harmonics amplified and sent through an antenna (ANT), the radio a signal received through an antenna (ANT) from the network by down-converting the low-noise amplifier and a frequency and provides it to the modem part 140. the

영상 입력부(160)는 예를 들어 CCD 촬상소자 혹은 카메라로, 제어부(130)에서 인가되는 제어신호에 따라 주변사물이나 인물 등 피사체의 영상을 입력하며, 입력되는 아날로그 영상신호를 내장되는 DSP(Digital Signal Processor)를 통해 디지털 신호로 변환한다. Image input unit 160, for example, CCD image pickup device or a camera, in accordance with the control signal applied from the controller 130 and enter the surrounding objects and the image of a person, such as the subject, (Digital incorporated the input analog video signal DSP via signal Processor) is converted to a digital signal.

영상처리부(170)는 제어부(130)의 제어신호에 따라 상기 영상 입력부(160)에서 인가되는 영상신호를 프레임 단위로 처리하며, 상기 프레임 단위의 영상신호를 표시부(180)의 특성 및 디스플레이 규격에 맞추에 출력한다. Image processing unit 170 to the characteristic and the display size of the image input unit 160, display unit 180 an image signal of the frame unit, and processing the video signal that is applied on a frame-by-frame basis in response to a control signal from the control unit 130 and outputs a match.

상기 영상처리부(170)는 JPEG 코덱이나 MPEG 코덱 혹은 Wavelet 코덱 중 어느 하나 이상의 영상 코덱을 포함하며, 상기 표시부(180)에 표시되는 프레임 단위의 영상 데이터를 설정된 방식으로 압축하거나 압축된 프레임 단위의 영상 데이터 를 복원하는 기능을 실행한다. The image processing unit 170 includes a JPEG codec or MPEG codec, or Wavelet codec of which includes one or more video CODEC, an image of the compressed video data of a frame unit in a predetermined manner or compressed frame by frame to be displayed on the display unit 180 It performs a function of restoring data.

표시부(180)는 상기 영상 처리부(170)에서 인가되는 프레임 단위의 영상을 표시하며, 제어부(130)에서 인가되는 메시지(메일), 컨텐츠 정보, 뉴스, 날씨, 생활정보 등 데이터를 문자나 텍스트 혹은 그래프의 형식으로 표시한다. A display unit 180 the video and display the video of a frame unit to be applied in a processing unit 170, a controller 130 is a message (email), the content information, news, weather, life information, and the data characters or text, or is in the be in the form of a graph.

상기 표시부(180)는 터치 스크린 방식으로 구현되어 키 입력부(110)를 대신하여 입력부로 동작할 수 있다. The display 180 is implemented as a touch screen can operate as an input unit in place of the key input unit 110.

메모리부(190)는 휴대 단말기를 운용하는 프로그램과 음성 명령어 인식을 위한 데이터 및 인식된 음성 명령어를 제어코드로 변환하기 위한 한글 표준 코드 테이블, 휴대 단말기의 운용 과정에서 발생되는 데이터 패킷을 저장한다. Memory section 190 stores the data packet generated in the Hangul operational procedure of the standard code table, the portable terminal for converting the data, and the recognized voice commands to mobile device applications, and voice command recognition that operates as the control code.

음성 인식장치(200)는 마이크(Mic)로 입력되는 사용자의 음성에서 음성의 시작점과 끝점을 검출하여 음성구간을 추출하고, 음성구간에서 검출되는 음소 및 음절을 조합하여 단어로 형성한 다음 이를 인식하고, 인식된 단어의 조합으로 구성되는 문장을 음성 명령어로 인식하며, 메모리부(190)에 저장되어 있는 한글 표준 코드 테이블을 적용하여 인식된 음성 명령어를 제어 코드로 변환한다. Speech recognition device 200 detects the starting and ending points of the voice from the user input to the microphone (Mic) audio extract a voice section, and a combination of a phoneme and a syllable is detected in the voice section, and then it recognizes form into words and it recognizes a sentence consisting of the combination of the recognized words to a voice command and converts the voice command recognized by applying the Hangul standard code table stored in the memory section 190 to the control code.

상기 음성 인식장치(200)는 추출된 음성구간에서 검출되는 음소 및 음절을 조합하여 단어로 형성하는 단어 조합부(210)와, 조합된 단어를 인식하여 문장으로 구성하는 단어 인식부(220), 단어의 조합을 통해 구성된 문장을 인식하여 음성 명령어로 인식하는 음성 인식부(230), 인식된 음성 명령어를 상기 메모리부(190)에 저장된 한글 표준 코드 테이블을 적용하여 제어 코드로 변환하는 코드 변환부(240)를 포함한다. The voice recognition device 200 and a combination of a phoneme and a syllable is detected in the extracted speech sections word combination unit 210 to form a word, the word recognizing a combined word comprised of a sentence recognition section 220, code to apply the Hangul standard code table stored in the voice command speech recognition unit 230, a recognition that recognizes a sentence configured with a combination of a word recognized by the voice command in the memory unit 190 is converted to a control code conversion unit It comprises 240.

상기 음성 인식부(230) 및 코드 변환부(240)에 대하여 도 2를 참조하여 그 구성을 좀 더 구체적으로 설명하면 다음과 같다. If with reference to Figure 2 with respect to the speech recognition unit 230 and the code converter 240 described the configuration in a more detail.

도시된 바와 같이, 음성 인식부(230)는 구문 분석기(231)와 구문 해석기(232)를 포함하고, 코드 변환부(240)는 구문 분석기(241)와 구문 해석기(242), 음절 변환기(243) 및 파일 생성기(244)를 포함한다. As illustrated, the voice recognition unit 230 parser including 231 and parser 232, and the code converter 240 is the parser 241, and parser 242, a syllable converter (243 ) and a file generator (244).

상기 음성 인식부(230)에 포함되는 구문 분석기(231)는 입력되는 음성을 분석하여 속성 파악한 다음 어절간 의존관계를 분석하여 음성 명령어의 문장으로 생성한다. The speech recognizer parser (231) included in the unit 230 analyzes the sound to be identified by analyzing the input attribute, and then control segmental dependency produces a sentence of the voice command.

음성 인식부(230)에 포함되는 구문 해석기(232)는 상기 생성된 음성 명령어의 문장을 메모리부(190)에 저장된 한글 표준 코드 테이블을 적용하여 명령어의 실질적인 의미를 분석한다. The syntax analyzer 232 included in the voice recognition unit 230 to apply the Hangul standard code table stored in the command sentence of the voice of the generation in the memory unit 190 analyzes the actual meaning of the instruction.

코드 변환기(240)에 포함되는 구문 분석기(241)는 상기 음성 인식부(230)에서 명령어의 실질적인 의미가 분석되어 인가되는 음성 명령어의 명사구 등 속성을 파악하고 어절간 의존관계를 분석한다. Parser 241 is included in the code converter 240 identifying the noun phrase, such as attributes of voice commands to which the real sense of the instruction is analyzed by the speech recognition unit 230 analyzes the control segmental dependency.

상기 코드 변환기(240)에 포함되는 구문 해석기(242)는 구문 분석기(241)에서 분석되어진 음성 명령어를 메모리부(190)에 저장된 한글 표준 코드 테이블을 적용하여 명령어의 실질적인 의미를 파악한다. Determine the parser 242 is practical significance of the instruction by the voice command been analyzed in the parser 241 applies a Hangul standard code table stored in the memory unit 190 included in the code converter 240.

상기 코드 변환기(240)에 포함되는 음절 변환기(243)는 상기 의미가 파악되어진 음성 명령어를 음절 변환한다. The code converter syllable converter 243 included in the unit 240 converts the voice command syllable been that the means identify.

상기 코드 변환기(240)에 포함되는 파일 생성기(244)는 음절 변환된 음성 명 령어를 파일로 생성하여 출력한다. File Generator (244) included in the code converter 240 generates and outputs a voice instruction name a syllable convert file.

상기한 기능을 포함하여 구성되는 본 발명의 실시예에 따른 휴대 단말기의 음성 인식장치의 음성 명령어 인식과 그에 따른 동작에 대하여 설명한다. Will be described operation voice command recognition and hence of the voice recognition device of a portable terminal according to an embodiment of the present invention is configured to include the above-described function.

휴대 단말기에서 키 입력에 따른 음성 통화나 영상 입력, 메시지(메일)의 송수신, 각종 컨텐츠 및 정보의 수신 등에 대한 동작은 통상적인 휴대 단말기의 동작과 동일 내지 유사하므로, 이에 대한 구체적인 설명은 생략한다. Since a wireless terminal in a voice or video input in accordance with the key input, the transmission and reception of messages (E-mail), the operation of such reception of a variety of content and information, a typical operation of the wireless terminal with the same or similar, and thus for the specific explanation is omitted.

본 발명은 음성 명령어를 인식하여 그에 따른 동작을 수행하는 것이므로, 이에 대하여 도 3 및 도 4를 참조하여 설명한다. The invention will now be described with reference to, and thus also with respect 3 and 4 because for recognizing a voice instruction to perform an operation according thereto.

휴대 단말기가 전원 온을 유지하는 대기상태에서(S101) 제어부(130)는 마이크(Mic)를 통해 입력되는 사용자의 음성 명령어가 검출되는지 판단한다(S102). It is determined that the portable terminal is in the stand-by state to maintain the power-on (S101), the control unit 130 of the user voice commands input via the microphone (Mic) is detected (S102).

사용자가 특정의 음성 명령어를 마이크(Mic)에 입력하면, 오디오 처리부(120)는 입력되는 사용자의 아날로그 음성신호를 오디오 코덱을 통해 디지털 신호로 변환하여 제어부(130)에 제공하므로, 제어부(130)는 동작 대기의 상태에서 음성 명령어가 입력되었는지의 여부를 판단할 수 있게 된다. Because the user enters a particular voice command into the microphone (Mic), the audio processing unit 120 provides the analog voice signal from the input user to the control unit 130 is converted into a digital signal through the audio codec, the control unit 130 is so that the voice command in the state of standby can be determined whether or not the input.

상기 S102의 판단에서 특정의 음성 명령어의 입력이 검출되면 음성 인식 모드의 진입 요구로 판단하여 시스템을 초기화하고(S103), 음성 변환모드를 활성화 한다(S104). When the input of a specific voice commands detected by the judgment of the S102 to initialize the system to determine the entry request of the voice recognition mode (S103), it activates the speech mode (S104).

상기에서 음성 인식모드의 진입을 대기상태에서 특정 음성 명령어의 입력으로 진입하는 것으로 하였으나, 이에 한정하지 않고 키 입력부(110)에 구비되어 있는 특정 키의 입력을 통해 음성 인식모드로 진입되는 기능도 본 발명의 범위에 포 함된다. Functionality enters but that enters the entry of the speech recognition mode by the input of a particular voice command in the standby state, through the input of a key that is provided to not only limited to this key input unit 110, a voice recognition mode, also the It is included in the scope of the invention.

상기 S104에서 음성 변환모드가 활성화되면 음성 인식장치(200)에 포함되는 단어 조합부(210)는 제어부(130)를 통해 인가되는 사용자의 음성신호에서 음성의 시작점과 끝점을 검출하여 음성구간을 추출하고 음성구간에서 검출되는 음소 및 음절을 조합하여 단어로 형성하며 단어 인식부(220)는 조합된 단어를 인식하여 문장으로 구성한다(S105)(S106). When the speech mode is active in the S104 word combining unit 210 included in the speech recognition unit 200 extracts a voice section detecting the start and end points of the speech from the speech signal of the user is applied through a controller 130 and by a combination of a phoneme and a syllable is detected in the voice section formed of a word and a word recognition unit 220 recognizes a combined word comprised of the sentence (S105) (S106).

이후, 음성 인식부(230)는 단어의 조합으로 구성되는 문장에서 각 단어의 의존관계를 분석 및 해석하여(S107) 음성 명령어를 인식한다(S108). Then, the speech recognition unit 230 recognizes (S107) the voice command by analyzing and interpreting the dependency of each word in a sentence composed of a set of words (S108).

상기 음성 명령어의 인식 절차에 대하여 도 4를 참조하여 설명한다. It will now be described with reference to Fig. 4 with respect to the recognition process in the voice instruction.

문장을 구성하는 각 단어의 의존관계 분석 및 해석 결과 음성 명령어로 인식할 수 있도록 사전에 정의된 단어로 구성되어 있는지를 판단한다(S201)(S202). Result analysis and interpretation dependencies of each word constituting the sentence to determine whether a word is composed of pre-defined so that you can recognize a voice command (S201) (S202).

상기의 판단 결과 사전에 정의된 단어로 구성되어 있으면 단어를 구성하는 각 음절을 검사하고(S203), 메모리부(190)에 저장되어 있는 한글 표준 코드 테이블을 검색하여(S204) 매칭되는 코드가 존재하는지를 판단한다(S205). The code that is configured with the word defined in the above determination result pretest each syllables that make up the word, and (S203), searching for Hangul standard code table stored in the memory section 190 to (S204) match exists, it is determined whether (S205).

상기 S205의 판단 결과 메칭되는 코드가 존재하면 해당 매칭 코드를 적용하여 음성 명령어로 인식한다(S206)(S207). If the code that is determined in the S205 meching present application the matching code to be recognized as a voice command (S206) (S207).

상기한 절차를 통해 음성 명령어를 인식하게 되면 이를 음성 명령어 파일로 생성하고(S109), 코드 변환부(240)를 통해 메모리부(190)에 저장되어 있는 한글 표준 코드 테이블을 적용하여 인식된 음성 명령어를 제어 코드로 변환하여 제어부(130)에 인가한다(S110). The When recognize voice commands via the procedure described above produce it as a voice command file (S109), the code conversion stored in the memory section 190 through the unit 240 to apply the Hangul standard code table recognizes that the voice instruction and converting the control code is applied to the control unit (130) (S110).

따라서, 제어부(130)는 음성 인식장치(200)에서 제어코드로 인가되는 음성 인식 명령에 따라 운용 프로그램을 실행시켜 인식된 명령을 실행하게 되며(S111), 실행 결과를 오디오 처리부(120)를 통해 아날로그 음성 신호로 변환하여 스피커(Spk)를 통해 송출함과 동시에 표시부(180)를 통해 표시하여 준다(S112). Therefore, the control unit 130 via, and to execute the identified command to execute the operation program according to a speech recognition command is applied to the control code from the voice recognition device (200) (S111), the execution result of the audio processing unit 120 It gives to at the same time as transmission is converted into an analog audio signal through a speaker (Spk) displayed through the display unit (180) (S112).

일 예를 들어, 인식된 음성 명령어가 수신된 메시지(메일)의 출력이면 제어부(130)는 메모리부(190)에 저장되어 있는 데이터 패킷중에서 출력이 요청된 메시지(메일)을 엑세스하여 표시부(180)를 통해 출력한다. , For example, if the recognized speech command received output of the message (mail), the controller 130 is a display (180 to access the message (message) output the request from the data packet stored in the memory section 190 ) outputs through.

또한, 필요에 따라 오디오 처리부(120)에 포함되는 오디오 코덱을 통해 수신된 메시지를 아날로그 음성신호로 변환한 다음 스피커(Spk)를 통해 송출하여 준다. Further, it gives to transmission through the converting the messages into an analog audio signal, and then speaker (Spk) received via the audio codec contained in the audio processing unit 120, if necessary.

상기에서 인식된 음성 명령어가 무선 인터넷망으로부터 증권정보, 뉴스,날씨, 생활정보, 각종 컨텐츠 등의 서비스 요청이면 명령어의 제어코드에 따라 송수신부(150)를 통해 무선 인터넷망을 접속한다. Connect a wireless internet network when the service request, such as stock information, the voice command recognized by the Internet network from the radio, news, weather, life information, various contents according to the control code of the instruction through the transmitter-receiver unit (150).

이후, 음성 인식되는 서비스의 요청을 해당하는 웹 서버에 전송하고, 그에 따라 제공되는 서비스의 데이터 패킷을 수신하여 표시부(180)를 통해 사용자에게 표시하여 준다. Then, the transmission to the web server to the requests of the voice service to be recognized, and gives the indication to the user through the display unit 180 receives the data packets of the service provided thereby.

그리고, 필요에 따라 오디오 처리부(120)의 오디오 코덱을 통해 음성으로 변환한 다음 스피커(Spk)를 통해 송출하여 준다. And, it gives the transmitted through the speakers (Spk) and converted to audio via the audio codec of the audio processing unit 120, if necessary.

이외에 메시지(메일)를 음성 명령의 입력으로 편집하여 상대방에게 전송하고, 상대방으로부터 수신되는 메시지를 표시부(180)에 표시하거나 음성으로 변환하여 스피커(Spk)를 통해 송출하여 준다. In addition to editing the message (message) to the input of a voice command to be sent to the other party, and to display the message received from the other party on the display 180 or converted to voice transmission over a speaker to give (Spk).

본 발명은 이동통신 서비스 업체, 인터넷 서비스 업체, 컨텐츠 제공업체 등 음성인식 합성기술을 접목할 수 있는 환경이면 모드 적용할 수 있다. The present invention can be applied to the environment if the mode to combine the speech recognition synthesis techniques such as mobile communication service providers, internet service providers, content providers.

이상에서 설명한 본 발명의 실시예는 장치 및 방법을 통해서만 구현이 되는 것은 아니며, 본 발명의 실시예의 구성에 대응하는 기능을 실현하는 프로그램 또는 그 프로그램이 기록된 기록 매체를 통해 구현될 수도 있으며, 이러한 구현은 앞서 설명한 실시예의 기재로부터 본 발명이 속하는 기술분야의 전문가라면 쉽게 구현할 수 있는 것이다. Embodiments of the invention described above may also be implemented through a program or a program recording medium to realize the functions corresponding to the configuration of the embodiments and are therefore not to be implemented through the above, these implementation from the described device, if expert in the art to which the invention pertains will easily implemented.

이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다. Although detailed description will be given of an embodiment of the present invention in the above scope of the present invention it is not limited to this number of variations and modifications in the form of one of ordinary skill in the art using the basic concept of the invention as defined in the following claims In addition, according to the present invention It will belong to the scope.

전술한 구성에 의하여 본 발명은 와이브로(Wibro),WCDMA, HSPA(HSDPA+HSUPA)의 무선망 환경에서 음성 명령의 인식과 제어 코드의 변환을 통해 메시지(메일), 각종 생활정보, 개인 일정관리 데이터를 제공하고, 화자 기술을 적용시켜 동화상 및 음성으로 변환하여 서비스 제공할 수 있으며, 기존의 음성전화, 텍스트, 팩스뿐만 아니라 데이터 통신 기능에 화상전화, 동영상 멀티미디어 서비스, 게시판, 신문기사, 상품광고, 게시물, 경제, 오락, 나의 정보 등 인터넷 상에서 게시되는 모든 정보들의 제공받을 수 있다. Present invention by the above-described configuration, Wibro (Wibro), WCDMA, HSPA (HSDPA + HSUPA) in a wireless network environment through the conversion of the recognition and control codes of a voice command message (mail), various living information, personal calendar data, to provide and offer to apply speaker technology to convert moving images and voice services, and traditional voice, text, image data communication functions, as well as fax calls, and video multimedia services, message boards, newspaper articles, product advertising, posts can be provided for all the information economy, entertainment, publishing on the Internet, such as my information.

Claims (9)

  1. 숫자 및 문자를 입력하기 위한 다수개의 키와 기능키로 구성되는 키 입력부; A key input unit comprising a plurality of keys and function keys for inputting numbers and characters; 마이크로 입력되는 아날로그 음성신호를 디지털 음성신호로 변환하고, 제어부에서 제공되는 디지털 음성신호를 아날로그 음성신호로 변환하여 스피커로 송출시키는 오디오 처리부; An audio processor for converting an analog audio signal that is input to the micro digital voice signal and converts the digital voice signal provided from the control unit to an analog audio signal delivered to the speaker; 무선망을 통해 송수신되는 음성신호 및 데이터 패킷을 부호화 및 복호화하는 변복조부; The modem unit for encoding and decoding a speech signal and data packets which are sent and received through a wireless network; 안테나를 통해 무선망과 접속하며, 상기 부호화된 음성신호 및 데이터 패킷의 주파수를 상승 변환 및 고조파 증폭하여 무선망으로 송출하고, 무선망에서 수신되는 신호를 저잡음 증폭 및 주파수 하강 변환하는 송수신부; Via an antenna connected to the radio network, and transmitting and receiving unit to the frequency of the encoded audio signal and a data packet up-converting and amplifying the harmonic conversion and sent to the radio network, the low noise amplifier and a frequency falling signal received from the radio network; 주변의 영상을 입력하며, 내장되는 DSP를 통해 디지털 신호로 변환하는 영상 입력부; And enter the surrounding image, an image input unit for converting into a digital signal through the DSP to be incorporated; JPEG 코덱, MPEG 코덱, Wavelet 코덱 중 어느 하나 이상의 영상 코덱을 포함하며 영상 입력부에서 인가되는 영상신호를 프레임 단위로 처리하고 표시부의 특성 및 디스플레이 규격에 맞추에 출력하는 영상처리부; JPEG codec, MPEG codec, an image processing unit that includes any one or more of the codec, Wavelet codec, video processing, and the video signal that is applied from the image input in frame units, and outputs to match the characteristics of the display and the display size; 상기 영상 처리부에서 인가되는 프레임 단위의 영상과 제어부에서 인가되는 메시지(메일), 컨텐츠, 뉴스, 날씨, 생활정보 데이터를 문자나 텍스트로 표시하는 표시부를 포함하며, Comprising a display unit for displaying the image processor messages to be applied in the image and the control unit of the frame unit is applied in (e-mail), the content, news, weather, life information data as a character or text,
    마이크로 입력되는 사용자 음성에서 음성의 시작점과 끝점을 검출하여 음성구간을 추출하고, 음성구간에서 추출되는 음소 및 음절을 조합하여 단어로 형성하며 단어의 조합으로 구성되는 문장을 음성 명령어로 인식하는 음성 인식장치; Detecting the start and end points of the speech in the user's voice to be micro-type extracting a voice section, and a combination of a phoneme and a syllable is extracted from the speech interval to form a word, and speech recognition for recognizing a sentence consisting of a set of words in the voice command Device; 휴대 단말기의 운용 프로그램과 음성인식 명령어를 제어코드로 변환하기 위한 표준 코드 테이블, 휴대 단말기의 운용 과정에서 발생되는 데이터 패킷을 저장하는 메모리부; Standard code table for converting the operational program and the speech recognition instruction of the mobile terminal to the control code, a memory for storing a data packet generated in the operating process of the portable terminal; 설정된 운용 프로그램에 따라 휴대 단말기의 제반적인 동작을 제어하며, 음성 인식모드에서 음성 명령어의 인식 결과에 따라 해당 정보를 엑세스하여 음성 송출 및 표시를 제공하거나 무선망에 해당하는 서비스를 요청하고 수신되는 서비스 정보를 표시부 및 음성으로 송출시키는 제어부를 더 포함하는 휴대 단말기의 음성 인식장치에 있어서, According to the set operation programs and controls the overall operation of the portable terminal, the service is to access the information in accordance with the recognition result of the speech command from the speech recognition mode providing voice transmission and display, or requesting the service to the radio network receives in a control section for sending the information to the display unit and a voice in the voice recognition device of the wireless terminal further comprises,
    상기 음성 인식장치는 입력 음성의 시작점과 끝점을 검출하여 음성구간을 추출하고, 음성구간에서 검출되는 음소 및 음절을 조합하여 단어로 형성하는 단어 조합부; The voice recognition device is a word combination unit for detecting the start and end points of the input speech to extract a voice section, and a combination of a phoneme and a syllable is detected in the voice section formed of a word;
    조합된 단어를 인식하여 문장으로 구성하는 단어 인식부; Word recognition unit for recognizing a word combination made up of sentences;
    단어의 조합으로 구성된 문장을 음성 명령어로 인식하는 음성 인식부; A speech recognition unit for recognizing a sentence consisting of a set of words in the voice instruction;
    인식된 음성 명령어를 메모리부에 저장된 한글 표준 코드 테이블을 적용하여 제어 코드로 변환하는 코드 변환부를 포함하는 휴대 단말기의 음성 인식장치. A voice recognition device for a mobile terminal including a voice recognition commands to apply the Hangul standard code table stored in the memory unit the code conversion to convert the control code portion.
  2. 삭제 delete
  3. 삭제 delete
  4. 삭제 delete
  5. 제1항에 있어서, According to claim 1,
    상기 음성 인식부는 입력 음성을 분석하여 속성을 파악하고 어절간 의존관계를 분석하여 음성 명령어의 문장으로 생성하는 구문 분석기; The speech recognition unit parser for analyzing the input speech to identify the property and air segmental analyzes dependency by creating a sentence of the voice command;
    상기 구문 분석기에서 생성된 음성 명령어의 문장을 메모리부에 저장된 한글 표준 코드 테이블을 적용하여 명령어의 실질적인 의미를 분석하는 구문 해석기를 포함하는 휴대 단말기의 음성 인식장치. Voice recognition device of the sentences of the speech commands generated by the parser comprises a parser for applying a Hangul standard code table stored in the memory unit analyzes the actual meaning of the instruction.
  6. 제1항에 있어서, According to claim 1,
    상기 코드 변환부는 상기 음성 인식부에서 명령어의 실질적인 의미가 분석된 음성 명령어의 속성을 파악하고 어절간 의존관계를 분석하는 구문 분석기; The code conversion unit parser to identify the properties of the speech command with a practical means of a command from the speech recognition unit analyze and control segmental analyzes dependency;
    상기 분석된 음성 명령어를 한글 표준 코드 테이블을 적용하여 명령어의 실질적인 의미를 파악하는 구문 해석기; Parser that a voice command the analyzed by applying the Hangul standard code table identify the actual meaning of the instructions;
    상기 구문 해석기에 의해 의미가 파악되어진 음성 명령어를 음절 변환하는 음절 변환기; Syllables converter to convert the voice command syllable been meaning are identified by the parser;
    상기 음절 변환된 음성 명령어를 파일로 생성하는 파일 생성기를 포함하는 휴대 단말기의 음성 인식장치. The voice recognition device of a portable terminal including a file generator for generating a voice command of the syllable to transform file.
  7. (a) 휴대 단말기의 대기상태에서 음성입력이 검출되면 시스템을 초기화한 후 음성 인식모드를 활성화하는 과정; (A) then when the voice input is detected in the standby state of the portable terminal to initialize the system, the process of activating a voice recognition mode;
    (b) 마이크로 입력되는 음성의 어절을 조합하여 단어로 생성하고, 단어의 속성과 어절간 의존관계를 분석하여 단어의 의미를 파악하는 과정; (B) micro-input step of generating a word in combination Eojeol of speech, and to analyze the properties and control segmental dependency of the word determine the meaning of the word;
    (c) 상기 (b) 과정에서 의미가 파악되어진 단어를 조합하여 문장으로 생성하는 과정; (C) the process to a combination of words means a grasp been created with words in the (b) process;
    (d) 상기 (c) 과정에서 단어의 조합으로 생성된 문장을 음성 명령어로 인식하고, 설정된 한글 표준 코드 테이블을 적용하여 음성 명령어의 실질적인 의미를 분석하는 과정; (D) the process of analyzing the actual meaning of the voice command by applying a Hangul standard code table recognition, and set the generated sentence in the (c) process a set of words in the voice instruction;
    (e) 상기 (d) 과정에서 의미가 분석된 음성 명령어의 파일을 생성하고, 이를 제어코드로 변환하는 과정 및; (E) generating a file of the voice command means is analyzed in the process (d), and converts it to a control code, and;
    (f) 상기 (e) 과정에서 변환된 제어코드에 따른 운용 프로그램의 작동으로 인식된 음성 명령에 매칭되는 정보를 엑세스하여 스피커를 통해 송출함과 동시에 표시부를 통해 표시하는 과정을 포함하는 휴대 단말기의 음성 인식방법. (F) for a mobile terminal including a step of displaying through the display and at the same time transmitted through the speaker to access the information that is matched to the voice command recognized by the operation of the operation program corresponding to the control code converter in the (e) process, how speech recognition.
  8. 제7항에 있어서, The method of claim 7,
    상기 (e) 과정에서 인식된 음성 명령에 매칭되는 정보는 수신 저장된 메시지(메일)의 표시 및 청취, 무선망으로부터 증권, 뉴스, 날씨, 생활정보, 컨텐츠 정보의 서비스 요청이며, 서비스 요청에 따라 수신되는 정보를 표시 및 음성 송출하는 것을 더 포함하는 휴대 단말기의 음성 인식방법. The (e) The information that is matched to a voice command recognition in the process of receiving the stored messages (e-mail) display, and listen to, securities from the wireless network, news, weather, lifestyle information, service request content information, received in accordance with the service request the speech recognition method of a portable terminal, comprising displaying and sending the voice information.
  9. 제7항에 있어서, The method of claim 7,
    상기 (a) 과정의 음성 인식모드에서 음성의 입력으로 메시지(메일)의 편집 및 전송과 수신 메시지(메일)의 출력을 제공하는 것을 더 포함하는 휴대 단말기의 음성 인식방법. Speech recognition method of the mobile terminal further includes providing the edit, and the output of the transmit and receive messages (e-mail) message (e-mail) to the input of a voice in the voice recognition mode of the (a) process.
KR1020070040652A 2007-04-26 2007-04-26 Apparatus for speech recognition of wireless terminal and method of thereof KR100819928B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070040652A KR100819928B1 (en) 2007-04-26 2007-04-26 Apparatus for speech recognition of wireless terminal and method of thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070040652A KR100819928B1 (en) 2007-04-26 2007-04-26 Apparatus for speech recognition of wireless terminal and method of thereof

Publications (1)

Publication Number Publication Date
KR100819928B1 true KR100819928B1 (en) 2008-04-08

Family

ID=39533957

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070040652A KR100819928B1 (en) 2007-04-26 2007-04-26 Apparatus for speech recognition of wireless terminal and method of thereof

Country Status (1)

Country Link
KR (1) KR100819928B1 (en)

Cited By (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101352695B1 (en) 2012-02-24 2014-01-17 주식회사 비엔에스웍스 Method for Displaying Contents by using Sound
WO2015005927A1 (en) * 2013-07-11 2015-01-15 Intel Corporation Device wake and speaker verification using the same audio input
KR101642918B1 (en) * 2015-08-03 2016-07-27 서치콘주식회사 Method for controlling network connection using codename protocol, network connection control server performing the same, and storage medium storing the same
KR20160127911A (en) * 2015-04-28 2016-11-07 주식회사 디오티스 Method for Providing Phone Banking based on Sentence Structure Recognition by using Linkage of Different Network
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
KR101834624B1 (en) * 2013-06-08 2018-03-05 애플 인크. Automatically adapting user interfaces for hands-free interaction
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10521466B2 (en) 2016-09-19 2019-12-31 Apple Inc. Data driven natural language event detection and classification

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050122604A (en) * 2004-06-25 2005-12-29 삼성전자주식회사 Method for initiating voice recognition in wireless terminal

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050122604A (en) * 2004-06-25 2005-12-29 삼성전자주식회사 Method for initiating voice recognition in wireless terminal

Cited By (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10381016B2 (en) 2008-01-03 2019-08-13 Apple Inc. Methods and apparatus for altering audio output signals
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US10108612B2 (en) 2008-07-31 2018-10-23 Apple Inc. Mobile device having human language translation capability with positional feedback
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
KR101352695B1 (en) 2012-02-24 2014-01-17 주식회사 비엔에스웍스 Method for Displaying Contents by using Sound
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
KR101834624B1 (en) * 2013-06-08 2018-03-05 애플 인크. Automatically adapting user interfaces for hands-free interaction
US9445209B2 (en) 2013-07-11 2016-09-13 Intel Corporation Mechanism and apparatus for seamless voice wake and speaker verification
US9852731B2 (en) 2013-07-11 2017-12-26 Intel Corporation Mechanism and apparatus for seamless voice wake and speaker verification
WO2015005927A1 (en) * 2013-07-11 2015-01-15 Intel Corporation Device wake and speaker verification using the same audio input
US10083690B2 (en) 2014-05-30 2018-09-25 Apple Inc. Better resolution when referencing to concepts
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US10497365B2 (en) 2014-05-30 2019-12-03 Apple Inc. Multi-command single utterance input method
US10431204B2 (en) 2014-09-11 2019-10-01 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US10311871B2 (en) 2015-03-08 2019-06-04 Apple Inc. Competing devices responding to voice triggers
KR101707086B1 (en) * 2015-04-28 2017-02-15 주식회사 디오티스 Method for Providing Phone Banking based on Sentence Structure Recognition by using Linkage of Different Network
KR20160127911A (en) * 2015-04-28 2016-11-07 주식회사 디오티스 Method for Providing Phone Banking based on Sentence Structure Recognition by using Linkage of Different Network
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
KR101642918B1 (en) * 2015-08-03 2016-07-27 서치콘주식회사 Method for controlling network connection using codename protocol, network connection control server performing the same, and storage medium storing the same
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10521466B2 (en) 2016-09-19 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10332518B2 (en) 2017-05-09 2019-06-25 Apple Inc. User interface for correcting recognition errors
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10529332B2 (en) 2018-01-04 2020-01-07 Apple Inc. Virtual assistant activation
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance

Similar Documents

Publication Publication Date Title
JP5394738B2 (en) Voice-controlled wireless communication device / system
CN1752975B (en) Method and system for voice-enabled autofill
JP4651613B2 (en) Voice activated message input method and apparatus using multimedia and text editor
KR101213514B1 (en) Method and system for transcribing telephone conversation to text
US7421390B2 (en) Method and system for voice control of software applications
US7974392B2 (en) System and method for personalized text-to-voice synthesis
AU684872B2 (en) Communication system
US20090006100A1 (en) Identification and selection of a software application via speech
JP3884851B2 (en) Communication system and radio communication terminal device used for the same
US6701162B1 (en) Portable electronic telecommunication device having capabilities for the hearing-impaired
CN102117614B (en) Personalized text-to-speech synthesis and personalized speech feature extraction
US7778397B2 (en) Dynamic video generation in interactive voice response systems
US7409349B2 (en) Servers for web enabled speech recognition
CN100580769C (en) Method and apparatus for selective speech recognition
US6738743B2 (en) Unified client-server distributed architectures for spoken dialogue systems
CN101207586B (en) Method and system for real-time automatic communication
US7395959B2 (en) Hands free contact database information entry at a communication device
US7480618B2 (en) Eliminating interference of noisy modality in a multimodal application
US7962344B2 (en) Depicting a speech user interface via graphical elements
US20050137875A1 (en) Method for converting a voiceXML document into an XHTMLdocument and multimodal service system using the same
US7506022B2 (en) Web enabled recognition architecture
JP2004287447A (en) Distributed speech recognition for mobile communication device
US7672436B1 (en) Voice rendering of E-mail with tags for improved user experience
CN1704958B (en) Information transmission system and information transmission method
CN1214612C (en) Speech control input of portable acquisition apparatus

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110331

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee