KR20110010939A - Apparatus and method for improving performance of voice recognition in portable terminal - Google Patents

Apparatus and method for improving performance of voice recognition in portable terminal Download PDF

Info

Publication number
KR20110010939A
KR20110010939A KR1020090068303A KR20090068303A KR20110010939A KR 20110010939 A KR20110010939 A KR 20110010939A KR 1020090068303 A KR1020090068303 A KR 1020090068303A KR 20090068303 A KR20090068303 A KR 20090068303A KR 20110010939 A KR20110010939 A KR 20110010939A
Authority
KR
South Korea
Prior art keywords
voice
parameter
user
portable terminal
recognition
Prior art date
Application number
KR1020090068303A
Other languages
Korean (ko)
Inventor
김영리
이준엽
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020090068303A priority Critical patent/KR20110010939A/en
Priority to US12/838,725 priority patent/US20110022389A1/en
Publication of KR20110010939A publication Critical patent/KR20110010939A/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

PURPOSE: A device and a method for increasing a voice recognition performance in a portable terminal are provided to supply information about voice recognition failure reason to a user. CONSTITUTION: A voice recognition management unit includes a parameter extraction unit(104) and a parameter comparison unit(106). The parameter extraction unit extracts a voice parameter from a voice of a user. The parameter comparison unit compares the extracted voice parameter with a voice recognition setting value. The parameter comparison unit determines a normal voice. A control unit(100) analyzes a determination result of a voice recognition determination unit by a voice parameter.

Description

휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법{APPARATUS AND METHOD FOR IMPROVING PERFORMANCE OF VOICE RECOGNITION IN PORTABLE TERMINAL}Apparatus and method for improving speech recognition performance in a portable terminal {APPARATUS AND METHOD FOR IMPROVING PERFORMANCE OF VOICE RECOGNITION IN PORTABLE TERMINAL}

본 발명은 휴대용 단말기의 음성 인식 성능을 향상시키기 위한 장치 및 방법에 관한 것으로, 특히 휴대용 단말기에서 음성 인식 실패가 반복적으로 발생하는 것을 방지하기 위하여 음성 인식 실패의 원인을 파악하여 음성 인식 결과를 직관적으로 제공하기 위한 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and a method for improving the speech recognition performance of a portable terminal. In particular, in order to prevent repeated speech recognition failures in a portable terminal, the cause of the speech recognition failure is identified and the result of the speech recognition is intuitively determined. An apparatus and method for providing the present invention.

최근 휴대용 단말기의 급격한 발달에 따라 특히 무선 음성 통화 및 정보 교환이 가능한 휴대폰은 필수품이 되었다. 휴대용 단말기 초기에는 단순히 휴대할 수 있고, 무선 통화가 가능한 것으로 인식되었으나, 그 기술이 발달함과 무선 인터넷의 도입에 따라 휴대용 단말기는 단순한 전화 통화 또는 일정 관리 등의 목적뿐만 아니라 장착된 디지털 카메라에 의한 이미지 촬영하거나, 위성 방송의 시청, 게임 및 근거리 통신을 이용한 리모컨 등의 그 활용범위가 갈수록 커지고 있다.Recently, with the rapid development of portable terminals, mobile phones capable of wireless voice call and information exchange have become a necessity. In the early days of portable terminals, it was recognized that they could simply be carried and wirelessly talked.However, with the development of the technology and the introduction of wireless Internet, portable terminals are not only used for simple phone calls or schedule management but also by the attached digital camera. The application range of the image capture, the watching of satellite broadcasting, the game and the remote control using near field communication are increasing.

특히 최근에는 음성 인식 기술이 적용된 휴대용 단말기가 출시되고 있으며 상기 현재 휴대용 단말기에 적용되는 음성 인식 기능은 단순의 저장번호의 이름을 입력하여 전화 연결을 하는 방법을 넘어서, STT(Speech to Text)등의 기능 제공한다. In particular, recently, a portable terminal using a speech recognition technology has been released, and the speech recognition function applied to the portable terminal is more than a method of connecting a telephone by entering a name of a simple storage number, such as speech to text (STT). Function.

상기와 같은 음성 인식 기능은 사용자의 음성 명령어를 인식하고 상기 음성에 해당하는 기능을 수행하도록 하는 것으로, 상기 사용자의 음성 명령어를 인식하는 것이 중요하다.Such a voice recognition function recognizes a user's voice command and performs a function corresponding to the voice, and it is important to recognize the user's voice command.

상기 휴대용 단말기가 사용자의 음성을 정확하게 인식하지 못할 경우, 상기 음성 인식 기능은 제대로 동작할 수 없음으로 상기와 같은 경우, 상기 휴대용 단말기는 사용자로 하여금 음성 명령어를 재입력하도록 한다.If the portable terminal does not correctly recognize the user's voice, the voice recognition function may not operate properly. In this case, the portable terminal allows the user to re-enter the voice command.

이때, 상기 휴대용 단말기는 한정된 텍스트 또는 효과음으로 음성 명령어 인식 실패를 알리게 된다. 예를 들어, 사용자가 음성 인식으로 전화를 걸기 위해 "Call 1234567" 이라고 했을 경우, 상기 휴대용 단말기가 음성 명령어를 제대로 인식할 경우, 해당 번호에 대한 전화 연결을 수행하나 음성 명령어 인식에 실패할 경우, "Try again?" 과 같은 단순한 음성 또는 한정된 텍스트로 음성 명령어를 재입력하도록 한다.In this case, the portable terminal notifies the voice command recognition failure with limited text or sound effects. For example, when a user calls "Call 1234567" to make a call using voice recognition, when the portable terminal recognizes a voice command correctly, the user connects to the number but fails to recognize the voice command. "Try again?" Re-enter voice commands with simple voice or limited text, such as

상기와 같이 음성 명령어를 제대로 인식하지 못하는 경우는 사용자의 목소리 크기, 발음, 액센트 등을 상기 휴대용 단말기가 제대로 인식하지 못하여 발생할 수 있는 것으로, 사용자는 인식 실패 원인을 알 수 없어 똑같은 형태의 음성 명령어를 재입력하여 동일한 원인의 음성 인식 실패가 반복되는 문제점이 있다.If the voice command is not properly recognized as described above, it may be caused by the portable terminal not properly recognizing the user's voice size, pronunciation, and accent, etc., and the user may not know the cause of the recognition failure. There is a problem that the voice recognition failure of the same cause is repeated by re-entering.

상기와 같은 문제점은 휴대용 단말기의 음성 인식율을 낮추게 되어 사용자의 음성 인식 기능 사용 빈도를 떨어뜨리게 된다.Such a problem lowers the speech recognition rate of the portable terminal, thereby decreasing the frequency of use of the speech recognition function of the user.

따라서 상기와 같은 문제점을 해결하여 상기 휴대용 단말기의 음성 인식율을 향상시키기 위한 장치 및 방법이 요구된다.Accordingly, there is a need for an apparatus and method for improving the speech recognition rate of the portable terminal by solving the above problems.

본 발명은 상술한 바와 같은 문제점을 해결하기 위하여 도출된 것으로서, 본 발명의 목적은 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법을 제공함에 있다.The present invention was derived to solve the above problems, and an object of the present invention is to provide an apparatus and method for improving speech recognition performance in a portable terminal.

본 발명의 다른 목적은 휴대용 단말기에서 음성 인식 결과를 제공하여 음성 인식 성능을 향상시키기 위한 장치 및 방법을 제공함에 있다.Another object of the present invention is to provide an apparatus and a method for improving speech recognition performance by providing a speech recognition result in a portable terminal.

본 발명의 또 다른 목적은 휴대용 단말기에서 음성 인식 실패의 원인을 나타내는 정보를 제공하기 위한 장치 및 방법을 제공함에 있다.Another object of the present invention is to provide an apparatus and method for providing information indicating a cause of a speech recognition failure in a portable terminal.

상술한 목적들을 달성하기 위한 본 발명의 제 1 견지에 따르면, 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치는 사용자의 음성을 인식하여 음성 파라미터를 추출한 후, 상기 추출한 음성 파라미터가 음성 인식 성공 유무를 판단하는 기준을 만족하는지 판단하는 음성 인식 관리부와, 상기 음성 인식 판단부의 판단 결과를 음성 파라미터 별로 분석하여 출력하는 제어부를 포함하는 것을 특징으로 한다.According to a first aspect of the present invention for achieving the above objects, a device for improving speech recognition performance in a portable terminal recognizes a user's voice and extracts a speech parameter, the extracted speech parameter is determined whether the speech recognition success or not And a controller configured to determine whether the criterion is satisfied, and a controller configured to analyze and output the determination result of the voice recognition determiner for each voice parameter.

상술한 목적들을 달성하기 위한 본 발명의 제 2 견지에 따르면, 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 방법은 사용자의 음성을 인식하여 음성 파라미터를 추출한 후, 상기 추출한 음성 파라미터가 음성 인식 성공 유무를 판단 하는 기준을 만족하는지 판단하는 과정과, 상기 판단 결과를 음성 파라미터 별로 분석하여 출력하는 과정을 포함하는 것을 특징으로 한다.According to a second aspect of the present invention for achieving the above object, a method for improving speech recognition performance in a portable terminal is to recognize the user's voice to extract the speech parameter, and then to determine whether the extracted speech parameter is successful speech recognition Determining whether the criterion is satisfied, and analyzing and outputting the determination result for each voice parameter.

상술한 바와 같이 본 발명은 휴대용 단말기의 음성 인식 성능을 향상시키기 위한 장치 및 방법에 관한 것으로, 음성 인식 실패의 원인이 되는 정보를 사용자에게 제공함으로써 똑같은 형태의 음성 명령어를 입력하여 동일한 원인의 음성 인식 실패가 반복되는 것을 방지할 수 있다.As described above, the present invention relates to an apparatus and a method for improving the speech recognition performance of a portable terminal. The present invention relates to a voice recognition of the same cause by inputting the same type of voice command by providing a user with information that causes the speech recognition failure. The failure can be prevented from repeating.

이하 본 발명의 바람직한 실시 예를 첨부된 도면의 참조와 함께 상세히 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. In describing the present invention, when it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted.

이하 설명에서는 본 발명에 따른 휴대용 단말기의 음성 인식 성능을 향상시키기 위하여 음성 인식 결과를 직관적으로 제공하기 위한 장치 및 방법에 대하여 설명할 것이다. 상기 음성 인식 결과는 사용자가 동일한 형태의 음성을 반복적으로 입력하여 동일한 입력 인식 실패가 발생하는 것을 방지하기 위하여 음성 인식 실패의 원인을 분석한 결과를 말한다. 또한, 이하 설명에서 음성 인식 설정값은 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값을 말하며, 음성 파 라미터는 사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 등이 될 수 있다.In the following description, an apparatus and method for intuitively providing a voice recognition result in order to improve voice recognition performance of a portable terminal according to the present invention will be described. The speech recognition result refers to a result of analyzing the cause of the speech recognition failure in order to prevent the user from repeatedly inputting the same type of speech to prevent the same input recognition failure. In addition, in the following description, the voice recognition setting value refers to a value which is a reference value for determining a normal voice in the portable terminal, and the voice parameter is a parameter for determining whether the voice of the user is a normal voice for the voice recognition function. It may be a loudness (voice size), a pronunciation accuracy value, an accent, or the like.

도 1은 본 발명에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 구성을 도시한 블록도이다.1 is a block diagram showing the configuration of a portable terminal for providing a voice recognition result according to the present invention.

상기 도 1을 참조하면, 상기 휴대용 단말기는 제어부(100), 음성 인식 관리부(102), 메모리부(108), 입력부(110), 표시부(112) 및 통신부(114)를 포함하여 구성할 수 있으며, 상기 음성 인식 관리부(102)는 파라미터 추출부(104) 및 파라미터 비교부(106)를 포함할 수 있다.Referring to FIG. 1, the portable terminal may include a control unit 100, a voice recognition management unit 102, a memory unit 108, an input unit 110, a display unit 112, and a communication unit 114. The voice recognition management unit 102 may include a parameter extraction unit 104 and a parameter comparison unit 106.

먼저, 상기 휴대용 단말기의 제어부(100)는 상기 휴대용 단말기의 전반적인 동작을 제어한다. 예를 들어, 음성통화 및 데이터 통신을 위한 처리 및 제어를 수행하며, 통상적인 기능에 더하여 본 발명에 따라, 상기 제어부(100)는 사용자의 음성을 인식한 후, 상기 인식한 사용자의 음성이 음성 인식 기능을 제어하는 정상적인 음성인지 또는 비 정상적인 음성인지를 판단한다. 이후, 상기 제어부(100)는 상기 판단한 사용자의 음성에 대한 결과를 출력하여 사용자로 하여금 음성 인식 결과를 인식할 수 있도록 처리한다. 예를 들어, 상기 제어부(100)는 사용자의 음성을 제대로 인식할 경우, 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 등이 음성 판단에 기준이 되는 음성 인식 설정 값의 조건을 만족한다는 정보를 출력할 수 있다. 반대로 상기 제어부(100)는 사용자의 음성을 제대로 인식할 수 없을 경우, 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 가운데 음성 인식 설정 값의 조건을 만족하지 못하는 항목에 대한 정보를 출력할 수 있다.First, the controller 100 of the portable terminal controls the overall operation of the portable terminal. For example, the processor 100 performs processing and control for voice call and data communication, and in addition to the usual function, the controller 100 recognizes the user's voice, and then the recognized user's voice is voiced. It is determined whether the normal voice or the abnormal voice controlling the recognition function. Thereafter, the controller 100 outputs the result of the determined voice of the user so that the user can recognize the result of the speech recognition. For example, if the user's voice is properly recognized, the controller 100 satisfies the condition of the voice recognition setting value based on the voice judgment (the size of the speech), the pronunciation accuracy value, the accent, etc. of the user. Information can be printed. On the contrary, when the user's voice cannot be properly recognized, the controller 100 outputs information on an item that does not satisfy the condition of the user's voice size (voice size), pronunciation accuracy value, and accent recognition value among accents. can do.

이로 인하여 상기 제어부(100)가 사용자의 음성 크기가 음성 인식 설정값의 조건을 만족하지 않는 정보를 출력할 경우, 상기 휴대용 단말기의 사용자는 사용자의 음성 크기를 조절하여 동일한 원인의 음성 인식 실패를 방지할 수 있다.Thus, when the controller 100 outputs information in which the user's voice size does not satisfy the condition of the voice recognition set value, the user of the portable terminal adjusts the user's voice size to prevent the voice recognition failure of the same cause. can do.

상기 음성 인식 관리부(102)는 상기 제어부(100)의 제어를 받아 사용자의 음성을 인식하여 음성 인식 기능을 제어하기 위한 정상적인 음성 여부를 판단한 후, 음성 인식 결과를 출력하여 사용자로 하여금 음성 인식 결과를 확인하도록 처리한다.The voice recognition management unit 102 recognizes the user's voice under the control of the control unit 100, determines whether or not the normal voice for controlling the voice recognition function, and outputs the voice recognition result to the user to output the voice recognition result Process to confirm.

이때, 상기 음성 인식 관리부(100)는 상기 파라미터 추출부(104)로 하여금 사용자의 음성에서 음성 파라미터를 추출하도록 처리하여 상기 정상적인 음성 여부를 판단하기 위한 음성 파라미터를 획득한다. 여기에서, 상기 음성 파라미터는 사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 등이 될 수 있다.In this case, the voice recognition manager 100 processes the parameter extractor 104 to extract a voice parameter from the user's voice to obtain a voice parameter for determining whether the voice is normal. Here, the voice parameter is a parameter for determining whether the user's voice is a normal voice for the voice recognition function, and may be a voice size (voice size), pronunciation accuracy value, accent, etc. of the user.

또한, 상기 음성 인식 관리부(102)는 상기 파라미터 추출부(104)에 의해 획득된 음성 파라미터를 이용하여 정상적인 음성 여부를 판단한다. 이때, 상기 음성 인식 관리부(102)는 상기 파라미터 비교부(106)로 하여금 정상적인 음성 여부를 판단하도록 처리한다.In addition, the voice recognition manager 102 determines whether the voice is normal using the voice parameter acquired by the parameter extractor 104. At this time, the voice recognition management unit 102 processes the parameter comparison unit 106 to determine whether or not the normal voice.

상기 음성 인식 관리부(102)의 파라미터 추출부(104)는 사용자의 음성을 인식하여 음성 파라미터를 획득하고, 상기 파라미터 비교부(106)는 상기 파라미터 추 출부(104)에 의해 획득된 음성 파라미터를 음성 인식 설정값과 비교하여 정상적인 음성 여부를 판단한다. 여기에서, 상기 음성 인식 설정값은 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값을 말한다.The parameter extraction unit 104 of the voice recognition management unit 102 acquires a voice parameter by recognizing a user's voice, and the parameter comparison unit 106 voices the voice parameter obtained by the parameter extraction unit 104. It is judged whether or not the normal voice is compared with the recognition set value. Here, the voice recognition setting value refers to a value that is a reference for determining a normal voice in the portable terminal.

예를 들어, 상기 파라미터 비교부(106)는 사용자의 음성 크기(말소리 크기)에 대한 음성 인식 설정 값을 사용할 경우, 상기 파라미터 추출부(104)에 의해 획득된 사용자의 음성 크기(말소리의 크기) 파라미터를 음성 인식 설정 값과 비교한 후, 상기 획득된 파라미터가 음성 인식 설정 값의 기준보다 높을 경우, 정상적인 음성이라고 판단할 수 있다.For example, when the parameter comparison unit 106 uses a voice recognition setting value for the user's voice size (word size), the user's voice size obtained by the parameter extractor 104 (word size) After comparing the parameter with the voice recognition setting value, if the acquired parameter is higher than the reference value of the voice recognition setting value, it may be determined that the voice is normal.

한편, 상기 파라미터 비교부(106)는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트에 대한 음성 인식 설정 값을 사용할 경우, 상기 파라미터 추출부(104)에 의해 획득된 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 파라미터를 상기 음성 인식 설정값과 비교한 후, 상기 획득된 파라미터들이 음성 인식 설정 값의 기준보다 높을 경우, 정상적인 음성이라고 판단할 수 있다.On the other hand, the parameter comparison unit 106, when using the user's voice size (voice size), pronunciation accuracy value, the speech recognition setting value for the accent, the user's voice size obtained by the parameter extraction unit 104 After comparing the (voice size), pronunciation accuracy value, and accent parameter with the speech recognition setting value, if the acquired parameters are higher than the reference value of the speech recognition setting value, it may be determined that the sound is normal.

이로 인하여 상기 제어부(100)는 상기 인식한 음성이 음성 인식을 제어하기 위한 음성인지를 판단할 경우, 상기 음성 파라미터의 항목이 음성 인식 설정 값을 기준을 만족하였다는 정보를 출력함으로써 음성 인식 결과를 제공할 수 있다.Therefore, when the controller 100 determines whether the recognized voice is a voice for controlling voice recognition, the controller 100 outputs information indicating that an item of the voice parameter satisfies a criterion of a voice recognition setting value. Can provide.

반면에 상기 제어부(100)는 상기 인식한 음성이 음성 인식을 제어하기 위한 음성이 아님을 판단할 경우, 상기 음성 인식 설정 값의 기준을 만족하지 못하는 음성 인식 파라미터에 대한 정보를 제공하여 사용자의 음성 재입력시 동일한 인식 오류가 발생하는 것을 방지하도록 한다.On the other hand, when the controller 100 determines that the recognized voice is not a voice for controlling voice recognition, the controller 100 provides information on a voice recognition parameter that does not satisfy the criterion of the voice recognition setting value, thereby providing a user voice. Prevent the same recognition error from happening again.

상기 휴대용 단말기의 메모리부(108)는 롬(ROM ; Read Only Memory), 램(RAM ; Random Access Memory), 플래쉬롬(flash ROM)으로 구성된다. 상기 롬은 상기 제어부(100) 및, 음성 인식 관리부(102)의 처리 및 제어를 위한 프로그램의 마이크로코드와 각종 참조 데이터를 저장한다.The memory unit 108 of the portable terminal includes a read only memory (ROM), a random access memory (RAM), and a flash ROM. The ROM stores microcodes and various reference data of a program for processing and controlling the controller 100 and the voice recognition management unit 102.

상기 램은 상기 제어부(100)의 워킹 메모리(working memory)로, 각종 프로그램 수행 중에 발생하는 일시적인 데이터를 저장한다. 또한, 상기 플래쉬롬은 전화번호부(phone book), 발신메시지, 수신메시지 및 사용자의 터치 입력 지점의 정보와 같은 갱신 가능한 각종 보관용 데이터를 저장하며 본 발명에 따라 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값인 음성 인식 설정 값을 저장한다.The RAM is a working memory of the controller 100, and stores temporary data generated during execution of various programs. In addition, the flash ROM stores various updatable storage data such as a phone book, an outgoing message, a received message, and information of a user's touch input point, and determines a normal voice in the portable terminal according to the present invention. The voice recognition setting value, which is a reference value, is stored.

상기 입력부(110)는 0 ~ 9의 숫자키 버튼들과, 메뉴버튼(menu), 취소버튼(지움), 확인버튼, 통화버튼(TALK), 종료버튼(END), 인터넷접속 버튼, 네비게이션 키(또는 방향키) 버튼들 및 문자 입력 키 등 다수의 기능키들을 구비하며, 사용자가 누르는 키에 대응하는 키 입력 데이터를 상기 제어부(100)로 제공한다.The input unit 110 includes 0 to 9 numeric key buttons, a menu button (menu), a cancel button (clear), an OK button, a call button (TALK), an end button (END), an internet access button, a navigation key ( Or a plurality of function keys such as arrow keys) buttons and character input keys, and provides key input data corresponding to a key pressed by the user to the controller 100.

상기 표시부(112)는 상기 휴대용 단말기의 동작 중에 발생하는 상태 정보, 제한된 숫자의 문자들, 다량의 동영상 및 정지영상 등을 디스플레이한다. 상기 표시부(112)는 컬러 액정 디스플레이 장치(LCD ; Liquid Crystal Display)를 사용할 수 있으며 상기 표시부(112)는 터치 입력 장치를 구비하여 터치 입력 방식의 휴대용 단말기에 적용할 경우 입력 장치로 사용할 수 있다.The display unit 112 displays status information generated during the operation of the portable terminal, a limited number of characters, a large amount of video and still images, and the like. The display unit 112 may use a color liquid crystal display (LCD), and the display unit 112 may include a touch input device and may be used as an input device when applied to a touch input type portable terminal.

상기 통신부(114)는 안테나(미도시)를 통해 입출력되는 데이터의 무선신호 를 송수신 처리하는 기능을 수행한다. 예를 들어, 송신인 경우, 송신할 데이터를 채널 코딩(Channel coding) 및 확산(Spreading)한 후, RF처리하여 송신하는 기능을 수행하고, 수신인 경우, 수신된 RF 신호를 기저대역신호로 변환하고 상기 기저대역신호를 역 확산(De-spreading) 및 채널 복호(Channel decoding)하여 데이터를 복원하는 기능을 수행한다.The communication unit 114 performs a function of transmitting and receiving a radio signal of data input and output through an antenna (not shown). For example, in the case of transmission, after performing channel coding and spreading on the data to be transmitted, RF processing is performed to transmit the data. In the case of reception, the received RF signal is converted into a baseband signal. The baseband signal is de-spreaded and channel decoded to restore data.

상기 음성 인식 관리부(102)의 역할은 상기 휴대용 단말기의 제어부(100)에 의해 수행할 수 있으나, 본 발명에서 이를 별도로 구성하여 도시한 것은 설명의 편의를 위한 예시적인 구성이지 결코 본 발명의 범위를 제한하자는 것이 아니며, 당업자라면 본 발명의 범위 내에서 다양한 변형 구성이 가능하다는 것을 알 수 있을 것이다. 예를 들어, 이들 모두를 상기 제어부(100)에서 처리하도록 구성할 수도 있다.The role of the voice recognition management unit 102 may be performed by the control unit 100 of the portable terminal. However, the configuration of the voice recognition management unit 102 is an exemplary configuration for convenience of description and the scope of the present invention will never be limited. It is not intended to be limiting and those skilled in the art will recognize that various modifications are possible within the scope of the invention. For example, the controller 100 may be configured to process all of them.

이상은 본 발명에 따른 휴대용 단말기의 음성 인식 성능을 향상시키기 위하여 음성 인식 결과를 직관적으로 제공하기 위한 장치에 대하여 설명하였고, 이하 설명에서는 본 발명의 바람직한 일 실시 예에 따른 상기 장치를 이용하여 사용자가 동일한 형태의 음성을 반복적으로 입력하여 동일한 입력 인식 실패가 발생하는 것을 방지하기 위하여 음성 인식 실패의 원인을 분석한 결과를 제공하여 음성 인식 성능을 향상시키는 방법에 대하여 설명할 것이다.The foregoing has described an apparatus for intuitively providing a speech recognition result in order to improve speech recognition performance of a portable terminal according to the present invention. Hereinafter, a user using the apparatus according to an exemplary embodiment of the present invention will be described. In order to prevent the same input recognition failure by repeatedly inputting the same type of speech, a method of improving the speech recognition performance by providing a result of analyzing the cause of the speech recognition failure will be described.

도 2는 본 발명에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 동작 과정을 도시한 흐름도이다.2 is a flowchart illustrating an operation process of a portable terminal for providing a voice recognition result according to the present invention.

상기 도 2를 참조하면, 상기 휴대용 단말기는 먼저 201단계에서 음성 인식 기능을 수행한 후, 203단계로 진행하여 사용자의 음성을 인식하는 과정을 수행한다.Referring to FIG. 2, the portable terminal first performs a voice recognition function in step 201, and then proceeds to step 203 to perform a process of recognizing a user's voice.

이후, 상기 휴대용 단말기는 205단계로 진행하여 상기 203단계에서 인식한 음성을 분석하여 음성 파라미터를 추출한다. 여기에서, 상기 음성 파라미터는 사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 등이 될 수 있다.In step 205, the portable terminal analyzes the voice recognized in step 203 and extracts a voice parameter. Here, the voice parameter is a parameter for determining whether the user's voice is a normal voice for the voice recognition function, and may be a voice size (voice size), pronunciation accuracy value, accent, etc. of the user.

이후, 상기 휴대용 단말기는 207단계로 진행하여 음성 인식 설정 값과 상기 분석한 파라미터를 비교하여 사용자의 음성이 음성 인식 기능을 제어하기 위한 정상적인 음성인지를 판단한다. 여기에서, 상기 음성 인식 설정 값은 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값을 말하며, 상기 휴대용 단말기는 상기 분석한 파라미터가 상기 음성 인식 설정 값 이상일 경우, 사용자의 음성은 음성 인식 기능을 위한 정상적인 음성이라고 판단할 수 있다.In step 207, the portable terminal compares the voice recognition setting value with the analyzed parameter to determine whether the user's voice is a normal voice for controlling the voice recognition function. Herein, the voice recognition setting value refers to a value which is a reference value for determining a normal voice in the portable terminal. When the analyzed parameter is equal to or greater than the voice recognition setting value, the user's voice may perform a voice recognition function. It can be determined that the normal voice for.

이후, 상기 휴대용 단말기는 209단계로 진행하여 상기 207단계의 비교 결과를 출력하도록 처리한다. 즉, 상기 휴대용 단말기는 상기 비교 과정에서 음성 인식 기능을 위한 정상적인 음성이 아님을 판단할 경우, 상기 음성 인식 설정 값보다 낮은 파라미터의 정보를 출력한다. 이로 인하여 사용자는 해당 정보를 이용하여 음성 인식율을 높이기 위하여 명확한 음성을 발성한다.Thereafter, the portable terminal proceeds to step 209 and processes to output the comparison result of step 207. That is, when it is determined that the voice is not a normal voice for the voice recognition function in the comparison process, the portable terminal outputs information of a parameter lower than the voice recognition setting value. As a result, the user speaks a clear voice to increase the speech recognition rate using the corresponding information.

예를 들어, 상기 휴대용 단말기가 상기 음성 파라미터 가운데 발음 정확도를 나타내는 파라미터가 상기 음성 인식 설정 값보다 낮다는 정보를 출력할 경우, 상 기 휴대용 단말기의 사용자는 음성 인식율을 높이기 위하여 기 발성한 음성보다 명확한 발음으로 음성 인식 기능을 위한 음성을 발성할 것이다.For example, when the portable terminal outputs information indicating that a parameter representing pronunciation accuracy among the speech parameters is lower than the speech recognition setting value, the user of the portable terminal may have a clearer voice than the speech produced in order to increase the speech recognition rate. Pronunciation will produce a voice for speech recognition.

이후, 상기 휴대용 단말기는 본 알고리즘을 종료한다.The portable terminal then terminates this algorithm.

도 3은 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식 결과를 제공하는 과정을 도시한 흐름도이다.3 is a flowchart illustrating a process of providing a voice recognition result in a portable terminal according to an exemplary embodiment of the present invention.

상기 도 3을 참조하면, 상기 휴대용 단말기는 먼저 301단계에서 음성 인식 기능을 수행한 후, 303단계로 진행하여 음성 인식 설정 값을 출력하도록 처리한다. 여기에서, 상기 음성 인식 설정 값은 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값을 말하며, 상기 휴대용 단말기는 상기 음성 인식 설정 값을 특정 도형으로 표시할 수 있다. 예를 들어, 상기 휴대용 단말기는 상기 음성 인식 설정 값을 "△"으로 표시할 경우, 상기 "△"의 각각의 면은 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트의 값을 의미한다. Referring to FIG. 3, the portable terminal first performs a voice recognition function in step 301, and then proceeds to step 303 to process a voice recognition setting value. Here, the voice recognition setting value refers to a value used as a reference for determining a normal voice in the portable terminal, and the portable terminal may display the voice recognition setting value in a specific figure. For example, when the portable terminal displays the speech recognition setting value as "Δ", each side of the "△" means a user's voice size (word size), pronunciation accuracy value, and accent value. do.

이후, 상기 휴대용 단말기는 305단계로 진행하여 사용자의 음성을 인식한 후, 307단계로 진행하여 인식한 음성을 분석하여 음성 인식 파라미터를 추출한다. 여기에서, 상기 음성 파라미터는 사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 등이 될 수 있으며, 상기 휴대용 단말기에서 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트를 음성 인식 설정 값으로 사용할 경우, 상기 휴대용 단말기는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트에 해당하는 파라미터를 추출할 것이다.In step 305, the portable terminal recognizes the user's voice. In step 307, the portable terminal analyzes the recognized voice and extracts a voice recognition parameter. Here, the voice parameter is a parameter for determining whether the user's voice is a normal voice in the voice recognition function, and may be a voice size (voice size), pronunciation accuracy value, accent, etc. of the user. When using the voice size (size of speech), pronunciation accuracy value, and accent as the speech recognition setting value, the portable terminal will extract parameters corresponding to the user's voice size (size of speech), pronunciation accuracy value, and accent.

이후, 상기 휴대용 단말기는 상기 추출한 파라미터의 정보를 출력한 후, 311단계로 진행하여 음성 인식 설정 값과 추출한 파라미터를 비교하는 과정을 수행한다. 상기 311단계는 사용자의 음성이 음성 인식을 제어하기 위한 정상적인 음성인지 또는 비정상적인 음성인지를 판단하기 위한 과정이다.After that, the portable terminal outputs the information of the extracted parameter, and then proceeds to step 311 to perform a process of comparing the speech recognition setting value and the extracted parameter. Step 311 is a process for determining whether the user's voice is a normal voice or an abnormal voice for controlling voice recognition.

이후, 상기 휴대용 단말기는 313단계로 진행하여 상기 311단계의 비교 결과 정상적인 음성 인식을 판단하였는지 확인한다.In step 313, the portable terminal determines whether normal speech recognition is determined as a result of the comparison of step 311.

만일, 상기 313단계에서 사용자의 음성이 음성 인식을 제어하기 위한 비정상적인 음성이라고 판단한 경우, 상기 휴대용 단말기는 319단계로 진행하여 기준 이하의 파라미터 정보를 확인한 후, 321단계로 진행하여 상기 확인한 기준 이하의 파라미터 정보를 출력하도록 처리한다.If it is determined in step 313 that the user's voice is an abnormal voice for controlling voice recognition, the portable terminal proceeds to step 319 and checks parameter information below the reference. Process to output parameter information.

이때, 상기 휴대용 단말기는 상기 311단계에서 추출한 파라미터가 상기 음성 인식 설정 값 미만임을 나타내는 정보를 출력하는 것으로, 상기 음성 인식 설정 값이 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트로 구성될 경우, 상기 휴대용 단말기는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트의 파라미터 정보를 상기 음성 인식 설정 값과 비교한 비교 값을 출력하도록 한다.In this case, the portable terminal outputs information indicating that the parameter extracted in step 311 is less than the speech recognition setting value, wherein the speech recognition setting value comprises a user's voice size (voice size), pronunciation accuracy value, and accent. If so, the portable terminal outputs a comparison value in which the user's voice size (word size), pronunciation accuracy value, and accent parameter information are compared with the speech recognition setting value.

이후, 상기 휴대용 단말기는 사용자의 음성을 재확인하기 위하여 상기 305단계의 과정을 수행한다.Thereafter, the portable terminal performs the process of step 305 to reconfirm the voice of the user.

한편, 상기 313단계에서 사용자의 음성이 음성 인식을 제어하기 위한 정상적 인 음성이라고 판단한 경우, 상기 휴대용 단말기는 315단계로 진행하여 정상적인 음성 인식을 알리는 비교 값을 출력한다. 여기에서, 상기 315단계는 상기 311단계에서 추출한 파라미터가 상기 음성 인식 설정 값 이상임을 나타내는 정보를 출력하는 것으로, 상기 음성 인식 설정 값이 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트로 구성될 경우, 상기 휴대용 단말기는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트의 파라미터 정보를 상기 음성 인식 설정 값과 비교한 비교 값을 출력하도록 한다.On the other hand, if it is determined in step 313 that the user's voice is a normal voice for controlling voice recognition, the portable terminal proceeds to step 315 and outputs a comparison value indicating the normal voice recognition. Here, the step 315 outputs information indicating that the parameter extracted in the step 311 is equal to or greater than the speech recognition setting value, wherein the speech recognition setting value is the user's voice size (voice size), pronunciation accuracy value, and accent. When configured, the portable terminal outputs a comparison value in which the user's voice size (voice size), pronunciation accuracy value, and accent parameter information are compared with the speech recognition setting value.

이후, 상기 휴대용 단말기는 317단계로 진행하여 상기 사용자의 음성에 해당하는 음성 인식 기능을 수행한다.In step 317, the portable terminal performs a voice recognition function corresponding to the user's voice.

이후, 상기 휴대용 단말기는 본 알고리즘을 종료한다.The portable terminal then terminates this algorithm.

도 4는 본 발명의 바람직한 일 실시 예에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 화면을 도시한 도면이다.4 is a diagram illustrating a screen of a portable terminal for providing a voice recognition result according to an exemplary embodiment of the present invention.

도 4(a)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식 설정 값을 출력한 화면이다.4A is a screen of outputting a voice recognition setting value in a portable terminal according to an exemplary embodiment of the present invention.

상기 도 4(a)를 참조하면, 상기 휴대용 단말기는 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값인 음성 인식 설정 값을 점선으로 출력(401)한 것으로, 본 발명의 바람직한 일 실시 예에 따라 상기 휴대용 단말기는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트의 값 가운데 적어도 어느 한 가지의 음성 인식 설정 값을 "○"으로 표시할 수 있다.Referring to FIG. 4 (a), the portable terminal outputs a voice recognition setting value, which is a reference value for determining a normal voice, by a dotted line in a portable terminal, according to an exemplary embodiment of the present invention. The portable terminal may display a voice recognition setting value of at least one of a user's voice size (voice size), pronunciation accuracy value, and accent value as "○".

도 4(b)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식을 실패함을 알리는 정보를 출력한 화면이다.4 (b) is a screen outputting information indicating that voice recognition fails in a portable terminal according to an exemplary embodiment of the present invention.

상기 도 4(b)를 참조하면, 상기 휴대용 단말기는 사용자의 음성을 인식하여 음성 파라미터 정보를 추출한 후, 상기 추출한 파라미터 정보를 상기 음성 인식 설정 값과 비교하여 음성 인식 결과를 제공한다. 상기와 같이 음성 인식 결과를 제공하고자 할 경우, 상기 휴대용 단말기는 점선으로 된 상기 음성 인식 설정 값(401)과 실선으로 된 추출한 파라미터 정보(403)를 함께 출력하여 사용자가 쉽게 음성 인식 결과를 확인하도록 한다.Referring to FIG. 4B, the portable terminal recognizes a user's voice to extract voice parameter information, and compares the extracted parameter information with the voice recognition setting value to provide a voice recognition result. When providing a voice recognition result as described above, the portable terminal outputs the voice recognition setting value 401 in dotted line and the extracted parameter information 403 in solid line so that the user can easily check the voice recognition result. do.

예를 들어, 상기 휴대용 단말기가 음성 인식에 실패하였다고 판단할 경우, 도시한 바와 같이 음성 인식 설정 값과 추출한 파라미터의 위치 차이를 크게하도록 한다. 이때, 상기 휴대용 단말기는 음성 인식 설정 값과 추출한 파라미터를 비교하여 음성 인식 성공 유무를 판단하는데 추출한 파라미터가 음성 인식 설정 값보다 낮을 수록 음성 인식의 정확도가 떨어진다고 판단한다. 상기와 같이 휴대용 단말기는 음성 인식의 정확도를 나타내기 위하여 음성 인식 설정 값과 추출한 파라미터의 위치를 조절한다. 즉, 음성 인식의 정확도가 낮을 수록 상기 음성 인식 설정 값과 추출한 파라미터의 위치 차이를 크게(405)하도록 한다.For example, when it is determined that the portable terminal has failed in speech recognition, as shown in the drawing, the position difference between the speech recognition setting value and the extracted parameter is increased. At this time, the portable terminal compares the voice recognition setting value with the extracted parameter to determine whether the voice recognition is successful. The lower the extracted parameter is than the voice recognition setting value, the accuracy of the voice recognition is determined to be lower. As described above, the portable terminal adjusts the voice recognition setting value and the position of the extracted parameter to indicate the accuracy of the voice recognition. That is, the lower the accuracy of speech recognition, the larger the difference between the position of the speech recognition setting value and the extracted parameter (405).

도 4(c)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식을 성공을 알리는 정보를 출력한 화면이다.4 (c) is a screen outputting information indicating success of speech recognition in a portable terminal according to an exemplary embodiment of the present invention.

상기 도 4(c)를 참조하면, 앞서 설명한 바와 같이 상기 사용자의 음성을 인식하여 음성 파라미터 정보를 추출한 후, 상기 추출한 파라미터 정보를 상기 음성 인식 설정 값과 비교하여 음성 인식 결과를 제공한다. Referring to FIG. 4C, as described above, voice parameter information is extracted by recognizing the user's voice, and then the extracted parameter information is compared with the voice recognition setting value to provide a voice recognition result.

예를 들어, 상기 휴대용 단말기가 음성 인식에 성공하였다고 판단할 경우, 도시한 바와 같이 음성 인식 설정 값과 추출한 파라미터의 위치 동일(407)하게 하여 상기 추출한 파라미터가 음성 인식 설정 값을 만족함을 사용자에게 알려준다.For example, when the portable terminal determines that the voice recognition is successful, as shown, the voice recognition setting value and the extracted parameter position are the same (407) to inform the user that the extracted parameter satisfies the voice recognition setting value. .

도 5는 본 발명의 바람직한 다른 실시 예에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 화면을 도시한 도면이다.5 is a diagram illustrating a screen of a portable terminal for providing a voice recognition result according to another exemplary embodiment of the present invention.

도 5(a)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식 설정 값을 출력한 화면이다.5A is a screen of outputting a voice recognition setting value in a portable terminal according to another exemplary embodiment of the present invention.

상기 도 5(a)를 참조하면, 상기 휴대용 단말기는 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값인 음성 인식 설정 값을 출력한 것으로 본 발명의 바람직한 다른 실시 예에 따라 상기 휴대용 단말기는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트의 값을 포함하는 음성 인식 설정 값을 "△"으로 표시(501)할 수 있다. 즉, 상기 "△"의 각각의 면이 상기 사용자의 음성 크기(말소리의 크기)(503), 발음 정확도 값(505), 액센트의 값(507)을 의미한다.Referring to FIG. 5 (a), the portable terminal outputs a voice recognition setting value which is a reference value for determining a normal voice in the portable terminal. A voice recognition setting value including a voice size (size of speech), a pronunciation accuracy value, and an accent value may be displayed as Δ 501. That is, each surface of "Δ" means the user's voice size (the size of speech) 503, the pronunciation accuracy value 505, and the accent value 507.

도 5(b)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식을 실패함을 알리는 정보를 출력한 화면이다.5 (b) is a screen outputting information indicating that voice recognition fails in a portable terminal according to another exemplary embodiment of the present invention.

상기 도 5(b)를 참조하면, 상기 휴대용 단말기는 앞서 설명한 바와 같이 점선의 도형인 음성 인식 설정 값(501)과 실선의 도형인 추출한 파라미터 정보를 함께 출력하여 사용자가 쉽게 음성 인식 결과를 확인하도록 한다.Referring to FIG. 5 (b), the portable terminal outputs the voice recognition setting value 501, which is a dotted line, and the extracted parameter information, which is a solid line, as described above, so that the user can easily check the voice recognition result. do.

예를 들어, 상기 휴대용 단말기가 음성 인식에 실패하였다고 판단할 경우, 도시한 바와 같이 음성 인식 설정 값(501)과 추출한 파라미터의 위치 차이를 다르게 한다. For example, if it is determined that the portable terminal has failed in speech recognition, the positional difference between the speech recognition setting value 501 and the extracted parameter is different as shown.

이때, 상기 휴대용 단말기는 상기 도 4와 다르게 사용자의 음성 크기(말소리의 크기)(503), 발음 정확도 값(505), 액센트의 값(507)을 추출한 파라미터와 각각 비교한 후, 상기 각각의 항목에 대한 비교값을 출력하도록 한다At this time, the portable terminal compares the user's voice size (voice size) 503, pronunciation accuracy value 505, and accent value 507 with the extracted parameters, respectively, differently from the above-described items. Outputs a comparison of

예를 들어, 상기 사용자의 음성 크기(말소리의 크기)(503), 발음 정확도 값(505), 액센트의 값(507)의 파라미터 가운데 액센트(507)와 발음 정확도를 나타내는 값(505)이 음성 인식 설정 값(501)보다 높을 경우, 상기 휴대용 단말기는 음성 인식 설정 값(501)보다 높은 항목의 삼각형의 면을 겹치도록 한다(509). 즉, 상기 휴대용 단말기는 음성 인식의 실패 요인이 음성의 크기라고 나타내기 위하여 음성의 크기에 해당하는 면의 겹치지 않게한 삼각형을 출력(511)하도록 한다.For example, among the parameters of the user's voice size (voice volume) 503, pronunciation accuracy value 505, and accent value 507, the accent 507 and the value 505 indicating pronunciation accuracy are voice recognition. When the value is higher than the set value 501, the portable terminal overlaps the triangle faces of items higher than the voice recognition set value 501 (509). That is, the portable terminal outputs 511 a triangle that does not overlap the surface corresponding to the size of the voice to indicate that the failure factor of the voice recognition is the size of the voice.

도 5(c)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식을 성공을 알리는 정보를 출력한 화면이다.5C is a screen of outputting information indicating success of speech recognition in a portable terminal according to another exemplary embodiment of the present invention.

상기 도 5(c)를 참조하면, 앞서 설명한 바와 같이 상기 사용자의 음성을 인식하여 음성 파라미터 정보를 추출한 후, 상기 추출한 파라미터 정보를 상기 음성 인식 설정 값(501)과 비교하여 음성 인식 결과를 제공한다. Referring to FIG. 5C, after recognizing the voice of the user and extracting voice parameter information as described above, the extracted parameter information is compared with the voice recognition setting value 501 to provide a voice recognition result. .

예를 들어, 상기 휴대용 단말기가 사용자의 음성 크기(말소리의 크기)(503), 발음 정확도 값(505), 액센트의 값(507)의 파라미터 항목이 음성 인식 설정 값(501)보다 모두 높아 음성 인식에 성공하였다고 판단할 경우, 도시한 바와 같이 점선의 도형인 음성 인식 설정 값(501)과 실선의 도형인 추출한 파라미터의 위치 동일(513)하게 하여 상기 추출한 파라미터가 음성 인식 설정 값(501)을 만족함을 사용자에게 알려준다.For example, the portable terminal may recognize a user's voice size (voice size) 503, pronunciation accuracy value 505, and accent value 507 as all the parameter items are higher than the voice recognition setting value 501. If it is determined to succeed, the extracted parameter satisfies the voice recognition setting value 501 by making the voice recognition setting value 501 of the dotted line figure and the position of the extracted parameter of the solid line line 513 as shown. Inform the user.

한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.Meanwhile, in the detailed description of the present invention, specific embodiments have been described, but various modifications are possible without departing from the scope of the present invention. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the scope of the following claims, but also by the equivalents of the claims.

도 1은 본 발명에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 구성을 도시한 블록도,1 is a block diagram showing the configuration of a portable terminal for providing a voice recognition result according to the present invention;

도 2는 본 발명에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 동작 과정을 도시한 흐름도,2 is a flowchart illustrating an operation process of a portable terminal for providing a voice recognition result according to the present invention;

도 3은 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식 결과를 제공하는 과정을 도시한 흐름도,3 is a flowchart illustrating a process of providing a voice recognition result in a portable terminal according to an embodiment of the present invention;

도 4(a)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식 설정 값을 출력한 화면,Figure 4 (a) is a screen output the voice recognition setting value in the portable terminal according to an embodiment of the present invention,

도 4(b)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식을 실패함을 알리는 정보를 출력한 화면,Figure 4 (b) is a screen outputting information indicating that the voice recognition fails in the portable terminal according to an embodiment of the present invention,

도 4(c)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식을 성공을 알리는 정보를 출력한 화면,Figure 4 (c) is a screen outputting information indicating the success of the speech recognition in the portable terminal according to an embodiment of the present invention,

도 5(a)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식 설정 값을 출력한 화면,5 (a) is a screen output the voice recognition setting value in the portable terminal according to another embodiment of the present invention,

도 5(b)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식을 실패함을 알리는 정보를 출력한 화면 및,5 (b) is a screen outputting information indicating that voice recognition fails in a portable terminal according to another embodiment of the present invention;

도 5(c)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식을 성공을 알리는 정보를 출력한 화면.Figure 5 (c) is a screen output information indicating the success of speech recognition in a portable terminal according to another embodiment of the present invention.

Claims (10)

휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치에 있어서,An apparatus for improving speech recognition performance in a portable terminal, 사용자의 음성을 인식하여 음성 파라미터를 추출한 후, 상기 추출한 음성 파라미터가 음성 인식 성공 유무를 판단하는 기준을 만족하는지 판단하는 음성 인식 관리부와,A voice recognition management unit for recognizing a user's voice and extracting a voice parameter, and determining whether the extracted voice parameter satisfies a criterion for determining whether the voice recognition is successful; 상기 음성 인식 판단부의 판단 결과를 음성 파라미터 별로 분석하여 출력하는 제어부를 포함하는 것을 특징으로 하는 장치.And a controller configured to analyze and output the determination result of the voice recognition determiner for each voice parameter. 제 1항에 있어서,The method of claim 1, 상기 제어부는,The control unit, 상기 음성 인식 성공을 확인할 경우, 상기 음성 파라미터가 기준을 만족함을 알리는 정보를 출력하고, 상기 음성 인식 실패를 확인할 경우, 상기 기준을 만족하지 못하는 음성 파라미터의 정보를 출력하는 것을 특징으로 하는 장치.Outputting information indicating that the voice parameter satisfies a criterion when the voice recognition is successful, and outputting information of a voice parameter that does not satisfy the criterion when the voice recognition failure is confirmed. 제 2항에 있어서,3. The method of claim 2, 상기 음성 파라미터는,The voice parameter, 사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미 터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 가운데 적어도 어느 한가지를 포함하는 것을 특징으로 하는 장치.A device for determining whether a user's voice is a normal voice to a speech recognition function, the device comprising at least one of a user's voice size (voice size), pronunciation accuracy value, and accent. 제 2항에 있어서,3. The method of claim 2, 상기 제어부는,The control unit, 상기 음성 음성 인식 성공 유무를 확인한 후, 상기 확인 결과를 특정 모형으로 도시하는 것을 특징으로 하는 장치.After confirming the success or failure of the speech speech recognition device, characterized in that showing the confirmation result in a specific model. 제 2항에 있어서,3. The method of claim 2, 상기 제어부는,The control unit, 사용자의 음성 재입력시 동일한 원인의 음성 인식 실패가 발생하는 것을 방지하기 위하여 상기 음성 인식 실패를 확인할 경우, 상기 기준을 만족하지 못하는 음성 파라미터의 정보를 출력하는 것을 특징으로 하는 장치.And when the voice recognition failure is confirmed in order to prevent a voice recognition failure of the same cause from occurring when the user re-enters the voice, outputting information of a voice parameter that does not satisfy the criterion. 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 방법에 있어서,In the method for improving speech recognition performance in a portable terminal, 사용자의 음성을 인식하여 음성 파라미터를 추출한 후, 상기 추출한 음성 파라미터가 음성 인식 성공 유무를 판단하는 기준을 만족하는지 판단하는 과정과,Recognizing a user's voice and extracting a voice parameter, determining whether the extracted voice parameter satisfies a criterion for determining whether the voice recognition is successful; 상기 판단 결과를 음성 파라미터 별로 분석하여 출력하는 과정을 포함하는 것을 특징으로 하는 방법.And analyzing and outputting the determination result for each voice parameter. 제 6항에 있어서,The method of claim 6, 상기 판단 결과를 음성 파라미터 별로 분석하여 출력하는 과정은,The process of analyzing and outputting the determination result for each voice parameter may include: 상기 음성 인식 성공을 판단할 경우, 상기 음성 파라미터가 기준을 만족함을 알리는 정보를 출력하는 과정과,If it is determined that the speech recognition is successful, outputting information indicating that the speech parameter satisfies a criterion; 상기 음성 인식 실패를 판단할 경우, 상기 기준을 만족하지 못하는 음성 파라미터의 정보를 출력하는 과정을 포함하는 것을 특징으로 하는 방법.If it is determined that the speech recognition fails, outputting information of a speech parameter that does not satisfy the criterion. 제 7항에 있어서,The method of claim 7, wherein 상기 음성 파라미터는,The voice parameter, 사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 가운데 적어도 어느 한가지를 포함하는 것을 특징으로 하는 방법.A parameter for determining whether a user's voice is a normal voice to the speech recognition function, the method comprising at least one of a user's voice size (voice size), pronunciation accuracy value, and accent. 제 7항에 있어서,The method of claim 7, wherein 상기 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 방법은,Method for improving speech recognition performance in the portable terminal, 상기 음성 음성 인식 성공 유무를 판단한 후, 상기 판단 결과를 특정 모형으로 도시하는 것을 특징으로 하는 방법.And determining the success or failure of the speech speech recognition, and displaying the determination result in a specific model. 제 7항에 있어서,The method of claim 7, wherein 상기 음성 인식 실패를 판단할 경우, 상기 기준을 만족하지 못하는 음성 파라미터의 정보를 출력하는 과정은,When determining the speech recognition failure, the process of outputting information of the speech parameter that does not satisfy the criterion, 사용자의 음성 재입력시 동일한 원인의 음성 인식 실패가 발생하는 것을 방지하기 위한 과정임을 특징으로 하는 방법.A method for preventing a voice recognition failure of the same cause from occurring when the user re-enters the voice.
KR1020090068303A 2009-07-27 2009-07-27 Apparatus and method for improving performance of voice recognition in portable terminal KR20110010939A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020090068303A KR20110010939A (en) 2009-07-27 2009-07-27 Apparatus and method for improving performance of voice recognition in portable terminal
US12/838,725 US20110022389A1 (en) 2009-07-27 2010-07-19 Apparatus and method for improving performance of voice recognition in a portable terminal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090068303A KR20110010939A (en) 2009-07-27 2009-07-27 Apparatus and method for improving performance of voice recognition in portable terminal

Publications (1)

Publication Number Publication Date
KR20110010939A true KR20110010939A (en) 2011-02-08

Family

ID=43498068

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090068303A KR20110010939A (en) 2009-07-27 2009-07-27 Apparatus and method for improving performance of voice recognition in portable terminal

Country Status (2)

Country Link
US (1) US20110022389A1 (en)
KR (1) KR20110010939A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019240324A1 (en) * 2018-06-11 2019-12-19 엘지전자 주식회사 Mobile terminal

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8818810B2 (en) 2011-12-29 2014-08-26 Robert Bosch Gmbh Speaker verification in a health monitoring system
CN102799408A (en) * 2012-07-09 2012-11-28 上海斐讯数据通信技术有限公司 Mobile terminal with voice-operated unlocking function and voice-operated unlocking method for mobile terminals
WO2014081429A2 (en) 2012-11-21 2014-05-30 Empire Technology Development Speech recognition
US9524717B2 (en) * 2013-10-15 2016-12-20 Trevo Solutions Group LLC System, method, and computer program for integrating voice-to-text capability into call systems
CN104219382B (en) * 2014-08-18 2016-09-14 上海卓易科技股份有限公司 A kind of solution lock control processing method, terminal and system
CN107077846B (en) * 2014-10-24 2021-03-16 索尼互动娱乐股份有限公司 Control device, control method, program, and information storage medium
US9972342B2 (en) * 2015-11-20 2018-05-15 JVC Kenwood Corporation Terminal device and communication method for communication of speech signals
JPWO2017130486A1 (en) * 2016-01-28 2018-11-22 ソニー株式会社 Information processing apparatus, information processing method, and program
JP2018191145A (en) * 2017-05-08 2018-11-29 オリンパス株式会社 Voice collection device, voice collection method, voice collection program, and dictation method
US10783901B2 (en) * 2018-12-10 2020-09-22 Amazon Technologies, Inc. Alternate response generation

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7263489B2 (en) * 1998-12-01 2007-08-28 Nuance Communications, Inc. Detection of characteristics of human-machine interactions for dialog customization and analysis
KR20010054622A (en) * 1999-12-07 2001-07-02 서평원 Method increasing recognition rate in voice recognition system
US7103542B2 (en) * 2001-12-14 2006-09-05 Ben Franklin Patent Holding Llc Automatically improving a voice recognition system
US7181392B2 (en) * 2002-07-16 2007-02-20 International Business Machines Corporation Determining speech recognition accuracy
KR100668297B1 (en) * 2002-12-31 2007-01-12 삼성전자주식회사 Method and apparatus for speech recognition
US20050049868A1 (en) * 2003-08-25 2005-03-03 Bellsouth Intellectual Property Corporation Speech recognition error identification method and system
US7272560B2 (en) * 2004-03-22 2007-09-18 Sony Corporation Methodology for performing a refinement procedure to implement a speech recognition dictionary
JP2005331882A (en) * 2004-05-21 2005-12-02 Pioneer Electronic Corp Voice recognition device, method, and program
US8036893B2 (en) * 2004-07-22 2011-10-11 Nuance Communications, Inc. Method and system for identifying and correcting accent-induced speech recognition difficulties
KR100705563B1 (en) * 2004-12-07 2007-04-10 삼성전자주식회사 Speech Recognition System capable of Controlling Automatically Inputting Level and Speech Recognition Method using the same
US7912713B2 (en) * 2004-12-28 2011-03-22 Loquendo S.P.A. Automatic speech recognition system and method using weighted confidence measure
JP4786384B2 (en) * 2006-03-27 2011-10-05 株式会社東芝 Audio processing apparatus, audio processing method, and audio processing program
US8214219B2 (en) * 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
KR100834679B1 (en) * 2006-10-31 2008-06-02 삼성전자주식회사 Method and apparatus for alarming of speech-recognition error
US7973230B2 (en) * 2007-12-31 2011-07-05 Apple Inc. Methods and systems for providing real-time feedback for karaoke
JP5451982B2 (en) * 2008-04-23 2014-03-26 ニュアンス コミュニケーションズ,インコーポレイテッド Support device, program, and support method
US8285545B2 (en) * 2008-10-03 2012-10-09 Volkswagen Ag Voice command acquisition system and method
KR101556594B1 (en) * 2009-01-14 2015-10-01 삼성전자 주식회사 Signal processing apparatus and method of recognizing voice thereof
US20100198583A1 (en) * 2009-02-04 2010-08-05 Aibelive Co., Ltd. Indicating method for speech recognition system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019240324A1 (en) * 2018-06-11 2019-12-19 엘지전자 주식회사 Mobile terminal

Also Published As

Publication number Publication date
US20110022389A1 (en) 2011-01-27

Similar Documents

Publication Publication Date Title
KR20110010939A (en) Apparatus and method for improving performance of voice recognition in portable terminal
CN110610699B (en) Voice signal processing method, device, terminal, server and storage medium
KR102265931B1 (en) Method and user terminal for performing telephone conversation using voice recognition
US7840406B2 (en) Method for providing an electronic dictionary in wireless terminal and wireless terminal implementing the same
US9520132B2 (en) Voice recognition device and voice recognition method
KR101944416B1 (en) Method for providing voice recognition service and an electronic device thereof
CN105825853A (en) Speech recognition device speech switching method and speech recognition device speech switching device
JP2019036914A (en) Cooperative display system
KR20100131221A (en) Method for control of output level of voice signal for video telephony service and apparatus for the same
KR20080036697A (en) Method and apparatus for remote control in portable terminal
CN103077711A (en) Electronic device and control method thereof
KR20120107571A (en) Apparatus and method for improving character input function in portable terminal
CN112672169A (en) Self-adaptive display method, device and system
KR100554442B1 (en) Mobile Communication Terminal with Voice Recognition function, Phoneme Modeling Method and Voice Recognition Method for the same
KR101865197B1 (en) Apparatus and method for recognizing code image in portable terminal
JP5163682B2 (en) Interpreter call system
KR101433171B1 (en) Video call terminal and method
CN100353791C (en) Long-button function displaying method of mobile communication terminal
KR100631585B1 (en) Method and device for message service of camera phone
KR20050082970A (en) Method and system of providing electronic dictionary contained in a camera mobile phone
US20130225240A1 (en) Speech-assisted keypad entry
KR20200039210A (en) Computer program
CN113596253B (en) Emergency number dialing method and device
KR100701434B1 (en) Method of voice control in portable terminal
KR101055732B1 (en) Device and method for transmitting key button signal during call using voice recognition

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application