KR20110010939A - 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법 - Google Patents

휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법 Download PDF

Info

Publication number
KR20110010939A
KR20110010939A KR1020090068303A KR20090068303A KR20110010939A KR 20110010939 A KR20110010939 A KR 20110010939A KR 1020090068303 A KR1020090068303 A KR 1020090068303A KR 20090068303 A KR20090068303 A KR 20090068303A KR 20110010939 A KR20110010939 A KR 20110010939A
Authority
KR
South Korea
Prior art keywords
voice
parameter
user
portable terminal
recognition
Prior art date
Application number
KR1020090068303A
Other languages
English (en)
Inventor
김영리
이준엽
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020090068303A priority Critical patent/KR20110010939A/ko
Priority to US12/838,725 priority patent/US20110022389A1/en
Publication of KR20110010939A publication Critical patent/KR20110010939A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 휴대용 단말기의 음성 인식 성능을 향상시키기 위한 장치 및 방법에 관한 것으로, 특히 휴대용 단말기에서 음성 인식 실패가 반복적으로 발생하는 것을 방지하기 위하여 음성 인식 실패의 원인을 파악하여 음성 인식 결과를 직관적으로 제공하기 위한 장치 및 방법에 관한 것으로, 사용자의 음성을 인식하여 음성 파라미터를 추출한 후, 상기 추출한 음성 파라미터가 음성 인식 성공 유무를 판단하는 기준을 만족하는지 판단하는 음성 인식 관리부와, 상기 음성 인식 판단부의 판단 결과를 음성 파라미터 별로 분석하여 출력하는 제어부를 포함하는 것을 특징으로 한다.
음성 인식, 음성 제어, 인식 성공율, 인식율, 음성 파라미터

Description

휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법{APPARATUS AND METHOD FOR IMPROVING PERFORMANCE OF VOICE RECOGNITION IN PORTABLE TERMINAL}
본 발명은 휴대용 단말기의 음성 인식 성능을 향상시키기 위한 장치 및 방법에 관한 것으로, 특히 휴대용 단말기에서 음성 인식 실패가 반복적으로 발생하는 것을 방지하기 위하여 음성 인식 실패의 원인을 파악하여 음성 인식 결과를 직관적으로 제공하기 위한 장치 및 방법에 관한 것이다.
최근 휴대용 단말기의 급격한 발달에 따라 특히 무선 음성 통화 및 정보 교환이 가능한 휴대폰은 필수품이 되었다. 휴대용 단말기 초기에는 단순히 휴대할 수 있고, 무선 통화가 가능한 것으로 인식되었으나, 그 기술이 발달함과 무선 인터넷의 도입에 따라 휴대용 단말기는 단순한 전화 통화 또는 일정 관리 등의 목적뿐만 아니라 장착된 디지털 카메라에 의한 이미지 촬영하거나, 위성 방송의 시청, 게임 및 근거리 통신을 이용한 리모컨 등의 그 활용범위가 갈수록 커지고 있다.
특히 최근에는 음성 인식 기술이 적용된 휴대용 단말기가 출시되고 있으며 상기 현재 휴대용 단말기에 적용되는 음성 인식 기능은 단순의 저장번호의 이름을 입력하여 전화 연결을 하는 방법을 넘어서, STT(Speech to Text)등의 기능 제공한다.
상기와 같은 음성 인식 기능은 사용자의 음성 명령어를 인식하고 상기 음성에 해당하는 기능을 수행하도록 하는 것으로, 상기 사용자의 음성 명령어를 인식하는 것이 중요하다.
상기 휴대용 단말기가 사용자의 음성을 정확하게 인식하지 못할 경우, 상기 음성 인식 기능은 제대로 동작할 수 없음으로 상기와 같은 경우, 상기 휴대용 단말기는 사용자로 하여금 음성 명령어를 재입력하도록 한다.
이때, 상기 휴대용 단말기는 한정된 텍스트 또는 효과음으로 음성 명령어 인식 실패를 알리게 된다. 예를 들어, 사용자가 음성 인식으로 전화를 걸기 위해 "Call 1234567" 이라고 했을 경우, 상기 휴대용 단말기가 음성 명령어를 제대로 인식할 경우, 해당 번호에 대한 전화 연결을 수행하나 음성 명령어 인식에 실패할 경우, "Try again?" 과 같은 단순한 음성 또는 한정된 텍스트로 음성 명령어를 재입력하도록 한다.
상기와 같이 음성 명령어를 제대로 인식하지 못하는 경우는 사용자의 목소리 크기, 발음, 액센트 등을 상기 휴대용 단말기가 제대로 인식하지 못하여 발생할 수 있는 것으로, 사용자는 인식 실패 원인을 알 수 없어 똑같은 형태의 음성 명령어를 재입력하여 동일한 원인의 음성 인식 실패가 반복되는 문제점이 있다.
상기와 같은 문제점은 휴대용 단말기의 음성 인식율을 낮추게 되어 사용자의 음성 인식 기능 사용 빈도를 떨어뜨리게 된다.
따라서 상기와 같은 문제점을 해결하여 상기 휴대용 단말기의 음성 인식율을 향상시키기 위한 장치 및 방법이 요구된다.
본 발명은 상술한 바와 같은 문제점을 해결하기 위하여 도출된 것으로서, 본 발명의 목적은 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법을 제공함에 있다.
본 발명의 다른 목적은 휴대용 단말기에서 음성 인식 결과를 제공하여 음성 인식 성능을 향상시키기 위한 장치 및 방법을 제공함에 있다.
본 발명의 또 다른 목적은 휴대용 단말기에서 음성 인식 실패의 원인을 나타내는 정보를 제공하기 위한 장치 및 방법을 제공함에 있다.
상술한 목적들을 달성하기 위한 본 발명의 제 1 견지에 따르면, 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치는 사용자의 음성을 인식하여 음성 파라미터를 추출한 후, 상기 추출한 음성 파라미터가 음성 인식 성공 유무를 판단하는 기준을 만족하는지 판단하는 음성 인식 관리부와, 상기 음성 인식 판단부의 판단 결과를 음성 파라미터 별로 분석하여 출력하는 제어부를 포함하는 것을 특징으로 한다.
상술한 목적들을 달성하기 위한 본 발명의 제 2 견지에 따르면, 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 방법은 사용자의 음성을 인식하여 음성 파라미터를 추출한 후, 상기 추출한 음성 파라미터가 음성 인식 성공 유무를 판단 하는 기준을 만족하는지 판단하는 과정과, 상기 판단 결과를 음성 파라미터 별로 분석하여 출력하는 과정을 포함하는 것을 특징으로 한다.
상술한 바와 같이 본 발명은 휴대용 단말기의 음성 인식 성능을 향상시키기 위한 장치 및 방법에 관한 것으로, 음성 인식 실패의 원인이 되는 정보를 사용자에게 제공함으로써 똑같은 형태의 음성 명령어를 입력하여 동일한 원인의 음성 인식 실패가 반복되는 것을 방지할 수 있다.
이하 본 발명의 바람직한 실시 예를 첨부된 도면의 참조와 함께 상세히 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략한다.
이하 설명에서는 본 발명에 따른 휴대용 단말기의 음성 인식 성능을 향상시키기 위하여 음성 인식 결과를 직관적으로 제공하기 위한 장치 및 방법에 대하여 설명할 것이다. 상기 음성 인식 결과는 사용자가 동일한 형태의 음성을 반복적으로 입력하여 동일한 입력 인식 실패가 발생하는 것을 방지하기 위하여 음성 인식 실패의 원인을 분석한 결과를 말한다. 또한, 이하 설명에서 음성 인식 설정값은 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값을 말하며, 음성 파 라미터는 사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 등이 될 수 있다.
도 1은 본 발명에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 구성을 도시한 블록도이다.
상기 도 1을 참조하면, 상기 휴대용 단말기는 제어부(100), 음성 인식 관리부(102), 메모리부(108), 입력부(110), 표시부(112) 및 통신부(114)를 포함하여 구성할 수 있으며, 상기 음성 인식 관리부(102)는 파라미터 추출부(104) 및 파라미터 비교부(106)를 포함할 수 있다.
먼저, 상기 휴대용 단말기의 제어부(100)는 상기 휴대용 단말기의 전반적인 동작을 제어한다. 예를 들어, 음성통화 및 데이터 통신을 위한 처리 및 제어를 수행하며, 통상적인 기능에 더하여 본 발명에 따라, 상기 제어부(100)는 사용자의 음성을 인식한 후, 상기 인식한 사용자의 음성이 음성 인식 기능을 제어하는 정상적인 음성인지 또는 비 정상적인 음성인지를 판단한다. 이후, 상기 제어부(100)는 상기 판단한 사용자의 음성에 대한 결과를 출력하여 사용자로 하여금 음성 인식 결과를 인식할 수 있도록 처리한다. 예를 들어, 상기 제어부(100)는 사용자의 음성을 제대로 인식할 경우, 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 등이 음성 판단에 기준이 되는 음성 인식 설정 값의 조건을 만족한다는 정보를 출력할 수 있다. 반대로 상기 제어부(100)는 사용자의 음성을 제대로 인식할 수 없을 경우, 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 가운데 음성 인식 설정 값의 조건을 만족하지 못하는 항목에 대한 정보를 출력할 수 있다.
이로 인하여 상기 제어부(100)가 사용자의 음성 크기가 음성 인식 설정값의 조건을 만족하지 않는 정보를 출력할 경우, 상기 휴대용 단말기의 사용자는 사용자의 음성 크기를 조절하여 동일한 원인의 음성 인식 실패를 방지할 수 있다.
상기 음성 인식 관리부(102)는 상기 제어부(100)의 제어를 받아 사용자의 음성을 인식하여 음성 인식 기능을 제어하기 위한 정상적인 음성 여부를 판단한 후, 음성 인식 결과를 출력하여 사용자로 하여금 음성 인식 결과를 확인하도록 처리한다.
이때, 상기 음성 인식 관리부(100)는 상기 파라미터 추출부(104)로 하여금 사용자의 음성에서 음성 파라미터를 추출하도록 처리하여 상기 정상적인 음성 여부를 판단하기 위한 음성 파라미터를 획득한다. 여기에서, 상기 음성 파라미터는 사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 등이 될 수 있다.
또한, 상기 음성 인식 관리부(102)는 상기 파라미터 추출부(104)에 의해 획득된 음성 파라미터를 이용하여 정상적인 음성 여부를 판단한다. 이때, 상기 음성 인식 관리부(102)는 상기 파라미터 비교부(106)로 하여금 정상적인 음성 여부를 판단하도록 처리한다.
상기 음성 인식 관리부(102)의 파라미터 추출부(104)는 사용자의 음성을 인식하여 음성 파라미터를 획득하고, 상기 파라미터 비교부(106)는 상기 파라미터 추 출부(104)에 의해 획득된 음성 파라미터를 음성 인식 설정값과 비교하여 정상적인 음성 여부를 판단한다. 여기에서, 상기 음성 인식 설정값은 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값을 말한다.
예를 들어, 상기 파라미터 비교부(106)는 사용자의 음성 크기(말소리 크기)에 대한 음성 인식 설정 값을 사용할 경우, 상기 파라미터 추출부(104)에 의해 획득된 사용자의 음성 크기(말소리의 크기) 파라미터를 음성 인식 설정 값과 비교한 후, 상기 획득된 파라미터가 음성 인식 설정 값의 기준보다 높을 경우, 정상적인 음성이라고 판단할 수 있다.
한편, 상기 파라미터 비교부(106)는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트에 대한 음성 인식 설정 값을 사용할 경우, 상기 파라미터 추출부(104)에 의해 획득된 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 파라미터를 상기 음성 인식 설정값과 비교한 후, 상기 획득된 파라미터들이 음성 인식 설정 값의 기준보다 높을 경우, 정상적인 음성이라고 판단할 수 있다.
이로 인하여 상기 제어부(100)는 상기 인식한 음성이 음성 인식을 제어하기 위한 음성인지를 판단할 경우, 상기 음성 파라미터의 항목이 음성 인식 설정 값을 기준을 만족하였다는 정보를 출력함으로써 음성 인식 결과를 제공할 수 있다.
반면에 상기 제어부(100)는 상기 인식한 음성이 음성 인식을 제어하기 위한 음성이 아님을 판단할 경우, 상기 음성 인식 설정 값의 기준을 만족하지 못하는 음성 인식 파라미터에 대한 정보를 제공하여 사용자의 음성 재입력시 동일한 인식 오류가 발생하는 것을 방지하도록 한다.
상기 휴대용 단말기의 메모리부(108)는 롬(ROM ; Read Only Memory), 램(RAM ; Random Access Memory), 플래쉬롬(flash ROM)으로 구성된다. 상기 롬은 상기 제어부(100) 및, 음성 인식 관리부(102)의 처리 및 제어를 위한 프로그램의 마이크로코드와 각종 참조 데이터를 저장한다.
상기 램은 상기 제어부(100)의 워킹 메모리(working memory)로, 각종 프로그램 수행 중에 발생하는 일시적인 데이터를 저장한다. 또한, 상기 플래쉬롬은 전화번호부(phone book), 발신메시지, 수신메시지 및 사용자의 터치 입력 지점의 정보와 같은 갱신 가능한 각종 보관용 데이터를 저장하며 본 발명에 따라 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값인 음성 인식 설정 값을 저장한다.
상기 입력부(110)는 0 ~ 9의 숫자키 버튼들과, 메뉴버튼(menu), 취소버튼(지움), 확인버튼, 통화버튼(TALK), 종료버튼(END), 인터넷접속 버튼, 네비게이션 키(또는 방향키) 버튼들 및 문자 입력 키 등 다수의 기능키들을 구비하며, 사용자가 누르는 키에 대응하는 키 입력 데이터를 상기 제어부(100)로 제공한다.
상기 표시부(112)는 상기 휴대용 단말기의 동작 중에 발생하는 상태 정보, 제한된 숫자의 문자들, 다량의 동영상 및 정지영상 등을 디스플레이한다. 상기 표시부(112)는 컬러 액정 디스플레이 장치(LCD ; Liquid Crystal Display)를 사용할 수 있으며 상기 표시부(112)는 터치 입력 장치를 구비하여 터치 입력 방식의 휴대용 단말기에 적용할 경우 입력 장치로 사용할 수 있다.
상기 통신부(114)는 안테나(미도시)를 통해 입출력되는 데이터의 무선신호 를 송수신 처리하는 기능을 수행한다. 예를 들어, 송신인 경우, 송신할 데이터를 채널 코딩(Channel coding) 및 확산(Spreading)한 후, RF처리하여 송신하는 기능을 수행하고, 수신인 경우, 수신된 RF 신호를 기저대역신호로 변환하고 상기 기저대역신호를 역 확산(De-spreading) 및 채널 복호(Channel decoding)하여 데이터를 복원하는 기능을 수행한다.
상기 음성 인식 관리부(102)의 역할은 상기 휴대용 단말기의 제어부(100)에 의해 수행할 수 있으나, 본 발명에서 이를 별도로 구성하여 도시한 것은 설명의 편의를 위한 예시적인 구성이지 결코 본 발명의 범위를 제한하자는 것이 아니며, 당업자라면 본 발명의 범위 내에서 다양한 변형 구성이 가능하다는 것을 알 수 있을 것이다. 예를 들어, 이들 모두를 상기 제어부(100)에서 처리하도록 구성할 수도 있다.
이상은 본 발명에 따른 휴대용 단말기의 음성 인식 성능을 향상시키기 위하여 음성 인식 결과를 직관적으로 제공하기 위한 장치에 대하여 설명하였고, 이하 설명에서는 본 발명의 바람직한 일 실시 예에 따른 상기 장치를 이용하여 사용자가 동일한 형태의 음성을 반복적으로 입력하여 동일한 입력 인식 실패가 발생하는 것을 방지하기 위하여 음성 인식 실패의 원인을 분석한 결과를 제공하여 음성 인식 성능을 향상시키는 방법에 대하여 설명할 것이다.
도 2는 본 발명에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 동작 과정을 도시한 흐름도이다.
상기 도 2를 참조하면, 상기 휴대용 단말기는 먼저 201단계에서 음성 인식 기능을 수행한 후, 203단계로 진행하여 사용자의 음성을 인식하는 과정을 수행한다.
이후, 상기 휴대용 단말기는 205단계로 진행하여 상기 203단계에서 인식한 음성을 분석하여 음성 파라미터를 추출한다. 여기에서, 상기 음성 파라미터는 사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 등이 될 수 있다.
이후, 상기 휴대용 단말기는 207단계로 진행하여 음성 인식 설정 값과 상기 분석한 파라미터를 비교하여 사용자의 음성이 음성 인식 기능을 제어하기 위한 정상적인 음성인지를 판단한다. 여기에서, 상기 음성 인식 설정 값은 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값을 말하며, 상기 휴대용 단말기는 상기 분석한 파라미터가 상기 음성 인식 설정 값 이상일 경우, 사용자의 음성은 음성 인식 기능을 위한 정상적인 음성이라고 판단할 수 있다.
이후, 상기 휴대용 단말기는 209단계로 진행하여 상기 207단계의 비교 결과를 출력하도록 처리한다. 즉, 상기 휴대용 단말기는 상기 비교 과정에서 음성 인식 기능을 위한 정상적인 음성이 아님을 판단할 경우, 상기 음성 인식 설정 값보다 낮은 파라미터의 정보를 출력한다. 이로 인하여 사용자는 해당 정보를 이용하여 음성 인식율을 높이기 위하여 명확한 음성을 발성한다.
예를 들어, 상기 휴대용 단말기가 상기 음성 파라미터 가운데 발음 정확도를 나타내는 파라미터가 상기 음성 인식 설정 값보다 낮다는 정보를 출력할 경우, 상 기 휴대용 단말기의 사용자는 음성 인식율을 높이기 위하여 기 발성한 음성보다 명확한 발음으로 음성 인식 기능을 위한 음성을 발성할 것이다.
이후, 상기 휴대용 단말기는 본 알고리즘을 종료한다.
도 3은 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식 결과를 제공하는 과정을 도시한 흐름도이다.
상기 도 3을 참조하면, 상기 휴대용 단말기는 먼저 301단계에서 음성 인식 기능을 수행한 후, 303단계로 진행하여 음성 인식 설정 값을 출력하도록 처리한다. 여기에서, 상기 음성 인식 설정 값은 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값을 말하며, 상기 휴대용 단말기는 상기 음성 인식 설정 값을 특정 도형으로 표시할 수 있다. 예를 들어, 상기 휴대용 단말기는 상기 음성 인식 설정 값을 "△"으로 표시할 경우, 상기 "△"의 각각의 면은 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트의 값을 의미한다.
이후, 상기 휴대용 단말기는 305단계로 진행하여 사용자의 음성을 인식한 후, 307단계로 진행하여 인식한 음성을 분석하여 음성 인식 파라미터를 추출한다. 여기에서, 상기 음성 파라미터는 사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 등이 될 수 있으며, 상기 휴대용 단말기에서 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트를 음성 인식 설정 값으로 사용할 경우, 상기 휴대용 단말기는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트에 해당하는 파라미터를 추출할 것이다.
이후, 상기 휴대용 단말기는 상기 추출한 파라미터의 정보를 출력한 후, 311단계로 진행하여 음성 인식 설정 값과 추출한 파라미터를 비교하는 과정을 수행한다. 상기 311단계는 사용자의 음성이 음성 인식을 제어하기 위한 정상적인 음성인지 또는 비정상적인 음성인지를 판단하기 위한 과정이다.
이후, 상기 휴대용 단말기는 313단계로 진행하여 상기 311단계의 비교 결과 정상적인 음성 인식을 판단하였는지 확인한다.
만일, 상기 313단계에서 사용자의 음성이 음성 인식을 제어하기 위한 비정상적인 음성이라고 판단한 경우, 상기 휴대용 단말기는 319단계로 진행하여 기준 이하의 파라미터 정보를 확인한 후, 321단계로 진행하여 상기 확인한 기준 이하의 파라미터 정보를 출력하도록 처리한다.
이때, 상기 휴대용 단말기는 상기 311단계에서 추출한 파라미터가 상기 음성 인식 설정 값 미만임을 나타내는 정보를 출력하는 것으로, 상기 음성 인식 설정 값이 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트로 구성될 경우, 상기 휴대용 단말기는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트의 파라미터 정보를 상기 음성 인식 설정 값과 비교한 비교 값을 출력하도록 한다.
이후, 상기 휴대용 단말기는 사용자의 음성을 재확인하기 위하여 상기 305단계의 과정을 수행한다.
한편, 상기 313단계에서 사용자의 음성이 음성 인식을 제어하기 위한 정상적 인 음성이라고 판단한 경우, 상기 휴대용 단말기는 315단계로 진행하여 정상적인 음성 인식을 알리는 비교 값을 출력한다. 여기에서, 상기 315단계는 상기 311단계에서 추출한 파라미터가 상기 음성 인식 설정 값 이상임을 나타내는 정보를 출력하는 것으로, 상기 음성 인식 설정 값이 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트로 구성될 경우, 상기 휴대용 단말기는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트의 파라미터 정보를 상기 음성 인식 설정 값과 비교한 비교 값을 출력하도록 한다.
이후, 상기 휴대용 단말기는 317단계로 진행하여 상기 사용자의 음성에 해당하는 음성 인식 기능을 수행한다.
이후, 상기 휴대용 단말기는 본 알고리즘을 종료한다.
도 4는 본 발명의 바람직한 일 실시 예에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 화면을 도시한 도면이다.
도 4(a)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식 설정 값을 출력한 화면이다.
상기 도 4(a)를 참조하면, 상기 휴대용 단말기는 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값인 음성 인식 설정 값을 점선으로 출력(401)한 것으로, 본 발명의 바람직한 일 실시 예에 따라 상기 휴대용 단말기는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트의 값 가운데 적어도 어느 한 가지의 음성 인식 설정 값을 "○"으로 표시할 수 있다.
도 4(b)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식을 실패함을 알리는 정보를 출력한 화면이다.
상기 도 4(b)를 참조하면, 상기 휴대용 단말기는 사용자의 음성을 인식하여 음성 파라미터 정보를 추출한 후, 상기 추출한 파라미터 정보를 상기 음성 인식 설정 값과 비교하여 음성 인식 결과를 제공한다. 상기와 같이 음성 인식 결과를 제공하고자 할 경우, 상기 휴대용 단말기는 점선으로 된 상기 음성 인식 설정 값(401)과 실선으로 된 추출한 파라미터 정보(403)를 함께 출력하여 사용자가 쉽게 음성 인식 결과를 확인하도록 한다.
예를 들어, 상기 휴대용 단말기가 음성 인식에 실패하였다고 판단할 경우, 도시한 바와 같이 음성 인식 설정 값과 추출한 파라미터의 위치 차이를 크게하도록 한다. 이때, 상기 휴대용 단말기는 음성 인식 설정 값과 추출한 파라미터를 비교하여 음성 인식 성공 유무를 판단하는데 추출한 파라미터가 음성 인식 설정 값보다 낮을 수록 음성 인식의 정확도가 떨어진다고 판단한다. 상기와 같이 휴대용 단말기는 음성 인식의 정확도를 나타내기 위하여 음성 인식 설정 값과 추출한 파라미터의 위치를 조절한다. 즉, 음성 인식의 정확도가 낮을 수록 상기 음성 인식 설정 값과 추출한 파라미터의 위치 차이를 크게(405)하도록 한다.
도 4(c)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식을 성공을 알리는 정보를 출력한 화면이다.
상기 도 4(c)를 참조하면, 앞서 설명한 바와 같이 상기 사용자의 음성을 인식하여 음성 파라미터 정보를 추출한 후, 상기 추출한 파라미터 정보를 상기 음성 인식 설정 값과 비교하여 음성 인식 결과를 제공한다.
예를 들어, 상기 휴대용 단말기가 음성 인식에 성공하였다고 판단할 경우, 도시한 바와 같이 음성 인식 설정 값과 추출한 파라미터의 위치 동일(407)하게 하여 상기 추출한 파라미터가 음성 인식 설정 값을 만족함을 사용자에게 알려준다.
도 5는 본 발명의 바람직한 다른 실시 예에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 화면을 도시한 도면이다.
도 5(a)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식 설정 값을 출력한 화면이다.
상기 도 5(a)를 참조하면, 상기 휴대용 단말기는 상기 휴대용 단말기에서 정상적인 음성을 판단하는데 기준이 되는 값인 음성 인식 설정 값을 출력한 것으로 본 발명의 바람직한 다른 실시 예에 따라 상기 휴대용 단말기는 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트의 값을 포함하는 음성 인식 설정 값을 "△"으로 표시(501)할 수 있다. 즉, 상기 "△"의 각각의 면이 상기 사용자의 음성 크기(말소리의 크기)(503), 발음 정확도 값(505), 액센트의 값(507)을 의미한다.
도 5(b)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식을 실패함을 알리는 정보를 출력한 화면이다.
상기 도 5(b)를 참조하면, 상기 휴대용 단말기는 앞서 설명한 바와 같이 점선의 도형인 음성 인식 설정 값(501)과 실선의 도형인 추출한 파라미터 정보를 함께 출력하여 사용자가 쉽게 음성 인식 결과를 확인하도록 한다.
예를 들어, 상기 휴대용 단말기가 음성 인식에 실패하였다고 판단할 경우, 도시한 바와 같이 음성 인식 설정 값(501)과 추출한 파라미터의 위치 차이를 다르게 한다.
이때, 상기 휴대용 단말기는 상기 도 4와 다르게 사용자의 음성 크기(말소리의 크기)(503), 발음 정확도 값(505), 액센트의 값(507)을 추출한 파라미터와 각각 비교한 후, 상기 각각의 항목에 대한 비교값을 출력하도록 한다
예를 들어, 상기 사용자의 음성 크기(말소리의 크기)(503), 발음 정확도 값(505), 액센트의 값(507)의 파라미터 가운데 액센트(507)와 발음 정확도를 나타내는 값(505)이 음성 인식 설정 값(501)보다 높을 경우, 상기 휴대용 단말기는 음성 인식 설정 값(501)보다 높은 항목의 삼각형의 면을 겹치도록 한다(509). 즉, 상기 휴대용 단말기는 음성 인식의 실패 요인이 음성의 크기라고 나타내기 위하여 음성의 크기에 해당하는 면의 겹치지 않게한 삼각형을 출력(511)하도록 한다.
도 5(c)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식을 성공을 알리는 정보를 출력한 화면이다.
상기 도 5(c)를 참조하면, 앞서 설명한 바와 같이 상기 사용자의 음성을 인식하여 음성 파라미터 정보를 추출한 후, 상기 추출한 파라미터 정보를 상기 음성 인식 설정 값(501)과 비교하여 음성 인식 결과를 제공한다.
예를 들어, 상기 휴대용 단말기가 사용자의 음성 크기(말소리의 크기)(503), 발음 정확도 값(505), 액센트의 값(507)의 파라미터 항목이 음성 인식 설정 값(501)보다 모두 높아 음성 인식에 성공하였다고 판단할 경우, 도시한 바와 같이 점선의 도형인 음성 인식 설정 값(501)과 실선의 도형인 추출한 파라미터의 위치 동일(513)하게 하여 상기 추출한 파라미터가 음성 인식 설정 값(501)을 만족함을 사용자에게 알려준다.
한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
도 1은 본 발명에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 구성을 도시한 블록도,
도 2는 본 발명에 따라 음성 인식 결과를 제공하는 휴대용 단말기의 동작 과정을 도시한 흐름도,
도 3은 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식 결과를 제공하는 과정을 도시한 흐름도,
도 4(a)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식 설정 값을 출력한 화면,
도 4(b)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식을 실패함을 알리는 정보를 출력한 화면,
도 4(c)는 본 발명의 바람직한 일 실시 예에 따른 휴대용 단말기에서 음성 인식을 성공을 알리는 정보를 출력한 화면,
도 5(a)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식 설정 값을 출력한 화면,
도 5(b)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식을 실패함을 알리는 정보를 출력한 화면 및,
도 5(c)는 본 발명의 바람직한 다른 실시 예에 따른 휴대용 단말기에서 음성 인식을 성공을 알리는 정보를 출력한 화면.

Claims (10)

  1. 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치에 있어서,
    사용자의 음성을 인식하여 음성 파라미터를 추출한 후, 상기 추출한 음성 파라미터가 음성 인식 성공 유무를 판단하는 기준을 만족하는지 판단하는 음성 인식 관리부와,
    상기 음성 인식 판단부의 판단 결과를 음성 파라미터 별로 분석하여 출력하는 제어부를 포함하는 것을 특징으로 하는 장치.
  2. 제 1항에 있어서,
    상기 제어부는,
    상기 음성 인식 성공을 확인할 경우, 상기 음성 파라미터가 기준을 만족함을 알리는 정보를 출력하고, 상기 음성 인식 실패를 확인할 경우, 상기 기준을 만족하지 못하는 음성 파라미터의 정보를 출력하는 것을 특징으로 하는 장치.
  3. 제 2항에 있어서,
    상기 음성 파라미터는,
    사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미 터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 가운데 적어도 어느 한가지를 포함하는 것을 특징으로 하는 장치.
  4. 제 2항에 있어서,
    상기 제어부는,
    상기 음성 음성 인식 성공 유무를 확인한 후, 상기 확인 결과를 특정 모형으로 도시하는 것을 특징으로 하는 장치.
  5. 제 2항에 있어서,
    상기 제어부는,
    사용자의 음성 재입력시 동일한 원인의 음성 인식 실패가 발생하는 것을 방지하기 위하여 상기 음성 인식 실패를 확인할 경우, 상기 기준을 만족하지 못하는 음성 파라미터의 정보를 출력하는 것을 특징으로 하는 장치.
  6. 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 방법에 있어서,
    사용자의 음성을 인식하여 음성 파라미터를 추출한 후, 상기 추출한 음성 파라미터가 음성 인식 성공 유무를 판단하는 기준을 만족하는지 판단하는 과정과,
    상기 판단 결과를 음성 파라미터 별로 분석하여 출력하는 과정을 포함하는 것을 특징으로 하는 방법.
  7. 제 6항에 있어서,
    상기 판단 결과를 음성 파라미터 별로 분석하여 출력하는 과정은,
    상기 음성 인식 성공을 판단할 경우, 상기 음성 파라미터가 기준을 만족함을 알리는 정보를 출력하는 과정과,
    상기 음성 인식 실패를 판단할 경우, 상기 기준을 만족하지 못하는 음성 파라미터의 정보를 출력하는 과정을 포함하는 것을 특징으로 하는 방법.
  8. 제 7항에 있어서,
    상기 음성 파라미터는,
    사용자의 음성이 음성 인식 기능에 정상적인 음성인지 판단하기 위한 파라미터로 사용자의 음성 크기(말소리의 크기), 발음 정확도 값, 액센트 가운데 적어도 어느 한가지를 포함하는 것을 특징으로 하는 방법.
  9. 제 7항에 있어서,
    상기 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 방법은,
    상기 음성 음성 인식 성공 유무를 판단한 후, 상기 판단 결과를 특정 모형으로 도시하는 것을 특징으로 하는 방법.
  10. 제 7항에 있어서,
    상기 음성 인식 실패를 판단할 경우, 상기 기준을 만족하지 못하는 음성 파라미터의 정보를 출력하는 과정은,
    사용자의 음성 재입력시 동일한 원인의 음성 인식 실패가 발생하는 것을 방지하기 위한 과정임을 특징으로 하는 방법.
KR1020090068303A 2009-07-27 2009-07-27 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법 KR20110010939A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020090068303A KR20110010939A (ko) 2009-07-27 2009-07-27 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법
US12/838,725 US20110022389A1 (en) 2009-07-27 2010-07-19 Apparatus and method for improving performance of voice recognition in a portable terminal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090068303A KR20110010939A (ko) 2009-07-27 2009-07-27 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20110010939A true KR20110010939A (ko) 2011-02-08

Family

ID=43498068

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090068303A KR20110010939A (ko) 2009-07-27 2009-07-27 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법

Country Status (2)

Country Link
US (1) US20110022389A1 (ko)
KR (1) KR20110010939A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019240324A1 (ko) * 2018-06-11 2019-12-19 엘지전자 주식회사 이동 단말기

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8818810B2 (en) 2011-12-29 2014-08-26 Robert Bosch Gmbh Speaker verification in a health monitoring system
CN102799408A (zh) * 2012-07-09 2012-11-28 上海斐讯数据通信技术有限公司 具有声控解锁功能的移动终端及移动终端声控解锁的方法
WO2014081429A2 (en) 2012-11-21 2014-05-30 Empire Technology Development Speech recognition
US9524717B2 (en) * 2013-10-15 2016-12-20 Trevo Solutions Group LLC System, method, and computer program for integrating voice-to-text capability into call systems
CN104219382B (zh) * 2014-08-18 2016-09-14 上海卓易科技股份有限公司 一种解锁控制处理方法、终端及系统
CN107077846B (zh) * 2014-10-24 2021-03-16 索尼互动娱乐股份有限公司 控制装置、控制方法、程序和信息存储介质
US9972342B2 (en) * 2015-11-20 2018-05-15 JVC Kenwood Corporation Terminal device and communication method for communication of speech signals
JPWO2017130486A1 (ja) * 2016-01-28 2018-11-22 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2018191145A (ja) * 2017-05-08 2018-11-29 オリンパス株式会社 収音装置、収音方法、収音プログラム及びディクテーション方法
US10783901B2 (en) * 2018-12-10 2020-09-22 Amazon Technologies, Inc. Alternate response generation

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7263489B2 (en) * 1998-12-01 2007-08-28 Nuance Communications, Inc. Detection of characteristics of human-machine interactions for dialog customization and analysis
KR20010054622A (ko) * 1999-12-07 2001-07-02 서평원 음성 인식 시스템의 음성 인식률 향상 방법
US7103542B2 (en) * 2001-12-14 2006-09-05 Ben Franklin Patent Holding Llc Automatically improving a voice recognition system
US7181392B2 (en) * 2002-07-16 2007-02-20 International Business Machines Corporation Determining speech recognition accuracy
KR100668297B1 (ko) * 2002-12-31 2007-01-12 삼성전자주식회사 음성인식방법 및 장치
US20050049868A1 (en) * 2003-08-25 2005-03-03 Bellsouth Intellectual Property Corporation Speech recognition error identification method and system
US7272560B2 (en) * 2004-03-22 2007-09-18 Sony Corporation Methodology for performing a refinement procedure to implement a speech recognition dictionary
JP2005331882A (ja) * 2004-05-21 2005-12-02 Pioneer Electronic Corp 音声認識装置、音声認識方法、および音声認識プログラム
US8036893B2 (en) * 2004-07-22 2011-10-11 Nuance Communications, Inc. Method and system for identifying and correcting accent-induced speech recognition difficulties
KR100705563B1 (ko) * 2004-12-07 2007-04-10 삼성전자주식회사 입력 레벨 자동 조절을 위한 음성 인식 시스템 및 이를이용한 음성 인식 방법
US7912713B2 (en) * 2004-12-28 2011-03-22 Loquendo S.P.A. Automatic speech recognition system and method using weighted confidence measure
JP4786384B2 (ja) * 2006-03-27 2011-10-05 株式会社東芝 音声処理装置、音声処理方法および音声処理プログラム
US8214219B2 (en) * 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
KR100834679B1 (ko) * 2006-10-31 2008-06-02 삼성전자주식회사 음성 인식 오류 통보 장치 및 방법
US7973230B2 (en) * 2007-12-31 2011-07-05 Apple Inc. Methods and systems for providing real-time feedback for karaoke
JP5451982B2 (ja) * 2008-04-23 2014-03-26 ニュアンス コミュニケーションズ,インコーポレイテッド 支援装置、プログラムおよび支援方法
US8285545B2 (en) * 2008-10-03 2012-10-09 Volkswagen Ag Voice command acquisition system and method
KR101556594B1 (ko) * 2009-01-14 2015-10-01 삼성전자 주식회사 신호처리장치 및 신호처리장치에서의 음성 인식 방법
US20100198583A1 (en) * 2009-02-04 2010-08-05 Aibelive Co., Ltd. Indicating method for speech recognition system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019240324A1 (ko) * 2018-06-11 2019-12-19 엘지전자 주식회사 이동 단말기

Also Published As

Publication number Publication date
US20110022389A1 (en) 2011-01-27

Similar Documents

Publication Publication Date Title
KR20110010939A (ko) 휴대용 단말기에서 음성 인식 성능을 향상시키기 위한 장치 및 방법
CN110610699B (zh) 语音信号处理方法、装置、终端、服务器及存储介质
KR102265931B1 (ko) 음성 인식을 이용하는 통화 수행 방법 및 사용자 단말
US7840406B2 (en) Method for providing an electronic dictionary in wireless terminal and wireless terminal implementing the same
US9520132B2 (en) Voice recognition device and voice recognition method
KR101944416B1 (ko) 영상 통화 분석 서비스를 제공하기 위한 방법 및 그 전자 장치
CN105825853A (zh) 语音识别设备语音切换方法及装置
JP2019036914A (ja) 連携表示システム
KR20100131221A (ko) 화상통화시 음성 신호의 출력 레벨 제어 방법 및 장치
KR20080036697A (ko) 휴대용 단말기에서 원격 제어 방법 및 장치
CN103077711A (zh) 电子设备及其控制方法
KR20120107571A (ko) 휴대용 단말기에서 문자 입력 기능을 향상시키기 위한 장치 및 방법
CN112672169A (zh) 自适应显示方法、装置及系统
KR100554442B1 (ko) 음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법
KR101865197B1 (ko) 휴대용 단말기에서 코드 이미지를 획득하기 위한 장치 및 방법
JP5163682B2 (ja) 通訳通話システム
KR101433171B1 (ko) 화상통화 단말기 및 방법
CN100353791C (zh) 移动通信终端的长按键功能显示方法
KR100631585B1 (ko) 카메라폰의 메시지 서비스 방법 및 장치
KR20050082970A (ko) 카메라폰 내장형 전자사전 제공 방법 및 시스템
US20130225240A1 (en) Speech-assisted keypad entry
KR20200039210A (ko) 컴퓨터 프로그램
CN113596253B (zh) 紧急号码拨打方法及装置
KR100701434B1 (ko) 휴대용 단말기의 음성 제어 방법
KR101055732B1 (ko) 음성인식을 이용한 통화 중 키 버튼 신호 전송 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application