KR100554442B1 - 음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법 - Google Patents

음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법 Download PDF

Info

Publication number
KR100554442B1
KR100554442B1 KR1020030069219A KR20030069219A KR100554442B1 KR 100554442 B1 KR100554442 B1 KR 100554442B1 KR 1020030069219 A KR1020030069219 A KR 1020030069219A KR 20030069219 A KR20030069219 A KR 20030069219A KR 100554442 B1 KR100554442 B1 KR 100554442B1
Authority
KR
South Korea
Prior art keywords
phoneme
voice
input
feature vectors
mobile communication
Prior art date
Application number
KR1020030069219A
Other languages
English (en)
Other versions
KR20050033248A (ko
Inventor
최관묵
Original Assignee
주식회사 팬택앤큐리텔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 팬택앤큐리텔 filed Critical 주식회사 팬택앤큐리텔
Priority to KR1020030069219A priority Critical patent/KR100554442B1/ko
Priority to US10/781,714 priority patent/US20050075143A1/en
Publication of KR20050033248A publication Critical patent/KR20050033248A/ko
Application granted granted Critical
Publication of KR100554442B1 publication Critical patent/KR100554442B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition

Abstract

본 발명은 음성인식 기능을 가진 이동 통신 단말기에 관한 것으로서, 특히 이동 통신 단말기에서 음성인식률을 향상시키기 위한 음소 모델링 방법과 그에 기초한 음성 인식방법에 관한 것이다. 본 발명에 따른 이동 통신 단말기는 음성을 입력받기 위한 음성입력기와; 사용자가 입력한 음성에 의해 생성된 각 음소별 특징벡터의 기준 모델을 저장하고 있는 저장부와; 입력 음성의 음소들을 구분하여 각 음소별 특징벡터를 추출하고 추출된 음소별 특징벡터를 상기 음소별 기준 모델들과 패턴매칭 수행하여 음성 인식하는 제어부;를 포함함을 특징으로 한다.
화자종속, 반복 훈련, 음성 인식.

Description

음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한 음소 모델링 방법 및 음성 인식 방법{Mobile Communication Terminal with Voice Recognition function, Phoneme Modeling Method and Voice Recognition Method for the same}
도 1은 본 발명의 실시예에 따른 이동 통신 단말기의 블록구성도.
도 2는 본 발명의 실시예에 따른 음소 모델링 절차 흐름도.
도 3은 본 발명의 실시예에 따른 음소 모델링에 기초하여 음성인식을 하는 과정을 설명하기 위한 흐름도.
본 발명은 이동 통신 단말기의 음성 인식에 관한 것으로, 특히 음성 인식을 위한 음소 모델링 방법과 그에 기초한 음성 인식방법 및 이를 채용한 이동 통신 단말기에 관한 것이다.
음성 인식 시스템이란 입력 수단의 하나로서 사용자의 음성을 인식하여 그에 해당하는 작업을 수행하는 시스템이다. 이러한 음성 인식 시스템은 입력된 음성의 특징을 추출하여 기존에 훈련된 기준 음성 모델들과 패턴매칭을 수행하여 음성을 구별하는 시스템으로, 상기 기준 음성 모델을 훈련하는 과정은 그 횟수가 많아질수 록 더 일반적인 기준 음성 모델을 구할 수 있다.
상술한 음성 인식 시스템의 하나로서 화자 종속형 음성 인식 시스템을 들 수 있다. 이동 통신 단말기의 경우 사용자가 1인이므로 사용자의 음성을 이용해서 DB를 구축하는 것이 적절하다. 이러한 이유로 이동 통신 단말기에서는 화자 종속형 음성 인식 시스템을 주로 채용하고 있다. 그러나 이동 통신 단말기의 화자 종속형 음성 인식 시스템은, 예를 들어, "우리집"과 같은 단어의 반복 입력을 통해 그 입력단어에 대한 기준 음성을 모델링하기 때문에, 사용자 입장에서 보면 음성 다이얼링 혹은 단말기 제어를 위해 필요한 단어들(예를 들면, 우리집, 회사, 시댁,..)을 매번 반복 입력하여 기준 모델을 생성해야 하는 불편함이 있다.
또한 종래 이동 통신 단말기의 음성 인식 시스템은 그 특성상 반복 훈련을 통해서 음성 인식률을 높일 수 있도록 설계되어 있으나, 이동 통신 단말기에서 채용하고 있는 음성 인식 시스템은 프로그램적으로 단어의 음성 입력 횟수를 미리 제한하고 있거나 미리 기준 모델을 DB화 해 놓았기 때문에 음성 인식률을 향상시키는데 한계가 있다.
따라서 본 발명의 목적은 음성 인식률을 향상시킬 수 있는 음소 모델링 방법 및 음성 인식 방법을 제공하기 위한 것이며,
더 나아가 본 발명의 또 다른 목적은 음성 인식률을 향상시킬 수 있는 음성 인식 방법을 채용한 이동 통신 단말기를 제공하기 위한 것이다.
상기 목적을 달성하기 위한 본 발명의 실시예에 따른 이동 통신 단말기는,
음성을 입력받기 위한 음성입력기와;
사용자가 입력한 음성에 의해 생성된 각 음소별 특징벡터의 기준 모델을 저장하고 있는 저장부와;
입력 음성의 음소들을 구분하여 각 음소별 특징벡터를 추출하고 추출된 음소별 특징벡터를 상기 음소별 기준 모델들과 패턴매칭 수행하여 음성 인식하는 제어부;를 포함함을 특징으로 한다.
아울러 본 발명에 따른 이동 통신 단말기의 음소 모델링 방법은,
표시 문자에 대한 음성을 입력받는 단계와;
입력된 음성을 표시 문자의 음소들로 구획하는 단계와;
구획된 각 음소들의 특징벡터를 추출하는 단계와;
추출된 각 음소들의 특징벡터를 음소별로 분류되어 있는 이전의 해당 음소별 특징벡터와 연산하여 각 음소별 기준 모델을 생성 저장하는 단계;를 포함함을 특징으로 한다.
그리고 본 발명에 따른 이동 통신 단말기의 음성인식 방법은,
사용자가 입력한 음성에 의해 생성된 각 음소별 특징벡터의 기준 모델을 생성하여 저장하는 단계와;
음성을 입력받는 단계와;
상기 입력된 음성의 음소들을 구분하여 각 음소별 특징벡터를 추출하는 단계와;
상기 추출된 음소별 특징벡터를 저장된 상기 음소별 기준 모델들과 패턴매칭 수행하여 음성을 인식하는 단계;를 포함함을 특징으로 한다.
상술한 방법을 통해 본 발명은 한글 자모 각각에 대한 기준 모델을 생성하여 놓을 수 있기 때문에, 사용자가 표시 문자에 대한 음성을 입력하는 것만으로 각 음소별 기준 모델이 지속적으로 갱신되기 때문에 결과적으로는 음성 인식률을 향상시킬 수 있는 효과를 누릴 수 있다.
또한, 모든 한글 어휘에 대한 음성인식이 가능함으로서 사용자는 음성 인식을 위해 필요한 음성들을 반복 입력하여야만 하는 불편함으로부터 해방될 수 있는 이점도 있다.
이하 본 발명의 바람직한 실시예를 첨부 도면을 참조하여 상세히 설명하기로 한다. 본 발명을 설명함에 있어 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략하기로 한다.
도 1은 본 발명의 실시예에 따른 이동 통신 단말기의 블록구성도를 도시한 것으로, 보다 구체적으로는 카메라 폰의 블록구성을 도시한 것이다.
도 1을 참조해 보면, RF(Radio Frequency) 모듈(module)(100)은 안테나(ANT)를 통해 기지국으로부터 수신되는 RF 신호를 복조하여 베이스밴드 처리부(102)에 제공하고, 베이스밴드 처리부(102)가 제공하는 신호를 RF 신호로 변조하여 안테나(ANT)를 통해 기지국으로 송신한다.
베이스밴드(BB) 처리부(102)는 RF 모듈(100)의 출력신호를 다운 컨버젼한 후 에 디지탈 신호로 변환하여 제어부(104)에 제공하고, 제어부(104)로부터 제공되는 신호를 아날로그 신호로 변환한 후에 업 컨버젼하여 RF모듈(100)에 제공한다.
제어부(104)는 후술할 메모리부(106)에 저장된 제어프로그램 데이터에 기초하여 도시된 카메라 폰의 동작을 전반적으로 제어한다. 예를 들면 상기 제어부(104)는 도 2와 도 3에 도시한 바와 같은 수순에 따라 각 음소별 기준 모델을 생성하여 저장하고, 사용자에 의해 입력된 음성을 구성하는 음소들의 특징을 추출하여 상기 음소별 기준 모델과 패턴매칭을 수행함으로서 음성을 인식한다.
메모리부(106)에는 적어도 카메라 폰의 동작을 제어하기 위한 제어 프로그램 데이터와 후술할 카메라(110)에 의해 촬상된 영상 데이터 및 본 발명의 실시예에 따른 음소별 기준 특징벡터들(기준 모델이라고도 함)이 저장된다.
키패드(key pad)(108)는 문자를 입력하기 위한 사용자 인터페이스로서 이미 공지된 바와 같이 4*3의 문자키와 다수의 기능키를 포함한다. 이러한 키패드(108)를 문자입력기로 명할 수도 있다.
한편 카메라(110)는 피사체를 촬상하여 출력하여 주는 역할을 수행하며, 영상신호 처리부(112)는 카메라(110)로부터 출력되는 촬상신호를 신호처리하여 한 프레임의 영상을 생성하고 이를 출력하여 주는 역할을 수행한다.
음성입력부(114)는 마이크를 통해 입력된 음성신호를 증폭하여 디지털 데이터로 변환하고 이를 음성인식을 위해 필요한 신호로 처리하여 제어부(104)로 출력한다. 이러한 음성입력부(114) 역시 음성입력기로 명할 수 있을 것이다.
표시부(116)는 제어부(104)의 제어에 따라 문자 혹은 촬상된 영상데이터를 표시하여 주는 역할을 수행한다.
이하 상술한 구성을 가지는 카메라 폰에서 사용자 음성에 대한 음소의 특징들을 모델링하여 음성 인식에 이용하는 과정을 설명하기로 한다.
우선 본 발명의 실시예에 따른 음소 모델링 방법은 카메라 폰 사용자가 발음하는 문자에 대한 음성을 최소 단위인 음소로 구분하고 각 음소별 기준 모델을 생성하여 데이터베이스화하는 단계와, 입력되는 음성의 음소들을 구분하여 각 음소별 특징벡터를 추출하고 그 추출된 음소별 특징벡터를 데이터베이스화된 음소별 기준 모델들과 패턴매칭 수행하여 음성 인식하는 단계로 구분할 수 있다.
각 음소별 기준 모델을 생성하여 데이터베이스화하는 단계는 도 2에 의해 설명될 수 있으며, 음성 인식하는 단계는 도 3을 참조하여 설명될 수 있다. 참고적으로 본 발명에서의 음소는 문자를 구성하는 최소 단위 즉, 자음과 모음, 음성을 구성하는 자음과 모음을 지칭하는 것으로 가정한다.
도 2를 우선 참조하면, 카메라 폰 사용자가 음성 입력만으로 카메라 폰을 제어하기 위해서는 우선적으로 자음과 모음에 대한 음소별 기준 모델을 생성하여야 한다. 이러한 음소별 기준 모델 생성을 위해 사용자가 음소 특징추출모드의 수행을 명하면, 제어부(104)는 이를 200단계에서 감지하고 사용자에게 문자의 입력(혹은 선택)을 요구한다. 이때의 문자는 사용자가 키패드(108)를 통해 입력하는 문자일 수 있으며, 경우에 따라서는 수신된 문자 메시지일 수도 있다. 중요한 것은 입력 혹은 선택된 문자가 표시부(116)상에 표시된후, 이 표시 문자를 사용자가 음성으로 입력함으로서 입력된 각각의 음성을 구성하는 음소들의 기준 모델이 생성된다는 것 이다.
만약 사용자가 훈련시키고자 하는 문자(예를 들면 "가")를 입력(210단계)하면, 제어부(104)는 입력문자에 대한 음성 입력을 요구한다. 이에 사용자 자신이 입력한 문자에 대해 발음하면, 문자에 대한 음성이 음성입력부(114)를 통해 입력(220단계)된다.
제어부(104)는 음성입력부(114)를 통해 입력문자에 대한 음성 입력이 있으면 입력음성의 음소를 구분("ㄱ"과 "ㅏ")하고, 구분된 음소의 특징벡터를 추출(230단계)한다. 그리고 제어부(104)는 240단계로 진행하여 상기 230단계에서 추출된 음소의 특징벡터를 음소별 기준 특징벡터로 설정하여 저장한다. 230단계에서 추출된 음소의 특징벡터가 기준 특징벡터로 설정되는 이유는 최초의 문자 입력이 이루어졌다고 가정할 수 있기 때문이다.
만약 사용자가 "나"라는 새로운 문자를 입력(210단계)하고 그에 대해 음성 입력하면, 제어부(104)는 230단계를 수행함으로서, "ㅏ"음소에 대해서는 두 번의 특징벡터 추출이 이루어진 결과를 갖게 된다. 따라서 음소 "ㅏ"에 대해 얻어진 두 개의 특징벡터들의 평균값을 산출하면 이를 기준 특징 벡터로 설정할 수 있다. 예시한 바에 의하면 "ㄱ"과 "ㄴ", "ㅏ"에 대한 기준모델이 생성된 결과를 얻게 된다.
즉, 본 발명은 사용자 자신이 입력한 혹은 선택한 문자들에 대해 각각 음성 입력하면, 각 음성을 구성하는 음소들에 대한 특징벡터들이 추출되고, 추출된 각 음소의 특징벡터들은 이전에 저장된 해당 음소의 기준 특징벡터와 연산되어 새로운 기준 특징벡터로 생성됨으로서, 데이터베이스화된 각 음소별 기준 모델들이 반복 훈련을 통해 지속적으로 갱신될 수 있는 것이며, 자음과 모음 모두에 대한 기준 모델을 생성할 수 있게 되는 것이다.
상술한 바와 같은 방법을 통해 생성된 음소별 기준모델을 이용하여 음성 인식이 이루어지는 과정을 이하 도 3을 참조하여 설명하면,
우선 음성인식모드에서 제어부(104)는 음성 입력부(114)를 통해 음성이 입력되는가를 검사(300단계)한다. 만약 우리 집을 호출하기 위한 음성정보로서 "우리 집"이 음성 입력되었다면 제어부(104)는 입력된 음성의 음소들을 구분하고 각 음소별 특징벡터를 추출(310단계)한다. 이어서 제어부(104)는 추출된 음소별 특징벡터를 메모리부(106)에 저장된 음소별 기준 모델들과 패턴매칭 수행(320단계)한다. 이러한 패턴매칭에는 HMM(Hidden Markov Model) 알고리즘을 적용할 수 있다.
한편 제어부(104)는 패턴매칭 수행 결과 310단계에서 추출된 음소의 특징벡터와 기준 모델의 거리가 최소인 음소들을 추출하여 조합하는 방식을 통해 음성을 인식(330단계)한다. 그리고 인식된 결과를 처리하는데, 그러한 인식 결과의 예가 바로 자동 다이얼링을 수행하는 것이다. 자동 다이얼링이 이루어지도록 하기 위해서는 물론 사전에 우리집에 대한 전화번호가 우리집:02-888-8888과 같이 미리 등록되어 있어야만 한다.
실시예로서 설명한 바와 같이, 본 발명은 한글 어휘 모두에 대한 음성을 인식할 수 있도록 미리 음소별 기준모델을 사용자가 생성하여 놓았기 때문에, 사용자는 예시한 바와 같이 사전에 "우리집"이라는 단어의 음성을 반복 입력하지 않고서도 우리 집이라는 음성 입력만으로 우리 집을 호출할 수 있게 되는 것이다.
상술한 바와 같이 본 발명은 표시 문자에 대한 사용자 음성을 입력받아 그 음성을 구성하는 음소들의 기준 모델을 지속적으로 갱신하기 때문에, 음성 인식률을 향상시키게 되는 효과를 얻을 수 있다. 또한, 인식하고자 하는 단어에 대한 음성의 반복 훈련 없이도 추후 그 단어를 음성 인식할 수 있는 장점이 있다. 이는 곧 모든 한글 어휘에 대한 음성인식이 가능하다는 것을 의미한다.
한편 본 발명은 도면에 도시된 실시예들을 참고로 설명되었으나 이는 예시적인 것에 불과하며, 당해 기술분야에 통상의 지식을 지닌자라면 이로부터 다양한 변형 및 균등한 타실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위에 의해서만 정해져야 할 것이다.

Claims (3)

  1. 키패드를 통해 입력된 혹은 RF 모듈을 통해 수신된 문자 데이터를 표시부상에 표시하는 이동 통신 단말기에 있어서,
    사용자 음성을 입력받기 위한 음성입력기와;
    음소 특징추출모드에서 상기 음성입력기를 통해 입력된 표시 문자의 음성을 표시 문자의 각 음소들로 구획하여 특징벡터를 추출하고, 추출된 각 음소들의 특징벡터를 이전의 해당 음소별 특징벡터와 연산하여 각 음소별 기준 모델을 생성하여 저장하며, 음성인식모드에서 상기 음성입력기를 통해 입력된 음성의 음소들을 구분하여 각 음소별 특징벡터를 추출하고 그 추출된 음소별 특징벡터를 상기 음소별 기준 모델들과 패턴매칭 수행하여 음성 인식하는 제어부와;
    상기 제어부에 의해 생성된 각 음소별 특징벡터의 기준 모델을 저장하기 위한 저장부;를 포함함을 특징으로 하는 이동 통신 단말기.
  2. 키패드를 통해 입력된 혹은 RF 모듈을 통해 수신된 문자 데이터를 표시부상에 표시하는 이동 통신 단말기의 음소 모델링 방법에 있어서,
    상기 표시 문자에 대한 음성을 입력받는 단계와;
    입력된 음성을 표시 문자의 음소들로 구획하는 단계와;
    구획된 각 음소들의 특징벡터를 추출하는 단계와;
    추출된 각 음소들의 특징벡터를 음소별로 분류되어 있는 이전의 해당 음소별 특징벡터와 연산하여 각 음소별 기준 모델을 생성 저장하는 단계;를 포함함을 특징으로 하는 이동 통신 단말기의 음소 모델링 방법.
  3. 키패드를 통해 입력된 혹은 RF 모듈을 통해 수신된 문자 데이터를 표시부상에 표시하는 이동 통신 단말기의 음소 모델링 방법에 있어서,
    상기 표시 문자에 대한 음성을 입력받는 단계와;
    입력된 음성을 표시 문자의 음소들로 구획하는 단계와;
    구획된 각 음소들의 특징벡터를 추출하는 단계와;
    추출된 각 음소들의 특징벡터를 음소별로 분류되어 있는 이전의 해당 음소별 특징벡터와 연산하여 각 음소별 기준 모델을 생성 저장하는 단계와;
    음성인식모드에서 음성을 입력받는 단계와;
    상기 음성인식모드에서 입력된 음성의 음소들을 구분하여 각 음소별 특징벡터를 추출한후 그 추출된 음소별 특징벡터를 저장된 음소별 기준 모델들과 패턴매칭 수행하여 음성 인식하는 단계;를 포함함을 특징으로 하는 이동 통신 단말기의 음성 인식 방법.
KR1020030069219A 2003-10-06 2003-10-06 음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법 KR100554442B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020030069219A KR100554442B1 (ko) 2003-10-06 2003-10-06 음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법
US10/781,714 US20050075143A1 (en) 2003-10-06 2004-02-20 Mobile communication terminal having voice recognition function, and phoneme modeling method and voice recognition method for the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030069219A KR100554442B1 (ko) 2003-10-06 2003-10-06 음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법

Publications (2)

Publication Number Publication Date
KR20050033248A KR20050033248A (ko) 2005-04-12
KR100554442B1 true KR100554442B1 (ko) 2006-02-22

Family

ID=34386747

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020030069219A KR100554442B1 (ko) 2003-10-06 2003-10-06 음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법

Country Status (2)

Country Link
US (1) US20050075143A1 (ko)
KR (1) KR100554442B1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8204748B2 (en) * 2006-05-02 2012-06-19 Xerox Corporation System and method for providing a textual representation of an audio message to a mobile device
KR100845428B1 (ko) * 2006-08-25 2008-07-10 한국전자통신연구원 휴대용 단말기의 음성 인식 시스템
US20080154608A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. On a mobile device tracking use of search results delivered to the mobile device
KR100897553B1 (ko) 2007-01-04 2009-05-15 삼성전자주식회사 사용자의 기기 사용 패턴을 이용한 음성 인식 방법 및 장치
KR100897554B1 (ko) * 2007-02-21 2009-05-15 삼성전자주식회사 분산 음성인식시스템 및 방법과 분산 음성인식을 위한 단말기
KR101398639B1 (ko) * 2007-10-08 2014-05-28 삼성전자주식회사 음성 인식 방법 및 그 장치
US8065152B2 (en) * 2007-11-08 2011-11-22 Demand Media, Inc. Platform for enabling voice commands to resolve phoneme based domain name registrations
CN103353824B (zh) * 2013-06-17 2016-08-17 百度在线网络技术(北京)有限公司 语音输入字符串的方法、装置和终端设备
KR101702760B1 (ko) * 2015-07-08 2017-02-03 박남태 가상 키보드 음성입력 장치 및 방법
CN108717851B (zh) * 2018-03-28 2021-04-06 深圳市三诺数字科技有限公司 一种语音识别方法及装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4751737A (en) * 1985-11-06 1988-06-14 Motorola Inc. Template generation method in a speech recognition system
JPS62232691A (ja) * 1986-04-03 1987-10-13 株式会社リコー 音声認識装置
US5390278A (en) * 1991-10-08 1995-02-14 Bell Canada Phoneme based speech recognition
US5502790A (en) * 1991-12-24 1996-03-26 Oki Electric Industry Co., Ltd. Speech recognition method and system using triphones, diphones, and phonemes
US5333275A (en) * 1992-06-23 1994-07-26 Wheatley Barbara J System and method for time aligning speech
US5920836A (en) * 1992-11-13 1999-07-06 Dragon Systems, Inc. Word recognition system using language context at current cursor position to affect recognition probabilities
JPH0981183A (ja) * 1995-09-14 1997-03-28 Pioneer Electron Corp 音声モデルの作成方法およびこれを用いた音声認識装置
US6151575A (en) * 1996-10-28 2000-11-21 Dragon Systems, Inc. Rapid adaptation of speech models
US6311182B1 (en) * 1997-11-17 2001-10-30 Genuity Inc. Voice activated web browser
US6333973B1 (en) * 1997-04-23 2001-12-25 Nortel Networks Limited Integrated message center
US6163596A (en) * 1997-05-23 2000-12-19 Hotas Holdings Ltd. Phonebook
US6012027A (en) * 1997-05-27 2000-01-04 Ameritech Corporation Criteria for usable repetitions of an utterance during speech reference enrollment
FI972723A0 (fi) * 1997-06-24 1997-06-24 Nokia Mobile Phones Ltd Mobila kommunikationsanordningar
KR100277105B1 (ko) * 1998-02-27 2001-01-15 윤종용 음성 인식 데이터 결정 장치 및 방법
JP4289715B2 (ja) * 1999-04-02 2009-07-01 キヤノン株式会社 音声認識装置及び音声認識方法並びにその方法に用いられる木構造辞書の作成方法
US6463413B1 (en) * 1999-04-20 2002-10-08 Matsushita Electrical Industrial Co., Ltd. Speech recognition training for small hardware devices
US6690772B1 (en) * 2000-02-07 2004-02-10 Verizon Services Corp. Voice dialing using speech models generated from text and/or speech
US6535850B1 (en) * 2000-03-09 2003-03-18 Conexant Systems, Inc. Smart training and smart scoring in SD speech recognition system with user defined vocabulary
GB2365188B (en) * 2000-07-20 2004-10-20 Canon Kk Method for entering characters
US6832189B1 (en) * 2000-11-15 2004-12-14 International Business Machines Corporation Integration of speech recognition and stenographic services for improved ASR training
US6975985B2 (en) * 2000-11-29 2005-12-13 International Business Machines Corporation Method and system for the automatic amendment of speech recognition vocabularies
US6823306B2 (en) * 2000-11-30 2004-11-23 Telesector Resources Group, Inc. Methods and apparatus for generating, updating and distributing speech recognition models
US6934683B2 (en) * 2001-01-31 2005-08-23 Microsoft Corporation Disambiguation language model
US7171365B2 (en) * 2001-02-16 2007-01-30 International Business Machines Corporation Tracking time using portable recorders and speech recognition
US7043431B2 (en) * 2001-08-31 2006-05-09 Nokia Corporation Multilingual speech recognition system using text derived recognition models
US6990445B2 (en) * 2001-12-17 2006-01-24 Xl8 Systems, Inc. System and method for speech recognition and transcription
US7054817B2 (en) * 2002-01-25 2006-05-30 Canon Europa N.V. User interface for speech model generation and testing
US7146319B2 (en) * 2003-03-31 2006-12-05 Novauris Technologies Ltd. Phonetically based speech recognition system and method

Also Published As

Publication number Publication date
KR20050033248A (ko) 2005-04-12
US20050075143A1 (en) 2005-04-07

Similar Documents

Publication Publication Date Title
US9769296B2 (en) Techniques for voice controlling bluetooth headset
US20180074661A1 (en) Preferred emoji identification and generation
EP1994529B1 (en) Communication device having speaker independent speech recognition
US7840406B2 (en) Method for providing an electronic dictionary in wireless terminal and wireless terminal implementing the same
CN107919138B (zh) 一种语音中的情绪处理方法及移动终端
KR101819458B1 (ko) 음성 인식 장치 및 시스템
JP2002540731A (ja) 携帯電話機による使用のための数字列を生成するシステムおよび方法
KR100554442B1 (ko) 음성인식 기능을 가진 이동 통신 단말기, 및 이를 위한음소 모델링 방법 및 음성 인식 방법
CN107291704A (zh) 处理方法和装置、用于处理的装置
CN108806688A (zh) 智能电视的语音控制方法、智能电视、系统及存储介质
CN111488744A (zh) 多模态语言信息ai翻译方法、系统和终端
KR20140067687A (ko) 대화형 음성인식이 가능한 차량 시스템
EP1110207B1 (en) A method and a system for voice dialling
CN112614482A (zh) 移动端外语翻译方法、系统及存储介质
CN110930977B (zh) 一种数据处理方法、装置和电子设备
KR101681944B1 (ko) 임의의 입력 음성에 대한 한국어 발음 표시 장치 및 방법
KR20040008990A (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
CN111341320B (zh) 短语语音的声纹识别方法及装置
JP2005520194A (ja) テキストメッセージの生成
CN114283791A (zh) 一种基于高维声学特征的语音识别方法及模型训练方法
JP2000338991A (ja) 認識率信頼性表示機能付き音声操作電話装置及びその音声認識方法
US6801890B1 (en) Method for enhancing recognition probability in voice recognition systems
JP2006251699A (ja) 音声認識装置
US20130225240A1 (en) Speech-assisted keypad entry
CN109379499A (zh) 一种语音呼叫方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130205

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140128

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20150203

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160201

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20170727

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee