KR100347790B1 - 명령어 갱신이 가능한 음성인식 방법 및 그 시스템 - Google Patents
명령어 갱신이 가능한 음성인식 방법 및 그 시스템 Download PDFInfo
- Publication number
- KR100347790B1 KR100347790B1 KR1020000073617A KR20000073617A KR100347790B1 KR 100347790 B1 KR100347790 B1 KR 100347790B1 KR 1020000073617 A KR1020000073617 A KR 1020000073617A KR 20000073617 A KR20000073617 A KR 20000073617A KR 100347790 B1 KR100347790 B1 KR 100347790B1
- Authority
- KR
- South Korea
- Prior art keywords
- word
- terminal
- server
- voice recognition
- model
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
- G10L15/144—Training of HMMs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
Abstract
Description
Claims (9)
- 사용자가 단말기에서 사용자 인터페이스 프로그램을 통해 음성인식 대상 단어를 정의하여 요청정보를 서버로 전송하고;상기 서버에서는 사용자의 상기 요청 정보를 처리하여 인식 단어 모델 생성기에 의해서 음성인식 단어 모델을 생성하고;상기 생성된 음성인식 단어 모델 정보가 데이터 통신 프로토콜로 변환되어 통신 라인을 통해 상기 사용자의 단말기로 전송되고; 그리고상기 단말기에서는 상기 서버로부터 전송된 음성인식 단어 모델 정보를 입력받아 이 단말기의 사용자 인터페이스 프로그램이 지정하는 특정메모리에 음성인식 단어 모델을 저장하는;단계로 이루어지는 것을 특징으로 하는 음성 인식 방법.
- 제1항에 있어서, 상기 사용자의 요청 정보는 문자 정보인 것을 특징으로 하는 음성 인식 방법.
- 사용자가 서버에서 사용자 인터페이스 프로그램을 통해 음성인식 대상 단어를 정의하고;상기 서버에서는 상기 사용자의 요청 정보를 처리하여 인식 단어 모델 생성기에 의해서 음성인식 단어 모델을 생성하고;상기 생성된 음성인식 단어 모델 정보가 데이터 통신 프로토콜로 변환되어 통신 라인을 통해 상기 사용자의 단말기로 전송되고; 그리고상기 단말기에서는 상기 서버로부터 전송된 음성인식 단어 모델 정보를 입력받아 이 단말기의 사용자 인터페이스 프로그램이 지정하는 특정메모리에 음성인식 단어 모델을 저장하는;단계로 이루어지는 것을 특징으로 하는 음성 인식 방법.
- 제1항 또는 제3항에 있어서, 상기 음성인식 단어 모델을 저장하는 단계는 상기 통신 라인을 통해 전송된 음성인식 단어 모델 정보가 단말기에서의 기존 단어 모델을 대체하여 음성인식 대상 단어를 갱신하며, 고정단어 인식기에 의하여 음성인식 서비스를 제공하는 것을 특징으로 하는 음성인식 방법.
- 제1항 또는 제3항에 있어서, 상기 서버에서 음성인식 모델을 생성하는 방법은 은닉 마콥 모델(Hidden Markov Model)인 것을 특징으로 하는 음성인식 방법.
- 음성인식 대상 단어가 고정되는 화자 독립의 고정단어 인식기를 탑재하고 있는 단말기; 및음성인식 대상 단어를 변경할 수 있는 화자 독립의 가변어 인식기를 이용한 모델 생성기를 탑재하고, 상기 단말기에서 요청하는 정보를 처리하는 서버;로 이루어지며, 상기 단말기와 서버는 통신라인을 통해 연결되어 인식 대상 단어를 갱신할 수 있도록 구성되는 것을 특징으로 하는 시스템.
- 제6항에 있어서, 상기 서버에 통신라인을 통해 연결되고, 상기 단말기에는 포트(port)를 통해 연결되어 상기 서버로 요청정보를 보내어 상기 서버에서 처리된 요청정보를 수신해 상기 단말기로 포트를 통해 전송하는 중개수단을 더 구비하여 구성되는 것을 특징으로 하는 시스템.
- 제6항에 있어서, 상기 서버는 이 서버에 탑재되는 인터페이스 프로그램을 통해 음성인식 대상 단어를 직접 입력받는 것을 특징으로 하는 시스템.
- 제6항에 있어서, 상기 단말기는 기존 단어 모델을 상기 서버에서 생성된 음성인식 단어모델로 대체하여 음성인식 대상 단어를 갱신하는 것을 특징으로 하는시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000073617A KR100347790B1 (ko) | 2000-12-06 | 2000-12-06 | 명령어 갱신이 가능한 음성인식 방법 및 그 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000073617A KR100347790B1 (ko) | 2000-12-06 | 2000-12-06 | 명령어 갱신이 가능한 음성인식 방법 및 그 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20020044629A KR20020044629A (ko) | 2002-06-19 |
KR100347790B1 true KR100347790B1 (ko) | 2002-08-07 |
Family
ID=27679818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020000073617A KR100347790B1 (ko) | 2000-12-06 | 2000-12-06 | 명령어 갱신이 가능한 음성인식 방법 및 그 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100347790B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101399777B1 (ko) * | 2012-07-27 | 2014-05-27 | 한국과학기술원 | 음성 인식률의 향상을 위한 음성 인식 지원 방법 및 시스템 |
CN107464558A (zh) * | 2017-08-23 | 2017-12-12 | 绵阳美菱软件技术有限公司 | 一种语音识别方法、终端以及服务端 |
-
2000
- 2000-12-06 KR KR1020000073617A patent/KR100347790B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20020044629A (ko) | 2002-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7209880B1 (en) | Systems and methods for dynamic re-configurable speech recognition | |
US10380992B2 (en) | Natural language generation based on user speech style | |
US8571861B2 (en) | System and method for processing speech recognition | |
US9330669B2 (en) | System and method for performing dual mode speech recognition | |
CN110232912B (zh) | 语音识别仲裁逻辑 | |
US5752232A (en) | Voice activated device and method for providing access to remotely retrieved data | |
US6393403B1 (en) | Mobile communication devices having speech recognition functionality | |
US8296138B2 (en) | System and method for mobile automatic speech recognition | |
US10490207B1 (en) | Automated speech recognition using a dynamically adjustable listening timeout | |
US5732187A (en) | Speaker-dependent speech recognition using speaker independent models | |
US20030120493A1 (en) | Method and system for updating and customizing recognition vocabulary | |
US20020091511A1 (en) | Mobile terminal controllable by spoken utterances | |
JP2003295893A (ja) | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
US20050197837A1 (en) | Enhanced multilingual speech recognition system | |
JP2007538278A (ja) | 音声認識システム | |
US20190147855A1 (en) | Neural network for use in speech recognition arbitration | |
JP4996156B2 (ja) | 音声信号変換装置 | |
KR100347790B1 (ko) | 명령어 갱신이 가능한 음성인식 방법 및 그 시스템 | |
JP5510069B2 (ja) | 翻訳装置 | |
JP2003140690A (ja) | 情報システム、電子機器、プログラム | |
US20020077814A1 (en) | Voice recognition system method and apparatus | |
JP2002049390A (ja) | 音声認識方法およびサーバならびに音声認識システム | |
US7194410B1 (en) | Generation of a reference-model directory for a voice-controlled communications device | |
KR100414064B1 (ko) | 음성인식에 의한 이동통신 단말기 제어시스템 및 방법 | |
KR20220045741A (ko) | 연속 상황을 판단하여 음성 인식 서비스를 제공하는 장치, 방법 및 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130620 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20140619 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20150615 Year of fee payment: 14 |
|
FPAY | Annual fee payment |
Payment date: 20160617 Year of fee payment: 15 |
|
FPAY | Annual fee payment |
Payment date: 20170622 Year of fee payment: 16 |
|
FPAY | Annual fee payment |
Payment date: 20180615 Year of fee payment: 17 |
|
FPAY | Annual fee payment |
Payment date: 20190626 Year of fee payment: 18 |