KR940009929A - 음성 정보 인식 장치 및 그 작동 방법 - Google Patents
음성 정보 인식 장치 및 그 작동 방법 Download PDFInfo
- Publication number
- KR940009929A KR940009929A KR1019930021765A KR930021765A KR940009929A KR 940009929 A KR940009929 A KR 940009929A KR 1019930021765 A KR1019930021765 A KR 1019930021765A KR 930021765 A KR930021765 A KR 930021765A KR 940009929 A KR940009929 A KR 940009929A
- Authority
- KR
- South Korea
- Prior art keywords
- phoneme
- comparing
- word
- letter
- phrase
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 8
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
구음의 스트링내에서 문자 및 숫자 겸용 정보를 인식하기 위한 장치 및 방법, 상기 장치는 기준 구, 단어, 문자 및 숫자의 음으로 이루어진 음소(1001)의 음소 스트링(1002)으로서 기록된 기준문자 및 숫자겸용 정보가 기억된 데이터 베이스 구조(10)를 갖는다. 동작에서, 상기 장치는 수신된 구음을 기억된 기준 구, 단어, 문자 및 숫자에 비교하고 전체 스코어(120)를 기준 구, 단어, 문자 및 숫자에 따른 구음의 근접을 나타내는 각 비교에 할당함에 의해서 구음의 수신에 응답한다. 상기 장치는 최고 전체 스코어를 선택해서 구음을 선택된 기준구, 단어, 문자 또는 숫자의 각 음소와 비교한다. 각 비교된 음소에 할당된 스코어는 선택된 기준 구, 단어, 문자 및 숫자로서 수신된 구음의 유효성을 결정하기 위해 요약된다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 원리를 실현하는 음성 인식 시스템의 도시도,
제2도는 제1도에 도시된 음성 인식 시스템의 작동을 제어하기 위한 음성 인식 알고리즘의 도시도,
제3도는 제1도에 도시된 음성 인식 시스템의 소프트웨어 배치 신경 회로망.
Claims (10)
- 사용자 구음(user spoken sounds)의 스트링에서 정보를 인식하기 위한 장치에 있어서, 수신된 구음을 음소스트링(a string of phonemes)으로 각각 표시된 기억된 기준 모델과 비교하고 전체 스코어를 각각의 기준 모델에 따른 구음의 근접을 나타내는 각 비교에 할당하는 수단(10,11,12)과, 최고 전체 스코어(120)에 할당된 기준 모델중 하나를 선택해서 구음을 선택된 기준 모델의 각 음소화 비교하며, 서브스코어(121,12n)를 선택된 모델의 각 비교된 음소에 할당하여 각 음소 비교 서브 스코어를 인가된 스코어를 요약하고 요약된 서브 스코어에 따라 선택된 모델과 같은 수신된 구음의 유효성을 결정하는 회로망(12000)에 인가하는 수단(10,11,12)을 포함하는 음성 정보 인식 장치.
- 제1항에 있어서, 상기 비교하고 할당하는 수단은, 음소화 같은 미리 규정된 기준 구(phrases), 단어(words), 문자(characters) 및 숫자로 이루어진 모델 및 기준 구, 단어, 문자 및 숫자의 음을 식별하는 음소스트링을 기억하는 데이터 베이스를 포함하는 음성 정보 인식 장치.
- 제1항에 있어서, 상기 비교하고 할당하는 수단은, 사용자 구음의 수신에 응다해서 수신된 구음을 각각 기억된 기준 구, 단어, 문자 및 숫자에 비교하고 전체 스코어를 비교된 기준 구, 단어, 문자 및 숫자로 이루어진 음소스트링에 따른 구음의 근접을 나타내는 각 비교에 할당하는 수단을 포함하는 음성 정보 인식 장치.
- 제3항에 있어서, 상기 선택해서 비교하고 할당하는 수단은, 상기 기준 구, 단어, 문자 및 숫자의 선택에 응답해서 구음을 선택된 기준 구, 단어, 문자 및 숫자로 이루어진 음소 스트링의 각 음소에 비교하고, 서브 스코어를 각 음소에 따른 구음의 근접을 나타내는 각 비교된 음소에 할당하는 수단을 포함하는 음성 정보 인식 장치.
- 제1항에 있어서, 상기 선택해서 비교하고 할당하는 수단은, 각각 상기 음소 서브 스코어 중 하나를 수신하며 상기 입력 서브 스코어를 요약해서 상기 요약된 서브 스코어의 등급으로 출력 데이터를 구동시키기 위한 다수의 입력을 가진 신경 회로망을 포함하는데, 상기 출력 데이터는 선택된 기준 구, 단어, 문자 및 숫자에 따른 구음의 근접을 나타내는 음성 정보 인식 장치.
- 사용자 구음의 스트링에서 정보를 인식하기 위해 실시간에서 음성 인식 자이를 작동시키는 방법에 있어서, 수신된 사용자 구음을 음소 스트링에 의해 표시된 기억된 기준 모델과 비교하고, 전체 스코어를 기준 모델에 따른 구음의 근접을 나타내는 각 비교에 할당하는 단계와, 최고 전체 스코어에 할당된 기준 모델 중 하나를 선택해서 서브 스코어를 선택된 모델의 각 비교된 음소에 할당함에 의해서 구음을 선택된 기준 모델의 각 음소와 비교하며, 음소 서브 스코어를 요약해서 요약된 스코어에 따라 선택된 기준 모델로서 수신된 구음의 유효성을 결정하는 단계로 이루어진 음성 인식 장치 작동방법.
- 제6항에 있어서, 상기 비교하고 할당하는 단계는, 수신된 구음을 각각 기억된 기준 구, 단어, 문자 및 숫자와 비교하고, 전체 스코어를 비교된 기준 구, 단어, 문자 및 숫자로 이루어진 음소에 따른 구음의 근접을 나타내는 각 비교에 할당하는 단계로 이루어진 음성 인식 장치 작동 방법.
- 제6항에 있어서, 상기 선택해서 비교하고 요약하는 단계는, 구음을 선택된 기준 구, 단어, 문자 및 숫자로 이루어진 음소 스트링의 각 음소와 비교하고 서브 스코어를 비교된 음소에 따른 구음의 근접을 나타내는 각 비교된 음소에 할당하는 단계로 이루어진 음성 인식 장치 작동 방법.
- 제6항에 있어서, 상기 선택해서 비교하고 요약하는 단계는, 음소 서브 스코어를 신경 회로망에 인가하고선택된 기준 구, 단어, 문자 및 숫자에 따른 구음의 근접을 나타내는 상기 음소 서브 스코어의 등급으로 출력데이타를 구동시키는 단계로 이루어진 음성 인식 장치 작동 방법.
- 제9항에 있어서, 상기 선택해서 비교하고 요약하는 단계는, 신경 회로망의 구동된 출력 데이터를 설정된 임계와 매칭시키고, 매칭자가 설정된 임계의 규정 범위내에 있을 때 선택된 기준 구, 단어, 문자 및 숫자 사용자 패스워드로서 사용자 구음을 식별하는 단계로 이루어진 음성 인식 장치 작동 방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US96872492A | 1992-10-30 | 1992-10-30 | |
US968,724 | 1992-10-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR940009929A true KR940009929A (ko) | 1994-05-24 |
Family
ID=25514677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019930021765A KR940009929A (ko) | 1992-10-30 | 1993-10-20 | 음성 정보 인식 장치 및 그 작동 방법 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP0595541A1 (ko) |
JP (1) | JPH06208390A (ko) |
KR (1) | KR940009929A (ko) |
AU (1) | AU657064B2 (ko) |
CA (1) | CA2107317A1 (ko) |
FI (1) | FI934813A (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5365574A (en) * | 1990-05-15 | 1994-11-15 | Vcs Industries, Inc. | Telephone network voice recognition and verification using selectively-adjustable signal thresholds |
CN110047466B (zh) * | 2019-04-16 | 2021-04-13 | 深圳市数字星河科技有限公司 | 一种开放性创建语音朗读标准参考模型的方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5782896A (en) * | 1980-11-12 | 1982-05-24 | Hitachi Ltd | Continuous voice recognition system |
US4761815A (en) * | 1981-05-01 | 1988-08-02 | Figgie International, Inc. | Speech recognition system based on word state duration and/or weight |
US4817159A (en) * | 1983-06-02 | 1989-03-28 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for speech recognition |
JPH02195400A (ja) * | 1989-01-24 | 1990-08-01 | Canon Inc | 音声認識装置 |
US5125022A (en) * | 1990-05-15 | 1992-06-23 | Vcs Industries, Inc. | Method for recognizing alphanumeric strings spoken over a telephone network |
FR2679690B1 (fr) * | 1991-07-23 | 1996-10-25 | Thomson Csf | Procede et dispositif de reconnaissance de la parole en temps reel. |
-
1993
- 1993-09-29 CA CA002107317A patent/CA2107317A1/en not_active Abandoned
- 1993-10-20 KR KR1019930021765A patent/KR940009929A/ko not_active Application Discontinuation
- 1993-10-20 EP EP93308345A patent/EP0595541A1/en not_active Withdrawn
- 1993-10-22 AU AU50233/93A patent/AU657064B2/en not_active Ceased
- 1993-10-26 JP JP5288776A patent/JPH06208390A/ja active Pending
- 1993-10-29 FI FI934813A patent/FI934813A/fi unknown
Also Published As
Publication number | Publication date |
---|---|
FI934813A (fi) | 1994-05-01 |
AU657064B2 (en) | 1995-02-23 |
CA2107317A1 (en) | 1994-05-01 |
AU5023393A (en) | 1994-05-19 |
JPH06208390A (ja) | 1994-07-26 |
FI934813A0 (fi) | 1993-10-29 |
EP0595541A1 (en) | 1994-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10027662B1 (en) | Dynamic user authentication | |
US6208964B1 (en) | Method and apparatus for providing unsupervised adaptation of transcriptions | |
US6912499B1 (en) | Method and apparatus for training a multilingual speech model set | |
US6078885A (en) | Verbal, fully automatic dictionary updates by end-users of speech synthesis and recognition systems | |
US5995928A (en) | Method and apparatus for continuous spelling speech recognition with early identification | |
US7529678B2 (en) | Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system | |
Fry | Theoretical aspects of mechanical speech recognition | |
EP0984430B1 (en) | Speech recognizer with lexicon updateable by spelled word input | |
US5752227A (en) | Method and arrangement for speech to text conversion | |
KR970707529A (ko) | 음성 인식 장치 및 음성 인식 장치용 어휘 발생 방법(speech recognition) | |
JPS603699A (ja) | 適応性自動離散音声認識方法 | |
KR870009322A (ko) | 스피커 배열 언어 인식 시스템 | |
KR20140134653A (ko) | 텍스트 투 스피치 및 시맨틱스에 기초한 오디오 인적 상호 증명 기법 | |
JP2002304190A (ja) | 発音変化形生成方法及び音声認識方法 | |
US20050071161A1 (en) | Speech recognition method having relatively higher availability and correctiveness | |
EP0562138A1 (en) | Method and apparatus for the automatic generation of Markov models of new words to be added to a speech recognition vocabulary | |
Boite et al. | A new approach towards keyword spotting. | |
JPS597998A (ja) | 連続音声認識装置 | |
KR940009929A (ko) | 음성 정보 인식 장치 및 그 작동 방법 | |
Mote et al. | Tactical language detection and modeling of learner speech errors: The case of Arabic tactical language training for American English speakers | |
JPH1097285A (ja) | 音声認識装置 | |
JP2820093B2 (ja) | 単音節認識装置 | |
JPH08123470A (ja) | 音声認識装置 | |
JP2003044085A (ja) | コマンド入力機能つきディクテーション装置 | |
US8688452B2 (en) | Automatic generation of distractors for special-purpose speech recognition grammars |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |