KR940009929A - 음성 정보 인식 장치 및 그 작동 방법 - Google Patents

음성 정보 인식 장치 및 그 작동 방법 Download PDF

Info

Publication number
KR940009929A
KR940009929A KR1019930021765A KR930021765A KR940009929A KR 940009929 A KR940009929 A KR 940009929A KR 1019930021765 A KR1019930021765 A KR 1019930021765A KR 930021765 A KR930021765 A KR 930021765A KR 940009929 A KR940009929 A KR 940009929A
Authority
KR
South Korea
Prior art keywords
phoneme
comparing
word
letter
phrase
Prior art date
Application number
KR1019930021765A
Other languages
English (en)
Inventor
프라사드 마이크킬리네니 라젠드라
Original Assignee
찰즈 엘. 워른
아메리칸 텔리폰 앤드 텔레그라프 캄파니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 찰즈 엘. 워른, 아메리칸 텔리폰 앤드 텔레그라프 캄파니 filed Critical 찰즈 엘. 워른
Publication of KR940009929A publication Critical patent/KR940009929A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

구음의 스트링내에서 문자 및 숫자 겸용 정보를 인식하기 위한 장치 및 방법, 상기 장치는 기준 구, 단어, 문자 및 숫자의 음으로 이루어진 음소(1001)의 음소 스트링(1002)으로서 기록된 기준문자 및 숫자겸용 정보가 기억된 데이터 베이스 구조(10)를 갖는다. 동작에서, 상기 장치는 수신된 구음을 기억된 기준 구, 단어, 문자 및 숫자에 비교하고 전체 스코어(120)를 기준 구, 단어, 문자 및 숫자에 따른 구음의 근접을 나타내는 각 비교에 할당함에 의해서 구음의 수신에 응답한다. 상기 장치는 최고 전체 스코어를 선택해서 구음을 선택된 기준구, 단어, 문자 또는 숫자의 각 음소와 비교한다. 각 비교된 음소에 할당된 스코어는 선택된 기준 구, 단어, 문자 및 숫자로서 수신된 구음의 유효성을 결정하기 위해 요약된다.

Description

음성 정보 인식 장치 및 그 작동 방법.
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명의 원리를 실현하는 음성 인식 시스템의 도시도,
제2도는 제1도에 도시된 음성 인식 시스템의 작동을 제어하기 위한 음성 인식 알고리즘의 도시도,
제3도는 제1도에 도시된 음성 인식 시스템의 소프트웨어 배치 신경 회로망.

Claims (10)

  1. 사용자 구음(user spoken sounds)의 스트링에서 정보를 인식하기 위한 장치에 있어서, 수신된 구음을 음소스트링(a string of phonemes)으로 각각 표시된 기억된 기준 모델과 비교하고 전체 스코어를 각각의 기준 모델에 따른 구음의 근접을 나타내는 각 비교에 할당하는 수단(10,11,12)과, 최고 전체 스코어(120)에 할당된 기준 모델중 하나를 선택해서 구음을 선택된 기준 모델의 각 음소화 비교하며, 서브스코어(121,12n)를 선택된 모델의 각 비교된 음소에 할당하여 각 음소 비교 서브 스코어를 인가된 스코어를 요약하고 요약된 서브 스코어에 따라 선택된 모델과 같은 수신된 구음의 유효성을 결정하는 회로망(12000)에 인가하는 수단(10,11,12)을 포함하는 음성 정보 인식 장치.
  2. 제1항에 있어서, 상기 비교하고 할당하는 수단은, 음소화 같은 미리 규정된 기준 구(phrases), 단어(words), 문자(characters) 및 숫자로 이루어진 모델 및 기준 구, 단어, 문자 및 숫자의 음을 식별하는 음소스트링을 기억하는 데이터 베이스를 포함하는 음성 정보 인식 장치.
  3. 제1항에 있어서, 상기 비교하고 할당하는 수단은, 사용자 구음의 수신에 응다해서 수신된 구음을 각각 기억된 기준 구, 단어, 문자 및 숫자에 비교하고 전체 스코어를 비교된 기준 구, 단어, 문자 및 숫자로 이루어진 음소스트링에 따른 구음의 근접을 나타내는 각 비교에 할당하는 수단을 포함하는 음성 정보 인식 장치.
  4. 제3항에 있어서, 상기 선택해서 비교하고 할당하는 수단은, 상기 기준 구, 단어, 문자 및 숫자의 선택에 응답해서 구음을 선택된 기준 구, 단어, 문자 및 숫자로 이루어진 음소 스트링의 각 음소에 비교하고, 서브 스코어를 각 음소에 따른 구음의 근접을 나타내는 각 비교된 음소에 할당하는 수단을 포함하는 음성 정보 인식 장치.
  5. 제1항에 있어서, 상기 선택해서 비교하고 할당하는 수단은, 각각 상기 음소 서브 스코어 중 하나를 수신하며 상기 입력 서브 스코어를 요약해서 상기 요약된 서브 스코어의 등급으로 출력 데이터를 구동시키기 위한 다수의 입력을 가진 신경 회로망을 포함하는데, 상기 출력 데이터는 선택된 기준 구, 단어, 문자 및 숫자에 따른 구음의 근접을 나타내는 음성 정보 인식 장치.
  6. 사용자 구음의 스트링에서 정보를 인식하기 위해 실시간에서 음성 인식 자이를 작동시키는 방법에 있어서, 수신된 사용자 구음을 음소 스트링에 의해 표시된 기억된 기준 모델과 비교하고, 전체 스코어를 기준 모델에 따른 구음의 근접을 나타내는 각 비교에 할당하는 단계와, 최고 전체 스코어에 할당된 기준 모델 중 하나를 선택해서 서브 스코어를 선택된 모델의 각 비교된 음소에 할당함에 의해서 구음을 선택된 기준 모델의 각 음소와 비교하며, 음소 서브 스코어를 요약해서 요약된 스코어에 따라 선택된 기준 모델로서 수신된 구음의 유효성을 결정하는 단계로 이루어진 음성 인식 장치 작동방법.
  7. 제6항에 있어서, 상기 비교하고 할당하는 단계는, 수신된 구음을 각각 기억된 기준 구, 단어, 문자 및 숫자와 비교하고, 전체 스코어를 비교된 기준 구, 단어, 문자 및 숫자로 이루어진 음소에 따른 구음의 근접을 나타내는 각 비교에 할당하는 단계로 이루어진 음성 인식 장치 작동 방법.
  8. 제6항에 있어서, 상기 선택해서 비교하고 요약하는 단계는, 구음을 선택된 기준 구, 단어, 문자 및 숫자로 이루어진 음소 스트링의 각 음소와 비교하고 서브 스코어를 비교된 음소에 따른 구음의 근접을 나타내는 각 비교된 음소에 할당하는 단계로 이루어진 음성 인식 장치 작동 방법.
  9. 제6항에 있어서, 상기 선택해서 비교하고 요약하는 단계는, 음소 서브 스코어를 신경 회로망에 인가하고선택된 기준 구, 단어, 문자 및 숫자에 따른 구음의 근접을 나타내는 상기 음소 서브 스코어의 등급으로 출력데이타를 구동시키는 단계로 이루어진 음성 인식 장치 작동 방법.
  10. 제9항에 있어서, 상기 선택해서 비교하고 요약하는 단계는, 신경 회로망의 구동된 출력 데이터를 설정된 임계와 매칭시키고, 매칭자가 설정된 임계의 규정 범위내에 있을 때 선택된 기준 구, 단어, 문자 및 숫자 사용자 패스워드로서 사용자 구음을 식별하는 단계로 이루어진 음성 인식 장치 작동 방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019930021765A 1992-10-30 1993-10-20 음성 정보 인식 장치 및 그 작동 방법 KR940009929A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US96872492A 1992-10-30 1992-10-30
US968,724 1992-10-30

Publications (1)

Publication Number Publication Date
KR940009929A true KR940009929A (ko) 1994-05-24

Family

ID=25514677

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019930021765A KR940009929A (ko) 1992-10-30 1993-10-20 음성 정보 인식 장치 및 그 작동 방법

Country Status (6)

Country Link
EP (1) EP0595541A1 (ko)
JP (1) JPH06208390A (ko)
KR (1) KR940009929A (ko)
AU (1) AU657064B2 (ko)
CA (1) CA2107317A1 (ko)
FI (1) FI934813A (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5365574A (en) * 1990-05-15 1994-11-15 Vcs Industries, Inc. Telephone network voice recognition and verification using selectively-adjustable signal thresholds
CN110047466B (zh) * 2019-04-16 2021-04-13 深圳市数字星河科技有限公司 一种开放性创建语音朗读标准参考模型的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5782896A (en) * 1980-11-12 1982-05-24 Hitachi Ltd Continuous voice recognition system
US4761815A (en) * 1981-05-01 1988-08-02 Figgie International, Inc. Speech recognition system based on word state duration and/or weight
US4817159A (en) * 1983-06-02 1989-03-28 Matsushita Electric Industrial Co., Ltd. Method and apparatus for speech recognition
JPH02195400A (ja) * 1989-01-24 1990-08-01 Canon Inc 音声認識装置
US5125022A (en) * 1990-05-15 1992-06-23 Vcs Industries, Inc. Method for recognizing alphanumeric strings spoken over a telephone network
FR2679690B1 (fr) * 1991-07-23 1996-10-25 Thomson Csf Procede et dispositif de reconnaissance de la parole en temps reel.

Also Published As

Publication number Publication date
FI934813A (fi) 1994-05-01
AU657064B2 (en) 1995-02-23
CA2107317A1 (en) 1994-05-01
AU5023393A (en) 1994-05-19
JPH06208390A (ja) 1994-07-26
FI934813A0 (fi) 1993-10-29
EP0595541A1 (en) 1994-05-04

Similar Documents

Publication Publication Date Title
US10027662B1 (en) Dynamic user authentication
US6208964B1 (en) Method and apparatus for providing unsupervised adaptation of transcriptions
US6912499B1 (en) Method and apparatus for training a multilingual speech model set
US6078885A (en) Verbal, fully automatic dictionary updates by end-users of speech synthesis and recognition systems
US5995928A (en) Method and apparatus for continuous spelling speech recognition with early identification
US7529678B2 (en) Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system
Fry Theoretical aspects of mechanical speech recognition
EP0984430B1 (en) Speech recognizer with lexicon updateable by spelled word input
US5752227A (en) Method and arrangement for speech to text conversion
KR970707529A (ko) 음성 인식 장치 및 음성 인식 장치용 어휘 발생 방법(speech recognition)
JPS603699A (ja) 適応性自動離散音声認識方法
KR870009322A (ko) 스피커 배열 언어 인식 시스템
KR20140134653A (ko) 텍스트 투 스피치 및 시맨틱스에 기초한 오디오 인적 상호 증명 기법
JP2002304190A (ja) 発音変化形生成方法及び音声認識方法
US20050071161A1 (en) Speech recognition method having relatively higher availability and correctiveness
EP0562138A1 (en) Method and apparatus for the automatic generation of Markov models of new words to be added to a speech recognition vocabulary
Boite et al. A new approach towards keyword spotting.
JPS597998A (ja) 連続音声認識装置
KR940009929A (ko) 음성 정보 인식 장치 및 그 작동 방법
Mote et al. Tactical language detection and modeling of learner speech errors: The case of Arabic tactical language training for American English speakers
JPH1097285A (ja) 音声認識装置
JP2820093B2 (ja) 単音節認識装置
JPH08123470A (ja) 音声認識装置
JP2003044085A (ja) コマンド入力機能つきディクテーション装置
US8688452B2 (en) Automatic generation of distractors for special-purpose speech recognition grammars

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid