KR870009322A - 스피커 배열 언어 인식 시스템 - Google Patents

스피커 배열 언어 인식 시스템 Download PDF

Info

Publication number
KR870009322A
KR870009322A KR870002681A KR870002681A KR870009322A KR 870009322 A KR870009322 A KR 870009322A KR 870002681 A KR870002681 A KR 870002681A KR 870002681 A KR870002681 A KR 870002681A KR 870009322 A KR870009322 A KR 870009322A
Authority
KR
South Korea
Prior art keywords
word
speaker array
previous
speaker
model
Prior art date
Application number
KR870002681A
Other languages
English (en)
Other versions
KR970001165B1 (ko
Inventor
킬렌 도트리취 브루스
윌리암 고델 토마스
비욘 로 데이비드
Original Assignee
엘리 와이스
아메리칸 텔리폰 앤드 텔레그라프 캄파니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘리 와이스, 아메리칸 텔리폰 앤드 텔레그라프 캄파니 filed Critical 엘리 와이스
Publication of KR870009322A publication Critical patent/KR870009322A/ko
Application granted granted Critical
Publication of KR970001165B1 publication Critical patent/KR970001165B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)
  • Image Analysis (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Character Discrimination (AREA)

Abstract

내용없음

Description

스피커 배열 언어 인식 시스템
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제 1 도는 본 발명을 설명하기에 유용한 언어 인식기의 블록도
제 2 도는 단어 발음을 비교하기 위한 다양한 기술의 도시
제 3 도는 본 발명의 동작에 의하여 배열 절차를 설명하는 플로우챠트도

Claims (11)

  1. 스피커 배열 언어 인식기에 있어서, 스피커로부터 수신된 현지 단어발음으로부터 다수의 특성을 인출하기 위한 장치(106)와 상기 다수의 특성 신호로부터 다수의 파라메터를 발생하기 위한 장치(101,206)와, 예정된 표준을 사용하여 미리 수신된 단어 발음으로부터 유도된 이전의 단어 기준 모델의 다수의 파라메터에 대하여 상기 인출 장치로부터 유도된 현재의 단어 발음의 상기 다수의 특성 신호를 비교하기 위한 장치(101,211)와, 현재 단어 발음과 기준 모델간의 차이가 예정치보다 작은 것을 상기 비교장치의 출력이 지시할시에 상기 스피커를 신호화시키기 위한 장치(107)를 특징으로 하는 스피커 배열 언어 인식기.
  2. 제 1 항에 있어서, 예정된 기준 모델이 Hidden Markov 모델인 것을 특징으로 하는 스피커 배열 언어 인식기.
  3. 제 1 항에 있어서, 상기 인출장치가 필터뱅크 장치인 것을 특징으로 하는 스피커 배열 언어 인식기.
  4. 제 1 항에 있어서, 상기 비교장치가 비텔비스코링 장치인 것을 특징으로 하는 스피커 배열 언어 인식기.
  5. 제 1 항에 있어서, 상기 비교장치는, 상기 현재의 단어발음의 다수의 특성 신호가 상기 예정된 표준을 사용하여 각각의 미리 수신된 단어 발음으로부터 유도된 이전의 기준 단어 모델의 각각의 다수의 파라메터에 대하여 스코어되는 이전의 단어 스코링 장치를 특징으로 하며,상기 비교장치는 상기 이전의 단어 모델 스코링장치로부터 가장 낮은 스코어를 사용하여 유사성 지수를 발생하며, 여기서 상기 신호장치는 상기 유사성 지수가 예정치보다 작을 경우 상기 스피커를 신호화하는 것을 특징으로 하는 스피커 배열 언어 인식기.
  6. 제 5 항에 있어서, 상기 비교장치는, 상기 현재의 단어 발음의 다수의 특성 신호가 그로부터 유도된 상기 예정된 기준 모델에 대하여 스코어 되는 것을 특징으로 하며, 여기서 비교장치는 상기 현재의 단어 모델 스코링 장치의 출력과 상기 동일 지수를 결정하는 상기 이전의 단어 모델 스코링 장치의 출력을 사용하는 것을 특징으로 하는 스피커 배열 언어 인식기.
  7. 제 6 항에 있어서, 상기 이전의 단어 스코링 장치로부터의 가장 낮은 스코어가 S(MIN)이고, 상기 현재의 단어 모델 스코링 장치의 출력은 S(N+1)이며, 상기 유사성 지수는 S(N+1)-S(MIN)에 일치하는 것을 특징으로 하는 스피커 배열 언어 인식기.
  8. 제 6 항에 있어서, 상기 이전의 단어 스코링 장치로부터 가장 낮은 소코어가 S(MIN)이고, 상기 현재의 단어 스코링 장치의 출력이 S(N+1)이며, 상기 유사성 지수는 S(N+1)을 S(MIN)으로 나눈값에 일치하는 것을 특징으로 하는 스피커 배열 언어 인식기.
  9. 제 6 항에 있어서, 상기 이전의 단어 스코링 장치로부터의 가장 낮은 스코어가 S(MIN)이며, 상기 유사겅 지수는 S(MIN)에 일치하는 것을 특징으로 하는 스피커 배열 언어 인식기.
  10. 제 1 항에 있어서 상기 현재 단어 발음의 다수의 특성 신호에 응답하여 상기 이전의 기준 단어 모델을 갱신하기 위한 장치를 특징으로 하는 스피커 배열 언어 인식기.
  11. 스피커 배열 언어 인식기를 동작하는 방법에 있어서, 스피커로부터 수신된 현재 단어 발음으로부터 다수의 특성 신호를 인출하는 단계와, 상기 다수의 특성 신호로부터 다수의 파라메터를 발생하는 단계와, 예정된 표준은 사용하여 미리 수신된 단어 발음으로부터 유도된 다수의 이전의 단어 기준 모델에 대하여 상기 인출장치로부터 유도된 상기 현재의 단어 발음의 다수의 특성 신호를 비교하기 위한 단계와, 상기 현재의 단어 발음과 기준 모델간의 차이가 예정치보다 작은 것을 상기 비교장치의 출력이 지시할시에 스피커를 신호화하는 단계를 특징으로 하는 스피커 배열 언어 인식기 동작방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019870002681A 1986-03-25 1987-03-24 대화자 훈련의 음성 인식기 및 그 사용방법 KR970001165B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US84196886A 1986-03-25 1986-03-25
US841968 1986-03-25
US841,968 1992-02-26

Publications (2)

Publication Number Publication Date
KR870009322A true KR870009322A (ko) 1987-10-26
KR970001165B1 KR970001165B1 (ko) 1997-01-29

Family

ID=25286208

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019870002681A KR970001165B1 (ko) 1986-03-25 1987-03-24 대화자 훈련의 음성 인식기 및 그 사용방법

Country Status (7)

Country Link
US (1) US4972485A (ko)
EP (1) EP0241163B1 (ko)
JP (1) JPS62231997A (ko)
KR (1) KR970001165B1 (ko)
CA (1) CA1311059C (ko)
DE (1) DE3775963D1 (ko)
ES (1) ES2028863T3 (ko)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5315689A (en) * 1988-05-27 1994-05-24 Kabushiki Kaisha Toshiba Speech recognition system having word-based and phoneme-based recognition means
US5465378A (en) * 1990-05-15 1995-11-07 Compuspeak, Inc. Report generating system
DE69322894T2 (de) * 1992-03-02 1999-07-29 At & T Corp Lernverfahren und Gerät zur Spracherkennung
US6073097A (en) * 1992-11-13 2000-06-06 Dragon Systems, Inc. Speech recognition system which selects one of a plurality of vocabulary models
US5452397A (en) * 1992-12-11 1995-09-19 Texas Instruments Incorporated Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list
KR100309207B1 (ko) * 1993-03-12 2001-12-17 에드워드 이. 데이비스 음성-대화식언어명령방법및장치
US5465317A (en) * 1993-05-18 1995-11-07 International Business Machines Corporation Speech recognition system with improved rejection of words and sounds not in the system vocabulary
US5737723A (en) * 1994-08-29 1998-04-07 Lucent Technologies Inc. Confusable word detection in speech recognition
US5903864A (en) * 1995-08-30 1999-05-11 Dragon Systems Speech recognition
US5937383A (en) * 1996-02-02 1999-08-10 International Business Machines Corporation Apparatus and methods for speech recognition including individual or speaker class dependent decoding history caches for fast word acceptance or rejection
US5754977A (en) * 1996-03-06 1998-05-19 Intervoice Limited Partnership System and method for preventing enrollment of confusable patterns in a reference database
US5842161A (en) * 1996-06-25 1998-11-24 Lucent Technologies Inc. Telecommunications instrument employing variable criteria speech recognition
US6151575A (en) * 1996-10-28 2000-11-21 Dragon Systems, Inc. Rapid adaptation of speech models
US5884258A (en) * 1996-10-31 1999-03-16 Microsoft Corporation Method and system for editing phrases during continuous speech recognition
US5899976A (en) * 1996-10-31 1999-05-04 Microsoft Corporation Method and system for buffering recognized words during speech recognition
US5950160A (en) 1996-10-31 1999-09-07 Microsoft Corporation Method and system for displaying a variable number of alternative words during speech recognition
US5829000A (en) * 1996-10-31 1998-10-27 Microsoft Corporation Method and system for correcting misrecognized spoken words or phrases
CN1216137A (zh) * 1996-12-24 1999-05-05 皇家菲利浦电子有限公司 一种训练语音识别系统的方法和实践该方法的装置特别是手提电话设备
US6212498B1 (en) 1997-03-28 2001-04-03 Dragon Systems, Inc. Enrollment in speech recognition
US6012027A (en) * 1997-05-27 2000-01-04 Ameritech Corporation Criteria for usable repetitions of an utterance during speech reference enrollment
US7630895B2 (en) * 2000-01-21 2009-12-08 At&T Intellectual Property I, L.P. Speaker verification method
US6490561B1 (en) * 1997-06-25 2002-12-03 Dennis L. Wilson Continuous speech voice transcription
FR2769118B1 (fr) * 1997-09-29 1999-12-03 Matra Communication Procede de reconnaissance de parole
DE19804047C2 (de) * 1998-02-03 2000-03-16 Deutsche Telekom Mobil Verfahren und Einrichtung zur Erhöhung der Erkennungswahrscheinlichkeit von Spracherkennungssystemen
US6163768A (en) 1998-06-15 2000-12-19 Dragon Systems, Inc. Non-interactive enrollment in speech recognition
US7266498B1 (en) * 1998-12-18 2007-09-04 Intel Corporation Method and apparatus for reducing conflicts between speech-enabled applications sharing speech menu
GB9920257D0 (en) * 1999-08-26 1999-10-27 Canon Kk Signal processing system
US7047196B2 (en) 2000-06-08 2006-05-16 Agiletv Corporation System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery
US8095370B2 (en) 2001-02-16 2012-01-10 Agiletv Corporation Dual compression voice recordation non-repudiation system
US7013276B2 (en) * 2001-10-05 2006-03-14 Comverse, Inc. Method of assessing degree of acoustic confusability, and system therefor
GB2385698B (en) * 2002-02-26 2005-06-15 Canon Kk Speech processing apparatus and method
US8498859B2 (en) * 2002-11-13 2013-07-30 Bernd Schönebeck Voice processing system, method for allocating acoustic and/or written character strings to words or lexical entries
US20070055520A1 (en) * 2005-08-31 2007-03-08 Microsoft Corporation Incorporation of speech engine training into interactive user tutorial
US7844456B2 (en) * 2007-03-09 2010-11-30 Microsoft Corporation Grammar confusability metric for speech recognition
US10431235B2 (en) 2012-05-31 2019-10-01 Elwha Llc Methods and systems for speech adaptation data
US9899026B2 (en) 2012-05-31 2018-02-20 Elwha Llc Speech recognition adaptation systems based on adaptation data
US20130325447A1 (en) * 2012-05-31 2013-12-05 Elwha LLC, a limited liability corporation of the State of Delaware Speech recognition adaptation systems based on adaptation data
US9899040B2 (en) 2012-05-31 2018-02-20 Elwha, Llc Methods and systems for managing adaptation data
DK2713367T3 (en) * 2012-09-28 2017-02-20 Agnitio S L Speech Recognition
US9684437B2 (en) * 2013-07-12 2017-06-20 II Michael L. Thornton Memorization system and method
US10121466B2 (en) 2015-02-11 2018-11-06 Hand Held Products, Inc. Methods for training a speech recognition system
EP3067887A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN107301862A (zh) * 2016-04-01 2017-10-27 北京搜狗科技发展有限公司 一种语音识别方法、识别模型建立方法、装置及电子设备
US10141009B2 (en) 2016-06-28 2018-11-27 Pindrop Security, Inc. System and method for cluster-based audio event detection
US9824692B1 (en) 2016-09-12 2017-11-21 Pindrop Security, Inc. End-to-end speaker recognition using deep neural network
AU2017327003B2 (en) 2016-09-19 2019-05-23 Pindrop Security, Inc. Channel-compensated low-level features for speaker recognition
WO2018053537A1 (en) 2016-09-19 2018-03-22 Pindrop Security, Inc. Improvements of speaker recognition in the call center
US10553218B2 (en) * 2016-09-19 2020-02-04 Pindrop Security, Inc. Dimensionality reduction of baum-welch statistics for speaker recognition
US10397398B2 (en) 2017-01-17 2019-08-27 Pindrop Security, Inc. Authentication using DTMF tones
US10586537B2 (en) * 2017-11-30 2020-03-10 International Business Machines Corporation Filtering directive invoking vocal utterances
WO2020159917A1 (en) 2019-01-28 2020-08-06 Pindrop Security, Inc. Unsupervised keyword spotting and word discovery for fraud analytics
WO2020163624A1 (en) 2019-02-06 2020-08-13 Pindrop Security, Inc. Systems and methods of gateway detection in a telephone network
US11646018B2 (en) 2019-03-25 2023-05-09 Pindrop Security, Inc. Detection of calls from voice assistants
US12015637B2 (en) 2019-04-08 2024-06-18 Pindrop Security, Inc. Systems and methods for end-to-end architectures for voice spoofing detection
CN115206299B (zh) * 2022-09-15 2022-11-11 成都启英泰伦科技有限公司 一种基于命令词语音识别的易混淆词防误识别方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3333248A (en) * 1963-12-20 1967-07-25 Ibm Self-adaptive systems
US3548202A (en) * 1968-11-29 1970-12-15 Ibm Adaptive logic system for unsupervised learning
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer
US4297528A (en) * 1979-09-10 1981-10-27 Interstate Electronics Corp. Training circuit for audio signal recognition computer
US4348553A (en) * 1980-07-02 1982-09-07 International Business Machines Corporation Parallel pattern verifier with dynamic time warping
CH644246B (fr) * 1981-05-15 1900-01-01 Asulab Sa Dispositif d'introduction de mots a commande par la parole.
US4499596A (en) * 1982-06-28 1985-02-12 International Business Machines Corporation Adaptive facsimile compression using a dynamic extendable decision network
US4587670A (en) * 1982-10-15 1986-05-06 At&T Bell Laboratories Hidden Markov model speech recognition arrangement
US4618984A (en) * 1983-06-08 1986-10-21 International Business Machines Corporation Adaptive automatic discrete utterance recognition
JPS60218698A (ja) * 1984-04-16 1985-11-01 日本電気株式会社 音声認識装置
JPH0792673B2 (ja) * 1984-10-02 1995-10-09 株式会社東芝 認識用辞書学習方法
US4718094A (en) * 1984-11-19 1988-01-05 International Business Machines Corp. Speech recognition system

Also Published As

Publication number Publication date
KR970001165B1 (ko) 1997-01-29
ES2028863T3 (es) 1992-07-16
CA1311059C (en) 1992-12-01
EP0241163B1 (en) 1992-01-15
DE3775963D1 (de) 1992-02-27
JPS62231997A (ja) 1987-10-12
EP0241163A1 (en) 1987-10-14
US4972485A (en) 1990-11-20

Similar Documents

Publication Publication Date Title
KR870009322A (ko) 스피커 배열 언어 인식 시스템
US10074363B2 (en) Method and apparatus for keyword speech recognition
Zissman et al. Automatic language identification
US5752227A (en) Method and arrangement for speech to text conversion
US6208964B1 (en) Method and apparatus for providing unsupervised adaptation of transcriptions
US4783802A (en) Learning system of dictionary for speech recognition
DE69127818D1 (de) System zur verarbeitung kontinuierlicher sprache
EP0387602A3 (en) Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
ATE374421T1 (de) Segmentierungsverfahren zur erweiterung des aktiven vokabulars von spracherkennern
CN106710585B (zh) 语音交互过程中的多音字播报方法及系统
CN111862954A (zh) 一种语音识别模型的获取方法及装置
JP2002062891A (ja) 音素割当て方法
US20180012602A1 (en) System and methods for pronunciation analysis-based speaker verification
Minematsu et al. Role of prosodic features in the human process of perceiving spoken words and sentences in Japanese
JPS6138479B2 (ko)
Yavuz et al. A Phoneme-Based Approach for Eliminating Out-of-vocabulary Problem Turkish Speech Recognition Using Hidden Markov Model.
JPH0743599B2 (ja) 音声認識用コンピュータ・システム
Phoophuangpairoj et al. Two-Stage Gender Identification Using Pitch Frequencies, MFCCs and HMMs
US20020016709A1 (en) Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis
JPH032319B2 (ko)
JP2578771B2 (ja) 音声認識装置
KR940009929A (ko) 음성 정보 인식 장치 및 그 작동 방법
JPH0695684A (ja) 音声認識システム
KR950009328B1 (ko) 단음절단위의 음성인식방법
JPS59185400A (ja) 単音節音声認識方式

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application
J2X1 Appeal (before the patent court)

Free format text: APPEAL AGAINST DECISION TO DECLINE REFUSAL

G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
NORF Unpaid initial registration fee