KR870009322A - 스피커 배열 언어 인식 시스템 - Google Patents
스피커 배열 언어 인식 시스템 Download PDFInfo
- Publication number
- KR870009322A KR870009322A KR870002681A KR870002681A KR870009322A KR 870009322 A KR870009322 A KR 870009322A KR 870002681 A KR870002681 A KR 870002681A KR 870002681 A KR870002681 A KR 870002681A KR 870009322 A KR870009322 A KR 870009322A
- Authority
- KR
- South Korea
- Prior art keywords
- word
- speaker array
- previous
- speaker
- model
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 6
- 230000011664 signaling Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Image Analysis (AREA)
- Electrically Operated Instructional Devices (AREA)
- Character Discrimination (AREA)
Abstract
내용없음
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제 1 도는 본 발명을 설명하기에 유용한 언어 인식기의 블록도
제 2 도는 단어 발음을 비교하기 위한 다양한 기술의 도시
제 3 도는 본 발명의 동작에 의하여 배열 절차를 설명하는 플로우챠트도
Claims (11)
- 스피커 배열 언어 인식기에 있어서, 스피커로부터 수신된 현지 단어발음으로부터 다수의 특성을 인출하기 위한 장치(106)와 상기 다수의 특성 신호로부터 다수의 파라메터를 발생하기 위한 장치(101,206)와, 예정된 표준을 사용하여 미리 수신된 단어 발음으로부터 유도된 이전의 단어 기준 모델의 다수의 파라메터에 대하여 상기 인출 장치로부터 유도된 현재의 단어 발음의 상기 다수의 특성 신호를 비교하기 위한 장치(101,211)와, 현재 단어 발음과 기준 모델간의 차이가 예정치보다 작은 것을 상기 비교장치의 출력이 지시할시에 상기 스피커를 신호화시키기 위한 장치(107)를 특징으로 하는 스피커 배열 언어 인식기.
- 제 1 항에 있어서, 예정된 기준 모델이 Hidden Markov 모델인 것을 특징으로 하는 스피커 배열 언어 인식기.
- 제 1 항에 있어서, 상기 인출장치가 필터뱅크 장치인 것을 특징으로 하는 스피커 배열 언어 인식기.
- 제 1 항에 있어서, 상기 비교장치가 비텔비스코링 장치인 것을 특징으로 하는 스피커 배열 언어 인식기.
- 제 1 항에 있어서, 상기 비교장치는, 상기 현재의 단어발음의 다수의 특성 신호가 상기 예정된 표준을 사용하여 각각의 미리 수신된 단어 발음으로부터 유도된 이전의 기준 단어 모델의 각각의 다수의 파라메터에 대하여 스코어되는 이전의 단어 스코링 장치를 특징으로 하며,상기 비교장치는 상기 이전의 단어 모델 스코링장치로부터 가장 낮은 스코어를 사용하여 유사성 지수를 발생하며, 여기서 상기 신호장치는 상기 유사성 지수가 예정치보다 작을 경우 상기 스피커를 신호화하는 것을 특징으로 하는 스피커 배열 언어 인식기.
- 제 5 항에 있어서, 상기 비교장치는, 상기 현재의 단어 발음의 다수의 특성 신호가 그로부터 유도된 상기 예정된 기준 모델에 대하여 스코어 되는 것을 특징으로 하며, 여기서 비교장치는 상기 현재의 단어 모델 스코링 장치의 출력과 상기 동일 지수를 결정하는 상기 이전의 단어 모델 스코링 장치의 출력을 사용하는 것을 특징으로 하는 스피커 배열 언어 인식기.
- 제 6 항에 있어서, 상기 이전의 단어 스코링 장치로부터의 가장 낮은 스코어가 S(MIN)이고, 상기 현재의 단어 모델 스코링 장치의 출력은 S(N+1)이며, 상기 유사성 지수는 S(N+1)-S(MIN)에 일치하는 것을 특징으로 하는 스피커 배열 언어 인식기.
- 제 6 항에 있어서, 상기 이전의 단어 스코링 장치로부터 가장 낮은 소코어가 S(MIN)이고, 상기 현재의 단어 스코링 장치의 출력이 S(N+1)이며, 상기 유사성 지수는 S(N+1)을 S(MIN)으로 나눈값에 일치하는 것을 특징으로 하는 스피커 배열 언어 인식기.
- 제 6 항에 있어서, 상기 이전의 단어 스코링 장치로부터의 가장 낮은 스코어가 S(MIN)이며, 상기 유사겅 지수는 S(MIN)에 일치하는 것을 특징으로 하는 스피커 배열 언어 인식기.
- 제 1 항에 있어서 상기 현재 단어 발음의 다수의 특성 신호에 응답하여 상기 이전의 기준 단어 모델을 갱신하기 위한 장치를 특징으로 하는 스피커 배열 언어 인식기.
- 스피커 배열 언어 인식기를 동작하는 방법에 있어서, 스피커로부터 수신된 현재 단어 발음으로부터 다수의 특성 신호를 인출하는 단계와, 상기 다수의 특성 신호로부터 다수의 파라메터를 발생하는 단계와, 예정된 표준은 사용하여 미리 수신된 단어 발음으로부터 유도된 다수의 이전의 단어 기준 모델에 대하여 상기 인출장치로부터 유도된 상기 현재의 단어 발음의 다수의 특성 신호를 비교하기 위한 단계와, 상기 현재의 단어 발음과 기준 모델간의 차이가 예정치보다 작은 것을 상기 비교장치의 출력이 지시할시에 스피커를 신호화하는 단계를 특징으로 하는 스피커 배열 언어 인식기 동작방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US84196886A | 1986-03-25 | 1986-03-25 | |
US841968 | 1986-03-25 | ||
US841,968 | 1992-02-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR870009322A true KR870009322A (ko) | 1987-10-26 |
KR970001165B1 KR970001165B1 (ko) | 1997-01-29 |
Family
ID=25286208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019870002681A KR970001165B1 (ko) | 1986-03-25 | 1987-03-24 | 대화자 훈련의 음성 인식기 및 그 사용방법 |
Country Status (7)
Country | Link |
---|---|
US (1) | US4972485A (ko) |
EP (1) | EP0241163B1 (ko) |
JP (1) | JPS62231997A (ko) |
KR (1) | KR970001165B1 (ko) |
CA (1) | CA1311059C (ko) |
DE (1) | DE3775963D1 (ko) |
ES (1) | ES2028863T3 (ko) |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5315689A (en) * | 1988-05-27 | 1994-05-24 | Kabushiki Kaisha Toshiba | Speech recognition system having word-based and phoneme-based recognition means |
US5465378A (en) * | 1990-05-15 | 1995-11-07 | Compuspeak, Inc. | Report generating system |
DE69322894T2 (de) * | 1992-03-02 | 1999-07-29 | At & T Corp | Lernverfahren und Gerät zur Spracherkennung |
US6073097A (en) * | 1992-11-13 | 2000-06-06 | Dragon Systems, Inc. | Speech recognition system which selects one of a plurality of vocabulary models |
US5452397A (en) * | 1992-12-11 | 1995-09-19 | Texas Instruments Incorporated | Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list |
KR100309207B1 (ko) * | 1993-03-12 | 2001-12-17 | 에드워드 이. 데이비스 | 음성-대화식언어명령방법및장치 |
US5465317A (en) * | 1993-05-18 | 1995-11-07 | International Business Machines Corporation | Speech recognition system with improved rejection of words and sounds not in the system vocabulary |
US5737723A (en) * | 1994-08-29 | 1998-04-07 | Lucent Technologies Inc. | Confusable word detection in speech recognition |
US5903864A (en) * | 1995-08-30 | 1999-05-11 | Dragon Systems | Speech recognition |
US5937383A (en) * | 1996-02-02 | 1999-08-10 | International Business Machines Corporation | Apparatus and methods for speech recognition including individual or speaker class dependent decoding history caches for fast word acceptance or rejection |
US5754977A (en) * | 1996-03-06 | 1998-05-19 | Intervoice Limited Partnership | System and method for preventing enrollment of confusable patterns in a reference database |
US5842161A (en) * | 1996-06-25 | 1998-11-24 | Lucent Technologies Inc. | Telecommunications instrument employing variable criteria speech recognition |
US6151575A (en) * | 1996-10-28 | 2000-11-21 | Dragon Systems, Inc. | Rapid adaptation of speech models |
US5884258A (en) * | 1996-10-31 | 1999-03-16 | Microsoft Corporation | Method and system for editing phrases during continuous speech recognition |
US5899976A (en) * | 1996-10-31 | 1999-05-04 | Microsoft Corporation | Method and system for buffering recognized words during speech recognition |
US5950160A (en) | 1996-10-31 | 1999-09-07 | Microsoft Corporation | Method and system for displaying a variable number of alternative words during speech recognition |
US5829000A (en) * | 1996-10-31 | 1998-10-27 | Microsoft Corporation | Method and system for correcting misrecognized spoken words or phrases |
CN1216137A (zh) * | 1996-12-24 | 1999-05-05 | 皇家菲利浦电子有限公司 | 一种训练语音识别系统的方法和实践该方法的装置特别是手提电话设备 |
US6212498B1 (en) | 1997-03-28 | 2001-04-03 | Dragon Systems, Inc. | Enrollment in speech recognition |
US6012027A (en) * | 1997-05-27 | 2000-01-04 | Ameritech Corporation | Criteria for usable repetitions of an utterance during speech reference enrollment |
US7630895B2 (en) * | 2000-01-21 | 2009-12-08 | At&T Intellectual Property I, L.P. | Speaker verification method |
US6490561B1 (en) * | 1997-06-25 | 2002-12-03 | Dennis L. Wilson | Continuous speech voice transcription |
FR2769118B1 (fr) * | 1997-09-29 | 1999-12-03 | Matra Communication | Procede de reconnaissance de parole |
DE19804047C2 (de) * | 1998-02-03 | 2000-03-16 | Deutsche Telekom Mobil | Verfahren und Einrichtung zur Erhöhung der Erkennungswahrscheinlichkeit von Spracherkennungssystemen |
US6163768A (en) | 1998-06-15 | 2000-12-19 | Dragon Systems, Inc. | Non-interactive enrollment in speech recognition |
US7266498B1 (en) * | 1998-12-18 | 2007-09-04 | Intel Corporation | Method and apparatus for reducing conflicts between speech-enabled applications sharing speech menu |
GB9920257D0 (en) * | 1999-08-26 | 1999-10-27 | Canon Kk | Signal processing system |
US7047196B2 (en) | 2000-06-08 | 2006-05-16 | Agiletv Corporation | System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery |
US8095370B2 (en) | 2001-02-16 | 2012-01-10 | Agiletv Corporation | Dual compression voice recordation non-repudiation system |
US7013276B2 (en) * | 2001-10-05 | 2006-03-14 | Comverse, Inc. | Method of assessing degree of acoustic confusability, and system therefor |
GB2385698B (en) * | 2002-02-26 | 2005-06-15 | Canon Kk | Speech processing apparatus and method |
US8498859B2 (en) * | 2002-11-13 | 2013-07-30 | Bernd Schönebeck | Voice processing system, method for allocating acoustic and/or written character strings to words or lexical entries |
US20070055520A1 (en) * | 2005-08-31 | 2007-03-08 | Microsoft Corporation | Incorporation of speech engine training into interactive user tutorial |
US7844456B2 (en) * | 2007-03-09 | 2010-11-30 | Microsoft Corporation | Grammar confusability metric for speech recognition |
US10431235B2 (en) | 2012-05-31 | 2019-10-01 | Elwha Llc | Methods and systems for speech adaptation data |
US9899026B2 (en) | 2012-05-31 | 2018-02-20 | Elwha Llc | Speech recognition adaptation systems based on adaptation data |
US20130325447A1 (en) * | 2012-05-31 | 2013-12-05 | Elwha LLC, a limited liability corporation of the State of Delaware | Speech recognition adaptation systems based on adaptation data |
US9899040B2 (en) | 2012-05-31 | 2018-02-20 | Elwha, Llc | Methods and systems for managing adaptation data |
DK2713367T3 (en) * | 2012-09-28 | 2017-02-20 | Agnitio S L | Speech Recognition |
US9684437B2 (en) * | 2013-07-12 | 2017-06-20 | II Michael L. Thornton | Memorization system and method |
US10121466B2 (en) | 2015-02-11 | 2018-11-06 | Hand Held Products, Inc. | Methods for training a speech recognition system |
EP3067887A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
CN107301862A (zh) * | 2016-04-01 | 2017-10-27 | 北京搜狗科技发展有限公司 | 一种语音识别方法、识别模型建立方法、装置及电子设备 |
US10141009B2 (en) | 2016-06-28 | 2018-11-27 | Pindrop Security, Inc. | System and method for cluster-based audio event detection |
US9824692B1 (en) | 2016-09-12 | 2017-11-21 | Pindrop Security, Inc. | End-to-end speaker recognition using deep neural network |
AU2017327003B2 (en) | 2016-09-19 | 2019-05-23 | Pindrop Security, Inc. | Channel-compensated low-level features for speaker recognition |
WO2018053537A1 (en) | 2016-09-19 | 2018-03-22 | Pindrop Security, Inc. | Improvements of speaker recognition in the call center |
US10553218B2 (en) * | 2016-09-19 | 2020-02-04 | Pindrop Security, Inc. | Dimensionality reduction of baum-welch statistics for speaker recognition |
US10397398B2 (en) | 2017-01-17 | 2019-08-27 | Pindrop Security, Inc. | Authentication using DTMF tones |
US10586537B2 (en) * | 2017-11-30 | 2020-03-10 | International Business Machines Corporation | Filtering directive invoking vocal utterances |
WO2020159917A1 (en) | 2019-01-28 | 2020-08-06 | Pindrop Security, Inc. | Unsupervised keyword spotting and word discovery for fraud analytics |
WO2020163624A1 (en) | 2019-02-06 | 2020-08-13 | Pindrop Security, Inc. | Systems and methods of gateway detection in a telephone network |
US11646018B2 (en) | 2019-03-25 | 2023-05-09 | Pindrop Security, Inc. | Detection of calls from voice assistants |
US12015637B2 (en) | 2019-04-08 | 2024-06-18 | Pindrop Security, Inc. | Systems and methods for end-to-end architectures for voice spoofing detection |
CN115206299B (zh) * | 2022-09-15 | 2022-11-11 | 成都启英泰伦科技有限公司 | 一种基于命令词语音识别的易混淆词防误识别方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3333248A (en) * | 1963-12-20 | 1967-07-25 | Ibm | Self-adaptive systems |
US3548202A (en) * | 1968-11-29 | 1970-12-15 | Ibm | Adaptive logic system for unsupervised learning |
US3816722A (en) * | 1970-09-29 | 1974-06-11 | Nippon Electric Co | Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer |
US4297528A (en) * | 1979-09-10 | 1981-10-27 | Interstate Electronics Corp. | Training circuit for audio signal recognition computer |
US4348553A (en) * | 1980-07-02 | 1982-09-07 | International Business Machines Corporation | Parallel pattern verifier with dynamic time warping |
CH644246B (fr) * | 1981-05-15 | 1900-01-01 | Asulab Sa | Dispositif d'introduction de mots a commande par la parole. |
US4499596A (en) * | 1982-06-28 | 1985-02-12 | International Business Machines Corporation | Adaptive facsimile compression using a dynamic extendable decision network |
US4587670A (en) * | 1982-10-15 | 1986-05-06 | At&T Bell Laboratories | Hidden Markov model speech recognition arrangement |
US4618984A (en) * | 1983-06-08 | 1986-10-21 | International Business Machines Corporation | Adaptive automatic discrete utterance recognition |
JPS60218698A (ja) * | 1984-04-16 | 1985-11-01 | 日本電気株式会社 | 音声認識装置 |
JPH0792673B2 (ja) * | 1984-10-02 | 1995-10-09 | 株式会社東芝 | 認識用辞書学習方法 |
US4718094A (en) * | 1984-11-19 | 1988-01-05 | International Business Machines Corp. | Speech recognition system |
-
1987
- 1987-02-26 CA CA000530682A patent/CA1311059C/en not_active Expired - Fee Related
- 1987-03-18 DE DE8787302309T patent/DE3775963D1/de not_active Expired - Fee Related
- 1987-03-18 ES ES198787302309T patent/ES2028863T3/es not_active Expired - Lifetime
- 1987-03-18 EP EP87302309A patent/EP0241163B1/en not_active Expired - Lifetime
- 1987-03-24 KR KR1019870002681A patent/KR970001165B1/ko active IP Right Grant
- 1987-03-25 JP JP62069264A patent/JPS62231997A/ja active Pending
-
1989
- 1989-05-23 US US07/356,589 patent/US4972485A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
KR970001165B1 (ko) | 1997-01-29 |
ES2028863T3 (es) | 1992-07-16 |
CA1311059C (en) | 1992-12-01 |
EP0241163B1 (en) | 1992-01-15 |
DE3775963D1 (de) | 1992-02-27 |
JPS62231997A (ja) | 1987-10-12 |
EP0241163A1 (en) | 1987-10-14 |
US4972485A (en) | 1990-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR870009322A (ko) | 스피커 배열 언어 인식 시스템 | |
US10074363B2 (en) | Method and apparatus for keyword speech recognition | |
Zissman et al. | Automatic language identification | |
US5752227A (en) | Method and arrangement for speech to text conversion | |
US6208964B1 (en) | Method and apparatus for providing unsupervised adaptation of transcriptions | |
US4783802A (en) | Learning system of dictionary for speech recognition | |
DE69127818D1 (de) | System zur verarbeitung kontinuierlicher sprache | |
EP0387602A3 (en) | Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system | |
ATE374421T1 (de) | Segmentierungsverfahren zur erweiterung des aktiven vokabulars von spracherkennern | |
CN106710585B (zh) | 语音交互过程中的多音字播报方法及系统 | |
CN111862954A (zh) | 一种语音识别模型的获取方法及装置 | |
JP2002062891A (ja) | 音素割当て方法 | |
US20180012602A1 (en) | System and methods for pronunciation analysis-based speaker verification | |
Minematsu et al. | Role of prosodic features in the human process of perceiving spoken words and sentences in Japanese | |
JPS6138479B2 (ko) | ||
Yavuz et al. | A Phoneme-Based Approach for Eliminating Out-of-vocabulary Problem Turkish Speech Recognition Using Hidden Markov Model. | |
JPH0743599B2 (ja) | 音声認識用コンピュータ・システム | |
Phoophuangpairoj et al. | Two-Stage Gender Identification Using Pitch Frequencies, MFCCs and HMMs | |
US20020016709A1 (en) | Method for generating a statistic for phone lengths and method for determining the length of individual phones for speech synthesis | |
JPH032319B2 (ko) | ||
JP2578771B2 (ja) | 音声認識装置 | |
KR940009929A (ko) | 음성 정보 인식 장치 및 그 작동 방법 | |
JPH0695684A (ja) | 音声認識システム | |
KR950009328B1 (ko) | 단음절단위의 음성인식방법 | |
JPS59185400A (ja) | 単音節音声認識方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application | ||
J2X1 | Appeal (before the patent court) |
Free format text: APPEAL AGAINST DECISION TO DECLINE REFUSAL |
|
G160 | Decision to publish patent application | ||
E701 | Decision to grant or registration of patent right | ||
NORF | Unpaid initial registration fee |