KR100879410B1 - 음향 특징 벡터 수정을 사용하는 분산형 음성 인식 시스템 - Google Patents
음향 특징 벡터 수정을 사용하는 분산형 음성 인식 시스템 Download PDFInfo
- Publication number
- KR100879410B1 KR100879410B1 KR1020037010130A KR20037010130A KR100879410B1 KR 100879410 B1 KR100879410 B1 KR 100879410B1 KR 1020037010130 A KR1020037010130 A KR 1020037010130A KR 20037010130 A KR20037010130 A KR 20037010130A KR 100879410 B1 KR100879410 B1 KR 100879410B1
- Authority
- KR
- South Korea
- Prior art keywords
- delete delete
- feature vector
- acoustic
- acoustic feature
- speech
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 179
- 238000012986 modification Methods 0.000 title claims description 34
- 230000004048 modification Effects 0.000 title claims description 34
- 238000012937 correction Methods 0.000 claims abstract description 61
- 230000006978 adaptation Effects 0.000 claims abstract description 44
- 230000006870 function Effects 0.000 claims description 79
- 238000000034 method Methods 0.000 claims description 34
- 230000003044 adaptive effect Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims 2
- 230000001419 dependent effect Effects 0.000 abstract description 18
- 238000012360 testing method Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003931 cognitive performance Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
- Image Analysis (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Image Processing (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
Description
f()의 화자-종속 최적화는 다수의 방법 중 일부 방법으로 수행될 수 있다. 제 1 전형적인 실시예에서, 제어 프로세서(222)는 다수의 발음(utterance)을 통해 사용자 스피치 및 적응 모델(228) 간의 상관도를 모니터한다. f()의 변화로 인하여 VR 성능이 개선되는 것을 제어 프로세서(222)가 결정할 때, 제어 프로세서(222)는 f()의 파라미터를 수정하고 메모리(227)에 새로운 파라미터를 저장한다. 선택적으로, 제어 프로세서(222)는 VR 성능을 개선하기 위하여 직접적으로 적응 모델(228)을 수정할 수 있다.
Claims (53)
- 음향 패턴 정보를 포함하는 적응 모델;선택된 특징 벡터 수정 함수를 식별하기 위해 음향 특징 벡터들과 상기 음향 패턴 정보의 매칭을 수행하고, 상기 적응 모델보다 큰 중앙 음향 모델을 사용하여 음성 인식 엔진에 의해 프로세싱하기 위한 수정된 음향 특징 벡터들의 세트를 생성하기 위해 상기 선택된 특징 벡터 수정 함수를 상기 음향 특징 벡터들로 적용하도록 구성된 적응 엔진;상기 수정된 음향 특징 벡터들의 매칭 정도를 평가하는 통신 센터로 상기 수정된 음향 특징 벡터들을 전송함으로써 상기 선택된 특징 벡터 수정 함수의 성능을 평가하고, 상기 통신 센터로부터 수신된 상기 평가에 기반하여 상기 선택된 특징 벡터 수정 함수를 조절하는 제어 프로세서; 및상기 수정된 음향 특징 벡터들을 상기 음성 인식 엔진에 전달하기 위한 통신 인터페이스를 포함하는 것을 특징으로 하는 원격국 장치.
- 제 1 항에 있어서,특징 벡터 수정 함수들의 세트에 대응하는 적어도 하나의 파라미터들의 세트를 저장하는 메모리를 더 포함하며, 상기 선택된 특징 벡터 수정 함수는 상기 특징 벡터 수정 함수들의 세트의 멤버(member)인 것을 특징으로 하는 원격국 장치.
- 제 2 항에 있어서,상기 메모리는 특징 벡터 수정 함수들의 세트에 대응하는 하나보다 많은 파라미터들의 세트를 포함하며, 각각의 파라미터들의 세트는 특정한 화자(speaker)에 대응하는 것을 특징으로 하는 원격국 장치.
- 제 2 항에 있어서,상기 메모리는 특징 벡터 수정 함수들의 세트에 대응하는 하나보다 많은 파라미터들의 세트를 포함하며, 상기 각각의 파라미터들의 세트는 상이한 음향 환경에 대응하는 것을 특징으로 하는 원격국 장치.
- 음향 특징 벡터 수정을 이용하는 방법으로서,적응 모델로부터 음향 패턴 정보를 검색하는 단계;적응 엔진을 사용하여, 선택된 특징 벡터 수정 함수를 식별하기 위해 음향 특징 벡터들과 상기 음향 패턴 정보의 패턴 매칭을 수행하는 단계;상기 적응 엔진에 의해, 상기 적응 모델보다 큰 중앙 음향 모델을 사용하여 음성 인식 엔진에 의해 프로세싱하기 위한 수정된 음향 특징 벡터들의 세트를 생성하기 위해 상기 선택된 특징 벡터 수정 함수를 상기 음향 특징 벡터들로 적용하는 단계;상기 수정된 음향 특징 벡터들의 매칭 정도를 평가하는 통신 센터로 상기 수정된 음향 특징 벡터들을 전송함으로써 상기 선택된 특징 벡터 수정 함수의 성능을 평가하고, 상기 통신 센터로부터 수신된 상기 평가에 기반하여 상기 선택된 특징 벡터 수정 함수를 조절하는 단계; 및상기 수정된 음향 특징 벡터들을 상기 음성 인식 엔진에 전달하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 5 항에 있어서,특징 벡터 수정 함수들의 세트에 대응하는 적어도 하나의 파라미터들의 세트를 메모리에 저장하는 단계를 더 포함하며, 상기 선택된 특징 벡터 수정 함수는 상기 특징 벡터 수정 함수들의 세트의 멤버인 것을 특징으로 하는 방법.
- 제 6 항에 있어서,상기 메모리는 특징 벡터 수정 함수들의 세트에 대응하는 하나보다 많은 파라미터들의 세트를 포함하며, 각각의 파라미터들의 세트는 특정한 화자에 대응하는 것을 특징으로 하는 방법.
- 제 6 항에 있어서,상기 메모리는 특징 벡터 수정 함수들의 세트에 대응하는 하나보다 많은 파라미터들의 세트를 포함하며, 상기 각각의 파라미터들의 세트는 상이한 음향 환경에 대응하는 것을 특징으로 하는 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/773,831 | 2001-01-31 | ||
US09/773,831 US7024359B2 (en) | 2001-01-31 | 2001-01-31 | Distributed voice recognition system using acoustic feature vector modification |
PCT/US2002/003014 WO2002065453A2 (en) | 2001-01-31 | 2002-01-30 | Distributed voice recognition system using acoustic feature vector modification |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040062433A KR20040062433A (ko) | 2004-07-07 |
KR100879410B1 true KR100879410B1 (ko) | 2009-01-19 |
Family
ID=25099445
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020037010130A KR100879410B1 (ko) | 2001-01-31 | 2002-01-30 | 음향 특징 벡터 수정을 사용하는 분산형 음성 인식 시스템 |
Country Status (12)
Country | Link |
---|---|
US (1) | US7024359B2 (ko) |
EP (1) | EP1356453B1 (ko) |
JP (2) | JP4567290B2 (ko) |
KR (1) | KR100879410B1 (ko) |
CN (1) | CN1284133C (ko) |
AT (1) | ATE407420T1 (ko) |
AU (1) | AU2002235513A1 (ko) |
BR (1) | BR0206836A (ko) |
DE (1) | DE60228682D1 (ko) |
HK (1) | HK1062738A1 (ko) |
TW (1) | TW546633B (ko) |
WO (1) | WO2002065453A2 (ko) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7236777B2 (en) | 2002-05-16 | 2007-06-26 | Intellisist, Inc. | System and method for dynamically configuring wireless network geographic coverage or service levels |
US7406421B2 (en) * | 2001-10-26 | 2008-07-29 | Intellisist Inc. | Systems and methods for reviewing informational content in a vehicle |
US6885735B2 (en) * | 2001-03-29 | 2005-04-26 | Intellisist, Llc | System and method for transmitting voice input from a remote location over a wireless data channel |
USRE46109E1 (en) | 2001-03-29 | 2016-08-16 | Lg Electronics Inc. | Vehicle navigation system and method |
US20020143611A1 (en) * | 2001-03-29 | 2002-10-03 | Gilad Odinak | Vehicle parking validation system and method |
US8175886B2 (en) | 2001-03-29 | 2012-05-08 | Intellisist, Inc. | Determination of signal-processing approach based on signal destination characteristics |
US20050065779A1 (en) * | 2001-03-29 | 2005-03-24 | Gilad Odinak | Comprehensive multiple feature telematics system |
US6487494B2 (en) * | 2001-03-29 | 2002-11-26 | Wingcast, Llc | System and method for reducing the amount of repetitive data sent by a server to a client for vehicle navigation |
US7392191B2 (en) * | 2001-03-29 | 2008-06-24 | Intellisist, Inc. | Method and device to distinguish between voice conversation and automated speech recognition |
CN1409527A (zh) * | 2001-09-13 | 2003-04-09 | 松下电器产业株式会社 | 终端器、服务器及语音辨识方法 |
GB2391679B (en) * | 2002-02-04 | 2004-03-24 | Zentian Ltd | Speech recognition circuit using parallel processors |
US8249880B2 (en) * | 2002-02-14 | 2012-08-21 | Intellisist, Inc. | Real-time display of system instructions |
US7330538B2 (en) | 2002-03-28 | 2008-02-12 | Gotvoice, Inc. | Closed-loop command and response system for automatic communications between interacting computer systems over an audio communications channel |
US8239197B2 (en) | 2002-03-28 | 2012-08-07 | Intellisist, Inc. | Efficient conversion of voice messages into text |
TW567465B (en) * | 2002-09-02 | 2003-12-21 | Ind Tech Res Inst | Configurable distributed speech recognition system |
GB0226648D0 (en) * | 2002-11-15 | 2002-12-24 | Koninkl Philips Electronics Nv | Usage data harvesting |
US7533023B2 (en) * | 2003-02-12 | 2009-05-12 | Panasonic Corporation | Intermediary speech processor in network environments transforming customized speech parameters |
DE10353068A1 (de) * | 2003-11-13 | 2005-06-23 | Voice Trust Ag | Verfahren zur Authentifizierung eines Benutzers anhand dessen Stimmprofils |
US20050216266A1 (en) * | 2004-03-29 | 2005-09-29 | Yifan Gong | Incremental adjustment of state-dependent bias parameters for adaptive speech recognition |
US7720012B1 (en) | 2004-07-09 | 2010-05-18 | Arrowhead Center, Inc. | Speaker identification in the presence of packet losses |
GB2418764B (en) * | 2004-09-30 | 2008-04-09 | Fluency Voice Technology Ltd | Improving pattern recognition accuracy with distortions |
US20060095261A1 (en) * | 2004-10-30 | 2006-05-04 | Ibm Corporation | Voice packet identification based on celp compression parameters |
CN1811911B (zh) * | 2005-01-28 | 2010-06-23 | 北京捷通华声语音技术有限公司 | 自适应的语音变换处理方法 |
JP4527679B2 (ja) | 2006-03-24 | 2010-08-18 | 学校法人早稲田大学 | 音声の類似度の評価を行う方法および装置 |
US7725316B2 (en) * | 2006-07-05 | 2010-05-25 | General Motors Llc | Applying speech recognition adaptation in an automated speech recognition system of a telematics-equipped vehicle |
JP4427530B2 (ja) * | 2006-09-21 | 2010-03-10 | 株式会社東芝 | 音声認識装置、プログラムおよび音声認識方法 |
WO2008137616A1 (en) * | 2007-05-04 | 2008-11-13 | Nuance Communications, Inc. | Multi-class constrained maximum likelihood linear regression |
US20090018826A1 (en) * | 2007-07-13 | 2009-01-15 | Berlin Andrew A | Methods, Systems and Devices for Speech Transduction |
US8352265B1 (en) | 2007-12-24 | 2013-01-08 | Edward Lin | Hardware implemented backend search engine for a high-rate speech recognition system |
US8639510B1 (en) | 2007-12-24 | 2014-01-28 | Kai Yu | Acoustic scoring unit implemented on a single FPGA or ASIC |
US8463610B1 (en) | 2008-01-18 | 2013-06-11 | Patrick J. Bourke | Hardware-implemented scalable modular engine for low-power speech recognition |
KR101217525B1 (ko) * | 2008-12-22 | 2013-01-18 | 한국전자통신연구원 | 비터비 디코더와 이를 이용한 음성 인식 방법 |
US9418662B2 (en) * | 2009-01-21 | 2016-08-16 | Nokia Technologies Oy | Method, apparatus and computer program product for providing compound models for speech recognition adaptation |
US8189925B2 (en) * | 2009-06-04 | 2012-05-29 | Microsoft Corporation | Geocoding by image matching |
US8554562B2 (en) * | 2009-11-15 | 2013-10-08 | Nuance Communications, Inc. | Method and system for speaker diarization |
CA2856496A1 (en) * | 2010-11-22 | 2012-05-31 | Listening Methods, Llc | System and method for pattern recognition and analysis |
US10229701B2 (en) | 2013-02-28 | 2019-03-12 | Nuance Communications, Inc. | Server-side ASR adaptation to speaker, device and noise condition via non-ASR audio transmission |
WO2014133525A1 (en) * | 2013-02-28 | 2014-09-04 | Nuance Communication, Inc. | Server-side asr adaptation to speaker, device and noise condition via non-asr audio transmission |
US9282096B2 (en) | 2013-08-31 | 2016-03-08 | Steven Goldstein | Methods and systems for voice authentication service leveraging networking |
US10405163B2 (en) | 2013-10-06 | 2019-09-03 | Staton Techiya, Llc | Methods and systems for establishing and maintaining presence information of neighboring bluetooth devices |
US20170092278A1 (en) * | 2015-09-30 | 2017-03-30 | Apple Inc. | Speaker recognition |
IL263655B2 (en) * | 2016-06-14 | 2023-03-01 | Netzer Omry | Automatic speech recognition |
CN106782504B (zh) * | 2016-12-29 | 2019-01-22 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
EP3719679B1 (en) * | 2019-04-03 | 2021-06-09 | Fondation de L'institut de Recherche Idiap | A method for protecting biometric templates, and a system and method for verifying a speaker´s identity |
US11545132B2 (en) | 2019-08-28 | 2023-01-03 | International Business Machines Corporation | Speech characterization using a synthesized reference audio signal |
CN113261056A (zh) * | 2019-12-04 | 2021-08-13 | 谷歌有限责任公司 | 使用说话者相关语音模型的说话者感知 |
CN113345428B (zh) * | 2021-06-04 | 2023-08-04 | 北京华捷艾米科技有限公司 | 语音识别模型的匹配方法、装置、设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06214569A (ja) * | 1993-01-18 | 1994-08-05 | Yamaha Corp | 電子楽器の鍵盤装置 |
EP0779609A2 (en) * | 1995-12-13 | 1997-06-18 | Nec Corporation | Speech adaptation system and speech recognizer |
US6070139A (en) | 1995-08-21 | 2000-05-30 | Seiko Epson Corporation | Bifurcated speaker specific and non-speaker specific speech recognition method and apparatus |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4926488A (en) * | 1987-07-09 | 1990-05-15 | International Business Machines Corporation | Normalization of speech by adaptive labelling |
JP2980382B2 (ja) * | 1990-12-19 | 1999-11-22 | 富士通株式会社 | 話者適応音声認識方法および装置 |
JPH06214596A (ja) * | 1993-01-14 | 1994-08-05 | Ricoh Co Ltd | 音声認識装置および話者適応化方法 |
ZA948426B (en) | 1993-12-22 | 1995-06-30 | Qualcomm Inc | Distributed voice recognition system |
JPH07210190A (ja) | 1993-12-30 | 1995-08-11 | Internatl Business Mach Corp <Ibm> | 音声認識方法及びシステム |
US5864810A (en) * | 1995-01-20 | 1999-01-26 | Sri International | Method and apparatus for speech recognition adapted to an individual speaker |
DE69822296T2 (de) | 1997-10-20 | 2005-02-24 | Koninklijke Philips Electronics N.V. | Mustererkennungsregistrierung in einem verteilten system |
JP2000276188A (ja) * | 1999-03-24 | 2000-10-06 | Sony Corp | 音声認識装置、音声認識方法、音声認識用制御プログラムを記録した記録媒体、通信端末装置、通信方法、音声認識通信の制御用プログラムを記録した記録媒体、サーバ装置、音声認識用データの送受信方法及び音声認識用データの送受信制御プログラムを記録した記録媒体 |
JP3456444B2 (ja) * | 1999-05-10 | 2003-10-14 | 日本電気株式会社 | 音声判定装置及び方法並びに記録媒体 |
US6421641B1 (en) * | 1999-11-12 | 2002-07-16 | International Business Machines Corporation | Methods and apparatus for fast adaptation of a band-quantized speech decoding system |
-
2001
- 2001-01-31 US US09/773,831 patent/US7024359B2/en not_active Expired - Lifetime
-
2002
- 2002-01-30 WO PCT/US2002/003014 patent/WO2002065453A2/en active Application Filing
- 2002-01-30 AT AT02702130T patent/ATE407420T1/de not_active IP Right Cessation
- 2002-01-30 BR BR0206836-2A patent/BR0206836A/pt unknown
- 2002-01-30 KR KR1020037010130A patent/KR100879410B1/ko active IP Right Grant
- 2002-01-30 CN CNB028060687A patent/CN1284133C/zh not_active Expired - Lifetime
- 2002-01-30 JP JP2002565298A patent/JP4567290B2/ja not_active Expired - Lifetime
- 2002-01-30 TW TW091101575A patent/TW546633B/zh not_active IP Right Cessation
- 2002-01-30 AU AU2002235513A patent/AU2002235513A1/en not_active Abandoned
- 2002-01-30 DE DE60228682T patent/DE60228682D1/de not_active Expired - Lifetime
- 2002-01-30 EP EP02702130A patent/EP1356453B1/en not_active Expired - Lifetime
-
2004
- 2004-07-28 HK HK04105572A patent/HK1062738A1/xx not_active IP Right Cessation
-
2009
- 2009-01-14 JP JP2009006033A patent/JP4976432B2/ja not_active Expired - Lifetime
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06214569A (ja) * | 1993-01-18 | 1994-08-05 | Yamaha Corp | 電子楽器の鍵盤装置 |
US6070139A (en) | 1995-08-21 | 2000-05-30 | Seiko Epson Corporation | Bifurcated speaker specific and non-speaker specific speech recognition method and apparatus |
EP0779609A2 (en) * | 1995-12-13 | 1997-06-18 | Nec Corporation | Speech adaptation system and speech recognizer |
Also Published As
Publication number | Publication date |
---|---|
HK1062738A1 (en) | 2004-11-19 |
TW546633B (en) | 2003-08-11 |
JP4567290B2 (ja) | 2010-10-20 |
KR20040062433A (ko) | 2004-07-07 |
CN1284133C (zh) | 2006-11-08 |
EP1356453B1 (en) | 2008-09-03 |
CN1494712A (zh) | 2004-05-05 |
AU2002235513A1 (en) | 2002-08-28 |
BR0206836A (pt) | 2006-01-17 |
EP1356453A2 (en) | 2003-10-29 |
US20020103639A1 (en) | 2002-08-01 |
US7024359B2 (en) | 2006-04-04 |
WO2002065453A2 (en) | 2002-08-22 |
JP4976432B2 (ja) | 2012-07-18 |
JP2009151318A (ja) | 2009-07-09 |
JP2004536330A (ja) | 2004-12-02 |
ATE407420T1 (de) | 2008-09-15 |
DE60228682D1 (de) | 2008-10-16 |
WO2002065453A3 (en) | 2002-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100879410B1 (ko) | 음향 특징 벡터 수정을 사용하는 분산형 음성 인식 시스템 | |
KR100933107B1 (ko) | 함축적인 화자 적응을 사용하는 음성 인식 시스템 | |
US6959276B2 (en) | Including the category of environmental noise when processing speech signals | |
TW580690B (en) | System and method for voice recognition in a distributed voice recognition system | |
KR19990043998A (ko) | 패턴인식시스템 | |
JP2001356792A (ja) | 自動音声認識実行方法および装置 | |
Vlaj et al. | A computationally efficient mel-filter bank VAD algorithm for distributed speech recognition systems | |
Ajgou et al. | Novel detection algorithm of speech activity and the impact of speech codecs on remote speaker recognition system | |
US6044147A (en) | Telecommunications system | |
EP0883959B1 (en) | Apparatus and method of improving the qulality of speech signals transmitted over a telecommunications system | |
Ajgou et al. | Effects of speech codecs on a remote speaker recognition system using a new SAD | |
Ibrahim | Distributed Speech Recognition over IP Recognition over IP Networks using Java | |
Yoon et al. | Efficient distribution of feature parameters for speech recognition in network environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121227 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20131227 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20141230 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20151230 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20161229 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20181227 Year of fee payment: 11 |