KR960701428A - 화자 인식을 위한 방법 및 장치(a method and apparatus for speaker recognition) - Google Patents

화자 인식을 위한 방법 및 장치(a method and apparatus for speaker recognition) Download PDF

Info

Publication number
KR960701428A
KR960701428A KR1019950704080A KR19950704080A KR960701428A KR 960701428 A KR960701428 A KR 960701428A KR 1019950704080 A KR1019950704080 A KR 1019950704080A KR 19950704080 A KR19950704080 A KR 19950704080A KR 960701428 A KR960701428 A KR 960701428A
Authority
KR
South Korea
Prior art keywords
term average
speaker
long term
long
frequency band
Prior art date
Application number
KR1019950704080A
Other languages
English (en)
Other versions
KR100312919B1 (ko
Inventor
폴로스키 마크
고든 탕 요셉
Original Assignee
사이먼 크리스토퍼 로버츠
브리티쉬 텔리커뮤니케이션즈 퍼블릭 리미티드 캄퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 사이먼 크리스토퍼 로버츠, 브리티쉬 텔리커뮤니케이션즈 퍼블릭 리미티드 캄퍼니 filed Critical 사이먼 크리스토퍼 로버츠
Priority claimed from PCT/GB1994/000629 external-priority patent/WO1994022132A1/en
Publication of KR960701428A publication Critical patent/KR960701428A/ko
Application granted granted Critical
Publication of KR100312919B1 publication Critical patent/KR100312919B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Abstract

본 발명은 화자 인식을 위한 장치에 관한 것으로서, 음성 신호에 응답하여 주파수 대역에 단기간의 스펙트럴 진폭을 지시하는 게수를 각각 포함하는 일련의 계수 세트를 포함하는 기능 데이타를 발생하는 수단, 상기 기능 데이타를 지정된 화자 기준 데이타와 비교하는 수단, 상기 비교에 따라 대응하는 화자의 인식을 지시하는 수단, 상기 계수중 하나 이상의 장기간 평균 스펙트럴 크기를 도출하는 수단 및 상기 장기간 평균에 의해 하나 이상의 계수를 정규화하는 수단을 포함하고, 상기 주파수 대역이 주파수축을 따라 불균등하게 분포되어 있는 것을 특징으로 한다.

Description

화자 인식을 위한 방법 및 장치(A METHOD AND APPARATUS FOR SPEAKER FECOGNITION)
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 통신 환경에서 본 발명에 따른 인식 처리기의 이용에 대한 개략도; 제2도는 본 발명의 실시예에 따른 인식 처리기의 기능 요소를 개략적으로 보여주는 블럭도; 제3도는 제2도의 일부분인 MFCC 발생기의 발생을 개략적으로 보여주는 흐름도.

Claims (23)

  1. 지정 주파수 대역에서 음성 신호 크기와 각각 관련된 복수개의 계수를 포함하는 인식 기능 데이타를 입력 음성 신호로부터 도출하는 단계; 상기 기능 데이타와 지정 화자 기준 데이타를 비교하는 단계; 및 그 비교에 따라 종속적으로 화자의 인식을 지시하는 단게를 포함한 화자 인식 방법에 있어서, 상기 주파수 대역이 주파수 측을 따라 불균등하게 분포되어 있고, 상기 계수를 발생하는 단계가 장기간의 평균 스페트럴 크기를 도출 하는 단계; 및 상기 장기간 크기의 효과가 감소되는 정규화된 계수를 발생하도록 상기 계수중 하나 이상을 처리하는 단계를 포함하는 것을 특징으로 하는 화자 인식 방법.
  2. 제1항에 있어서, 상기 주파수 대역이 멜 주파수 범위에 분포된 것을 특징으로 하는 화자 인식 방법.
  3. 제1항에 있어서, 상기 주파수 대역이 지정 한계 주파수 이하에서 선형으로 분포되고, 상기 한계 주파수 이상에서는 대수적으로 분포된 것을 특징으로 하는 화자 인식 방법.
  4. 제1항 내지 제3항중 어느 한 항에 있어서, 상기 계수를 발생하는 단계가 상기 크기의 대수를 발생하는 단계, 장기간의 대수 평균값을 발생하는 단계 및 대수 크기에서 대수 장기간 평균을 감산하는 단계를 포함하는 것을 특징으로 화자 인식 방법.
  5. 제1항 내지 제4항중 어느 한 항에 있어서, 상기 비교가 기능 데이타를 기준 데이타와 시간적으로 정렬하기 위한 것임을 특징으로 하는 화자 인식 방법.
  6. 제5항에 있어서, 상기 비교가 DWT 과정을 이용하는 것을 특징으로 하는 화자 인식 방법.
  7. 제1항 내지 제6항중 어느 한 항에 있어서, 상기 입력 음성 신호내의 음성 시작점과 음성 끝점을 인식하는 단계 및 상기 시작점과 끝점 사이의 기간에 걸쳐 상기 장기간의 평균을 도출하는 단계를 더 포함하는 화자 인식 방법.
  8. 제1항 내지 제7항중 어느 한 항에 있어서, 상기 장기간 평균(avergae)이 장기간 평균치(mean)를 포함하는 것을 특징으로 하는 화자 인식 방법.
  9. 제1항 내지 제7항중 어느 한 항에 있어서, 상기 장기간 평균이 주기적으로 갱신되는 이동 평균을 포함하는 것을 특징으로 하는 화자 인식 방법.
  10. 제1항 내지 제9항중 어느 한 항에 있어서, 워드를 연속으로 입력하는 단계 및 상기 워드 전부에 대하여 상기 장기간 평균을 구하는 단게를 포함하는 화자 인식 방법.
  11. 음성 신호에 응답하여, 복수개의 주파수 대역에서 단기간의 스펙트럴 크기를 지시하는 복수개의 계수를 포함하는 일련의 계수 세트로 구성된 복수개의 기능 데이타를 발생하는 수단; 및 지정 화자 기준 데이타를 지정 화자 기준 데이타와 비교하고, 상기 비교에 따라 대응하는 화자의 인식을 지시하는 수단을 구비한 화자 인식 장치에 있어서, 상기 계수중 하나 이상의 장기간 평균 스펙트럴 크기를 도출하는 수단; 및 산기 장기간 평균에 의해 하나 이상의 계수를 정규화하는 수단을 포함하고, 상기 주파수 대역이 주파수측을 따라 불균등하게 분포되어 있는 것을 특징으로 하는 화자 인식 장치.
  12. 제11항에 있어서, 상기 주파수 대역이 멜 주파수 범위에 분포되어 있는 것을 특징으로 하는 화자 인식 장치.
  13. 제11항에 있어서, 상기 주파수 대역이 지정 한계 주파수 이하에서 선형으로 분포되어 있고, 상기 한계 주파수 이상에서 대수적으로 분포되어 있는 것을 특징으로 하는 화자 인식 장치.
  14. 제11항 내지 제13항중 어느 한 항에 있어서, 상기 계수를 발생하는 수단이 상기 크기의 대수를 발생하고, 대수장기간 평균값을 발생하고, 그리고 대수 계수 크기로부터 대수 장기간 평균을 감산할 수 있도록 구성되는 것을 특징으로 하는 화자 인식 장치.
  15. 제11항 내지 제14항중 어느 한 항에 있어서, 상기 비교수단이 기능 데이타를 기준 데이타와 시간적으로 정렬하도록 구성되는 것을 특징으로 하는 화자 인식 장치.
  16. 제15항에 있어서, 상기 비교 수단이 DTW 과정을 이용하는 것을 특징으로 하는 화자 인식 장치.
  17. 제11항 내지 제16항중 어느 한 항에 있어서, 상기 음성 신호내의 시작점과 끝점을 인식하는 수단을 더 포함하고, 상기 정규화 수단이 구술 내용의 상기 시작점과 끝점 사이의 기간 동안 상기 장기간 평균을 도출하도록 구성되는 것을 특징으로 하는 화자 인식 장치.
  18. 제11항 내지 제17항중 어느 한 항에 있어서, 상기 장기간 평균이 장기간 평균치를 포함하는 것을 특징으로 하는 화자 인식 장치.
  19. 제11항 내지 제17항중 어느 한 항에 있어서, 상기 장기간 평균이 주기적으로 갱신되는 이동 평균을 포함하는 것을 특징으로 하는 화자 인식 장치.
  20. 제11항 내지 제19항중 어느 한 항에 있어서, 연속하는 워드를 입력하기 위해 구성되고, 상기 정규화 수단이 상기 워드 전부에 대해 상기 장기간 평균을 구할 수 있도록 구성되는 것을 특징으로 하는 화자 인식 장치.
  21. 제11항 내지 제20항중 어느 한 항에 있어서, 전화 네트워크에 연결되도록 채택된 것을 특징으로 하는 화자 인식 장치.
  22. 제21항에 따른 장치를 포함하는 전화 네트워크.
  23. 음성 신호의 대응하는 주파수 대역에서, 단기간의 진포에 각각 관련되 신호를 포함하는 인식 데이타를 도출하는 수단; 및 그 인식 데이타에 따라 종속적으로 인식 처리를 실행하는 수단을 포함하는 음성신호 인식 장치에 있어서, 상기 주파수 대역에 이동 장기간 평균 스펙트럴 진폭을 주기적으로 발생하거나 갱신하는 수단; 및 고정된 스펙트럴 엔벨로프 성분에 대한 의존성을 줄이기 위해 상기 장기간 평균을 사용하여 상기 기능 데이타를 처리하는 단게를 포함하는 신호의 신식 처리를 위한 장치.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019950704080A 1993-03-25 1994-03-25 화자인식을위한방법및장치 KR100312919B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP93302302.0 1993-03-25
EP93302302 1993-03-25
PCT/GB1994/000629 WO1994022132A1 (en) 1993-03-25 1994-03-25 A method and apparatus for speaker recognition

Publications (2)

Publication Number Publication Date
KR960701428A true KR960701428A (ko) 1996-02-24
KR100312919B1 KR100312919B1 (ko) 2001-12-28

Family

ID=8214353

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950704080A KR100312919B1 (ko) 1993-03-25 1994-03-25 화자인식을위한방법및장치

Country Status (9)

Country Link
US (1) US5583961A (ko)
EP (1) EP0691024B1 (ko)
JP (1) JPH08508107A (ko)
KR (1) KR100312919B1 (ko)
AU (1) AU685788B2 (ko)
CA (1) CA2158847C (ko)
DE (1) DE69420400T2 (ko)
FI (1) FI954527A (ko)
SG (2) SG50502A1 (ko)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU6433094A (en) * 1993-03-25 1994-10-11 British Telecommunications Public Limited Company Speech recognition with pause detection
DE69421077T2 (de) * 1993-03-31 2000-07-06 British Telecomm Wortkettenerkennung
US6230128B1 (en) 1993-03-31 2001-05-08 British Telecommunications Public Limited Company Path link passing speech recognition with vocabulary node being capable of simultaneously processing plural path links
US5749073A (en) * 1996-03-15 1998-05-05 Interval Research Corporation System for automatically morphing audio information
US5960399A (en) * 1996-12-24 1999-09-28 Gte Internetworking Incorporated Client/server speech processor/recognizer
JP3962445B2 (ja) * 1997-03-13 2007-08-22 キヤノン株式会社 音声処理方法及び装置
US6003000A (en) * 1997-04-29 1999-12-14 Meta-C Corporation Method and system for speech processing with greatly reduced harmonic and intermodulation distortion
US6633842B1 (en) * 1999-10-22 2003-10-14 Texas Instruments Incorporated Speech recognition front-end feature extraction for noisy speech
FR2786308B1 (fr) * 1998-11-20 2001-02-09 Sextant Avionique Procede de reconnaissance vocale dans un signal acoustique bruite et systeme mettant en oeuvre ce procede
US7117149B1 (en) 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
GB2357231B (en) 1999-10-01 2004-06-09 Ibm Method and system for encoding and decoding speech signals
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7043430B1 (en) 1999-11-23 2006-05-09 Infotalk Corporation Limitied System and method for speech recognition using tonal modeling
WO2001039179A1 (en) * 1999-11-23 2001-05-31 Infotalk Corporation Limited System and method for speech recognition using tonal modeling
DE10012145C2 (de) * 2000-03-13 2002-02-21 Christian Popella Verfahren und Vorrichtung zur akustischen Erkennung erkrankungsbedingter physikalischer Veränderungen des Stimmbildapparates
TW521266B (en) * 2000-07-13 2003-02-21 Verbaltek Inc Perceptual phonetic feature speech recognition system and method
FR2825826B1 (fr) * 2001-06-11 2003-09-12 Cit Alcatel Procede pour detecter l'activite vocale dans un signal, et codeur de signal vocal comportant un dispositif pour la mise en oeuvre de ce procede
US6678656B2 (en) * 2002-01-30 2004-01-13 Motorola, Inc. Noise reduced speech recognition parameters
DE10254612A1 (de) * 2002-11-22 2004-06-17 Humboldt-Universität Zu Berlin Verfahren zur Ermittlung spezifisch relevanter akustischer Merkmale von Schallsignalen für die Analyse unbekannter Schallsignale einer Schallerzeugung
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7885420B2 (en) 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7725315B2 (en) 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US8073689B2 (en) 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7340398B2 (en) * 2003-08-21 2008-03-04 Hewlett-Packard Development Company, L.P. Selective sampling for sound signal classification
DE10361850A1 (de) * 2003-12-31 2005-07-28 Kress, Markus Verfahren zur Identifizierung von Personen
US8724447B2 (en) * 2004-01-28 2014-05-13 Qualcomm Incorporated Timing estimation in an OFDM receiver
JP2005308512A (ja) * 2004-04-21 2005-11-04 Agilent Technol Inc スペクトラム処理方法および該方法を用いる測定装置
FI20045146A0 (fi) * 2004-04-22 2004-04-22 Nokia Corp Audioaktiivisuuden ilmaisu
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US7949520B2 (en) 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8543390B2 (en) 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US8170879B2 (en) 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US7716046B2 (en) 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US8306821B2 (en) 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US8284947B2 (en) 2004-12-01 2012-10-09 Qnx Software Systems Limited Reverberation estimation and suppression system
US7702505B2 (en) * 2004-12-14 2010-04-20 Electronics And Telecommunications Research Institute Channel normalization apparatus and method for robust speech recognition
GB2421317B (en) * 2004-12-15 2009-02-11 Agilent Technologies Inc A method and apparatus for detecting leading pulse edges
GB2422237A (en) * 2004-12-21 2006-07-19 Fluency Voice Technology Ltd Dynamic coefficients determined from temporally adjacent speech frames
US8027833B2 (en) 2005-05-09 2011-09-27 Qnx Software Systems Co. System for suppressing passing tire hiss
US8170875B2 (en) 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US8311819B2 (en) 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
JP4527679B2 (ja) * 2006-03-24 2010-08-18 学校法人早稲田大学 音声の類似度の評価を行う方法および装置
US7844453B2 (en) 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
US9830912B2 (en) 2006-11-30 2017-11-28 Ashwin P Rao Speak and touch auto correction interface
EP2096630A4 (en) * 2006-12-08 2012-03-14 Nec Corp AUDIO RECOGNITION DEVICE AND AUDIO RECOGNITION METHOD
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8335685B2 (en) 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
JP4305509B2 (ja) * 2006-12-26 2009-07-29 ヤマハ株式会社 音声処理装置およびプログラム
US20080256613A1 (en) * 2007-03-13 2008-10-16 Grover Noel J Voice print identification portal
JP5183741B2 (ja) 2007-08-27 2013-04-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充と帯域拡張との間の遷移周波数の適合
US8904400B2 (en) 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
TWI356399B (en) * 2007-12-14 2012-01-11 Ind Tech Res Inst Speech recognition system and method with cepstral
JP2009157442A (ja) * 2007-12-25 2009-07-16 Toshiba Corp データ検索装置および方法
US8209514B2 (en) 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
US9922640B2 (en) 2008-10-17 2018-03-20 Ashwin P Rao System and method for multimodal utterance detection
US8645131B2 (en) * 2008-10-17 2014-02-04 Ashwin P. Rao Detecting segments of speech from an audio stream
GB2465782B (en) * 2008-11-28 2016-04-13 Univ Nottingham Trent Biometric identity verification
US10257191B2 (en) 2008-11-28 2019-04-09 Nottingham Trent University Biometric identity verification
US9767806B2 (en) * 2013-09-24 2017-09-19 Cirrus Logic International Semiconductor Ltd. Anti-spoofing
JP5535198B2 (ja) * 2009-04-02 2014-07-02 三菱電機株式会社 雑音抑圧装置
US8595005B2 (en) * 2010-05-31 2013-11-26 Simple Emotion, Inc. System and method for recognizing emotional state from a speech signal
US20140095161A1 (en) * 2012-09-28 2014-04-03 At&T Intellectual Property I, L.P. System and method for channel equalization using characteristics of an unknown signal
JP2017508188A (ja) 2014-01-28 2017-03-23 シンプル エモーション, インコーポレイテッドSimple Emotion, Inc. 適応型音声対話のための方法
US11853884B2 (en) 2017-02-10 2023-12-26 Synaptics Incorporated Many or one detection classification systems and methods
US11100932B2 (en) * 2017-02-10 2021-08-24 Synaptics Incorporated Robust start-end point detection algorithm using neural network
CN107527620B (zh) * 2017-07-25 2019-03-26 平安科技(深圳)有限公司 电子装置、身份验证的方法及计算机可读存储介质
US10540990B2 (en) * 2017-11-01 2020-01-21 International Business Machines Corporation Processing of speech signals
WO2020046831A1 (en) * 2018-08-27 2020-03-05 TalkMeUp Interactive artificial intelligence analytical system
US11205419B2 (en) * 2018-08-28 2021-12-21 International Business Machines Corporation Low energy deep-learning networks for generating auditory features for audio processing pipelines
JP7383122B2 (ja) * 2019-07-30 2023-11-17 ドルビー ラボラトリーズ ライセンシング コーポレイション 信号認識または修正のために音声データから抽出した特徴を正規化するための方法および装置
CN112820300B (zh) * 2021-02-25 2023-12-19 北京小米松果电子有限公司 音频处理方法及装置、终端、存储介质
CN112951245B (zh) * 2021-03-09 2023-06-16 江苏开放大学(江苏城市职业学院) 一种融入静态分量的动态声纹特征提取方法
CN113488070B (zh) * 2021-09-08 2021-11-16 中国科学院自动化研究所 篡改音频的检测方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4829578A (en) * 1986-10-02 1989-05-09 Dragon Systems, Inc. Speech detection and recognition apparatus for use with background noise of varying levels

Also Published As

Publication number Publication date
AU6432994A (en) 1994-10-11
KR100312919B1 (ko) 2001-12-28
JPH08508107A (ja) 1996-08-27
EP0691024B1 (en) 1999-09-01
SG50487A1 (en) 1998-07-20
US5583961A (en) 1996-12-10
SG50502A1 (en) 1998-07-20
DE69420400T2 (de) 2000-07-13
FI954527A0 (fi) 1995-09-25
AU685788B2 (en) 1998-01-29
DE69420400D1 (de) 1999-10-07
CA2158847A1 (en) 1994-09-29
CA2158847C (en) 2000-03-14
FI954527A (fi) 1995-11-20
EP0691024A1 (en) 1996-01-10

Similar Documents

Publication Publication Date Title
KR960701428A (ko) 화자 인식을 위한 방법 및 장치(a method and apparatus for speaker recognition)
EP0950239B1 (en) Method and recognizer for recognizing a sampled sound signal in noise
US6098040A (en) Method and apparatus for providing an improved feature set in speech recognition by performing noise cancellation and background masking
US9009047B2 (en) Specific call detecting device and specific call detecting method
US20220215853A1 (en) Audio signal processing method, model training method, and related apparatus
US20050143997A1 (en) Method and apparatus using spectral addition for speaker recognition
KR100316077B1 (ko) 분산형음성인식시스템
US4720802A (en) Noise compensation arrangement
US20030115054A1 (en) Data-driven filtering of cepstral time trajectories for robust speech recognition
US20200372925A1 (en) Method and device of denoising voice signal
KR950015199A (ko) 음성 인식 방법 및 장치
FR2274101B1 (ko)
CN108108357B (zh) 口音转换方法及装置、电子设备
PT89978A (pt) Aparelho detector da actividade vocal e aparelho telefonico movel que o contem
Barua et al. Neural network based recognition of speech using MFCC features
US7917359B2 (en) Noise suppressor for removing irregular noise
US20100082338A1 (en) Voice processing apparatus and voice processing method
CN112017639B (zh) 语音信号的检测方法、终端设备及存储介质
CN102723081A (zh) 语音信号处理方法、语音和声纹识别方法及其装置
JPH02298998A (ja) 音声認識装置とその方法
CN116312561A (zh) 一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置
Yu et al. Text-Dependent Speech Enhancement for Small-Footprint Robust Keyword Detection.
US5001761A (en) Device for normalizing a speech spectrum
JP2863214B2 (ja) 雑音除去装置及び該装置を用いた音声認識装置
Marković et al. Recognition of Whispered Speech Based on PLP Features and DTW Algorithm

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080922

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee