KR960701428A - 화자 인식을 위한 방법 및 장치(a method and apparatus for speaker recognition) - Google Patents
화자 인식을 위한 방법 및 장치(a method and apparatus for speaker recognition) Download PDFInfo
- Publication number
- KR960701428A KR960701428A KR1019950704080A KR19950704080A KR960701428A KR 960701428 A KR960701428 A KR 960701428A KR 1019950704080 A KR1019950704080 A KR 1019950704080A KR 19950704080 A KR19950704080 A KR 19950704080A KR 960701428 A KR960701428 A KR 960701428A
- Authority
- KR
- South Korea
- Prior art keywords
- term average
- speaker
- long term
- long
- frequency band
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
Abstract
본 발명은 화자 인식을 위한 장치에 관한 것으로서, 음성 신호에 응답하여 주파수 대역에 단기간의 스펙트럴 진폭을 지시하는 게수를 각각 포함하는 일련의 계수 세트를 포함하는 기능 데이타를 발생하는 수단, 상기 기능 데이타를 지정된 화자 기준 데이타와 비교하는 수단, 상기 비교에 따라 대응하는 화자의 인식을 지시하는 수단, 상기 계수중 하나 이상의 장기간 평균 스펙트럴 크기를 도출하는 수단 및 상기 장기간 평균에 의해 하나 이상의 계수를 정규화하는 수단을 포함하고, 상기 주파수 대역이 주파수축을 따라 불균등하게 분포되어 있는 것을 특징으로 한다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 통신 환경에서 본 발명에 따른 인식 처리기의 이용에 대한 개략도; 제2도는 본 발명의 실시예에 따른 인식 처리기의 기능 요소를 개략적으로 보여주는 블럭도; 제3도는 제2도의 일부분인 MFCC 발생기의 발생을 개략적으로 보여주는 흐름도.
Claims (23)
- 지정 주파수 대역에서 음성 신호 크기와 각각 관련된 복수개의 계수를 포함하는 인식 기능 데이타를 입력 음성 신호로부터 도출하는 단계; 상기 기능 데이타와 지정 화자 기준 데이타를 비교하는 단계; 및 그 비교에 따라 종속적으로 화자의 인식을 지시하는 단게를 포함한 화자 인식 방법에 있어서, 상기 주파수 대역이 주파수 측을 따라 불균등하게 분포되어 있고, 상기 계수를 발생하는 단계가 장기간의 평균 스페트럴 크기를 도출 하는 단계; 및 상기 장기간 크기의 효과가 감소되는 정규화된 계수를 발생하도록 상기 계수중 하나 이상을 처리하는 단계를 포함하는 것을 특징으로 하는 화자 인식 방법.
- 제1항에 있어서, 상기 주파수 대역이 멜 주파수 범위에 분포된 것을 특징으로 하는 화자 인식 방법.
- 제1항에 있어서, 상기 주파수 대역이 지정 한계 주파수 이하에서 선형으로 분포되고, 상기 한계 주파수 이상에서는 대수적으로 분포된 것을 특징으로 하는 화자 인식 방법.
- 제1항 내지 제3항중 어느 한 항에 있어서, 상기 계수를 발생하는 단계가 상기 크기의 대수를 발생하는 단계, 장기간의 대수 평균값을 발생하는 단계 및 대수 크기에서 대수 장기간 평균을 감산하는 단계를 포함하는 것을 특징으로 화자 인식 방법.
- 제1항 내지 제4항중 어느 한 항에 있어서, 상기 비교가 기능 데이타를 기준 데이타와 시간적으로 정렬하기 위한 것임을 특징으로 하는 화자 인식 방법.
- 제5항에 있어서, 상기 비교가 DWT 과정을 이용하는 것을 특징으로 하는 화자 인식 방법.
- 제1항 내지 제6항중 어느 한 항에 있어서, 상기 입력 음성 신호내의 음성 시작점과 음성 끝점을 인식하는 단계 및 상기 시작점과 끝점 사이의 기간에 걸쳐 상기 장기간의 평균을 도출하는 단계를 더 포함하는 화자 인식 방법.
- 제1항 내지 제7항중 어느 한 항에 있어서, 상기 장기간 평균(avergae)이 장기간 평균치(mean)를 포함하는 것을 특징으로 하는 화자 인식 방법.
- 제1항 내지 제7항중 어느 한 항에 있어서, 상기 장기간 평균이 주기적으로 갱신되는 이동 평균을 포함하는 것을 특징으로 하는 화자 인식 방법.
- 제1항 내지 제9항중 어느 한 항에 있어서, 워드를 연속으로 입력하는 단계 및 상기 워드 전부에 대하여 상기 장기간 평균을 구하는 단게를 포함하는 화자 인식 방법.
- 음성 신호에 응답하여, 복수개의 주파수 대역에서 단기간의 스펙트럴 크기를 지시하는 복수개의 계수를 포함하는 일련의 계수 세트로 구성된 복수개의 기능 데이타를 발생하는 수단; 및 지정 화자 기준 데이타를 지정 화자 기준 데이타와 비교하고, 상기 비교에 따라 대응하는 화자의 인식을 지시하는 수단을 구비한 화자 인식 장치에 있어서, 상기 계수중 하나 이상의 장기간 평균 스펙트럴 크기를 도출하는 수단; 및 산기 장기간 평균에 의해 하나 이상의 계수를 정규화하는 수단을 포함하고, 상기 주파수 대역이 주파수측을 따라 불균등하게 분포되어 있는 것을 특징으로 하는 화자 인식 장치.
- 제11항에 있어서, 상기 주파수 대역이 멜 주파수 범위에 분포되어 있는 것을 특징으로 하는 화자 인식 장치.
- 제11항에 있어서, 상기 주파수 대역이 지정 한계 주파수 이하에서 선형으로 분포되어 있고, 상기 한계 주파수 이상에서 대수적으로 분포되어 있는 것을 특징으로 하는 화자 인식 장치.
- 제11항 내지 제13항중 어느 한 항에 있어서, 상기 계수를 발생하는 수단이 상기 크기의 대수를 발생하고, 대수장기간 평균값을 발생하고, 그리고 대수 계수 크기로부터 대수 장기간 평균을 감산할 수 있도록 구성되는 것을 특징으로 하는 화자 인식 장치.
- 제11항 내지 제14항중 어느 한 항에 있어서, 상기 비교수단이 기능 데이타를 기준 데이타와 시간적으로 정렬하도록 구성되는 것을 특징으로 하는 화자 인식 장치.
- 제15항에 있어서, 상기 비교 수단이 DTW 과정을 이용하는 것을 특징으로 하는 화자 인식 장치.
- 제11항 내지 제16항중 어느 한 항에 있어서, 상기 음성 신호내의 시작점과 끝점을 인식하는 수단을 더 포함하고, 상기 정규화 수단이 구술 내용의 상기 시작점과 끝점 사이의 기간 동안 상기 장기간 평균을 도출하도록 구성되는 것을 특징으로 하는 화자 인식 장치.
- 제11항 내지 제17항중 어느 한 항에 있어서, 상기 장기간 평균이 장기간 평균치를 포함하는 것을 특징으로 하는 화자 인식 장치.
- 제11항 내지 제17항중 어느 한 항에 있어서, 상기 장기간 평균이 주기적으로 갱신되는 이동 평균을 포함하는 것을 특징으로 하는 화자 인식 장치.
- 제11항 내지 제19항중 어느 한 항에 있어서, 연속하는 워드를 입력하기 위해 구성되고, 상기 정규화 수단이 상기 워드 전부에 대해 상기 장기간 평균을 구할 수 있도록 구성되는 것을 특징으로 하는 화자 인식 장치.
- 제11항 내지 제20항중 어느 한 항에 있어서, 전화 네트워크에 연결되도록 채택된 것을 특징으로 하는 화자 인식 장치.
- 제21항에 따른 장치를 포함하는 전화 네트워크.
- 음성 신호의 대응하는 주파수 대역에서, 단기간의 진포에 각각 관련되 신호를 포함하는 인식 데이타를 도출하는 수단; 및 그 인식 데이타에 따라 종속적으로 인식 처리를 실행하는 수단을 포함하는 음성신호 인식 장치에 있어서, 상기 주파수 대역에 이동 장기간 평균 스펙트럴 진폭을 주기적으로 발생하거나 갱신하는 수단; 및 고정된 스펙트럴 엔벨로프 성분에 대한 의존성을 줄이기 위해 상기 장기간 평균을 사용하여 상기 기능 데이타를 처리하는 단게를 포함하는 신호의 신식 처리를 위한 장치.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP93302302.0 | 1993-03-25 | ||
EP93302302 | 1993-03-25 | ||
PCT/GB1994/000629 WO1994022132A1 (en) | 1993-03-25 | 1994-03-25 | A method and apparatus for speaker recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
KR960701428A true KR960701428A (ko) | 1996-02-24 |
KR100312919B1 KR100312919B1 (ko) | 2001-12-28 |
Family
ID=8214353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950704080A KR100312919B1 (ko) | 1993-03-25 | 1994-03-25 | 화자인식을위한방법및장치 |
Country Status (9)
Country | Link |
---|---|
US (1) | US5583961A (ko) |
EP (1) | EP0691024B1 (ko) |
JP (1) | JPH08508107A (ko) |
KR (1) | KR100312919B1 (ko) |
AU (1) | AU685788B2 (ko) |
CA (1) | CA2158847C (ko) |
DE (1) | DE69420400T2 (ko) |
FI (1) | FI954527A (ko) |
SG (2) | SG50502A1 (ko) |
Families Citing this family (80)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU6433094A (en) * | 1993-03-25 | 1994-10-11 | British Telecommunications Public Limited Company | Speech recognition with pause detection |
DE69421077T2 (de) * | 1993-03-31 | 2000-07-06 | British Telecomm | Wortkettenerkennung |
US6230128B1 (en) | 1993-03-31 | 2001-05-08 | British Telecommunications Public Limited Company | Path link passing speech recognition with vocabulary node being capable of simultaneously processing plural path links |
US5749073A (en) * | 1996-03-15 | 1998-05-05 | Interval Research Corporation | System for automatically morphing audio information |
US5960399A (en) * | 1996-12-24 | 1999-09-28 | Gte Internetworking Incorporated | Client/server speech processor/recognizer |
JP3962445B2 (ja) * | 1997-03-13 | 2007-08-22 | キヤノン株式会社 | 音声処理方法及び装置 |
US6003000A (en) * | 1997-04-29 | 1999-12-14 | Meta-C Corporation | Method and system for speech processing with greatly reduced harmonic and intermodulation distortion |
US6633842B1 (en) * | 1999-10-22 | 2003-10-14 | Texas Instruments Incorporated | Speech recognition front-end feature extraction for noisy speech |
FR2786308B1 (fr) * | 1998-11-20 | 2001-02-09 | Sextant Avionique | Procede de reconnaissance vocale dans un signal acoustique bruite et systeme mettant en oeuvre ce procede |
US7117149B1 (en) | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
GB2357231B (en) | 1999-10-01 | 2004-06-09 | Ibm | Method and system for encoding and decoding speech signals |
US9076448B2 (en) | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
US7043430B1 (en) | 1999-11-23 | 2006-05-09 | Infotalk Corporation Limitied | System and method for speech recognition using tonal modeling |
WO2001039179A1 (en) * | 1999-11-23 | 2001-05-31 | Infotalk Corporation Limited | System and method for speech recognition using tonal modeling |
DE10012145C2 (de) * | 2000-03-13 | 2002-02-21 | Christian Popella | Verfahren und Vorrichtung zur akustischen Erkennung erkrankungsbedingter physikalischer Veränderungen des Stimmbildapparates |
TW521266B (en) * | 2000-07-13 | 2003-02-21 | Verbaltek Inc | Perceptual phonetic feature speech recognition system and method |
FR2825826B1 (fr) * | 2001-06-11 | 2003-09-12 | Cit Alcatel | Procede pour detecter l'activite vocale dans un signal, et codeur de signal vocal comportant un dispositif pour la mise en oeuvre de ce procede |
US6678656B2 (en) * | 2002-01-30 | 2004-01-13 | Motorola, Inc. | Noise reduced speech recognition parameters |
DE10254612A1 (de) * | 2002-11-22 | 2004-06-17 | Humboldt-Universität Zu Berlin | Verfahren zur Ermittlung spezifisch relevanter akustischer Merkmale von Schallsignalen für die Analyse unbekannter Schallsignale einer Schallerzeugung |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7885420B2 (en) | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7725315B2 (en) | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US7895036B2 (en) | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US7340398B2 (en) * | 2003-08-21 | 2008-03-04 | Hewlett-Packard Development Company, L.P. | Selective sampling for sound signal classification |
DE10361850A1 (de) * | 2003-12-31 | 2005-07-28 | Kress, Markus | Verfahren zur Identifizierung von Personen |
US8724447B2 (en) * | 2004-01-28 | 2014-05-13 | Qualcomm Incorporated | Timing estimation in an OFDM receiver |
JP2005308512A (ja) * | 2004-04-21 | 2005-11-04 | Agilent Technol Inc | スペクトラム処理方法および該方法を用いる測定装置 |
FI20045146A0 (fi) * | 2004-04-22 | 2004-04-22 | Nokia Corp | Audioaktiivisuuden ilmaisu |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US8170879B2 (en) | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US7716046B2 (en) | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US8306821B2 (en) | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US8284947B2 (en) | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
US7702505B2 (en) * | 2004-12-14 | 2010-04-20 | Electronics And Telecommunications Research Institute | Channel normalization apparatus and method for robust speech recognition |
GB2421317B (en) * | 2004-12-15 | 2009-02-11 | Agilent Technologies Inc | A method and apparatus for detecting leading pulse edges |
GB2422237A (en) * | 2004-12-21 | 2006-07-19 | Fluency Voice Technology Ltd | Dynamic coefficients determined from temporally adjacent speech frames |
US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US8311819B2 (en) | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
US8126706B2 (en) * | 2005-12-09 | 2012-02-28 | Acoustic Technologies, Inc. | Music detector for echo cancellation and noise reduction |
JP4527679B2 (ja) * | 2006-03-24 | 2010-08-18 | 学校法人早稲田大学 | 音声の類似度の評価を行う方法および装置 |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
JP4827661B2 (ja) * | 2006-08-30 | 2011-11-30 | 富士通株式会社 | 信号処理方法及び装置 |
US9830912B2 (en) | 2006-11-30 | 2017-11-28 | Ashwin P Rao | Speak and touch auto correction interface |
EP2096630A4 (en) * | 2006-12-08 | 2012-03-14 | Nec Corp | AUDIO RECOGNITION DEVICE AND AUDIO RECOGNITION METHOD |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US8335685B2 (en) | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
JP4305509B2 (ja) * | 2006-12-26 | 2009-07-29 | ヤマハ株式会社 | 音声処理装置およびプログラム |
US20080256613A1 (en) * | 2007-03-13 | 2008-10-16 | Grover Noel J | Voice print identification portal |
JP5183741B2 (ja) | 2007-08-27 | 2013-04-17 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | ノイズ補充と帯域拡張との間の遷移周波数の適合 |
US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
TWI356399B (en) * | 2007-12-14 | 2012-01-11 | Ind Tech Res Inst | Speech recognition system and method with cepstral |
JP2009157442A (ja) * | 2007-12-25 | 2009-07-16 | Toshiba Corp | データ検索装置および方法 |
US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
US9922640B2 (en) | 2008-10-17 | 2018-03-20 | Ashwin P Rao | System and method for multimodal utterance detection |
US8645131B2 (en) * | 2008-10-17 | 2014-02-04 | Ashwin P. Rao | Detecting segments of speech from an audio stream |
GB2465782B (en) * | 2008-11-28 | 2016-04-13 | Univ Nottingham Trent | Biometric identity verification |
US10257191B2 (en) | 2008-11-28 | 2019-04-09 | Nottingham Trent University | Biometric identity verification |
US9767806B2 (en) * | 2013-09-24 | 2017-09-19 | Cirrus Logic International Semiconductor Ltd. | Anti-spoofing |
JP5535198B2 (ja) * | 2009-04-02 | 2014-07-02 | 三菱電機株式会社 | 雑音抑圧装置 |
US8595005B2 (en) * | 2010-05-31 | 2013-11-26 | Simple Emotion, Inc. | System and method for recognizing emotional state from a speech signal |
US20140095161A1 (en) * | 2012-09-28 | 2014-04-03 | At&T Intellectual Property I, L.P. | System and method for channel equalization using characteristics of an unknown signal |
JP2017508188A (ja) | 2014-01-28 | 2017-03-23 | シンプル エモーション, インコーポレイテッドSimple Emotion, Inc. | 適応型音声対話のための方法 |
US11853884B2 (en) | 2017-02-10 | 2023-12-26 | Synaptics Incorporated | Many or one detection classification systems and methods |
US11100932B2 (en) * | 2017-02-10 | 2021-08-24 | Synaptics Incorporated | Robust start-end point detection algorithm using neural network |
CN107527620B (zh) * | 2017-07-25 | 2019-03-26 | 平安科技(深圳)有限公司 | 电子装置、身份验证的方法及计算机可读存储介质 |
US10540990B2 (en) * | 2017-11-01 | 2020-01-21 | International Business Machines Corporation | Processing of speech signals |
WO2020046831A1 (en) * | 2018-08-27 | 2020-03-05 | TalkMeUp | Interactive artificial intelligence analytical system |
US11205419B2 (en) * | 2018-08-28 | 2021-12-21 | International Business Machines Corporation | Low energy deep-learning networks for generating auditory features for audio processing pipelines |
JP7383122B2 (ja) * | 2019-07-30 | 2023-11-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 信号認識または修正のために音声データから抽出した特徴を正規化するための方法および装置 |
CN112820300B (zh) * | 2021-02-25 | 2023-12-19 | 北京小米松果电子有限公司 | 音频处理方法及装置、终端、存储介质 |
CN112951245B (zh) * | 2021-03-09 | 2023-06-16 | 江苏开放大学(江苏城市职业学院) | 一种融入静态分量的动态声纹特征提取方法 |
CN113488070B (zh) * | 2021-09-08 | 2021-11-16 | 中国科学院自动化研究所 | 篡改音频的检测方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4829578A (en) * | 1986-10-02 | 1989-05-09 | Dragon Systems, Inc. | Speech detection and recognition apparatus for use with background noise of varying levels |
-
1993
- 1993-08-13 US US08/105,583 patent/US5583961A/en not_active Expired - Lifetime
-
1994
- 1994-03-25 EP EP94912001A patent/EP0691024B1/en not_active Expired - Lifetime
- 1994-03-25 AU AU64329/94A patent/AU685788B2/en not_active Ceased
- 1994-03-25 CA CA002158847A patent/CA2158847C/en not_active Expired - Fee Related
- 1994-03-25 JP JP6520840A patent/JPH08508107A/ja not_active Ceased
- 1994-03-25 SG SG1996002893A patent/SG50502A1/en unknown
- 1994-03-25 DE DE69420400T patent/DE69420400T2/de not_active Expired - Lifetime
- 1994-03-25 KR KR1019950704080A patent/KR100312919B1/ko not_active IP Right Cessation
- 1994-03-25 SG SG1996002702A patent/SG50487A1/en unknown
-
1995
- 1995-09-25 FI FI954527A patent/FI954527A/fi unknown
Also Published As
Publication number | Publication date |
---|---|
AU6432994A (en) | 1994-10-11 |
KR100312919B1 (ko) | 2001-12-28 |
JPH08508107A (ja) | 1996-08-27 |
EP0691024B1 (en) | 1999-09-01 |
SG50487A1 (en) | 1998-07-20 |
US5583961A (en) | 1996-12-10 |
SG50502A1 (en) | 1998-07-20 |
DE69420400T2 (de) | 2000-07-13 |
FI954527A0 (fi) | 1995-09-25 |
AU685788B2 (en) | 1998-01-29 |
DE69420400D1 (de) | 1999-10-07 |
CA2158847A1 (en) | 1994-09-29 |
CA2158847C (en) | 2000-03-14 |
FI954527A (fi) | 1995-11-20 |
EP0691024A1 (en) | 1996-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR960701428A (ko) | 화자 인식을 위한 방법 및 장치(a method and apparatus for speaker recognition) | |
EP0950239B1 (en) | Method and recognizer for recognizing a sampled sound signal in noise | |
US6098040A (en) | Method and apparatus for providing an improved feature set in speech recognition by performing noise cancellation and background masking | |
US9009047B2 (en) | Specific call detecting device and specific call detecting method | |
US20220215853A1 (en) | Audio signal processing method, model training method, and related apparatus | |
US20050143997A1 (en) | Method and apparatus using spectral addition for speaker recognition | |
KR100316077B1 (ko) | 분산형음성인식시스템 | |
US4720802A (en) | Noise compensation arrangement | |
US20030115054A1 (en) | Data-driven filtering of cepstral time trajectories for robust speech recognition | |
US20200372925A1 (en) | Method and device of denoising voice signal | |
KR950015199A (ko) | 음성 인식 방법 및 장치 | |
FR2274101B1 (ko) | ||
CN108108357B (zh) | 口音转换方法及装置、电子设备 | |
PT89978A (pt) | Aparelho detector da actividade vocal e aparelho telefonico movel que o contem | |
Barua et al. | Neural network based recognition of speech using MFCC features | |
US7917359B2 (en) | Noise suppressor for removing irregular noise | |
US20100082338A1 (en) | Voice processing apparatus and voice processing method | |
CN112017639B (zh) | 语音信号的检测方法、终端设备及存储介质 | |
CN102723081A (zh) | 语音信号处理方法、语音和声纹识别方法及其装置 | |
JPH02298998A (ja) | 音声認識装置とその方法 | |
CN116312561A (zh) | 一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置 | |
Yu et al. | Text-Dependent Speech Enhancement for Small-Footprint Robust Keyword Detection. | |
US5001761A (en) | Device for normalizing a speech spectrum | |
JP2863214B2 (ja) | 雑音除去装置及び該装置を用いた音声認識装置 | |
Marković et al. | Recognition of Whispered Speech Based on PLP Features and DTW Algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20080922 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |