WO2011046474A3 - Procédé d'identification d'un locuteur sur la base de phonogrammes de parole aléatoire, basé sur l'égalisation des formants - Google Patents
Procédé d'identification d'un locuteur sur la base de phonogrammes de parole aléatoire, basé sur l'égalisation des formants Download PDFInfo
- Publication number
- WO2011046474A3 WO2011046474A3 PCT/RU2010/000661 RU2010000661W WO2011046474A3 WO 2011046474 A3 WO2011046474 A3 WO 2011046474A3 RU 2010000661 W RU2010000661 W RU 2010000661W WO 2011046474 A3 WO2011046474 A3 WO 2011046474A3
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- phonograms
- convergence
- formant
- speech
- reference fragments
- Prior art date
Links
- 238000000034 method Methods 0.000 title abstract 4
- 239000012634 fragment Substances 0.000 abstract 4
- 238000011840 criminal investigation Methods 0.000 abstract 1
- 230000003304 psychophysiological effect Effects 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/20—Pattern transformations or operations aimed at increasing system robustness, e.g. against channel noise or different working conditions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Electrically Operated Instructional Devices (AREA)
- Television Signal Processing For Recording (AREA)
- Television Receiver Circuits (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Telephonic Communication Services (AREA)
Abstract
L'invention concerne un procédé pour l'identification d'un locuteur sur la base de phonogrammes longs ou court de parole aléatoire, basé sur l'égalisation des formants. Le procédé permet une identification fiable de locuteurs sur la base de phonogrammes longs ou courts, de phonogrammes enregistrés sur différents canaux avec un taux d'interférences et de distorsions élevé ainsi que de phonogrammes contenant de la parole aléatoire de locuteurs se trouvant dans des états psycho-physiologiques différents ou parlant des langues différentes, ce qui permet d'utiliser l'invention dans une large gamme d'applications, y compris dans des enquêtes criminelles. L'identification d'un locuteur sur la base de phonogrammes de la parole est réalisée par l'estimation de la similitude entre un premier phonogramme du locuteur et un second phonogramme d'étalonnage. Afin de réaliser cette estimation, on sélectionne dans les premier et second phonogrammes des fragments de référence de signaux vocaux contenant des trajectoires de formants d'au moins trois formants, on compare les fragments de référence dans lesquels coïncident les valeurs d'au moins deux fréquences de formants, on estime la similitude des fragments de référence comparés en fonction de la coïncidence des valeurs des autres fréquences de formants, et on détermine la similitude des phonogrammes dans leur ensemble sur la base d'une estimation globale de la similitude de tous les fragments de référence comparés.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP10823678.7A EP2482277B1 (fr) | 2009-09-24 | 2010-11-03 | Procédé d'identification d'un locuteur basé sur l'égalisation des formants |
EA201290082A EA019949B1 (ru) | 2009-09-24 | 2010-11-03 | Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания |
ES10823678.7T ES2547731T3 (es) | 2009-09-24 | 2010-11-03 | Procedimiento para identificar a un hablante usando ecualización de formante |
US13/429,260 US9047866B2 (en) | 2009-09-24 | 2012-03-23 | System and method for identification of a speaker by phonograms of spontaneous oral speech and by using formant equalization using one vowel phoneme type |
US13/956,240 US20130325470A1 (en) | 2009-09-24 | 2013-07-31 | System and method for identification of a speaker by phonograms of spontaneous oral speech and by using formant equalization |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2009136387 | 2009-09-24 | ||
RU2009136387/09A RU2419890C1 (ru) | 2009-09-24 | 2009-09-24 | Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US13/429,260 Continuation US9047866B2 (en) | 2009-09-24 | 2012-03-23 | System and method for identification of a speaker by phonograms of spontaneous oral speech and by using formant equalization using one vowel phoneme type |
Publications (2)
Publication Number | Publication Date |
---|---|
WO2011046474A2 WO2011046474A2 (fr) | 2011-04-21 |
WO2011046474A3 true WO2011046474A3 (fr) | 2011-06-16 |
Family
ID=43876755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/RU2010/000661 WO2011046474A2 (fr) | 2009-09-24 | 2010-11-03 | Procédé d'identification d'un locuteur sur la base de phonogrammes de parole aléatoire, basé sur l'égalisation des formants |
Country Status (6)
Country | Link |
---|---|
US (2) | US9047866B2 (fr) |
EP (1) | EP2482277B1 (fr) |
EA (1) | EA019949B1 (fr) |
ES (1) | ES2547731T3 (fr) |
RU (1) | RU2419890C1 (fr) |
WO (1) | WO2011046474A2 (fr) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2419890C1 (ru) | 2009-09-24 | 2011-05-27 | Общество с ограниченной ответственностью "Центр речевых технологий" | Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания |
JP5589537B2 (ja) * | 2010-04-30 | 2014-09-17 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム、情報提供装置および情報処理システム |
RU2459281C1 (ru) * | 2011-09-15 | 2012-08-20 | Общество с ограниченной ответственностью "Цифрасофт" | Устройство и способ формирования сигнатуры акустического сигнала, устройство идентификации акустического сигнала |
DE102011085280A1 (de) * | 2011-10-27 | 2013-05-02 | Robert Bosch Gmbh | Überwachung einer differentiellen mehrkanalübertragungsstrecke |
US20140095161A1 (en) * | 2012-09-28 | 2014-04-03 | At&T Intellectual Property I, L.P. | System and method for channel equalization using characteristics of an unknown signal |
US20140188468A1 (en) * | 2012-12-28 | 2014-07-03 | Dmitry Dyrmovskiy | Apparatus, system and method for calculating passphrase variability |
US9015045B2 (en) | 2013-03-11 | 2015-04-21 | Nuance Communications, Inc. | Method for refining a search |
WO2014145960A2 (fr) * | 2013-03-15 | 2014-09-18 | Short Kevin M | Procédé et système de génération de vecteurs de discrimination de caractéristiques avancées destinés à être utilisés en reconnaissance de la parole |
US20140309992A1 (en) * | 2013-04-16 | 2014-10-16 | University Of Rochester | Method for detecting, identifying, and enhancing formant frequencies in voiced speech |
RU2530314C1 (ru) * | 2013-04-23 | 2014-10-10 | Общество с ограниченной ответственностью "ЦРТ-инновации" | Способ гибридной генеративно-дискриминативной сегментации дикторов в аудио-потоке |
RU2598314C2 (ru) * | 2013-08-05 | 2016-09-20 | Общество с ограниченной ответственностью "Центр речевых технологий" (ООО "ЦРТ") | Способ оценки вариативности парольной фразы (варианты) |
JP6316685B2 (ja) * | 2014-07-04 | 2018-04-25 | 日本電信電話株式会社 | 声まね音声評価装置、声まね音声評価方法及びプログラム |
BR102014023647B1 (pt) * | 2014-09-24 | 2022-12-06 | Fundacao Cpqd - Centro De Pesquisa E Desenvolvimento Em Telecomunicacoes | Método e sistema para detecção de fraudes em aplicações baseadas em processamento de voz |
GB2552722A (en) * | 2016-08-03 | 2018-02-07 | Cirrus Logic Int Semiconductor Ltd | Speaker recognition |
US10672402B2 (en) * | 2017-04-11 | 2020-06-02 | International Business Machines Corporation | Speech with context authenticator |
US11594241B2 (en) * | 2017-09-26 | 2023-02-28 | Sony Europe B.V. | Method and electronic device for formant attenuation/amplification |
CN108670199B (zh) * | 2018-05-28 | 2023-05-23 | 暨南大学 | 一种构音障碍元音评估模板及评估方法 |
CN111986698B (zh) * | 2019-05-24 | 2023-06-30 | 腾讯科技(深圳)有限公司 | 音频片段的匹配方法、装置、计算机可读介质及电子设备 |
CN111133508A (zh) * | 2019-12-24 | 2020-05-08 | 广州国音智能科技有限公司 | 一种可供比对音素选取方法和装置 |
CN111933172A (zh) * | 2020-08-10 | 2020-11-13 | 广州九四智能科技有限公司 | 人声分离提取方法方法、装置、计算机设备及存储介质 |
CN111879397B (zh) * | 2020-09-01 | 2022-05-13 | 国网河北省电力有限公司检修分公司 | 高压断路器储能机构故障诊断方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5313556A (en) * | 1991-02-22 | 1994-05-17 | Seaway Technologies, Inc. | Acoustic method and apparatus for identifying human sonic sources |
RU2107950C1 (ru) * | 1996-08-08 | 1998-03-27 | Николай Владимирович Байчаров | Способ идентификации личности по фонограммам произвольной устной речи |
WO2000077772A2 (fr) * | 1999-06-14 | 2000-12-21 | Cyber Technology (Iom) Liminted | Traitement de la voix et des signaux vocaux |
RU2230375C2 (ru) * | 2002-09-03 | 2004-06-10 | Общество с ограниченной ответственностью "Центр речевых технологий" | Метод распознавания диктора и устройство для его осуществления |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3466394A (en) | 1966-05-02 | 1969-09-09 | Ibm | Voice verification system |
US3700815A (en) * | 1971-04-20 | 1972-10-24 | Bell Telephone Labor Inc | Automatic speaker verification by non-linear time alignment of acoustic parameters |
DE2431458C2 (de) | 1974-07-01 | 1986-05-28 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und Anordnung zur automatischen Sprechererkennung |
US5265191A (en) | 1991-09-17 | 1993-11-23 | At&T Bell Laboratories | Technique for voice-based security systems |
US5339385A (en) | 1992-07-22 | 1994-08-16 | Itt Corporation | Speaker verifier using nearest-neighbor distance measure |
RU2047912C1 (ru) | 1994-04-20 | 1995-11-10 | Виктор Николаевич Сорокин | Способ распознавания изолированных слов речи с адаптацией к диктору |
SE515447C2 (sv) * | 1996-07-25 | 2001-08-06 | Telia Ab | Metod och anordning för talverifiering |
US5995927A (en) | 1997-03-14 | 1999-11-30 | Lucent Technologies Inc. | Method for performing stochastic matching for use in speaker verification |
DE69813597T2 (de) | 1997-10-15 | 2004-02-12 | British Telecommunications P.L.C. | Mustererkennung, die mehrere referenzmodelle verwendet |
RU2161826C2 (ru) | 1998-08-17 | 2001-01-10 | Пензенский научно-исследовательский электротехнический институт | Способ автоматической идентификации личности |
US6411930B1 (en) | 1998-11-18 | 2002-06-25 | Lucent Technologies Inc. | Discriminative gaussian mixture models for speaker verification |
US6993378B2 (en) * | 2001-06-25 | 2006-01-31 | Science Applications International Corporation | Identification by analysis of physiometric variation |
US20050171774A1 (en) * | 2004-01-30 | 2005-08-04 | Applebaum Ted H. | Features and techniques for speaker authentication |
JP4455417B2 (ja) * | 2005-06-13 | 2010-04-21 | 株式会社東芝 | 移動ロボット、プログラム及びロボット制御方法 |
US20100217591A1 (en) * | 2007-01-09 | 2010-08-26 | Avraham Shpigel | Vowel recognition system and method in speech to text applictions |
RU2419890C1 (ru) | 2009-09-24 | 2011-05-27 | Общество с ограниченной ответственностью "Центр речевых технологий" | Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания |
-
2009
- 2009-09-24 RU RU2009136387/09A patent/RU2419890C1/ru active
-
2010
- 2010-11-03 EA EA201290082A patent/EA019949B1/ru not_active IP Right Cessation
- 2010-11-03 ES ES10823678.7T patent/ES2547731T3/es active Active
- 2010-11-03 EP EP10823678.7A patent/EP2482277B1/fr active Active
- 2010-11-03 WO PCT/RU2010/000661 patent/WO2011046474A2/fr active Application Filing
-
2012
- 2012-03-23 US US13/429,260 patent/US9047866B2/en active Active
-
2013
- 2013-07-31 US US13/956,240 patent/US20130325470A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5313556A (en) * | 1991-02-22 | 1994-05-17 | Seaway Technologies, Inc. | Acoustic method and apparatus for identifying human sonic sources |
RU2107950C1 (ru) * | 1996-08-08 | 1998-03-27 | Николай Владимирович Байчаров | Способ идентификации личности по фонограммам произвольной устной речи |
WO2000077772A2 (fr) * | 1999-06-14 | 2000-12-21 | Cyber Technology (Iom) Liminted | Traitement de la voix et des signaux vocaux |
RU2230375C2 (ru) * | 2002-09-03 | 2004-06-10 | Общество с ограниченной ответственностью "Центр речевых технологий" | Метод распознавания диктора и устройство для его осуществления |
Also Published As
Publication number | Publication date |
---|---|
EA019949B1 (ru) | 2014-07-30 |
WO2011046474A2 (fr) | 2011-04-21 |
EA201290082A1 (ru) | 2012-07-30 |
EP2482277B1 (fr) | 2015-06-24 |
EP2482277A4 (fr) | 2013-04-10 |
ES2547731T3 (es) | 2015-10-08 |
EP2482277A2 (fr) | 2012-08-01 |
US20130325470A1 (en) | 2013-12-05 |
RU2419890C1 (ru) | 2011-05-27 |
US20120232899A1 (en) | 2012-09-13 |
US9047866B2 (en) | 2015-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2011046474A3 (fr) | Procédé d'identification d'un locuteur sur la base de phonogrammes de parole aléatoire, basé sur l'égalisation des formants | |
EP3360250B1 (fr) | Appareil de traitement de signal sonore et procédé d'amélioration d'un signal sonore | |
Rose et al. | Naive auditory identification and discrimination of similar voices by familiar listeners | |
WO2009104022A3 (fr) | Signature audiovisuelle, procédé d'obtention d'une signature et procédé de comparaison de données audiovisuelles | |
WO2010011377A3 (fr) | Procédé et appareil pour conserver l’audibilité vocale dans un signal audio à canaux multiples ayant un impact minimal sur l’expérience ambiophonique | |
DE602006015376D1 (de) | Vorrichtung zur ausblendung von signalausfällen für eine mehrkanalanordnung | |
WO2007081916A3 (fr) | Systeme et procede pour l'utilisation de differences de niveau entre des microphones pour l'amelioration de la parole | |
WO2006130802A3 (fr) | Appareil, methode et systeme pour effectuer une imagerie de domaine de frequence optique a resolution de phase | |
MX2008013078A (es) | Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto. | |
MY194835A (en) | Audio or Video Encoder, Audio or Video Decoder and Related Methods for Processing Multi-Channel Audio of Video Signals Using a Variable Prediction Direction | |
MY160467A (en) | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction | |
WO2010036062A3 (fr) | Procédé et appareil de traitement d'un signal | |
PT2171493E (pt) | Mecanismo e método para determinar um sincronismo de uma posição com uma posição de referência | |
WO2014145960A3 (fr) | Procédé et système de génération de vecteurs de discrimination de caractéristiques avancées destinés à être utilisés en reconnaissance de la parole | |
WO2017035281A3 (fr) | Codage et décodage audio à l'aide de paramètres de transformation de présentation | |
WO2014020182A3 (fr) | Décodeur et procédé destiné à un concept généralisé d'informations paramétriques spatiales de codage d'objets audio pour des cas de mixage réducteur/élévateur multicanaux | |
IN2015MN01952A (fr) | ||
PH12016500470A1 (en) | Gain shape estimation for improved tracking of high-band temporal characteristics | |
WO2016004757A1 (fr) | Procédé et appareil de détection de bruit | |
EP2941770B1 (fr) | Méthode pour déterminer un signal stereo | |
WO2010036060A3 (fr) | Procédé et appareil pour traiter un signal | |
EP4283614A3 (fr) | Procédé de traitement de signal vocal/audio et appareil | |
EP3896501A4 (fr) | Visionneuse de détermination d'authenticité et son procédé de fabrication, procédé pour déterminer l'authenticité d'un support d'authentification et ensemble de détermination d'authenticité | |
WO2017019498A3 (fr) | Adaptation de correction physiologique | |
Hsu et al. | Spectro-temporal subband wiener filter for speech enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 10823678 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 201290082 Country of ref document: EA |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2010823678 Country of ref document: EP |