SE515447C2 - Metod och anordning för talverifiering - Google Patents
Metod och anordning för talverifieringInfo
- Publication number
- SE515447C2 SE515447C2 SE9602860A SE9602860A SE515447C2 SE 515447 C2 SE515447 C2 SE 515447C2 SE 9602860 A SE9602860 A SE 9602860A SE 9602860 A SE9602860 A SE 9602860A SE 515447 C2 SE515447 C2 SE 515447C2
- Authority
- SE
- Sweden
- Prior art keywords
- speaker
- speech
- voice
- database
- stored
- Prior art date
Links
- 238000012795 verification Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 title claims abstract description 5
- 238000004458 analytical method Methods 0.000 abstract 2
- 238000013475 authorization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Electrically Operated Instructional Devices (AREA)
- Mobile Radio Communication Systems (AREA)
- Monitoring And Testing Of Exchanges (AREA)
Description
25 30 35 40 I o i ., , , I Ii u; » . _. o v: n' I '* ' 1 an» I., , i . } v n ' ! * V F vr .
' I o n , , .men u 2 KORTFATTAD BESKRIVNING AV RITNINGARNA I det följande ges en detaljerad beskrivning av en utföringsform av uppfinningen med hänvisning till de åtföljande ritningarna.
Figur l visar schematiskt formanter som motsvarar olika artikulatorers rörelser; figur 2 visar de inbördes tidsförhàllandena mellan formanternas maxima respektive minima i enlighet med figur l.
DETALJERAD BESKRIVNING AV EN UTFÖRINGSFORM AV UPPFINNINGEN Det är tidigare känt att de olika artikulatorernas rörelser avspeglas akustiskt där bl.a. den första resonans- frekvensen (Fl) påverkas av käkens upp/nerrörelser. Det är också känt att den andra resonansfrekvensen (F2) pâverkas av tungans bak/framrörelser samt att den tredje resonans- frekvensen (F3) påverkas av läpparnas rundnings/spridnings- rörelser. Hur dessa frekvenser ligger i förhållande till varandra framgår av figur l.
Vidare är det känt att artikulatorernas timingmönster skiljer sig från varandra, dvs når sina maximum och minimum- positioner vid olika tidpunkter varvid deras asynkrona rörelser avspeglas akustiskt i formantmönster (formant = resonansfrekvens). Varje enskild talare har ett formant- rörelsemönster som är typiskt för personen och som därför alltid skiljer sig från andra talares resonansfrekvenser.
Uppfinningen kännetecknas av en anordning och en metod som analyserar tidpunkterna när de olika formanterna när sina maximum respektive minimum avseende nämnda resonans- frekvensvärden, och nämnda värden utnyttjas för att bygga upp en talarspecifik frekvensprofil som lagras i en talveri- fieringsdatabas. När en talares identitet skall verifieras för att t.ex. erhålla access till en viss teletjänst, så jämför avsedda organ i anordningen det mottagna talet med i nämnda databas lagrade profil.
I figur 2 ges ett mera konkret exempel på hur talveri- fieringen går till. Formantkarakteristiken för en användare A enligt figur 2 är lagrad i en databas där tidpunkterna för Tai f Tci) ligger lagrade. formantmaxima (TA, Taz» Tcz) respektive formantminima (TAW 10 15 20 25 30 35 40 »i <;, 515 44%* news o n 3 Denna lagring av formantkarakteristika i ett minne i en talverifieringsdatabas sker således vid varje inrättning, t.ex. en bank, där användaren A vill kunna identifiera sig medelst röstmeddelanden. Om t.ex. en användare A vill ha access till ett godtyckligt antal banktjänster genom att identifiera sig via sin telefon medelst röstmeddelanden ombedes således användaren A av bankpersonal, då tjänsten begäres, att läsa in ett antal förutbestämda eller godtyck- ligt valda meddelanden i en mikrofon kopplad till en data- bas, varvid användarens A formantkarakteristik lagras i bankens talverifieringsdatabas.
Låt oss nu anta att användaren A vill utföra någon god- tycklig banktjänst som kräver identifikation medelst sin telefon. Användaren A ringer upp banken och ombedes att identifiera sig genom att tala in ett förutbestämt eller valfritt meddelande. Talverifieringsdatabasen jämför nu formantkarakteristiken för användaren A som är lagrad i databasen med det intalade meddelandet, dvs talverifierings- databasen jämför hur väl tidsvärdena (Tmj TM, Tu) respek- tive (TM, TM, Tu) i databasen stämmer överens med mot- svarande tidsvärden i det intalade meddelandet. Om ovan nämnda tidsvärden i databasen stämmer väl överens med tidsvärdena i det intalade meddelandet fär användaren A access till banktjänsten, annars ej.
Det skall givetvis inses att en databasoperatör på banken godtyckligt kan bestämma noggrannheten hos lagrade formantkarakteristika och intalade formantkarakteristika, dvs inom vilka tidsintervall en användares A intalade tids- värden (TM¿ TM, Tu), respektive (TM, Tu, TQ) skall ligga i förhållande till de för användaren A i databasen lagrade tidsvärdena (TM, TM, Tu) respektive (TM, Tm, Tu) för att erhålla identitet och access till banktjänsten.
Uppfinningen är avsedd att kunna tillämpas i samband med alla telefonitjänster som ställer behörighetskrav för att användaren skall erhålla access till tjänsten ifråga.
Det ovan nämnda är endast att betrakta som en fördel- aktig utföringsform av uppfinningen, och uppfinningens skyddsomfäng definieras endast av vad som anges i de följande patentkraven.
Claims (5)
1. Metod vid ett talverifieringssystem för verifiering av en talares identitet, där nämnda talares röst analyseras och identifieras på basis av röstens resonansfrekvens- röresler(F1, F2, P3) och deras inbördes tidsförhållanden, kännetecknad av att tid- punktema (TM, Tm, TG) när de olika resonansfrekvenserna (Fl, F2, FB) når sina maximum samt tidpunkterna (TM, Tm, Tcz) när nämnda resonansfrekvenser når sina minimum analyseras, och nämnda tidpunkter utnyttjas för att bygga upp en för nämnda talare talarspecifik frekvensprofil som lagras i en talverifieringsdatabas.
2. Metod enligt patentkrav 1, kännetecknad av att när nämnda talares identitet skall verifieras för att erhålla access till en tjänst, företrädesvis teletjänst, jämförcs den för nämnda talare i talverifieringsdatabasen lagrade talarspecifika frekvensprofilen med nämnda talares röstmeddelande, varvid om talarens röst överensstämmer med lagrad frekvensprofil beviljas access till nämnda tjänst.
3. Anordning vid ett talverifieringssystem för verifiering av en talares identitet, varvid den analyserar och identifierar nämnda talares röst på basis av röstens resonans- frekvensrörelser (Fl, F2, F3) och deras inbördes tidsförhållanden, kännetecknad av att den är anordnad att analysera tidpunkterna (T M, TBI, TC, ) när de olika resonanssfrek- vensema (Fl, F2, F3) når sina maximum samt tidpunktema (TM, Tm, TCZ ) när nämnda resonansfrekvenser når sina minimum, samt att den utnyttjar nämnda tidpunkter för att bygga upp en för nämnda talare talarspecifik frekvensprofil som lagras i en talveri- fieringsdatabas.
4. Anordning enligt patentkrav 3, kännetecknad av att den lagrar ett för nämnda talare speciñkt resonansfrekvensrörelsemönster i en talverifieringsdatabas, varvid då nämnda talares identitet skall verifieras jämför ett organ i nämnda anordning resonans- frekvensmönstret hos talarens röst med det i talverifieringsdatabasen lagrade resonans- frekvensmönstret, varvid om dessa båda mönster stämmer överens verifieras och iden- tifieras talaren.
5. Anordning enligt något av patentkraven 3 eller 4, kännetecknad av att den är avsedd att användas i samband med alla telefonitjänster där en användare måste iden- tifiera sig för att erhålla access till nämnda tjänster, t.ex. banktjänster.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE9602860A SE515447C2 (sv) | 1996-07-25 | 1996-07-25 | Metod och anordning för talverifiering |
EP97850105A EP0825587B1 (en) | 1996-07-25 | 1997-07-03 | Method and device for verification of speech |
DE1997625252 DE69725252T2 (de) | 1996-07-25 | 1997-07-03 | Verfahren und Vorrichtung zur Prüfung von Sprache |
DK97850105T DK0825587T3 (da) | 1996-07-25 | 1997-07-03 | Fremgangsmåde og indretning til taleverifikation |
NO19973134A NO314474B1 (no) | 1996-07-25 | 1997-07-07 | Fremgangsmåte og anordning for verifisering av tale |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE9602860A SE515447C2 (sv) | 1996-07-25 | 1996-07-25 | Metod och anordning för talverifiering |
Publications (3)
Publication Number | Publication Date |
---|---|
SE9602860D0 SE9602860D0 (sv) | 1996-07-25 |
SE9602860L SE9602860L (sv) | 1998-01-26 |
SE515447C2 true SE515447C2 (sv) | 2001-08-06 |
Family
ID=20403468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SE9602860A SE515447C2 (sv) | 1996-07-25 | 1996-07-25 | Metod och anordning för talverifiering |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP0825587B1 (sv) |
DE (1) | DE69725252T2 (sv) |
DK (1) | DK0825587T3 (sv) |
NO (1) | NO314474B1 (sv) |
SE (1) | SE515447C2 (sv) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IES20020244A2 (en) * | 2002-04-05 | 2003-10-15 | Univ Dublin | Speaker identification or verification using temporal measurements |
RU2419890C1 (ru) * | 2009-09-24 | 2011-05-27 | Общество с ограниченной ответственностью "Центр речевых технологий" | Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания |
US11341973B2 (en) * | 2016-12-29 | 2022-05-24 | Samsung Electronics Co., Ltd. | Method and apparatus for recognizing speaker by using a resonator |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2003183C (en) * | 1988-11-17 | 1996-06-18 | Shingo Nishimura | Speaker recognition system |
US6081782A (en) * | 1993-12-29 | 2000-06-27 | Lucent Technologies Inc. | Voice command control and verification system |
US5522012A (en) * | 1994-02-28 | 1996-05-28 | Rutgers University | Speaker identification and verification system |
-
1996
- 1996-07-25 SE SE9602860A patent/SE515447C2/sv not_active IP Right Cessation
-
1997
- 1997-07-03 DK DK97850105T patent/DK0825587T3/da active
- 1997-07-03 DE DE1997625252 patent/DE69725252T2/de not_active Expired - Fee Related
- 1997-07-03 EP EP97850105A patent/EP0825587B1/en not_active Expired - Lifetime
- 1997-07-07 NO NO19973134A patent/NO314474B1/no not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
NO973134L (no) | 1998-01-26 |
DE69725252T2 (de) | 2004-08-26 |
NO314474B1 (no) | 2003-03-24 |
SE9602860D0 (sv) | 1996-07-25 |
EP0825587A3 (en) | 1998-09-30 |
EP0825587A2 (en) | 1998-02-25 |
NO973134D0 (no) | 1997-07-07 |
DE69725252D1 (de) | 2003-11-06 |
SE9602860L (sv) | 1998-01-26 |
EP0825587B1 (en) | 2003-10-01 |
DK0825587T3 (da) | 2004-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU636335B2 (en) | Voice verification circuit for validating the identity of telephone calling card customers | |
CN104185868B (zh) | 话音认证和语音识别系统及方法 | |
US5623539A (en) | Using voice signal analysis to identify authorized users of a telephone system | |
Naik et al. | Speaker verification over long distance telephone lines | |
CN105575391B (zh) | 声纹信息管理方法、装置以及身份认证方法、系统 | |
Matsui et al. | Likelihood normalization for speaker verification using a phoneme-and speaker-independent model | |
US7222072B2 (en) | Bio-phonetic multi-phrase speaker identity verification | |
US5719921A (en) | Methods and apparatus for activating telephone services in response to speech | |
US5216720A (en) | Voice verification circuit for validating the identity of telephone calling card customers | |
US6487530B1 (en) | Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models | |
US20050065789A1 (en) | System and method with automated speech recognition engines | |
CN105933323B (zh) | 声纹注册、认证方法及装置 | |
US20030074201A1 (en) | Continuous authentication of the identity of a speaker | |
Sethu et al. | Speaker normalisation for speech-based emotion detection | |
Lindberg et al. | Techniques for a priori decision threshold estimation in speaker verification | |
CN107346568A (zh) | 一种门禁系统的认证方法和装置 | |
US7246061B2 (en) | Method for the voice-operated identification of the user of a telecommunications line in a telecommunications network in the course of a dialog with a voice-operated dialog system | |
JP2001514768A (ja) | 話者証明システム | |
SE515447C2 (sv) | Metod och anordning för talverifiering | |
KR102098956B1 (ko) | 음성인식장치 및 음성인식방법 | |
EP0643520A3 (en) | System and method for passive voice verification in a telephone network | |
Julia et al. | A speaker identification agent | |
Vysotsky | VoiceDialingSM—The first speech recognition based service delivered to customer's home from the telephone network | |
KR100484210B1 (ko) | 예측모델을사용한,특히억세스제어응용을위한발성자음성인식방법 | |
Fogel | A Commercial Implementation of a Free-Speech Speaker Verification System in a Call Center |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
NUG | Patent has lapsed |