SE515447C2 - Metod och anordning för talverifiering - Google Patents

Metod och anordning för talverifiering

Info

Publication number
SE515447C2
SE515447C2 SE9602860A SE9602860A SE515447C2 SE 515447 C2 SE515447 C2 SE 515447C2 SE 9602860 A SE9602860 A SE 9602860A SE 9602860 A SE9602860 A SE 9602860A SE 515447 C2 SE515447 C2 SE 515447C2
Authority
SE
Sweden
Prior art keywords
speaker
speech
voice
database
stored
Prior art date
Application number
SE9602860A
Other languages
English (en)
Other versions
SE9602860D0 (sv
SE9602860L (sv
Inventor
Richard Schulman
Original Assignee
Telia Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telia Ab filed Critical Telia Ab
Priority to SE9602860A priority Critical patent/SE515447C2/sv
Publication of SE9602860D0 publication Critical patent/SE9602860D0/sv
Priority to EP97850105A priority patent/EP0825587B1/en
Priority to DK97850105T priority patent/DK0825587T3/da
Priority to DE1997625252 priority patent/DE69725252T2/de
Priority to NO19973134A priority patent/NO314474B1/no
Publication of SE9602860L publication Critical patent/SE9602860L/sv
Publication of SE515447C2 publication Critical patent/SE515447C2/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/15Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Monitoring And Testing Of Exchanges (AREA)

Description

25 30 35 40 I o i ., , , I Ii u; » . _. o v: n' I '* ' 1 an» I., , i . } v n ' ! * V F vr .
' I o n , , .men u 2 KORTFATTAD BESKRIVNING AV RITNINGARNA I det följande ges en detaljerad beskrivning av en utföringsform av uppfinningen med hänvisning till de åtföljande ritningarna.
Figur l visar schematiskt formanter som motsvarar olika artikulatorers rörelser; figur 2 visar de inbördes tidsförhàllandena mellan formanternas maxima respektive minima i enlighet med figur l.
DETALJERAD BESKRIVNING AV EN UTFÖRINGSFORM AV UPPFINNINGEN Det är tidigare känt att de olika artikulatorernas rörelser avspeglas akustiskt där bl.a. den första resonans- frekvensen (Fl) påverkas av käkens upp/nerrörelser. Det är också känt att den andra resonansfrekvensen (F2) pâverkas av tungans bak/framrörelser samt att den tredje resonans- frekvensen (F3) påverkas av läpparnas rundnings/spridnings- rörelser. Hur dessa frekvenser ligger i förhållande till varandra framgår av figur l.
Vidare är det känt att artikulatorernas timingmönster skiljer sig från varandra, dvs når sina maximum och minimum- positioner vid olika tidpunkter varvid deras asynkrona rörelser avspeglas akustiskt i formantmönster (formant = resonansfrekvens). Varje enskild talare har ett formant- rörelsemönster som är typiskt för personen och som därför alltid skiljer sig från andra talares resonansfrekvenser.
Uppfinningen kännetecknas av en anordning och en metod som analyserar tidpunkterna när de olika formanterna när sina maximum respektive minimum avseende nämnda resonans- frekvensvärden, och nämnda värden utnyttjas för att bygga upp en talarspecifik frekvensprofil som lagras i en talveri- fieringsdatabas. När en talares identitet skall verifieras för att t.ex. erhålla access till en viss teletjänst, så jämför avsedda organ i anordningen det mottagna talet med i nämnda databas lagrade profil.
I figur 2 ges ett mera konkret exempel på hur talveri- fieringen går till. Formantkarakteristiken för en användare A enligt figur 2 är lagrad i en databas där tidpunkterna för Tai f Tci) ligger lagrade. formantmaxima (TA, Taz» Tcz) respektive formantminima (TAW 10 15 20 25 30 35 40 »i <;, 515 44%* news o n 3 Denna lagring av formantkarakteristika i ett minne i en talverifieringsdatabas sker således vid varje inrättning, t.ex. en bank, där användaren A vill kunna identifiera sig medelst röstmeddelanden. Om t.ex. en användare A vill ha access till ett godtyckligt antal banktjänster genom att identifiera sig via sin telefon medelst röstmeddelanden ombedes således användaren A av bankpersonal, då tjänsten begäres, att läsa in ett antal förutbestämda eller godtyck- ligt valda meddelanden i en mikrofon kopplad till en data- bas, varvid användarens A formantkarakteristik lagras i bankens talverifieringsdatabas.
Låt oss nu anta att användaren A vill utföra någon god- tycklig banktjänst som kräver identifikation medelst sin telefon. Användaren A ringer upp banken och ombedes att identifiera sig genom att tala in ett förutbestämt eller valfritt meddelande. Talverifieringsdatabasen jämför nu formantkarakteristiken för användaren A som är lagrad i databasen med det intalade meddelandet, dvs talverifierings- databasen jämför hur väl tidsvärdena (Tmj TM, Tu) respek- tive (TM, TM, Tu) i databasen stämmer överens med mot- svarande tidsvärden i det intalade meddelandet. Om ovan nämnda tidsvärden i databasen stämmer väl överens med tidsvärdena i det intalade meddelandet fär användaren A access till banktjänsten, annars ej.
Det skall givetvis inses att en databasoperatör på banken godtyckligt kan bestämma noggrannheten hos lagrade formantkarakteristika och intalade formantkarakteristika, dvs inom vilka tidsintervall en användares A intalade tids- värden (TM¿ TM, Tu), respektive (TM, Tu, TQ) skall ligga i förhållande till de för användaren A i databasen lagrade tidsvärdena (TM, TM, Tu) respektive (TM, Tm, Tu) för att erhålla identitet och access till banktjänsten.
Uppfinningen är avsedd att kunna tillämpas i samband med alla telefonitjänster som ställer behörighetskrav för att användaren skall erhålla access till tjänsten ifråga.
Det ovan nämnda är endast att betrakta som en fördel- aktig utföringsform av uppfinningen, och uppfinningens skyddsomfäng definieras endast av vad som anges i de följande patentkraven.

Claims (5)

l0 15 20 25 30 n n n n nn 515 44-7 n n n n nn n o nu nn nn n n nn u n nn n nn vn ' n n nn n. n nn nnn n nn nn nn n nnn i n rn n n n nn n n n t' ' ' 0 i vn n :n nn : n n n nn PATENTKRAV
1. Metod vid ett talverifieringssystem för verifiering av en talares identitet, där nämnda talares röst analyseras och identifieras på basis av röstens resonansfrekvens- röresler(F1, F2, P3) och deras inbördes tidsförhållanden, kännetecknad av att tid- punktema (TM, Tm, TG) när de olika resonansfrekvenserna (Fl, F2, FB) når sina maximum samt tidpunkterna (TM, Tm, Tcz) när nämnda resonansfrekvenser når sina minimum analyseras, och nämnda tidpunkter utnyttjas för att bygga upp en för nämnda talare talarspecifik frekvensprofil som lagras i en talverifieringsdatabas.
2. Metod enligt patentkrav 1, kännetecknad av att när nämnda talares identitet skall verifieras för att erhålla access till en tjänst, företrädesvis teletjänst, jämförcs den för nämnda talare i talverifieringsdatabasen lagrade talarspecifika frekvensprofilen med nämnda talares röstmeddelande, varvid om talarens röst överensstämmer med lagrad frekvensprofil beviljas access till nämnda tjänst.
3. Anordning vid ett talverifieringssystem för verifiering av en talares identitet, varvid den analyserar och identifierar nämnda talares röst på basis av röstens resonans- frekvensrörelser (Fl, F2, F3) och deras inbördes tidsförhållanden, kännetecknad av att den är anordnad att analysera tidpunkterna (T M, TBI, TC, ) när de olika resonanssfrek- vensema (Fl, F2, F3) når sina maximum samt tidpunktema (TM, Tm, TCZ ) när nämnda resonansfrekvenser når sina minimum, samt att den utnyttjar nämnda tidpunkter för att bygga upp en för nämnda talare talarspecifik frekvensprofil som lagras i en talveri- fieringsdatabas.
4. Anordning enligt patentkrav 3, kännetecknad av att den lagrar ett för nämnda talare speciñkt resonansfrekvensrörelsemönster i en talverifieringsdatabas, varvid då nämnda talares identitet skall verifieras jämför ett organ i nämnda anordning resonans- frekvensmönstret hos talarens röst med det i talverifieringsdatabasen lagrade resonans- frekvensmönstret, varvid om dessa båda mönster stämmer överens verifieras och iden- tifieras talaren.
5. Anordning enligt något av patentkraven 3 eller 4, kännetecknad av att den är avsedd att användas i samband med alla telefonitjänster där en användare måste iden- tifiera sig för att erhålla access till nämnda tjänster, t.ex. banktjänster.
SE9602860A 1996-07-25 1996-07-25 Metod och anordning för talverifiering SE515447C2 (sv)

Priority Applications (5)

Application Number Priority Date Filing Date Title
SE9602860A SE515447C2 (sv) 1996-07-25 1996-07-25 Metod och anordning för talverifiering
EP97850105A EP0825587B1 (en) 1996-07-25 1997-07-03 Method and device for verification of speech
DK97850105T DK0825587T3 (da) 1996-07-25 1997-07-03 Fremgangsmåde og indretning til taleverifikation
DE1997625252 DE69725252T2 (de) 1996-07-25 1997-07-03 Verfahren und Vorrichtung zur Prüfung von Sprache
NO19973134A NO314474B1 (no) 1996-07-25 1997-07-07 Fremgangsmåte og anordning for verifisering av tale

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE9602860A SE515447C2 (sv) 1996-07-25 1996-07-25 Metod och anordning för talverifiering

Publications (3)

Publication Number Publication Date
SE9602860D0 SE9602860D0 (sv) 1996-07-25
SE9602860L SE9602860L (sv) 1998-01-26
SE515447C2 true SE515447C2 (sv) 2001-08-06

Family

ID=20403468

Family Applications (1)

Application Number Title Priority Date Filing Date
SE9602860A SE515447C2 (sv) 1996-07-25 1996-07-25 Metod och anordning för talverifiering

Country Status (5)

Country Link
EP (1) EP0825587B1 (sv)
DE (1) DE69725252T2 (sv)
DK (1) DK0825587T3 (sv)
NO (1) NO314474B1 (sv)
SE (1) SE515447C2 (sv)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IES20020244A2 (en) * 2002-04-05 2003-10-15 Univ Dublin Speaker identification or verification using temporal measurements
RU2419890C1 (ru) * 2009-09-24 2011-05-27 Общество с ограниченной ответственностью "Центр речевых технологий" Способ идентификации говорящего по фонограммам произвольной устной речи на основе формантного выравнивания
CN110121633B (zh) * 2016-12-29 2023-04-04 三星电子株式会社 用于通过使用谐振器来识别说话者的方法及设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2003183C (en) * 1988-11-17 1996-06-18 Shingo Nishimura Speaker recognition system
US6081782A (en) * 1993-12-29 2000-06-27 Lucent Technologies Inc. Voice command control and verification system
US5522012A (en) * 1994-02-28 1996-05-28 Rutgers University Speaker identification and verification system

Also Published As

Publication number Publication date
NO973134L (no) 1998-01-26
EP0825587A3 (en) 1998-09-30
EP0825587A2 (en) 1998-02-25
SE9602860D0 (sv) 1996-07-25
EP0825587B1 (en) 2003-10-01
NO314474B1 (no) 2003-03-24
SE9602860L (sv) 1998-01-26
DE69725252D1 (de) 2003-11-06
NO973134D0 (no) 1997-07-07
DK0825587T3 (da) 2004-02-09
DE69725252T2 (de) 2004-08-26

Similar Documents

Publication Publication Date Title
CN104185868B (zh) 话音认证和语音识别系统及方法
US5623539A (en) Using voice signal analysis to identify authorized users of a telephone system
KR0139949B1 (ko) 미지인 사람의 신원을 확인하기 위한 음성 검증 회로
CN105575391B (zh) 声纹信息管理方法、装置以及身份认证方法、系统
Matsui et al. Likelihood normalization for speaker verification using a phoneme-and speaker-independent model
US7222072B2 (en) Bio-phonetic multi-phrase speaker identity verification
US5719921A (en) Methods and apparatus for activating telephone services in response to speech
US5216720A (en) Voice verification circuit for validating the identity of telephone calling card customers
US6487530B1 (en) Method for recognizing non-standard and standard speech by speaker independent and speaker dependent word models
US4773093A (en) Text-independent speaker recognition system and method based on acoustic segment matching
CN105933323B (zh) 声纹注册、认证方法及装置
US20030074201A1 (en) Continuous authentication of the identity of a speaker
ATE426234T1 (de) Sprecherverifikation
DE69624848D1 (de) Verfahren zum überprüfen eines sprechers
Sethu et al. Speaker normalisation for speech-based emotion detection
Lindberg et al. Techniques for a priori decision threshold estimation in speaker verification
CN107346568A (zh) 一种门禁系统的认证方法和装置
US7246061B2 (en) Method for the voice-operated identification of the user of a telecommunications line in a telecommunications network in the course of a dialog with a voice-operated dialog system
JP2001514768A (ja) 話者証明システム
SE515447C2 (sv) Metod och anordning för talverifiering
KR102098956B1 (ko) 음성인식장치 및 음성인식방법
EP0643520A3 (en) System and method for passive voice verification in a telephone network
Julia et al. A speaker identification agent
Vysotsky VoiceDialingSM—The first speech recognition based service delivered to customer's home from the telephone network
KR100484210B1 (ko) 예측모델을사용한,특히억세스제어응용을위한발성자음성인식방법

Legal Events

Date Code Title Description
NUG Patent has lapsed