DE154020T1 - Sprecher-verifikationssystem. - Google Patents

Sprecher-verifikationssystem.

Info

Publication number
DE154020T1
DE154020T1 DE198484115633T DE84115633T DE154020T1 DE 154020 T1 DE154020 T1 DE 154020T1 DE 198484115633 T DE198484115633 T DE 198484115633T DE 84115633 T DE84115633 T DE 84115633T DE 154020 T1 DE154020 T1 DE 154020T1
Authority
DE
Germany
Prior art keywords
circuit
value
memory
signal
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE198484115633T
Other languages
English (en)
Inventor
Michele N. 23 - Torino Cavazza
Alberto N. 31 - Rosta Ciaramella (Torino)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telecom Italia SpA
Original Assignee
CSELT Centro Studi e Laboratori Telecomunicazioni SpA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CSELT Centro Studi e Laboratori Telecomunicazioni SpA filed Critical CSELT Centro Studi e Laboratori Telecomunicazioni SpA
Publication of DE154020T1 publication Critical patent/DE154020T1/de
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Complex Calculations (AREA)
  • Machine Translation (AREA)

Claims (6)

Patentansprüche
1. Vorrichtung zur Identifizierung eines Sprechers, mit: einer Schaltung (EP), die von jedem Satz die charakteristischen Parameter extrahiert, die dem Sprechsignal in verschiedenen Frequenzbändern des Sprechbands zugeordnete Energiewerte sowie Vektorkomponenten sind, die jeweils auf ein Intervall der Nutzzeit für die Satzaussprache bezogen sind; einer Schaltung (DP), die den Vektor-Mittelwert berechnet und einen mittleren Parametervektor abgibt; einer Schaltung, die Histogramme der Verteilung der mittleren Parameter für viele Wiederholungen desselben Satzes bestimmt, und zwar ein Histogramm für jedes Frequenzband; einem Speicher (MEM) der Histogramme für jeden Sprecher; einer Schaltung (CP), die die Wahrscheinlichkeit berechnet, daß ein soeben gesprochener Satz zu einem gegebenen Sprecher gehört; einer eine Wahrscheinlichkeitsschwelle berechnenden Schaltung (CSV); und einer Vergleichsschaltung (CMP), die ein Signal des identifizierten Sprechers abgibt, wenn die Wahrscheinlichkeit die Wahrscheinlichkeitsschwelle überschreitet, dadurch gekennzeichnet, daß sie weiterhin folgende Baugruppen umfaßt:
- eine im Nachrichtenweg vor der die charakteristischen Parameter extrahierenden Schaltung (EP) liegende, die tat-
sächlichen Zeitpunkte des Satzbeginns und des Satzendes bestimmende Schaltung (RIF), die: in jedem Intervall einen Langzeit-Leistungswert des Sprechsignals berechnet, wobei "Langzeit" eine Periode einer bestimmten Anzahl aufeinanderfolgender Intervalle angibt, in jedem Intervall einen gewichteten Kurzzeit-Leistungswert berechnet, wobei "Kurzzeit" eine Intervallperiode ist und dieser Wert als Leistungsprodukt des Sprechsignals mit dem Verhältnis zwischen einer Sprechsignalleistung bei niedrigen Frequenzen und einer Sprechsignalleistung bei hohen Frequenzen erhalten wird; die um eine feste Menge erhöhten Langzeit-Leistungswerte mit der gewichteten Kurzzeit-Leistung vergleicht und den Zeitpunkt, zu dem der zweite Wert die ersten Werte überschreitet, als den tatsächlichen Zeitpunkt des Satzbeginns nimmt, sofern diese Bedingung für eine gegebene Anzahl aufeinanderfolgender Intervalle (FRAGB, FRAGE) nach diesem Zeitpunkt stets verwirklicht ist; diese Operationen zum Bestimmen des Satzendes unter Analysierung der Intervalle vom letzen Satzintervall zurück wiederholt; und an die die Parameter extrahierende Schaltung (EP) nur die zwischen den tatsächlichen Zeitpunkten des Satzbeginns und des Satzendes enthaltenen Intervalle liefert;
- eine Zeitabgleichschaltung (AT), die im Nachrichtenstrom hinter der die Parameter extrahierenden Schaltung (EP) liegt und eine entsprechende Tabelle, die dann als Abgleichlinie (at, Fig. 2) bezeichnet ist, zwischen den Indizes der von der die Parameter extrahierenden Schaltung gelieferten Vektorparameter und den Vektor Parametervektoren eines Referenzsatzes bestimmt und entsprechend dieser Tabelle eine neue Folge aufeinander ausgerichteter Parametervektoren erzeugt, deren Anzahl der Zahl der Parametervektoren des Referenzsatzes entspricht, wobei die Vektoren der ausgerichteten Parameter zur den Mittelwert berechnenden Schaltung (DP) gesendet werden;
weiterhin dadurch gekennzeichnet, daß die die Wahrscheinlichkeitsschwelle berechnende Schaltung (CSV) eine Schaltung (CDEV) umfaßt, die das Produkt der Standardabweichungen der Verteilungshistgramme der mittleren Parameter berechnet, wobei die
Wahrscheinlichkeitsschwelle dann durch einen Korrektivfaktor dividiert wird, der im wesentlichen aus dem Produkt der Standardabweichungen besteht, wodurch eine veränderliche Wahrscheinlichkeitsschwelle erhalten wird.
2. Vorrichtung nach Anspruch 1, mit einem Digitalumsetzer (AD) des Sprechsignals für die gesamte für die Satzaussprache nützliche Zeit, der eine Gruppe digitaler Abtastwerte erzeugt, die in einen Speicher (MMl) für digitale Abtastwerte zu schreiben sind, dadurch gekennzeichnet, daß die folgenden Baugruppen die die tatsächlichen Zeitpunkte des Satzbeginns und Satzendes bestimmende Schaltung (RIF) aufbauen:
- ein Frequenzteiler (ORF), der die Abtastfrequenz des Umsetzers (AD) für die Teilung in Zeitintervalle teilt, wobei jedes Intervall eine bestimmte Anzahl digitaler Abtastwerte umfaßt;
- eine Verzögerungsschaltung (Tl) für die digitalen Abtastwerte um eine Anzahl DN der Intervalle;
- eine Schaltung (PLT), die die Langzeit-Leistungswerte der von der Verzögerungsschaltung (Tl) empfangenen Abtastwerte berechnet und bei jedem Intervall den Logarithmus des Mittelwerts der Quadratwerte der während der letzten NFN Intervalle empfangenen Werte berechnet;
- ein erstes Register (RGl), das die Langzeit-Leistungswerte empfängt und sie dann abgibt, wenn es durch ein erstes Befähigungssignal (22) angesteuert ist, das aus dem Ausgangssignal des Frequenzteilers (OFR) besteht, das durch logische Tore (34,35,37) kommt;
- ein erster Addierer (Sl) zum Addieren des Ausgangssignals des ersten Registers (RGl) und eines konstanten Werts (von STOl), wobei der Addierer das Additionsergebnis an ein zweites Register (RG2) gibt, das ebenfalls vom ersten Befähigungssignal (22) angesteuert ist;
- eine die gewichtete Kurzzeit-Leistung berechnende Schaltung, die aus einer ersten Schaltung (PBTl), einer zweiten Schaltung (PBT2) und einer dritten Schaltung (PBT3) besteht, die die Kurzzeitleistung berechnen und die in jedem Intervall den Logarithmus des Mittelwerts der Quadratwerte der im letzten
Intervall empfangenen Werte auswerten, wobei die erste Schaltung (PBTl) die Abtastwerte, die zweite Schaltung (PBT2) die in einem Tiefpaßfilter (FPB) gefilterten Abtastwerte und die dritte Schaltung (PBT3) die in einem Hochpaßfilter (FPA) gefilterten Abtastwerte empfängt und das Ausgangssignal der dritten Schaltung vom Ausgangssignal der zweiten Schaltung in einem Subtraktor (S2) subtrahiert wird, dessen Ausgangssignal mit dem Ausgangssignal der ersten Schaltung (PBTl) in einem zweiten Addierer (S3) addiert wird;
ein drittes Register (RG3), welches das Ausgangssignal des zweiten Addieres (S3) empfängt und durch ein zweites Befähigungssignal (43) angesteuert ist, das aus dem über ein logisches Tor (42) geleiteten Ausgangssignal des Frequenzteilers (ORF) besteht;
ein programmierbarer Auf- und Abzähler (CTl), der die Intervalle, also die Perioden des Ausgangssignals des Frequenzteilers (ORF), zählt und der während der Suche nach dem Beginnpunkt des Satzes anfangend von Null aufwärts zählt und während der Suche nach den Schlußpunkt des Satzes anfangend von einen maximalen Intervallwert abwärts zählt;
ein viertes Register (RG4), das den Wert des Ausgangssignals des Zählers (CTl) speichert, wenn ein drittes Befähigungssignal (33) eintrifft;
ein zweiter Zähler (CT3), der durch das dritte Befähigungssignal (33) zurückgestellt wird und der die Perioden des Ausgangssignals des Frequenzteilers (ORF) zählt, das ihm über ein logisches Tor (47), das vom dritten Befähigungssignal (33) angesteuert wird, zugeleitet ist;
ein erster Komparator (CMP5), der das Ausgangssignal des zweiten Zählers (CT3) mit einem konstanten Wert vergleicht, der aus jener Anzahl aufeinanderfolgender Intervalle (FRAGE, FRAGB) besteht, und der dann ein Bestätigungssignal (51) abgibt, wenn das Ausgangssignal des zweiten Zählers (CT3) den konstanten Wert überschreitet;
ein zweiter Komparator (CMPl), der die Ausgangssignale des dritten Registers (RG3) und des zweiten Registers (RG2) vergleicht und, wenn das Ausgangssignal des dritten Registers
-fa- C 1 5 A Q 2
das des zweiten Registers übertrifft, das dritte Befähigungssignal (33) abgibt, das weiterhin als Sperrsignal an die logischen Tore (34,37) geleitet ist, die das erste Befähigungssignal (22) erzeugen;
- ein dritter Komparator (CMP2), der, wenn das Ausgangssignal des Auf- und Ab-Zählers (CTl) einen konstanten Wert (von STO6) überschreitet, ein Befähigungssignal (41) für das logische Tor (42), das das zweite Befähigungssignal (43) erzeugt, abgibt;
- eine Steuerlogik (LC), die auf den Empfang eines Steuersignals (PU) hin das aufsteigende sequentielle Auslesen des die digitalen Abtastwerte enthaltenden Speichers (MMl) und den Beginn des Aufwärtszählens des Auf- und Ab-Zählers (CTl) bestimmt und bei Empfang des Bestätigungssignals (51) den Ausgangswert des vierten Registers (RG4) als tatsächlichen Zeitpunkt des Satzbeginns ansieht, das Abwärtszählsignal an den Zähler (CTl) abgibt und das absteigende sequentielle Auslesen des die digitalen Abtastwerte enthaltenden Speichers (MMl) bestimmt, und auf den Empfang des Bestätigungssignals (51) den Ausgangswert des vierten Registers (RG4) als tatsächlichen Zeitpunkt des Satzendes ansieht.
3. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet, daß die den tatsächlichen Zeitpunkt bestimmende Schaltung (RIF) weiterhin aus folgendem Baugruppen besteht:
- einem dritten Zähler (CT3), der vorn dritten Befähigungssignal (33) zurückgestellt wird und der die Perioden des Ausgangssignals des Frequenzteilers (ORF), das über das vom dritten Befähigungssignal (33) angesteuerte logische Tor (47) gesendet wird, zählt;
- einem vierten Komparator (CMP4), der das Ausgangssignal des dritten Zählers (CT3) mit einem konstanten Wert vergleicht und, soweit dieser nicht überschritten wird, ein Signal (36) abgibt, das die Durchlaßsteuerung für die logischen Tore (34,35,37), die das erste Befähigungssignal (22) abgeben, aufrechterhält, nachdem der zweite Komparator (CMPl) das
Sperrsignal (33) geliefert hat;
- einem fünftem Komperator (CMP3), der das Ausgangssignal des Auf- und Ab-Zählers (CTl) mit einem Intervallschwellenwert vergleicht, wobei das Überschreiten des Schwelle die Emission eines Fehlersignals (44) an die Steuerlogik bestimmt, die dann die Operationen stoppt.
4. Vorrichtung nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die folgenden Baugruppen die Zeitabgleichschaltung (AT) aufbauen:
- ein erster Speicher (MM2), der die Parametervektoren des Bezugsatzes enthält, wobei jeder Vektor durch einen Index m (1 = m = M) identifiziert ist;
- ein zweiter Speicher (MM5), in dem die die Parameter extrahierende Schaltung (EP) die soeben berechneten Parametervektoren eines Satzes schreibt, wobei jeder Vektor durch einen Index j (1 = j = J) identifiziert ist;
- eine Richtungen berechnende Schaltung (CBC), die die Vektoren vom ersten Speicher und vom zweiten Speicher empfängt und für jedes Indexpaar (j,m) der Vektoren Richtungswerte P(j,m) berechnet, die anzeigen, von welchem vorhergehenden Paar von zusammenhängenden Indizes (j,m-l; j-l,m; j-l,m-l) das Minimum der Additionen von Differenzen zwischen entsprechenden Komponenten der Vektoren kommt;
- ein dritter Speicher (MEMP), der diese Richtungswerte P(j,m) an Stellen enthält, an denen die Adresse durch die Werte der entsprechenden Paare von Indizes j, m gegeben ist;
- eine erste Adressier- und Rechenlogik (LAR,nr,pr,j ,m), die von der vorliegenden Adresse den im dritten Speicher (MEMP) gelesenen Richtungswert P(j,m) subtrahiert und die nächste Adresse für die Speicherlesung erhält, ausgehend von der dem Indexpaar J, M entsprechenden Stellung, und die aufeinanderfolgend die erzeugten Adressen, die die Abgleichlinie (at) zusammensetzen, in einen vierten Speicher (MEMC) schreibt;
- eine zweite Adressier- und Rechenlogik (ALTE), die in sequentieller ansteigender Ordnung den vierten Speicher (MEMC) adressiert, die Indexpaare j, m der Abgleichlinie (at) liest,
den Index j zur Leseadressierung des zweiten Speichers (MM5) und den Index m zur Schreibadressierung eines fünften Speichers (MEMM) verwendet und die Werte des vorliegenden und des vorhergehenden Index vergleicht:
übersteigt der vorliegende Wert den vorhergehenden, so schreibt sie in den fünften Speicher den im zweiten Speicher gelesenen Wert, ist der vorliegende Wert gleich dem vorhergehenden Wert, so berechnet sie den Mittelwert aller auf einanderfolgenden im zweiten Speicher gelesenen Vektoren, deren Index j durch Indexpaare mit dem Wert des vorliegenden Index m gegeben ist, und schreibt ihn in den fünften Speicher, wobei dieser fünfte Speicher (MEMM) dann die Folge der Vektoren der ausgerichteten Parameter enthält;
- eine Logik (LGC), die den Betrieb der Zeitabgleichschaltung (AT) steuert.
5. Vorrichtung nach Anspruch 4, dadurch gekennzeichnet, daß die die Richtungen berechnende Schaltung (CBC) aus zwei in Kaskade geschalteten Konfigurationen gleicher Schaltungen, sogenannter Zellen (C(-R),.. .CO,.. .CR) besteht, die durch ungeradzahlige und geradzahlige Indizes r (-R = r = R) identifiziert sind, deren Wert die Differenz zwischen den Indizes von vom ersten Speicher (MM2) und vom zweiten Speicher (MM5) kommenden Vektoren ist, wobei die folgenden Schaltungen jede der Zellen aufbauen:
- ein fünftes Register (REG5), das von der vorhergehenden Zelle der selben Konfiguration die vom zweiten Speicher (MM5) kommenden Parametervektoren empfängt und sie zur folgenden Zelle der selben Konfiguration weitergibt;
- ein sechstes Register (RG6), das von der folgenden Zelle der selben Konfiguration die vom ersten Speicher (MM2) kommenden Parametervektoren empfängt und sie zur vorhergehenden Zelle der selben Konfiguration weitergibt;
- eine Abstandsberechnungsschaltung (CDS), die die Summe der Differenzen zwischen homologen Komponenten der Vektoren berechnet, die am Ausgang des fünften Registers (RG5) und des sechsten Registers (RG6) vorliegen;
- eine Schaltung (CDA), die akkumulierte Abstände berechnet
und die folgende Baugruppen enthält:
einen Komparator, der das Minimum zwischen drei vorliegenden Werten identifiziert, nämlich eines akkumulierten Abstandswerts, der bei der früheren Kalkulation erhalten wurde und zeitweise in einem siebten Register (RIG7) gespeichert ist, und von Werten von akkumuliertem Abstand, die am Ausgang von Schaltungen (CDA) vorliegen, welche akkumulierte Abstände der beiden Zellen von zusammenhängendem Index berechnen, die zur anderen in Kaskade geschalteten Konfiguration gehören, und der eine auf den Minimumwert von diesen drei Werten bezogene Anzeige abgibt, die einen Richtungswert P(j,m) darstellt; und einen Addierer des von der Abstandberechnungsschaltung (CDS) gelieferten Abstandswerts und des Minimums der drei Werte, wobei der Addierer die akkumulierten Abstandswerte abgibt, die zu den Eingängen der entsprechenden Schaltungen der zusammenhängenden Zellen der anderen in Kaskade geschalteten Konfiguration gesendet werden;
- eine Ansteuerschaltung (TFL), die den Betrieb der den akkumulierten Abstand berechnenden Schaltung (CDA) und des siebenten Registers (REG7) in Gang setzt, wenn sie das gleichzeitige Vorhandensein von Daten an den Ausgängen des fünften Registers (REG5) und des sechsten Registers (REG6) feststellt.
6. Vorrichtung nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die die Wahrscheinlichkeitsschwelle berechnende Schaltung (CSV) aus folgenden Baugruppen besteht:
- der die Standardabweichung des jeweiligen Sprecherhistogramms, das vom Histogramm-Speicher (MEM) empfangen wird, berechnenden Schaltung (CDEV);
- Registern (Rl,...RK), und zwar jeweils einem für jedes Histogramm, die vorübergehend den entsprechenden Wert der Standardabweichung, der von der die Standdardabweichung berechnenden Schaltung (CDEV) geliefert wird, speichern;
- einer Schaltung (PRD), die das Produkt der in diesen Registern (Rl,...,RK) vorhandenen Werte berechnet;
einem ersten Teiler (DVSl), der die von der das Produkt berechnenden Schaltung (PRD) empfangenen Werte durch einen konstanten Normalisierungswert (σ vtqRM) teilt;
eine Leistungsanhebeschaltung (ELP), die die Z-te Potenz und dann die Z-te Wurzel des Werts berechnet, der vom ersten Teiler (DVSl) empfangen wird, wobei Z = ein fester Exponentialfaktor, und K = die Histogrammzahl;
einen zweiten Teiler (DVS2), der die Wahrscheinlichkeitsschwelle durch einen Wert teilt, der am Ausgang der Leistungsanhebeschaltung (ELP) vorliegt, wodurch die variable Wahrscheinlichkeitsschwelle erhalten wird;
einer die Steuer- und Synchronisationssignale erzeugenden Schaltung (GSI).
DE198484115633T 1983-12-19 1984-12-17 Sprecher-verifikationssystem. Pending DE154020T1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
IT68320/83A IT1160148B (it) 1983-12-19 1983-12-19 Dispositivo per la verifica del parlatore

Publications (1)

Publication Number Publication Date
DE154020T1 true DE154020T1 (de) 1986-02-27

Family

ID=11308972

Family Applications (2)

Application Number Title Priority Date Filing Date
DE198484115633T Pending DE154020T1 (de) 1983-12-19 1984-12-17 Sprecher-verifikationssystem.
DE8484115633T Expired DE3470240D1 (en) 1983-12-19 1984-12-17 Device for speaker verification

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE8484115633T Expired DE3470240D1 (en) 1983-12-19 1984-12-17 Device for speaker verification

Country Status (6)

Country Link
US (1) US4752958A (de)
EP (1) EP0154020B1 (de)
JP (1) JPH0680480B2 (de)
CA (1) CA1212179A (de)
DE (2) DE154020T1 (de)
IT (1) IT1160148B (de)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987000332A1 (en) * 1985-07-01 1987-01-15 Ecco Industries, Inc. Speaker verification system
GB8630118D0 (en) * 1986-12-17 1987-01-28 British Telecomm Speaker identification
US5227228A (en) * 1988-05-02 1993-07-13 Newell Robert D Sorptive article comprising elements having capacitive spaces for fluid and/or particulate solids
US5171741A (en) * 1989-04-21 1992-12-15 Health Research, Inc. Bacteriochlorophyll-a derivatives useful in photodynamic therapy
US5293452A (en) * 1991-07-01 1994-03-08 Texas Instruments Incorporated Voice log-in using spoken name input
JP2908168B2 (ja) * 1993-03-15 1999-06-21 シャープ株式会社 信号識別回路
US5522012A (en) * 1994-02-28 1996-05-28 Rutgers University Speaker identification and verification system
US5625747A (en) * 1994-09-21 1997-04-29 Lucent Technologies Inc. Speaker verification, speech recognition and channel normalization through dynamic time/frequency warping
EP0761514A4 (de) * 1995-03-20 1997-05-12 Vladimir Lvovich Taubkin Auf sprachanalyse basiertes verfahren zum kontrollieren von fahrzeugen mit verhänderung des unerlaubten zugriffs und ein system zur durchführung des vorgeschlagenen verfahrens
US6292767B1 (en) * 1995-07-18 2001-09-18 Nuance Communications Method and system for building and running natural language understanding systems
CA2180392C (en) * 1995-07-31 2001-02-13 Paul Wesley Cohrs User selectable multiple threshold criteria for voice recognition
US5774858A (en) * 1995-10-23 1998-06-30 Taubkin; Vladimir L. Speech analysis method of protecting a vehicle from unauthorized accessing and controlling
US5940476A (en) 1996-06-28 1999-08-17 Distributed Software Development, Inc. System and method for identifying an unidentified caller
US6205204B1 (en) 1996-06-28 2001-03-20 Distributed Software Development, Inc. System and method for identifying an unidentified person using an ambiguity-resolution criterion
US5901203A (en) 1996-06-28 1999-05-04 Distributed Software Development, Inc. Computer-based system and method for identifying an unidentified caller
US7006605B1 (en) 1996-06-28 2006-02-28 Ochopee Big Cypress Llc Authenticating a caller before providing the caller with access to one or more secured resources
US6529881B2 (en) * 1996-06-28 2003-03-04 Distributed Software Development, Inc. System and method for identifying an unidentified customer at the point of sale
DE19630109A1 (de) * 1996-07-25 1998-01-29 Siemens Ag Verfahren zur Sprecherverifikation anhand mindestens eines von einem Sprecher eingesprochenen Sprachsignals, durch einen Rechner
WO1998014934A1 (en) 1996-10-02 1998-04-09 Sri International Method and system for automatic text-independent grading of pronunciation for language instruction
US6490560B1 (en) * 2000-03-01 2002-12-03 International Business Machines Corporation Method and system for non-intrusive speaker verification using behavior models
GB2426368A (en) 2005-05-21 2006-11-22 Ibm Using input signal quality in speeech recognition
US20060293898A1 (en) * 2005-06-22 2006-12-28 Microsoft Corporation Speech recognition system for secure information
US7917540B2 (en) * 2007-02-22 2011-03-29 Colorado State University Research Foundation Nonlinear set to set pattern recognition
JP5456370B2 (ja) * 2009-05-25 2014-03-26 任天堂株式会社 発音評価プログラム、発音評価装置、発音評価システムおよび発音評価方法
US9043210B1 (en) 2012-10-02 2015-05-26 Voice Security Systems, Inc. Biometric voice command and control switching device and method of use
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10332545B2 (en) * 2017-11-28 2019-06-25 Nuance Communications, Inc. System and method for temporal and power based zone detection in speaker dependent microphone environments
CN111508503B (zh) * 2020-06-16 2020-10-20 北京爱数智慧科技有限公司 一种识别同一说话人的方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2536585C3 (de) * 1975-08-16 1981-04-02 Philips Patentverwaltung Gmbh, 2000 Hamburg Anordnung zur statistischen Signalanalyse
US4028496A (en) * 1976-08-17 1977-06-07 Bell Telephone Laboratories, Incorporated Digital speech detector
DE2844156A1 (de) * 1978-10-10 1980-04-24 Philips Patentverwaltung Verfahren zum verifizieren eines sprechers
JPS56135898A (en) * 1980-03-26 1981-10-23 Sanyo Electric Co Voice recognition device
JPS5718279A (en) * 1980-07-09 1982-01-30 Sanyo Electric Co Ltd Thermally recording device
JPS5852695A (ja) * 1981-09-25 1983-03-28 日産自動車株式会社 車両用音声検出装置
JPS5876899A (ja) * 1981-10-31 1983-05-10 株式会社東芝 音声区間検出装置
DE3243231A1 (de) * 1982-11-23 1984-05-24 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur erkennung von sprachpausen

Also Published As

Publication number Publication date
US4752958A (en) 1988-06-21
DE3470240D1 (en) 1988-05-05
JPS60153100A (ja) 1985-08-12
IT1160148B (it) 1987-03-04
EP0154020A1 (de) 1985-09-11
JPH0680480B2 (ja) 1994-10-12
IT8368320A0 (it) 1983-12-19
EP0154020B1 (de) 1988-03-30
CA1212179A (en) 1986-09-30

Similar Documents

Publication Publication Date Title
DE154020T1 (de) Sprecher-verifikationssystem.
DE3310335C2 (de)
DE3233637C2 (de) Vorrichtung zur Bestimmung der Dauer von Sprachsignalen
DE2613258A1 (de) System zur automatischen spracherkennung
Kuczura Queues with mixed renewal and Poisson inputs
DE2659096A1 (de) Verfahren und vorrichtung zur spracherkennung
EP0296588A2 (de) Verfahren und Schaltungsanordnung zum automatischen Wiedererkennen von Signalfolgen
DE3612347A1 (de) Sammelverfahren von feuerdaten und feuerdetektor, der dieses verfahren verwendet und feuermeldeanlage, die ebenfalls dieses verfahren verwendet
DE2753277A1 (de) Spracherkennungseinrichtung
DE3009677A1 (de) Verfahren zur erkennung von sprache und sprachpausen
DE69836472T2 (de) Tonverarbeitungsverfahren, tonprozessor und aufzeichnungs-/wiedergabevorrichtung
DE2104622C3 (de) Verfahren und Schaltungsanordnung zur Synchronisation von Signalen
DE3043516C2 (de) Verfahren und Vorrichtung zur Spracherkennung
EP0285222B1 (de) Verfahren zum Erkennen zusammenhängend gesprochener Wörter
DE60308921T2 (de) Verfahren und Vorrichtung zur Grundfrequenz-Extraktion mittels Interpolation für Sprachkodierung
DE2544121A1 (de) Digitaler pegelregler
DE2921012C2 (de) Vorrichtung zum Bestimmen der Fertigkeit des Sprechens einer zu untersuchenden Person
DE2431458C2 (de) Verfahren und Anordnung zur automatischen Sprechererkennung
DE1962759A1 (de) Vocoder
DE69911964T2 (de) Leistungsmessung von fernmeldesystemen
EP0803861B1 (de) Verfahren zum Ableiten charakteristischer Werte aus einem Sprachsignal
DE1547027C3 (de) Verfahren und Anordnung zur Konsonantenbestimmung in Sprachsignalen
DE4022387C2 (de)
DE19711057A1 (de) Synchronsignal-Erfassungsvorrichtung
DE3490580C2 (de)