EP0310636B1

EP0310636B1 - Abstandsmessungskontrolle eines multidetektorsystems

Info

Publication number: EP0310636B1
Application number: EP88901684A
Authority: EP
Inventors: David Lynn Thomson
Original assignee: American Telephone and Telegraph Co Inc; AT&T Corp
Current assignee: AT&T Corp
Priority date: 1987-04-03
Filing date: 1988-01-11
Publication date: 1992-09-09
Anticipated expiration: 2008-01-11
Also published as: DE3874471D1; WO1988007740A1; AU1242988A; SG59693G; JPH0795238B2; ATE80488T1; JPH01502853A; DE3874471T2; AU602957B2; HK108993A; CA1336212C; EP0310636A1

Claims

Vorrichtung zur Bestimmung des Vorhandenseins eines stimmhaften Lautes in Rahmen von Sprache mit einer Vielzahl von unabhängigen Detektoreinrichtungen (102, 103) zur Feststellung des stimmhaften Lautes in einem Rahmen,
dadurch gekennzeichnet,
daß jede der Detektoreinrichtungen eine Einrichtung (209) zur Berechnung eines Gütewertes umfaßt, der den Abstand zwischen stimmhaften und stimmlosen Sprachrahmen definiert, und
daß die Vorrichtung eine Einrichtung (104, 105) zur Auswahl einer der Detektoreinrichtungen für die Anzeige des Vorhandenseins des stimmhaften Lautes auswählt, wenn die gewählte Detektoreinrichtung einen Gütewert berechnet, der besser ist als der von jeder anderen Detektoreinrichtung berechnete Gütewert.
Vorrichtung nach Anspruch 1,
bei der die Berechnungseinrichtung jeder Detektoreinrichtung eine statistische Berechnung durchführt, um den Gütewert zu bestimmen.
Vorrichtung nach Anspruch 2,
bei der die statistischen Berechnungen Abstandsmessungsberechnungen sind.
Vorrichtung nach Anspruch 2,
bei der die eine Detektoreinrichtung eine Einrichtung umfaßt, die anzeigt, daß ein Rahmen stimmhaft ist, wenn der stimmhafte Laut festgestellt wird, und anzeigt, daß ein Rahmen stimmlos ist, wenn der stimmhafte Laut nicht vorhanden ist,
die Berechnungseinrichtung für die eine Detektoreinrichtung ferner eine Einrichtung zur Bestimmung einer Diskriminanzvariablen für jeden vorhergehenden und augenblicklichen Rahmen umfaßt,
ferner eine Einrichtung zur Bestimmung eines Mittelwertes für stimmhafte Rahmen der vorhergehenden und augenblicklichen Rahmen,
eine Einrichtung zur Bestimmung eines Varianzwertes für stimmhafte Rahmen der vorhergehenden und augenblicklichen Rahmen,
eine Einrichtung zur Bestimmung eines Mittelwertes stimmloser Rahmen der vorhergehenden und augenblicklichen Rahmen,
eine Einrichtung zur Bestimmung eines Varianzwertes stimmloser Rahmen der vorhergehenden und augenblicklichen Rahmen und
eine Einrichtung zur Bestimmung des Gütewertes für die eine Detektoreinrichtung aus den bestimmten stimmhaften Mittel- und Varianzwerten und den bestimmten stimmlosen Mittel- und Varianzwerten.
Vorrichtung nach Anspruch 4,
bei der die Einrichtung zur Bestimmung des Gütewertes für die eine Detektoreinrichtung eine Einrichtung zur Summierung der Varianzwerte umfaßt,
ferner eine Einrichtung zur Berechnung einer gewichteten Summe der Varianzwerte,
eine Einrichtung zum Subtrahieren des Mittelwertes der stimmlosen rahmen von dem Mittelwert der stimmhaften Rahmen,
eine Einrichtung zum quadrieren des subtrahierten Wertes und
eine Einrichtung zum Dividieren der gewichteten Summe durch die Summe der quadrierten Werte, wodurch der Gütewert für die eine Detektoreinrichtung erzeugt wird.
Vorrichtung nach Anspruch 5,
bei der die Einrichtung zur Berechnung der gewichteten Summe eine Einrichtung zur Berechnung eines ersten Wahrscheinlichkeitswertes umfaßt dafür, daß die eine Detektoreinrichtung das Vorhandensein des stimmhaften Lautes im augenblicklichen Rahmen anzeigt,
ferner eine Einrichtung zur Berechnung eines zweiten Wahrscheinlichkeitswertes dafür, daß die eine Detektoreinrichtung das Fehlen des stimmhaften Lautes im augenblicklichen Rahmen anzeigt,
eine Einrichtung zur Multiplikation der Varianz der stimmhaften Rahmen aus den vorhergehenden und augenblicklichen Rahmen mit dem ersten Wahrscheinlichkeitswert und der Varianz der stimmlosen Rahmen aus den vorhergehenden und augenblicklichen Rahmen mit dem zweiten Wahrscheinlichkeitswert und
eine Einrichtung zur Bildung der gewichteten Summe aus dem Ergebnis der Multiplikationen.
Vorrichtung nach Anspruch 6,
bei der die Divisionseinrichtung eine Einrichtung zur Multiplikation der Ergebnisse der Division der gewichteten Summe durch die Summe der quadrierten Werte mit dem ersten und dem zweiten Wahrscheinlichkeitswert umfaßt, um den Gütewert für die eine Detektoreinrichtung zu erzeugen.
Vorrichtung nach Anspruch 7,
bei der die Einrichtung zur Anzeige dafür, daß der Rahmen stimmhaft und stimmlos ist, eine Einrichtung umfaßt, die unter Ansprechen auf einen Satz von Sprachattribute des augenblicklichen Sprachrahmens definierenden Klassifizierangaben einen Satz statistischer Parameter berechnet,
ferner eine Einrichtung, die unter Ansprechen auf den berechneten Satz von Parametern einen Satz von Gewichtungen berechnet, die je einer der Klassifizierangaben zugeordnet ist, und eine Einrichtung, die unter Ansprechen auf den berechneten Satz von Gewichtungen und Klassifizierangaben sowie den Satz von Parametern das Vorhandensein des stimmhaften Lautes in dem Sprachrahmen bestimmt.
Vorrichtung nach Anspruch 8,
bei der die Einrichtung zur Berechnung des Satzes von Gewichtungen eine Einrichtung zur Berechnung eines Schwellenwertes unter Ansprechen auf den Satz von Parametern umfaßt,
ferner eine Einrichtung, die den Satz von Gewichtungen und den Schwellenwert an die Einrichtung zur Berechnung des Satzes von statistischen Parametern zur Verwendung für die Berechnung eines weiteren Satzes von Parametern für einen weiteren Sprachrahmen überträgt, und
wobei die Einrichtung zur Berechnung des Satzes statistischer Parameter ferner unter Ansprechen auf den übertragenen Satz von Gewichtungen und einen weiteren Satz von Klassifizierangaben, die die Sprachattribute des weiteren Rahmens definieren, einen weiteren Satz statistischer Parameter berechnet.
Vorrichtung zur Bestimmung des Vorhandenseins eines stimmhaften Lautes in Sprachrahmen mit
einer ersten Einrichtung (102) zur Erzeugung eines ersten Signals, das das Vorhandensein des stimmhaften Lautes in einem der Sprachrahmen anzeigt,
einer zweiten Einrichtung (103) zur Erzeugung eines zweiten Signals, das das Vorhandensein des stimmhaften Lautes in dem einen Sprachrahmen anzeigt,
dadurch gekennzeichnet,
daß die erste Einrichtung eine Einrichtung zur Berechnung eines ersten verallgemeinerten Distanzwertes umfaßt, der den Grad des Abstandes zwischen den stimmhaften und stimmlosen, durch die erste Einrichtung bestimmten Rahmen darstellt,
daß die zweite Einrichtung eine Einrichtung (206) zur Berechnung eines zweiten verallgemeinerten Distanzwertes aufweist, der den Grad des Abstandes zwischen stimmhaften und stimmlosen, durch die zweite Einrichtung bestimmten Rahmens darstellt, und
eine Einrichtung (104, 105) zur Auswahl des ersten Signals umfaßt, um das Vorhandensein des stimmhaften Lautes anzuzeigen, wenn der erste verallgemeinerte Distanzwert besser als der zweite verallgemeinerte Distanzwert ist, und zur Auswahl des zweiten Signals, um das Vorhandensein des stimmhaften Lautes anzuzeigen, wenn der zweite verallgemeinerte Distanzwert besser als der erste verallgemeinerte Distanzwert ist.
Vorrichtung nach Anspruch 10,
bei der die verallgemeinerten Distanzwerte die Mahalanobis-Distanzwerte sind.
Vorrichtung nach Anspruch 11,
bei der die erste Einrichtung ferner eine Einrichtung umfaßt, die unter Ansprechen auf einen Satz von Sprachattribute eines Sprachrahmens definierende Klassifizierangaben einen Satz von statistischen Parametern errechnet,
ferner eine Einrichtung, die unter Ansprechen auf den berechneten Satz von Parametern einen Satz von Gewichtungen berechnet, die je einer der Klassifizierangaben zugeordnet sind, und
eine Einrichtung, die unter Ansprechen auf den berechneten Satz von Gewichtungen und Klassifizierangaben sowie den Satz von Parametern das Vorhandensein des stimmhaften Lautes in dem Sprachrahmen bestimmt.
Vorrichtung nach Anspruch 12,
bei der die Einrichtung zur Berechnung des ersten verallgemeinerten Distanzwertes eine Einrichtung umfaßt, die unter Ansprechen auf den berechneten Satz von Parametern und den berechneten Satz von Gewichtungen den ersten verallgemeinerten Distanzwert bestimmt.
Vorrichtung nach Anspruch 13,
bei der die zweite Einrichtung ein Diskriminanten-Stimmhaft-Detektor ist.
Vorrichtung nach Anspruch 14,
bei der die Einrichtung zur Berechnung des zweiten verallgemeinerten Distanzwertes eine Einrichtung zur Bestimmung eines Mittelwertes für stimmhafte Rahmen der vorhergehenden und augenblicklichen Rahmen umfaßt, ferner eine Einrichtung zur Bestimmung eines Mittelwertes für stimmlose Rahmen der vorhergehenden und augenblicklichen Rahmen,
eine Einrichtung zur Bestimmung eines Varianzwertes der stimmlosen Rahmen von den vorhergehenden und augenblicklichen Rahmen und
eine Einrichtung zur Bestimmung des zweiten Distanzmeßwertes aus den bestimmten stimmhaften Mittel-und Varianzwerten sowie den bestimmten stimmlosen Mittel-und Varianzwerten.
Vorrichtung nach Anspruch 15,
bei der die Einrichtung zur Bestimmung des zweiten Distanzmeßwertes umfaßt:
eine Einrichtung zur Berechnung der gewichteten Summe der Varianzwerte,
eine Einrichtung zum Subtrahieren des Mittelwertes der stimmlosen Rahmen von dem Mittelwert der stimmhaften Rahmen,
eine Einrichtung zum quadrieren des subtrahierten Wertem und
eine Einrichtung zum Dividieren der gewichteten Summe der Varianzwerte durch die Summe der quadrierten Werte und dadurch Erzeugen des zweiten Distanzmeßwertes.
Verfahren zur Bestimmung des Vorhandenseins eines stimmhaften Lautes in Sprachrahmen unter Verwendung eines ersten und eines zweiten Stimmhaft-Detektorverfahrens (102, 103) zur Feststellung des stimmhaften Lautes in einem Rahmen,
gekennzeichnet durch:
Berechnen eines ersten Gütewertes, der den Abstand zwischen stimmhaften und stimmlosen Sprachrahmen durch das erste Stimmhaft-Detektorverfahren definiert, Berechnen eines zweiten Gütewertes, der den Abstand zwischen den stimmhaften und stimmlosen Sprachrahmen durch das zweite Stimmhaft-Detektorverfahren definiert, und
Auswählen (104, 105) des ersten Stimmhaft-Detektorverfahrens zur Anzeige des Vorhandenseins des stimmhaften Lautes, wenn der erste Gütewert besser als der zweite Gütewert ist, und
Auswählen des zweiten Stimmhaft-Detektorverfahrens des Anzeige des Vorhandenseins des stimmhaften Lautes, wenn der zweite Gütewert besser als der erste Gütewert ist.
Verfahren nach Anspruch 17,
bei dem der Schritt zur Berechnung des ersten und zweiten Wertes je den Schritt der Durchführung einer statistischen Berechnung zur Bestimmung des ersten bzw. zweiten Wertes umfaßt.
Verfahren nach Anspruch 18, bei dem die statistischen Berechnungen Distanzmeßberechnungen sind.
Verfahren nach Anspruch 18,
bei dem ferner die Schritte vorgesehen sind, anzuzeigen, daß ein Rahmen stimmhaft ist, wenn der stimmhafte Laut festgestellt wird, und daß ein Rahmen stimmlos ist, wenn das erste Stimmhaft-Detektorverfahren feststellt, daß der stimmhafte Laut nicht vorhanden ist, und wobei der Schritt zur Berechnung des ersten Wertes ferner die Schritte umfaßt:
Bestimmen einer Diskriminanzvariablen für jeden vorhergehenden und augenblicklichen Rahmen, Bestimmen eines Mittelwertes für stimmhafte Rahmen der vorhergehenden und augenblicklichen Rahmen,
Bestimmen eines Varianzwertes für die stimmhaften Rahmen der vorhergehenden und augenblicklichen Rahmen,
Bestimmen eines Mittelwertes für die stimmlosen Rahmen der vorhergehenden und augenblicklichen Rahmen,
Bestimmen eines Varianzwertes für die stimmlosen Rahmen der vorhergehenden und augenblicklichen Rahmen, und
Bestimmen des ersten Wertes aus den bestimmten stimmhaften Mittel- und Varianzwerten und den bestimmten stimmlosen Mittel- und Varianzwerten.
Verfahren nach Anspruch 20,
bei dem der Schritt zur Bestimmung des ersten Wertes die Schritte umfaßt:
Summieren der Varianzwerte,
Berechnen der gewichteten Summe der Varianzwerte,
Subtrahieren des Mittelwertes der stimmlosen Rahmen vom Mittelwert der stimmhaften Rahmen,
Quadrieren der subtrahierten Werte und
Dividieren der gewichteten Summe von Varianzwerten durch die Summe der quadrierten Varianzwerte und dadurch Erzeugen des statistischen Wertes.
Verfahren nach Anspruch 21,
bei dem der Schritt der Berechnung der gewichteten Summe die Schritte umfaßt:
Berechnen eines ersten Wahrscheinlichkeitswertes dafür, daß der Schritt zur Bestimmung des ersten Wertes das Vorhandensein des stimmhaften Lautes im augenblicklichen Rahmen anzeigt,
Berechnen eines zweiten Wahrscheinlichkeitswertes dafür, daß der Schritt der Bestimmung des ersten Wertes die Abwesenheit des stimmhaften Lautes im augenblicklichen Rahmen anzeigt,
Multiplizieren der Varianz der stimmhaften Rahmen von den vorhergehenden und augenblicklichen Rahmen mit dem ersten Wahrscheinlichkeitswert und der Varianz der stimmlosen Rahmen von den vorhergehenden und augenblicklichen Rahmen mit dem zweiten Wahrscheinlichkeitswert, und
Bilden der gewichteten Summe aus den Ergebnissen der Multiplikationen.
Verfahren nach Anspruch 22,
bei dem der Dividierschritt das Multiplizieren der Ergebnisse aus der Division der gewichteten Summe durch die Summe der quadrierten Werte mit dem ersten und dem zweiten Wahrscheinlichkeitswert zur Erzeugung des ersten Wertes umfaßt.