DE3035565A1 - Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen - Google Patents

Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen

Info

Publication number
DE3035565A1
DE3035565A1 DE19803035565 DE3035565A DE3035565A1 DE 3035565 A1 DE3035565 A1 DE 3035565A1 DE 19803035565 DE19803035565 DE 19803035565 DE 3035565 A DE3035565 A DE 3035565A DE 3035565 A1 DE3035565 A1 DE 3035565A1
Authority
DE
Germany
Prior art keywords
value
signal
distance
signals
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19803035565
Other languages
English (en)
Inventor
Rudolf Dipl.-Ing. 2000 Hamburg Geppert
Hermann Dipl.-Phys. Ney
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philips Intellectual Property and Standards GmbH
Original Assignee
Philips Patentverwaltung GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Patentverwaltung GmbH filed Critical Philips Patentverwaltung GmbH
Priority to DE19803035565 priority Critical patent/DE3035565A1/de
Priority to CA000385936A priority patent/CA1176755A/en
Priority to GB8127964A priority patent/GB2085208B/en
Priority to JP56147041A priority patent/JPS5786900A/ja
Priority to US06/304,294 priority patent/US4471453A/en
Priority to FR8117749A priority patent/FR2491235B1/fr
Publication of DE3035565A1 publication Critical patent/DE3035565A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Complex Calculations (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

ό L;.:■!~ /> ο
PHILIPS PATENTVERWALTUNG GMBH-O- PHD 80-1:0
"Verfahren zur nichtlinearen Zeitanpassung von Signalverläufen"
Die Erfindung betrifft ein Verfahren zum nichtlinearen Anpassen des Zeitverlaufes eines Testsignals an den Zeitverlauf eines vorgegebenen Referenzsignals, wobei beide Signale in regelmäßig aufeinanderfolgenden Zeitabständen abgetastet und die Abtastwerte gespeichert werden und die Folge der Kombinationen jeweils eines Test-Abstandswertes *·*. und eines Referenz-Abstandswertes, deren akkumulierten Unterschiede ein Minimum ergeben, bestimmt wird, indem ausgehend von den Unterschiedswerten des ersten Abtastwertes beider Signale für weitere Kombinationen von Abtastwerten, wobei für jeden der aufeinanderfolgenden Abtastwerte des einen Signals nacheinander jeweils einer von mehreren aufeinanderfolgenden Abtastwerten des anderen Signals verwendet wird, ein Abstandsmaß aus dem Unterschiedswert der Abtastwerte dieser Kombination und dem minimalsten der drei in Richtung der vorhergehenden Abstandswerte unmittelbar benachbarten, bis dahin ermittelten Abstandswerte ermittelt wird.
*"*" 20 Ein derartiges Verfahren ist bekannt aus der Zeitschrift "IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING',' VOL. ASSP-26, NO. 1, FEBRUARY 1978, Seiten 43 bis 49 für die Anwendung von Spracherkennung. Dabei werden abhängig davon, ob eine symmetrische Zeitanpassung durch eine zeitliche Verzerrung beider Signale oder eine asymmetrische Zeitanpassung durch zeitliche Verzerrung nur eines Signalverlaufes erfolgt und abhängig davon, in welcher Richtung der minimale benachbarte Abstandswert liegt, verschiedene Gewichte bei der Berücksichtigung des Unterschiedswertes der Abstandswerte verwendet. Ferner werden für die optimale Folge der Kombi-
BAD ORIGINAL
?HD 30-1JO
nationen dsr Abstandswert«? beider Signale gewisse Beschränkungen aufgestellt, die zusätzlichen Rechenaufwand erfordern. Der bei der Verarbeitung der letzten Abstandswerte beider Signale gefundene Abstandswert wird durch eine von den verwendeten Gewichten abhängige Zahl dividiert, um ein Gesamtabstandsmaß für die beiden Signalverläufe zu erhalten, das für die Erkennung des gesprochenen Wortes verwendet 1tfird. Für die Berechnung eines neuen Abstandswertes muß jeweils auf eine Anzahl weiter zurückliegender Abstandswerte zurückgegriffen werden, so daß diese alle abgespeichert werden müssen. Dieses bekannte Verfahren erfordert daher außer einem großen Rechenaufwand auch einen ganz erheblichen Speieher
■ - - " Aufgabe der Erfindung ist es, ein Verfahren der eingangs genannten Art anzugeben, das weniger Rechenaufwand und vor allem weniger Speicherplatz erfordert.
Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß
außer den Abtastwerten der beiden Signale lediglich die Abstandsmaße, die für den gerade verarbeiteten Abtast- vjert des einen Signals ermittelt worden sind, und die Abstandsmaße für den vorhergehenden Abtastwert dieses Signals von den noch zu verarbeitenden Abtastwerten des anderen Signals einschließlich des zuletzt verarbeiteten Abtastwertes an gespeichert werden und daß für jeden Abstandswert die Summe aus dem Unterschiedswert der zugehörigen Abtastwerte beider Signale und dem einfachen minimalen benachbarten Abstandswert unabhängig von dessen Lage gebildet wird. Auf diese Weise werden jeweils nur die Abstandsmaße höchstens einer Zeile, wenn die Abstandsmaße in Form einer Matrix mit den Ordnungszahlen der Abtastwerte der beiden Signale als Koordinaten angeordnet angenommen werden, abgespeichert sowie maximal drei zusätzliche Abstandswerte, die im momentanen Verarbeitungs-
BAD ORIGINAL
a « O O
PHD
schritt verwendet werden. Dadurch ist nur ein kleiner Speicher erforderlich, und die Verarbeitung der *'rerte erfolgt immer in der gleichen "ieise mit einer Tost eingestellten arithmetischen Recheneinheit.
In vielen Fällen sollen Signalverläufe aneinander angepaßt werden, bei denen jedes Signal mehrere Komponenten aufweist, wie dies beispielsweise bei Sprachsignalen der Fall ist, die durch eine Filterbank in eine Anzahl S-oektralbereiche aufgeteilt sind. Dabei können für die Auswertung des Testsignals mehrere Abstandswerte gewonnen werden, indem das erfindungsgemäße Verfahren auf jede Komponente des Sprachsignals getrennt angewendet wird. Dabei kann jedoch eine unterschiedliche Zeitanpassung verschiedener Komponenten erfolgen, die dem tatsächlichen Unterschied zweier Sprachsignale nicht zutreffend entspricht und die falsche bzw. nicht optimale Ergebnisse liefert. Beispielsweise kann der Lautstärkeverlauf eines Testsignals an ein Referenzsignal zeitlich angepaßt werden, und a.us dem verbleibenden Unterschied bei der Anpassung kann, wenn mit mehreren verschiedenen Referenzsignalen für verschiedene Wörter verglichen wird, das Referenzsignal mit bester Übereinstimmung ermittelt werden. Damit sind aber nur die lauttypischen Merkmale erfaßt. Um nun auch die sprechertypischen Merkmale zusätzlich zu erfassen, ist das erfindungsgemäße Verfahren nach einer Ausgestaltung, der Erfindung für Signale mit mehreren, untereinander gleichartigen Komponenten dadurch gekennzeichnet, daß das Verfahren auf die Komponenten getrennt parallel angewendet wird, wobei nur für eine Komponente der minimale der drei benachbarten Abstandsmaße ermittelt und für die anderen Komponenten das diesem minimalen Abstandsmaß entsprechende Abstandsmaß für die Ermittlung des nächsten Abstandsma.ßes übernommen wird. Für den vorstehend geschilderten Fall ist die eine Komponente, bei der das minimale benachbarte Abstandsmaß ermittelt wird, bei-
BAD ORIGINAL
PHD 80-1 30
spielsweise die Lautstärke, während die anderen Komponenten die Intensität der Spektralanteile darstellen. Dadurch ergeben sich mehrere Gesamt-Abstandsmaße, die für die endgültige Entscheidung verwendet werden können.
Diese mehreren Abstandsmaße stellen jedoch einen Rechenaufwand dar, der nicht immer notwendig ist. Häufig genügt es auch, mehrere oder alle Komponenten zu einem mehrdimensionalen Vektor zusammenzufassen, so daß eine entsprechend geringere Anzahl von Gesamt-Abstandswerten entsteht. Eine weitere Ausgestaltung der Erfindung ist daher dadurch gekennzeichnet, daß aus mehreren gleichartigen Komponenten jeweils eines Abstandswertes beider Signale ein einheitlicher Unterschiedswert bestimmt" wird.
Dafür können auch alle Komponenten des Signals außer der einen Komponente, für die die Zeitanpassung bestimmt wird, zusammengefaßt werden, beispielsweise bei einem Sprachsignal alle Spektralkomponenten.
Der Unterschiedswert jeweils eines Abtastwertes beider Signale kann für eindimensionale Signale mit nur einer Komponente die unmittelbare Differenz sein. Bei Signalen mit mehreren Komponenten kann der sogenannte City-Block-Abs tand verwendet werden, der aus der Summe der Abstände der einzelnen Komponenten entsteht, oder der euklidische Abstand, .
Für eine einfache Weiterverarbeitung der durch das erfindungsgemäße Verfahren ermittelten Abstandswerte ist es zweckmäßig, daß alle für den letzten Abtastwert beider Signale ermittelten Abstandswerte unmittelbar einer Klassifikationseinrichtung zugeführt werden. Eine Zwischen verarbeitung der Gesamt-Abstandswerte, beispielsweise die Division durch einen die Zeitdauer bzw. die Anzahl der Abtastwerte berücksichtigenden Wert, ist nicht notwendig, wenn jeweils auf das Referenzsignal bezogen wird.
y ψ ft β
mc *
PHD 80-1^0
Ausführungsbeispiele der Erfindung Werfen nachstehend.
anhand der Zeichnung näher erläutert. Es zeigen:
Fig.1 Diagramme zur Erläuterung des Prinzips der Zeitanpassung ,
Fig.2 ein Flußdiagramm des erfindungsgemäßen Verfahrens.
Fig.? eine Anordnung 7,ur Durchführung des »rfin^ungsgemäßen Verfahrens.
In Fig. 1a ist eine Matrix von vierten angegeben, die die Unterschiede bzw. die Abstände jedes Abtastwertes des einen Signals gegenüber jedem Abtastwert des anderen Signals enthält. Das eine Signal A mit den Abtastwerten a. ist an der linken Seite der Matrix angegeben, wobei daneben noch die Zahlenwerte der einzelnen Abtastwerte angegeben sind. Zur einfacheren Erläuterung ist hier zunächst angenommen, daß es sich um ein eindimensionales Signal mit nur einer Komponente handelt. Die Ordnungsnummer i der einzelnen Abtastwerte ist dabei nicht einzeln angegeben.
In entsprechender Weise ist das Testsignal B mit den Abtastwerten b. am unteren Rand der Matrix aufgetragen, wobei ebenfalls die Zahlenwerte der einzelnen Abtastwerte angegeben sind. Die Unterschiedswerte d.. in der Matrix können auf verschiedene Weise bestimmt werden. Die einfachste Methode ist. der City-Block-Abstand, der für Signale mit mehreren Komponenten wie folgt lautet:
&~ '
Für Signale mit nur einer Komponente reduziert sich diese Gleichung auf den Betrag der Differenz der beiden Abtastwerte. Auf diese letztere Weise sind in dem hier beschriebenen Beispiel die Werte der Matrix gewonnen, wie sich leicht nachrechnen läßt.
BAD ORIGINAL
ΌΗη ^0-1
Eine andere Möglichkeit ist der quadrierte euklidische Abstand, bei dem die Quadrate ^er Differenzen einzelnen Komponentenwerte aufsummiert
In der Matrix sind bei den hier angenommenen etvas idealisierten Werten eine ganze Anzahl Kombinationen von Abtastwerten beider Signale vorhanden, ^eren Unterschied 0 ist, d.h. die beiden Abtastwerte stimmen exakt '"iberein. Eine optimale Zeitanpassung beider Signalverläufe, di^ also angibt, welche Abtastwerte beider Signale jeweils paarweise einander zuzuordnen sind, wobei einzelne Abtastwerte eines der beiden Signale mehreren aufeinanderfolgenden Abtastwerten des jeweils anderen Signals zugeordnet werden können, ist also eine solche Folge von jeweils waagerecht, senkrecht oder diagonal benachbarten Matrixwerten, daß diese Matrixwerte aufsummiert ein Gesamtminimum ergeben. Dieses Minimum gibt dann ein Maß für die Übereinstimmung bzw. für den Gesamtabstand der beidon Signalverläufe an. Eine solche Folge ist in Fig.2a durch Verbindung der entsprechenden Matrixpunkte mittels einer Linie angedeutet. Es sei bemerkt, daß diese angegebene Verbindung nicht die einzig mögliche ist, die ein Minimum ergibt, sondern insbesondere rechts oben in der Matrix sind an einzelnen Stellen um. eine Matrixzeile versetzte Verbindungen möglich, ohne diesen optimalen Weg zu verlassen. Diese Mehrdeutigkeit kann beispielsweise dadurch bedingt sein, daß beide Signalverläufe für mehrere Abtastwerte stationär sind, oder daß ein Abtastwert des einen Signals in der Mitte zwischen zwei aufeinanderfolgenden Abtastwerten des anderen Signals liegt, so daß beide Zuordnungen einen gleich großen Fehler ergeben.
In den meisten Fällen, insbesondere bei Erkennungsproblemen, kommt es aber nicht auf den genauen Verlauf der optimalen Folge von Abtastwertepaaren an, sondern es interessiert lediglich der Gesamtabstand zwischen beiden Signalver-
BAD ORIGINAL
-· U J '-'.■ ■-
# * -1 * A » it « ft * β
-θ-
PHD 80-^30
laufen, d.h. die Summe r!er Untersohieswerte in dieser Folge.
Die Bestimmung dieses Gesamtabstandswertes wird nun anhand der in Fig.2b dargestellten Matrix erläutert, die Abstandsmaße D. . angibt. "Die in dieser Abstandsma ßmatrix angegebenen Werte werden auf folgende Weise bestimmt:
D(i,j) = d(i,.j) + min
Für die Werte in der untersten Zeile und der linken Spalte dieser Matrix sind dies die jeweils aufakkumulierten Unterschiedswerte, die in der Matrix in Fig.1a angegeben sind, und. diese ergeben sich in der genannten Gleichung beispielsweise automatisch dadurch, wenn für die benachbarte nicht vorhandene Zeile bzw. Spalte ein Maximalwert, angenommen wird, der von den tatsächlichen Unterschiedswerten sicher überschritten wird.
Da für einen neuen Abstandsmaßwert jeweils nur die Abstandsmaße berücksichtigt v/erden, die zu zeitlich vorhergehenden bzw. gleichzeitigen Abtastwerten der Signale gehören, ergibt sich eine Vorzugsrichtung der optimalen Folge von Werten in der Matrix, die etwa diagonal von links unten nach rechts oben verläuft. Diese Diagonale entspricht der Tatsache, daß für beide Signale die Zeit nur in eine Richtung läuft. Aus dem entsprechenden Grund ist in Fig.1b auch nur ein Teil der gesamten Matrix dargestellt, nämlich solange in diesem Beispiel die Werte noch einstellig sind, da die nicht dargestellten Werte wegen der Summierung nur größer sein können und somit nicht die optimale Folge von Werten enthalten können.
Für die Bestimmung der optimalen Folge von Abtastwertpaaren beider Signale bzw. des Gesamtabstandsmaßes zwischen beiden Signalen ist es nun nicht notwendig, die gesamte
BAD ORIGINAL
« * et« « »η« ι φ β *
PHD 80-130
Matrix der Abstandswerte oder auch rar die in Fig. .1 b dargestellten Werte zu speichern, sondern es werden lediglich die Werte maximal einer Zeile dieser Matrix s'owi-= A ie drei gerade verarbeiteten Werte zwischengespeichert. Dabei wird davon ausgegangen, daß jeweils für einen Abtaet-'wert des einen Signals a. nacheinander mehrere aufeinanderfolgende Abtastwerte des anderen Signals b. verarbeitet werden. Zunächst werden die Werte der untersten Zeile der Matrix der Abstandsmaße durch Aufsummieren der Unterschiedswerte der entsprechenden Abtastwerte beider Signale bestimmt, wie vorher für die Anfangswerte angedeutet wurde, und zwar bis ein vorgegebener G-renzwert überschritten wird, der hier gleich 9 ist. In dieser Zeile verläuft die optimale Folge von Werten so lange, bis nach minimalen Wert, d.h. in dieser Zeile der Wert 0, der erste größere Wert auftritt, d.h. diese Zeile gibt drei Werte . der optimalen Folge an, die hier wieder als Verbindung der • entsprechenden Werte angedeutet ist. Dies bedeutet, daß die ersten drei Abtastwerte des Testsignals dem ersten Abtastwert des Referenzsignals zuzuordnen ist.
In der nächsten Zeile werden die Unterschiedswerte der Größe 1 zu den kleinsten benachbarten Abstandsmaßen addiert, die zunächst den Wert O haben, so- daß- die Werte der zweiten Zeile zunächst mit den Werten der zweiten Zeile der Ma£r:Lx in Fig. 1a übereinstimmen. Erst in der fünften Zeilerkein benachbarter Abstandsmaßwert gleich 0, so daß nun in dieser Zeile die Abstandsmaße größer werden, d.h. für die optimale Zeitanpassung ist der vierte Abtastwert des Testsignals dem zweiten Abtastwert des Referenzsignals zuzuordnen. In dieser Weise geht die Verarbeitung schrittweise weiter, wobei jeweils die bisher ermittelten Abstandsmaßwerte der gleichen Zeile bis zu dem jeweils in Verarbeitung befindlichen Punkt gespeichert sind, und für die folgenden Punkte sind die Abstandsmaßwerte der vorhergehenden Zeile gespeichert.
BAD ORIGINAL
PHO 80-1 30
Aus dem Verlauf der Folge der durch den Strich miteinander verbundenen Werte int zu erkennen, daß ein Wert in dieser Folge ,jex^eils ^nn größer wird, wenn an dieser Stelle der Unterschiedswert von 0 verschieden ist. Daraus
S geht aber außerdem hervor, daß nach Verarbeitung der letzten, obersten Zeile ein Abstandsmaßwert erhalten wird, der gleich der Summe der Unterschiedswerte in der optimalen Folge der Kombinationen jeweils eines Abtastwertes der beiden Signale ist. Dieses zuletzt erhaltene Abstandsmaß gibt somit den Gesamtabstand zwischen beiden Signalen an. Dieser Wert wird also unmittelbar gewonnen, ohne daß die ganze Matrix der Abstandsmaße ermittelt und zwischengespeichert wird, sondern es genügt die Zwischenspeicherung der Werte ,jeweils höchstens einer Zeile der Matrix.
In Fig.2 ist ein Flußdiagramm dargestellt, das die richtige Reihenfolge der einzelnen Verarbeitungsschritte und deren Wiederholung genauer angibt. Das Symbol 100 gibt symbolisch den Start des Ablaufes an. In dem Block 101 wird dem ersten Wert der Matrix der Abstandsmaße der Wert 0 zugewiesen, da angenommen wird, daß zu Beginn beide Signale übereinstimmen, da sie beide bei 0 beginnen.
In dem Block 102 wird der Index i tun 1 erhöht, d.h. es wird auf die Werte der nächsten Zeile der Matrix übergegangen. In dem Block 103 wird den beiden Größen X und Y jeweils ein Grenzwert zugeordnet, der beispielsweise gleich oder größer ist als die größte Zahl, die in der Matrix in Fig.1b noch dargestellt wird. Die Größen X und Y sind zusammen mit einer weiteren Größe Z drei Werte, Λ ie bei der Berechnung der Abstandsmaße jeweils zwischengespeichert werden, da diese Werte die je\-/eils benachbarten AbstandsmaGe in jedem Verarbeitungsschritt darstellen, von denen das Minimum verwendet wird, um das neue Abstandsmaß zu ermitteln. Bezogen auf die Anordnung der Werte
BAD ORIGINAL
β V
PHD 80-130
in einer Matrix sind diese Werte solchen Matrizcpunkten zugeordnet, wie dies aus der symbolischen Darstellung der vier Punkte neben den Blöcken 10? und 10? hervorgeht. Her nicht bezeichnete Punkt gibt den Punkt an, für den ^as 'neue Abstandsmaß ermittelt werden soll.
In dem Block 104 wird der Index ,i um jeweils 1 erhöht, d.h. es wird in der Zeile zum nächsten Wert gegangen.
In dem Block 105 erfolgt die eigentliche Verarbeitung. Die Größe Z erhält das Abstandsmaß D (i-1,j) aus der vorhergehenden Zeile an der betreffenden Stelle. Die Größe X erhält die Summe aus dem Unterschiedswert, der hier der Betrag aus der Differenz der Abtastwerte der beiden Signale a(i) und b(j) ist, und dem minimalen Wert der Größen X, Y und Z, wobei für die Größe X der bis dahin gültige Wert verwendet wird. Auf diese Weise erhält die Größe X jeweils den aktuellen Wert, so daß bei der Realisierung ein gesonderter Speicherplatz für das Srgebnis gespart wird. Anschließend wird der so ermittelte Wert der Größe X in dem Speicher für die Abstandsmaße abgespeichert. Schließlich erhält die Größe Y den Wert der Größe Z. Wenn beim nächsten Durchgang die Größe Z dann den Wert des Abstandsmaßes der vorhergehenden Zeile und des nächsten Punktes erhält, ist auf diese Weise die dargestellte Anordnung aus den vier Punkten in der Matrix um einen Schritt nach rechts gerückt.
In dem Block 106 wird geprüft, ob bereits alle Punkte einer Zeile verarbeitet sind. Wenn dies nicht der Fall ist, wird der Index j ein weiteres Mal erhöht, wenn aber der Maximalwert J überschritten ist, folgt in dem Block 107 eine weitere Abfrage darauf, ob alle Zeilen verarbeitet sind. Wenn dies nicht der Fall ist, wird"wieder auf den Block 102 zurückgegangen und der Index i für die Zeile um 1 erhöht und der Ablauf fortgesetzt. Wenn die letzte Zeile
SAD ORfGiNAL
♦ * ♦ c
β « β ·
U J U .. O
PHD 80-130
verarbeitet ist, wird der Ablauf beendet, und der in diesem Augenblick erreichte 'vert e'er Größe X stellt ^s Gesamtabstandsmaß zwischen beiden Signalen dar.
Dieses Beispiel vnxr^.e wieder der Einfachheit halber für ein Signal mit nur piner Komponente erläutert. Wenn es sich um ein Signal mit mehreren Komponenten handelt, deren vektorieller Unterschied bestimmt wird, muß lediglich im Block 105'bei der Berechnung des neuen Wertes für die Größe X statt des Betrages der Differenz der beiden Abtastwerte" der entsprechende vekt.orielle Unterschiedswert eingesetzt werden. Auch dabei ergibt sich schließlich ein einziger Wert für das Gesarat-Abstandsmaß.
Falls es sich bei den Signalen beispielsweise um Sprachsignale handelt, bei denen der Verlauf der Lautstärke zeitlich an ein Referenzsignal angepaßt werden soll und außer dem dabei entstehenden Abstandsmaß außerdem ein oder mehrere Abstandsmaße einer oder mehrerer anderer Komponenten für das so zeitlich angepaßte Signal bestimmt werden soll, erfolgt der Ablauf ii weitgehend gleicher Weise. Ks müssen lediglich für jede getrennt zu verarbeitende Komponente eine eigene Gruppe von Größen X,Y und Z vorgesehen werden, und im Block 105 wird nur für die eine Komponente, die die zeitliche Anpassung bestimmt, der neue Wert für die Größe X aus dem Minimum der Werte der Größen X,.Y und Z bestimmt, während für die anderen Komponenten der jeweils entsprechende Wert dieser Komponente übernommen wird. Wenn also für die bestimmende Komponente in einem bestimmten Punkt, d.h. für ein bestimmtes Wertepaar γοη i und j der Wert der Größe Y ein Minimum ist, wird, der entsprechende Wert der Größe Y für die anderen Komponenten ebenfalls für die Bestimmung des Abstandsrn&Scs dieser anderen Komponente verwendet, auch wenn dort nicht der Wert der Größe Y das Minimum darstellt. Der Block 105 muß also für jede Komponente ge-
PHD 80-1 30 trennt durchgeführt werden.
Eine Anordnung zur Bestimmung ^er Gesamt-Abstandsmaße eines Sprachsignals mit mehreren Komponenten, bei der die Berechnung jedes neuen Abstandsmaßes für die Komponenten getrennt erfolgt, ist in Fig.3 dargestellt.
In dieser Anordnung enthält ein Speicher 12 die Abtastwerte der Lautstärke des Testsignals, und ein Speicher enthält die entsprechenden Abtastwerte des Referenzsignals, Ferner ist noch ein Speicher 32 vorgesehen, der die Abtastwerte der übrigen Komponenten, beispielsweise der Spektralwerte des Sprachsignals, enthält, und ein Speicher 34 enthält die entsprechenden Abtastwerte des Referenzsignals. Zvir Adressierung ist ein Zähler 2 vorgesehen, dessen Ausgänge, die den Index j angeben, parallel auf die Adresseneingänge der Speicher 12 und 32 sowie ferner auf die Adresseneingänge von weiteren Speicher 22 und 42 geführt sind, und das Übertragssignal des Zählers 2 führt auf den Zähleingang eines Zählers 4, dessen parallelen Ausgänge, die den Zeilenindex i angeben, mit den Adresseneingängen der Speicher 14 und 34 verbunden sind. Der Zähltakteingang des Zählers 2 erhält einen Zähltakt ClI. Durch diese Verbindung der Zähler werden die Speicher 12 und 32 sowie die später zu erläuternden Speicher 22 und für jede Adresse der Speicher 14 und 34 wiederholt aufeinanderfolgend adressiert. Eine Beschränkung der Berechnung der Abstandsmaße auf die in Fig.1b angegebene Anzahl bzw. Verteilung ist hier der Einfachheit halber nicht näher angegeben.
Für eine bestimmte Stellung der Zähler 2 und 4 werden die entsprechenden Speicher 12, 14, 32, 34, 22 und 42 ausgelesen, wobei die letzteren später erläutert werden. Die Speicher 12 und 14 liefern je einen Abtastwert b(j) und a(i) der Lautstärke, die auf eine Betrag bildende
BAD ORIGINAL
»« 4
Oo r- r- ο Γ-ODObD
PHD
Subtrahiereinrichtung 16 geführt sind. Deren Ausgang liefert also den Unterschiedswert d(i,ö) der Lautstärke zwischen zwei Abtastwerten, der auf den einen Eingang eines Addierers 18 geführt ist. Der andere Eingang dieses Addierers erhält aus dein Miniinalwertbestimmer 26 den minimalen Wert der drei Größen X,Y und Z, die in den Registern 20 und 24 enthalten sind. Der Ausgangswert des Addierers 18, der das Abstandsmaß D(i,j) liefert, führt auf ein Register 20 und wird dort mit einem Taktsignal C13 übernommen. Mit einem darauf folgenden Taktsignal C14 wird der Inhalt des Registers 20, der die Größe X darstellt, in den Speicher 22 in die Speicherzelle mit der Adresse übernommen, die durch den Zähler 2 angegeben wird. Vorher war aus diesem Speicher 22 dar, Abstandsmaß D(i-1,j) der vorhergehenden Zeile incter gleichen Spalte ausgelesen und dem Register 24 zugeführt worden, wo es mit dem Taktsignal C12 eingeschrieben wurde. Dieses Register 24 ist zweckmäßig ein zweistufiges Schieberegister, das gleichzeitig mit dem Übernehmen eines neuen Wertes den alten Wert in die zweite Stufe schiebt und den darin enthalten gewesenen Wert löscht. Das Taktsignal C12 folgt mindestens eine solche Zeit nach dem Taktsignal CH, wie der Speicher 22 von dem Anlegen einer Adresse bis zur Ausgabe des Inhaltes der adressierten Speicherzelle benötigt. Auf diese Weise enthält das Register 20 gerade das Abständsmaß des in der gleichen Zeile vorhergehenden Punktes, und das Register 24 enthält jeweils die Abstandsmaße des vorhergehenden und des gleichen Punktes der vorhergehenden Zeile. Auf diese Weise wird die in dem Block 105 der Fig.2 angegebene Verarbeitung einfach durchgeführt.
Parallel dazu werden die Abtastwerte der anderen Komponenten b"(o) und ä(i) des Testsignals und des Referenzsignals ausgelesen und einer Anordnung 36 zugeführt, die auf eine der bekannten Weisen den Unterschiedswert d"(i,j)
ORIGINAL INSPECTED
ι' m λ um * · we * ■
PHD 80-1
ermittelt und dem einen Eingang eines Addierers 38 zuführt. Der andere Eingang des Addierers erhält über einen Selektor 48, der von dem Minimalwertbestimmer 26 gesteuert wird, den Wert der Größe X, Y und Z, der auch von dem Minimalwertbestimmer 26 ermittelt wurde. Die Werte dieser Größen werden den Registern £-0 und Zl4 bzw. dem Speicher 42 entnommen, wobei diese Elemente in gleicher Weise gesteuert werden wie die entsprechenden Elemente 20, 24 und 22 auf der linken Seite.
Sobald der Zähler 4 einmal alle Adressen der Speicher bzw. 34 einmal abgegeben hat und beispielsweise danach ein Übertragssignal abgibt, wird die Verarbeitung beendet, und die dann in den Registern 20 und 40 enthaltenen Gesamt-Abstandsmaße werden an den Ausgängen 29 und 49 abgegeben und einer KIassifikationseinrichtung zugeführt, die bestimmt, ob das Testsignal ausreichende Übereinstimmung mit dem Referenzsignal hat.
BAD ORIGINAL

Claims (4)

* η νι PHD 80-130 Pate ntansprüche
1. Verfahren zum nichtlinearen Anpassen des Zeitverlaufes eines Testsignals an den Zeitverlauf eines vorgegebenen Referenzsignals, wobei beide Signale in regelmäßig aufeinanderfolgenden Zeitabständen abgetastet und die Abtastwerte gespeichert werden und die Folge der Kombinationen jeweils eines Test-Abstandswertes und eines Referenz-Abstandswertes, deren akkumulierten Unterschiede ein Minimum ergeben, bestimmt wird, indem ausgehend von den Unterschiedswerten des ersten Abtastwertes beider Signale für weitere Kombinationen von Abtastwerten, wobei für ,jeden der aufeinanderfolgenden Abtastwerte des einen Signals nacheinander jeweils einer von mehreren aufeinanderfolgenden Abtastwerten des anderen Signals verwendet wird, ein Abstandsmaß aus dem Unterschiedswert der Abtastwerte dieser Kombination und dem minimalsten der drei in Richtung der vorhergehenden Abstandswerte unmittelbar benachbarten, bis dahin ermittelten Abstandswerte ermittelt wird, dadurch gekennzeichnet, daß außer den Abtastwerten der beiden Signale lediglich die Abstandsmaße, die für den gerade verarbeiteten Abtastwert des einen Signals ermittelt worden sind, und die Abstandsmaße für den vorhergehenden Abtastwert dieses Signals von den noch zu verarbeitenden Abtastwerten des anderen Signals einschließlich des zuletzt verarbeiteten Abtastwertes an gespeichert werden und daß für jeden .Abstandswert die Summe aus dem Unterschiedswert der zugehörigen Abtastwerte beider Signale und dem einfachen minimalen benachbarten Abstandswert unabhängig von dessen Lage gebildet vrird.
2. Verfahren nach Anspruch 1, bei <äem beide Signale
ORIGINAL INSPECTED
80-130
mehrere untereinander gleichartige Komponenten aufweisen, dadurch gekennzeichnet,
daß das Verfahren auf die Komponenten getrennt parallel angewendet wird, wobei nur für eine Komponente der minimale der drei benachbarten Abstandsmaße ermittelt und für die anderen Komponenten das diesem minimalen Abstandsmaß entsprechende Abstandsmaß für die Ermittlung des nächsten Abstandsmaßes übernommen wird.
3. . Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß aus mehreren gleichartigen Komponenten jeweils eines Abtastwertes beider Signale ein einheitlicher Unterschiedswert bestimmt wird.
4. Verfahren nach Anstjruch 2 oder 3, dadurch gekennzeichnet ,
daß alle für den letzten Abtastwert beider Signale ermittelten Abstandswerte unmittelbar einer Klassifikations einrichtung zugeführt werden.
- .
ORIGINAL INSPECTED
DE19803035565 1980-09-20 1980-09-20 Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen Withdrawn DE3035565A1 (de)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE19803035565 DE3035565A1 (de) 1980-09-20 1980-09-20 Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen
CA000385936A CA1176755A (en) 1980-09-20 1981-09-15 Measuring mis-match between signals
GB8127964A GB2085208B (en) 1980-09-20 1981-09-16 Measuring mis-match between signals
JP56147041A JPS5786900A (en) 1980-09-20 1981-09-19 Method of and apparatus for measuring mismatching between signals
US06/304,294 US4471453A (en) 1980-09-20 1981-09-21 Measuring mis-match between signals
FR8117749A FR2491235B1 (fr) 1980-09-20 1981-09-21 Mesure de la discordance entre des signaux

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19803035565 DE3035565A1 (de) 1980-09-20 1980-09-20 Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen

Publications (1)

Publication Number Publication Date
DE3035565A1 true DE3035565A1 (de) 1982-05-06

Family

ID=6112462

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19803035565 Withdrawn DE3035565A1 (de) 1980-09-20 1980-09-20 Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen

Country Status (6)

Country Link
US (1) US4471453A (de)
JP (1) JPS5786900A (de)
CA (1) CA1176755A (de)
DE (1) DE3035565A1 (de)
FR (1) FR2491235B1 (de)
GB (1) GB2085208B (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3215868A1 (de) * 1982-04-29 1983-11-03 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zum erkennen der woerter in einer zusammenhaengenden wortkette
DE4444583A1 (de) * 1993-12-14 1995-06-22 Masaharu Ishii Vorrichtung und Verfahren zur Wahl von physikalischen Merkmalen entsprechenden Parametern

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4616333A (en) * 1984-06-05 1986-10-07 Elscint, Ltd. Data correlation system
CN101622668B (zh) * 2007-03-02 2012-05-30 艾利森电话股份有限公司 电信网络中的方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer
JPS5628278B2 (de) * 1973-12-24 1981-06-30
JPS592954B2 (ja) * 1975-12-25 1984-01-21 日本電気株式会社 パタンルイジドケイサンソウチ
JPS5535751A (en) * 1978-09-04 1980-03-12 Kurosaki Refract Co Ltd Smooth carrying method of powder particle
GB2094088B (en) * 1979-01-09 1983-05-18 Emi Ltd Correlation arrangements
JPS56162183A (en) * 1980-05-16 1981-12-12 Hitachi Ltd Pattern matching method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. 26, No. 1, Feb. 1978, p. 43-49 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3215868A1 (de) * 1982-04-29 1983-11-03 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zum erkennen der woerter in einer zusammenhaengenden wortkette
DE4444583A1 (de) * 1993-12-14 1995-06-22 Masaharu Ishii Vorrichtung und Verfahren zur Wahl von physikalischen Merkmalen entsprechenden Parametern
US6032106A (en) * 1993-12-14 2000-02-29 Ishii; Masaharu Apparatus and method for selecting parameters corresponding to physical characteristics
DE4444583B4 (de) * 1993-12-14 2004-09-30 Masaharu Nagoya Ishii Approximationsvorrichtung und Approximationsverfahren zum Bestimmen eines technischen Systems

Also Published As

Publication number Publication date
FR2491235B1 (fr) 1988-05-27
CA1176755A (en) 1984-10-23
JPS5786900A (en) 1982-05-31
FR2491235A1 (fr) 1982-04-02
GB2085208B (en) 1983-11-16
US4471453A (en) 1984-09-11
GB2085208A (en) 1982-04-21

Similar Documents

Publication Publication Date Title
DE2935261C2 (de) Anordnung zur Mustererkennung
DE3315108C2 (de)
DE2550645A1 (de) Digitale verarbeitungseinheit zur ableitung von daten aus binaeren bilddarstellungen
DE3732435C3 (de) Verfahren und eine Einrichtung zum Feststellen einander entsprechender Bereiche in mehreren Bildern
EP0312905A1 (de) Verfahren zur automatischen Zeichenerkennung
DE2748558C3 (de) Vorrichtung zum Prüfen der Echtheit von Banknoten
DE3632639C2 (de) Einrichtung zum Hochgeschwindigkeitsverarbeiten von Bilddaten durch Faltung
DE3904129A1 (de) Einrichtung zum ueberpruefen von dokumenten
DE3322705A1 (de) Verfahren und schaltungsanordnung zur videoschnellen bestimmung des medianwertes eines auswertefensters
DE3732459C2 (de)
DE19961817B4 (de) Frequenzabweichung detektierendes Gerät und Frequenzabweichungs-Detektionsverfahren
DE2355640A1 (de) Anordnung zur spektralanalyse von elektrischen signalen
DE1938804C3 (de) Numerische Frequenz-Empfangsvorrichtung
DE3733391A1 (de) Verfahren zur spracherkennung
DE2813157C2 (de) Gerät zur selbsttätigen, lageunabhängigen Mustererkennung
DE2461651C3 (de) Zählvorrichtung zum Zählen von Mustern
DE2920041C2 (de) Verfahren zum Verifizieren von Signalen, und Anordnung zum Durchführen des Verfahrens
DE3035565A1 (de) Verfahren zur nichtlinearen zeitanpassung von signalverlaeufen
DE4105516A1 (de) Verfahren und vorrichtung zur filterung von signalen
DE2805940A1 (de) Elektronisches steuersystem fuer analogschaltungen
DE3440522A1 (de) Anlage zur spektralanalyse
EP0272723B1 (de) Verfahren zur Bestimmung des zeitlichen Verlaufs eines Sprachparameters und Anordnung zur Durchführung des Verfahrens
DE1300974B (de) Verfahren zum Empfang und zur Auswertung im Zeitvielfachbetrieb von ueber individuelle Signalkanaele uebermittelten Wechselstromsignalen, insbesondere in Fernmeldeanlagen
DE69626928T2 (de) Vorrichtung zur Kontrolle der Farbe von Druckerzeugnissen
EP0703567B1 (de) Verfahren und Einrichtung zur Bestimmung eines Masses der Übereinstimmung zwischen zwei Mustern sowie Spracherkennungseinrichtung damit und Programmmodul dafür

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8139 Disposal/non-payment of the annual fee