DE2939077A1 - Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal - Google Patents
Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignalInfo
- Publication number
- DE2939077A1 DE2939077A1 DE19792939077 DE2939077A DE2939077A1 DE 2939077 A1 DE2939077 A1 DE 2939077A1 DE 19792939077 DE19792939077 DE 19792939077 DE 2939077 A DE2939077 A DE 2939077A DE 2939077 A1 DE2939077 A1 DE 2939077A1
- Authority
- DE
- Germany
- Prior art keywords
- signal
- output
- arrangement
- value
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
Description
PHILIPS PATENTVERWALTUNG GMSH . : pHD 79_i04
-I"
Verfahren und Anordnung zum Bestimmen charakteristischer Werte aus einem Geräuschsignal"
Die Erfindung betrifft ein Verfahren zum Bestimmen charakteristischer
Werte aus einem zeitbegrenzten Geräuschsignal, insbesondere einem Sprachsignal eines Sprechers, bei dem
das Geräuschsignal in benachbarte Frequenzbereiche aufgeteilt und das Geräuschsignal jedes Frequenzbereiches jeweils
über aufeinanderfolgende gleiche Zeitabschnitte zu Kurzzeitspektrum-Signalen ontegriert wird, sowie eine Anordnung
zum Durchführen dieses Verfahrens.
Verfahren der obengenannten Art dienen dazu, anhand der
charakteristischen Werte Geräuschsignale, die nicht identisch reproduzierbar sind, zu erkennen bzw. zuzuordnen.
Solche Geräuschsignale können beispielsweise bei dem Prüfen oder dem Betrieb von Maschinen auftreten, wobei eine
Veränderung, die einen möglichen Ausfall der Maschine ankündigen kann, möglichst rechtzeitig erkannt werden
soll. Eine andere bedeutende Art von Geräuschsignalen sind Sprachsignale, anhand denen ein Sprecher erkannt bzw.
verifiziert werden soll. Derartige Geräuschsignale haben die Eigenschaft, daß sie allgemein nicht exakt reproduzierbar
sind und daß sie andererseits eine sehr große Anzahl von Informationen enthalten, so daß eine direkte
Speicherung zum Vergleich praktisch nicht in Frage kommt. Es ist daher notwendig, diese Informationsmenge stark zu
reduzieren, indem charakteristische Werte daraus abgeleitet werden. Diese charakteristischen Werte sollen möglichst
nur soviel Information enthalten, wie zur Kennzeichnung der Besonderheiten des jeweiligen Geräuschsignals
notwendig sind.
Es ist bereits bekannt, aus einem Geräuschsignal aufein-
13001S/0405
PHD 79-104
anderfolgende Kurzzeitspektren durch Integration der Energie des Geräuschsignals in benachbarten Frequenzbereichen
zu erzeugen. Aus diesen Kurzzeitspektren kann durch deren Summierung das Langzeitspektrum gewonnen werden,
und außerdem kann aus dem Langzeitspektrum und den Kurzzeitspektren die Standardabweichung für die einzelnen
Frequenzbereiche bestimmt werden. Dabei stellen also die Werte des Langzeitspektrums oder der Standardabweichungen
die charakteristischen Werte des Geräuschsignals bzw. Sprachsignals dar. Diese bekannten Verfahren ergeben Jedoch
häufig eine zu starke Reduzierung der Informationsmenge, so daß eine Unterscheidung ähnlicher Geräuschsignale
bzw. Sprachsignale nicht in einem ausreichenden Maße möglich ist.
Aufgabe der Erfindung ist es, ein Verfahren der eingangs genannten Art anzugeben, mit dem aus einem Geräuschsignal
bzw. Sprachsignal charakteristische Werte mit einer ausrei chenden Anzahl gewonnen werden können, die die Besonder-
heiten des zu prüfenden bzw. zu vergleichenden Geräuschsignals besonders gut enthalten. Diese Aufgabe wird erfindungsgemäß
dadurch gelöst, daß für jeden Frequenzbereich ein Histogramm der KurzzeitSpektrum-Signale gebildet wird,
indem die Anzahl Kurzzeitspektrum-Signale jedes Signal-
wertes gezählt wird, daß mindestens ein Bruchteil der Anzahl
der Kurzzeitspektrum-Signale je Frequenzbereich durch eine vorgegebene Quantilzahl dividiert und ein Quantilwert
gebildet wird, daß die Anzahl der Kurzzeitspektrum-Signale für aufeinanderfolgende Signalwerte, beginnend bei dem
niedrigsten Signalwert, summiert wird, bis jeweils ein
ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten ist, und daß die Signalwerte, bei denen
jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder übeerschritten ist, als die charakteristischen
Werte ausgegeben werden. Auf diese Weise werden die
130015/(UQS
*5 PHD 79-104
-3-
Histogramme der aufeinanderfolgenden Kurzzeitspektren in den einzelnen Frequenzbereichen verwendet, wobei anstelle
einer direkten Speicherung der Histogramme, die einen zu großen Speicherplatz erfordern würde, eine Ableitung
kennzeichnender Werte aus den Histogrammen verwendet wird. Dies erfolgt durch die Bildung der Quantile, die sich als
Streifengrenzen ergeben, wenn die Histogramme der einzelnen Frequenzbereiche in Streifen gleicher Fläche unterteilt
werden, und die ausreichend Information über die Form der einzelnen Histogramme enthalten.
Bei der Aufnahme eines diskontinuierlichen Geräuschsignals, das insbesondere bei einem Sprachsignal normalerweise
vorliegt, können zumindest in einzelnen Frequenzbereichen Pausen auftreten, in denen sich das Rauschen
der gesamten Umwandlungsanordnung mit den Verstärkern zur Umwandlung des Geräuschsignals in ein elektrisches £ignal
sowie auch ein gleichmäßiges Hintergrundgeräusch bemerkbar machen. Dies führt dazu, daß beispielsweise bei einem weißen
Rauschen alle Histogramme bei den Signalwerten entsprechend dem Rauschsignal eine hohe Spitze aufweisen,
die jedoch überhaupt nicht geräuschsignalspezifisch ist. Um diese Spitze bei der Bestimmung der Quantile auszuschließen,
ist es zweckmäßig, daß die Summierung der Kurzzeitspektrum-Signale zunächst beginnend beim niedrigsten
Signalwert solange fortgesetzt wird, bis ein Minimum-Signal wert erreicht ist, bei dem die Anzahl der Kurzzeitspektrum-Signale
ein Minimum ist, daß die Anzahl der bis zu diesem Minimum-Signalwert summierten Kurzzeitspektrum-Signale
von der Gesamtzahl der Kurzzeitspektrum-Signale subtrahiert und aus der Differenz der Quantilwert gebildet
wird, und daß dann erneut die Summierung der Kurzzeitspektrum-Signale
vom Anfangswert Null und der Vergleich mit den Vielfachen des Quantilwertes beginnt. Auf diese
Weise wird das bei niedrigen Geräuschsignalen bzw. bei
130015/0405
PHD 79-104 Signalpausen erfaßte Rauschen weitgehend ausgeschaltet.
Dieses Rauschsignal ist jedoch auch bei größeren Geräuschsignalamplituden
vorhanden und überlagert sich praktisch additiv. Um den Einfluß des Rauschens auch bei größeren
Geräuschsignalwerten auszuschalten, ist es zweckmäßig, daß von den Signalwerten, bei denen jeweils ein ganzzahliges
Vielfaches des Quantilwertes erreicht oder überschritten wird, der Minimum-Signalwert subtrahiert wird, wobei die
Differenzen die charakteristischen Werte darstellen. Dadurch werden die Histogramme parallel verschoben, so daß
der Einfluß des additiv überlagerten Rauschens praktisch bei allen Geräuschsignalwerten eliminiert wird.
Es ist möglich, daß das Geräuschsignal bei der Aufnahme durch den Einfluß von linearen Übertragungsfunktionen verfälscht
wird, beispielsweise ein über eine Telefonleitung übertragenes Sprechsignal durch die Übertragungsfunktion
der gesamten Telefon-Übertragungsstrecke. Um den Einfluß der Übertragungsfunktion auszugleichen, ist es zweckmäßig,
daß außerdem das Langzeitspektrum des Gerauschsignals
durch Addition aller Kurzzeitspektrum-Signale je Frequenzbereich gebildet wird, und daß die Signalwerte, bei denen
jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird, durch ein von dem Signalwert des zugehörigen Frequenzbereiches des Langzeitspektrums
abgeleiteten Wert dividiert werden und die Quotienten die charakteristischen Werte darstellen. Dadurch
kann auch die unterschiedliche Lautstärke verschiedener Geräuschsignale bei der Aufnahme zum Teil ausgeglichen
werden, die insbesondere bei Sprachsignalen.auftritt, z.B. wenn der Besprechungsabstand des Mikrofons vom Sprecher
nicht genau eingehalten wird. Das Langzeitspektrum enthält nämlich die Gesamtenergie des Geräuschsignals und
damit auch eine Angabe über die mittlere Energie jedes
130015/0405
JpT PHD 79-104
Frequenzbereiches.
In dem Langzeitspektrum ist ein Rauschsignal der Aufnahmeeinrichtung
ebenso enthalten wie in den Histogrammen. Um den Einfluß des Rauschens auch aus dem Langzeitspektrum
zu entfernen, ist es zweckmäßig, daß von jedem Spektralwert des Langzeitspektrums zunächst das Produkt aus der
Gesamtzahl der Kurzzeitspektrum-Signalwerte und des Minimum-Signalwertes des zugehörigen Frequenzbereiches subtrahiert
wird. Auf diese Weise wird die während des gesamten Geräuschsignals hinzugefügte Rauschenergie aus dem Langzeitspektrum
wieder entfernt.
Wenn die Lautstärke-Korrektur der Quantile mittels Division durch den Langzeitspektrumwert des jeweils zugehörigen Frequenzbereichs
für jeden Frequenzbereich getrennt geschieht, geht jedoch ein kleiner Anteil der Information verloren,
nämlich der Anteil, der in dem Langzeitspektrum enthalten ist. Um diesen Informationsverlust zu vermeiden, ist es
zweckmäßig, daß außerdem durch Addition aller Kurzzeitspektrum-Signale aller Frequenzbereiche ein Gesamtenergiewert gebildet wird und daß die Signalwerte, bei denen jeweils
ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird, durch einen für alle Frequenzbereiche
gleichen, von dem Gesamtenergiewert abgeleiten Wert dividiert werden und die Quotienten die
charakteristischen Werte darstellen. Die Summe der Kurzzeitspektrum-Signale aller Frequenzbereiche gibt nämlich
die mittlere Lautstärke unabhängig vom Frequenzbereich wieder und ermöglicht besonders gut den Ausgleich von Lautstärkeunterschieden,
jedoch erfolgt dann kein Ausgleich von Ubertragungsfunktionen mehr.
Eine Anordnung zur Durchführung des erfindungsgemäßen Verfahrens mit einer Wandleranordnung, die das vom'Geräuschsignal
abgeleitete elektrische Signal erhält und am Ausgang Kurzzeitspektrum-Signalwerte erzeugt, die die Ener-
130015/040S
PHD 79-104
gie des elektrischen Signals in aufeinanderfolgenden gleichen Zeitabschnitten für jeweils einen von einer Anzahl
benachbarter Frequenzbereiche angeben, ist dadurch gekennzeichnet, daß ein Speicher vorgesehen ist, daß während dem
Zuführen des Geräuschsignals der Adresseneingang des Speichers mit dem Ausgang der Wandleranordnung verbunden
ist und die Kurzzeitspektrum-Signalwerte und die Nummer des zugehörigen Frequenzbereiches als Adressen erhält, daß
der Datenausgang des Speichers mit einem Addierer verbunden ist, der den Inhalt des adressierten Speicherplatzes um
eine Einheit erhöht und an den gleichen Speicherplatz zurückschreibt, daß nach dem Zuführen des Geräuschsignals
während der Verarbeitung eine Adressieranordnung die Speicherplätze des Speichers aufeinanderfolgend beginnend bei
den niedrigsten Adressen adressiert, daß an den Datenausgang des Speichers ferner eine Summieranordnung angeschlossen
ist, die die Inhalte der adressierten Speicherplätze Jeweils eines Frequenzbereiches summiert, daß eine
Vergleichsanordnung die summierten Inhalte mit Vielfachen
eines von der Gesamtzahl der Kurzzeitspektrum-Signalwerte jedes Frequenzbereiches abgeleiteten Quantilwertes vergleicht
und bei Überschreiten eines Vielfachen die momentane Adresse der Adressieranordnung in einen daran angeschlossenen
Ergebnisspeicher einschreibt, der nach Adressierung aller Speicherplätze des Speichers durch die
Adressieranordnung die gesuchten charakteristischen Werte angegebene Signalwerte enthält. Auf diese Weise werden die
charakteristischen Werte mit wenig Aufwand gewonnen.
Weiterbildungen dieser Anordnung, insbesondere zur Bestimmung
der Quantilwerte sowie zum Ausgleich des Einflusses von Rauschen, Ubertragungsfunktionen und unterschiedlicher
Lautstärke, sind in den weiteren Unteransprüchen gekennzeichnet.
Ausführungsbeispiele der Erfindung werden nachstehend
130015/0405
' PHD 79-104 anhand der Zeichnung näher erläutert. Es zeigen:
Fig. 1a den zeitlichen Verlauf eines kurzzeitintegrierten
Geräuschsignals in einem Frequenzbereich,
Fig. 1b ein daraus gewonnenes Histogramm,
Fig. 2 ein Blockschaltbild einer gesamten Anordnung,
Fig. 3 ein Blockschaltbild eines Teils einer gegenüber der Anordnung nach Fig. 2 erweiterten Anordnung
zum Beseitigen des Einflusses von Rauschen,
Fig. 4 ein Blockschaltbild eines erweiterten Teils der Anordnung nach Fig. 2 und Fig. 3 zum Beseitigen
des Einflusses von Lautstärkeunterschieden,
Fig. 5 ein Blockschaltbild der Erweiterung der Anordnung nach Fig. 4.
Die Fig. 1a zeigt ein Beispiel des über Jeweils einen kurzen Zeitabschnitt integrierten Sprachsignals eines Frequenzbereiches
über die Zeit t, wobei ein beispielsweise angegebener Zeitabschnitt von dem Zeitpunkt t^ bis zum
Zeitpunkt tp reicht. Diese integrierten Signale entstehen
daher im Abstand jeweils dieses Zeitabschnittes und sind durch Kreuze angedeutet, die zur besseren Übersichtlichkeit
durch eine geglättete Kurve verbunden sind, Die Darstellung beginnt bei einer Pause des Geräuschsignals mit
einem minimalen Wert R, der das unvermeidliche Rauschsignal der Aufnahmeanordnung mit den Verstärkern angibt
und der daher nirgends unterschritten wird. Mit dem Einsatz des Geräuschsignals entstehen höhere Werte A des
integrierten Signals, die jedoch bei der nächsten Geräuschsignalpause
wieder auf den Rauschwert zurückgehen. Der
130015/0405
β" PHD 79-104
- IU-
Zeitverlauf der kurzzeitintegrierten Geräuschsignale in den anderen Frequenzbereichen hat einen ähnlichen, jedoch
im einzelnen allgemein abweichenden Verlauf.
Wenn nun gezählt wird, wie oft ,jeder Wert A in einem zeitbegrenzten
Geräuschsignal auftritt, entsteht eine Darstellung, die etwa der in Fig. 1b entspricht. Darin sind also
die Anzahlen n, wie oft ein bestimmter integrierter Wert A auftritt, über diesen Wert A aufgetragen. Da die kurzzeitintegrierten
Werte A in digitaler Form vorliegen, ist eine solche Zählung ohne weiteres möglich, die eine Folge von
diskreten Punkten ergibt, die in der Fig. 1b der Übersichtlichkeit halber durch eine geglättete Kurve verbunden
sind.
Wie bereits anhand der Fig. 1a erläutert, ist der niedrigste auftretende Wert R durch das Rauschen der Aufnahmeanordnung
gegeben. Abhängig davon, wie viele Pausen bzw. sehr leise Stellen in dem Geräuschsignal bzw. in einem Frequenzbereich
davon auftreten, ist die Spitze der Kurve beim Wert R mehr oder weniger hoch, und sie kann sogar wesentlich
höher als der höchste Wert des nachfolgenden Teils der Kurve sein. Da die Anzahl der kurzzeitintegrierten Werte,
die nur das Rauschen enthalten, praktisch keine Information über das Geräuschsignal enthält, andererseits aber
sehr stark die Lage der Quantilö beeinflußt, die nachstehend erläutert werden, ist es zweckmäßig, den durch
das Rauschen erzeugten Anteil möglichst zu beseitigen. Dafür wird das erste Minimum der Kurve aufgesucht, das im
dargestellten Fall beim Wert QQ liegt, und damit wird die
weitere Verarbeitung fortgesetzt.
Beginnend von diesem Wert Q wird nun die Kurve in eine
Anzahl flächengleiche Abschnitte eingeteilt. In dem hier gewählten Beispiel sind dies sechs Abschnitte. Die Werte
130015/0405
Q bis Qg, die die Grenzen der einzelnen Abschnitte angeben,
werden die Quantile genannt, die hier die gesuchten charakteristischen Werte darstellen. Diese Quantile, d.h.
die Grenzen der Abschnitte, sind sehr stark abhängig von der Form der Kurve und enthalten somit viel Information
über diese Form, benötigen andererseits jedoch nur einen geringen Speicherbedarf, nämlich im angegebenen Beispiel
für sieben Werte. Dabei kann der unterste Wert QQ eingespart
werden, wenn die Kurve durch das Beseitigen des Einflusses des Rauschens so nach links geschoben wird, daß
dieser Wert QQ immer auf den Nullpunkt fällt, während der maximale Wert Qg häufig gleich dem maximal darstellenden
Wert von A ist, da dessen Stellenzahl begrenzt ist und einzelne kurzzeitintegrierte Geräuschsignale diesen Wert
erreichen oder gar überschreiten können. Die grundsätzliche Ausnahme des höchsten Quantiis Qg gleich dem maximal
darstellbaren Wert ergibt zumindest nur einen vernachlässigbar kleinen Fehler, so daß nur die Quantile Q1 bis Q1- als
charakteristische Werte gespeichert werden müssen.
Die Quantile Q1 bis Q1- können dadurch gefunden werden,
daß die Gesamtzahl der Zeitabschnitte und damit die Gesamtzahl der kurzzeitintegrierten Werte A durch eine Quantilzahl
dividiert wird, die die Anzahl der Flächenabschnitte unter der Kurve entsprechend der Fig. 1b angibt. Dies ergibt
einen Wert, der mit Quantilwert bezeichnet wird und die Anzahl η aller aufgetretenen Werte a in einem Flächenabschnitt
angibt. Dies ist ein Maß für die Flächenabschnitte und somit für alle Flächenabschnitte gleich. Es werden
nun die Anzahlen η der einzelnen Werte A, beginnend vom kleinsten Wert bzw. vom Minimum bei Q , aufsummiert, bis
der Quantilwert erreicht ist. Der Wert A, bei dem gerade dieser Quantilwert erreicht wird, ist das erste Quantil Q1.
Nun wird die Aufsummierung der Anzahlen η weiter fortgesetzt und mit dem doppelten Quantilwert verglichen, usw.
130015/0405 ORIGINAL INSPECtEO
Statt dessen kann bei dem ersten Erreichen des Quantilwertes
die Aufsummierung der Anzahlen der Werte A wieder bei Null beginnen, bis wieder der Quantilwert erreicht
ist, usw. für die folgenden Abschnitte.
Ein Blockschaltbild der wichtigsten Elemente für die Bestimmung der Quantile als charakteristische Werte ist in
Fig. 2 dargestellt. Über das Mikrofon 1 wird das Geräuschsignal aufgenommen und in ein elektrisches Signal umgewandelt,
wobei die nachgeschalteten Verstärker der Übersichtlichkeit halber nicht dargestellt sind. Das verstärkte
elektrische Signal wird dann einer Filterbank 3 zugeführt, die dieses elektrische Signal in eine Anzahl aneinandergrenzender
Frequenzbereiche aufspaltet und integriert. Die integrierten Werte der Frequenzbereiche werden
über getrennte Leitungen einem Multiplexer 5 zugeführt, der von einem Zähler 15 gesteuert diese Leitungen aufeinanderfolgend
abtastet und das abgetastete Signal einem Analog-Digital-Wandler 7 zuführt. Nach jeder Abtastung
einer Leitung wird deren Signal wieder auf Null zurückgesetzt und von neuem integriert. Die Filterbank 3 kann insbesondere
im Falle der Verarbeitung eines Sprachsignals beispielsweise einen Frequenzbereich von 100 Hz bis
7.500 Hz in 15 benachbarte Frequenzbereiche gleicher relativer Bandbreite aufteilen.
Der Zähltakteingang des Zählers 15 ist über den Schalter 13b mit einem Taktsignal Ck aus einer nicht dargestellten
Taktsignalquelle verbunden, deren Frequenz die Dauer der Zeitabschnitte bestimmt, über die integriert wird. Bei
einer Dauer der Zeitabschnitte von 27 ms muß die Taktfrequenz dann 555 Hz betragen.
Der Ausgang 8 des Analog-Digital-Wandlers 7 ist über den Schalter 13a mit einem Teil der Adresseneingänge eines
130015/0405
PHD 79-104
Speichers 9 verbunden, dessen andere Adresseneingänge mit dem Ausgang 16 des Zählers 15 verbunden sind. Die Leitungen
8 und 16, die je Mehr-Bit-Binärwerte übertragen, bestehen tatsächlich aus einer der Anzahl Bit entsprechenden
Anzahl paralleler Leitungen, die lediglich der Übersichtlichkeit halber nur als eine Leitung dargestellt sind. Dies
gilt auch für die meisten der übrigen Leitungen, auch in den folgenden Figuren, insbesondere wenn diese Leitungen
Parallelausgänge von Zählern, Speichern und Registern sind.
Der Speicher 9 enthält für jeden der vom Analog-Digital-Wandler 7 erzeugbaren Werte mit z.B. 8 Bits eine Anzahl
Speicherplätze entsprechend der Anzahl Frequenzbereiche, wobei jeder Speicherplatz eine Mehr-Bit-Zahl aufnehmen
kann. Durch die Verbindung der Adresseneingänge des Speichers
9 mit den Ausgängen des Analog-Digital-Wandlers 7 und des Zählers 15, der den jeweils abgetasteten Frequenzbereich
angibt, ist jedem Speicherplatz des Speichers 9 ein bestimmter Wert in einem bestimmten Frequenzbereich
zugeordnet. Der Datenausgang des Speichers 9 ist über einen Addierer 11 mit dem Dateneingang verbunden, wobei der andere
Eingang des Addierers 11 eine Signalkombxnation entsprechend dem Zahlenwert "1" erhält. Dadurch wird der Inhalt
eines Speicherplatzes bei jeder Adressierung um 1 erhöht und enthält somit die Anzahl Male, die der zugehörige
Signalwert am Ausgang 8 des Analog-Digital-Wandlers 7 in dem betreffenden Frequenzbereich aufgetreten ist.
An den Übertragsausgang des Zählers 15 für die Frequenzbereiche ist der Zähltakteingang eines Anzahlzählers 23
angeschlossen, der die Gesamtanzahl der Zeitabschnitte je Frequenzbereich des aufgenommenen Geräuschsignals an
seinem Parallelausgang 24 bildet.
Nachdem das zeitbegrenzte Geräuschsignal aufgenommen und in Speicher 9 auf die beschriebene Weise das Histogramm
130015/0405
PHD 79-104
der Kurzzeitspektren gebildet worden ist, werden die Schalter 13a bis 13c, die zweckmäßig als elektronische Schalter
z.B. mit UND-Gattern realisiert werden, parallel in die Stellung entgegengesetzt zur gezeichneten Stellung umgeschaltet.
Damit erhält nun der Zähler 17, der einen Teil einer Adressieranordnung des Speichers 9 für den folgenden
Verarbeitungsabschnitt bildet, über den Schalter 13c das Taktsignal Ck, das gleichzeitig auf eine höhere Frequenz
umgeschaltet werden kann. Dieser Zähler beginnt von der Nullstellung an zu zählen und adressiert somit aufeinanderfolgende
Speicherplätze des Frequenzbereichs, der durch den Zähler 15 vorgegeben wird, wobei dieser Zähler 15 sich
zu Beginn des Verarbeitungsablaufs in der Anfangsstellung
befindet. Die am Datenausgang 10 auftretenden Inhalte der adressierten Speicherplätze des Speichers 9 werden dem
einen Eingang eines Addierers 19 zugeführt, dessen Ausgang mit dem Eingang eines Registers 21 verbunden ist, der
das invertierte Taktsignal CK als Einschreibsignal erhält.
Der Ausgang des Registers ist außer mit dem einen Eingang eines Vergleichers 33 auch mit dem anderen Eingang des
Addierers 19 verbunden, so daß dieser zusammen mit dem Register 21 eine bekannte Akkumulatorschaltung bildet. Diese
summiert die an dem Datenausgang 10 des Speichers 9 nacheinander erscheinenden Anzahlen aufeinanderfolgender kurzzeitintegrierter
Signalwerte und führt diese dem einen Eingang des Vergleichers 33 zu.
Am Ende der Aufnahme des Geräuschsignals wird ferner das Signal am Parallelausgang 24 des Anzahl-Zählers 23, das die
Gesamtanzahl der Zeitabschnitte des aufgenommenen Geräuschsignals darstellt, einem Dividierer 25 zugeführt, der diese
Anzahl durch eine am Divisoreingang 26 zugeführte Quantilzahl teilt, die die Anzahl der Flächenabschnitte angibt,
in die die Histogrammkurven zu unterteilen sind. Der von dem Dividierer 25 gelieferte Quantilwert stellt den
13Q015/G405
Wert dar, bis zu dem die am Datenausgang 10 des Speichers 9 abgegebenen Speicherplatzinhalte aufsummiert werden
müssen, um zur Grenze des ersten Flächenabschnitts zu gelangen, und er wird dem einen Eingang eines Addierers 27
zugeführt, dessen Ausgang mit dem Eingang eines Registers 29 verbunden ist, dessen Ausgang außer an den anderen Eingang
des Vergleichers 33 auch an den anderen Eingang des Addierers 27 angeschlossen ist, so daß der Addierer 27
und das Register 29 ebenfalls eine Akkumulatoranordnung
bilden. Zu Beginn enthält das Register 29 den Wert 0, so daß es unmittelbar den vom Dividierer 25 gelieferten
Wert aufnimmt.
Der Zähler 17 adressiert nun nacheinander die zum ersten Frequenzbereich gehörenden Speicherplätze, und der Summierer
aus dem Addierer 19 und dem Register 21 summiert die Inhalte der Speicherplätze, bis der vom Register 21
dem Vergleicher 33 zugeführte Wert größer oder mindestens gleich ist dem vom Register 29 gelieferten Wert. In diesem
Falle liefert der Vergleicher 33 auf der Ausgangsleitung 34 ein Signal, das den Einschreibeingang des Ergebnisspeichers
31 ansteuert und den auf der Ausgangsleitung 18 des Zählers 17 diesem Ergebnisspeicher zugeführte
Signal als erstes Quantil einschreibt. Der Zähler 17 adressiert nämlich in diesem Augenblick gerade die
Speicherstelle, die entsprechend der Fig. 1b einem Wert A zugeordnet ist, der dieses erste Quantil angibt. Ferner
schreibt dieses Ausgangssignal in das Register 29 das Ausgangssignal des Addierers 27 ein, das der Summe der
am Ausgang des Dividierers 25 und des Registers 29 vorhandenen Werte entspricht, die beide gleich dem Quantilwert
sind, so daß das Register 29 anschließend den doppelten Quantilwert enthält und dem Vergleicher 33 zuführt.
Der Zähler 17 adressiert nun nacheinander die folgenden
130015/0405
PHD 79-104
Speicherplätze des Speichers 9, und die am Datenausgang 10 erscheinenden Speicherplatzinhalte werden weiter aufsummiert,
bis am Ausgang des Registers 21 ein Wert erscheint, der größer oder gleich dem doppelten Quantilwert ist, wodurch
der Vergleicher 33 wieder ein Ausgangssignal auf der
Leitung "5k abgibt, das das nächste Quantil in den Ergebnisspeicher
31 einschreibt und im Addierer wieder dem Quantilwert zum Inhalt des Registers 29 addiert und in das letztere
einschreibt, so daß dieses nun den dreifachen Quantilwert enthält, und dies wird fortgesetzt, bis der Zähler 17
alle Speicherplätze eines Frequenzbereichs adressiert hat. Der Zähler 17 gibt dann ein Ubertragssignal auf der Leitung
20 ab, das über den Schalter 13b, der sich in der Stellung entgegengesetzt zur gezeichneten Stellung befindet,
auf den Zähltakteingang des Frequenzbereichs-Zählers 15 gelangt und diesen auf den nächsten Frequenzbereich
umschaltet. Ferner gelangt das Übertragsignal über die Leitung 20 auf den Löscheingang der Register 21 und 29
und setzt diese auf Null, wobei anschließend in das Register 29 wieder der vom Dividierer gelieferte einfache
Quantilwert über den Addierer 27 eingeschrieben wird.
Nachdem der Zähler 17 das Ubertragssignal abgegeben hat, beginnt er wieder, von seiner Anfangsstellung zu zählen ,
und adressiert dadurch wieder aufeinanderfolgende Speicherplätze im Speicher 9>
jedoch nun zum zweiten Frequenzbereich der Filterbank 3 gehörige Speicherplätze. Der auf
dem Datenausgang 10 des Speichers 9 erscheinende Inhalt der Speicherplätze wird nun wieder in der Summieranordnung
aus dem Addierer 19 und dem Register 21 eingeschrieben und das Ergebnis im Vergleicher 33 mit dem Quantilwert
im Register 29 verglichen, wie dies bei den Inhalten der Speicherplätze des ersten Frequenzbereiches
im Speicher 9 der Fall war, so daß nacheinander die Quantile des zweiten Frequenzbereichs in den Ergebnisspeicher
130015/0405
PHD 79-104
31 eingeschrieben werden, und dieser Ablauf wiederholt sich auch für die folgenden Frequenzbereiche. Der Ergebnisspeicher
31 enthält schließlich die Quantile der Histogramme aller Frequenzbereiche, und diese können ausgegeben
und in einem anderen Speicher zwischengespeichert werden, um sie mit den Quantilen eines anderen, auf gleiche
Weise verarbeiteten Geräuschsignals zu vergleichen, um den Grad der Übereinstimmung der beiden Geräuschsignale
zu prüfen. Bei Anwendung in der Sprecherkennung kann dann beispielsweise festgestellt werden, ob das zweite Sprachsignal
von dem gleichen Sprecher stammt wie das erste Sprachsignal.
In Fig. 3 ist ein Teil der Anordnung nach Fig. 2, und zwar der die Verarbeitung der aus dem aufgenommenen Geräuschsignal
erstellten Histogramme von dem Datenausgang 10 des Speichers 9 sowie dem Ausgang 24 des Anzahlzählers 23 und
dem Ausgang 18 des Zählers 17 für die Adressierung beginnend, in einer Abwandlung dargestellt, bei der der Ein-5n
insbesondere
fluß des Rauschens/in Pausen des Geräuschsignals beseitigt wird. Die mit den in der Fig. 2 übereinstimmenden Elemente
sind in Fig. 3 mit den gleichen Bezugszeichen bezeichnet.
An die Datenleitung 10 ist der eine Eingang eines Vergleichers 41 angeschlossen, dessen anderer Eingang über
ein Register 43 an die Datenleitung 10 angeschlossen ist. Das Register 43 erhält als Einschreibsignal das gleiche
Taktsignal Ck wie der Zähler 17 in Fig. 2, der den Speicher 9 adressiert, so daß das Register 43 außer bein
Wechsel der Adressierung immer den im vorhergehenden Taktabschnitt auf der Datenleitung 10 vorhandenen W<>rt
enthält. Auf diese Weise vergleicht der Vergleicher 41 jeweils zwei aufeinanderfolgende Werte bzw. Anzahlen
des gerade verarbeiteten Histogramms, und er gibt ein
Signal ab, wenn der auf der Datenleitung 10 vorhandone
130015/0405
PHD 79-104
Wert größer ist als der vom Register 43 gelieferte Wert,
denn dann ist gerade das Minimum der Kurve beim Quantil Q
in Fig. 1 erreicht. Der Vergleicher 41 wird daher als Minimum-Vergleicher bezeichnet. Sein Ausgangssignal steuert
den Einschreibeingang eines Registers 47 an und schreibt den auf der Adressenleitung 18 des Zählers 17 in Fig. 2
vorhandenen Wert entsprechend dem Quantil Q in das Register 47 ein. Außerdem wird dieses Ausgangssignal dem
D-Vorbereitungseingang eines D-Flip-Flops 45 zugeführt, das am Takteingang das inverse Taktsignal Ük erhält und
somit nach einer halben Taktzeit umschaltet und dabei den Vergleicher 41 für weitere Vergleiche sperrt und das Ausgangssignal
beendet. Ferner wird das Ausgangssignal über eine Zeitverzögerungsstufe 53 dem Löscheingang des Registers
21 und dem Einschreibeingang des Registers 29 zugeführt. Mit dem Beginn des Ausgangssignals des Minimum-Vergleichers
41 hatte nämlich die Summieranordnung aus dem Addierer 19 dem Register 21 sowie dem später zu erläuternden
Multiplexer 37 die Anzahlen der kurzzeitintegrierten Werte bis zum Quantil Q in Fig. 1, die praktisch
nur durch das Rauschen verursacht wurden, aufsummiert.
Diese summierte Anzahl am Ausgang des Registers 21 wird nun außer dem einen Eingang des Addierers 19 auch dem
Subtraktoreingang eines Subtrahierers 51 zugeführt, dessen Subtrahendeneingang mit der Leitung 24 verbunden ist, die
das Ausgangssignal des Anzahl-Zählers 23 entsprechend der
Gesamtzahl der Zeitabschnitte des Geräuschsignals bzw. der kurzzeitintegrierten Werte liefert. Dadurch erhält
der Dividierer 25 an seinem Dividendeneingang eine um die Anzahl der lediglich Rauschen enthaltenden Zeitabschnitte
verminderte Anzahl, die durch die am Eingang 26 zugeführte Quantilzahl dividiert und dem Register 29 zugeführt wird.
Das zeitverzögerte Signal am Ausgang der Zeitverzögerungsanordnung 53 schreibt somit in das Register 29 den ersten
Quantilwert ein. Außerdem wird das Register 21 gelöscht,
130015/0405
YT PHD 79-104
so daß nun die Summierung der Werte auf der Datenleitung
10 wieder bei Null beginnt.
Der Ausgang des Registers 21 ist mit dem Subtrahendeneingang und der Ausgang des Registers 29 mit dem Subtraktoreingang
eines Subtrahierers 35 verbunden, der somit zur· nächst ein negatives Ausgangssignal liefert.
Die Summieranordnung aus dem Addierer 19, dem Multiple-ίο
xer 37 und dem Register 31 summiert nun wieder die auf der Datenleitung 10 nacheinander erscheinenden Werte, beginnend
mit dem auf den minimalen Wert folgenden Wert. Falls dieser minimale Wert auch noch mit erfaßt werden soll,
kann der eine Eingang des Addierers 19 statt direkt mit der Datenleitung 10 mit dem Ausgang des Registers 43 verbunden
werden. Sobald nun der Wert am Ausgang des Registers 21 den Quantilwert am Ausgang des Registers 29 erreicht
oder überschreitet, liefert der Subtrahierer 35 einen positiven Wert am Ausgang. Dieser Ausgang ist mit
dem Vergleicher 33 verbunden, der hier diesen Wert mit dem Wert "0" vergleicht und bei Erreichen bzw. Überschreiten
ein Signal auf der Ausgangsleitung 34 abgibt. Dieses Signal steuert den Multiplexer 37 an und schaltet den
Eingang des Registers 21 auf den Ausgang des Sübtrahierers, so daß dessen Ausgangswert mit dem nächsten
inversen Taktsignal Ük in das Register 21 eingeschrieben wird. Hier wird also im Gegensatz zu der Anordnung nach
Fig. 2 nicht mit aufeinanderfolgenden Vielfachen des Quantilwertes
verglichen, sondern von dem aufsummierten Wert wird jeweils bei Erreichen bzw. Überschreiten des Quantilwertes
dieser davon abgezogen. Dies entspricht vollständig dem Vergleich mit aufeinanderfolgenden Vielfachen
des Quantilwertes.
Das Signal auf der Ausgangsleitung 34 des Vergleichers 33
130015/0405
PHD 79-104
steuert außerdem in gleicher Weise wie in Fig. 2 den Einschreibeingang
des Ergebnisspeichers 31 an. Dieser erhält am Dateneingang über die Leitung 50 nun nicht direkt die
am Speicher 9 in Fig. 2 anliegende Adresse über die Leitung 18 vom Ausgang des Zählers 17, sondern diese Leitung
ist mit dem Subtrahenden-Eingang eines Subtrahierers 49 verbunden, der am Subtraktoreingang über die Leitung 48
das Ausgangssignal des Registers 47 erhält, der den Minimum-Wert enthält. Dieser Minimum-Wert wird nun ständig
Ό von der Adresse auf der Leitung 18 subtrahiert und dem
Ergebnisspeieher 31 zugeführt, was gemäß der Fig. 1b einer
Verschiebung des gesamten Histogramms um den Rauschanteil entspricht.
Nach Verarbeitung der kurzzeitintegrierten Werte des ersten
Frequenzbereichs wird dann in gleicher Weise wie bei Fig. 2 beschrieben auf den nächsten Frequenzbereich umgeschaltet,
wobei das Übertragssignal auf der Leitung 20 in Fig. 2 außer die Register 21 und 29 auch das Register 47
und das D-Flip-Flop 45 löscht, was der Einfachheit halber in Fig. 3 nicht dargestellt ist.
In den bisher beschriebenen Anordnungen ist noch nicht der Einfluß unterschiedlicher Übertragungsfunktionen während
der Aufnahme bei verschiedenen Geräuschsignalen berücksichtigt,
die miteinander verglichen werden sollen. Durch eine frequenzabhängige Übertragungsfunktion werden die
Energien in einzelnen Frequenzbereichen unterschiedlich angehoben bzw. abgesenkt, und dies wirkt bei einem Histogramm
wie eine proportionale Verschiebung der Abszissenwerte oder wie eine Maßstabsveränderung durch einen konstanten
Skalierungsfaktor. Einen Sonderfall hiervon stellt eine unterschiedliche Lautstärke bei der Aufnahme
dar, nämlich eine frequenzkonstante Übertragungsfunktion.
Dadurch werden alle Histogramme um den gleichen Skalie-
130015/0405
PHD 79-1C4
proportional verschoben. Dadurch beeinflußt sowohl die Übertragungsfunktion als auch die Lautstärke unmittelbar
die Quantile.
Der einfachste Weg, Lautstärkeunterschiede auszugleichen, besteht in einer Dynamikregelung des in ein elektrisches
Signal umgesetzten Geräuschsignals. Eine solche Dynamikregelung verfälscht jedoch in den meisten Fällen das
Geräuschsignal, da später auftretende hohe Lautstärken naturgemäß zu Anfang noch nicht berücksichtigt werden
können und somit der Beginn des Geräuschsignals gegenüber dem restlichen Teil bzw. dem Mittelwert zu laut aufgenommen wird. Für eine korrekte Lautstärkenberücksichtigung
muß also zunächst das gesamte Geräuschsignal aufgenommen und daraus beispielsweise ein der mittleren oder der
maximalen Lautstärke entsprechendes Signal gebildet werden. Hierfür eignet sich besonders das Langzeitspektrum,
das die Gesamtenergie des Geräuschsignals in den einzelnen Frequenzbereichen angibt und beispielsweise durch Summierung
der Kurzzeitspektrum-Signale der Frequenzbereich gebildet werden kann. Durch Summierung der einzelnen Werte
des Langzeitspektrums wird dann ein Wert erhalten, der die Lautstärke bei der Aufnahme angibt, und durch eine proportionale
Verschiebung der Abszisaenwerte'der Histogramme aller
Frequenzbereiche entsprechend diesem Summenwert wird der Einfluß unterschiedlicher Lautstärke ausgeglichen,
d.h. alle Quantile müssen durch diesen Summenwert dividiert werden.
Für den Ausgleich einer frequenzabhängigen Übertragungsfunktion müssen dagegen die Abszissenwerte der Histogramme
für die einzelnen Frequenzbereiche unterschiedlich verschoben werden. Hierfür müssen die Werte des Langzeitspektrums
für die einzelnen Frequenzbereiche getrennt verwendet werden, d.h. die Quantile jeweils eines Frequenzbereiches
müssen durch den Wert des Langzeitspektrums
130015/0405
PHD 79-104
im gleichen Frequenzbereich dividiert werden.
Das Blockschaltbild einer Anordnung hierfür ist in Fig. dargestellt. Dabei wird das vom Analog-Digital-Wandler 7
in Fig. 2 auf der Ausgangsleitung 8 gelieferte Signal außerdem dem einen Eingang eines Addierers 61 zugeführt,
dessen Ausgang mit dem Eingang eines Speichers 63 und dessen anderer Eingang mit dem Ausgang 64 dieses Speichers
verbunden ist. Der Speicher 63 enthält für jeden Frequenz-Ό bereich einen Speicherplatz, der eine mehrstellige Zahl
aufnehmen kann. Der Speicher 63 wird von einem Zähler 65 angesteuert, der am Zähltakteingang das Taktsignal Ck erhält
und eine Kapazität entsprechend der Anzahl Frequenzbereiche bzw. -ausgänge der Filterbank 3 in Fig. 2 auf's
weist. Dieser Zähler 65 kann auch durch den Zähler 15 in Fig. 2 ersetzt werden, so daß der Adresseneingang des
Speichers 63 ebenfalls an die Leitung 16 anzuschließen ist.
Durch die Verbindung des Ausgangs 64 wird jeder über die Leitung 8 zugeführte Wert zu dem Inhalt des gerade adressierten
Speicherplatzes addiert. Dadurch enthält der Speicher 63 am Ende der Aufnahme des Geräuschsignals die
einzelnen Werte des Langzeitspektrums dieses Geräuschsignals.
Während der folgenden Verarbeitung der Histogramme des aufgenommenen
Geräuschsignals in der Anordnung gemäß Fig. 2 bzw. Fig. 3 wird im Speicher 63 der Speicherplatz des Frequenzbereiches
adressiert, dessen Histogramm gerade verarbeitet wird, was bei Verwendung des Zählers 15 in Fig.
zur Adressierung des Zählers 63 automatisch erfolgt. Der am Ausgang 64 des Speichers 63 erscheinende Wert
wird dem Divisor-Eingang eines Dividierers 71 zugeführt, dessen Dividenden-Eingang 72 mit dem Ausgang 18 des
130015/0405
PHD 79-104
Zählers 17 oder, bei Verwendung der Anordnung nach ?ig. 3,
mit dem Ausgang 50 des Subtrahierers 49 verbunden ist. Der Ausgang des Dividierers 71 ist mit dem Dateneingang
des Ergebnisspeichers 31 verbunden, so daß der Diviiierer 71 bei der Anordnung nach der Fig. 2 in die Leitung 18
und bei der Anordnung nach der Fig. 3 in die Leitung 50 einzufügen ist. Auf diese Weise werden alle Quantile eines
Frequenzbereichs bei deren Erzeugung um einen Wert antsprechend der Gesamtenergie in diesem Frequenzbereich proportional
verkleinert, wodurch der Einfluß von Lautstärkeunterschieden völlig ausgeglichen wird.
Die über die Leitung 8 dem Addierer 61 zugeführten Signale enthalten noch den durch das Rauschen hervorgerufenen Anteil,
der dann auch in dem Langzeitspektrum enthalten ist. Bei Verwendung der Anordnung nach Fig. 3 wird dieser
Rauschanteil jedoch aus den Histogrammen beseitigt. Um exakte Werte zu erhalten, muß bei Verwendung dieser Anordnung
auch aus dem LangzeitSpektrum der Rauschanteil beseitigt werden.
Dies geschieht durch die in Fig. 5 als Blockschaltbild dargestellte Anordnung. Der Addierer 61 und der Speicher
63 sind dabei in gleicher Weise angeordnet bzw. angeschlossen wie in Fig. 4 dargestellt, und sie arbeiten auch in
gleicher Weise wie für die Fig. 4 beschrieben. Lediglich der Adresseneingang des Speichers 63 ist nun an die
Ausgangsleitung 16 des Zählers 15 in Fig. 2 angeschlossen dargestellt.
Der Ausgang 64 des Speichers 63 ist nun mit dem Subtrahendeneingang
eines Subtrahierers 69 verbunden, dessen Subtraktoreingang mit dem Ausgang eines Multiplizierers
67 verbunden ist. Dieser multipliziert die am Ausgang des Anzahl-Zählers 23 in Fig. 2 abgegebene Gesamtanzahl
130015/0405
PHD 79-104
der Zeitabschnitte des aufgenommenen Geräuschsignals mit dem Ausgangssignal des Registers 47 auf der Leitung 48,
das die Amplitude des Rauschsignals in dem betreffenden Frequenzbereich angibt. Dieses Produkt ist daher die durch
das Rauschen hervorgerufene Energie während des gesamten Geräuschsignals, die in dem Subtrahierer 79 von der Gesamt-
wobei die Differenz
energie subtrahiert wird,/am Ausgang 70 abgegeben wird. Dieser
Ausgang 70 kann nun entsprechend der Fig. 4 direkt mit dem Divisoreingang des Dividierers 71 verbunden werden.
10
In Fig. 5 ist der Ausgang 70 des Subtrahierers 69 jedoch
mit dem einen Eingang eines Addierers 81 verbunden, dessen Ausgang mit dem Eingang des Registers 83 und dessen zweiter
Eingang mit dem Ausgang dieses Registers verbunden ist. Das Register 83 erhält auf der Leitung 20 das Übertragssignal
des Zählers 17 in Fig. 2 als Einschreibsignal, so daß dieses Register 83 am Ende der Verarbeitung der Histogramme aller
Frequenzbereiche die Summe der einzelnen korrigierten Werte des Langzeitspektrums enthält. Dieser Wert ist, wie vorher
erläutert wurde, ein Maß für die Lautstärke, so daß durch diesen Teil der Anordnung nach Fig. 5 nun der Einfluß von
Lautstärkeunterschieden ausgeglichen wird. Da dieser Wert jedoch erst am Ende der Verarbeitung aller Histogramme
vorliegt, können die Quantile dieser Histogramme bei der Erzeugung noch nicht korrigiert werden, und sie werden
daher zunächst unkorrigiert in den Ergebnisspeicher 31 eingeschrieben. Erst nach Erzeugung der Quantile aller Histogramme
wird ein Adressenzähler 85 gestartet, der die Speicherplätze des Ergebnisspeichers 31 aufeinanderfolgend
adressiert, und die am Ausgang 32 nacheinander erscheinenden Quantile werden dem Dividierer 71 zugeführt und durch
die Summe des korrigierten Langzeitspektrums dividiert und anschließend an denselben Speicherplatz im Ergebnisspeisher
31 wieder eingeschrieben. Erst wenn der Zähler 85 alle Speicherplätze des Ergebnisspeichers 31 adressiert
130015/0405
PHD 79-104
hat, enthält dieser die korrigierten Quantile.
Da die Werte des Langzeitspektrums und besonders die Summe dieser Werte des Langzeitspektrums sehr große Zahlen sind,
werden sie zweckmäßig vor der Weiterverarbeitung in dem Dividierer 71 durch einen Skalierungsfaktor geteilt. Dies
kann durch eine einfache konstante Kommaverschiebung erzielt werden, die auch durch einen entsprechenden Aufbau
bzw. Anschluß des Dividierers 71 erreicht werden kann.
Die in den Anordnungen angegebenen Elemente wie Speicher, Register und Rechenelemente können in verschiedener bekannter
Weise aufgebaut sein. Dabei können beispielsweise die Speicher zu einem einzigen Speicher entsprechender Größe
zusammengefaßt werden, und auch die Rechenelemente können durch Mehrfachausnutzung zusammengefaßt werden. Insbesondere
können diese Elemente wie auch die Register und Vergleicher vollständig oder zumindest teilweise durch einen fest programmierten
Mikroprozessor ersetzt werden.
130015/0405
Claims (15)
1.J Verfahren zum Bestimmen charakteristischer Werte
ms einem zeitbegrenzten Geräuschsignal, insbesondere einem Sprachsignal eines Sprechers, bei dem das Geräuschsignal in
benachbarte Frequenzbereiche aufgeteilt und das Geräuschsignal jedes Frequenzbereiches jeweils über aufeinanderfolgende
gleiche Zeitabschnitte zu Kurzzeitspektrum-Signalen integriert wird, dadurch gekennzeichnet, daß für jeden
Frequenzbereich ein Histogramm der Kurzzeitspektrum-Signale gebildet wird, indem die Anzahl Kurzzeitspektrum-Signale
jedes Signalwertes gezählt wird, daß mindestens ein Bruchteil der Anzahl der Kurzzeitspektrum-Signale je Frequenzbereich
durch eine vorgegebene Quantilzahl dividiert und ein Quantilwert gebildet wird, daß die Anzahl der Kurzzeitspektrum-Signale
für aufeinanderfolgende Signalwerte, beginnend bei dem niedrigsten Signalwert, summiert wird, bis
jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird und daß die Signalwerte, bei
denen jeweils ein ganzzahliges Vielfaches des Quant ij. wertes
erreicht oder überschritten wird, als die charakteristischen
Werte ausgegeben werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Summierung der Kurzzeitspektrum-Signale zunächst
beginnend beim niedrigsten Signalwert solange fortgesetzt wird, bis ein Minimum-Signalwert erreicht ist, bei dem die
Anzahl der Kurzzeitspektrum^Signale ein Minimum ist, daß die Anzahl der bis zu diesem Minimum summierten Kurzzeitspektrum-Signale
von der Gesamtzahl der Kurzzeitspektrum-Signale
subtrahiert und aus der Differenz der Quantilwert gebildet wird, und daß dann erneut die Summierung der
Kurzzeitspektrum-Signale vom Anfangswert Null und der Vergleich mit den Vielfachen des Quantilwertes beginnt.
130015/0405
3Λ PHD 79-104
-ι-
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß von den Signalwerten, bei denen jeweils ein ganzzahliges
Vielfaches des Quantilwertes erreicht oder überschritten wird, der Minimum-Signalwert subtrahiert wird, wobei die
Differenzen die charakteristischen Werte darstellen.
4. Verfahren nach Anspruch 1 oder einem der folgenden, dadurch gekennzeichnet, daß außerdem das Langzeitspektrura
des Geräuschsignals durch Addition aller Kurzzeitspektrum-Signale
je Frequenzbereich gebildet wird, und daß die Signalwerte, bei denen jeweils ein ganzzahliges Vielfaches
des Quantilwertes erreicht oder überschritten wird, durch ein von dem Signalwert des zugehörigen Frequenzbereiches
des Langzeitspektrums abgeleiteten Wert dividiert werden und die Quotienten die charakteristischen Werte darstellen
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß von jedem Spektralwert des Langzeitspektrums zunächst
das Produkt aus der Gesamtzahl der Kurzzeitspektrum-Signalwerte und des Minimum-Signalwertes des zugehörigen Frequenzbereiches
subtrahiert wird.
6. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß außerdem durch Addition aller Kurzzeitspektrum-Signale
aller Frequenzbereiche ein Gesamtenergiewert gebildet wird, und daß die Signalwerte, bei denen
jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird, durch einen für alle
Frequenzbereiche gleichen, von dem Gesamtenergiewert abgeleiteten Wert dividiert werden und die Quotienten die
charakteristischen Werte darstellen.
7. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, mit einer Wandleranordnung, die das vom Geräuschsignal
abgeleitete elektrische Signal erhält und am
130015/0405
PHD 79-104
Ausgang Kurzzeitspektrum-Signalwerte erzeugt, die die Energie des elektrischen Signals in aufeinanderfolgenden
gleichen Zeitabschnitten für jeweils einen von einer Anzahl benachbarter Frequenzbereiche angeben, dadurch gekennzeichnet,
daß ein Speicher (9) vorgesehen ist, daß während dem Zuführen des Geräuschsignals der Adresseneingang
des Speichers (9) mit dem Ausgang (8) der Wandleranordnung (3, 5, 7) verbunden ist und die Kurzzeitspektrum-Signalwerte
und die Nummer des zugehörigen Frequenzbereiches als Adressen erhält, daß der Datenausgang
(1) des Speichers (9) mit einem Addierer (11) verbunden ist, der den Inhalt des adressierten Speicherplatzes um
eine Einheit erhöht und an den gleichen Speicherplatz zurückschreibt, daß nach dem Zuführen des Geräuschsignals
während der Verarbeitung eine Adressieranordnung (15,
17) die Speicherplätze des Speichers (9) aufeinanderfolgend beginnend bei den niedrigsten Adressen adressiert, daß
an den Datenausgang (10) des Speichers (9) ferner eine Summieranordnung (19, 21) angeschlossen ist, die die
Inhalte der adressierten Speicherplätze jeweils eines Frequenzbereiches summiert, daß eine Vergleichsanordnung
(33; 35) die summierten Inhalte mit Vielfachen eines von der Gesamtzahl der Kurzzeitspektrum-Signalwerte jedes
Frequenzbereiches abgeleiteten Quantilwertes vergleicht und bei Überschreiten eines Vielfachen die momentane
Adresse der Adressieranordnung (15, 17) in einen daran angeschlossenen Ergebnisspeicher (31) einschreibt, der
nach Adressierung aller Speicherplätze des Speichers (9) durch die Adressieranordnung (15, 17) die gesuchten
charakteristischen Werte angebende Signalwerte enthält.
8. Anordnung nach Anspruch 7, dadurch gekennzeichnet, daß ein Anzahl-Zähler (23) vorgesehen ist, dessen Takteingang
bei jedem der aufeinanderfolgenden Zeitabschnitte ein Zählsignal von einer die Wandleranordnung (3, 5» 7)
130015/0405
-27 PHD 79-104
steuernden Einrichtung (15) enthält, und daß an den Ausgang (24) des Anzahl-Zählers (23) ein Dividierer (25) angeschlossen
ist, der am Divisoreingang (26) ein der maximalen Anzahl von Vielfachen des Quantilwertes entsprechendes Signal
erhält.
9. Anordnung nach Anspruch 8, dadurch gekennzeichnet, daß dem Dividierer (25) eine Addieranordnung (27, 29) nachgeschaltet
ist, deren Ausgang mit dem einen Eingang eines Vergleiches (33) verbunden ist, dessen anderer Eingang mit
dem Ausgang der Summieranordnung (19, 21) verbunden ist und dessen Ausgang ein Ausgangssignal liefert, wenn das
Signal am Ausgang der Summieranordnung (19, 21) einen
größeren Wert angibt als das Signal am Ausgang der Addieranordnung (27, 29), und mit dem Einschreibeingang des Ergebnisspeichers
(31) und der Addieranordnung (27, 29) verbunden
ist, wodurch ein Ausgangssignal jeweils das an dem
mit der Adressieranordnung (15, 17) verbundenen Eingang (18) des Ergebnisspeichers (31) anliegende Signal einschreibt
und in der Addieranordnung (27, 29) deren Inhalt um das Ausgangssignal des Dividierers (25) erhöht.
10. Anordnung nach Anspruch 8, dadurch gekennzeichnet, daß die Vergleichsanordnung ein erster Subtrahierer (35)
ist, dessen Subtrahendeneingang mit dem Ausgang der Summieranordnung (19, 21), dessen Subtraktoreingang mit dem
Ausgang des Dividierers (25) und dessen Ausgang mit dem Eingang eines Vergleichers (33) verbunden ist, dessen Ausgangssignal
bei einem positiven Ausgangswert des ersten Subtrahierers (35) den Einschreibeingang des Ergebnisspeichers
(31) ansteuert und den Ausgangswert des ersten Subtrahierers (35) in die Summieranordnung (19, 21) einschreibt.
11. Anordnung nach Anspruch 7 oder einem der folgenden,
130015/0405
PHD 79-104
dadurch gekennzeichnet, daß an den Datenausgang (10) des Speichers (9) der eine Eingang eines Minimum-Vergleichers
(41) angeschlossen ist, dessen anderer Eingang mit einem Pufferregister (43), das das jeweils vorhergehende Signal
des Datenausgangs (10) speichert, verbunden ist, daß ein Ausgangssignal des Minimum-Vergleichers (41) bei einem
Wert am Datenausgang (10) größer als der Wert am Ausgang des Pufferregisters (43) einen zweiten Subtrahierer (51)
ansteuert, der das Ausgangssignal der Summieranordnung (19,
21) von dem Ausgangssignal des Anzahl-Zählers (23) subtrahiert und das Ergebnis dem Dividierer (25) zuführt, wobei
dieses Ausgangssignal des Minimum-Vergleichers (41)
danach den Inhalt der Summieranordnung (19, 21) auf den Wert Null einstellt.
12. Anordnung nach Anspruch 11, dadurch gekennzeichnet, daß das Ausgangssignal des Minimum-Vergleichers ein
Minimumwert-Register (47) ansteuert und das momentane Ausgangssignal der Adressieranordnung (15, 17) einspeichert,
und das ein dritter Subtrahierer (49) vorgesehen ist, der
das Ausgangssignal des Minimum-Registers (47) von dem
Ausgangssignal der Adressieranordnung (15, 17) subtrahiert und die Differenz dem Dateneingang (50) des Ergebnisspeichers
(31) zuführt.
13. Anordnung nach Anspruch 7 oder einem der folgenden, dadurch gekennzeichnet, daß eine Langzeitspektrum-Anordnung
(61, 63) vorgesehen ist, die an den Ausgang (8) der Wandleranordnung (3, 5, 7) angeschlossen ist und die
Kurzzeitspektrum-Signale getrennt nach Frequenzbereichen zu einem Langzeitspektrum aufsummiert, und daß der Ausgang
der Langzeitspektrum-Anordnung (61, 63) mit dem Divisor-Eingang einer Dividieranordnung (71) verbunden ist, deren
Dividendeneingang (72) mit dem Ausgang der Adressieranordnung (15, 17) bzw. des dritten Subtrahierers (49) und
130015/0405
29 PHD 79-104
deren Ausgang mit dem Ergebnisspeicher (31) verbunden ist, wobei in der Langzeitspektrum-Anordnung (61, 63) und im
Speicher (9) derselbe Frequenzbereich adressiert ist.
14 Anordnung nach Anspruch 13, dadurch gekennzeichnet, daß der Langzeitspektrum-Anordnung (61, 63) unmittelbar ein
vierter Subtrahierer (69) nachgeschaltet ist, dessen Subtraktor-Eingang mit dem Ausgang eines Multiplizierers
(67) verbunden ist, dessen einer Eingang an den Ausgang
(24) des Anzahl-Zählers (23) und dessen anderer Eingang an den Ausgang des Minimum-Registers (47) angeschlossen
ist.
15. Anordnung nach Anspruch 13 oder 14, dadurch gekennzeichnet,
daß der Langzeitspektrum-Anordnung (61, 63) ein Akkumulator (81, 83) nachgeschaltet ist, der die Summe
aller Kurzzeitspektrum-Signale aller Frequenzbereiche bildet und dessen Ausgang mit dem Divisoreingang der Dividieranordnung
(71) verbunden ist.
130015/0405
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19792939077 DE2939077A1 (de) | 1979-09-27 | 1979-09-27 | Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal |
GB8030830A GB2059658B (en) | 1979-09-27 | 1980-09-24 | Method of and arrangement for deriving characteristic values from a sound signal |
FR8020503A FR2472804A1 (fr) | 1979-09-27 | 1980-09-24 | Procede et systeme pour determiner des valeurs caracteristiques d'un signal sonore |
JP13508780A JPS5656000A (en) | 1979-09-27 | 1980-09-27 | Method and device for producing characteristic values |
US06/192,156 US4379948A (en) | 1979-09-27 | 1980-09-29 | Method of and arrangement for deriving characteristic values from a sound signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19792939077 DE2939077A1 (de) | 1979-09-27 | 1979-09-27 | Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal |
Publications (2)
Publication Number | Publication Date |
---|---|
DE2939077A1 true DE2939077A1 (de) | 1981-04-09 |
DE2939077C2 DE2939077C2 (de) | 1987-04-23 |
Family
ID=6081966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19792939077 Granted DE2939077A1 (de) | 1979-09-27 | 1979-09-27 | Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal |
Country Status (5)
Country | Link |
---|---|
US (1) | US4379948A (de) |
JP (1) | JPS5656000A (de) |
DE (1) | DE2939077A1 (de) |
FR (1) | FR2472804A1 (de) |
GB (1) | GB2059658B (de) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0212323A3 (de) * | 1985-08-29 | 1988-03-16 | Scott Instruments Corporation | Verfahren und Einrichtung von Signalumwandlung und ihre Anwendung zur Signalverarbeitung |
US5664171A (en) * | 1994-04-14 | 1997-09-02 | International Business Machines Corporation | System and method for query optimization using quantile values of a large unordered data set |
US6108658A (en) * | 1998-03-30 | 2000-08-22 | International Business Machines Corporation | Single pass space efficent system and method for generating approximate quantiles satisfying an apriori user-defined approximation error |
US6343288B1 (en) | 1999-03-12 | 2002-01-29 | International Business Machines Corporation | Single pass space efficient system and method for generating an approximate quantile in a data set having an unknown size |
CH695402A5 (de) * | 2000-04-14 | 2006-04-28 | Creaholic Sa | Verfahren zur Bestimmung eines charakteristischen Datensatzes für ein Tonsignal. |
JP4698606B2 (ja) * | 2004-12-10 | 2011-06-08 | パナソニック株式会社 | 楽曲処理装置 |
US20110010509A1 (en) * | 2009-07-07 | 2011-01-13 | L3 Communications Integrated Systems,L.P. | System and method of sorting and calculating statistics on large data sets with a known value range |
WO2016135741A1 (en) * | 2015-02-26 | 2016-09-01 | Indian Institute Of Technology Bombay | A method and system for suppressing noise in speech signals in hearing aids and speech communication devices |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2719175A1 (de) * | 1976-04-30 | 1977-11-17 | Int Computers Ltd | Schallanalysiereinrichtung |
DE2536640B2 (de) * | 1975-08-16 | 1979-02-08 | Philips Patentverwaltung Gmbh, 2000 Hamburg |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4020286A (en) * | 1975-05-19 | 1977-04-26 | Metrosonics, Inc. | Signal analysis apparatus for amplitude statistics |
DE2536585C3 (de) * | 1975-08-16 | 1981-04-02 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Anordnung zur statistischen Signalanalyse |
US4091237A (en) * | 1975-10-06 | 1978-05-23 | Lockheed Missiles & Space Company, Inc. | Bi-Phase harmonic histogram pitch extractor |
DE2720666A1 (de) * | 1977-05-07 | 1978-11-09 | Philips Patentverwaltung | Verfahren und anordnung zur geraeuschanalyse |
-
1979
- 1979-09-27 DE DE19792939077 patent/DE2939077A1/de active Granted
-
1980
- 1980-09-24 GB GB8030830A patent/GB2059658B/en not_active Expired
- 1980-09-24 FR FR8020503A patent/FR2472804A1/fr active Granted
- 1980-09-27 JP JP13508780A patent/JPS5656000A/ja active Granted
- 1980-09-29 US US06/192,156 patent/US4379948A/en not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2536640B2 (de) * | 1975-08-16 | 1979-02-08 | Philips Patentverwaltung Gmbh, 2000 Hamburg | |
DE2719175A1 (de) * | 1976-04-30 | 1977-11-17 | Int Computers Ltd | Schallanalysiereinrichtung |
Also Published As
Publication number | Publication date |
---|---|
DE2939077C2 (de) | 1987-04-23 |
JPS5656000A (en) | 1981-05-16 |
JPH0239800B2 (de) | 1990-09-07 |
GB2059658B (en) | 1983-03-02 |
FR2472804A1 (fr) | 1981-07-03 |
GB2059658A (en) | 1981-04-23 |
FR2472804B1 (de) | 1983-08-19 |
US4379948A (en) | 1983-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2536585C3 (de) | Anordnung zur statistischen Signalanalyse | |
EP0277613B1 (de) | Verfahren zur Übertragung eines Audiosignals | |
DE2629697A1 (de) | Elektronisches musikinstrument | |
DE69629986T2 (de) | Verfahren und Gerät zum Kodieren digitaler akustischer Signale | |
EP0251028B1 (de) | Verfahren zur Übertragung eines Audiosignales | |
DE2851877C3 (de) | Blutdruck-Meßgerät und Verfahren zur Fehlerkompensation bei der Blutdruckmessung | |
DE2357067C3 (de) | Elektrische Schaltungsanordnung in Verbindung mit einer Spracherkennungseinrichtung | |
DE3314570A1 (de) | Verfahren und anordnung zur einstellung der verstaerkung | |
DE2637063A1 (de) | Kanalprocessor | |
DE2939077A1 (de) | Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal | |
DE2830483C2 (de) | Elektronisches Tastatur-Musikinstrument | |
DE2131635A1 (de) | Digitale Komprimierschaltung | |
DE2720666A1 (de) | Verfahren und anordnung zur geraeuschanalyse | |
DE2920041C2 (de) | Verfahren zum Verifizieren von Signalen, und Anordnung zum Durchführen des Verfahrens | |
AT403969B (de) | Verfahren zur kompression eines analogen signals | |
DE2719175A1 (de) | Schallanalysiereinrichtung | |
DE2505388C2 (de) | Anordnung zur logarithmischen Umwandlung eines Meßwertes | |
DE1105914B (de) | Schaltung zur automatischen Regelung und/oder Begrenzung der Hoehe von Impulsfolgen | |
EP0272723B1 (de) | Verfahren zur Bestimmung des zeitlichen Verlaufs eines Sprachparameters und Anordnung zur Durchführung des Verfahrens | |
EP0027233A1 (de) | Verfahren zur Codierung von Analogsignalen | |
DE3037276C2 (de) | Tonsynthesizer | |
EP0518116A1 (de) | Verfahren zum Messen des Spitzenwertes einer Wechselspannung | |
DE3129155A1 (de) | Datenkompressorsystem | |
EP0417854B1 (de) | Verfahren zur Erkennung von N unterschiedlichen Wortketten in einem Sprachsignal | |
DE1547027B2 (de) | Verfahren und anordnung zur konsonantenbestimmung in sprachsignalen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |