DE2939077A1 - Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal - Google Patents

Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal

Info

Publication number
DE2939077A1
DE2939077A1 DE19792939077 DE2939077A DE2939077A1 DE 2939077 A1 DE2939077 A1 DE 2939077A1 DE 19792939077 DE19792939077 DE 19792939077 DE 2939077 A DE2939077 A DE 2939077A DE 2939077 A1 DE2939077 A1 DE 2939077A1
Authority
DE
Germany
Prior art keywords
signal
output
arrangement
value
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19792939077
Other languages
English (en)
Other versions
DE2939077C2 (de
Inventor
Dipl.-Ing. Dr. Michael H. 2000 Hamburg Kuhn
Dipl.-Phys. Hermann Ney
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philips Intellectual Property and Standards GmbH
Original Assignee
Philips Patentverwaltung GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Patentverwaltung GmbH filed Critical Philips Patentverwaltung GmbH
Priority to DE19792939077 priority Critical patent/DE2939077A1/de
Priority to GB8030830A priority patent/GB2059658B/en
Priority to FR8020503A priority patent/FR2472804A1/fr
Priority to JP13508780A priority patent/JPS5656000A/ja
Priority to US06/192,156 priority patent/US4379948A/en
Publication of DE2939077A1 publication Critical patent/DE2939077A1/de
Application granted granted Critical
Publication of DE2939077C2 publication Critical patent/DE2939077C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Description

PHILIPS PATENTVERWALTUNG GMSH . : pHD 79_i04
-I"
Verfahren und Anordnung zum Bestimmen charakteristischer Werte aus einem Geräuschsignal"
Die Erfindung betrifft ein Verfahren zum Bestimmen charakteristischer Werte aus einem zeitbegrenzten Geräuschsignal, insbesondere einem Sprachsignal eines Sprechers, bei dem das Geräuschsignal in benachbarte Frequenzbereiche aufgeteilt und das Geräuschsignal jedes Frequenzbereiches jeweils über aufeinanderfolgende gleiche Zeitabschnitte zu Kurzzeitspektrum-Signalen ontegriert wird, sowie eine Anordnung zum Durchführen dieses Verfahrens.
Verfahren der obengenannten Art dienen dazu, anhand der charakteristischen Werte Geräuschsignale, die nicht identisch reproduzierbar sind, zu erkennen bzw. zuzuordnen. Solche Geräuschsignale können beispielsweise bei dem Prüfen oder dem Betrieb von Maschinen auftreten, wobei eine Veränderung, die einen möglichen Ausfall der Maschine ankündigen kann, möglichst rechtzeitig erkannt werden soll. Eine andere bedeutende Art von Geräuschsignalen sind Sprachsignale, anhand denen ein Sprecher erkannt bzw. verifiziert werden soll. Derartige Geräuschsignale haben die Eigenschaft, daß sie allgemein nicht exakt reproduzierbar sind und daß sie andererseits eine sehr große Anzahl von Informationen enthalten, so daß eine direkte Speicherung zum Vergleich praktisch nicht in Frage kommt. Es ist daher notwendig, diese Informationsmenge stark zu reduzieren, indem charakteristische Werte daraus abgeleitet werden. Diese charakteristischen Werte sollen möglichst nur soviel Information enthalten, wie zur Kennzeichnung der Besonderheiten des jeweiligen Geräuschsignals notwendig sind.
Es ist bereits bekannt, aus einem Geräuschsignal aufein-
13001S/0405
PHD 79-104
anderfolgende Kurzzeitspektren durch Integration der Energie des Geräuschsignals in benachbarten Frequenzbereichen zu erzeugen. Aus diesen Kurzzeitspektren kann durch deren Summierung das Langzeitspektrum gewonnen werden, und außerdem kann aus dem Langzeitspektrum und den Kurzzeitspektren die Standardabweichung für die einzelnen Frequenzbereiche bestimmt werden. Dabei stellen also die Werte des Langzeitspektrums oder der Standardabweichungen die charakteristischen Werte des Geräuschsignals bzw. Sprachsignals dar. Diese bekannten Verfahren ergeben Jedoch häufig eine zu starke Reduzierung der Informationsmenge, so daß eine Unterscheidung ähnlicher Geräuschsignale bzw. Sprachsignale nicht in einem ausreichenden Maße möglich ist.
Aufgabe der Erfindung ist es, ein Verfahren der eingangs genannten Art anzugeben, mit dem aus einem Geräuschsignal bzw. Sprachsignal charakteristische Werte mit einer ausrei chenden Anzahl gewonnen werden können, die die Besonder-
heiten des zu prüfenden bzw. zu vergleichenden Geräuschsignals besonders gut enthalten. Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß für jeden Frequenzbereich ein Histogramm der KurzzeitSpektrum-Signale gebildet wird, indem die Anzahl Kurzzeitspektrum-Signale jedes Signal-
wertes gezählt wird, daß mindestens ein Bruchteil der Anzahl der Kurzzeitspektrum-Signale je Frequenzbereich durch eine vorgegebene Quantilzahl dividiert und ein Quantilwert gebildet wird, daß die Anzahl der Kurzzeitspektrum-Signale für aufeinanderfolgende Signalwerte, beginnend bei dem
niedrigsten Signalwert, summiert wird, bis jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten ist, und daß die Signalwerte, bei denen jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder übeerschritten ist, als die charakteristischen
Werte ausgegeben werden. Auf diese Weise werden die
130015/(UQS
*5 PHD 79-104
-3-
Histogramme der aufeinanderfolgenden Kurzzeitspektren in den einzelnen Frequenzbereichen verwendet, wobei anstelle einer direkten Speicherung der Histogramme, die einen zu großen Speicherplatz erfordern würde, eine Ableitung kennzeichnender Werte aus den Histogrammen verwendet wird. Dies erfolgt durch die Bildung der Quantile, die sich als Streifengrenzen ergeben, wenn die Histogramme der einzelnen Frequenzbereiche in Streifen gleicher Fläche unterteilt werden, und die ausreichend Information über die Form der einzelnen Histogramme enthalten.
Bei der Aufnahme eines diskontinuierlichen Geräuschsignals, das insbesondere bei einem Sprachsignal normalerweise vorliegt, können zumindest in einzelnen Frequenzbereichen Pausen auftreten, in denen sich das Rauschen der gesamten Umwandlungsanordnung mit den Verstärkern zur Umwandlung des Geräuschsignals in ein elektrisches £ignal sowie auch ein gleichmäßiges Hintergrundgeräusch bemerkbar machen. Dies führt dazu, daß beispielsweise bei einem weißen Rauschen alle Histogramme bei den Signalwerten entsprechend dem Rauschsignal eine hohe Spitze aufweisen, die jedoch überhaupt nicht geräuschsignalspezifisch ist. Um diese Spitze bei der Bestimmung der Quantile auszuschließen, ist es zweckmäßig, daß die Summierung der Kurzzeitspektrum-Signale zunächst beginnend beim niedrigsten Signalwert solange fortgesetzt wird, bis ein Minimum-Signal wert erreicht ist, bei dem die Anzahl der Kurzzeitspektrum-Signale ein Minimum ist, daß die Anzahl der bis zu diesem Minimum-Signalwert summierten Kurzzeitspektrum-Signale von der Gesamtzahl der Kurzzeitspektrum-Signale subtrahiert und aus der Differenz der Quantilwert gebildet wird, und daß dann erneut die Summierung der Kurzzeitspektrum-Signale vom Anfangswert Null und der Vergleich mit den Vielfachen des Quantilwertes beginnt. Auf diese Weise wird das bei niedrigen Geräuschsignalen bzw. bei
130015/0405
PHD 79-104 Signalpausen erfaßte Rauschen weitgehend ausgeschaltet.
Dieses Rauschsignal ist jedoch auch bei größeren Geräuschsignalamplituden vorhanden und überlagert sich praktisch additiv. Um den Einfluß des Rauschens auch bei größeren Geräuschsignalwerten auszuschalten, ist es zweckmäßig, daß von den Signalwerten, bei denen jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird, der Minimum-Signalwert subtrahiert wird, wobei die Differenzen die charakteristischen Werte darstellen. Dadurch werden die Histogramme parallel verschoben, so daß der Einfluß des additiv überlagerten Rauschens praktisch bei allen Geräuschsignalwerten eliminiert wird.
Es ist möglich, daß das Geräuschsignal bei der Aufnahme durch den Einfluß von linearen Übertragungsfunktionen verfälscht wird, beispielsweise ein über eine Telefonleitung übertragenes Sprechsignal durch die Übertragungsfunktion der gesamten Telefon-Übertragungsstrecke. Um den Einfluß der Übertragungsfunktion auszugleichen, ist es zweckmäßig, daß außerdem das Langzeitspektrum des Gerauschsignals durch Addition aller Kurzzeitspektrum-Signale je Frequenzbereich gebildet wird, und daß die Signalwerte, bei denen jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird, durch ein von dem Signalwert des zugehörigen Frequenzbereiches des Langzeitspektrums abgeleiteten Wert dividiert werden und die Quotienten die charakteristischen Werte darstellen. Dadurch kann auch die unterschiedliche Lautstärke verschiedener Geräuschsignale bei der Aufnahme zum Teil ausgeglichen werden, die insbesondere bei Sprachsignalen.auftritt, z.B. wenn der Besprechungsabstand des Mikrofons vom Sprecher nicht genau eingehalten wird. Das Langzeitspektrum enthält nämlich die Gesamtenergie des Geräuschsignals und damit auch eine Angabe über die mittlere Energie jedes
130015/0405
JpT PHD 79-104
Frequenzbereiches.
In dem Langzeitspektrum ist ein Rauschsignal der Aufnahmeeinrichtung ebenso enthalten wie in den Histogrammen. Um den Einfluß des Rauschens auch aus dem Langzeitspektrum zu entfernen, ist es zweckmäßig, daß von jedem Spektralwert des Langzeitspektrums zunächst das Produkt aus der Gesamtzahl der Kurzzeitspektrum-Signalwerte und des Minimum-Signalwertes des zugehörigen Frequenzbereiches subtrahiert wird. Auf diese Weise wird die während des gesamten Geräuschsignals hinzugefügte Rauschenergie aus dem Langzeitspektrum wieder entfernt.
Wenn die Lautstärke-Korrektur der Quantile mittels Division durch den Langzeitspektrumwert des jeweils zugehörigen Frequenzbereichs für jeden Frequenzbereich getrennt geschieht, geht jedoch ein kleiner Anteil der Information verloren, nämlich der Anteil, der in dem Langzeitspektrum enthalten ist. Um diesen Informationsverlust zu vermeiden, ist es zweckmäßig, daß außerdem durch Addition aller Kurzzeitspektrum-Signale aller Frequenzbereiche ein Gesamtenergiewert gebildet wird und daß die Signalwerte, bei denen jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird, durch einen für alle Frequenzbereiche gleichen, von dem Gesamtenergiewert abgeleiten Wert dividiert werden und die Quotienten die charakteristischen Werte darstellen. Die Summe der Kurzzeitspektrum-Signale aller Frequenzbereiche gibt nämlich die mittlere Lautstärke unabhängig vom Frequenzbereich wieder und ermöglicht besonders gut den Ausgleich von Lautstärkeunterschieden, jedoch erfolgt dann kein Ausgleich von Ubertragungsfunktionen mehr.
Eine Anordnung zur Durchführung des erfindungsgemäßen Verfahrens mit einer Wandleranordnung, die das vom'Geräuschsignal abgeleitete elektrische Signal erhält und am Ausgang Kurzzeitspektrum-Signalwerte erzeugt, die die Ener-
130015/040S
PHD 79-104
gie des elektrischen Signals in aufeinanderfolgenden gleichen Zeitabschnitten für jeweils einen von einer Anzahl benachbarter Frequenzbereiche angeben, ist dadurch gekennzeichnet, daß ein Speicher vorgesehen ist, daß während dem Zuführen des Geräuschsignals der Adresseneingang des Speichers mit dem Ausgang der Wandleranordnung verbunden ist und die Kurzzeitspektrum-Signalwerte und die Nummer des zugehörigen Frequenzbereiches als Adressen erhält, daß der Datenausgang des Speichers mit einem Addierer verbunden ist, der den Inhalt des adressierten Speicherplatzes um eine Einheit erhöht und an den gleichen Speicherplatz zurückschreibt, daß nach dem Zuführen des Geräuschsignals während der Verarbeitung eine Adressieranordnung die Speicherplätze des Speichers aufeinanderfolgend beginnend bei den niedrigsten Adressen adressiert, daß an den Datenausgang des Speichers ferner eine Summieranordnung angeschlossen ist, die die Inhalte der adressierten Speicherplätze Jeweils eines Frequenzbereiches summiert, daß eine Vergleichsanordnung die summierten Inhalte mit Vielfachen eines von der Gesamtzahl der Kurzzeitspektrum-Signalwerte jedes Frequenzbereiches abgeleiteten Quantilwertes vergleicht und bei Überschreiten eines Vielfachen die momentane Adresse der Adressieranordnung in einen daran angeschlossenen Ergebnisspeicher einschreibt, der nach Adressierung aller Speicherplätze des Speichers durch die Adressieranordnung die gesuchten charakteristischen Werte angegebene Signalwerte enthält. Auf diese Weise werden die charakteristischen Werte mit wenig Aufwand gewonnen.
Weiterbildungen dieser Anordnung, insbesondere zur Bestimmung der Quantilwerte sowie zum Ausgleich des Einflusses von Rauschen, Ubertragungsfunktionen und unterschiedlicher Lautstärke, sind in den weiteren Unteransprüchen gekennzeichnet.
Ausführungsbeispiele der Erfindung werden nachstehend
130015/0405
' PHD 79-104 anhand der Zeichnung näher erläutert. Es zeigen:
Fig. 1a den zeitlichen Verlauf eines kurzzeitintegrierten Geräuschsignals in einem Frequenzbereich,
Fig. 1b ein daraus gewonnenes Histogramm,
Fig. 2 ein Blockschaltbild einer gesamten Anordnung,
Fig. 3 ein Blockschaltbild eines Teils einer gegenüber der Anordnung nach Fig. 2 erweiterten Anordnung zum Beseitigen des Einflusses von Rauschen,
Fig. 4 ein Blockschaltbild eines erweiterten Teils der Anordnung nach Fig. 2 und Fig. 3 zum Beseitigen des Einflusses von Lautstärkeunterschieden,
Fig. 5 ein Blockschaltbild der Erweiterung der Anordnung nach Fig. 4.
Die Fig. 1a zeigt ein Beispiel des über Jeweils einen kurzen Zeitabschnitt integrierten Sprachsignals eines Frequenzbereiches über die Zeit t, wobei ein beispielsweise angegebener Zeitabschnitt von dem Zeitpunkt t^ bis zum Zeitpunkt tp reicht. Diese integrierten Signale entstehen daher im Abstand jeweils dieses Zeitabschnittes und sind durch Kreuze angedeutet, die zur besseren Übersichtlichkeit durch eine geglättete Kurve verbunden sind, Die Darstellung beginnt bei einer Pause des Geräuschsignals mit einem minimalen Wert R, der das unvermeidliche Rauschsignal der Aufnahmeanordnung mit den Verstärkern angibt und der daher nirgends unterschritten wird. Mit dem Einsatz des Geräuschsignals entstehen höhere Werte A des integrierten Signals, die jedoch bei der nächsten Geräuschsignalpause wieder auf den Rauschwert zurückgehen. Der
130015/0405
β" PHD 79-104
- IU-
Zeitverlauf der kurzzeitintegrierten Geräuschsignale in den anderen Frequenzbereichen hat einen ähnlichen, jedoch im einzelnen allgemein abweichenden Verlauf.
Wenn nun gezählt wird, wie oft ,jeder Wert A in einem zeitbegrenzten Geräuschsignal auftritt, entsteht eine Darstellung, die etwa der in Fig. 1b entspricht. Darin sind also die Anzahlen n, wie oft ein bestimmter integrierter Wert A auftritt, über diesen Wert A aufgetragen. Da die kurzzeitintegrierten Werte A in digitaler Form vorliegen, ist eine solche Zählung ohne weiteres möglich, die eine Folge von diskreten Punkten ergibt, die in der Fig. 1b der Übersichtlichkeit halber durch eine geglättete Kurve verbunden sind.
Wie bereits anhand der Fig. 1a erläutert, ist der niedrigste auftretende Wert R durch das Rauschen der Aufnahmeanordnung gegeben. Abhängig davon, wie viele Pausen bzw. sehr leise Stellen in dem Geräuschsignal bzw. in einem Frequenzbereich davon auftreten, ist die Spitze der Kurve beim Wert R mehr oder weniger hoch, und sie kann sogar wesentlich höher als der höchste Wert des nachfolgenden Teils der Kurve sein. Da die Anzahl der kurzzeitintegrierten Werte, die nur das Rauschen enthalten, praktisch keine Information über das Geräuschsignal enthält, andererseits aber sehr stark die Lage der Quantilö beeinflußt, die nachstehend erläutert werden, ist es zweckmäßig, den durch das Rauschen erzeugten Anteil möglichst zu beseitigen. Dafür wird das erste Minimum der Kurve aufgesucht, das im dargestellten Fall beim Wert QQ liegt, und damit wird die weitere Verarbeitung fortgesetzt.
Beginnend von diesem Wert Q wird nun die Kurve in eine Anzahl flächengleiche Abschnitte eingeteilt. In dem hier gewählten Beispiel sind dies sechs Abschnitte. Die Werte
130015/0405
Q bis Qg, die die Grenzen der einzelnen Abschnitte angeben, werden die Quantile genannt, die hier die gesuchten charakteristischen Werte darstellen. Diese Quantile, d.h. die Grenzen der Abschnitte, sind sehr stark abhängig von der Form der Kurve und enthalten somit viel Information über diese Form, benötigen andererseits jedoch nur einen geringen Speicherbedarf, nämlich im angegebenen Beispiel für sieben Werte. Dabei kann der unterste Wert QQ eingespart werden, wenn die Kurve durch das Beseitigen des Einflusses des Rauschens so nach links geschoben wird, daß dieser Wert QQ immer auf den Nullpunkt fällt, während der maximale Wert Qg häufig gleich dem maximal darstellenden Wert von A ist, da dessen Stellenzahl begrenzt ist und einzelne kurzzeitintegrierte Geräuschsignale diesen Wert erreichen oder gar überschreiten können. Die grundsätzliche Ausnahme des höchsten Quantiis Qg gleich dem maximal darstellbaren Wert ergibt zumindest nur einen vernachlässigbar kleinen Fehler, so daß nur die Quantile Q1 bis Q1- als charakteristische Werte gespeichert werden müssen.
Die Quantile Q1 bis Q1- können dadurch gefunden werden, daß die Gesamtzahl der Zeitabschnitte und damit die Gesamtzahl der kurzzeitintegrierten Werte A durch eine Quantilzahl dividiert wird, die die Anzahl der Flächenabschnitte unter der Kurve entsprechend der Fig. 1b angibt. Dies ergibt einen Wert, der mit Quantilwert bezeichnet wird und die Anzahl η aller aufgetretenen Werte a in einem Flächenabschnitt angibt. Dies ist ein Maß für die Flächenabschnitte und somit für alle Flächenabschnitte gleich. Es werden nun die Anzahlen η der einzelnen Werte A, beginnend vom kleinsten Wert bzw. vom Minimum bei Q , aufsummiert, bis der Quantilwert erreicht ist. Der Wert A, bei dem gerade dieser Quantilwert erreicht wird, ist das erste Quantil Q1. Nun wird die Aufsummierung der Anzahlen η weiter fortgesetzt und mit dem doppelten Quantilwert verglichen, usw.
130015/0405 ORIGINAL INSPECtEO
Statt dessen kann bei dem ersten Erreichen des Quantilwertes die Aufsummierung der Anzahlen der Werte A wieder bei Null beginnen, bis wieder der Quantilwert erreicht ist, usw. für die folgenden Abschnitte.
Ein Blockschaltbild der wichtigsten Elemente für die Bestimmung der Quantile als charakteristische Werte ist in Fig. 2 dargestellt. Über das Mikrofon 1 wird das Geräuschsignal aufgenommen und in ein elektrisches Signal umgewandelt, wobei die nachgeschalteten Verstärker der Übersichtlichkeit halber nicht dargestellt sind. Das verstärkte elektrische Signal wird dann einer Filterbank 3 zugeführt, die dieses elektrische Signal in eine Anzahl aneinandergrenzender Frequenzbereiche aufspaltet und integriert. Die integrierten Werte der Frequenzbereiche werden über getrennte Leitungen einem Multiplexer 5 zugeführt, der von einem Zähler 15 gesteuert diese Leitungen aufeinanderfolgend abtastet und das abgetastete Signal einem Analog-Digital-Wandler 7 zuführt. Nach jeder Abtastung einer Leitung wird deren Signal wieder auf Null zurückgesetzt und von neuem integriert. Die Filterbank 3 kann insbesondere im Falle der Verarbeitung eines Sprachsignals beispielsweise einen Frequenzbereich von 100 Hz bis 7.500 Hz in 15 benachbarte Frequenzbereiche gleicher relativer Bandbreite aufteilen.
Der Zähltakteingang des Zählers 15 ist über den Schalter 13b mit einem Taktsignal Ck aus einer nicht dargestellten Taktsignalquelle verbunden, deren Frequenz die Dauer der Zeitabschnitte bestimmt, über die integriert wird. Bei einer Dauer der Zeitabschnitte von 27 ms muß die Taktfrequenz dann 555 Hz betragen.
Der Ausgang 8 des Analog-Digital-Wandlers 7 ist über den Schalter 13a mit einem Teil der Adresseneingänge eines
130015/0405
PHD 79-104
Speichers 9 verbunden, dessen andere Adresseneingänge mit dem Ausgang 16 des Zählers 15 verbunden sind. Die Leitungen 8 und 16, die je Mehr-Bit-Binärwerte übertragen, bestehen tatsächlich aus einer der Anzahl Bit entsprechenden Anzahl paralleler Leitungen, die lediglich der Übersichtlichkeit halber nur als eine Leitung dargestellt sind. Dies gilt auch für die meisten der übrigen Leitungen, auch in den folgenden Figuren, insbesondere wenn diese Leitungen Parallelausgänge von Zählern, Speichern und Registern sind.
Der Speicher 9 enthält für jeden der vom Analog-Digital-Wandler 7 erzeugbaren Werte mit z.B. 8 Bits eine Anzahl Speicherplätze entsprechend der Anzahl Frequenzbereiche, wobei jeder Speicherplatz eine Mehr-Bit-Zahl aufnehmen kann. Durch die Verbindung der Adresseneingänge des Speichers 9 mit den Ausgängen des Analog-Digital-Wandlers 7 und des Zählers 15, der den jeweils abgetasteten Frequenzbereich angibt, ist jedem Speicherplatz des Speichers 9 ein bestimmter Wert in einem bestimmten Frequenzbereich zugeordnet. Der Datenausgang des Speichers 9 ist über einen Addierer 11 mit dem Dateneingang verbunden, wobei der andere Eingang des Addierers 11 eine Signalkombxnation entsprechend dem Zahlenwert "1" erhält. Dadurch wird der Inhalt eines Speicherplatzes bei jeder Adressierung um 1 erhöht und enthält somit die Anzahl Male, die der zugehörige Signalwert am Ausgang 8 des Analog-Digital-Wandlers 7 in dem betreffenden Frequenzbereich aufgetreten ist.
An den Übertragsausgang des Zählers 15 für die Frequenzbereiche ist der Zähltakteingang eines Anzahlzählers 23 angeschlossen, der die Gesamtanzahl der Zeitabschnitte je Frequenzbereich des aufgenommenen Geräuschsignals an seinem Parallelausgang 24 bildet.
Nachdem das zeitbegrenzte Geräuschsignal aufgenommen und in Speicher 9 auf die beschriebene Weise das Histogramm
130015/0405
PHD 79-104
der Kurzzeitspektren gebildet worden ist, werden die Schalter 13a bis 13c, die zweckmäßig als elektronische Schalter z.B. mit UND-Gattern realisiert werden, parallel in die Stellung entgegengesetzt zur gezeichneten Stellung umgeschaltet. Damit erhält nun der Zähler 17, der einen Teil einer Adressieranordnung des Speichers 9 für den folgenden Verarbeitungsabschnitt bildet, über den Schalter 13c das Taktsignal Ck, das gleichzeitig auf eine höhere Frequenz umgeschaltet werden kann. Dieser Zähler beginnt von der Nullstellung an zu zählen und adressiert somit aufeinanderfolgende Speicherplätze des Frequenzbereichs, der durch den Zähler 15 vorgegeben wird, wobei dieser Zähler 15 sich zu Beginn des Verarbeitungsablaufs in der Anfangsstellung befindet. Die am Datenausgang 10 auftretenden Inhalte der adressierten Speicherplätze des Speichers 9 werden dem einen Eingang eines Addierers 19 zugeführt, dessen Ausgang mit dem Eingang eines Registers 21 verbunden ist, der das invertierte Taktsignal CK als Einschreibsignal erhält. Der Ausgang des Registers ist außer mit dem einen Eingang eines Vergleichers 33 auch mit dem anderen Eingang des Addierers 19 verbunden, so daß dieser zusammen mit dem Register 21 eine bekannte Akkumulatorschaltung bildet. Diese summiert die an dem Datenausgang 10 des Speichers 9 nacheinander erscheinenden Anzahlen aufeinanderfolgender kurzzeitintegrierter Signalwerte und führt diese dem einen Eingang des Vergleichers 33 zu.
Am Ende der Aufnahme des Geräuschsignals wird ferner das Signal am Parallelausgang 24 des Anzahl-Zählers 23, das die Gesamtanzahl der Zeitabschnitte des aufgenommenen Geräuschsignals darstellt, einem Dividierer 25 zugeführt, der diese Anzahl durch eine am Divisoreingang 26 zugeführte Quantilzahl teilt, die die Anzahl der Flächenabschnitte angibt, in die die Histogrammkurven zu unterteilen sind. Der von dem Dividierer 25 gelieferte Quantilwert stellt den
13Q015/G405
Wert dar, bis zu dem die am Datenausgang 10 des Speichers 9 abgegebenen Speicherplatzinhalte aufsummiert werden müssen, um zur Grenze des ersten Flächenabschnitts zu gelangen, und er wird dem einen Eingang eines Addierers 27 zugeführt, dessen Ausgang mit dem Eingang eines Registers 29 verbunden ist, dessen Ausgang außer an den anderen Eingang des Vergleichers 33 auch an den anderen Eingang des Addierers 27 angeschlossen ist, so daß der Addierer 27 und das Register 29 ebenfalls eine Akkumulatoranordnung bilden. Zu Beginn enthält das Register 29 den Wert 0, so daß es unmittelbar den vom Dividierer 25 gelieferten Wert aufnimmt.
Der Zähler 17 adressiert nun nacheinander die zum ersten Frequenzbereich gehörenden Speicherplätze, und der Summierer aus dem Addierer 19 und dem Register 21 summiert die Inhalte der Speicherplätze, bis der vom Register 21 dem Vergleicher 33 zugeführte Wert größer oder mindestens gleich ist dem vom Register 29 gelieferten Wert. In diesem Falle liefert der Vergleicher 33 auf der Ausgangsleitung 34 ein Signal, das den Einschreibeingang des Ergebnisspeichers 31 ansteuert und den auf der Ausgangsleitung 18 des Zählers 17 diesem Ergebnisspeicher zugeführte Signal als erstes Quantil einschreibt. Der Zähler 17 adressiert nämlich in diesem Augenblick gerade die Speicherstelle, die entsprechend der Fig. 1b einem Wert A zugeordnet ist, der dieses erste Quantil angibt. Ferner schreibt dieses Ausgangssignal in das Register 29 das Ausgangssignal des Addierers 27 ein, das der Summe der am Ausgang des Dividierers 25 und des Registers 29 vorhandenen Werte entspricht, die beide gleich dem Quantilwert sind, so daß das Register 29 anschließend den doppelten Quantilwert enthält und dem Vergleicher 33 zuführt.
Der Zähler 17 adressiert nun nacheinander die folgenden
130015/0405
PHD 79-104
Speicherplätze des Speichers 9, und die am Datenausgang 10 erscheinenden Speicherplatzinhalte werden weiter aufsummiert, bis am Ausgang des Registers 21 ein Wert erscheint, der größer oder gleich dem doppelten Quantilwert ist, wodurch der Vergleicher 33 wieder ein Ausgangssignal auf der Leitung "5k abgibt, das das nächste Quantil in den Ergebnisspeicher 31 einschreibt und im Addierer wieder dem Quantilwert zum Inhalt des Registers 29 addiert und in das letztere einschreibt, so daß dieses nun den dreifachen Quantilwert enthält, und dies wird fortgesetzt, bis der Zähler 17 alle Speicherplätze eines Frequenzbereichs adressiert hat. Der Zähler 17 gibt dann ein Ubertragssignal auf der Leitung 20 ab, das über den Schalter 13b, der sich in der Stellung entgegengesetzt zur gezeichneten Stellung befindet, auf den Zähltakteingang des Frequenzbereichs-Zählers 15 gelangt und diesen auf den nächsten Frequenzbereich umschaltet. Ferner gelangt das Übertragsignal über die Leitung 20 auf den Löscheingang der Register 21 und 29 und setzt diese auf Null, wobei anschließend in das Register 29 wieder der vom Dividierer gelieferte einfache Quantilwert über den Addierer 27 eingeschrieben wird.
Nachdem der Zähler 17 das Ubertragssignal abgegeben hat, beginnt er wieder, von seiner Anfangsstellung zu zählen , und adressiert dadurch wieder aufeinanderfolgende Speicherplätze im Speicher 9> jedoch nun zum zweiten Frequenzbereich der Filterbank 3 gehörige Speicherplätze. Der auf dem Datenausgang 10 des Speichers 9 erscheinende Inhalt der Speicherplätze wird nun wieder in der Summieranordnung aus dem Addierer 19 und dem Register 21 eingeschrieben und das Ergebnis im Vergleicher 33 mit dem Quantilwert im Register 29 verglichen, wie dies bei den Inhalten der Speicherplätze des ersten Frequenzbereiches im Speicher 9 der Fall war, so daß nacheinander die Quantile des zweiten Frequenzbereichs in den Ergebnisspeicher
130015/0405
PHD 79-104
31 eingeschrieben werden, und dieser Ablauf wiederholt sich auch für die folgenden Frequenzbereiche. Der Ergebnisspeicher 31 enthält schließlich die Quantile der Histogramme aller Frequenzbereiche, und diese können ausgegeben und in einem anderen Speicher zwischengespeichert werden, um sie mit den Quantilen eines anderen, auf gleiche Weise verarbeiteten Geräuschsignals zu vergleichen, um den Grad der Übereinstimmung der beiden Geräuschsignale zu prüfen. Bei Anwendung in der Sprecherkennung kann dann beispielsweise festgestellt werden, ob das zweite Sprachsignal von dem gleichen Sprecher stammt wie das erste Sprachsignal.
In Fig. 3 ist ein Teil der Anordnung nach Fig. 2, und zwar der die Verarbeitung der aus dem aufgenommenen Geräuschsignal erstellten Histogramme von dem Datenausgang 10 des Speichers 9 sowie dem Ausgang 24 des Anzahlzählers 23 und dem Ausgang 18 des Zählers 17 für die Adressierung beginnend, in einer Abwandlung dargestellt, bei der der Ein-5n insbesondere
fluß des Rauschens/in Pausen des Geräuschsignals beseitigt wird. Die mit den in der Fig. 2 übereinstimmenden Elemente sind in Fig. 3 mit den gleichen Bezugszeichen bezeichnet.
An die Datenleitung 10 ist der eine Eingang eines Vergleichers 41 angeschlossen, dessen anderer Eingang über ein Register 43 an die Datenleitung 10 angeschlossen ist. Das Register 43 erhält als Einschreibsignal das gleiche Taktsignal Ck wie der Zähler 17 in Fig. 2, der den Speicher 9 adressiert, so daß das Register 43 außer bein
Wechsel der Adressierung immer den im vorhergehenden Taktabschnitt auf der Datenleitung 10 vorhandenen W<>rt enthält. Auf diese Weise vergleicht der Vergleicher 41 jeweils zwei aufeinanderfolgende Werte bzw. Anzahlen des gerade verarbeiteten Histogramms, und er gibt ein
Signal ab, wenn der auf der Datenleitung 10 vorhandone
130015/0405
PHD 79-104
Wert größer ist als der vom Register 43 gelieferte Wert, denn dann ist gerade das Minimum der Kurve beim Quantil Q in Fig. 1 erreicht. Der Vergleicher 41 wird daher als Minimum-Vergleicher bezeichnet. Sein Ausgangssignal steuert den Einschreibeingang eines Registers 47 an und schreibt den auf der Adressenleitung 18 des Zählers 17 in Fig. 2 vorhandenen Wert entsprechend dem Quantil Q in das Register 47 ein. Außerdem wird dieses Ausgangssignal dem D-Vorbereitungseingang eines D-Flip-Flops 45 zugeführt, das am Takteingang das inverse Taktsignal Ük erhält und somit nach einer halben Taktzeit umschaltet und dabei den Vergleicher 41 für weitere Vergleiche sperrt und das Ausgangssignal beendet. Ferner wird das Ausgangssignal über eine Zeitverzögerungsstufe 53 dem Löscheingang des Registers 21 und dem Einschreibeingang des Registers 29 zugeführt. Mit dem Beginn des Ausgangssignals des Minimum-Vergleichers 41 hatte nämlich die Summieranordnung aus dem Addierer 19 dem Register 21 sowie dem später zu erläuternden Multiplexer 37 die Anzahlen der kurzzeitintegrierten Werte bis zum Quantil Q in Fig. 1, die praktisch nur durch das Rauschen verursacht wurden, aufsummiert. Diese summierte Anzahl am Ausgang des Registers 21 wird nun außer dem einen Eingang des Addierers 19 auch dem Subtraktoreingang eines Subtrahierers 51 zugeführt, dessen Subtrahendeneingang mit der Leitung 24 verbunden ist, die das Ausgangssignal des Anzahl-Zählers 23 entsprechend der Gesamtzahl der Zeitabschnitte des Geräuschsignals bzw. der kurzzeitintegrierten Werte liefert. Dadurch erhält der Dividierer 25 an seinem Dividendeneingang eine um die Anzahl der lediglich Rauschen enthaltenden Zeitabschnitte verminderte Anzahl, die durch die am Eingang 26 zugeführte Quantilzahl dividiert und dem Register 29 zugeführt wird. Das zeitverzögerte Signal am Ausgang der Zeitverzögerungsanordnung 53 schreibt somit in das Register 29 den ersten Quantilwert ein. Außerdem wird das Register 21 gelöscht,
130015/0405
YT PHD 79-104
so daß nun die Summierung der Werte auf der Datenleitung 10 wieder bei Null beginnt.
Der Ausgang des Registers 21 ist mit dem Subtrahendeneingang und der Ausgang des Registers 29 mit dem Subtraktoreingang eines Subtrahierers 35 verbunden, der somit zur· nächst ein negatives Ausgangssignal liefert.
Die Summieranordnung aus dem Addierer 19, dem Multiple-ίο xer 37 und dem Register 31 summiert nun wieder die auf der Datenleitung 10 nacheinander erscheinenden Werte, beginnend mit dem auf den minimalen Wert folgenden Wert. Falls dieser minimale Wert auch noch mit erfaßt werden soll, kann der eine Eingang des Addierers 19 statt direkt mit der Datenleitung 10 mit dem Ausgang des Registers 43 verbunden werden. Sobald nun der Wert am Ausgang des Registers 21 den Quantilwert am Ausgang des Registers 29 erreicht oder überschreitet, liefert der Subtrahierer 35 einen positiven Wert am Ausgang. Dieser Ausgang ist mit dem Vergleicher 33 verbunden, der hier diesen Wert mit dem Wert "0" vergleicht und bei Erreichen bzw. Überschreiten ein Signal auf der Ausgangsleitung 34 abgibt. Dieses Signal steuert den Multiplexer 37 an und schaltet den Eingang des Registers 21 auf den Ausgang des Sübtrahierers, so daß dessen Ausgangswert mit dem nächsten inversen Taktsignal Ük in das Register 21 eingeschrieben wird. Hier wird also im Gegensatz zu der Anordnung nach Fig. 2 nicht mit aufeinanderfolgenden Vielfachen des Quantilwertes verglichen, sondern von dem aufsummierten Wert wird jeweils bei Erreichen bzw. Überschreiten des Quantilwertes dieser davon abgezogen. Dies entspricht vollständig dem Vergleich mit aufeinanderfolgenden Vielfachen des Quantilwertes.
Das Signal auf der Ausgangsleitung 34 des Vergleichers 33
130015/0405
PHD 79-104
steuert außerdem in gleicher Weise wie in Fig. 2 den Einschreibeingang des Ergebnisspeichers 31 an. Dieser erhält am Dateneingang über die Leitung 50 nun nicht direkt die am Speicher 9 in Fig. 2 anliegende Adresse über die Leitung 18 vom Ausgang des Zählers 17, sondern diese Leitung ist mit dem Subtrahenden-Eingang eines Subtrahierers 49 verbunden, der am Subtraktoreingang über die Leitung 48 das Ausgangssignal des Registers 47 erhält, der den Minimum-Wert enthält. Dieser Minimum-Wert wird nun ständig
Ό von der Adresse auf der Leitung 18 subtrahiert und dem Ergebnisspeieher 31 zugeführt, was gemäß der Fig. 1b einer Verschiebung des gesamten Histogramms um den Rauschanteil entspricht.
Nach Verarbeitung der kurzzeitintegrierten Werte des ersten Frequenzbereichs wird dann in gleicher Weise wie bei Fig. 2 beschrieben auf den nächsten Frequenzbereich umgeschaltet, wobei das Übertragssignal auf der Leitung 20 in Fig. 2 außer die Register 21 und 29 auch das Register 47 und das D-Flip-Flop 45 löscht, was der Einfachheit halber in Fig. 3 nicht dargestellt ist.
In den bisher beschriebenen Anordnungen ist noch nicht der Einfluß unterschiedlicher Übertragungsfunktionen während der Aufnahme bei verschiedenen Geräuschsignalen berücksichtigt, die miteinander verglichen werden sollen. Durch eine frequenzabhängige Übertragungsfunktion werden die Energien in einzelnen Frequenzbereichen unterschiedlich angehoben bzw. abgesenkt, und dies wirkt bei einem Histogramm wie eine proportionale Verschiebung der Abszissenwerte oder wie eine Maßstabsveränderung durch einen konstanten Skalierungsfaktor. Einen Sonderfall hiervon stellt eine unterschiedliche Lautstärke bei der Aufnahme dar, nämlich eine frequenzkonstante Übertragungsfunktion.
Dadurch werden alle Histogramme um den gleichen Skalie-
130015/0405
PHD 79-1C4
proportional verschoben. Dadurch beeinflußt sowohl die Übertragungsfunktion als auch die Lautstärke unmittelbar die Quantile.
Der einfachste Weg, Lautstärkeunterschiede auszugleichen, besteht in einer Dynamikregelung des in ein elektrisches Signal umgesetzten Geräuschsignals. Eine solche Dynamikregelung verfälscht jedoch in den meisten Fällen das Geräuschsignal, da später auftretende hohe Lautstärken naturgemäß zu Anfang noch nicht berücksichtigt werden können und somit der Beginn des Geräuschsignals gegenüber dem restlichen Teil bzw. dem Mittelwert zu laut aufgenommen wird. Für eine korrekte Lautstärkenberücksichtigung muß also zunächst das gesamte Geräuschsignal aufgenommen und daraus beispielsweise ein der mittleren oder der maximalen Lautstärke entsprechendes Signal gebildet werden. Hierfür eignet sich besonders das Langzeitspektrum, das die Gesamtenergie des Geräuschsignals in den einzelnen Frequenzbereichen angibt und beispielsweise durch Summierung der Kurzzeitspektrum-Signale der Frequenzbereich gebildet werden kann. Durch Summierung der einzelnen Werte des Langzeitspektrums wird dann ein Wert erhalten, der die Lautstärke bei der Aufnahme angibt, und durch eine proportionale Verschiebung der Abszisaenwerte'der Histogramme aller Frequenzbereiche entsprechend diesem Summenwert wird der Einfluß unterschiedlicher Lautstärke ausgeglichen, d.h. alle Quantile müssen durch diesen Summenwert dividiert werden.
Für den Ausgleich einer frequenzabhängigen Übertragungsfunktion müssen dagegen die Abszissenwerte der Histogramme für die einzelnen Frequenzbereiche unterschiedlich verschoben werden. Hierfür müssen die Werte des Langzeitspektrums für die einzelnen Frequenzbereiche getrennt verwendet werden, d.h. die Quantile jeweils eines Frequenzbereiches müssen durch den Wert des Langzeitspektrums
130015/0405
PHD 79-104
im gleichen Frequenzbereich dividiert werden.
Das Blockschaltbild einer Anordnung hierfür ist in Fig. dargestellt. Dabei wird das vom Analog-Digital-Wandler 7 in Fig. 2 auf der Ausgangsleitung 8 gelieferte Signal außerdem dem einen Eingang eines Addierers 61 zugeführt, dessen Ausgang mit dem Eingang eines Speichers 63 und dessen anderer Eingang mit dem Ausgang 64 dieses Speichers verbunden ist. Der Speicher 63 enthält für jeden Frequenz-Ό bereich einen Speicherplatz, der eine mehrstellige Zahl aufnehmen kann. Der Speicher 63 wird von einem Zähler 65 angesteuert, der am Zähltakteingang das Taktsignal Ck erhält und eine Kapazität entsprechend der Anzahl Frequenzbereiche bzw. -ausgänge der Filterbank 3 in Fig. 2 auf's weist. Dieser Zähler 65 kann auch durch den Zähler 15 in Fig. 2 ersetzt werden, so daß der Adresseneingang des Speichers 63 ebenfalls an die Leitung 16 anzuschließen ist.
Durch die Verbindung des Ausgangs 64 wird jeder über die Leitung 8 zugeführte Wert zu dem Inhalt des gerade adressierten Speicherplatzes addiert. Dadurch enthält der Speicher 63 am Ende der Aufnahme des Geräuschsignals die einzelnen Werte des Langzeitspektrums dieses Geräuschsignals.
Während der folgenden Verarbeitung der Histogramme des aufgenommenen Geräuschsignals in der Anordnung gemäß Fig. 2 bzw. Fig. 3 wird im Speicher 63 der Speicherplatz des Frequenzbereiches adressiert, dessen Histogramm gerade verarbeitet wird, was bei Verwendung des Zählers 15 in Fig. zur Adressierung des Zählers 63 automatisch erfolgt. Der am Ausgang 64 des Speichers 63 erscheinende Wert wird dem Divisor-Eingang eines Dividierers 71 zugeführt, dessen Dividenden-Eingang 72 mit dem Ausgang 18 des
130015/0405
PHD 79-104
Zählers 17 oder, bei Verwendung der Anordnung nach ?ig. 3, mit dem Ausgang 50 des Subtrahierers 49 verbunden ist. Der Ausgang des Dividierers 71 ist mit dem Dateneingang des Ergebnisspeichers 31 verbunden, so daß der Diviiierer 71 bei der Anordnung nach der Fig. 2 in die Leitung 18 und bei der Anordnung nach der Fig. 3 in die Leitung 50 einzufügen ist. Auf diese Weise werden alle Quantile eines Frequenzbereichs bei deren Erzeugung um einen Wert antsprechend der Gesamtenergie in diesem Frequenzbereich proportional verkleinert, wodurch der Einfluß von Lautstärkeunterschieden völlig ausgeglichen wird.
Die über die Leitung 8 dem Addierer 61 zugeführten Signale enthalten noch den durch das Rauschen hervorgerufenen Anteil, der dann auch in dem Langzeitspektrum enthalten ist. Bei Verwendung der Anordnung nach Fig. 3 wird dieser Rauschanteil jedoch aus den Histogrammen beseitigt. Um exakte Werte zu erhalten, muß bei Verwendung dieser Anordnung auch aus dem LangzeitSpektrum der Rauschanteil beseitigt werden.
Dies geschieht durch die in Fig. 5 als Blockschaltbild dargestellte Anordnung. Der Addierer 61 und der Speicher 63 sind dabei in gleicher Weise angeordnet bzw. angeschlossen wie in Fig. 4 dargestellt, und sie arbeiten auch in gleicher Weise wie für die Fig. 4 beschrieben. Lediglich der Adresseneingang des Speichers 63 ist nun an die Ausgangsleitung 16 des Zählers 15 in Fig. 2 angeschlossen dargestellt.
Der Ausgang 64 des Speichers 63 ist nun mit dem Subtrahendeneingang eines Subtrahierers 69 verbunden, dessen Subtraktoreingang mit dem Ausgang eines Multiplizierers 67 verbunden ist. Dieser multipliziert die am Ausgang des Anzahl-Zählers 23 in Fig. 2 abgegebene Gesamtanzahl
130015/0405
PHD 79-104
der Zeitabschnitte des aufgenommenen Geräuschsignals mit dem Ausgangssignal des Registers 47 auf der Leitung 48, das die Amplitude des Rauschsignals in dem betreffenden Frequenzbereich angibt. Dieses Produkt ist daher die durch das Rauschen hervorgerufene Energie während des gesamten Geräuschsignals, die in dem Subtrahierer 79 von der Gesamt-
wobei die Differenz
energie subtrahiert wird,/am Ausgang 70 abgegeben wird. Dieser Ausgang 70 kann nun entsprechend der Fig. 4 direkt mit dem Divisoreingang des Dividierers 71 verbunden werden. 10
In Fig. 5 ist der Ausgang 70 des Subtrahierers 69 jedoch mit dem einen Eingang eines Addierers 81 verbunden, dessen Ausgang mit dem Eingang des Registers 83 und dessen zweiter Eingang mit dem Ausgang dieses Registers verbunden ist. Das Register 83 erhält auf der Leitung 20 das Übertragssignal des Zählers 17 in Fig. 2 als Einschreibsignal, so daß dieses Register 83 am Ende der Verarbeitung der Histogramme aller Frequenzbereiche die Summe der einzelnen korrigierten Werte des Langzeitspektrums enthält. Dieser Wert ist, wie vorher erläutert wurde, ein Maß für die Lautstärke, so daß durch diesen Teil der Anordnung nach Fig. 5 nun der Einfluß von Lautstärkeunterschieden ausgeglichen wird. Da dieser Wert jedoch erst am Ende der Verarbeitung aller Histogramme vorliegt, können die Quantile dieser Histogramme bei der Erzeugung noch nicht korrigiert werden, und sie werden daher zunächst unkorrigiert in den Ergebnisspeicher 31 eingeschrieben. Erst nach Erzeugung der Quantile aller Histogramme wird ein Adressenzähler 85 gestartet, der die Speicherplätze des Ergebnisspeichers 31 aufeinanderfolgend adressiert, und die am Ausgang 32 nacheinander erscheinenden Quantile werden dem Dividierer 71 zugeführt und durch die Summe des korrigierten Langzeitspektrums dividiert und anschließend an denselben Speicherplatz im Ergebnisspeisher 31 wieder eingeschrieben. Erst wenn der Zähler 85 alle Speicherplätze des Ergebnisspeichers 31 adressiert
130015/0405
PHD 79-104
hat, enthält dieser die korrigierten Quantile.
Da die Werte des Langzeitspektrums und besonders die Summe dieser Werte des Langzeitspektrums sehr große Zahlen sind, werden sie zweckmäßig vor der Weiterverarbeitung in dem Dividierer 71 durch einen Skalierungsfaktor geteilt. Dies kann durch eine einfache konstante Kommaverschiebung erzielt werden, die auch durch einen entsprechenden Aufbau bzw. Anschluß des Dividierers 71 erreicht werden kann.
Die in den Anordnungen angegebenen Elemente wie Speicher, Register und Rechenelemente können in verschiedener bekannter Weise aufgebaut sein. Dabei können beispielsweise die Speicher zu einem einzigen Speicher entsprechender Größe zusammengefaßt werden, und auch die Rechenelemente können durch Mehrfachausnutzung zusammengefaßt werden. Insbesondere können diese Elemente wie auch die Register und Vergleicher vollständig oder zumindest teilweise durch einen fest programmierten Mikroprozessor ersetzt werden.
130015/0405

Claims (15)

PHD 79-104 PATENTANSPRÜCHE:
1.J Verfahren zum Bestimmen charakteristischer Werte ms einem zeitbegrenzten Geräuschsignal, insbesondere einem Sprachsignal eines Sprechers, bei dem das Geräuschsignal in benachbarte Frequenzbereiche aufgeteilt und das Geräuschsignal jedes Frequenzbereiches jeweils über aufeinanderfolgende gleiche Zeitabschnitte zu Kurzzeitspektrum-Signalen integriert wird, dadurch gekennzeichnet, daß für jeden Frequenzbereich ein Histogramm der Kurzzeitspektrum-Signale gebildet wird, indem die Anzahl Kurzzeitspektrum-Signale jedes Signalwertes gezählt wird, daß mindestens ein Bruchteil der Anzahl der Kurzzeitspektrum-Signale je Frequenzbereich durch eine vorgegebene Quantilzahl dividiert und ein Quantilwert gebildet wird, daß die Anzahl der Kurzzeitspektrum-Signale für aufeinanderfolgende Signalwerte, beginnend bei dem niedrigsten Signalwert, summiert wird, bis jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird und daß die Signalwerte, bei denen jeweils ein ganzzahliges Vielfaches des Quant ij. wertes erreicht oder überschritten wird, als die charakteristischen Werte ausgegeben werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Summierung der Kurzzeitspektrum-Signale zunächst beginnend beim niedrigsten Signalwert solange fortgesetzt wird, bis ein Minimum-Signalwert erreicht ist, bei dem die Anzahl der Kurzzeitspektrum^Signale ein Minimum ist, daß die Anzahl der bis zu diesem Minimum summierten Kurzzeitspektrum-Signale von der Gesamtzahl der Kurzzeitspektrum-Signale subtrahiert und aus der Differenz der Quantilwert gebildet wird, und daß dann erneut die Summierung der Kurzzeitspektrum-Signale vom Anfangswert Null und der Vergleich mit den Vielfachen des Quantilwertes beginnt.
130015/0405
PHD 79-104
-ι-
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß von den Signalwerten, bei denen jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird, der Minimum-Signalwert subtrahiert wird, wobei die Differenzen die charakteristischen Werte darstellen.
4. Verfahren nach Anspruch 1 oder einem der folgenden, dadurch gekennzeichnet, daß außerdem das Langzeitspektrura des Geräuschsignals durch Addition aller Kurzzeitspektrum-Signale je Frequenzbereich gebildet wird, und daß die Signalwerte, bei denen jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird, durch ein von dem Signalwert des zugehörigen Frequenzbereiches des Langzeitspektrums abgeleiteten Wert dividiert werden und die Quotienten die charakteristischen Werte darstellen
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß von jedem Spektralwert des Langzeitspektrums zunächst das Produkt aus der Gesamtzahl der Kurzzeitspektrum-Signalwerte und des Minimum-Signalwertes des zugehörigen Frequenzbereiches subtrahiert wird.
6. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß außerdem durch Addition aller Kurzzeitspektrum-Signale aller Frequenzbereiche ein Gesamtenergiewert gebildet wird, und daß die Signalwerte, bei denen jeweils ein ganzzahliges Vielfaches des Quantilwertes erreicht oder überschritten wird, durch einen für alle Frequenzbereiche gleichen, von dem Gesamtenergiewert abgeleiteten Wert dividiert werden und die Quotienten die charakteristischen Werte darstellen.
7. Anordnung zur Durchführung des Verfahrens nach Anspruch 1, mit einer Wandleranordnung, die das vom Geräuschsignal abgeleitete elektrische Signal erhält und am
130015/0405
PHD 79-104
Ausgang Kurzzeitspektrum-Signalwerte erzeugt, die die Energie des elektrischen Signals in aufeinanderfolgenden gleichen Zeitabschnitten für jeweils einen von einer Anzahl benachbarter Frequenzbereiche angeben, dadurch gekennzeichnet, daß ein Speicher (9) vorgesehen ist, daß während dem Zuführen des Geräuschsignals der Adresseneingang des Speichers (9) mit dem Ausgang (8) der Wandleranordnung (3, 5, 7) verbunden ist und die Kurzzeitspektrum-Signalwerte und die Nummer des zugehörigen Frequenzbereiches als Adressen erhält, daß der Datenausgang (1) des Speichers (9) mit einem Addierer (11) verbunden ist, der den Inhalt des adressierten Speicherplatzes um eine Einheit erhöht und an den gleichen Speicherplatz zurückschreibt, daß nach dem Zuführen des Geräuschsignals während der Verarbeitung eine Adressieranordnung (15,
17) die Speicherplätze des Speichers (9) aufeinanderfolgend beginnend bei den niedrigsten Adressen adressiert, daß an den Datenausgang (10) des Speichers (9) ferner eine Summieranordnung (19, 21) angeschlossen ist, die die Inhalte der adressierten Speicherplätze jeweils eines Frequenzbereiches summiert, daß eine Vergleichsanordnung (33; 35) die summierten Inhalte mit Vielfachen eines von der Gesamtzahl der Kurzzeitspektrum-Signalwerte jedes Frequenzbereiches abgeleiteten Quantilwertes vergleicht und bei Überschreiten eines Vielfachen die momentane Adresse der Adressieranordnung (15, 17) in einen daran angeschlossenen Ergebnisspeicher (31) einschreibt, der nach Adressierung aller Speicherplätze des Speichers (9) durch die Adressieranordnung (15, 17) die gesuchten charakteristischen Werte angebende Signalwerte enthält.
8. Anordnung nach Anspruch 7, dadurch gekennzeichnet, daß ein Anzahl-Zähler (23) vorgesehen ist, dessen Takteingang bei jedem der aufeinanderfolgenden Zeitabschnitte ein Zählsignal von einer die Wandleranordnung (3, 5» 7)
130015/0405
-27 PHD 79-104
steuernden Einrichtung (15) enthält, und daß an den Ausgang (24) des Anzahl-Zählers (23) ein Dividierer (25) angeschlossen ist, der am Divisoreingang (26) ein der maximalen Anzahl von Vielfachen des Quantilwertes entsprechendes Signal erhält.
9. Anordnung nach Anspruch 8, dadurch gekennzeichnet, daß dem Dividierer (25) eine Addieranordnung (27, 29) nachgeschaltet ist, deren Ausgang mit dem einen Eingang eines Vergleiches (33) verbunden ist, dessen anderer Eingang mit dem Ausgang der Summieranordnung (19, 21) verbunden ist und dessen Ausgang ein Ausgangssignal liefert, wenn das Signal am Ausgang der Summieranordnung (19, 21) einen größeren Wert angibt als das Signal am Ausgang der Addieranordnung (27, 29), und mit dem Einschreibeingang des Ergebnisspeichers (31) und der Addieranordnung (27, 29) verbunden ist, wodurch ein Ausgangssignal jeweils das an dem mit der Adressieranordnung (15, 17) verbundenen Eingang (18) des Ergebnisspeichers (31) anliegende Signal einschreibt und in der Addieranordnung (27, 29) deren Inhalt um das Ausgangssignal des Dividierers (25) erhöht.
10. Anordnung nach Anspruch 8, dadurch gekennzeichnet, daß die Vergleichsanordnung ein erster Subtrahierer (35) ist, dessen Subtrahendeneingang mit dem Ausgang der Summieranordnung (19, 21), dessen Subtraktoreingang mit dem Ausgang des Dividierers (25) und dessen Ausgang mit dem Eingang eines Vergleichers (33) verbunden ist, dessen Ausgangssignal bei einem positiven Ausgangswert des ersten Subtrahierers (35) den Einschreibeingang des Ergebnisspeichers (31) ansteuert und den Ausgangswert des ersten Subtrahierers (35) in die Summieranordnung (19, 21) einschreibt.
11. Anordnung nach Anspruch 7 oder einem der folgenden,
130015/0405
PHD 79-104
dadurch gekennzeichnet, daß an den Datenausgang (10) des Speichers (9) der eine Eingang eines Minimum-Vergleichers (41) angeschlossen ist, dessen anderer Eingang mit einem Pufferregister (43), das das jeweils vorhergehende Signal des Datenausgangs (10) speichert, verbunden ist, daß ein Ausgangssignal des Minimum-Vergleichers (41) bei einem Wert am Datenausgang (10) größer als der Wert am Ausgang des Pufferregisters (43) einen zweiten Subtrahierer (51) ansteuert, der das Ausgangssignal der Summieranordnung (19,
21) von dem Ausgangssignal des Anzahl-Zählers (23) subtrahiert und das Ergebnis dem Dividierer (25) zuführt, wobei dieses Ausgangssignal des Minimum-Vergleichers (41) danach den Inhalt der Summieranordnung (19, 21) auf den Wert Null einstellt.
12. Anordnung nach Anspruch 11, dadurch gekennzeichnet, daß das Ausgangssignal des Minimum-Vergleichers ein Minimumwert-Register (47) ansteuert und das momentane Ausgangssignal der Adressieranordnung (15, 17) einspeichert, und das ein dritter Subtrahierer (49) vorgesehen ist, der das Ausgangssignal des Minimum-Registers (47) von dem Ausgangssignal der Adressieranordnung (15, 17) subtrahiert und die Differenz dem Dateneingang (50) des Ergebnisspeichers (31) zuführt.
13. Anordnung nach Anspruch 7 oder einem der folgenden, dadurch gekennzeichnet, daß eine Langzeitspektrum-Anordnung (61, 63) vorgesehen ist, die an den Ausgang (8) der Wandleranordnung (3, 5, 7) angeschlossen ist und die Kurzzeitspektrum-Signale getrennt nach Frequenzbereichen zu einem Langzeitspektrum aufsummiert, und daß der Ausgang der Langzeitspektrum-Anordnung (61, 63) mit dem Divisor-Eingang einer Dividieranordnung (71) verbunden ist, deren Dividendeneingang (72) mit dem Ausgang der Adressieranordnung (15, 17) bzw. des dritten Subtrahierers (49) und
130015/0405
29 PHD 79-104
deren Ausgang mit dem Ergebnisspeicher (31) verbunden ist, wobei in der Langzeitspektrum-Anordnung (61, 63) und im Speicher (9) derselbe Frequenzbereich adressiert ist.
14 Anordnung nach Anspruch 13, dadurch gekennzeichnet, daß der Langzeitspektrum-Anordnung (61, 63) unmittelbar ein vierter Subtrahierer (69) nachgeschaltet ist, dessen Subtraktor-Eingang mit dem Ausgang eines Multiplizierers (67) verbunden ist, dessen einer Eingang an den Ausgang
(24) des Anzahl-Zählers (23) und dessen anderer Eingang an den Ausgang des Minimum-Registers (47) angeschlossen ist.
15. Anordnung nach Anspruch 13 oder 14, dadurch gekennzeichnet, daß der Langzeitspektrum-Anordnung (61, 63) ein Akkumulator (81, 83) nachgeschaltet ist, der die Summe aller Kurzzeitspektrum-Signale aller Frequenzbereiche bildet und dessen Ausgang mit dem Divisoreingang der Dividieranordnung (71) verbunden ist.
130015/0405
DE19792939077 1979-09-27 1979-09-27 Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal Granted DE2939077A1 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE19792939077 DE2939077A1 (de) 1979-09-27 1979-09-27 Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal
GB8030830A GB2059658B (en) 1979-09-27 1980-09-24 Method of and arrangement for deriving characteristic values from a sound signal
FR8020503A FR2472804A1 (fr) 1979-09-27 1980-09-24 Procede et systeme pour determiner des valeurs caracteristiques d'un signal sonore
JP13508780A JPS5656000A (en) 1979-09-27 1980-09-27 Method and device for producing characteristic values
US06/192,156 US4379948A (en) 1979-09-27 1980-09-29 Method of and arrangement for deriving characteristic values from a sound signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19792939077 DE2939077A1 (de) 1979-09-27 1979-09-27 Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal

Publications (2)

Publication Number Publication Date
DE2939077A1 true DE2939077A1 (de) 1981-04-09
DE2939077C2 DE2939077C2 (de) 1987-04-23

Family

ID=6081966

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19792939077 Granted DE2939077A1 (de) 1979-09-27 1979-09-27 Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal

Country Status (5)

Country Link
US (1) US4379948A (de)
JP (1) JPS5656000A (de)
DE (1) DE2939077A1 (de)
FR (1) FR2472804A1 (de)
GB (1) GB2059658B (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0212323A3 (de) * 1985-08-29 1988-03-16 Scott Instruments Corporation Verfahren und Einrichtung von Signalumwandlung und ihre Anwendung zur Signalverarbeitung
US5664171A (en) * 1994-04-14 1997-09-02 International Business Machines Corporation System and method for query optimization using quantile values of a large unordered data set
US6108658A (en) * 1998-03-30 2000-08-22 International Business Machines Corporation Single pass space efficent system and method for generating approximate quantiles satisfying an apriori user-defined approximation error
US6343288B1 (en) 1999-03-12 2002-01-29 International Business Machines Corporation Single pass space efficient system and method for generating an approximate quantile in a data set having an unknown size
CH695402A5 (de) * 2000-04-14 2006-04-28 Creaholic Sa Verfahren zur Bestimmung eines charakteristischen Datensatzes für ein Tonsignal.
JP4698606B2 (ja) * 2004-12-10 2011-06-08 パナソニック株式会社 楽曲処理装置
US20110010509A1 (en) * 2009-07-07 2011-01-13 L3 Communications Integrated Systems,L.P. System and method of sorting and calculating statistics on large data sets with a known value range
WO2016135741A1 (en) * 2015-02-26 2016-09-01 Indian Institute Of Technology Bombay A method and system for suppressing noise in speech signals in hearing aids and speech communication devices

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2719175A1 (de) * 1976-04-30 1977-11-17 Int Computers Ltd Schallanalysiereinrichtung
DE2536640B2 (de) * 1975-08-16 1979-02-08 Philips Patentverwaltung Gmbh, 2000 Hamburg

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4020286A (en) * 1975-05-19 1977-04-26 Metrosonics, Inc. Signal analysis apparatus for amplitude statistics
DE2536585C3 (de) * 1975-08-16 1981-04-02 Philips Patentverwaltung Gmbh, 2000 Hamburg Anordnung zur statistischen Signalanalyse
US4091237A (en) * 1975-10-06 1978-05-23 Lockheed Missiles & Space Company, Inc. Bi-Phase harmonic histogram pitch extractor
DE2720666A1 (de) * 1977-05-07 1978-11-09 Philips Patentverwaltung Verfahren und anordnung zur geraeuschanalyse

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2536640B2 (de) * 1975-08-16 1979-02-08 Philips Patentverwaltung Gmbh, 2000 Hamburg
DE2719175A1 (de) * 1976-04-30 1977-11-17 Int Computers Ltd Schallanalysiereinrichtung

Also Published As

Publication number Publication date
DE2939077C2 (de) 1987-04-23
JPS5656000A (en) 1981-05-16
JPH0239800B2 (de) 1990-09-07
GB2059658B (en) 1983-03-02
FR2472804A1 (fr) 1981-07-03
GB2059658A (en) 1981-04-23
FR2472804B1 (de) 1983-08-19
US4379948A (en) 1983-04-12

Similar Documents

Publication Publication Date Title
DE2536585C3 (de) Anordnung zur statistischen Signalanalyse
EP0277613B1 (de) Verfahren zur Übertragung eines Audiosignals
DE2629697A1 (de) Elektronisches musikinstrument
DE69629986T2 (de) Verfahren und Gerät zum Kodieren digitaler akustischer Signale
EP0251028B1 (de) Verfahren zur Übertragung eines Audiosignales
DE2851877C3 (de) Blutdruck-Meßgerät und Verfahren zur Fehlerkompensation bei der Blutdruckmessung
DE2357067C3 (de) Elektrische Schaltungsanordnung in Verbindung mit einer Spracherkennungseinrichtung
DE3314570A1 (de) Verfahren und anordnung zur einstellung der verstaerkung
DE2637063A1 (de) Kanalprocessor
DE2939077A1 (de) Verfahren und anordnung zum bestimmen charakteristischer werte aus einem geraeuschsignal
DE2830483C2 (de) Elektronisches Tastatur-Musikinstrument
DE2131635A1 (de) Digitale Komprimierschaltung
DE2720666A1 (de) Verfahren und anordnung zur geraeuschanalyse
DE2920041C2 (de) Verfahren zum Verifizieren von Signalen, und Anordnung zum Durchführen des Verfahrens
AT403969B (de) Verfahren zur kompression eines analogen signals
DE2719175A1 (de) Schallanalysiereinrichtung
DE2505388C2 (de) Anordnung zur logarithmischen Umwandlung eines Meßwertes
DE1105914B (de) Schaltung zur automatischen Regelung und/oder Begrenzung der Hoehe von Impulsfolgen
EP0272723B1 (de) Verfahren zur Bestimmung des zeitlichen Verlaufs eines Sprachparameters und Anordnung zur Durchführung des Verfahrens
EP0027233A1 (de) Verfahren zur Codierung von Analogsignalen
DE3037276C2 (de) Tonsynthesizer
EP0518116A1 (de) Verfahren zum Messen des Spitzenwertes einer Wechselspannung
DE3129155A1 (de) Datenkompressorsystem
EP0417854B1 (de) Verfahren zur Erkennung von N unterschiedlichen Wortketten in einem Sprachsignal
DE1547027B2 (de) Verfahren und anordnung zur konsonantenbestimmung in sprachsignalen

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee