DE3236000A1 - Verfahren zum klassifizieren von audiosignalen - Google Patents
Verfahren zum klassifizieren von audiosignalenInfo
- Publication number
- DE3236000A1 DE3236000A1 DE19823236000 DE3236000A DE3236000A1 DE 3236000 A1 DE3236000 A1 DE 3236000A1 DE 19823236000 DE19823236000 DE 19823236000 DE 3236000 A DE3236000 A DE 3236000A DE 3236000 A1 DE3236000 A1 DE 3236000A1
- Authority
- DE
- Germany
- Prior art keywords
- signal
- output
- value
- pauses
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 24
- 230000005236 sound signal Effects 0.000 claims abstract description 27
- 238000001514 detection method Methods 0.000 claims abstract description 21
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 claims abstract description 9
- 238000011156 evaluation Methods 0.000 claims description 20
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000012854 evaluation process Methods 0.000 claims description 2
- 238000011144 upstream manufacturing Methods 0.000 claims 1
- 230000007704 transition Effects 0.000 abstract 3
- 230000006870 function Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/046—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Analogue/Digital Conversion (AREA)
Description
E.ir. Jl6
315 3 6 O O
13.9.1982
Verfahren zum Klassifizieren von Audiosignalen
Die Erfindung betrifft ein Verfahren zum Klassifizieren von Audiosignalen der im Oberbegriff des
Anspruchs 1 angegebenen Art.
Ein solches Klassifizierungsverfahren, bei welchem
die Audiosignale zumindest* in Musik- und Sprachinformationen unterschieden werden, dient insbesondere
bei Rundfunkempfängern zur Ableitung von automatischen Steuer- und Einstellfunktionen, so
z.B. zum Auffinden und Einstellen von Sendern mit Sprach- oder Musiksendungen mittels Sendersuchlauf,
zum Ausblenden von Sprach- oder Musikpassagen, z.B. bei Tonbandaufnahmen, oder automatischen Umschaltung
für Sprach- bzw. Musikabstimmung bei Equalizern.
Bei einem bekannten Klassifizierungsverfahren der eingangs genannten Art zur Erkennung von Musik- und
Sprachinformationen wird das Frequenzband des Audiosignals in einen oberen Frequenzbereich von 6-10 kHz
und einen unteren Frequenzbereich bis 3 kHz unterteilt und als Erkennungskriterien für Musik und Sprache werden
Pausenzeiten und Zeitdauer von Folgen durch Pausen
nicht unterbrochener Nulldurchgänge im unteren
Frequenzbereich und das gleichzeitige bzw. wechselseitige Auftreten von Pausen in beiden Frequenzbereichen herangezogen. Ein solches Klassifizierungsverfahren erfordert eine etwas aufwendige Schaltungsanordnung zu seiner Realisierung, da relativ viele
Merkmale zur Klassifizierung der Signaltypen detektiert werden müssen.
nicht unterbrochener Nulldurchgänge im unteren
Frequenzbereich und das gleichzeitige bzw. wechselseitige Auftreten von Pausen in beiden Frequenzbereichen herangezogen. Ein solches Klassifizierungsverfahren erfordert eine etwas aufwendige Schaltungsanordnung zu seiner Realisierung, da relativ viele
Merkmale zur Klassifizierung der Signaltypen detektiert werden müssen.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren der eingangs genannten Art zu verbessern, insbesondere
dahingehend, daß durch Reduktion der Detektionsmerkmale ohne Einbuße an Erkennungssicherheit ein geringerer
Schaltungsaufwand zur Durchführung des Verfahrens erforderlich ist.
Diese Aufgabe ist bei einem Verfahren zum Klassifizieren
von Audiosignalen der im Oberbegriff des Anspruchs 1
definierten Gattung erfindungsgemäß durch die Merkmale im Kennzeichenteil des Anspruchs 1 gelöst.
Bei dem erfindungsgemäßen Verfahren wird durch die
Analog-Digitalwandlung des Audiosignals an zwei weit auseinanderliegenden Schwellen zusätzlich zu den Pausenkriterien die Signaldynamik berücksichtigt. Hierdurch wird unter gleichzeitiger Abkehr von der reinen Auswertung statischer Häufigkeiten eine Verringerung der Detektionsmerkmale bei zusätzlicher Vergrößerung der Erkennungssicherheit erzielt. Bei dem erfindungsgemäßen Verfahren treten damit weniger Fehlentscheidungen auf.
Analog-Digitalwandlung des Audiosignals an zwei weit auseinanderliegenden Schwellen zusätzlich zu den Pausenkriterien die Signaldynamik berücksichtigt. Hierdurch wird unter gleichzeitiger Abkehr von der reinen Auswertung statischer Häufigkeiten eine Verringerung der Detektionsmerkmale bei zusätzlicher Vergrößerung der Erkennungssicherheit erzielt. Bei dem erfindungsgemäßen Verfahren treten damit weniger Fehlentscheidungen auf.
β,Ιγ. 1760
Ein zusätzliches Klassifizierungssignal für nicht identifizierbare Informationen sorgt für eindeutige
Analyseergebnisse. Der elektrische Schaltungsaufwand ist relativ gering, wobei sowohl der Analogteil der
Schaltungsanordnung vereinfacht als auch der Aufwand für den Digitalteil reduziert werden kann.
Die Erfindung ist anhand eines in der Zeichnung dargestellten
Ausführungsbeispiels einer Schaltungsan-· Ordnung zum Klassifizieren von Audiosignalen im folgenden
näher beschrieben. Es zeigen:
Fig. 1 ein Blockschaltbild einer nach dem und 2 erfindungsgemäßen Verfahren arbeitenden
Schaltungsanordnung zum Klassifizieren
von Audiosignalen,
Fig. 3 eine stark schematisierte Darstellung
eines Audiosignals (a), einer Impulsfolge nach digitaler Wandlung des Audiosignals (b) und des Ausgangssignals eines
Zeitdiskriminators in Fig. 1 (c), jeweils in Abhängigkeit von der Zeit.
Die in Fig. 1 und 2 dargestellte Schaltungsanordnung ist der Übersichtlichkeit halber in zwei Einzelbilder
aufgeteilt, wobei die Anschlußstellen von Fig.· 1 mit Fig. 2 mit A,B und C bezeichnet sind. In dem Schaltungs
teil gemäß Fig. 1 erfolgt die Aufbereitung des durch einen Empfänger 10 empfangenen Audiosignals. Dem Empfänger
10 ist ein Verstärker 11 und ein Tiefpaßfilter 12 mit einer oberen Grenzfrequenz von ca. 3.kHz
nachgeschaltet. Ein nachfolgender Kompander 13 aus antiparallelen geschalteten Dioden 14 komprimiert das
H.Ir. 176O
Audiosignal im Bereich der Signalnullinie, um Störungen zu unterdrücken. An dem Ausgang des
Kompanders 13 ist sowohl ein Komparator 15 als auch ein Komparator 16 angeschlossen. Die beiden
Komparatoren 15,16 sind als Schmitt-Trigger ausgebildet und mit einer symmetrisch um Null liegenden
Hysterese ausgestattet. Die Schalthysterese der Komparatoren 15,16 sind mittels einstellbarer
Widerstände 17,18 so gewählt, daß der Betrag der Schalthysterese des Komparators 15 0,3 V und die
Schalthysterese des Komparators 16 2,2 V beträgt. Die beiden Komparatoren 15,16 wandeln die Nulldurchgänge
des. Audiosignals in jeweils eine digitale Impulsfolge um, wobei jede negative Impulsflanke
durch einen positiven Nulldurchgang des Audiosignals und jede positive Impulsflanke entweder
durch einen negativen Nulldurchgang des Audiosignals oder durch eine beginnende Pause im
Audiosignal erzeugt werden/ Zur Realisierung des letzteren sind die Komparatoren 15,16 derart aufgebaut,
daß sie innerhalb einer bestimmten Zeit, hier 2 ms, nach dem letzten Nulldurchgang in ihren
Ausgangszustand, hier logisch 1, zurückkippen (vergl. Fig. 3 a und b). An dem Ausgang des Komparators
15 ist ein erstes nach- oder retriggerbares Monoflop 19 mit einer Zeitkonstante von 30 ms
und ein zweites retriggerbares Monoflop 20 mit einer Zeitkonstante von 60 ms angeschlossen, während
der Ausgang des Komparators 16 mit dem Eingang eines dritten retriggerbaren Monoflops 21 mit einer Zeitkonstante
von 60 ms verbunden ist.
Ein Beispiel des zeitlichen Verlaufs eines Audiosignals an einem Eingang der Komparatoren 15,16 ist
in Fig. 3a dargestellt. Die Hysterese des Komparators ist strichliniert angedeutet. Am Ausgang des
Komparators 15, 16 tritt dann eine Impulsfolge auf, wie sie beispielhaft in Fig. 3b schematisch dargestellt
ist. Mit jeder positiven Impulsflanke wird jeweils eines der Monoflops 19 - 21 getriggert. Das
Ausgangssignal am Q-Ausgang eines der Monoflops 19 ist in Fig. 3c dargestellt. Mittels der Monoflops ·-
19 - 21 werden nach Aufbereitung des Audiosignals. ..
in den Komparatoren 15, 16 Signalpausen mit einer
Pausendauer von einerseits größer 30 ms und andererseits größer 60 ms detektiert, und zwar dadurch,daß jeweils
das Monoflop wieder in seinen logisch 0-Zustand zurückfällt, wenn innerhalb dieser Zeitspanne von 30 ms bzw. 60 ms
keine positive Impulsflanke einen Triggerimpuls auslöst. Die negative Impulsflanke des Ausgangsignals
am Q-Ausgang der Monoflops gemäß Fig. 3c repräsentiert damit das Auffinden einer Signalpause mit einer
Pausenlänge größer 30 ms bzw. 60 ms.
Die Monoflops 19-21 sind an einer Auswertereinheit 22 (Fig. 2)
angeschlossen, welche drei Ausgänge 23,24,25 aufweist, an welchen jeweils eines der drei Klassifizierungssignale, Sprachkennungssignal, Musikkennungssignal
und Nichtidentifizier-Signal,ausgegeben wird. Die
Auswertereinheit 22 weist drei Pausenzähler 26 - 28 und drei Zeitmesser oder Zeitzähler 29 - 31 aus. Die
Pausenzähler 26-28 sind als Impulszähler mit Takt- und Reset-Eingang und die Zeitmesser 29-31 als Impulszähler
mit Takt-,Reset- und Enable-Eingang aüsgebildet. Die Pausen- und Zeitzähler 26 - 31 sind über eine
Schwellwertlogik 32, eine Speichereinheit 33 und eine
Verknüpfungslogik 34 mit den drei Ausgängen 23 - 25 der Auswertereinheit 22 verbunden. Die Speichereinheit
33 besteht dabei aus einer Vielzahl von RS-Latch 35 Eine Start-Stop-Vorrichtung 43, die als RS-Flip-Flop
ausgebildet ist, ist einerseits über einen Inverter
H. tr.. 176O
mit den Reset-Eingängen der Pausen- und Zeitzähler 26 - 31 verbunden und andererseits über ein Differenzierglied
45 an den R-Eingängen der RS-Latch 35 - 42 angeschlossen. An dem S-Eingang der Start-Stop-Vorrichtung
43 ist ein St art impuls und an demR-Eingang
ein Stopimpuls anlegbar. Hierzu ist einerseits der S-Eingang mit einem hier nicht dargestellten Impulsgeber
und der R-Eingang mit dem Ausgang eines ORt-Gliedes 46 verbunden, dessen drei Eingänge jeweils
mit einem der Ausgänge 23 - 25 der Auswerteeinheit 22 verbunden sind.
Im einzelnen ist der Takteingang des ersten Pausenzählers 26 mit dem Q-Ausgang des ersten Monoflops 19
und der Takteingang des zweiten Pausenzählers 27 mit dem Q-Ausgang des dritten Monoflops 21 verbunden. Dem
ersten Impulszähler 26 sind drei Zählerständsbewerter 47,48 und 49 in Parallelschaltung nachgeschaltet,
deren Ausgänge mit je einem S-Eingang der RS-Latch 35-37
verbunden sind. Dem zweiten Pausenzähler 27 ist ebenfalls ein Zählerständsbewerter 50 nachgeschaltet, dessen Ausgang
wiederum mit dem S-Eingang des vierten RS-Latch verbunden ist. Der Takteingang des dritten Pausenzählers
28 ist mit dem Ausgang eines AND-Gl.iedes 52 verbunden, dessen einerEingang unmittelbar mit dem
Q-Ausgang des zweiten Monoflops 20 und dessen andere Eingang über einen Inverter 53 mit dem Q-Ausgang des dritten
Monoflops 21 verbunden ist. Dem dritten Pausenzähler ist wiederum ein Zählerständsbewerter 51 nachgeschaltet,
dessen Ausgang wiederum an dem S-Eingang des fünften RS-Latch 39 liegt. Der erste Zählerständsbewerter
47 gibt bei einem Zählerstand größer oder gleich 3, der zweite Zählerständsbewerter 48 bei einem Zählerstand
gleich oder größer 4 aber kleiner oder gleich 12,
der dritte Zahlerstandsbewerter 49 bei einem Zählerstand
größer oder gleich 4, der vierte Zahlerstandsbewerter 50 bei einem Zählerstand größer oder gleich
und der fünfte Zahlerstandsbewerter 51 bei einem Zählerstand größer oder gleich 9 ein Ausgangssingal ab,
das in den RS-Latch 35 - 39 gespeichert wird und dort am Q-Ausgang ansteht.
Die Takteingänge der Zeitzähler 29 - 31 sind mit einem
hier symbolisch dargestellten Taktgeber 54 verbunden, der Zählimpulse konstanter Frequenz ausgibt. Der
Enable-Eingang des ersten Zeitzählers 29 ist über einen Inverter 55 und der Enable-Eingang des dritten Zeitzählers
31 unmittelbar mit dem Q-Ausgang des zweiten Monoflops 20 verbunden, während der Enable-Eingang
des zweiten Zeitzählers 30 an dem Takteingang des dritten Pausenzählers 28 angeschlossen ist und dadurch über die Logikglieder 52 und 53 mit den Q-Ausgängen
der Monoflops 2.0, 21 ' verbunden ist. Den Zeitzählern 29 - 31 ist jeweils ein Schwellwertintegrator
56,57,58 nachgeschaltet, deren Ausgänge wiederum mit jeweils dem S-Eingang dreier weiterer RS-Latch 40,41,42 der
Speichereinheit 33 verbunden sind. Die Schwellwertintegratoren 56 - 58 geben jeweils ein Ausgangssignal
ab, das in den RS-Latch 40-42 gespeichert wird, wenn die Impulszahl der Zeitzähler 29 - 31 einen.vorgegebenen
Schwellwert überschreitet. Da die Zeitzähler mit einer konstanten Zählimpulsfolge getaktet werden,
entspricht der Schwellwert einer maximal möglichen Summenzeit und ist im ersten Schwellwertinte-
grator 56 größer oder gleich 1,6 s, im zweiten Schwellwertintegrator 57 größer oder gleich 1,5 s und im
dritten Schwellwertintegrator 3,Os festgelegt.
R.Ir. 1760
Durch die Verknüpfungslogik 34 werden die Q-Ausgänge
der RS-Latch 35 - 45 mit den drei Ausgängen 23-25 der Auswerteeinheit 22 verknüpft. Dabei sind die
Q-Ausgänge des ersten RS-Latch 35 und des vierten RS-Latch 38 über ein AND-Glied 59 (Konjunktion) mit dem Ausgang 23 für das Sprachkennungssignal verbunden.
Die Q-Ausgänge des ersten RS-Latch 35 und des achten RS-Latch 42 sind über ein AND-Glied 60 verknüpft,
dessen Ausgang mit den Q-Ausgängen des fünften und
Q-Ausgänge des ersten RS-Latch 35 und des vierten RS-Latch 38 über ein AND-Glied 59 (Konjunktion) mit dem Ausgang 23 für das Sprachkennungssignal verbunden.
Die Q-Ausgänge des ersten RS-Latch 35 und des achten RS-Latch 42 sind über ein AND-Glied 60 verknüpft,
dessen Ausgang mit den Q-Ausgängen des fünften und
sechsten RS-Latch 39 und 40 über ein OR-Glied 61 mit
dem Ausgang 24 für das Nichtidentifizier-Sigrial verbunden
ist. Die Q-Ausgänge des dritten und siebten RS-Latch 37 und 41 sind über ein AND-Glied 62 zusammengefaßt,
während der Q-Ausgang des achten RS-Latch 42 mit dem über einen Inverter 63 negierten Q-Ausgang des ersten
RS-Latch 35 durch ein weiteres AND-Glied 64 verknüpft ist. Die Ausgänge der AND-Glieder 62 und 64
sind über ein OR-Glied 65 mit dem dritten Ausgang 25 für das Musikkennungssignal'verbunden."
sind über ein OR-Glied 65 mit dem dritten Ausgang 25 für das Musikkennungssignal'verbunden."
Mit dieser Schaltungsanordnung wird nunmehr ein von dem Empfänger 10 empfangenes Audiosignal nach Verstärkung
im Verstärker 11 und Begrenzung auf eine
Bandbreite von ca. λ kHz einer Analog-Digital-Wandlung an einer niedrigen Schwelle von O,3V (Komparator 15) und an einer wesentlich höheren Schwelle von 2,2 V (Komparator 16) unterzogen. Mittels der an den Ausgängen der beiden Komparatoren 15,16 auftretenden beiden Impulsfolgen werden nunmehr Signalpausen im
Audiosignal, die eine Pausendauer von 30 ms und 60 ms überschreiten, detektiert. Jede negative Impulsflanke am Q-Ausgang der Monoflops 19-21 repräsentiert ein Erkennungssignal für solche Pausen im Audiosignal.
Bandbreite von ca. λ kHz einer Analog-Digital-Wandlung an einer niedrigen Schwelle von O,3V (Komparator 15) und an einer wesentlich höheren Schwelle von 2,2 V (Komparator 16) unterzogen. Mittels der an den Ausgängen der beiden Komparatoren 15,16 auftretenden beiden Impulsfolgen werden nunmehr Signalpausen im
Audiosignal, die eine Pausendauer von 30 ms und 60 ms überschreiten, detektiert. Jede negative Impulsflanke am Q-Ausgang der Monoflops 19-21 repräsentiert ein Erkennungssignal für solche Pausen im Audiosignal.
In der Auswerteeinheit 22 'werden nunmehr die Zahl der detektierten Signalpausen und die Zeiträume des
gleichzeitigen und/oder wechselseitigen Auftretens von mittels der einen und der anderen Impulsfolge
detektierten Signalpausen als Kriterium zur Bestimmung der drei Signaltypen, nämlich der Musik-
und Sprachinformation und der nichtidentifizierbaren
Information ausgewertet. Durch den vorstehend beschriebenen Schaltungsaufbau der Auswerteeinheit 22
werden nun folgende Erkennungsmodalitäten vorgenommen:
Ein Sprachkennungssignal am Ausgang 23 der Auswerteeinheit 22 wird erzeugt, wenn die Anzahl der mittels
an der niedrigen Schwelle von 0,3 V gewandelten Impulsfolge detektierten Signalpause mit 30 ms
übersteigender Dauer (Monoflop 19) größer als 3 und kleiner als 12 (Zählerstandsbewerter 48 und RS-Latch 36)
und die Anzahl der mittels der an der höheren Schwelle von 2,2 V gewandelten Impulsfolge (Monoflop 21)
detektierten Signalpausen größer als 4 (Zählerstandsbewerter 50, RS-Latch 38) ist. Die Konjunktion ist
durch das AND-Glied 59 gegeben.
Ein Musikkennungssignal am Ausgang 25 der Auswerteeinheit
22 wir.d erzeugt, wenn die Anzahl der mittels der an der niedrigen Schwelle von 0,3 V gewandelten
Impulsfolge detektierten Signalpause mit 30 ms übersteigender Dauer (Monoflop 19) größer als 3 (Zählerstandsbewerter
49, RS-Latch 37) und der Zeitraum der Detektion einer Signalpause mittels der an der höheren
Schwelle von 2,2 V gewandelten Impulsfolge (Monoflop 21) und der gleichzeitigen Nichtdetektion von Signalpausen
mit 60 ms übersteigender Dauer mittels der an der nie-
-S.Sr«
drigen Schwelle von 0,3 V gewandelten Impulsfolge (Monoflop20) größer ist als 1,5 s (Schwellwertintegrator
57, RS-Latch 41). Die Konjunktion ist durch das AND-Glied 62 gegeben.
Ein Musikkennungssignal am Ausgang 25 der Auswerteeinheit 22 wird auch dann erzeugt, wenn die Anzahl
der mittels der an der niedrigen Schwelle von 0,3 V gewandelten Impulsfolge detektierten Signalpause mit
30 ms übersteigender Dauer (Monoflop 19) kleiner als 3 ist (Zählerstandsbewerter 47, RS-Latch 35, Inverter
63) und der Zeitraum der Nichtdetektion von Signalpausen mit 60 ms übersteigender Dauer mittels
der an der niedrigen Schwelle von 0,3 V gewandelten Impulsfolge (Monoflop 20) größer ist als ca. 3s
(Schwellwertintegrator 58, RS-Latch 42). Die Konjunktion wird durch das AND-Glied 64 sichergestellt.
Ein Nichtidentifizier-Signarl am Ausgang 24 der Auswerteeinheit
22 wird in drei Fällen erzeugt:
1. Wenn der Zeitraum, in welchem Singalpausen mit 60 ms übersteigender Dauer mittels der an der niedrigen
Schwelle von 0,3 V gewandelten Impulsfolge (Monoflop 20) detektiert werden,größer ist als 1,6 s
(Schwellwertintegrator 56, RS-Latch 40),
2. Wenn die Zahl der Detektionen einer Signalpause mittels der an der höheren Schwelle von 2,2 V
gewandelten Impulsfolge (Monoflop 21) bei gleichzeitiger Nichtdetektion von Signalpausen mit 60 ms
übersteigender Dauer mittels der an der niedrigen Schwelle von 0,3 V gewandelten Impulsfolge (Monoflop
20) größer als 8 ist (Zählerstandsbewerter 51),
- yC-
-U-
J
3. wenn die Anzahl der mittels der an der niedrigen j Schwelle von 0,3 V gewandelten Impulsfolge detek- f
tierten Signalpausen mit 30 ms übersteigender j
Dauer (Monoflop 19) größer oder gleich 3 ist (Zählerstandsbewerter 47, RS-Latch 35) und der
Zeitraum der Nichtdetektion von Signalpausen mit
60 ms übersteigender Dauer mittels der an der niedrigen
Schwelle von 0,3 V gewandelten Impulsfolge (Monoflop 20) größer ist als ca. 3 s (Schwellwertintegrator
58, RS-Latch 42) . Die Konjunktion wird durch das AND-Glied 60 sichergestellt.
Sobald eines der Klassifizierungssignale, das Sprachkennungssignal
am Ausgang 23, das Musikkennungssignal am Ausgang 25 und das Nichtidentifizier-Signal
am Ausgang 24 der Auswerteeinheit 22 auftritt, erhält die Start-Stop-Vorrichtung 43 einen Stopimpuls. Dadurch
werden alle Pausen- und Zeitzähler 26 - 31 zurückgesetzt und in diesem Zustand gehalten. Soll ein
neuer Auswertevorgang eingeleitet werden, so ist an den S-Eingang der Start-Stop-Vorrichtung 43 ein Startimpuls
zu legen. Mit diesem Startsignal werden alle Pausen- und Zeitzähler 26 - 31 freigegeben und mit der
positiven Flanke des Startimpulses über das Differenzierglied 45 alle RS-Latch 35 - 42 in ihren Ausgangszustand
gebracht, wobei die zuvor gespeicherten Informationen gelöscht sind.
Claims (1)
- JLIr* 176013.9.1982Patentansprüche1. Verfahren zum Klassifizieren von Audiosignalen, bei welchem die Nulldurchgänge eines Audiosignals in digitale Impulsfolgen umgewandelt und damit Signalpausen vorgegebener minimaler Dauer im Audiosignal detektiert werden, dadurch gekennzeichnet, daß die Analog-Digital-Wandlung des Audiosignals einmal an einer niedrigen und einmal an einer diese wesentlich übersteigenden höheren Schwelle durchgeführt wird, daß mittels der an der niedrigen Schwelle gewandelten Impulsfolge sowohl Signalpausen mit einer einen vorgegebenen unteren Wert übersteigenden Dauer als auch Signalpausen mit einer einen vorgegebenen oberen Wert, der vorzugsweise etwa doppelt so groß wie der untere ist, übersteigenden Dauer detektiert werden, daß mittels der an der höheren Schwelle gewandelten Impulsfolge nur Signalpausen detektiert werden, deren Dauer den höheren Wert übersteigt, und daß die Anzahl der detektierten Signalpausen und die Zeiträume des gleichzeitigen und/oder wechselseitigen Auftretens von mittels der einen und anderen Impulsfolge detektierten Signalpausen als Kriterien zur Bestimmung von drei Signaltypen, Musik- und Sprachinformation und nichtidentifizierbare Information, herangezogen werden.; :: : it.bis2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Analog-Digital-Wandlung des Audiosignals an jeder Schwelle derart durchgeführt wird, daß jede negative Impulsflanke einen positiven NuIidurchgang und jede positive Impulsflanke einen negativen Nulldurchgang oder einen Signalpausenbeginn repräsentiert, und daß zur Detektion der Signalpausen die Impulsdauer gemessen wird.3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzei chnet, daß ein Sprachkennungssignal erzeugt wird, wenn die Anzahl der mittels der an der niedrigen Schwelle gewandelten Impulsfolge detektieren Signalpausen mit dem unteren Wert übersteigender Dauer größer als drei und kleiner als zwölf und die Anzahl der mittels der an der höheren Schwelle gewandelten Impulsfolge detektierten Signalpausen größer als vier ist.4. Verfahren nach einem der Ansprüche 1-3, d a durch gekennzeichnet, daß ein Musikkennungssignal erzeugt wird, wenn die"Anzahl der mittels der an der niedrigen Schwelle gewandelten Impulsfolge detektierten Signalpausen mit dem unteren Wert übersteigender Dauer größer als drei ist und der Zeitraum der Detektion einer Signa.lpause mittels der an der höheren Schwelle gewandelten Impulsfolge und der gleichzeitigen Nichtdetektion von Signalpausen mit dem oberen Wert übersteigender Dauer mitteis der an der niedrigen Schwelle gewandelten Impulsfolge größer ist als ein erster Vorgabewert.B.Hr. 17605. Verfahren nach einem der Ansprüche 1 - 4, d a durch gekennzeichnet, daß ein Musikkennungssignal erzeugt wird, wenn die Anzahl der mittels der an der niedrigen Schwelle gewandelten Impulsfolge detektierten Signalpausen mit dem unteren Wert übersteigender Dauer kleiner als drei ist und der Zeitraum der Nichtdetektion von Signalpausen mit dem oberen Wert übersteigender Dauer mittels der an der niedrigen Schwelle gewandelten Impulsfolge größer ist als ein zweiter, vorzugsweise gegenüber dem ersten etwa doppelt so großer Vorgabewert.6. Verfahren nach einem der Ansprüche 1-5, dadurch gekennzeichnet, daß ein Nichtidentifiziersignal erzeugt wird, wenn der Zeitraum, in welchem Signalpausen mit dem oberen Wert übersteigender Dauer mittels der an der niedrigen Schwelle gewandelten Impulsfolge detektiert werden, größer ist als ein dritter Vorgabewert, der vorzugsweise zwischen dem ersten und zweiten und nahe dem ersten Vorgabewert liegt.7. Verfahren nach einem der Ansprüche 1-6, dadurch gekennzeichnet, daß ein Nichtidentifiziersignal erzeugt wird, wenn die Zahl der Detektionen einer Signalpause mittels der an der höheren Schwelle gewandelten Impulsfolge bei gleichzeitiger Nichtdetektion von Signalpausen mit dem oberen Wert übersteigender Dauer mittels der an der niedrigen Schwelle gewandelten Impulsfolge größer als acht ist.B.Nr. 1760-A-8. Verfahren nach einem der Ansprüche 1-7, dadurch gekennzeichnet, daß ein Nichtidentifiziersignal erzeugt wird, wenn die Anzahl der mittels der an der niedrigen Schwelle gewandelten Impulsfolge detektierten Signalpausen mit einer den unteren Wert übersteigender Dauer größer oder gleich drei ist und der Zeitraum der Nichtdetektion von Signalpausen mit dem oberen Wert übersteigender Dauer mittels der an der niedrigen Schwelle gewandelten Impulsfolge größer ist als der zweite Vorgabewert.9. Verfahren nach einem der Ansprüche 1-8, dadurch gekennzeichnet, daß mit Auftreten eines der drei Klassifizierungssignale, Sprach- und Musikkennungssignal und Nichtidentifiziersignal, ein neuer Auswertevorgang der detektierten Signalpausen durchgeführt wird.10. Verfahren nach einem der Ansprüche 1-9, dadurch gekennzeichnet, daß die niedrige Schwelle der Signalwandlung 0,3 V, die höhere Schwelle 2,2 V, der untere Wert der Signalpausendauer 30 ms, der obere Wert der Signalpausendauer 60 ms, der erste Vorgabewert 1,5 s, der zweite Vorgabewert 3 s' und der dritte Vorgabewert 1,6 s beträgt.11. Schaltungsanordnung zur Durchführung des Verfahrens nach einem der Ansprüche 1-9, gekenn — zeichnet durch zwei Komparatoren (15,16) zur Analog-Digital-Wandlung, die als Schmitt- Trigger mit unterschiedlicher, jeweils symmetrisch um Null liegender Schalthysterese ausgebildet sind, durchH. Kr. 176Oden Komparatoren (15,16) nachgeschaltete Schaltdiskrimihatoren, die als nachtriggerbare Monoflops (19 - 21) ausgebildet sind, wobei an dem Komparator (16)mit großer Schalthysterese ein Monoflop (21) mit einer großen Zeitkonstante und an dem Komparator (15) mit kleiner Schalthysterese sowohl ein Monoflop (20) mit gleich großer Zeitkonstante als auch ein Monof lop(19)mit kleinerer, vorzugsweise halb so großer Zeitkonstante angeschlossen sind, und durch eine den Monoflops (19 - 21) nachgeschaltete Auswerteeinheit (22) mit drei Ausgängen (23-25), an welchen jeweils eines der drei Klassifizierungssignale ausgebbar ist.12. Schaltungsanordnung nach Anspruch 11, d a -durch gekennzeichnet, daß die Schalthysterese der Komparatoren (15,16) 2,2 V bzw. 0,3 V und die Zeitkonstante der Monoflops (19-21) 60 ms bzw. 30 me beträgt.13. Schaltungsanordnung nach Anspruch 11 oder 12, dadurch gekennzeichnet, daß die Auswerteeinheit (22) an den Ausgängen der Monoflops (19-21) angeschlossene Pausenzähler (26-28) und Zeitzähler (29-31) aufweist, daß den Pausen- und Zeitzählern (26-31) eine Schwellwert-Logik (32) nachgeschaltet ist, deren Ausgänge mit einer Speichereinheit (33) verbunden sind, und daß die Ausgänge der Speichereinheit (33) über eine Verknüpfungslogik (34) mit jeweils einem der drei Ausgänge (23-25) der Auswerteeinheit (22) verbunden sind.- "... - H.Hr. I76O14. Schaltungsanordnung nach einem der Ansprüche 11-13, dadurch gekennzeichnet, daß die Speichereinheit (33) eine Vielzahl von RS-Latch (35-42) aufweist, deren Q--Ausgänge mit der Verknüpfungslogik (34) verbunden sind.15. Schaltungsanordnung nach einem der Ansprüche 11-14, gekennzeichnet durch eine vorzugsweise als RS-Flip-Flop ausgebildete Start-Stop-Vorrichtung (43) mit einem Start-und einem Stopeingang, deren Ausgang einerseits mit den Rücksetzeingängen (Reset)der Pausen- und Zeitzähler (27-31) und andererseits über ein Differenzierglied (45) mit den Löscheingängen der RS-Latch (35-42) verbunden ist und an deren Stopeingang (R) der Ausgang eines OR-Gliedes (46) angeschlossen ist, dessen Eingänge mit den Ausgängen (23-25) der Auswerteeinheit(22)verbunden sind.16. Schaltungsanordnung nach einem der Ansprüche11-15, dadurch gekennzeichnet, daß die Zeitzähler (29-31) als Impulszähler mit Takt-,Enable-und Reset-Eingang und die Pausenzähler (26-28) als Impulszähler mit Takt- und Reset-Eingang ausgebildet sind.17. Schaltungsanordnung nach einem der Ansprüche 11-16, dadurch g e k e η η ζ e i c h net, daß der Ausgang des ersten Monoflops (19) mit dem Takteingang eines ersten Pausenzählers (26) verbunden ist, an dessen Ausgang drei Zählerstandsbewerter (47-49) angeschlossen sind, wobei der erste Zählerstandsbewerter (47) bei einem Zählerstand größer oder gleich drei der zweite: :: : .. -": H.Ir. 176O7 -bei einem Zählerstand zwischen vier und zwölf und der dritte bei einem Zählerstand größer oder gleich vier jeweils ein Ausgangssignal abgibt, und daß die Ausgänge der Zählerstandsbewerter (47-49) jeweils mit dem S-Eingang eines ersten, zweiten und dritten RS-Latch (35-37) verbunden sind.18. Schaltungsanordnung nach einem der Ansprüche 11-17, dadurch gekennzeichnet, daß der Ausgang des dritten Monoflops (21) mit dem Takteingang eines zweiten Pausenzählers (27) verbunden ist, dem ein vierter Zählerstandsauswerter (5O) nachgeschaltet ist, der bei einem Zählerstand größer oder gleich fünf ein Ausgangssignal abgibt, und daß der Ausgang des vierten Zählerstandsbewerters (50) mit dem S-Eingang eines vierten RS-Latch (38) verbunden ist.19. Schaltungsanordnung nach Anspruch 17 und 18, dadurch gekennzeichnet, daß die Ausgänge des zweiten und vierten RS-Latch (35,37) über eine Konjunktion, z.B. AND-Glied (59), mit dem Ausgang (23) für das Sprachkennungssignal der Auswerteeinheit (22) verbunden sind.20. Schaltungsanordnung nach einem der Ansprüche11 _ 19, dadurch gekennzeichnet, daß der negierte Ausgang des dritten Monoflops (21) und der Ausgang des zweiten Monoflops (20) über eine Konjunktion, z.B. AND-Glied (52), mit dem Takteingang des dritten Pausenzählers (28) verbunden sind, dem ein fünfter Zählerstandsbewerter (51) nachgeschaltet ist, der bei einem Zählerstand größer oder gleich neun ein Ausgangssignal abgibt, und daß der Ausgang des Zählerstandsbewerters (51)mit dem S-Eingang eines fünften RS-Latch'(39) verbunden ist. :21. Schaltungsanordnung nach einem der Ansprüche 11-20, dadurch gekennzeichnet, daß die Takteingänge der Zeitzähler (29-31) mit einem Taktgeber (54) verbunden sind, daß jedem Zeitzähler (29-31) ein Schwellwertintegrator (56-58) nachgeschaltet ist, wobei der Schwellwert des ersten Schwellwertintegrators (56) einer;Zeit von 1,6 s, des zweiten Schwellwertintegrators (57) einer Zeit von 1,5 s und des dritten Schwellwertintegrators (58) einer Zeit von 3 s entspricht, und daß die Ausgänge der Schwellwertintegratoren (56-58) mit jeweils einem S-Eingang eines sechsten, siebten und achten RS-Latch (40,41,42) verbunden sind. i22. Schaltungsanordnung nach Anspruch 21, dadurch gekennzeichnet, daß der Enable-Eingang des ersten Zeitzählers (29) mit dem :invertierten Ausgang des zweiten Monoflops (2O) und der Enable-Eingang des dritten Zeitzählers (31) mit dem Ausgang des zweiten Monoflops (20) verbunden sind und daß der Enable-Eingang des zweiten Zeitzählers (30) dem Takteingang des dritten Pausenzählers (28)parallel geschaltet ist. ■ '.23. Schaltungsanordnung nach Anspruch 21 und ;22, dadurch gekennzeichnet, daß die Ausgänge des fünften und sechsten RS-Latch (39,40) und der über eine Konjunktion, z.B. AND-Glied* (6O), mit dem Ausgang des ersten RS-Latch (35) verbundene Ausgang des achten RS-Latch (42) über eine Disjunktion,B.Ir. 1?6θ.— 9 —z.B. OR-Glied (61) , mit dem zweiten Ausgang (24) für das Nichtidentifiziersignal der Auswerteeinheit (22) verbunden sind.24. Schaltungsanordnung nach einem der Ansprüche 21 - 23, dadurch gekennzeichnet, daß der mit dem Ausgang des dritten RS-Latch (37) über eine Konjunktion,z.B. AND-Glied (62), verbundene Ausgang des siebten RS-Latch(41) und der über eine Konjunktion, z.B. AND-Glied (64), mit dem negierten Ausgang des ersten RS-Latch (35) verbundene Ausgang des achten RS-Latch (42) über eine Disjunktion, z.B. OR-Glied (65), mit dem dritten Ausgang (25) für das Musikkennungssignal der Auswerteeinheit (22) verbunden sind.25. Schaltungsanordnung nach einem der Ansprüche 11 - 24, dadurchgekennzeichn e t, daß den parallel" geschalteten Komparatoren (15,16) ein Tiefpaßfilter (12) mit einer oberen Grenzfrequenz von ca. 3 kHz vorgeschaltet ist.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19823236000 DE3236000A1 (de) | 1982-09-29 | 1982-09-29 | Verfahren zum klassifizieren von audiosignalen |
US06/536,213 US4542525A (en) | 1982-09-29 | 1983-09-27 | Method and apparatus for classifying audio signals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19823236000 DE3236000A1 (de) | 1982-09-29 | 1982-09-29 | Verfahren zum klassifizieren von audiosignalen |
Publications (2)
Publication Number | Publication Date |
---|---|
DE3236000A1 true DE3236000A1 (de) | 1984-03-29 |
DE3236000C2 DE3236000C2 (de) | 1990-01-25 |
Family
ID=6174422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19823236000 Granted DE3236000A1 (de) | 1982-09-29 | 1982-09-29 | Verfahren zum klassifizieren von audiosignalen |
Country Status (2)
Country | Link |
---|---|
US (1) | US4542525A (de) |
DE (1) | DE3236000A1 (de) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3236834A1 (de) * | 1981-10-05 | 1983-10-06 | Exxon Corp | Verfahren und geraet zur sprachanalyse |
EP0171234A2 (de) * | 1984-08-10 | 1986-02-12 | McWHIRTER HOLDINGS PTY LIMITED | Schaltungsanordnung zur Authentifikation von gesprochenen Worten für verfälschungsgeschützte Aufzeichnung |
DE3630518A1 (de) * | 1985-09-06 | 1987-03-19 | Ricoh Kk | Einrichtung zum erkennen von sprache |
EP0228882A2 (de) * | 1985-12-23 | 1987-07-15 | McWHIRTER HOLDINGS PTY LIMITED | Aufzeichnungs-Dekoder-System und Dekoder für ein solches System |
DE3645118A1 (de) * | 1985-09-06 | 1989-08-17 | ||
DE4103913A1 (de) * | 1991-02-08 | 1992-08-13 | Nikolaus Von Seemann | Verfahren und einrichtung zur steuerung von geraeten |
Families Citing this family (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4698842A (en) * | 1985-07-11 | 1987-10-06 | Electronic Engineering And Manufacturing, Inc. | Audio processing system for restoring bass frequencies |
US4759069A (en) * | 1987-03-25 | 1988-07-19 | Sy/Lert System | Emergency signal warning system |
DE3720882A1 (de) * | 1987-06-24 | 1989-01-05 | Media Control Musik Medien | Verfahren und schaltungsanordnung zum automatischen wiedererkennen von signalfolgen |
JP2551050B2 (ja) * | 1987-11-13 | 1996-11-06 | ソニー株式会社 | 有音無音判定回路 |
US4979211A (en) * | 1988-11-16 | 1990-12-18 | At&T Bell Laboratories | Classifier for high speed voiceband digital data modem signals |
US5007000A (en) * | 1989-06-28 | 1991-04-09 | International Telesystems Corp. | Classification of audio signals on a telephone line |
US5144096A (en) * | 1989-11-13 | 1992-09-01 | Yamaha Corporation | Nonlinear function generation apparatus, and musical tone synthesis apparatus utilizing the same |
JP3033061B2 (ja) * | 1990-05-28 | 2000-04-17 | 松下電器産業株式会社 | 音声雑音分離装置 |
US5007032A (en) * | 1990-06-08 | 1991-04-09 | Honeywell Inc. | Acoustic alert sensor |
US5201028A (en) * | 1990-09-21 | 1993-04-06 | Theis Peter F | System for distinguishing or counting spoken itemized expressions |
US5315688A (en) * | 1990-09-21 | 1994-05-24 | Theis Peter F | System for recognizing or counting spoken itemized expressions |
US5656948A (en) * | 1991-05-17 | 1997-08-12 | Theseus Research, Inc. | Null convention threshold gate |
EP0584265A4 (en) * | 1991-05-17 | 1994-05-18 | Theseus Research Inc | Null convention speed independent logic |
US6900658B1 (en) * | 1991-05-17 | 2005-05-31 | Theseus Logic Inc. | Null convention threshold gate |
US5668780A (en) * | 1992-10-30 | 1997-09-16 | Industrial Technology Research Institute | Baby cry recognizer |
US7313251B2 (en) * | 1993-11-18 | 2007-12-25 | Digimarc Corporation | Method and system for managing and controlling electronic media |
US5822436A (en) * | 1996-04-25 | 1998-10-13 | Digimarc Corporation | Photographic products and methods employing embedded information |
US5563952A (en) * | 1994-02-16 | 1996-10-08 | Tandy Corporation | Automatic dynamic VOX circuit |
US6560349B1 (en) | 1994-10-21 | 2003-05-06 | Digimarc Corporation | Audio monitoring using steganographic information |
US7224819B2 (en) | 1995-05-08 | 2007-05-29 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
US6760463B2 (en) * | 1995-05-08 | 2004-07-06 | Digimarc Corporation | Watermarking methods and media |
GB2303471B (en) * | 1995-07-19 | 2000-03-22 | Olympus Optical Co | Voice activated recording apparatus |
US6411725B1 (en) * | 1995-07-27 | 2002-06-25 | Digimarc Corporation | Watermark enabled video objects |
US6965682B1 (en) | 1999-05-19 | 2005-11-15 | Digimarc Corp | Data transmission by watermark proxy |
US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
DE19625455A1 (de) * | 1996-06-26 | 1998-01-02 | Nokia Deutschland Gmbh | Vorrichtung und Verfahren zur Spracherkennung |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
JP3700890B2 (ja) * | 1997-07-09 | 2005-09-28 | ソニー株式会社 | 信号識別装置及び信号識別方法 |
US7689532B1 (en) | 2000-07-20 | 2010-03-30 | Digimarc Corporation | Using embedded data with file sharing |
DE19960161C2 (de) * | 1998-12-15 | 2002-03-28 | Daimler Chrysler Ag | Verfahren zur Detektion von sprachmodulierten Sendungen |
US6519564B1 (en) * | 1999-07-01 | 2003-02-11 | Koninklijke Philips Electronics N.V. | Content-driven speech-or audio-browser |
US7174293B2 (en) * | 1999-09-21 | 2007-02-06 | Iceberg Industries Llc | Audio identification system and method |
US7194752B1 (en) | 1999-10-19 | 2007-03-20 | Iceberg Industries, Llc | Method and apparatus for automatically recognizing input audio and/or video streams |
JP4166153B2 (ja) | 2001-08-06 | 2008-10-15 | 株式会社インデックス | 鳴声の音声的特徴分析に基づく犬の感情判別装置及びその方法 |
US6847930B2 (en) * | 2002-01-25 | 2005-01-25 | Acoustic Technologies, Inc. | Analog voice activity detector for telephone |
US6895290B2 (en) * | 2002-07-11 | 2005-05-17 | International Business Machines Corporation | Limiting the damaging effects of loud music from audio systems, particularly from automobile audio systems |
GB2421317B (en) * | 2004-12-15 | 2009-02-11 | Agilent Technologies Inc | A method and apparatus for detecting leading pulse edges |
US8001260B2 (en) | 2008-07-28 | 2011-08-16 | Vantrix Corporation | Flow-rate adaptation for a connection of time-varying capacity |
US7975063B2 (en) * | 2009-05-10 | 2011-07-05 | Vantrix Corporation | Informative data streaming server |
US8340964B2 (en) * | 2009-07-02 | 2012-12-25 | Alon Konchitsky | Speech and music discriminator for multi-media application |
US8712771B2 (en) * | 2009-07-02 | 2014-04-29 | Alon Konchitsky | Automated difference recognition between speaking sounds and music |
US9196254B1 (en) | 2009-07-02 | 2015-11-24 | Alon Konchitsky | Method for implementing quality control for one or more components of an audio signal received from a communication device |
US9196249B1 (en) | 2009-07-02 | 2015-11-24 | Alon Konchitsky | Method for identifying speech and music components of an analyzed audio signal |
US8606569B2 (en) | 2009-07-02 | 2013-12-10 | Alon Konchitsky | Automatic determination of multimedia and voice signals |
US9026440B1 (en) | 2009-07-02 | 2015-05-05 | Alon Konchitsky | Method for identifying speech and music components of a sound signal |
CN102044246B (zh) * | 2009-10-15 | 2012-05-23 | 华为技术有限公司 | 一种音频信号检测方法和装置 |
US9137551B2 (en) * | 2011-08-16 | 2015-09-15 | Vantrix Corporation | Dynamic bit rate adaptation over bandwidth varying connection |
CN102982804B (zh) * | 2011-09-02 | 2017-05-03 | 杜比实验室特许公司 | 音频分类方法和系统 |
US8901955B2 (en) * | 2012-11-05 | 2014-12-02 | Sandisk Technologies Inc. | High speed buffer with high noise immunity |
CN110265058B (zh) | 2013-12-19 | 2023-01-17 | 瑞典爱立信有限公司 | 估计音频信号中的背景噪声 |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10224053B2 (en) * | 2017-03-24 | 2019-03-05 | Hyundai Motor Company | Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2405349A1 (de) * | 1973-02-13 | 1974-08-22 | Communications Satellite Corp | Digitaler sprachgesteuerter schalter mit einer digital gesteuerten schwelle |
EP0027343A1 (de) * | 1979-10-11 | 1981-04-22 | The Marconi Company Limited | Sprachdetektor |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2761897A (en) * | 1951-11-07 | 1956-09-04 | Jones Robert Clark | Electronic device for automatically discriminating between speech and music forms |
US3448215A (en) * | 1966-08-22 | 1969-06-03 | Northrop Corp | Monitoring device for distinguishing between voice and data signals |
US3767860A (en) * | 1972-07-18 | 1973-10-23 | Atlantic Res Corp | Modulation identification system |
US3927260A (en) * | 1974-05-07 | 1975-12-16 | Atlantic Res Corp | Signal identification system |
US4027102A (en) * | 1974-11-29 | 1977-05-31 | Pioneer Electronic Corporation | Voice versus pulsed tone signal discrimination circuit |
-
1982
- 1982-09-29 DE DE19823236000 patent/DE3236000A1/de active Granted
-
1983
- 1983-09-27 US US06/536,213 patent/US4542525A/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2405349A1 (de) * | 1973-02-13 | 1974-08-22 | Communications Satellite Corp | Digitaler sprachgesteuerter schalter mit einer digital gesteuerten schwelle |
EP0027343A1 (de) * | 1979-10-11 | 1981-04-22 | The Marconi Company Limited | Sprachdetektor |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3236834A1 (de) * | 1981-10-05 | 1983-10-06 | Exxon Corp | Verfahren und geraet zur sprachanalyse |
EP0171234A2 (de) * | 1984-08-10 | 1986-02-12 | McWHIRTER HOLDINGS PTY LIMITED | Schaltungsanordnung zur Authentifikation von gesprochenen Worten für verfälschungsgeschützte Aufzeichnung |
EP0171234A3 (en) * | 1984-08-10 | 1987-10-28 | Minnesota Mining And Manufacturing Company | Circuitry for characterizing speech for tamper protected recording |
DE3630518A1 (de) * | 1985-09-06 | 1987-03-19 | Ricoh Kk | Einrichtung zum erkennen von sprache |
DE3645118A1 (de) * | 1985-09-06 | 1989-08-17 | ||
EP0228882A2 (de) * | 1985-12-23 | 1987-07-15 | McWHIRTER HOLDINGS PTY LIMITED | Aufzeichnungs-Dekoder-System und Dekoder für ein solches System |
EP0228882A3 (en) * | 1985-12-23 | 1987-10-14 | Minnesota Mining And Manufacturing Company | Decoder for a recorder-decoder system |
DE4103913A1 (de) * | 1991-02-08 | 1992-08-13 | Nikolaus Von Seemann | Verfahren und einrichtung zur steuerung von geraeten |
Also Published As
Publication number | Publication date |
---|---|
DE3236000C2 (de) | 1990-01-25 |
US4542525A (en) | 1985-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3236000A1 (de) | Verfahren zum klassifizieren von audiosignalen | |
EP0296588B1 (de) | Verfahren und Schaltungsanordnung zum automatischen Wiedererkennen von Signalfolgen | |
DE2820425C2 (de) | Binärer Zufallsrauschgenerator zur stochastischen Kodierung | |
DE68926411T2 (de) | Analog-Digitalwandlersystem | |
DE3012400C2 (de) | Verfahren zur Überwachung der Bitfehlerrate | |
DE3619430A1 (de) | Zusammengesetzter steuerimpulsgenerator | |
DE2357067C3 (de) | Elektrische Schaltungsanordnung in Verbindung mit einer Spracherkennungseinrichtung | |
DE3102385C2 (de) | ||
EP0137948B1 (de) | Schaltungsanordnung zum Überprüfen des zeitlichen Abstands von Rechtecksignalen | |
DE2551686A1 (de) | Digitale vorrichtung zur erkennung einer nrz-nachricht | |
DE3780406T2 (de) | Verfahren und anordnung zur kodierung und dekodierung binaerer information. | |
DE2537264B2 (de) | Schaltungsanordnung zum erkennen der null-durchgaenge von signalen | |
DE3889028T2 (de) | Taktextrahierer mit digitaler phasenverriegelter Schleife für bipolare Signale. | |
DE3533467C2 (de) | Verfahren und Anordnung zum störsicheren Erkennen von in Datensignalen enthaltenen Daten | |
DE3214978C2 (de) | ||
DE69501376T2 (de) | Überwachungsanlage für Übertragung in einem Modem | |
DE3225800C1 (de) | Schaltungsanordnung zur Störbefreiung von binären Signalen | |
DE3130156C2 (de) | Digitaler Frequenz-Phasenkomparator | |
DE19503576A1 (de) | Digitaler Empfänger und Empfangsverfahren für frequenzmodulierte Signale | |
DE2712831C3 (de) | ||
DE2258643A1 (de) | Anordnung fuer die impulshoehenbestimmung | |
DE1772633A1 (de) | Verfahren zur Spracherkennung | |
DE3217335C1 (de) | Verfahren zur Ermittlung gleicher Modulationsinhalte in mindestens zwei Empfängerzügen und Empfangseinrichtung zur Durchführung des Verfahrens | |
DE68911355T2 (de) | Verfahren und Einrichtung zur Signalunterscheidung. | |
DE3126115C2 (de) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8125 | Change of the main classification |
Ipc: G10C 3/00 |
|
8120 | Willingness to grant licences paragraph 23 | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |