DE69434568T2 - Mikrofonsystem für telekonferenzsystem - Google Patents

Mikrofonsystem für telekonferenzsystem Download PDF

Info

Publication number
DE69434568T2
DE69434568T2 DE69434568T DE69434568T DE69434568T2 DE 69434568 T2 DE69434568 T2 DE 69434568T2 DE 69434568 T DE69434568 T DE 69434568T DE 69434568 T DE69434568 T DE 69434568T DE 69434568 T2 DE69434568 T2 DE 69434568T2
Authority
DE
Germany
Prior art keywords
microphone
microphones
block
signals
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69434568T
Other languages
English (en)
Other versions
DE69434568D1 (de
Inventor
Lee Peter CHU
F. William BARTON
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Polycom Inc
Original Assignee
Polycom Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Polycom Inc filed Critical Polycom Inc
Publication of DE69434568D1 publication Critical patent/DE69434568D1/de
Application granted granted Critical
Publication of DE69434568T2 publication Critical patent/DE69434568T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers

Description

  • Hintergrund der Erfindung
  • Die Erfindung betrifft die automatische Auswahl von Mikrophonsignalen.
  • Seit den frühesten Tagen der Tonaufzeichnung stellen Rauschen und Nachhall beständige Probleme dar. Rauschen und Nachhall sind in Telekonferenzsystemen, bei denen mehrere Leute um einen Tisch sitzen, typischerweise in einem akustisch aktiven Raum, in dem jeder mit Papier hantiert, besonders schädlich.
  • Frühere Verfahren zum Verringern von Rauschen und Nachhall haben auf Richtmikrophonen beruht, die auf Schallquellen auf der Achse des Mikrophons am stärksten ansprechen und weniger ansprechen, wenn der Winkel zwischen der Achse und der Quelle zunimmt. Der Telekonferenzraum kann mit mehreren Richtmikrophonen ausgestattet sein: entweder ein Mikrophon für jeden Teilnehmer oder ein Mikrophon für jede Zone des Raums. Eine automatische Mikrophontorschaltung schaltet ein Mikrophon zu einem Zeitpunkt ein, um nur die gerade sprechende Person aufzunehmen. Die anderen Mikrophone werden abgeschaltet (oder in der Empfindlichkeit signifikant verringert), wodurch die Rausch- und Nachhallsignale, die an den anderen Mikrophonen empfangen werden, ausgeschlossen werden. Die Torsteuerung wird in einer komplexen analogen Schaltung durchgeführt.
  • US 4 741 038 offenbart eine planare Mikrophonanordnung und eine Misch- und Steuerschaltung, um das Ausgangssignal von jedem der Mikrophone in der Anordnung zu kombinieren und anzupassen. Die Signale der einzelnen Mikrophone werden aufsummiert, nachdem die einzelnen Signale um eine individuelle Verzögerungszeit verzögert wurden. Dadurch wird eine hohe Winkelauflösung erreicht. Durch Abtasten der verfügbaren Winkelrichtungsabhängigkeiten der Mikrophonanordnung kann die Winkelorientierung gesucht werden, in der eine maximale Schallleistung erfasst wird. Diese Abtastung erfordert eine entsprechende Anpassung der Zeitverzögerung für jeden einzelnen Wandler der Anordnung.
  • Bei der Mikrophonanordnung von DE 2 214 431 A sind vier Mikrophone derart angeordnet, dass jedes in eine andere Richtung in einer Ebene weist. Die Signale der vier Mikrophone werden verstärkt und gemischt, um vier Ausgangssignale für eine Vierkanal-Wiedergabe vorzusehen.
  • Es ist eine Aufgabe der Erfindung, ein Mikrophonsystem und ein Verfahren zum Kombinieren von Mikrophonsignalen bereitzustellen, die das Ausgangssignal optimieren, wenn eine Schallquelle ihre Position relativ zu den Mikrophonen ändern kann.
  • Die Erfindung ist in dem Anspruch 1 bzw. 11 definiert.
  • Spezielle Ausführungsbeispiele sind in den abhängigen Ansprüchen dargelegt.
  • Zusammenfassung der Erfindung
  • Gemäß einem Aspekt zeichnet sich die Erfindung im Allgemeinen durch ein Mikrophonsystem zur Verwendung in einer Umgebung, in der eine Schallquelle Energie von verschiedenen und veränderlichen Stellen innerhalb der Umgebung emittiert, aus. Das Mikrophonsystem weist mindestens zwei Richtmikrophone, eine Mischschaltung und eine Steuerschaltung auf. Die Mikrophone werden jeweils von einem Mittelpunkt ausgerichtet gehalten. Die Mischschaltung kombiniert die elektrischen Signale von den Mikrophonen in veränderlichen Verhältnissen, um ein zusammengesetztes Signal zu erzeugen, wobei das zusammengesetzte Signal Beiträge von mindestens zwei der Mikrophone umfasst. Die Steuerschaltung analysiert die elektrischen Signale, um eine Winkelorientierung des Schallsignals relativ zum Mittelpunkt zu ermitteln, und stellt im Wesentlichen kontinuierlich die Verhältnisse als Reaktion auf die ermittelte Orientierung ein und liefert die eingestellten Verhältnisse zur Mischschaltung. Die Werte der Verhältnisse werden so ausgewählt, dass das zusammengesetzte Signal ein Signal simuliert, das von einem einzelnen Richtmikrophon erzeugt werden würde, das um den Mittelpunkt geschwenkt wird, um seine maximale Ansprechempfindlichkeit auf das Schallsignal zu richten, wenn sich das Schallsignal in der Umgebung herumbewegt.
  • Spezielle Ausführungsbeispiele der Erfindung können die folgenden Merkmale umfassen. Die mehreren Mikrophone sind in einer kleinen, unauffälligen, zentral angeordneten "Scheibe" montiert, um die Sprache von Leuten aufzunehmen, die um einen großen Tisch sitzen. Die Scheibe kann zwei Dipolmikrophone oder vier Kardioid-Mikrophone, die in 90° zueinander orientiert sind, halten. Das Schwenken und Richten finden in diskreten Winkeln um den Mittelpunkt statt. Die Mischschaltung kombiniert die Signale von den Mikrophonen durch selektives Addieren, Subtrahieren oder Durchleiten der Signale, um vier Dipolmikrophone in 45° zueinander zu simulieren. Die Mischverhältnisse werden durch Kombinieren und Gewichten von Koeffizienten, die die Ansprechempfindlichkeit des virtuellen Mikrophons auf einem fast gleichmäßigen Pegel halten, festgelegt. Mindestens zwei der eingestellten Koeffizienten sind weder Null noch Eins. Das Mikrophonsystem umfasst ferner eine Echokompensationsschaltung mit einem Effekt, der sich mit den ausgewählten Verhältnissen und der Richtung des virtuellen Mikrophons ändert, wobei die Echokompensationsschaltung eine Information von der Steuerschaltung erhält, um den Effekt zu bestimmen.
  • Gemäß einem zweiten Aspekt zeichnet sich die Erfindung im Allgemeinen durch ein Verfahren zum Auswählen eines Mikrophons für die bevorzugte Verstärkung aus. Das Verfahren ist bei einem Mikrophonsystem zur Verwendung in einer Umgebung, in der sich eine Schallquelle in der Umgebung herumbewegt, nützlich. Bei dem Verfahren werden mindestens zwei Mikrophone in der Umgebung bereitgestellt. Für jedes Mikrophon wird eine Folge von Abtastwerten entsprechend dem elektrischen Signal des Mikrophons erzeugt. Die Abtastwerte werden in Blöcke von mindestens jeweils einem Abtastwert blockweise unterteilt. Für jeden Block wird ein Energiewert für die Abtastwerte des Blocks berechnet und ein laufender Spitzenwert wird erzeugt: der laufende Spitzenwert ist gleich dem Energiewert des Blocks, wenn der Energiewert des Blocks den laufenden Spitzenwert, der für den vorherigen Block erzeugt wurde, übersteigt, und ist ansonsten gleich einer Abklingkonstante mal dem vorherigen laufenden Spitzenwert. Nachdem ein laufender Spitzenwert für den Block und jedes Mikrophon berechnet wurde, werden die laufenden Spitzenwerte für jedes Mikrophon verglichen. Das Mikrophon, dessen entsprechender laufender Spitzenwert am größten ist, wird ausgewählt und während eines anschließenden Blocks vorzugsweise verstärkt.
  • Bei bevorzugten Ausführungsbeispielen kann sich das Verfahren durch das Folgende auszeichnen. Die Energiepegel werden durch Subtrahieren einer Abschätzung von Hintergrundrauschen berechnet. Die Abklingkonstante dämpft die laufende Spitze um die Hälfte in etwa 1/23 Sekunde. Eine sich bewegende Summe der laufenden Spitzenwerte für jedes Mikrophon wird vor dem Vergleichsschritt summiert.
  • Gemäß einem dritten Aspekt stellt die Erfindung ein Verfahren zum Entwerfen eines Dipolmikrophons bereit: zwei Kardioid-Mikrophone werden nahe beieinander in entgegengesetzten Richtungen ortsfest gehalten und die Signale, die von den Kardioid-Mikrophonen erzeugt werden, werden subtrahiert, um ein Dipolmikrophon zu simulieren.
  • Unter den Vorteilen der Erfindung sind die folgenden. Die Mikrophonauswahl und das Mischen werden in der Software implementiert, die etwa 5% der Verarbeitungszyklen eines AT&T DSP1610 Digitalsignalverarbeitungs- (DSP) Chips verbraucht. Bevorzugte Ausführungsbeispiele können mit einem einzelnen Stereo-Analog-Digital-Wandler und DSP implementiert werden. Da das Telekonferenzsystem bereits den Stereo-ADC- und DSP-Chip verwendet, beispielsweise zur Schallechokompensation, ist die offenbarte Mikrophontorvorrichtung signifikant einfacher und preiswerter als eine in einer analogen Schaltung implementierte und erreicht eine überlegene Leistung. Die Integration der Echokompensationssoftware und der Mikrophonauswahlsoftware zu einem einzelnen DSP ermöglicht eine kooperative Verbesserung von verschiedenen Signalverarbeitungsfunktionen im DSP.
  • Weitere Aufgaben, Vorteile und Merkmale der Erfindung werden aus der folgenden Beschreibung eines bevorzugten Ausführungsbeispiels und aus den Zeichnungen ersichtlich, in denen gilt:
  • Kurzbeschreibung der Zeichnungen
  • 1 ist eine perspektivische Ansicht von vier Mikrophonen mit ihren Kardioid-Ansprechkeulen.
  • 2 ist eine perspektivische Ansicht einer Mikrophonanordnung, die teilweise aufgeschnitten ist.
  • 3 ist ein schematisches Diagramm der Signalverarbeitungswege für die von den Mikrophonen der Mikrophonanordnung erzeugten Signale.
  • 4a4d sind Draufsichten auf vier Kardioid-Mikrophone und die Ansprechkeulen, die durch Kombinieren ihrer Signale in veränderlichen Verhältnissen erhalten werden.
  • 5 ist ein Ablaufplan eines Mikrophonauswahlverfahrens der Erfindung.
  • 6 ist eine schematische Ansicht von zwei Mikrophonanordnungen, die miteinander verkettet sind.
  • Beschreibung von speziellen Ausführungsbeispielen der Erfindung
  • Aufbau
  • Mit Bezug auf 1 umfasst eine Mikrophonanordnung gemäß der Erfindung vier Kardioid-Mikrophone MA, MB, MC und MD, die senkrecht zueinander, so nahe aneinander und so nahe an einer Tischoberseite wie möglich angebracht sind. Die Achsen der Mikrophone sind zur Tischoberseite parallel. Jedes der vier Mikrophone weist eine Kardioid-Ansprechkeule A, B, C bzw. D auf. Durch Kombinieren der Signale der Mikrophone in verschiedenen Verhältnissen können die vier Kardioid-Mikrophone dazu veranlasst werden, ein einzelnes "virtuelles" Mikrophon zu simulieren, das sich dreht, um eine Schallquelle zu verfolgen, während sie sich um den Tisch bewegt (oder unter mehreren Quellen zu verfolgen, während sie sprechen und still werden).
  • 2 zeigt die Mikrophonanordnung 200 mit vier Primos EN75B Kardioid-Mikrophonen MA, MB, MC und MD, die senkrecht zueinander an einer Leiterplatte (PCB) 202 montiert sind. Eine perforierte Kuppelabdeckung 204 liegt über einer Schaumschicht 208 und steht mit einer Basis 206 in Eingriff. Potentiometer 210 zum Ausgleichen der Ansprechempfindlichkeit der Mikrophone sind durch Löcher 212 in der Unterseite des Gehäuses 206 und der PCB 202 zugänglich. Die Schaltungen auf der PCB 202, die nicht dargestellt sind, umfassen vier Vorverstärker. Die Anordnung 200 weist einen Durchmesser von etwa sechs Inch und eine Höhe von 1 ½ Inch auf.
  • Nimmt man erneut auf 1 Bezug, so variiert die Ansprechempfindlichkeit eines Kardioid-Mikrophons mit dem außeraxialen Winkel θ gemäß der Funktion:
    Figure 00080001
  • Diese Funktion ergibt, wenn sie in Polarkoordinaten aufgetragen wird, die herzförmige Ansprechempfindlichkeit, die als Keulen A, B, C und D aufgetragen wird, für die Mikrophone MA, MB, MC bzw. MD. wenn beispielsweise θA 180° ist (die Schallquelle 102 liegt direkt hinter dem Mikrophon MA, wie in 1 dargestellt), ist die Amplitudenansprechempfindlichkeit des Kardioid-Mikrophons MA Null.
  • Mit Bezug auf 3 wird die Differenz eines entgegengesetzten Paars von Mikrophonen durch Verdrahten eines Mikrophons mit einer Sperrvorspannung relativ zur anderen gebildet. In Anbetracht des Paars MA und MC ist MA, zwischen +5V und einen Widerstand 302A von 10 kΩ zur Erdung und MC ist zwischen einen Widerstand 3020 von 10 kΩ zu +5V und die Erdung geschaltet. Kondensatoren 304A , 304C mit 1 μF und Pegeleinstellpotentiometer 210A , 210C mit 5 kΩ verbinden jeweils MA und MC mit einem Eingang eines Differenzoperationsverstärkers 320AC . Eine Bassverstärkungsschaltung 322AC führt das Ausgangssignal des Operationsverstärkers zum Eingang zurück. Bei anderen Ausführungsbeispielen können die Komponentenwerte (vorstehend und nachstehend angegeben) variieren, wie für die verschiedenen aktiven Komponenten erforderlich.
  • Das Ausgangssignal 330AC , 330BD des Operationsverstärkers 320BD stellt jenes eines virtuellen Dipolmikrophons dar. Das Signal 330AC (das Ausgangssignal des Mikrophons MC minus das Ausgangssignal des Mikrophons MA) ergibt beispielsweise ein Dipolmikrophon, dessen Winkelansprechempfindlichkeit
    Figure 00090001
    ist.
  • Dieses Dipolmikrophon weist eine Ansprechempfindlichkeit von 1 auf, wenn θA 0° ist, –1, wenn θA 180° ist, und weist Ansprechempfindlichkeitsnullen auf, wenn θA ± 90° außeraxial ist. Ebenso simuliert ein Signal 330BD (wobei MD von MB subtrahiert wird) ein Dipolmikrophon, dessen Winkelansprechempfindlichkeit
    Figure 00090002
    ist.
  • Dieses Dipolmikrophon weist eine Ansprechempfindlichkeit von 1 auf, wenn θB 0° ist (θA 90° ist), –1, wenn θB 180° ist (θA –90° ist), und weist Ansprechempfindlichkeitsnullen auf, wenn θB ±90° außeraxial ist (θA 0° oder 180° ist). Die zwei virtuellen Dipolmikrophone, die durch die Signale 330AC und 330BD dargestellt werden, weisen folglich Ansprechkeulen in rechten Winkeln zueinander auf.
  • Nachdem die Signale durch einen Widerstand 324AC , 324BD mit 4,99 kΩ laufen, werden die analogen Differenzen 330AC und 330BD durch Analog-Digital-Wandler (ADC) 340AC und 340BD in die digitale Form 342AC und 342BD mit einer Rate von 16000 Abtastwerten pro Sekunde umgewandelt. Die ADCs 340AC und 340BD können beispielsweise der rechte bzw. der linke Kanal eines Stereo-ADC sein.
  • Mit Bezug auf 4a-4d können die Ausgangssignale 342AC und 342BD ferner in einem Digitalsignalprozessor (DSP) 350 miteinander addiert oder voneinander subtrahiert werden, um zusätzliche Mikrophon-Ansprechempfindlichkeitsmuster zu erhalten. Die Summe der Signale 342AC und 342BD ist cosθA + sinθA = √2cos(θA – 45°)
  • Dies entspricht dem virtuellen Dipolmikrophon, das in 4c dargestellt ist, dessen Ansprechkeule um 45° von der Achse des Mikrophons MA weg verschoben ist (auf halbem Wege zwischen den Mikrophonen MA und MB).
  • Ebenso ist die Differenz der Signale 212AC – 212BD = COSθA – sinθA = √2cos(θA + 45°)entsprechend dem in 4a dargestellten virtuellen Dipolmikrophon, dessen Ansprechkeule um –45° verschoben ist (auf halbem Wege zwischen den Mikrophonen MA und MD).
  • Die Summen- und Differenzsignale von 4a und 4c werden im Digitalsignalprozessor 350 um 1/√2 skaliert, um eine Ansprechempfindlichkeit auf der Achse mit gleichmäßiger Amplitude zwischen den vier virtuellen Dipolmikrophonen zu erhalten.
  • Die Ansprechempfindlichkeit auf eine Schallquelle auf halbem Wege zwischen zwei benachbarten virtuellen Dipolen ist cos (22,5°) oder 0,9239, nur 0,688 dB weniger als die Ansprechempfindlichkeit auf der Achse. Folglich decken die vier Dipolmikrophone einen Raum von 360° um die Mikrophonanordnung ohne Lücken in der Abdeckung ab.
  • Betrieb
  • 5 zeigt das Verfahren zum Wählen unter den vier virtuellen Dipolmikrophonen. Das Verfahren ist gegen ein konstantes Hintergrundrauschen von Computern, Klimaanlagenlüftungen usw. und auch gegen Nachhallenergie unempfindlich.
  • Digitalisierte Signale 342AC und 342BD treten in den DSP ein. Das Hintergrundrauschen wird von den wesentlichen Sprachfrequenzen in nichtrekursiven Bandpassfiltern 510 mit 1-4 kHz und mit 20 Abgriffen entfernt. Das resultierende Signal wird in Schritt 512 um fünf dezimiert (vier von jeweils fünf Abtastwerten werden durch die Schritte stromabwärts von 512 ignoriert), um das Ausmaß der erforderlichen Berechnung zu verringern. Dann werden vier virtuelle Dipolsignale 530a -530d durch Summieren, Subtrahieren und Durchleiten der Signale 342AC und 342BD erzeugt.
  • 5 und die folgende Erörterung beschreiben die Verarbeitung für das Signal 530a im einzelnen; die Verarbeitung für die Signale 530b bis 530a ist bis Schritt 590 identisch. Verschiedene der folgenden Schritte unterteilen die Abtastwerte blockweise in Blöcke von 20 ms (80 der um fünf dezimierten Abtastwerte von 3,2 kHz pro Block). Diese Funktionen werden nachstehend unter Verwendung der Zeitvariable T beschrieben. Andere Schritte berechnen eine Funktion an jedem dezimierten Abtastwert; diese Funktionen werden unter Verwendung der Zeitvariable t beschrieben.
  • Schritt 540 nimmt den Absolutwert des Signals 530a , so dass grobe Energiemessungen, die später in dem Verfahren stattfinden, berechnet werden können, indem einfach die resultierenden Abtastwerte u(T) 542 zusammensummiert werden.
  • Der Schritt 550 schätzt das Hintergrundrauschen ab. Die Abtastwerte werden blockweise in Blöcke von 20 ms unterteilt und ein Mittelwert wird für die Abtastwerte in jedem Block berechnet. Der Hintergrundrauschpegel wird als Minimalwert v(T) über die Energiepegelwerte 542 der vorherigen 100 Blöcke angenommen. Die Rauschabschätzung w(T) 554 des aktuellen Blocks wird aus der vorherigen Rauschabschätzung w(T – 1) und der minimalen mittleren Energieabschätzung v(T) des aktuellen Blocks unter Verwendung der Formel w(T) = 0,75 w(T – 1) + 0,25 v(T)berechnet.
  • In Schritt 560 wird die Hintergrundrauschabschätzung w(T) 554 des Blocks von der Energieabschätzung u(T) 542 des Abtastwerts subtrahiert. Wenn die Differenz negativ ist, dann wird der Wert auf Null gesetzt, um rauschkompensierte Abtastratenenergien x(T) 562 zu erzeugen.
  • Schritt 570 findet die Kurzzeitenergie. Die rauschkompensierten Abtastratenenergien x(t) 562 werden einem Integrator zugeführt, um Kurzzeitenergieabschätzungen y(t) 572 zu erzeugen: y(t) = 0,75y(t – 1) + 0,25 × (t)
  • Schritt 580 berechnet einen laufenden Spitzenwert z(t) 582 bei der Abtastrate von 3,2 kHz, dessen Wert der Energie des direkten Weges von der Schallquelle minus Rauschen und Nachhall entspricht, um die Wirkungen der Nachhallenergie auf die Auswahl unter den virtuellen Mikrophonen zu mildern. Wenn y(t) > z(t – 1), dann gilt z(t) = y(t).
  • Ansonsten gilt z(t) = 0,996 z(t – 1). Die laufende Spitze klingt um die Hälfte in 173 Abtastzeiten von 3,2 kHz, etwa 1/18 Sekunde, ab. Andere Abklingkonstanten, beispielsweise jene, die Halbdämpfungszeiten zwischen 1/5 und 1/100 Sekunde ergeben, sind in Abhängigkeit von der Raumakustik, dem Abstand von Schallquellen von der Mikrophonanordnung usw. auch nützlich.
  • Schritt 584 summiert die 64 laufenden Spitzenwerte in jedem Block von 20 ms, um das Signal 586a zu erzeugen.
  • Ähnliche Schritte werden verwendet, um laufende Spitzensummen 586b 586d für die Eingabe in den Schritt 590 zu erzeugen.
  • In Schritt 590 wird das virtuelle Dipolmikrophon mit dem maximalen Ergebnis 586a 586d als durch Addieren, Subtrahieren oder Durchleiten der Signale 342AC und 342BD zu erzeugendes virtuelles Mikrophon ausgewählt, um das Ausgangssignal 390 zu erzeugen. Damit das Verfahren die Mikrophonwahl umschaltet, muss der Maximalwert 586a 586d für das neue Mikrophon mindestens 1 dB über dem Wert 586a -586d für das vorher ausgewählte virtuelle Mikrophon liegen. Diese Hysterese verhindert, dass das Mikrophon zwischen zwei virtuellen Mikrophonen "zittert", wenn beispielsweise die Schallquelle fast in dem Winkel angeordnet ist, in dem die Ansprechempfindlichkeit von zwei virtuellen Mikrophonen gleich ist. Die Auswahlentscheidung wird alle 20 ms getroffen. An den Blockgrenzen blendet man das Ausgangssignal zwischen dem alten virtuellen Mikrophon und dem neuen über acht Abtastwerte über.
  • Wechselwirkung der Mikrophonauswahl mit der anderen Verarbeitung
  • Bei einem Telekonferenzsystem wird die Mikrophonanordnung typischerweise mit einem Lautsprecher verwendet, um Töne von einer entfernten Telekonferenzstation wiederzugeben. Beim bevorzugten Ausführungsbeispiel verwaltet die Software Wechselwirkungen zwischen dem Lautsprecher und den Mikrophonen, beispielsweise um ein "Durcheinanderbringen" des Mikrophonauswahlverfahrens zu vermeiden und die Schallechokompensation zu verbessern. Beim bevorzugten Ausführungsbeispiel werden diese Wechselwirkungen im DSP 350 zusammen mit dem Mikrophonauswahlmerkmal implementiert und folglich kann jede der Analysen von den Ergebnissen der anderen profitieren, beispielsweise um die Echokompensation auf der Basis der Mikrophonauswahl zu verbessern.
  • Wenn der Lautsprecher Sprache von der entfernten Telekonferenzstation wiedergibt, kann das Mikrophonauswahlverfahren deaktiviert werden. Diese Feststellung wird durch bekannte Verfahren durchgeführt, beispielsweise jenes, das in der US-Patentanmeldung Seriennummer 08/086 707, veröffentlicht unter US 5550824 , beschrieben ist. Wenn der Lautsprecher fernes Hintergrundrauschen emittiert, arbeitet das Mikrophonauswahlverfahren normal.
  • Ein Telekonferenzsystem umfasst eine Schallechokompensation, um Ton vom Lautsprecher vom Mikrophoneingangssignal zu kompensieren, wie in den Patentanmeldungen der Vereinigten Staaten, Seriennummern 07/659 579, veröffentlicht unter US 5305307 , und 07/837 729, veröffentlicht unter US 5263019 , beschrieben. Ein vom Lautsprecher erzeugter Ton wird vom Mikrophon zeitlich verzögert und in der Frequenz verändert empfangen, wie durch die Akustik des Raums, die relative Geometrie des Lautsprechers und des Mikrophons, den Ort anderer Gegenstände im Raum, das Verhalten des Lautsprechers und des Mikrophons selbst und das Verhalten der Lautsprecher- und Mikrophonschaltung, die gemeinsam als "Raumansprechempfindlichkeit" bekannt sind, bestimmt. Solange das Audiosystem eine vernachlässigbare, nichtlineare Verzerrung aufweist, kann der Lautsprecher-Mikrophon-Weg durch ein nichtrekursives (FIR) Filter gut modelliert werden.
  • Der Echokompensator unterteilt das vollständige Tonfrequenzband in Teilbänder und verwaltet eine Abschätzung für die Raumansprechempfindlichkeit für jedes als FIR-Filter modellierte Teilband.
  • Der Echokompensator ist "adaptiv": er aktualisiert seine Filter als Reaktion auf eine Änderung der Raumansprechempfindlichkeit in jedem Teilband. Typischerweise nimmt die Zeit, die dafür erforderlich ist, dass ein Filter des Teilbandes von einem gewissen Anfangszustand konvergiert (das heißt, der tatsächlichen Raumansprechempfindlichkeit so nahe kommt, wie es das Anpassungsverfahren zulässt), mit der anfänglichen Differenz des Filters von der aktuellen Raumansprechempfindlichkeit zu. Für große Differenzen kann diese Konvergenzzeit mehrere Sekunden sein, während welcher die Echokompensationsleistung unangemessen ist.
  • Die aktuelle Raumansprechempfindlichkeit kann in eine "primäre Ansprechempfindlichkeit" und eine "Störungsansprechempfindlichkeit" aufgespalten werden. Die primäre Ansprechempfindlichkeit spiegelt diejenigen Elemente der Raumansprechempfindlichkeit wider, die konstant sind oder sich nur über Zeiten in einigen zehn Sekunden ändern, beispielsweise die Geometrie und Oberflächeneigenschaften des Raums und großer Objekte im Raum und die Geometrie des Lautsprechers und des Mikrophons. Die Störungsansprechempfindlichkeit spiegelt diejenigen Elemente der Raumansprechempfindlichkeit wider, die sich geringfügig und schnell ändern, wie z.B. Luftströmungsmuster, die Positionen von Leuten auf ihren Stühlen usw. Diese kleinen Störungen erzeugen nur eine geringfügige Verschlechterung der Echokompensation und die Filter konvergieren schnell wieder, um die vollständige Echokompensation wiederherzustellen.
  • Bei typischen Telekonferenzanwendungen liegen Änderungen der Raumansprechempfindlichkeit hauptsächlich an Änderungen der Störungsansprechempfindlichkeit. Änderungen der primären Ansprechempfindlichkeit führen zu einer schlechten Echokompensation, während die Filter erneut konvergieren. Wenn sich die primäre Ansprechempfindlichkeit nur selten ändert, wie wenn ein Mikrophon bewegt wird, ergibt die adaptive Echokompensation eine annehmbare Leistung. wenn sich jedoch die primäre Raumansprechempfindlichkeit häufig ändert, wie es geschieht, sobald ein neues Mikrophon ausgewählt wird, kann die Änderung der Raumansprechempfindlichkeit groß genug sein, so dass sie zu einer schlechten Echokompensation und einer langen Zeit für die erneute Konvergenz zur Wiederherstellung einer guten Echokompensation führt.
  • Ein Echokompensator zur Verwendung bei dem Mikrophonauswahlverfahren verwaltet eine Version seines gegen die Ansprechempfindlichkeit empfindlichen Zustands (die adaptiven Filterparameter für jedes Teilband und Hintergrundrauschabschätzungen) für jedes virtuelle Mikrophon. Wenn ein neues virtuelles Mikrophon ausgewählt wird, speichert der Echokompensator den aktuellen gegen die Ansprechempfindlichkeit empfindlichen Zustand für das aktuelle virtuelle Mikrophon und lädt den gegen die Ansprechempfindlichkeit empfindlichen Zustand für das neu ausgewählte virtuelle Mikrophon.
  • Da der Speicherplatz für den vollen gegen die Ansprechempfindlichkeit empfindlichen Zustand für alle virtuellen Mikrophone eine tolerierbare Speicherquote übersteigen würde, wird der gegen die Ansprechempfindlichkeit empfindliche Zustand jedes virtuellen Mikrophons in einer komprimierten Form gespeichert. Um eine ausreichende Kompression zu erzielen, werden verlustbehaftete Kompressionsverfahren verwendet, um Blöcke von Filterabgriffen zu komprimieren und zu speichern: jeder 16-Bit-Abgriffswert wird zu vier Bits komprimiert. Das folgende Verfahren verringert die Kompressionsverluste, wobei ein ausreichendes Detail in der Filterform aufrechterhalten wird, um eine merkliche erneute Konvergenz zu vermeiden, wenn das Filter von der komprimierten Speicherung abgerufen wird.
  • Die adaptiven Filter weisen typischerweise Spitzenwerte bei einer relativ kleinen Verzögerung entsprechend der Länge des direkten Weges vom Lautsprecher zum Mikrophon mit einem langsam abklingenden "Schwanz" bei größeren Verzögerungen entsprechend dem langsam abklingenden Nachhall auf. Wenn ein Block von Filterdaten komprimiert wird, wird jedes Filter in mehrere Blöcke, z.B. vier, aufgeteilt, so dass die großen Werte, die für den ersten Block typisch sind, kleine Werte in den Nachhallschwanzblöcken nicht verdecken.
  • Wenn jeder Block von 16-Bit-Abgriffen komprimiert wird, werden die Abgriffswerte im Block folgendermaßen normiert. Für den größten aktuellen Abgriffswert im Block wird die maximale Anzahl von Linksverschiebungen, die durchgeführt werden können, ohne irgendwelche signifikanten Bits zu verlieren, gefunden. Diese Verschiebungsanzahl wird mit jedem Block von komprimierten Abgriffen gespeichert, so dass die entsprechende Anzahl von Rechtsverschiebungen durchgeführt werden kann, wenn der Block erweitert wird.
  • Die höchstwertigen acht Bits der normierten Abgriffswerte werden bis auf vier Bits nicht-linear quantisiert. Eines der vier Bits wird für das Vorzeichenbit des Abgriffswerts verwendet. Die restlichen drei Bits codieren den Betrag des Acht-Bit-Eingangswerts folgendermaßen:
    7-Bit-Betrag 3-Bit-Quantisierung
    0–16 0
    17–25 1
    26–37 2
    38–56 3
    57–69 4
    70–85 5
    86–104 6
    105–127 7
  • Alternativ könnte der Echokompensator zwei Filterparametersätze speichern, einen Satz entsprechend dem A-C-Dipolmikrophon und einen entsprechend dem B-D-Dipol. Wenn sich die Mikrophonauswahl ändert, könnten die korrekten Echokompensations-Filterwerte durch eine Berechnung analog zu jener, die verwendet wird, um die Mikrophonsignale zu kombinieren, abgeleitet werden. Die Übertragungsfunktionskoeffizienten für das ((A–C) – (B–D)) virtuelle Mikrophon von 4a könnten beispielsweise durch Subtrahieren der entsprechenden Koeffizienten und Skalieren derselben um √2 abgeleitet werden.
  • Der Echokompensator kann in einem DSP mit einem kleinen "schnellen" Speicher und einem größeren "langsamen" Speicher implementiert werden. Die Zeit, die erforderlich ist, um einen gegen die Ansprechempfindlichkeit empfindlichen Zustand in den langsamen Speicher auszulagern und in einen anderen zu wechseln, kann die verfügbare Zeit überschreiten. Daher wird einmal während jedes Aktualisierungsintervalls von 20 ms (des Verarbeitungsintervalls, während dessen der Echokompensatorzustand aktualisiert wird) eine Teilmenge des gegen die Ansprechempfindlichkeit empfindlichen Zustands in den langsamen Speicher kopiert. Das vorliegende Ausführungsbeispiel speichert eines seiner 29 Teilbandfilter in jedem Aktualisierungsintervall, so dass der gesamte Satz von Teilbandfiltern für das gerade aktive virtuelle Mikrophon alle 0,58 Sekunden gespeichert wird.
  • Der gegen die Ansprechempfindlichkeit empfindliche Zustand des Echokompensators wird nur dann aktualisiert, wenn das zugehörige virtuelle Mikrophon aktiv ist. Um den Echokompensationszustand für jedes der virtuellen Mikrophone angemessen aktuell zu halten, erzwingt der Echokompensator die Auswahl eines virtuellen Mikrophons, wenn das aktuelle Mikrophon keine Energie ohne Rauschen für ein gewisses Intervall, z.B. eine Minute, empfangen hat. Die Anwesenheit von Energie ohne Rauschen wird vom Echokompensator an die Mikrophonauswahleinrichtung gemeldet.
  • Alternative Ausführungsbeispiele
  • Eine einzelne Mikrophonanordnung arbeitet für Sprache innerhalb eines Radius von sieben Fuß um die Mikrophonanordnung gut. Wie in 6 gezeigt, können zwei Mikrophonanordnungen 200 zusammen verwendet werden, indem die linken Kanäle 620, 624 der zwei Mikrophonanordnungen zusammenaddiert werden und die zwei rechten Kanäle 622, 626 zusammenaddiert werden. Die zwei summierten Kanäle 632 werden dann in Analog-Digital-Wandler 340 eingespeist, wie aus 3 ersichtlich. Das Auswahlverfahren von 5 arbeitet für die verkettete Konfiguration von 6 gut.
  • Bei der verketteten Konfiguration von 6 erhöht die zweite Anordnung das Rauschen und den Nachhall um 3 dB, was den Effekt der Verringerung des Abdeckradius jeder Mikrophonanordnung von sieben Fuß auf fünf Fuß hat. Da zwei Kreise mit einem Radius von fünf Fuß dieselbe Fläche aufweisen wie ein Kreis mit einem Radius von sieben Fuß, ändert die Verwendung von mehreren Mikrophonanordnungen vielmehr die Form des Abdeckbereichs, als ihn zu erweitern.
  • Durch Berechnen von geeigneten gewichteten Summen von mehreren Mikrophonen, die in einer einzigen Ebene liegen und in Winkeln zueinander orientiert sind, ist es möglich, ein virtuelles Mikrophon abzuleiten, das um einen beliebigen willkürlichen Winkel in der Ebene der realen Mikrophone gedreht ist. Sobald eine Schallquelle lokalisiert ist, würden die Eingangssignale der zwei Mikrophone, die am nächsten zur Schallquelle orientiert sind, in einem geeigneten Verhältnis kombiniert werden. Bei einigen Ausführungsbeispielen würden die Verhältnisse der Eingangssignale von anderen Mikrophonen subtrahiert werden. Das summierte Signal würde skaliert werden, um die Ansprechempfindlichkeit des kombinierten Signals nahezu konstant zu halten, da die Ansprechempfindlichkeit in verschiedene Winkel gerichtet ist. Die Kombinationsverhältnisse und Skalierungskonstanten werden durch die Geometrie und Orientierung der Ansprechkeulen der Mikrophone festgelegt. Wenn die Mikrophonanordnung beispielsweise drei Mikrophone umfasst, die in 60° zueinander orientiert sind, könnte eine Schallquelle, die exakt zwischen zwei Mikrophonen ausgerichtet ist, durch Kombinieren der Signale von den zwei nach vorn gewandten Mikrophonen mit Gewichten 1/(1 + cos 30°) am besten auf genommen werden.
  • Durch Hinzufügen eines Mikrophons, das aus der Ebene der anderen Mikrophone heraus weist, wird es möglich, ein virtuelles Mikrophon in einem beliebigen räumlichen Winkel auszurichten.

Claims (14)

  1. Mikrophonsystem (200, 350), das zur Verwendung in einer Umgebung ausgelegt ist, in der eine Schallquelle ein Schallsignal von verschiedenen und veränderlichen Stellen innerhalb der Umgebung emittiert, wobei das Mikrophonsystem aufweist: mindestens zwei Richtmikrophone (MA–MD), die in einer festen Anordnung um einen Mittelpunkt gehalten werden, wobei die jeweilige Ansprechempfindlichkeit von jedem Mikrophon radial vom Mittelpunkt in einer unterschiedlichen Richtung weggerichtet wird, wobei jedes Mikrophon das von der Schallquelle emittierte Schallsignal empfangen und als Reaktion ein elektrisches Signal erzeugen kann; eine Mischschaltung (200), um die elektrischen Signale in veränderlichen Verhältnissen zu kombinieren, um ein zusammengesetztes Signal zu erzeugen, wobei das zusammengesetzte Signal gewichtete Beiträge von mindestens zwei der Mikrophone umfasst; und eine Steuerschaltung (350), die dazu ausgelegt ist, die elektrischen Signale zu analysieren und den gewichteten Beitrag im Wesentlichen kontinuierlich einzustellen, um das zusammengesetzte Signal zu maximieren; wobei die Verhältnisse durch Kombinieren und Gewichten von Koeffizienten festgelegt werden, die das maximierte zusammengesetzte Signal auf einem nahezu gleichmäßigen Pegel halten, wobei mindestens zwei der eingestellten Koeffizienten weder Null noch Eins sind.
  2. Mikrophonsystem nach Anspruch 1, wobei die Mikrophone (MA–MD) zwei Dipolmikrophone aufweisen, die in 90° zueinander ausgerichtet sind.
  3. Mikrophonsystem nach Anspruch 2, wobei die Mischschaltung (200) die Signale von den zwei Dipolmikrophonen durch selektives Addieren, Subtrahieren oder Durchleiten der Signale kombiniert, um vier Dipolmikrophone in 45° zueinander zu simulieren.
  4. Mikrophonsystem nach Anspruch 1, wobei die Mikrophone (MA–MD) vier Kardioid-Mikrophone aufweisen, die in 90° zueinander ausgerichtet sind.
  5. Mikrophonsystem nach Anspruch 4, wobei die durch die Mischschaltung (200) kombinierten elektrischen Signale Signale aufweisen, die Differenzen von elektrischen Signalen von entgegengesetzten Paaren der Kardioid-Mikrophone sind.
  6. Mikrophonsystem nach Anspruch 1, wobei die Koeffizienten aus einer Gruppe ausgewählt sind, deren Werte etwa 1, 0, –1, √2/2 und –√2/2 sind.
  7. Mikrophonsystem nach Anspruch 1, wobei die Misch- und Steuerschaltung (350) einen Digitalsignalprozessor aufweist.
  8. Mikrophonsystem nach Anspruch 1, wobei die Steuerschaltung (350) aufweist: ein Mittel, das dazu ausgelegt ist, jedes elektrische Signal in eine Folge von Blöcken entsprechend Zeitfenstern mit einer festen Länge blockweise zu unterteilen, um einen Energiewert für jeden der Blöcke zu berechnen; und einen laufenden Spitzenwert für jeden Block zu erzeugen, der gleich dem Energiewert des Blocks ist, wenn der Energiewert des Blocks den für den vorherigen Block erzeugten laufenden pitzenwert übersteigt, und ansonsten gleich einer Abklingkonstante mal dem laufenden Spitzenwert des vorherigen Blocks ist; das dazu ausgelegt ist, einen laufenden Spitzenwert für einen Block und für mindestens zwei Schwenkrichtungen des virtuellen Richtmikrophons zu berechnen und die laufenden Spitzenwerte des Blocks für jede Richtung zu vergleichen; und ein Mittel, das dazu ausgelegt ist, die Verhältnisse so einzustellen, dass die Mischschaltung (200) während eines anschließenden Blocks die Richtung des virtuellen Richtmikrophons auswählt, deren entsprechender laufender Spitzenwert am größten ist.
  9. Mikrophonsystem nach Anspruch 1, welches ferner aufweist eine Echokompensationsschaltung mit der Wirkung der Veränderung mit den ausgewählten Verhältnissen und der Richtung des virtuellen Richtmikrophons, wobei die Echokompensationsschaltung eine Information von der Steuerschaltung (350) erhält, um die Wirkung zu ermitteln.
  10. Mikrophonsystem nach Anspruch 1, wobei die Schallquelle eine Vielzahl von diskreten Lautsprechern aufweist, die jeweils an einer der verschiedenen Stellen innerhalb der Umgebung angeordnet sind.
  11. Verfahren zum Kombinieren von Signalen von mindestens zwei Richtmikrophonen (MA–MD) in einer Umgebung mit einer Schallquelle, die Energie von verschiedenen und veränderlichen Stellen innerhalb der Umgebung emittiert, wobei jedes Mikrophon ein Schallsignal empfangen und als Reaktion ein elektrisches Signal erzeugen kann, wobei das Verfahren die Schritte aufweist: Anbringen der Mikrophone in einer festen Anordnung um einen Mittelpunkt, wobei die jeweiligen Ansprechempfindlichkeiten der Mikrophone radial vom Mittelpunkt in verschiedenen Richtungen weggerichtet werden; Mischen der elektrischen Signale in veränderlichen Verhältnissen, um ein zusammengesetztes Signal zu erzeugen, wobei das zusammengesetzte Signal gewichtete Beiträge von mindestens zwei der Mikrophone umfasst; und im Wesentlichen kontinuierliches Auswählen und Einstellen der gewichteten Beiträge, um das zusammengesetzte Signal zu maximieren; wobei die Verhältnisse durch Kombinieren und Gewichten von Koeffizienten, die das maximierte zusammengesetzte Signal auf einem nahezu gleichmäßigen Pegel halten, festgelegt werden, wobei mindestens zwei der eingestellten Koeffizienten weder Null noch Eins sind.
  12. Verfahren nach Anspruch 11, wobei der Anbringschritt ferner einen der zwei folgenden Schritte aufweist: Vorsehen von zwei Dipolmikrophonen und Ausrichten derselben in 90° zueinander; und Vorsehen von vier Kardioid-Mikrophonen und Ausrichten derselben in 90° zueinander; und der Mischschritt ferner das Bilden von skalierten Summen und Differenzen der elektrischen Signale aufweist.
  13. Verfahren nach Anspruch 11, welches ferner die Schritte aufweist: blockweises Unterteilen von jedem elektrischen Signal in eine Folge von Blöcken entsprechend Zeitfenstern mit einer festen Länge und Durchführen der folgenden Schritte für jeden Block: Berechnen eines Energiewerts für den Block; und Erzeugen eines laufenden Spitzenwerts, der gleich dem Energiewert des Blocks ist, wenn der Energiewert des Blocks den für den vorherigen Block erzeugten laufenden Spitzenwert übersteigt, und ansonsten gleich einer Abklingkonstante mal dem vorherigen laufenden Spitzenwert ist; nachdem ein laufender Spitzenwert für einen Block und für mindestens zwei Schwenkrichtungen des virtuellen Richtmikrophons berechnet wurde, Vergleichen der laufenden Spitzenwerte des Blocks für jede Richtung; und Einstellen der Verhältnisse so, dass die Mischschaltung während eines anschließenden Blocks die Richtung des virtuellen Richtmikrophons auswählt, deren entsprechender laufender Spitzenwert am größten ist.
  14. Verfahren nach Anspruch 11, welches ferner den Schritt aufweist: als Reaktion auf die Auswahl von Verhältniswerten Einstellen des Verhaltens der Echokompensationsschaltung.
DE69434568T 1993-10-05 1994-10-03 Mikrofonsystem für telekonferenzsystem Expired - Lifetime DE69434568T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US132032 1993-10-05
US08/132,032 US5664021A (en) 1993-10-05 1993-10-05 Microphone system for teleconferencing system
PCT/US1994/011205 WO1995010164A1 (en) 1993-10-05 1994-10-03 Microphone system for teleconferencing system

Publications (2)

Publication Number Publication Date
DE69434568D1 DE69434568D1 (de) 2006-01-12
DE69434568T2 true DE69434568T2 (de) 2006-08-03

Family

ID=22452134

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69434568T Expired - Lifetime DE69434568T2 (de) 1993-10-05 1994-10-03 Mikrofonsystem für telekonferenzsystem

Country Status (5)

Country Link
US (2) US5664021A (de)
EP (1) EP0723733B1 (de)
JP (1) JP3321170B2 (de)
DE (1) DE69434568T2 (de)
WO (1) WO1995010164A1 (de)

Families Citing this family (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226031B1 (en) 1992-02-19 2001-05-01 Netergy Networks, Inc. Video communication/monitoring apparatus and method therefor
US5825898A (en) * 1996-06-27 1998-10-20 Lamar Signal Processing Ltd. System and method for adaptive interference cancelling
US6178248B1 (en) 1997-04-14 2001-01-23 Andrea Electronics Corporation Dual-processing interference cancelling system and method
CA2318395C (en) * 1998-01-27 2005-03-22 Collaboration Properties, Inc. Multifunction video communication service device
JP3344647B2 (ja) 1998-02-18 2002-11-11 富士通株式会社 マイクロホンアレイ装置
DE19812697A1 (de) * 1998-03-23 1999-09-30 Volkswagen Ag Verfahren und Einrichtung zum Betrieb einer Mikrofonanordnung, insbesondere in einem Kraftfahrzeug
US6173059B1 (en) 1998-04-24 2001-01-09 Gentner Communications Corporation Teleconferencing system with visual feedback
US6275580B1 (en) * 1998-07-07 2001-08-14 Tellabs Operations, Inc. Teleconferencing device having acoustic transducers positioned to improve acoustic echo return loss
US6185152B1 (en) 1998-12-23 2001-02-06 Intel Corporation Spatial sound steering system
US6363345B1 (en) 1999-02-18 2002-03-26 Andrea Electronics Corporation System, method and apparatus for cancelling noise
US6321194B1 (en) 1999-04-27 2001-11-20 Brooktrout Technology, Inc. Voice detection in audio signals
JP3789685B2 (ja) * 1999-07-02 2006-06-28 富士通株式会社 マイクロホンアレイ装置
US6594367B1 (en) 1999-10-25 2003-07-15 Andrea Electronics Corporation Super directional beamforming design and implementation
EP1226578A4 (de) * 1999-12-31 2005-09-21 Octiv Inc Techniken zur verbesserung der klarheit und verständlichkeit von mit verminderten bitraten übertragenden audiosignalen in einem digitalen netzwerk
US20010033649A1 (en) * 2000-02-08 2001-10-25 Cetacean Networks, Inc. Speakerphone accessory for a telephone instrument
EP1184676B1 (de) * 2000-09-02 2004-05-06 Nokia Corporation Vorrichtung und Verfahren zur Verarbeitung eines Signales emittiert von einer Zielsignalquelle in einer geräuschvollen Umgebung
US20020075965A1 (en) * 2000-12-20 2002-06-20 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility
US20030023429A1 (en) * 2000-12-20 2003-01-30 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility
US7236929B2 (en) * 2001-05-09 2007-06-26 Plantronics, Inc. Echo suppression and speech detection techniques for telephony applications
US7085245B2 (en) * 2001-11-05 2006-08-01 3Dsp Corporation Coefficient domain history storage of voice processing systems
US6795794B2 (en) * 2002-03-01 2004-09-21 The Board Of Trustees Of The University Of Illinois Method for determination of spatial target probability using a model of multisensory processing by the brain
US7146014B2 (en) 2002-06-11 2006-12-05 Intel Corporation MEMS directional sensor system
US7778438B2 (en) 2002-09-30 2010-08-17 Myport Technologies, Inc. Method for multi-media recognition, data conversion, creation of metatags, storage and search retrieval
US10721066B2 (en) 2002-09-30 2020-07-21 Myport Ip, Inc. Method for voice assistant, location tagging, multi-media capture, transmission, speech to text conversion, photo/video image/object recognition, creation of searchable metatags/contextual tags, storage and search retrieval
US6996251B2 (en) 2002-09-30 2006-02-07 Myport Technologies, Inc. Forensic communication apparatus and method
US7433462B2 (en) * 2002-10-31 2008-10-07 Plantronics, Inc Techniques for improving telephone audio quality
US7076072B2 (en) * 2003-04-09 2006-07-11 Board Of Trustees For The University Of Illinois Systems and methods for interference-suppression with directional sensing patterns
JP4123046B2 (ja) * 2003-05-13 2008-07-23 ソニー株式会社 スピーカ装置
US8644525B2 (en) * 2004-06-02 2014-02-04 Clearone Communications, Inc. Virtual microphones in electronic conferencing systems
US7916849B2 (en) * 2004-06-02 2011-03-29 Clearone Communications, Inc. Systems and methods for managing the gating of microphones in a multi-pod conference system
US8031853B2 (en) * 2004-06-02 2011-10-04 Clearone Communications, Inc. Multi-pod conference systems
US20050285935A1 (en) * 2004-06-29 2005-12-29 Octiv, Inc. Personal conferencing node
US20050286443A1 (en) * 2004-06-29 2005-12-29 Octiv, Inc. Conferencing system
US8627213B1 (en) * 2004-08-10 2014-01-07 Hewlett-Packard Development Company, L.P. Chat room system to provide binaural sound at a user location
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US7826624B2 (en) * 2004-10-15 2010-11-02 Lifesize Communications, Inc. Speakerphone self calibration and beam forming
US8116500B2 (en) * 2004-10-15 2012-02-14 Lifesize Communications, Inc. Microphone orientation and size in a speakerphone
US20060132595A1 (en) * 2004-10-15 2006-06-22 Kenoyer Michael L Speakerphone supporting video and audio features
US7903137B2 (en) * 2004-10-15 2011-03-08 Lifesize Communications, Inc. Videoconferencing echo cancellers
US7970151B2 (en) * 2004-10-15 2011-06-28 Lifesize Communications, Inc. Hybrid beamforming
US7760887B2 (en) * 2004-10-15 2010-07-20 Lifesize Communications, Inc. Updating modeling information based on online data gathering
US7720236B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Updating modeling information based on offline calibration experiments
US8457614B2 (en) * 2005-04-07 2013-06-04 Clearone Communications, Inc. Wireless multi-unit conference phone
US7970150B2 (en) * 2005-04-29 2011-06-28 Lifesize Communications, Inc. Tracking talkers using virtual broadside scan and directed beams
US7991167B2 (en) * 2005-04-29 2011-08-02 Lifesize Communications, Inc. Forming beams with nulls directed at noise sources
US7593539B2 (en) * 2005-04-29 2009-09-22 Lifesize Communications, Inc. Microphone and speaker arrangement in speakerphone
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US7925004B2 (en) * 2006-04-27 2011-04-12 Plantronics, Inc. Speakerphone with downfiring speaker and directional microphones
JP4867516B2 (ja) * 2006-08-01 2012-02-01 ヤマハ株式会社 音声会議システム
KR100916497B1 (ko) * 2007-03-30 2009-09-08 중앙대학교 산학협력단 음원추적 방법 및 이를 이용한 홈네트워크 시스템
KR100895430B1 (ko) * 2007-03-30 2009-05-07 중앙대학교 산학협력단 소리의 세기차를 이용한 음원추적 방법 및 그 장치
US20080255840A1 (en) * 2007-04-16 2008-10-16 Microsoft Corporation Video Nametags
US8526632B2 (en) * 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
US8330787B2 (en) * 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
US8165416B2 (en) * 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
JP5156934B2 (ja) * 2008-03-07 2013-03-06 学校法人日本大学 音響測定装置
US8125559B2 (en) * 2008-05-25 2012-02-28 Avistar Communications Corporation Image formation for large photosensor array surfaces
US20220417652A1 (en) * 2008-06-27 2022-12-29 Jawbone Innovations, Llc Microphone array with rear venting
EP2382802A2 (de) * 2008-12-24 2011-11-02 Nxp B.V. Verfahren und vorrichtung zur planar-audioquellenverfolgung
US8767971B2 (en) * 2009-07-24 2014-07-01 Panasonic Corporation Sound pickup apparatus and sound pickup method
US20110058683A1 (en) * 2009-09-04 2011-03-10 Glenn Kosteva Method & apparatus for selecting a microphone in a microphone array
TW201208335A (en) * 2010-08-10 2012-02-16 Hon Hai Prec Ind Co Ltd Electronic device
SE536046C2 (sv) 2011-01-19 2013-04-16 Limes Audio Ab Metod och anordning för mikrofonval
US9264553B2 (en) 2011-06-11 2016-02-16 Clearone Communications, Inc. Methods and apparatuses for echo cancelation with beamforming microphone arrays
US8588434B1 (en) 2011-06-27 2013-11-19 Google Inc. Controlling microphones and speakers of a computing device
GB2493801B (en) 2011-08-18 2014-05-14 Ibm Improved audio quality in teleconferencing
EP3917161B1 (de) * 2012-11-12 2024-01-31 Yamaha Corporation Signalverarbeitungssystem und signalverarbeitungsverfahren
US20140215332A1 (en) * 2013-01-31 2014-07-31 Hewlett-Packard Development Company, Lp Virtual microphone selection corresponding to a set of audio source devices
US9282399B2 (en) 2014-02-26 2016-03-08 Qualcomm Incorporated Listen to people you recognize
US9685730B2 (en) 2014-09-12 2017-06-20 Steelcase Inc. Floor power distribution system
US9584910B2 (en) 2014-12-17 2017-02-28 Steelcase Inc. Sound gathering system
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9554207B2 (en) * 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9769563B2 (en) * 2015-07-22 2017-09-19 Harman International Industries, Incorporated Audio enhancement via opportunistic use of microphones
MC200185B1 (fr) * 2016-09-16 2017-10-04 Coronal Audio Dispositif et procédé de captation et traitement d'un champ acoustique tridimensionnel
MC200186B1 (fr) 2016-09-30 2017-10-18 Coronal Encoding Procédé de conversion, d'encodage stéréophonique, de décodage et de transcodage d'un signal audio tridimensionnel
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method
WO2019231632A1 (en) 2018-06-01 2019-12-05 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
EP3854108A1 (de) 2018-09-20 2021-07-28 Shure Acquisition Holdings, Inc. Einstellbare nockenform für arraymikrofone
US11438691B2 (en) 2019-03-21 2022-09-06 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
EP3942842A1 (de) 2019-03-21 2022-01-26 Shure Acquisition Holdings, Inc. Gehäuse und zugehörige konstruktionsmerkmale für mikrofone einer deckenanordnung
CN114051738A (zh) 2019-05-23 2022-02-15 舒尔获得控股公司 可操纵扬声器阵列、系统及其方法
TW202105369A (zh) 2019-05-31 2021-02-01 美商舒爾獲得控股公司 整合語音及雜訊活動偵測之低延時自動混波器
CN114467312A (zh) 2019-08-23 2022-05-10 舒尔获得控股公司 具有改进方向性的二维麦克风阵列
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
KR102153106B1 (ko) * 2020-02-12 2020-09-07 한국영상대학교 산학협력단 모듈형 마이크로폰
KR102153105B1 (ko) * 2020-02-12 2020-09-07 한국영상대학교 산학협력단 모듈형 마이크로폰
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
CN116918351A (zh) 2021-01-28 2023-10-20 舒尔获得控股公司 混合音频波束成形系统

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3906431A (en) * 1965-04-09 1975-09-16 Us Navy Search and track sonar system
US3755625A (en) * 1971-10-12 1973-08-28 Bell Telephone Labor Inc Multimicrophone loudspeaking telephone system
DE2214431A1 (de) * 1972-03-21 1973-10-04 Georg Neumann Gmbh Electroacus Mikrophonanordnung zur gleichzeitigen, aber getrennten aufnahme von aus vier annaehernd aufeinander senkrecht stehenden richtungen einfallendem schall
US4070547A (en) * 1976-01-08 1978-01-24 Superscope, Inc. One-point stereo microphone
US4072821A (en) * 1976-05-10 1978-02-07 Cbs Inc. Microphone system for producing signals for quadraphonic reproduction
US4096353A (en) * 1976-11-02 1978-06-20 Cbs Inc. Microphone system for producing signals for quadraphonic reproduction
IE47296B1 (en) * 1977-11-03 1984-02-08 Post Office Improvements in or relating to audio teleconferencing
US4131760A (en) * 1977-12-07 1978-12-26 Bell Telephone Laboratories, Incorporated Multiple microphone dereverberation system
US4198705A (en) * 1978-06-09 1980-04-15 The Stoneleigh Trust, Donald P. Massa and Fred M. Dellorfano, Trustees Directional energy receiving systems for use in the automatic indication of the direction of arrival of the received signal
US4305141A (en) * 1978-06-09 1981-12-08 The Stoneleigh Trust Low-frequency directional sonar systems
US4334740A (en) * 1978-09-12 1982-06-15 Polaroid Corporation Receiving system having pre-selected directional response
JPS5910119B2 (ja) * 1979-04-26 1984-03-07 日本ビクター株式会社 可変指向性マイクロホン
US4254417A (en) * 1979-08-20 1981-03-03 The United States Of America As Represented By The Secretary Of The Navy Beamformer for arrays with rotational symmetry
JPS5710598A (en) * 1980-06-20 1982-01-20 Sony Corp Transmitting circuit of microphone output
JPS5710597A (en) * 1980-06-20 1982-01-20 Sony Corp Microphone device
AT371969B (de) * 1981-11-19 1983-08-25 Akg Akustische Kino Geraete Mikrophon zur stereophonischen aufnahme akustischer ereignisse
US4436966A (en) * 1982-03-15 1984-03-13 Darome, Inc. Conference microphone unit
US4449238A (en) * 1982-03-25 1984-05-15 Bell Telephone Laboratories, Incorporated Voice-actuated switching system
US4521908A (en) * 1982-09-01 1985-06-04 Victor Company Of Japan, Limited Phased-array sound pickup apparatus having no unwanted response pattern
US4489442A (en) * 1982-09-30 1984-12-18 Shure Brothers, Inc. Sound actuated microphone system
US4485484A (en) * 1982-10-28 1984-11-27 At&T Bell Laboratories Directable microphone system
US4669108A (en) * 1983-05-23 1987-05-26 Teleconferencing Systems International Inc. Wireless hands-free conference telephone system
US4581758A (en) * 1983-11-04 1986-04-08 At&T Bell Laboratories Acoustic direction identification system
US4712231A (en) * 1984-04-06 1987-12-08 Shure Brothers, Inc. Teleconference system
US4696043A (en) * 1984-08-24 1987-09-22 Victor Company Of Japan, Ltd. Microphone apparatus having a variable directivity pattern
US4658425A (en) * 1985-04-19 1987-04-14 Shure Brothers, Inc. Microphone actuation control system suitable for teleconference systems
US4815132A (en) * 1985-08-30 1989-03-21 Kabushiki Kaisha Toshiba Stereophonic voice signal transmission system
CA1236607A (en) * 1985-09-23 1988-05-10 Northern Telecom Limited Microphone arrangement
US4653102A (en) * 1985-11-05 1987-03-24 Position Orientation Systems Directional microphone system
US4860366A (en) * 1986-07-31 1989-08-22 Nec Corporation Teleconference system using expanders for emphasizing a desired signal with respect to undesired signals
US4741038A (en) * 1986-09-26 1988-04-26 American Telephone And Telegraph Company, At&T Bell Laboratories Sound location arrangement
NL8701633A (nl) * 1987-07-10 1989-02-01 Philips Nv Digitale echocompensator.
US5121426A (en) * 1989-12-22 1992-06-09 At&T Bell Laboratories Loudspeaking telephone station including directional microphone
AT407815B (de) * 1990-07-13 2001-06-25 Viennatone Gmbh Hörgerät
JPH05191887A (ja) * 1992-01-16 1993-07-30 Matsushita Electric Ind Co Ltd サラウンドマイクロホンシステム

Also Published As

Publication number Publication date
US5664021A (en) 1997-09-02
US5787183A (en) 1998-07-28
EP0723733B1 (de) 2005-12-07
EP0723733A1 (de) 1996-07-31
JP3321170B2 (ja) 2002-09-03
JPH09505699A (ja) 1997-06-03
DE69434568D1 (de) 2006-01-12
WO1995010164A1 (en) 1995-04-13
EP0723733A4 (de) 1997-11-05

Similar Documents

Publication Publication Date Title
DE69434568T2 (de) Mikrofonsystem für telekonferenzsystem
EP1977626B1 (de) Verfahren zur aufnahme einer tonquelle mit zeitlich variabler richtcharakteristik und zur wiedergabe
DE60125553T2 (de) Verfahren zur interferenzunterdrückung
DE2910117C2 (de) Lautsprecherkombination zur Wiedergabe eines zwei- oder mehrkanalig übertragenen Schallereignisses
DE102019129330A1 (de) Konferenzsystem mit einem Mikrofonarray-System und Verfahren zur Spracherfassung in einem Konferenzsystem
DE69726262T2 (de) Tonaufnahme- und -wiedergabesysteme
DE60036958T2 (de) Verfahren und vorrichtung zur ausrichtung von schall mit einer gruppe von emissionswandlern
DE10351793B4 (de) Adaptive Filtervorrichtung und Verfahren zum Verarbeiten eines akustischen Eingangssignals
DE2720984C3 (de) Elektrische Anordnung für die Steigerung des Raumeffekts bei einer Tonwiedergabe
DE69637203T2 (de) Mikrofonauswahlverfahren zur Anwendung in einem sprachgesteuerten Mehrmikrofonvermittlungssystem
DE4328620C1 (de) Verfahren zur Simulation eines Raum- und/oder Klangeindrucks
EP1251493B1 (de) Verfahren zur Geräuschreduktion mit selbststeuernder Störfrequenz
DE69933659T2 (de) Verfahren und system zur räumlichen kodierung mit niedriger bitrate
DE69908463T2 (de) Verfahren und Einrichtung zur mehrkanaligen Kompensation eines akustischen Echos
DE69738195T2 (de) Verfahren und vorrichtung zur ortung einer akustischen quelle
AT410597B (de) Verfahren, computersystem und computerprodukt zur messung akustischer raumeigenschaften
EP0641477A1 (de) Verbesserungen in einem breitband-nachhallsystem
DE4241130B4 (de) Verfahren und Vorrichtung zur Wiedergabe von vierkanaligen Tonsignalen über einen Zweikanalkopfhörer bzw. über zwei Lautsprecher
DE1812596B2 (de) Lautsprechersystem für Stereoübertragung in geschlossenen Räumen
DE102008004674A1 (de) Signalaufnahme mit variabler Richtcharakteristik
DE19911507A1 (de) Verfahren zur Verbesserung dreidimensionaler Klangwiedergabe
DE69817461T2 (de) Verfahren und Vorrichtung zur optimierten Verarbeitung eines Störsignals während einer Tonaufnahme
DE102020117299A1 (de) Mikrofonarray, Konferenzsystem mit Mikrofonarray und Verfahren zur Steuerung eines Mikrofonarrays
DE3003668C2 (de) Beschallungsanlage für künstlichen Nachhall
DE3512155C2 (de)

Legal Events

Date Code Title Description
8364 No opposition during term of opposition