DE102018207530A1 - Vorrichtung und Verfahren für Verbesserung der Privatsphäre - Google Patents

Vorrichtung und Verfahren für Verbesserung der Privatsphäre Download PDF

Info

Publication number
DE102018207530A1
DE102018207530A1 DE102018207530.1A DE102018207530A DE102018207530A1 DE 102018207530 A1 DE102018207530 A1 DE 102018207530A1 DE 102018207530 A DE102018207530 A DE 102018207530A DE 102018207530 A1 DE102018207530 A1 DE 102018207530A1
Authority
DE
Germany
Prior art keywords
audio
signal
masking signal
time domain
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102018207530.1A
Other languages
English (en)
Inventor
Luke Redfern
Kudzayi Chiwoko
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jaguar Land Rover Ltd
Original Assignee
Jaguar Land Rover Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jaguar Land Rover Ltd filed Critical Jaguar Land Rover Ltd
Publication of DE102018207530A1 publication Critical patent/DE102018207530A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/1752Masking
    • G10K11/1754Speech masking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/10Applications
    • G10K2210/128Vehicles
    • G10K2210/1282Automobiles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/30Means
    • G10K2210/301Computational

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

Offenbart wird ein Verfahren zum Erzeugen eines Audiomaskierungssignals, Folgendes umfassend: Empfangen eines Eingangsaudiosignals, Bestimmen des Frequenzdomänenspektrums des Eingangsaudiosignals und Erzeugen eines Audiomaskierungssignals für das Audiosignal. Das Audiomaskierungssignal wird erzeugt aus Komponenten, die Folgende umfassen: i) eine Nominalkomponente mit einem Frequenzdomänenspektrum, dessen Frequenzbandamplituden proportional zu entsprechenden Frequenzbandamplituden des Frequenzdomänenspektrums des Eingangsaudiosignals sind, und ii) eine Abklingvorspannungskomponente, die die Rate wenigstens einiger Verringerungen der Zeitdomänenamplitude des Audiomaskierungssignals verringert, wobei diese Verringerungen im Laufe der Zeit im Einklang mit der Nominalkomponente erzeugt werden.

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Offenbarung bezieht sich auf eine Vorrichtung und ein Verfahren zur Verbesserung der Privatsphäre. Aspekte der Erfindung beziehen sich auf ein Verfahren zum Erzeugen eines Audiomaskierungssignals, ein System, ein Fahrzeug, ein Steuergerät, ein Computerprogramm, ein nichtflüchtiges computerlesbares Speichermedium und ein Signal, das computerlesbare Anweisungen umfasst.
  • STAND DER TECHNIK
  • Der Einfachheit halber ist der folgende Stand der Technik mit Bezug auf Fahrzeuginsassen bereitgestellt. Dies ist allerdings nicht einschränkend zu verstehen und es wird darauf hingewiesen, dass weitere Beispiele aus anderen Bereichen dargelegt werden können, in denen das Erreichen einer Privatsphäre wünschenswert, aber schwierig zu erzielen ist (z. B. ein gemeinsam genutzter Arbeits- oder sozialer Raum). Ferner wird darauf hingewiesen, dass die in dieser Anmeldung dargelegten Offenbarungen in diesen alternativen Bereichen ebenso anwendbar sind.
  • In manchen Fällen ist es wünschenswert, Privatsphäre zwischen den Insassen eines Fahrzeugs bereitzustellen. Wenn zum Beispiel ein Insasse eines Fahrzeugs einen Telefonanruf tätigen möchte, bevorzugt zum Beispiel wenigstens dieser Insasse, dass der Anruf privat ausgeführt wird. Selbst wenn der Insasse den Anruf mit einem Kopfhörer oder einer ähnlichen Vorrichtung tätigt, ist seine Sprache möglicherweise weiterhin für die anderen Insassen des Fahrzeugs hörbar. Physische Barrieren in Fahrzeugen, wie etwa zwischen den Insassen auf den Vordersitzen und denen auf den Rücksitzen des Fahrzeugs, sind bekannt. Diese sind aber störend und trennen die Insassen wenigstens teilweise dauerhaft, selbst wenn die Barriere teilweise entfernt, zum Beispiel abgesenkt, werden kann. Alternativ dazu kann eine Lautstärke einer Audioausgabe von einem Fahrzeugunterhaltungssystem angehoben werden, um die Sprache zu überdecken, aber dies ist möglicherweise für den Insassen, der den Anruf tätigt, und für die anderen Insassen nicht wünschenswert.
  • Es ist eine Aufgabe von Ausführungsformen der Erfindung, ein oder mehrere Probleme des Standes der Technik wenigstens abzuschwächen.
  • KURZDARSTELLUNG DER ERFINDUNG
  • Aspekte und Ausführungsformen der Erfindung stellen Folgendes bereit: ein Verfahren zum Erzeugen eines Audiomaskierungssignals, ein System, ein Fahrzeug, ein Steuergerät, ein Computerprogramm, ein nichtflüchtiges computerlesbares Speichermedium und ein Signal, das computerlesbare Anweisungen umfasst, wie in den angehängten Patentansprüchen beansprucht.
  • Nach einem Aspekt der Erfindung wird ein Verfahren zum Erzeugen eines Audiomaskierungssignals bereitgestellt, wobei das Verfahren Folgendes umfasst:
    • Empfangen eines Eingangsaudiosignals;
    • Bestimmen des Frequenzdomänenspektrums des Eingangsaudiosignals; und
    • Erzeugen eines Audiomaskierungssignals für das Eingangsaudiosignal,
    • wobei das Audiomaskierungssignal aus Komponenten erzeugt wird, die Folgende umfassen:
      1. i) eine Nominalkomponente mit einem Frequenzdomänenspektrum, das proportional zu dem Frequenzdomänenspektrum des Eingangsaudiosignals ist, und
      2. ii) eine Abklingvorspannungskomponente, die die Rate einer oder mehrerer Verringerungen der Zeitdomänenamplitude des Audiomaskierungssignals verringert.
  • Nach einem weiteren Aspekt der Erfindung wird ein Verfahren zum Erzeugen eines Audiomaskierungssignals bereitgestellt, wobei das Verfahren Folgendes umfasst:
    • Empfangen eines Eingangsaudiosignals;
    • Bestimmen des Frequenzdomänenspektrums des Eingangsaudiosignals; und
    • Erzeugen eines Audiomaskierungssignals für das Eingangsaudiosignal,
    • wobei das Audiomaskierungssignal aus Komponenten erzeugt wird, die Folgende umfassen:
      1. i) eine Nominalkomponente mit einem Frequenzdomänenspektrum mit Frequenzbandamplituden proportional zu entsprechenden Frequenzbandamplituden des Frequenzdomänenspektrums des Eingangsaudiosignals, und
      2. ii) eine Abklingvorspannungskomponente, die die Rate einer oder mehrerer Verringerungen der Zeitdomänenamplitude des Audiomaskierungssignals verringert.
  • Der Beitrag der Nominalkomponente bedeutet möglicherweise, dass das Audiomaskierungssignal im Wesentlichen im Laufe der Zeit dem Eingangsaudiosignal folgt und insbesondere jegliche Anstiege in dessen Zeitdomänenamplitude widerspiegelt. Dies bedeutet möglicherweise, dass das Audiomaskierungssignal das Eingangsaudiosignal wirksam maskieren kann. Die Abklingvorspannungskomponente kann die Nominalkomponente wirksam einstellen, um ihre darauffolgende Reaktion auf Verringerungen in der Zeitdomänenamplitude des Eingangsaudiosignals einzuschränken. Dies bedeutet möglicherweise, dass sich im Einklang mit dem Audiomaskierungssignal erzeugtes maskiertes Audio für einen Zuhörer weicher und angenehmer anhört und es erscheinen kann, dass es natürliche Klänge, wie etwa Meeresrauschen, imitiert. Ferner bedeutet ein langsameres Abschwächen des Audiomaskierungssignals (wie etwa durch die Abklingvorspannungskomponente bereitgestellt), dass es begrenzte darauffolgende Anstiege in der Zeitdomänenamplitude des Eingangsaudiosignals wirksam maskieren kann, mit nur geringen oder keinen Unterbrechungen des weichen Abklingens in der Zeitdomänenamplitude des Maskierungssignals.
  • In manchen Ausführungsformen verringert die Abklingvorspannungskomponente die Rate einer oder mehrerer Verringerungen der Zeitdomänenamplitude des Audiomaskierungssignals mit Bezug auf entsprechende Verringerungen, die im Einklang mit der Nominalkomponente erzeugt worden wären.
  • In manchen Ausführungsformen umfasst das Verfahren das Einschränken der Rate der Zeitdomänenamplitudenverringerung auf eine vorgegebene maximale Steigung in Abhängigkeit der Abklingvorspannungskomponente. Es wird darauf hingewiesen, dass diese vorgegebene maximale Steigung auf alle Verringerungen in der Zeitdomänenamplitude des Maskierungssignals oder alternativ nur auf Verringerungen von Amplituden über einem Schwellenwert angewandt werden könnte.
  • In manchen Ausführungsformen kann, wenn die maximale Steigung einmal erreicht ist, eine Verringerung mit dieser Steigung beibehalten werden, sofern kein Aufhebungskriterium erfüllt ist und bis dies der Fall ist. Eines oder mehrere der folgenden Aufhebungskriterien können eingesetzt werden:
    1. i) die Verringerung der Zeitdomänenamplitude des Audiomaskierungssignals, so wie dies im Einklang mit der Nominalkomponente erzeugt werden würde, fällt unter die vorgegebene maximale Steigung;
    2. ii) die Zeitdomänenamplitude des Audiomaskierungssignals übersteigt einen Mindestamplitudendifferenzschwellenwert mit Bezug auf das Zeitdomänenspektrum des Eingangsaudiosignals;
    3. iii) die Zeitdomänenamplitude des Audiomaskierungssignals wird im Wesentlichen auf null verringert.
  • Eine zuverlässige und stetige Verringerung kann weicher erscheinen und natürliche Klänge, wie etwa Meeresrauschen, besser imitieren. Ferner bedeutet ein derartiges stetiges Verringern möglicherweise, dass darauffolgende Anstiege in der Zeitdomänenamplitude des Eingangsaudiosignals maskiert werden können, wobei ein Anstieg in der Zeitdomänenamplitude des Audiomaskierungssignals nicht erforderlich ist oder schwächer auftritt. Dies kann zum Beispiel bedeuten, dass der Rest einer Phrase oder eines Satzes, die/der das Audiosignal ausmacht, ohne erkennbare abrupte Anstiege und/oder Verringerungen im Audiomaskierungssignal maskiert wird.
  • In manchen Ausführungsformen ist die vorgegebene maximale Steigung derart ausgewählt, dass eine entsprechende Verringerung der Zeitdomänenamplitude im Einklang mit der maximalen Steigung über einen Zeitraum stattfindet, der im Wesentlichen einer erwarteten Periodizität der Zeitdomänenamplitude des Eingangsaudiosignals entspricht. Wenn zum Beispiel erwartet wird, dass es sich bei dem Eingangsaudiosignal um gesprochene Konversation handelt, kann die vorgegebene maximale Steigung im Einklang mit einer durchschnittlichen oder angenäherten durchschnittlichen Phrasen- oder Satzlänge mit Bezug auf die Länge während einer gesprochenen Konversation ausgewählt sein.
  • In manchen Ausführungsformen beträgt die vorgegebene maximale Steigung der Rate der Zeitdomänenamplitudenverringerung zwischen 20 dBs-1 und 40 dBs-1. In manchen Ausführungsformen beträgt die vorgegebene maximale Steigung zwischen 25 dBs-1 und 35 dBs-1. In manchen Ausführungsformen beträgt die vorgegebene maximale Steigung im Wesentlichen 30 dBs-1.
  • In manchen Ausführungsformen ist ein proportionales Verhältnis zwischen der Nominalkomponente und dem Eingangsaudiosignal derart definiert, dass die entsprechenden Frequenzen in der Frequenzdomäne der Nominalkomponente eine höhere Amplitude aufweisen als das Eingangsaudiosignal. Dies kann die Wirksamkeit des Maskierens des Audiosignals erhöhen. Ferner kann dies die Wahrscheinlichkeit erhöhen, dass die vorgegebene maximale Steigung im Laufe von darauffolgenden Anstiegen in der Zeitdomänenamplitude des Eingangsaudiosignals beibehalten werden kann. Diese Anstiege können zum Beispiel zusätzlichen gesprochenen Worten beim Abschließen einer Phrase oder eines Satzes entsprechen.
  • In manchen Ausführungsformen umfasst das Audiomaskierungssignal eine Hintergrundkomponente. Die Hintergrundkomponente kann zum Beispiel zuvor aufgezeichnetes oder computergeneriertes Audio sein. Das Einschließen eines Hintergrundgeräuschs in dem Audiomaskierungssignal kann bedeuten, dass das Audiomaskierungssignal als für einen Benutzer angenehmer wahrgenommen wird. Ferner können hierdurch Änderungen in der Zeitdomänenamplitude anderer Komponenten des Audiomaskierungssignals weniger bemerkbar gemacht werden.
  • In manchen Ausführungsformen umfasst die Hintergrundkomponente ein natürlich auftretendes Geräusch. Diese natürlichen Geräusche sind für einen Benutzer möglicherweise entspannender und angenehmer.
  • In manchen Ausführungsformen umfasst die Hintergrundkomponente den Klang von Meeresrauschen und/oder Vögeln. So kann zum Beispiel die zyklische Natur von Meeresrauschen geeignet sein, mit der Zeitdomänenamplitude der Nominalkomponente vermischt zu werden, wodurch gewissermaßen zyklische Muster in dem Eingangssignal wiedergegeben werden können, wo dies wiederum gesprochene Konversation wiedergibt.
  • In manchen Ausführungsformen ist die Zeitdomänenamplitude der Hintergrundkomponente nicht von dem Eingangsaudiosignal abhängig. Demnach ist die Hintergrundkomponente möglicherweise im Wesentlichen gleichbleibend und nicht mit Anstiegen und Verringerungen in der Zeitdomänenamplitude des Eingangsaudiosignals verknüpft. Dies bedeutet möglicherweise, dass ein Benutzer eine Verringerung der Amplitudendifferenz zwischen Audiomaskierungssignalspitzen und -tälern und/oder eine höhere Konsistenz in Audiomaskierungssignalmustern erfährt. Nichtsdestotrotz wird darauf hingewiesen, dass die Zeitdomänenamplitude der Hintergrundkomponente dennoch im Laufe der Zeit variiert (z. B. wie bei der zyklischen Natur des Meeresrauschens).
  • In manchen Ausführungsformen wird das Audiomaskierungssignal aus einer Anstiegsvorspannungskomponente erzeugt, welche die Rate eines oder mehrerer Anstiege in der Zeitdomänenamplitude des Maskierungssignals mit Bezug auf entsprechende Anstiege einschränkt, die im Einklang mit der Nominalkomponente erzeugt worden wären. Dies kann zum Beispiel erzielt werden, indem die Reaktion auf das Eingangsaudiosignal verzögert wird. Die Anstiegsvorspannungskomponente kann dazu neigen, abrupte Audiomerkmalanfänge innerhalb des Audiomaskierungssignals zu maskieren, die möglicherweise für die Benutzererfahrung unerwünscht sind.
  • In manchen Ausführungsformen ist die Rate des Anstiegs in der Zeitdomänenamplitude des Maskierungssignals mit Bezug auf die Anstiegsvorspannungskomponente auf ein Maximum von zwischen 100 dBs-1 und 140 dBs-1 eingeschränkt. In manchen Ausführungsformen liegt das Maximum zwischen 110 dBs-1 und 130 dbs-1. In manchen Ausführungsformen beträgt das Maximum im Wesentlichen 120 dBs-1.
  • In manchen Ausführungsformen wird das Audiomaskierungssignal aus einer Niederfrequenz-Verstärkungskomponente erzeugt, welche die Frequenzdomänenamplitude eines Abschnitts des Frequenzdomänenspektrums des Audiomaskierungssignals verstärkt, der unter einer Schwellenwertfrequenz liegt, durch Vergleichen mit den Amplituden, die nach der Nominalkomponente erzeugt worden wären. Das Steigern der Amplitude von niedrigeren Frequenzen kann bedeuten, dass das Audiomaskierungssignal bestimmte natürliche Klänge (z. B. Wellen) besser nachahmt und es kann demnach als entspannender wahrgenommen werden und/oder kann sich besser mit einer beliebigen verwendeten Hintergrundkomponente mischen.
  • In manchen Ausführungsformen ist das Frequenzdomänenspektrum des Maskierungssignals geglättet. Dies kann zum Beispiel dadurch erzielt werden, dass die Amplituden der Frequenzbänder eingestellt werden, sodass die Amplitudendifferenz zwischen nebeneinanderliegenden Frequenzbändern des Maskierungssignals ein ausgewähltes Maximum nicht übersteigt. Starke Spitzen und Täler in diesem Spektrum können für einen Benutzer unnatürlich klingen.
  • In manchen Ausführungsformen ist das Frequenzdomänenspektrum des Maskierungssignals dadurch geglättet, dass eine Spur, die dem Frequenzdomänenspektrum des Maskierungssignals entspricht, und eine Spur, die dem Frequenzdomänenspektrum des Eingangsaudiosignals entspricht, als ein physisches System modelliert werden. In diesen Ausführungsformen kann das Modell mehrere Knotenpaare umfassen, wobei jedes Paar einen Knoten auf einer Spur und einen Knoten bei einer entsprechenden Frequenz auf der anderen Spur umfasst. Die Knoten können als mit Federn verbunden modelliert werden. In manchen Ausführungsformen sind die Knoten der Spur des Frequenzdomänenspektrums des Maskierungssignals als Massen modelliert, die durch die daran befestigte Feder mit Bezug auf die Frequenzdomänenspektrumspur des Eingangsaudiosignals vorgespannt ist. Die Frequenzdomänenspektrumspur des Audiomaskierungssignals ist derart modelliert, dass sie wenigstens einen Flexibilitätsgrad aufweist, der sich unter dem Einfluss der Federn im Einklang mit den Massenpositionen bewegt. Eine oder mehrere verschiedene andere Kräfte, die auf das physische System einwirken, können ebenfalls modelliert werden, z. B. eine Gravitationskraft, eine Trägheitskraft, eine Reibungskraft und eine Spektrumflexkraft für die Spur des Frequenzdomänenspektrums des Maskierungssignals. Es wird darauf hingewiesen, dass der Betrag einer jeden modellierten Kraft angepasst sein kann, um eine erwünschte Glättungswirkung zu erzielen. Die Spektrumflexkraft kann zum Beispiel verändert werden, um die Starrheit der Spur des Frequenzdomänenspektrums des Audiomaskierungssignals zwischen und/oder an den Knoten zu variieren.
  • In manchen Ausführungsformen ist das Zeitdomänenspektrum des Maskierungssignals geglättet. Dies kann dadurch erzielt werden, dass ein Zeitdomänenspektrum des Maskierungssignals derart verändert wird, dass die Rate der Amplitudenänderung unter einem maximalen Schwellenwert gehalten wird. Dies kann schnelle Änderungen der Steigung verringern, die ansonsten zu einem Stottereffekt in der Benutzererfahrung führen können.
  • In manchen Ausführungsformen umfasst das Verfahren das Abtasten des Eingangsaudiosignals mit einer Abtastrate von wenigstens 20 Hz. Dies kann das Ansprechen und das Maskieren im Vergleich zu alternativen langsameren Abtastsystemen verbessern.
  • In manchen Ausführungsformen umfasst das Verfahren das Ausgeben des Audiomaskierungssignals über eine oder mehrere Audioausgabevorrichtungen.
  • In manchen Ausführungsformen umfasst das Eingangsaudiosignal ein Signal, das auf Sprache hindeutet.
  • Nach einem weiteren erfindungsgemäßen Aspekt wird ein Audiomaskierungssystem bereitgestellt, das Folgendes umfasst:
    • wenigstens einen Prozessor;
    • wenigstens einen Speicher, der computerlesbare Anweisungen umfasst;
    • wobei der wenigstens eine Prozessor konfiguriert ist, die computerlesbaren Anweisungen zu lesen, um das Ausführen des Verfahrens nach einem der vorhergehenden Aspekte zu bewirken.
  • In manchen Ausführungsformen umfasst das Audiomaskierungssystem eine oder mehrere Audioausgabevorrichtungen, konfiguriert, das erzeugte Audiomaskierungssignal auszugeben.
  • In manchen Ausführungsformen umfasst das Audiomaskierungssystem eine oder mehrere Audioerfassungsvorrichtungen, konfiguriert, das Eingangsaudiosignal zu erfassen.
  • Nach noch einem weiteren erfindungsgemäßen Aspekt wird ein Fahrzeug bereitgestellt, das ein Audiomaskierungssystem nach dem vorangehenden Aspekt umfasst. Das Fahrzeug kann ein Straßenfahrzeug und/oder ein Passagierfahrzeug und/oder ein Auto und/oder eine Limousine umfassen.
  • In manchen Ausführungsformen sind die eine oder die mehreren Audioausgabevorrichtungen in einer ersten Zone (optional einem Insassenbereich) des Fahrzeugs bereitgestellt und die eine oder die mehreren Audioerfassungsvorrichtungen sind in einer zweiten Zone (optional einem anderen Insassenbereich) des Fahrzeugs bereitgestellt.
  • Nach noch einem weiteren erfindungsgemäßen Aspekt wird ein Steuergerät zum Erzeugen eines Audiomaskierungssignals bereitgestellt, wobei das Steuergerät Folgendes umfasst:
    • einen Eingang zum Empfangen eines Eingangsaudiosignals;
    • ein Verarbeitungsmittel zum:
      • Bestimmen des Frequenzdomänenspektrums des Eingangsaudiosignals; und
      • Erzeugen eines Audiomaskierungssignals für das Eingangsaudiosignal; und einen Ausgang zum Ausgeben des Audiomaskierungssignals;
    • wobei das Verarbeitungsmittel konfiguriert ist zum Erzeugen des Audiomaskierungssignals aus Komponenten, die Folgende umfassen:
      1. i) eine Nominalkomponente mit einem Frequenzdomänenspektrum mit Frequenzbandamplituden proportional zu entsprechenden Frequenzbandamplituden des Frequenzdomänenspektrums des Eingangsaudiosignals, und
      2. ii) eine Abklingvorspannungskomponente, die die Rate einer oder mehrerer Verringerungen der Zeitdomänenamplitude des Audiomaskierungssignals verringert.
  • In manchen Ausführungsformen verringert die Abklingvorspannungskomponente die Rate einer oder mehrerer Verringerungen der Zeitdomänenamplitude des Audiomaskierungssignals mit Bezug auf entsprechende Verringerungen, die im Einklang mit der Nominalkomponente erzeugt worden wären.
  • Nach noch einem weiteren Aspekt der Erfindung wird ein Computerprogramm bereitgestellt, das, wenn durch einen Computer ausgelesen, das Ausführen des Verfahrens nach einem der ersten zwei Aspekte bewirkt.
  • Nach noch einem weiteren Aspekt der Erfindung wird ein nichtflüchtiges computerlesbares Speichermedium bereitgestellt, das computerlesbare Anweisungen umfasst, die, wenn durch einen Computer ausgelesen, das Ausführen des Verfahrens nach einem der ersten zwei Aspekte bewirken.
  • Nach noch einem weiteren Aspekt der Erfindung wird ein Signal bereitgestellt, das computerlesbare Anweisungen umfasst, die, wenn durch einen Computer ausgelesen, das Ausführen des Verfahrens nach einem der ersten zwei Aspekte bewirken.
  • Innerhalb des Umfangs dieser Anmeldung wird ausdrücklich beabsichtigt, dass die verschiedenen Aspekte, Ausführungsformen, Beispiele und Alternativen, die in den vorhergehenden Absätzen, in den Ansprüchen und/oder in der folgenden Beschreibung und den Zeichnungen dargestellt werden, und insbesondere deren individuelle Merkmale, unabhängig voneinander oder in einer beliebigen Kombination berücksichtigt werden können. Dies bedeutet, dass alle Ausführungsformen und/oder Merkmale einer beliebigen Ausführungsform auf beliebige Weise und/oder in beliebiger Kombination kombiniert werden können, sofern diese Merkmale nicht inkompatibel sind. Der Anmelder behält sich das Recht vor, jeden beliebigen ursprünglich eingereichten Patentanspruch zu ändern oder jeden neuen Patentanspruch entsprechend einzureichen, einschließlich des Rechts, jeden beliebigen ursprünglich eingereichten Patentanspruch zu verändern, um von einem beliebigen Merkmal eines beliebigen anderen Anspruchs abzuhängen und/oder dieses zu integrieren, obwohl es auf diese Art und Weise zuvor nicht beansprucht wurde.
  • Figurenliste
  • Eine oder mehrere erfindungsgemäße Ausführungsformen werden nun ausschließlich beispielhaft unter Bezugnahme auf die beiliegenden Zeichnungen beschrieben, hierbei zeigen:
    • 1 eine schematische Ansicht eines Fahrzeugs, das Teil eines Audiomaskierungssystems nach einer erfindungsgemäßen Ausführungsform ausbildet;
    • 2 eine schematische Ansicht eines Audiomaskierungssystems nach einer erfindungsgemäßen Ausführungsform;
    • 3 einen Zeitdomänengraphen für einen Audiosignaleingang (Sprache) und ein grundlegendes Audiomaskierungssignal;
    • 4 einen Frequenzdomänengraphen für einen Audiosignaleingang (Sprache) und eine Nominalkomponente für ein Audiomaskierungssignal nach einer erfindungsgemäßen Ausführungsform;
    • 5 einen Zeitdomänengraphen für einen Audiosignaleingang (Sprache) und ein Audiomaskierungssignal nach einer erfindungsgemäßen Ausführungsform;
    • 6 einen Frequenzdomänengraphen für einen Audiosignaleingang (Sprache) und eine geglättete Version einer Nominalkomponente für ein Audiomaskierungssignal nach einer erfindungsgemäßen Ausführungsform;
    • 7 eine graphische Darstellung eines Modells zum Glätten einer Frequenzdomänen-Nominalkomponente für ein Audiomaskierungssignal nach einer erfindungsgemäßen Ausführungsform;
    • 8 ein Schema von Kräften eines Modells zum Glätten einer Frequenzdomänen-Nominalkomponente für ein Audiomaskierungssignal nach einer erfindungsgemäßen Ausführungsform; und
    • 9 eine Reihe von Verfahrensschritten nach einer erfindungsgemäßen Ausführungsform.
  • DETAILLIERTE BESCHREIBUNG
  • 1 zeigt schematisch ein Fahrzeug 100 nach einer erfindungsgemäßen Ausführungsform. The Fahrzeug 100 umfasst mehrere Sitzpositionen 120, 140, 160, 180. Vier Sitzpositionen sind in einer Anordnung von zwei mal zwei dargestellt, es wird allerdings darauf hingewiesen, dass dies nur ein Beispiel ist und dass andere Anzahlen von Sitzpositionen, wie etwa fünf Sitzpositionen sowie solche in anderen Anordnungen, denkbar sind. Jede Sitzposition 120, 140, 160, 180 ist mit einem entsprechenden Sitz für einen Insassen des Fahrzeugs 100 verknüpft.
  • Der erste und der zweite Sitz 120, 140 sind Vordersitze des Fahrzeugs 100, während der dritte und der vierte Sitz 160, 180 Rücksitze des Fahrzeugs 100 sind. Der zweite und der dritte Sitz 140, 160 sind als mit einer entsprechenden Zone 110, 150 des Fahrzeugs verknüpft dargestellt, die als eine Infotainmentzone oder ein Insassenbereich benannt sein kann. Jede Zone des Fahrzeugs kann eine Teilmenge oder ein Abschnitt des Inneren des Fahrzeugs 100 sein. Es ist erwünscht, dass Audioinhalte in einer Zone in dieser Zone isoliert oder eingeschlossen sind. Insbesondere ist erwünscht, dass verhindert wird, dass der in einer Zone 150 bereitgestellte Audioinhalt in einer anderen Zone 110 verständlich ist.
  • Wie in 1 dargestellt, umfasst das Fahrzeug 100 zwei Zonen, diese sind eine erste Zone 110 und eine zweite Zone 150. Das Fahrzeug 100 kann andere Anzahlen von Zonen umfassen, wie etwa drei oder vier Zonen. Allerdings wird eine Beschreibung als ein Beispiel unter Bezugnahme auf die zwei dargestellten Zonen bereitgestellt, wenngleich die Erfindung in dieser Hinsicht nicht eingeschränkt ist. Die erste Zone 110 ist mit einem Insassen in einem Vordersitz des Fahrzeugs 100 verknüpft, der ein Fahrer des Fahrzeugs 100 in einer rechtsgelenkten Konfiguration des Fahrzeugs 100 sein kann. Die zweite Zone 150 ist mit einem Insassen in einem Rücksitz des Fahrzeugs 100 verknüpft, hiernach bezeichnet als ein Passagier. In einem Beispiel, in dem das Fahrzeug 100 von einem Fahrer, wie zum Beispiel einem Chauffeur gefahren wird, kann der Rücksitz-Insasse (eingehende und ausgehende) Anrufe tätigen, während er im Fahrzeug 100 reist, wenngleich die Erfindung in dieser Hinsicht nicht eingeschränkt ist. Der Passagier kann die Anrufe entweder über ein in der Hand gehaltenes Handgerät oder über ein Autofreisprechsystem des Fahrzeugs 100 entgegennehmen, wie erklärt werden wird. Es ist wünschenswert, dass wenigstens die Sprache des Passagiers für den Fahrer des Fahrzeugs 100 unverständlich ist. Es ist möglicherweise ferner wünschenswert, zu verhindern, dass die Sprache einer anderen Person, die nicht im Fahrzeug 100 ist, für den Fahrer verständlich ist. Wenngleich erfindungsgemäße Ausführungsformen mit Bezug auf den Passagier und den Fahrer des Fahrzeugs beschrieben werden, wird darauf hingewiesen, dass die Lehre der Erfindung zwischen zwei beliebigen Insassen des Fahrzeugs in verschiedenen Zonen angewandt werden kann. Ferner ist es wünschenswert, zu verhindern, dass Sprache zwischen Insassen verschiedener Zonen 110, 150 ohne eine physische Barriere oder ohne das Erzeugen von übermäßigem Lärm im Fahrzeug nicht verständlich ist.
  • Die erste Zone 110 ist mit Audioausgabevorrichtungen 146, 147 verknüpft. Die zweite Zone ist mit Audioausgabevorrichtungen 166, 167 verknüpft. Die Audioausgabevorrichtungen 146, 147, 166, 167 sind angeordnet, Audio vorwiegend an einen Insassen in jeder jeweiligen Zone 110, 150 auszugeben. Die Audioausgabevorrichtungen 146, 147 der ersten Zone 110 sind angeordnet, im Gebrauch anderes Audio auszugeben als die Audioausgabevorrichtungen 166, 167 der zweiten Zone 150. In manchen Ausführungsformen sind die Audioausgabevorrichtungen 146, 147, 166, 167 in einer Kopfstütze eines jeden Sitzes 140, 160 angeordnet, um Audio direkt hin zu den Ohren des Insassen des Sitzes auszugeben, wodurch die Audioisolierung jeder Zone 110, 150 unterstützt wird. Allerdings sind auch andere Einbauorte für die Audioausgabemittel 146, 147, 166, 167 vorgesehen, wie zum Beispiel innerhalb des Sitzkörpers oder hinter der Innenverkleidung des Fahrzeugs 100. Es wird darauf hingewiesen, dass die Audioausgabevorrichtungen 146, 147, 166, 167 jeweils ein Lautsprecher zum Ausgeben von hörbarem Audio auf der Grundlage von empfangenen elektrischen Signalen sein können.
  • In manchen Ausführungsformen ist die erste Zone 110 ist mit einer Audioerfassungsvorrichtung 130 verknüpft. Die Audioerfassungsvorrichtung 130 ist bereitgestellt zum Ausgeben eines elektrischen Signals, das auf Audio in der ersten Zone 110 hindeutet. Die Audioerfassungsvorrichtung kann ein erstes Mikrofon 130 sein. Das erste Mikrofon kann eingesetzt werden, um hörbare Merkmale der ersten Zone 110 zu bestimmen. In der dargestellten Ausführungsform umfasst die zweite Zone 150 eine Audioerfassungsvorrichtung 170. Die Audioerfassungsvorrichtung 170 ist bereitgestellt zum Ausgeben eines elektrischen Signals, das auf Audio in der zweiten Zone 150 hindeutet. Die Audioerfassungsvorrichtung kann ein zweites Mikrofon 170 sein. Das zweite Mikrofon 170 kann eingesetzt werden, um das Telefongespräch mit dem Passagier in der zweiten Zone 150 zu unterstützen. In manchen Ausführungsformen wird das zweite Mikrofon eingesetzt, um ein oder mehrere Merkmale von Sprache in der zweiten Zone 150 zu bestimmen. Das eine oder die mehreren Merkmale können ein Frequenzprofil und eine Lautstärke der Sprache in der zweiten Zone 150 sein.
  • Das Fahrzeug 100 umfasst ferner einen Prozessor 190. Der Prozessor 190 ist kommunikativ mit den Mikrofonen 130, 170 und den Audioausgabevorrichtungen 146, 147, 166, 167 gekoppelt.
  • 2 zeigt einen Teil eines Audiomaskierungssystems nach einer erfindungsgemäßen Ausführungsform. Das System 200 umfasst den Prozessor 190. Das System 200 ist angeordnet, Sprache innerhalb des Fahrzeugs 100 außerhalb einer oder mehrerer Zonen im Fahrzeug 100 wenigstens teilweise unverständlich zu machen.
  • Der Prozessor 190 ist funktionsfähig, Computersoftwareanweisungen auszuführen, die in einem für den Prozessor 190 zugänglichen Speicher gespeichert sind. Der Prozessor 190 ist kommunikativ mit einem Kommunikationsbus 210 des Fahrzeugs 100 gekoppelt, um Daten mit anderen kommunikativ mit dem Kommunikationsbus 210 gekoppelten Einheiten oder Modulen auszutauschen, d. h. zu senden und/oder zu empfangen. Der Kommunikationsbus 210 kann zum Beispiel durch ein Kommunikationsnetz, wie etwa CAN-Bus, Ethernet oder Flexray implementiert sein, wenngleich auch andere Protokolle denkbar sind.
  • Das System 200 umfasst ferner Audioausgabemittel 146, 147, die mit wenigstens einer Zone verknüpft sind, die in der dargestellten Ausführungsform die Zone 110 ist. Es wird darauf hingewiesen, dass der Prozessor 190 mit Audioausgabemitteln mehr als einer Zone verknüpft sein kann. Der Prozessor 190 ist angeordnet, im Gebrauch zu bewirken, dass die Audioausgabevorrichtungen 146, 147 hörbare Signale ausgeben, die ein oder mehrere Merkmale aufweisen, welche darauf hinzielen, aus der zweiten Zone 150 stammende Sprache wenigstens teilweise unverständlich zu machen. Der Prozessor 190 umfasst eine Ausgabe in der Form einer elektrischen Ausgabe an die Audioausgabevorrichtungen 146, 147, die jeweils Lautsprecher sind.
  • In manchen Ausführungsformen umfasst, wie zuvor angegeben, das System ferner eine zweite Audioerfassungsvorrichtung 170, um ein Signal an den Prozessor 190 auszugeben, das auf hörbare Signale in der zweiten Zone 150 hindeutet. Die zweite Audioerfassungsvorrichtung 170 ist ein in der zweiten Zone 150 angeordnetes Mikrofon. Der Prozessor umfasst ein Eingabemittel, wie etwa einen elektrischen Eingang, zum Empfangen eines elektrischen Signals von dem zweiten Mikrofon 170.
  • Das System umfasst ferner einen Rauschgenerator 250 zum Bereitstellen eines Rauschsignals 205 an den Prozessor 190. Das Rauschsignal 205 kann zum Beispiel ein Brownsches, ein weißes oder ein rosa Rauschsignal umfassen. Der Rauschgenerator 250 ist über einen elektrischen Eingang zum Empfangen des Rauschsignals mit dem Prozessor 190 gekoppelt. In anderen Ausführungsformen kann das Rauschsignal 205 Musik aus einem Radio oder aus einer Audiostreamingquelle sein. Der Rauschgenerator 250 kann ein Unterhaltungssystem des Fahrzeugs sein, das in der Lage ist, Radio, digital gestreamte Musik oder Audio (wie etwa Hörbücher) zum Beispiel über das Internet zu empfangen oder gespeichertes Audio, zum Beispiel von einer CD, einer DVD, einer Speichervorrichtung oder einem anderen Speichermedium, wiederzugeben.
  • Unter Bezugnahme auf die 3 bis 8 wird nun die Art und Weise erörtert, mit der das Audiomaskierungssystem 200 aus der zweiten Zone 150 stammende Sprache für einen Insassen der ersten Zone 110 wenigstens teilweise unverständlich macht.
  • Das eingesetzte Grundprinzip ist das der Audiomaskierung. Hierzu gehört das Abspielen von Rauschen, um das Eingangsaudiosignal zu maskieren. Da das Eingangsaudiosignal im Laufe der Zeit variiert, wird das Audiomaskierungssignal ebenfalls passend variiert. Dies führt häufig dazu, dass ein Audiomaskierungssignal erzeugt wird, das eine Zeitdomänenamplitude aufweist, die eine lineare Abhängigkeit von der Zeitdomänenamplitude für ein gleichzeitiges Soundeingangssignal aufweist. Im Laufe der Zeit neigen diese Amplituden dazu, dieselbe Form aufzuweisen (wie in 3 dargestellt). Darüber hinaus kann es in manchen Fällen der Fall sein, dass das Audiomaskierungssignal eine Rauschunterdrückungskomponente aufweist. Hierzu würde ein nahezu gleichzeitiges Wiedergeben einer Reproduktion des Eingangsaudiosignals mit einem Phasenversatz von im Wesentlichen 180° zählen.
  • Nun werden unter Bezugnahme auf 9 Verfahrensschritte erörtert, die ergriffen werden, um aus der zweiten Zone 150 stammende Sprache für einen Insassen der ersten Zone 110 wenigstens zum Teil unverständlich zu machen. In einem Erfassungsschritt 300 wird die Sprache eines Insassen der zweiten Zone 150 durch das zweite Mikrofon 170 erfasst. Die erfasste Sprache wird durch das zweite Mikrofon 170 in ein Eingangsaudiosignal umgewandelt und an den Prozessor 190 gesendet. Der Prozessor 190 führt im Speicher gespeicherte Computersoftwareanweisungen aus, um die folgenden Schritte auszuführen.
  • In einem Analyseschritt 302 analysiert der Prozessor 190 ein Eingangsaudiosignal (von dem eine Zeitdomänenspur 303 als die „Sprach“-Spur in 5 dargestellt ist) um dessen Frequenzdomänenspektrum 304 zu bestimmen. Das Frequenzdomänenspektrum 304 des Eingangsaudiosignals ist in 4 dargestellt. Der Prozessor 190 erzeugt dann ein Audiomaskierungssignal (von dem eine Zeitdomänenspur 306 in 5 dargestellt ist) für das Eingangsaudiosignal aus in der Folge erörterten Komponenten.
  • Eine erste durch den Prozessor 190 erzeugte Komponente in einem Nominalkomponentenerzeugungsschritt 308 ist eine Nominalkomponente. Das Frequenzdomänenspektrum 310 der Nominalkomponente ist in Frequenzbänder eingeteilt und wird derart erzeugt, dass die Amplituden dieser Bänder direkt proportional zu entsprechenden Amplituden des Frequenzdomänenspektrums 304 des Eingangsaudiosignals sind. Genauer gesagt wird im in 4 gezeigten Beispiel die Amplitude jedes Frequenzbands des Frequenzdomänenspektrums 310 der Nominalkomponente erzeugt durch Erhöhen der entsprechenden Frequenzbandamplitude des Frequenzdomänenspektrums 304 des Eingangsaudiosignals um eine Nominalamplitude. Somit weist die Spur des Frequenzdomänenspektrums 310 der Nominalkomponente dieselbe Form auf wie das Frequenzdomänenspektrum 304 des Eingangsaudiosignals, aber in eine höhere Amplitudenordnung versetzt.
  • Eine zweite durch den Prozessor 190 implementierte Komponente beim Erzeugen des Audiomaskierungssignals ist eine Abklingvorspannungskomponente. Die Abklingvorspannungskomponente ist in einem Abklinganwendungsschritt 312 implementiert. Die Abklingvorspannungskomponente begrenzt die Rate von Verringerungen der Zeitdomänenamplitude des Audiomaskierungssignals im Laufe der Zeit. Sie ist auf eine vorgegebene maximale Steigung der Zeitdomänenspur 306 des Audiomaskierungssignals eingestellt. Die Abklingvorspannungskomponente kann demnach als eine Anpassung der Zeitdomänenspur 306 des Audiomaskierungssignals angesehen werden, das ansonsten nach der Nominalkomponente erzeugt worden wäre.
  • Ferner wird, wenn die Abklingvorspannungskomponente aufgerufen wird, um eine Verringerung im Laufe der Zeit in der Zeitdomänenamplitude des Audiomaskierungssignals zu begrenzen, die maximale Verringerungsrate beibehalten, sofern kein Aufhebungskriterium erfüllt ist und bis dies der Fall ist. Demnach ist es die Auswirkung der Abklingvorspannungskomponente, dass, sobald die Nominalkomponente eine Verringerung im Laufe der Zeit in der Zeitdomänenamplitude des Audiomaskierungssignals über das Maximum hinaus bewirken würde, die maximale Verringerungsrate stattdessen aufgerufen und dann beibehalten wird, sofern kein Aufhebungskriterium erfüllt ist und bis dies der Fall ist.
  • Die zugrundeliegende Wirkung der Abklingvorspannungskomponente ist in 5 zu sehen, in der nach einer anfänglichen Spitze 314 in der Zeitdomänenamplitude des Eingangsaudiosignals und einer entsprechenden Spitze 316 in der Zeitdomänenamplitude des Audiomaskierungssignals das Audiomaskierungssignal für einen längeren Zeitraum eine im Wesentlichen gleichbleibende Verringerung im Laufe der Zeit beibehält, trotz einer wesentlichen Änderung der Eingangsaudiosignalamplitude im selben Zeitraum. Die in diesem Zeitraum durch das Audiomaskierungssignal beibehaltene Steigung ist nicht vollständig gleichbleibend, dies liegt aber an der Auswirkung des darauffolgenden Glättens des Signals.
  • In der vorliegenden Ausführungsform liegen zwei Aufhebungskriterien vor, von denen jedes die Standardauswirkungen der Abklingvorspannungskomponente aufhebt, um die maximale Verringerungsrate beizubehalten, wenn diese einmal erreicht ist Das erste Aufhebungskriterium tritt auf, wenn die Zeitdomänenamplitude des Audiomaskierungssignals einen Mindestamplitudendifferenzschwellenwert mit Bezug auf die Zeitdomänenamplitude des Eingangsaudiosignals übersteigt. Dieser Effekt ist in 5 zu sehen. Hier bewirken aufeinanderfolgende Spitzen 320 in der Zeitdomänenamplitude des Eingangsaudiosignals keine Veränderung in der Verringerungsrate der Zeitdomänenamplitude des Audiomaskierungssignals im Laufe der Zeit, da der Mindestamplitudendifferenzschwellenwert nicht überschritten wird. Eine darauffolgende Spitze 322 hebt allerdings das Beibehalten der Verringerungsrate auf, da der Schwellenwert ansonsten überschritten werden würde.
  • Das zweite Aufhebungskriterium tritt auf, wenn die Zeitdomänenamplitude des Maskierungssignals auf null verringert wird. In diesem Fall kann die Verringerung nicht beibehalten werden.
  • Es ist darauf hinzuweisen, dass in anderen Ausführungsformen weitere oder alternative Kriterien eingesetzt werden können. Ein beispielhaftes Kriterium ist, dass die Verringerung der Zeitdomänenamplitude des Audiomaskierungssignals, so wie dies im Einklang mit der Nominalkomponente erzeugt werden würde, unter die vorgegebene maximale Steigung fällt.
  • Die vorgegebene maximale Steigung ist derart ausgewählt, dass eine entsprechende Verringerung der Zeitdomänenamplitude im Einklang mit der maximalen Steigung über einen Zeitraum stattfindet, der im Wesentlichen erwarteter angenäherter Periodizität der Zeitdomänenamplitude des Eingangsaudiosignals entspricht. In diesem Fall entspricht die Periodizität einer erwarteten Satzlänge auf der Grundlage eines angenäherten Durchschnitts für gesprochene Konversation. Somit neigt die Zeitdomänenamplitude des Audiomaskierungssignals dazu, im Laufe eines in dem Eingangsaudiosignal erfassten gesprochenen Satzes und in einer Pause, bevor ein weiterer Satz begonnen wird, verringert zu werden.
  • Es wird darauf hingewiesen, dass das Erzeugen der Nominalkomponente derart, dass ihre Frequenzdomäne in einer höheren Amplitudenordnung vorliegt als die Frequenzdomänenamplitude des Eingangsaudiosignals, ermöglichen kann, dass eine Verringerungsrate im Laufe der Zeit in der Zeitdomänenamplitude des Audiomaskierungssignals (wie durch die Abklingvorspannungskomponente angewiesen) länger beibehalten wird, bevor ein Aufhebungskriterium aufgerufen wird.
  • Eine dritte durch den Prozessor 190 eingebundene Komponente beim Erzeugen des Audiomaskierungssignals ist eine Hintergrundkomponente. Die Hintergrundkomponente wird in einem Hintergrundkomponenteneinbindungsschritt 324 eingebunden. Die Hintergrundkomponente entspricht einem zuvor aufgezeichneten Audio, in diesem Fall Meeresrauschen, wenngleich auch anderes zuvor aufgezeichnetes Audio vorgesehen ist. Die Zeitdomänenamplitude der Hintergrundkomponente ist nicht von dem Eingangsaudiosignal abhängig. Demnach gilt, dass Teile des Audiomaskierungssignals, die der Hintergrundkomponente entsprechen, auf einem gleichbleibenden Pegel (z. B. gleichbleibende Lautstärke/Amplitude) gehalten werden. Allerdings wird darauf hingewiesen, dass das Frequenzdomänenspektrum der Hintergrundkomponente und/oder dessen Zeitdomänenamplitude sich im Laufe der Zeit ändern können (d. h. nach einer natürlichen Variation der Audiokomponenten und dem Pegel des Meeresrauschens).
  • Eine vierte durch den Prozessor 190 implementierte Komponente beim Erzeugen des Audiomaskierungssignals ist eine Anstiegsvorspannungskomponente. Die Anstiegsvorspannungskomponente ist in einem Anstieganwendungsschritt 326 implementiert. Die Anstiegsvorspannungskomponente begrenzt Anstiege der vorgegebenen maximalen Steigung der Zeitdomänenamplitude des Audiomaskierungssignals, so wie dies im Laufe der Zeit im Einklang mit der Nominalkomponente erzeugt werden würde. Die Abklingvorspannungskomponente kann demnach als eine Anpassung der Zeitdomänenspur 306 des Audiomaskierungssignals angesehen werden, das ansonsten nach der Nominalkomponente erzeugt worden wäre. Die zugrundeliegende Wirkung der Anstiegsvorspannungskomponente ist in 5 zu sehen, in der ein Anstieg der Zeitdomänenamplitude des Eingangsaudiosignals im Laufe der Zeit zum Erreichen der anfänglichen Spitze 314 einen geringeren Steigungsanstieg in der Zeitdomänenamplitude des Audiomaskierungssignals erzeugt. Der flachere Anstieg im Audiomaskierungssignal spiegelt die maximale Steigung der Anstiegsvorspannungskomponente wieder, die in der Zeitdomänenspur 303 des Eingangsaudiosignals und der Nominalkomponente überschritten worden ist, sowie die Tatsache, dass die maximale Steigung demnach wieder eingesetzt worden ist. Es wird darauf hingewiesen, dass darauffolgendes Glätten der Zeitdomänenspur des Audiomaskierungssignals für die Variation der Steigung sorgt, selbst wenn die maximale Steigung aufgerufen worden ist.
  • Eine fünfte durch den Prozessor 190 implementierte Komponente beim Erzeugen des Audiomaskierungssignals ist eine Niederfrequenz-Verstärkungskomponente. Die Niederfrequenz-Verstärkungskomponente wird in einem Niederfrequenz-Verstärkungsschritt 328 implementiert. Die Niederfrequenz-Verstärkungskomponente verstärkt die Amplitude eines Abschnitts der Frequenzen im Frequenzdomänenspektrum des Audiomaskierungssignals, die unter einer Schwellenwertfrequenz liegen, durch Vergleichen mit den Amplituden derjenigen Frequenzen, die nach der Nominalkomponente erzeugt worden wären. Die Amplituden dieser Frequenzen können zum Beispiel durch Multiplizieren mit einer Konstante oder mit einem Anstieg oder durch eine andere Verteilung verstärkt werden. Das Steigern der Amplitude von niedrigeren Frequenzen kann bedeuten, dass das Audiomaskierungssignal bestimmte natürliche Klänge (z. B. Meeresrauschen) besser nachahmt und es kann demnach als entspannender wahrgenommen werden und/oder kann sich besser mit einer beliebigen verwendeten Hintergrundkomponente mischen. Allerdings wird darauf hingewiesen, dass in anderen Ausführungsformen die Amplituden einer alternativen Auswahl von Frequenzen erhöht werden können.
  • In einem Spektrumglättungsschritt 330 glättet der Prozessor 190 das Frequenzdomänenspektrum des nach den zuvor erörterten Komponenten erzeugten Maskierungssignals. Ein Beispiel des Frequenzdomänenspektrums 332 des Eingangsaudiosignals und der Frequenzdomänenspur 334 des entsprechenden geglätteten Audiomaskierungssignals ist in 6 dargestellt. Das Glätten kann auf verschiedene Weisen ausgeführt werden.
  • Ein Glättungsverfahren wird nachfolgend unter Bezugnahme auf die 7 und 8 erörtert. In 7 sind ein Frequenzdomänenspektrum (Sprache) 336 eines Eingangsaudiosignals und ein geglättetes Frequenzdomänenspektrum (Maskierung) 338 eines Audiomaskierungssignals dargestellt. Um ein Frequenzdomänenspektrum eines Grundaudiomaskierungssignals zu glätten, wird ein Modell erzeugt, in dem seine Spur und die des Frequenzdomänenspektrums 336 des Eingangsaudiosignals derart modelliert werden, als wären sie an entsprechenden Frequenzbandknoten 340 physisch mit Federn 342 verbunden. Die Knoten im Frequenzdomänenspektrum des Grundaudiomaskierungssignals werden als Massen 343a modelliert und die Federn 342 werden modelliert, als würden sie die Massen 343a mit Bezug auf das Frequenzdomänenspektrum 336 des Eingangsaudiosignals mit einer Federkraft 343b vorspannen. Das Frequenzdomänenspektrum des Grundaudiomaskierungssignals ist derart modelliert, dass es sich mit Bezug auf die Modellierung der Positionen der Massen 343a unter dem Einfluss der Federn 342 und der modellierten Anwendung verschiedener anderer in 8 dargestellter Kräfte frei bewegen kann. Die Spur des Frequenzdomänenspektrums 336 des Eingangsaudiosignals wird wiedergegeben, während sie sich im Laufe der Zeit ändert und sie wird nicht umpositioniert, verzerrt oder anderweitig durch die Federkräfte 343b oder eine der anderen nachfolgend beschriebenen Kräfte beeinflusst.
  • Im vorliegenden Beispiel sind die zusätzlichen Kräfte eine Gravitationskraft 344, eine Trägheitskraft 346, eine Reibungskraft 348 und eine Spektrumflexkraft 350. Die Trägheitskraft 346 modelliert die Trägheit der Massen 343a, während sich ihre Positionen ändern (z. B. durch Anwendung der verschiedenen Kräfte und/oder während sich das Frequenzdomänenspektrum des Eingangsaudiosignals im Laufe der Zeit ändert). Die Reibungskraft 348 modelliert Reibungskräfte an den Massen 343a, während diese ihre Position verändern. Die Spektrumflexkraft 350 modelliert die Steifheit zwischen und/oder an den Knoten 340 der Spur des Frequenzdomänenspektrums des Grundaudiomaskierungssignals. In anderen Ausführungsformen werden möglicherweise nur eine oder manche dieser Kräfte modelliert und/oder zusätzliche alternative Kräfte werden modelliert. Es wird darauf hingewiesen, dass der Betrag einer jeden modellierten Kraft angepasst werden kann, um eine erwünschte Glättungswirkung zu erzielen. Die Spektrumflexkraft 350 kann zum Beispiel verändert werden, um die Starrheit der Spur des Frequenzdomänenspektrums des Grundaudiomaskierungssignals zwischen und/oder an den Knoten 340 zu variieren. Die in 8 dargestellten Richtungen der Federkraft 343b, der Trägheitskraft 346, der Reibungskraft 348 und der Spektrumflexkraft 350 dienen nur der Veranschaulichung. Die Richtung und der Betrag der durch eine Feder 342 auf ihre entsprechende Masse 343a ausgeübten Kraft ist abhängig von dem modellierten Abstand der Masse 343a von der Spur des Frequenzdomänenspektrums 336 des Eingangsaudiosignals zu jedem Zeitpunkt. Auf ähnliche Weise sind die Richtung und der Betrag der Trägheitskraft 346 abhängig von der Richtung und der Geschwindigkeit der Bewegung der Masse 343a zu diesem Zeitpunkt. Die Richtung der durch Reibung aufgebrachten Kraft ist ebenfalls abhängig von der Richtung und der Geschwindigkeit der Bewegung der Masse 343a zu diesem Zeitpunkt. Schließlich sind der Betrag und die Richtung der durch die Spektrumflexkraft auf eine Masse 343a aufgebrachten Kraft abhängig von den Positionen der anderen Massen 343a mit Bezug darauf zu diesem Zeitpunkt.
  • Ein Zeitdomänenglättungsschritt 352 wird durch den Prozessor 190 ausgeführt, der die Zeitdomänenspur des Audiomaskierungssignals 306 glättet.
  • Auf der Grundlage des erzeugten Audiomaskierungssignals filtert der Prozessor 190 dann in einem Filterschritt 354 das durch den Rauschgenerator 250 erzeugte Rauschsignal 205 heraus. In einem abschließenden Wiedergabeschritt 356 wird das gefilterte Rauschsignal an die Audioausgabevorrichtungen 146 und 147 geschickt.
  • Im Gebrauch wird das zuvor beschriebene Verfahren in Echtzeit wiederholt, wobei das erfasste Eingangsaudiosignal und das erzeugte Audiomaskierungssignal ständig aktualisiert werden. Die Nominalkomponente stellt eine Grundaudiomaskierung bereit, die angepasst ist, das Eingangsaudiosignal zum fraglichen Zeitpunkt zu maskieren, und an der Veränderungen im Einklang mit den verschiedenen zusätzlichen erörterten Schritten vorgenommen werden können. Die Abklingvorspannungskomponente kann der Zeitdomänenspur des Audiomaskierungssignals ein weicheres Ausklingen nach einer Amplitudenspitze in der Zeitdomänenspur des Eingangsaudiosignals verleihen. Dies kann dem Audiomaskierungssignal einen weicheren Effekt verleihen und kann der Hintergrundkomponente besser entsprechen und sich besser mit dieser vermischen, was auch selbst einen natürlicheren und angenehmeren Maskierungseffekt bieten kann. Die Anstiegsvorspannungskomponente kann dazu neigen, abrupte Audiomerkmalanfänge innerhalb des Audiomaskierungssignals zu maskieren, die möglicherweise für die Benutzererfahrung unerwünscht sind. Ferner kann die Niederfrequenz-Verstärkungskomponente bedeuten, dass das Audiomaskierungssignal natürliche Klänge besser nachahmt und für einen Benutzer angenehmer ist. Schließlich können die zwei Glättungsschritte offenbare Lücken im Audiomaskierungssignal weiter verringern.
  • Es wird darauf hingewiesen, dass in anderen Ausführungsformen nur manche der zuvor erwähnten Komponenten und Schritte eingesetzt werden können. Zusätzlich oder alternativ dazu kann den Komponenten und Schritten eine beliebige Priorität in einer Hierarchie gegeben werden, sodass Komponenten/Schritte weiter oben in der Hierarchie einen Vorrang gegenüber denen weiter unten in der Hierarchie erhalten, sollten diese einander widersprechen.
  • Es wird darauf hingewiesen, dass erfindungsgemäße Ausführungsformen in der Form von Hardware, Software oder einer Kombination aus Hardware und Software realisiert werden können. Jede derartige Software kann in der Form von flüchtigem oder nichtflüchtigem Speicher gespeichert werden, wie zum Beispiel einer Speichervorrichtung, wie etwa einem ROM, gleich ob löschbar oder überschreibbar oder nicht, oder in der Form von Speicher, wie zum Beispiel RAM, Speicherchips, Vorrichtungen oder integrierten Schaltkreisen oder eines optisch oder magnetisch lesbaren Mediums, wie zum Beispiel einer/einem CD, DVD, Magnetplatte oder Magnetband. Es wird darauf hingewiesen, dass Speichervorrichtungen und Speichermedien Ausführungsformen eines maschinenlesbaren Speichers sind, die geeignet sind zum Speichern eines Programms oder von Programmen, die, wenn ausgeführt, erfindungsgemäße Ausführungsformen implementieren. Demnach stellen Ausführungsformen ein Programm bereit, das Code umfasst, um ein System oder ein Verfahren nach einem der vorhergehenden Ansprüche zu implementieren, sowie einen maschinenlesbaren Speicher, in dem ein derartiges Programm gespeichert ist. Ferner noch können erfindungsgemäße Ausführungsformen elektronisch über ein Medium übermittelt werden, wie etwa über ein Kommunikationssignal, das über eine Drahtverbindung oder eine Drahtlosverbindung übermittelt wird, und Ausführungsformen können entsprechend selbiges beinhalten.
  • Alle der in dieser Patentschrift offenbarten Merkmale (einschließlich jeglicher beiliegender Patentansprüche, der Zusammenfassung und Zeichnungen) und/oder alle der Schritte beliebiger derart offenbarter Verfahren oder Vorgänge können beliebig kombiniert werden, mit Ausnahme von Kombinationen, in denen wenigstens manche dieser Merkmale und/oder Schritte einander gegenseitig ausschließen.
  • Jedes in dieser Patentschrift offenbarte Merkmal (einschließlich jeglicher beiliegender Patentansprüche, der Zusammenfassung und Zeichnungen) kann durch alternative Merkmale ersetzt werden, die denselben entsprechenden oder ähnlichen Zweck erfüllen, falls nicht ausdrücklich anderweitig angegeben. Demnach ist, sofern nicht ausdrücklich anderweitig angegeben, jedes offenbarte Merkmal nur ein Beispiel aus einer allgemeinen Reihe von entsprechenden oder ähnlichen Merkmalen.
  • Die Erfindung ist nicht auf die Details der obigen Ausführungsformen beschränkt. Die Erfindung erstreckt sich auf jedes neuartige Merkmal oder jede neuartige Kombination von in dieser Patentschrift offenbarten Merkmalen (einschließlich jeglicher beiliegender Patentansprüche, der Zusammenfassung und Zeichnungen) oder auf jeden neuartigen oder jede neuartige Kombination der Schritte beliebiger derart offenbarter Verfahren oder Vorgänge. Die Patentansprüche sollten nicht derart ausgelegt werden, dass sie lediglich die obigen Ausführungsformen abdecken, sondern ferner jegliche Ausführungsformen, die in den Umfang der Patentansprüche fallen.

Claims (10)

  1. Verfahren zum Erzeugen eines Audiomaskierungssignals, wobei das Verfahren Folgendes umfasst: Empfangen eines Eingangsaudiosignals; Bestimmen des Frequenzdomänenspektrums des Eingangsaudiosignals; und Erzeugen eines Audiomaskierungssignals für das Eingangsaudiosignal, wobei das Audiomaskierungssignal aus Komponenten erzeugt wird, die Folgende umfassen: i) eine Nominalkomponente mit einem Frequenzdomänenspektrum, dessen Frequenzbandamplituden proportional zu entsprechenden Frequenzbandamplituden des Frequenzdomänenspektrums des Eingangsaudiosignals sind, und ii) eine Abklingvorspannungskomponente, die die Rate einer oder mehrerer Verringerungen der Zeitdomänenamplitude des Audiomaskierungssignals verringert.
  2. Verfahren nach Anspruch 1, umfassend das Einschränken der Rate der Zeitdomänenamplitudenverringerung auf eine vorgegebene maximale Steigung in Abhängigkeit der Abklingvorspannungskomponente; optional wobei das Verfahren das Halten einer Verringerung bei der vorgegebenen maximalen Steigung umfasst, sofern kein Aufhebungskriterium erfüllt ist und bis dies der Fall ist.
  3. Verfahren nach Anspruch 2, wobei zu den Aufhebungskriterien eines oder mehrere der Folgenden zählen: i) die Verringerung der Zeitdomänenamplitude des Audiomaskierungssignals, so wie dies im Einklang mit der Nominalkomponente erzeugt werden würde, fällt unter die vorgegebene maximale Steigung; ii) die Zeitdomänenamplitude des Audiomaskierungssignals übersteigt einen Mindestamplitudendifferenzschwellenwert mit Bezug auf das Zeitdomänenspektrum des Eingangsaudiosignals; iii) die Zeitdomänenamplitude des Audiomaskierungssignals wird auf null verringert.
  4. Verfahren nach Anspruch 2 oder 3, wobei die vorgegebene maximale Steigung derart ausgewählt ist, dass eine entsprechende Verringerung der Zeitdomänenamplitude im Einklang mit der maximalen Steigung über einen Zeitraum stattfindet, der im Wesentlichen einer erwarteten Periodizität der Zeitdomänenamplitude des Eingangsaudiosignals entspricht; und/oder wobei die vorgegebene maximale Steigung der Rate der Verringerung der Zeitdomänenamplitude zwischen 20 dBs-1 und 40 dBs-1 liegt.
  5. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Audiomaskierungssignal eine Hintergrundkomponente umfasst; optional wobei die Zeitdomänenamplitude der Hintergrundkomponente nicht von dem Eingangsaudiosignal abhängig ist.
  6. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Audiomaskierungssignal aus einer Anstiegsvorspannungskomponente erzeugt wird, die die Rate eines oder mehrerer Anstiege in der Zeitdomänenamplitude des Maskierungssignals im Vergleich zu entsprechenden Anstiegen einschränkt, welche nach der Nominalkomponente erzeugt werden würden; optional wobei die Anstiegsrate in der Zeitdomänenamplitude des Maskierungssignals nach der Anstiegsvorspannungskomponente auf ein Maximum von zwischen 100 dBs-1 und 140 dBs-1 eingeschränkt ist.
  7. Audiomaskierungssystem, Folgendes umfassend: wenigstens einen Prozessor; wenigstens einen Speicher, der computerlesbare Anweisungen umfasst; wobei der wenigstens eine Prozessor konfiguriert ist, die computerlesbaren Anweisungen zu lesen, um das Ausführen des Verfahrens nach einem der vorhergehenden Ansprüche zu bewirken.
  8. Fahrzeug, umfassend ein Audiomaskierungssystem nach Anspruch 7.
  9. Steuergerät zum Erzeugen eines Audiomaskierungssignals, wobei das Steuergerät Folgendes umfasst: einen Eingang zum Empfangen eines Eingangsaudiosignals; ein Verarbeitungsmittel zum: Bestimmen des Frequenzdomänenspektrums des Eingangsaudiosignals; und Erzeugen eines Audiomaskierungssignals für das Eingangsaudiosignal; und einen Ausgang zum Ausgeben des Audiomaskierungssignals; wobei das Verarbeitungsmittel konfiguriert ist zum Erzeugen des Audiomaskierungssignals aus Komponenten, die Folgende umfassen: i) eine Nominalkomponente mit einem Frequenzdomänenspektrum mit Frequenzbandamplituden proportional zu entsprechenden Frequenzbandamplituden des Frequenzdomänenspektrums des Eingangsaudiosignals, und ii) eine Abklingvorspannungskomponente, die die Rate einer oder mehrerer Verringerungen der Zeitdomänenamplitude des Audiomaskierungssignals verringert.
  10. Computerprogramm, das, wenn von einem Computer ausgelesen, das Ausführen des Verfahrens nach einem der Ansprüche 1 bis 6 bewirkt.
DE102018207530.1A 2017-05-17 2018-05-15 Vorrichtung und Verfahren für Verbesserung der Privatsphäre Pending DE102018207530A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB1707901.3 2017-05-17
GB1707901.3A GB2562507B (en) 2017-05-17 2017-05-17 Apparatus and method for privacy enhancement

Publications (1)

Publication Number Publication Date
DE102018207530A1 true DE102018207530A1 (de) 2018-11-22

Family

ID=59201666

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102018207530.1A Pending DE102018207530A1 (de) 2017-05-17 2018-05-15 Vorrichtung und Verfahren für Verbesserung der Privatsphäre

Country Status (3)

Country Link
US (1) US10614789B2 (de)
DE (1) DE102018207530A1 (de)
GB (1) GB2562507B (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111508461B (zh) * 2020-04-13 2023-11-03 山东省计算中心(国家超级计算济南中心) 一种多声掩蔽系统信息中心化管理系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4914706A (en) 1988-12-29 1990-04-03 777388 Ontario Limited Masking sound device
US8218783B2 (en) * 2008-12-23 2012-07-10 Bose Corporation Masking based gain control

Also Published As

Publication number Publication date
GB2562507A (en) 2018-11-21
US10614789B2 (en) 2020-04-07
US20180336876A1 (en) 2018-11-22
GB2562507B (en) 2020-01-29
GB201707901D0 (en) 2017-06-28

Similar Documents

Publication Publication Date Title
DE112011104737B4 (de) Geräuschunterdrückungsvorrichtung
DE102015119494B4 (de) Systeme und Verfahren zur Lärmbekämpfung in einem Fahrzeug
EP3327931B1 (de) Tonwiedergabevorrichtung mit hörszenariosimulation
DE112016006218B4 (de) Schallsignal-Verbesserungsvorrichtung
DE60004888T2 (de) Sprachsverteilungssystem
EP1143416A2 (de) Geräuschunterdrückung im Zeitbereich
EP3375204B1 (de) Audiosignalverarbeitung in einem fahrzeug
DE102014214052A1 (de) Virtuelle Verdeckungsmethoden
DE60301692T2 (de) Aktives System zur Unterdrückung der Geräusche einer Fahrzeugtür
DE10308414A1 (de) Verfahren zur Steuerung eines Akustiksystems im Fahrzeug
DE102014017293A1 (de) Verfahren zur Verzerrungskompensation im Hörfrequenzbereich und damit zu verwendendes Verfahren zur Schätzung akustischer Kanäle
DE102017207543A1 (de) Verfahren und systeme zum verringern einer druckwelle
DE102021214593A1 (de) Aktivgeräuschkontrolleinrichtung für Fahrzeuge und Verfahren zum Steuern derselben
DE112017004568T5 (de) Vorrichtung und verfahren zur verbesserung der privatsphäre
DE102018207530A1 (de) Vorrichtung und Verfahren für Verbesserung der Privatsphäre
DE112016004394T5 (de) Heulunterdrückungsvorrichtung
DE102016118917A1 (de) Fahrzeug-Audioübertragungsregelung
DE102016007873A1 (de) Vorrichtung und Verfahren zur Erzeugung von akustischen Signalen
DE102018217634A1 (de) Verfahren zum Betrieb eines Fahrzeugs sowie Fahrzeug
EP3403260B1 (de) Verfahren und vorrichtung zur aufbereitung eines verlustbehaftet komprimierten audiosignals
DE102014214699A1 (de) Wiedergabe tieffrequenter Audiosignale durch Körperschall
DE102008007240A1 (de) Verfahren zur automatischen Kontrolle mindestens eines akustischen Parameters
DE102021130908A1 (de) Audio-Verarbeitungsverfahren und -system für ein Sitzkopfstützen-Audiosystem
DE102017102234A1 (de) Verfahren und Vorrichtung zur räumlichen Darstellung virtueller Geräuschquellen in einem Fahrzeug
DE102014222917B4 (de) Lautstärkeregelung für individuelle Entertainmentwiedergabe

Legal Events

Date Code Title Description
R082 Change of representative

Representative=s name: BARDEHLE PAGENBERG PARTNERSCHAFT MBB PATENTANW, DE

R163 Identified publications notified