DE112022002887T5 - Signalverarbeitungseinrichtung, Signalverarbeitungsverfahren und Programm - Google Patents

Signalverarbeitungseinrichtung, Signalverarbeitungsverfahren und Programm Download PDF

Info

Publication number
DE112022002887T5
DE112022002887T5 DE112022002887.4T DE112022002887T DE112022002887T5 DE 112022002887 T5 DE112022002887 T5 DE 112022002887T5 DE 112022002887 T DE112022002887 T DE 112022002887T DE 112022002887 T5 DE112022002887 T5 DE 112022002887T5
Authority
DE
Germany
Prior art keywords
vibration
signal
unit
signal processing
reproduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112022002887.4T
Other languages
English (en)
Inventor
Yuji TOKOZUME
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Group Corp
Original Assignee
Sony Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Group Corp filed Critical Sony Group Corp
Publication of DE112022002887T5 publication Critical patent/DE112022002887T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1041Mechanical or electronic switches, or control elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/01Hearing devices using active noise cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/13Hearing devices using bone conduction transducers

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

Es werden eine Signalverarbeitungseinrichtung, ein Signalverarbeitungsverfahren und ein Programm bereitgestellt, die selbst in einem Zustand, in dem Ton von einer Schwingungswiedergabeeinrichtung ausgegeben wird, eine Äußerung durch einen Träger erkennen können.Eine Signalverarbeitungseinrichtung, die eine Verarbeitungseinheit aufweist, die entsprechend einer Schwingungswiedergabeeinrichtung arbeitet, die eine Schwingungswiedergabeeinheit, die Schwingung wiedergibt, und einen Schwingungssensor, der Schwingung erfasst, aufweist und Verarbeitung zum Erschweren des Erkennens einer Äußerung bei Äußerungserkennungsverarbeitung zum Erkennen einer Äußerung durch einen Träger der Schwingungswiedergabeeinrichtung auf der Basis des Schwingungssensorsignals durchführt.

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Technologie betrifft eine Signalverarbeitungseinrichtung, ein Signalverarbeitungsverfahren und ein Programm.
  • STAND DER TECHNIK
  • Herkömmlicherweise wurde eine Technologie zum Erkennen einer Äußerung eines Äußerers vorgeschlagen. Es gibt zum Beispiel eine Technik zum Erkennen einer Äußerung durch einen Äußerer durch Verwenden eines Beschleunigungssensors in einem akustischen Kommunikationssystem (Patentdokument 1).
  • LITERATURVERZEICHNIS
  • PATENTDOKUMENT
  • Patentdokument 1: Japanische Patent-Offenlegungsschrift Nr. 2011-188462
  • KURZDARSTELLUNG DER ERFINDUNG
  • DURCH DIE ERFINDUNG ZU LÖSENDE PROBLEME
  • Es wird ein Fall in Betracht gezogen, in dem die Technik in Patentdokument 1 auf einen Kopfhörer angewendet wird, der einen Beschleunigungssensor aufweist, um eine Äußerung durch eine Person zu erkennen, die den Kopfhörer trägt. Wenn Ton hoher Lautstärke von einem Lautsprecher des Kopfhörers ausgegeben wird, wird Schwingung eines Gehäuses des Kopfhörers aufgrund der Ausgabe des Tons auf den Beschleunigungssensor übertragen, sodass eine Möglichkeit besteht, dass sich die Leistung des Erkennens der Äußerung durch den Äußerer verschlechtert. Wenn zum Beispiel eine menschliche Stimme in Musik enthalten ist, die als Ergebnis der Übertragung der Schwingung des Gehäuses auf den Beschleunigungssensor aufgrund der Ausgabe des Tons vom Lautsprecher ausgegeben wird, tritt ein Schwingungsmuster ähnlich einem Schwingungsmuster bei Äußerung durch einen Träger in den Beschleunigungssensor ein, in welchem Fall irrtümlicherweise erkannt wird, dass der Äußerer sich äußert, obwohl sich der Äußerer nicht äußert.
  • Die vorliegende Technologie wurde angesichts solch eines Problems entwickelt und eine Aufgabe derselben besteht darin, eine Signalverarbeitungseinrichtung, ein Signalverarbeitungsverfahren und ein Programm bereitzustellen, die selbst in einem Zustand, in dem Ton von einer Schwingungswiedergabeeinrichtung ausgegeben wird, eine Äußerung durch einen Träger erkennen können.
  • PROBLEMLÖSUNG
  • Um das vorstehend beschriebene Problem zu lösen, besteht eine erste Technik in einer Signalverarbeitungseinrichtung, die eine Verarbeitungseinheit aufweist, die entsprechend einer Schwingungswiedergabeeinrichtung arbeitet, die eine Schwingungswiedergabeeinheit, die Schwingung wiedergibt, und einen Schwingungssensor aufweist, der Schwingung erfasst, und Verarbeitung zum Erschweren des Erkennens einer Äußerung bei Äußerungserkennungsverarbeitung zum Erkennen einer Äußerung durch einen Träger der Schwingungswiedergabeeinrichtung auf der Basis des Schwingungssensorsignals durchführt.
  • Außerdem besteht eine zweite Technik in einem Signalverarbeitungsverfahren, das umfasst, dass es entsprechend einer Schwingungswiedergabeeinrichtung ausgeführt wird, die eine Schwingungswiedergabeeinheit, die Schwingung wiedergibt, und einen Schwingungssensor aufweist, der Schwingung erfasst, und Verarbeitung zum Erschweren des Erkennens einer Äußerung bei Äußerungserkennungsverarbeitung zum Erkennen einer Äußerung durch einen Träger der Schwingungswiedergabeeinrichtung auf der Basis eines Schwingungssensorsignals durchführt.
  • Darüber hinaus besteht eine dritte Technik in einem Programm, das einen Computer zum Ausführen eines Signalverarbeitungsverfahrens veranlasst, das umfasst, dass es entsprechend einer Schwingungswiedergabeeinrichtung ausgeführt wird, die eine Schwingungswiedergabeeinheit, die Schwingung wiedergibt, und einen Schwingungssensor aufweist, der Schwingung erfasst, und Verarbeitung zum Erschweren des Erkennens einer Äußerung bei Äußerungserkennungsverarbeitung zum Erkennen einer Äußerung durch einen Träger der Schwingungswiedergabeeinrichtung auf der Basis eines Schwingungssensorsignals durchführt.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
    • 1A ist eine Außenansicht, die eine äußere Konfiguration eines Kopfhörers 100 veranschaulicht, und 1B und 1C sind Querschnittansichten, die eine innere Konfiguration des Kopfhörers 100 veranschaulichen.
    • 2 ist ein Blockdiagramm, das eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer ersten Ausführungsform veranschaulicht.
    • 3 ist ein Flussdiagramm, das eine Verarbeitung durch die Signalverarbeitungseinrichtung 200 gemäß der ersten Ausführungsform veranschaulicht.
    • 4 ist ein erläuterndes Diagramm der Verarbeitung durch die Signalverarbeitungseinrichtung 200 in der ersten Ausführungsform.
    • 5 ist ein Blockdiagramm, das eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer zweiten Ausführungsform veranschaulicht.
    • 6 ist ein Flussdiagramm, das eine Verarbeitung durch die Signalverarbeitungseinrichtung 200 gemäß der zweiten Ausführungsform veranschaulicht.
    • 7 ist ein erläuterndes Diagramm der Verarbeitung durch die Signalverarbeitungseinrichtung 200 in der der zweiten Ausführungsform.
    • 8 ein erläuterndes Diagramm einer Benachrichtigung.
    • 9 ist ein Blockdiagramm, das eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer dritten Ausführungsform veranschaulicht.
    • 10 ist ein Flussdiagramm, das eine Verarbeitung durch die Signalverarbeitungseinrichtung 200 gemäß der dritten Ausführungsform veranschaulicht.
    • 11 ist ein Blockdiagramm, das eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer vierten Ausführungsform veranschaulicht.
    • 12 ist ein Flussdiagramm, das eine Verarbeitung durch die Signalverarbeitungseinrichtung 200 gemäß der vierten Ausführungsform veranschaulicht.
    • 13 ist ein Blockdiagramm, das eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer fünften Ausführungsform veranschaulicht.
    • 14 ist ein Flussdiagramm, das eine Verarbeitung durch die Signalverarbeitungseinrichtung 200 gemäß der fünften Ausführungsform veranschaulicht.
    • 15 ist ein Blockdiagramm, das eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer sechsten Ausführungsform veranschaulicht.
    • 16 ist ein Flussdiagramm, das eine Verarbeitung durch die Signalverarbeitungseinrichtung 200 gemäß der sechsten Ausführungsform veranschaulicht.
    • 17 ist ein erläuterndes Diagramm eines Anwendungsbeispiels der vorliegenden Technologie.
  • AUSFÜHRUNGSFORM DER ERFINDUNG
  • Nachfolgend wird eine Ausführungsform der vorliegenden Technologie unter Bezugnahme auf die Zeichnungen beschrieben. Es sei angemerkt, dass die Beschreibung in der folgenden Reihenfolge erfolgt.
    • <1. Erste Ausführungsform>
      • [1-1. Konfiguration einer Schwingungswiedergabeeinrichtung]
      • [1-2. Konfiguration einer Signalverarbeitungseinrichtung 200]
      • [1-3. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
    • <2. Zweite Ausführungsform>
      • [2-1. Konfiguration einer Signalverarbeitungseinrichtung 200]
      • [2-2. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
    • <3. Dritte Ausführungsform>
      • [3-1. Konfiguration einer Signalverarbeitungseinrichtung 200]
      • [3-2. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
    • <4. Vierte Ausführungsform>
      • [4-1. Konfiguration einer Signalverarbeitungseinrichtung 200]
      • [4-2. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
    • <5. Fünfte Ausführungsform>
      • [5-1. Konfiguration einer Signalverarbeitungseinrichtung 200]
      • [5-2. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
    • <6. Sechste Ausführungsform>
      • [6-1. Aufbau einer Signalverarbeitungseinrichtung 200]
      • [6-2. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
    • <7. Anwendungsbeispiel>
    • <8. Modifikationen>
  • <1. Erste Ausführungsform>
  • [1-1. Konfiguration einer Schwingungswiedergabeeinrichtung]
  • Unter Bezugnahme auf 1 wird eine Konfiguration eines Kopfhörers 100 als eine Schwingungswiedergabeeinrichtung mit einer Schwingungswiedergabeeinheit 130 und einem Schwingungssensor 140 beschrieben. Die Konfiguration des Kopfhörers 100 ist bei den Ausführungsformen eins bis vier identisch. Es ist zu erwähnen, dass die Kopfhörer 100 ein Paar eines linken Kopfhörers und eines rechten Kopfhörers aufweisen und die Beschreibung in Bezug auf den linken Kopfhörer erfolgt. In der folgenden Beschreibung wird eine Person, die den Kopfhörer 100 trägt und verwendet, als Träger bezeichnet.
  • Es ist zu erwähnen, dass die Schwindungswiedergabeeinrichtung entweder am Körper tragbar oder stationär sein kann, und Beispiele für die am Körper tragbare Schwingungswiedergabeeinrichtung weisen Kopfhörer, Ohrhörer, Nackenlautlautsprecher und dergleichen auf. Beispiele für Kopfhörer weisen Überkopf-Kopfhörer, Nackenbügel-Kopfhörer und dergleichen auf und Beispiele für Ohrhörer weisen Innenohr-Ohrhörer, Gehörgangs-Ohrhörer und dergleichen auf. Außerdem werden einige der Ohrhörer als True-Wireless-Ohrhörer, vollständig drahtlose Ohrhörer oder dergleichen bezeichnet, wobei es sich um vollkommen unabhängige drahtlose Ohrhörer handelt. Ferner gibt es auch drahtlose Kopfhörer und Nackenlautsprecher. Es ist zu erwähnen, dass die Schwingungswiedergabeeinrichtung nicht auf einen drahtlosen Typ beschränkt ist, sondern auch ein drahtgebundener Typ sein kann.
  • Der Kopfhörer 100 weist ein Gehäuse 110, ein Substrat 120, die Schwingungswiedergabeeinheit 130, den Schwingungssensorsensor 140 und ein Ohrstück 150 auf. Der Kopfhörer 100 ist ein sogenannter drahtloser Gehörgangskopfhörer. Es ist zu erwähnen, dass der Kopfhörer 100 auch als Ohrhörer bezeichnet werden kann. Der Kopfhörer 100 gibt als Ton ein Wiedergabesignal aus, das von einer elektronischen Vorrichtung übertragen wird, die mit dem Kopfhörer 100 verbunden, synchronisiert oder gekoppelt ist.
  • Das Gehäuse 110 fungiert als Aufnahmeteil, das das Substrat 120, die Schwingungswiedergabeeinheit 130, den Schwingungssensorsensor 140 und dergleichen darin aufnimmt. Das Gehäuse 110 ist zum Beispiel durch Verwenden von Kunstharz, beispielsweise Kunststoff, gebildet.
  • Das Substrat 120 ist eine Leiterplatte, auf der ein Prozessor, eine Mikrocontroller-Einheit (MCU), eine Batterielade-IC und dergleichen vorgesehen sind. Verarbeitung durch den Prozessor implementiert eine Wiedergabesignalverarbeitungseinheit, eine Signalausgabeeinheit 121, eine Signalverarbeitungseinrichtung 200, eine Kommunikationseinheit und dergleichen. Die Wiedergabesignalverarbeitungseinheit und die Kommunikationseinheit sind nicht veranschaulicht.
  • Die Wiedergabesignalverarbeitungseinheit führt zum Beispiel eine vorgegebene Tonsignalverarbeitung, beispielsweise Signalverstärkungsverarbeitung oder Entzerrungsverarbeitung, an einem Wiedergabesignal durch, das von der Schwingungswiedergabeeinheit 130 wiedergegeben wird.
  • Die Signalausgabeeinheit 121 gibt das Wiedergabesignal, das von der Wiedergabesignalverarbeitungseinheit verarbeitet wird, an die Schwingungswiedergabeeinheit 130 aus. Das Wiedergabesignal ist zum Beispiel ein Tonsignal. Das Wiedergabesignal kann ein analoges Signal oder ein digitales Signal sein. Es ist zu erwähnen, dass der von der Schwingungswiedergabeeinheit 130 durch das Wiedergebsignal ausgegeben wird, Musik, anderer Ton als Musik oder die Stimme einer Person sein kann.
  • Die Signalverarbeitungseinrichtung 200 führt Signalverarbeitung gemäß der vorliegenden Technologie durch. Eine Konfiguration der Signalverarbeitungseinrichtung 200 wird später beschrieben.
  • Die Kommunikationseinheit kommuniziert durch drahtlose Kommunikation mit dem rechten Kopfhörer und einer Endgerätevorrichtung. Beispiele für ein Kommunikationsverfahren weisen Bluetooth (eingetragene Handelsmarke), Nahfeldkommunikation (NFC) und Wi-Fi auf, aber es kann jedes Kommunikationsverfahren verwendet werden, solange Kommunikation durchgeführt werden kann.
  • Die Schwingungswiedergabeeinheit 130 gibt Schwingung auf der Basis des Wiedergabesignals wieder. Die Schwingungswiedergabeeinheit 130 ist zum Beispiel eine Treibereinheit oder ein Lautsprecher, die/der als Ton ein Tonsignal als Wiedergabesignal ausgibt.
  • Die durch die Schwingungswiedergabeeinheit 130 wiedergegebene Schwingung kann Schwingung aufgrund einer Musikausgabe oder Schwingung aufgrund einer von Musik verschiedenen Ton- oder Stimmausgabe sein. Falls außerdem der Kopfhörer 100 eine Rauschunterdrückungsfunktion aufweist, kann die von der Schwingungswiedergabeeinheit 130 wiedergegebene Schwingung Schwingung aufgrund eines Rauschunterdrückungssignals als das Wiedergabesignal sein oder sie kann Schwingung aufgrund der Ausgabe eines Tonsignals sein, zu dem das Rauschunterdrückungssignal addiert ist. Falls der Kopfhörer 100 eine Externton-Erfassungsfunktion aufweist, kann die von der Schwingungswiedergabeeinheit 130 wiedergegebene Schwingung Schwingung aufgrund der Ausgabe eines Externton-Erfassungssignals als das Wiedergabesignal sein oder sie kann Schwingung aufgrund der Ausgabe eines Tonsignals sein, zu dem das Externton-Erfassungssignal addiert ist.
  • In den folgenden Ausführungsformen eins bis vier erfolgt die Beschreibung in der Annahme, dass die Schwingungswiedergabeeinheit 130 eine Treibereinheit ist, die als Ton ein Tonsignal als Wiedergabesignal ausgibt. Wenn Ton von der Schwingungswiedergabeeinheit 130 als Treibereinheit ausgegeben wird, schwingt das Gehäuse 110 und der Schwingungssensor 140 erfasst die Schwingung.
  • Der Schwingungssensor 140 erfasst Schwingung des Gehäuses 110. Der Schwingungssensor 140 ist dazu bestimmt, Schwingung des Gehäuses 110 aufgrund einer Äußerung durch einen Träger und Schwingung des Gehäuses 110 aufgrund von Ton, der von der Schwingungswiedergabeeinheit 130 ausgegeben wird, zu erfassen und unterscheidet sich von einem Mikrofon, das zum Erfassen von Schwingung von Luft bestimmt ist. Da der Schwingungssensor 140 Schwingung des Gehäuses 110 erfasst und das Mikrofon Schwingung der Luft erfasst, unterscheiden sich Schwingungsmedien davon voneinander. Daher weist in der vorliegenden Technologie der Schwingungssensor 140 kein Mikrofon auf. Der Schwingungssensor 140 ist zum Beispiel ein Beschleunigungssensor und in diesem Fall ist der Schwingungssensor 140 dazu ausgebildet, Positionsverschiebung eines Elements innerhalb des Sensors zu erfassen, und weist eine andere Konfiguration als das Mikrofon auf.
  • Der Schwingungssensor 140 erfasst Schwingung des Gehäuses 110 und gibt ein Schwingungssensorsignal, das als Ergebnis des Erfassens erhalten wird, an die Signalverarbeitungseinrichtung 200 aus.
  • Als der Schwingungssensor 140 kann neben dem Beschleunigungssensor ein Sprachaufnahme- bzw. VPU-Sensor (Voice Pick Up), ein Knochenleitungssensor oder dergleichen verwendet werden. Der Beschleunigungssensor kann ein biaxialer Beschleunigungssensor oder ein Beschleunigungssensor mit zwei oder mehr Achsen (zum Beispiel ein triaxialer Beschleunigungssensor) sein. Im Falle des Beschleunigungssensors mit zwei oder mehr Achsen kann Schwingung in einer Mehrzahl von Richtungen gemessen werden und daher kann Schwingung der Schwingungswiedergabeeinheit 130 mit höherer Genauigkeit erfasst werden.
  • Wie in 1C mit einem Schwingungssensor 140A, einem Schwingungssensor 140B und einem Schwingungssensor 140D veranschaulicht, kann der Schwingungssensor 140 so angeordnet sein, dass er parallel zu einer Schwingungsfläche der Schwingungswiedergabeeinheit 130 ist.
  • Wie in 1C außerdem mit einem Schwingungssensor 140C, einem Schwingungssensor 140E und einem Schwingungssensor 140F veranschaulicht, kann der Schwingungssensor 140 so angeordnet sein, dass er senkrecht oder schräg zu der Schwingungsfläche der Schwingungswiedergabeeinheit 130 ist. Folglich ist es möglich, die Beeinflussung durch die Vibrationswiedergabeeinheit 130 zu erschweren.
  • Wie in 1C ferner mit dem Schwingungssensor 140C und dem Schwingungssensor 140D veranschaulicht, kann der Schwingungssensor 140 koaxial mit der Schwingungsfläche der Schwingungswiedergabeeinheit 130 angeordnet sein.
  • Wie in 1C zudem mit dem Schwingungssensor 140A, dem Schwingungssensor 140B, dem Schwingungssensor 140E und dem Schwingungssensor 140F veranschaulicht, kann der Schwingungssensor 140 in einer Position angeordnet sein, die nicht koaxial mit der Schwingungsfläche der Schwingungswiedergabeeinheit 130 ist. Folglich kann es schwierig sein, dass der Schwingungssensor 140 von der Vibrationswiedergabeeinheit 130 beeinflusst wird.
  • Wie in 1C außerdem mit dem Schwingungssensor 140A, dem Schwingungssensor 140B, dem Schwingungssensor 140E und dem Schwingungssensor 140F veranschaulicht, kann der Schwingungssensor 140 auf dem Substrat angeordnet sein, das von der Schwingungswiedergabeeinheit 130 verschieden ist. Folglich kann Übertragung von Schwingung, die von der Schwingungswiedergabeeinheit 130 wiedergegeben wird, auf den Schwingungssensor 140 physisch reduziert werden.
  • Wie in 1C ferner mit dem Schwingungssensor 140D veranschaulicht, kann der Schwingungssensor 140 auf einer Oberfläche der Schwingungswiedergabeeinheit 130 angeordnet sein. Folglich kann die Schwingung der Schwingungswiedergabeeinheit 130 mit höherer Genauigkeit erfasst werden.
  • Wie in 1C zudem mit dem Schwingungssensor 140C veranschaulicht, kann der Schwingungssensor 140 auf einer Innenfläche des Gehäuses 110 angeordnet sein. Folglich kann Übertragung von Schwingung, die von der Schwingungswiedergabeeinheit 130 wiedergegeben wird, auf den Schwingungssensor 140 physisch reduziert werden. Darüber hinaus kann die Erfassungsgenauigkeit verbessert werden, da die Schwingung in einer Position erfasst werden kann, die der Haut des Trägers näher ist.
  • Das Ohrstück 150 ist auf einem rohrförmigen Vorsprung vorgesehen, der auf einer Seite des Gehäuses 110 ausgebildet ist, die einem Ohr des Trägers zugewandt ist. Das Ohrstück 150 wird als Gehörgangs-Ohrstück bezeichnet und tief in eine äußere akustische Öffnung des Trägers eingeführt. Das Ohrstück 150 weist durch einen elastischen Körper wie etwa Gummi Elastizität auf und dadurch, dass es in engem Kontakt mit einer Innenfläche der äußeren akustischen Öffnung des Trägers ist, spielt es eine Rolle bei der Erhaltung eines Zustands, in dem der Kopfhörer im Ohr getragen wird. Dadurch, dass es in engem Kontakt mit einer Innenfläche der äußeren akustischen Öffnung des Trägers ist, spielt das Ohrstück 150 außerdem auch eine Rolle dabei, Geräusche von außen zu blockieren, um das Hören von Ton zu erleichtern, und eine Rolle dabei, zu verhindern, dass Ton nach außen dringt.
  • Der von der Schwingungswiedergabeeinheit 130 ausgegebene Ton wird aus einem Tonemissionsloch im Ohrstück 150 zur äußeren akustischen Öffnung des Trägers emittiert. Dadurch kann der Träger Ton hören, der vom Kopfhörer 100 wiedergegeben wird.
  • Die Kopfhörer 100 ist aufgebaut, wie vorstehend beschrieben. Es ist zu erwähnen, dass, obwohl die Beschreibung unter Bezugnahme auf den linken Kopfhörer erfolgte, der rechte Kopfhörer ebenfalls so aufgebaut ist, wie vorstehend beschrieben.
  • [1-2. Konfiguration einer Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 2 eine Konfiguration der Signalverarbeitungseinrichtung 200 beschrieben. Die Signalverarbeitungseinrichtung 200 weist eine Rauscherzeugungseinheit 201, eine Rauschadditionseinheit 202 und eine Signalverarbeitungseinheit 203 auf.
  • Die Rauscherzeugungseinheit 201 erzeugt Rauschen, das zu einem Schwingungssensorsignal addiert werden soll, das vom Schwingungssensor 140 an die Signalverarbeitungseinheit 203 ausgegeben wird, und gibt das Rauschen an die Rauschadditionseinheit aus. Zum Beispiel können weißes Rauschen, Schmalbandrauschen, rosa Rauschen oder dergleichen als das Rauschen verwendet werden. Die vorliegende Technologie ist nicht auf ein bestimmtes Rauschen beschränkt, sodass eine Art des Rauschens nicht beschränkt ist, solange ein Signal von einer Schwingungscharakteristik eines Erkennungsziels verschieden ist. Außerdem kann Rauschen gemäß dem Wiedergabesignal selektiv verwendet werden. Zum Beispiel wird Rauschen in Abhängigkeit davon, ob der von der Schwingungswiedergabeeinheit 130 durch das Wiedergabesignal ausgegebene Ton eine männliche Stimme (männlicher Gesang im Falle von Musik) oder eine weibliche Stimme (weiblicher Gesang im Falle von Musik) ist, selektiv verwendet.
  • Die Rauschadditionseinheit 202 führt Verarbeitung zum Addieren des von der Rauscherzeugungseinheit 201 erzeugten Rauschens zu dem vom Schwingungssensor 140 ausgegebenen Schwingungssensorsignal durch. Durch Addieren des Rauschens wird eine Übertragungskomponente der Schwingung zum Schwingungssensor 140 maskiert, wobei die Schwingung durch den von der Schwingungswiedergabeeinheit 130 ausgegebenen Ton wiedergegeben wird. Die Rauschadditionseinheit 202 entspricht einer Verarbeitungseinheit in den Ansprüchen.
  • Die Rauschadditionseinheit 202, die eine Verarbeitungseinheit ist, ändert ein Schwingungssensorsignal so, dass eine Äußerung in der Äußerungserkennungsverarbeitung durch die Signalverarbeitungseinheit 203 schwer zu erkennen ist.
  • Die Signalverarbeitungseinheit 203 erkennt die Äußerung durch den Träger auf der Basis des Schwingungssensorsignals, zu dem das Rauschen durch die Rauschadditionseinheit 202 addiert ist. Zum Beispiel erkennt bei einem neuronalen Netzwerk, das durch Verwenden einer Technik für maschinelles Lernen erstellt ist, einem neuronalen Netzwerk, das durch Verwenden einer Deep-Learning-Technik erstellt ist, oder dergleichen die Signalverarbeitungseinheit 203 die Äußerung durch den Träger, indem sie die Schwingung des Gehäuses 110 aufgrund der Äußerung durch den Träger aus dem Schwingungssensorsignal erkennt.
  • In der vorliegenden Technologie erkennt die Signalverarbeitungseinheit 203 eine Äußerung durch einen Träger und daher ist es nicht wünschenswert, dass eine Äußerung durch eine Person in der Nähe des Trägers erkannt wird. Im Allgemeinen wird Erkennung einer Äußerung durch ein Mikrofon durchgeführt, das im Kopfhörer 100 vorgesehen ist, aber beim Mikrofon ist es schwierig, zu identifizieren, ob die Äußerung von einem Träger oder einer anderen Person getätigt wird. Außerdem ist eine Mehrzahl von Mikrofonen erforderlich, um zu identifizieren, ob der Träger sich äußert oder eine andere Person sich äußert. Es ist möglich, eine Mehrzahl von Mikrofonen in einem Kopfbügel-Kopfhörer mit einem großen Gehäuse bereitzustellen, aber es ist schwierig, eine Mehrzahl von Mikrofonen in einem Gehörgangskopfhörer mit einem kleinen Gehäuse 110 bereitzustellen.
  • Daher wird durch Verwenden des Schwingungssensors 140 anstelle des Mikrofons zum Erfassen der Schwingung des Gehäuses 110 aufgrund einer Äußerung durch den Träger die Äußerung durch den Träger und nicht durch eine andere Person erkannt. Selbst wenn sich eine andere Person äußert, erfasst der Schwingungssensor eine Äußerung durch die andere Person nicht oder, selbst wenn die Schwingung erfasst wird, ist die Schwingung eine leichte Schwingung und kann verhindert werden, dass eine Äußerung durch eine andere Person irrtümlicherweise als eine Äußerung durch den Träger erkannt wird.
  • Die Informationsverarbeitungseinrichtung 200 ist so ausgebildet, wie vorstehend beschrieben. Es ist zu erwähnen, dass die Signalverarbeitungseinrichtung 200 in jeder der Ausführungsformen eins bis vier als eine einzelne Einrichtung ausgebildet sein kann, im Kopfhörer 100, der eine Schwingungswiedergabeeinrichtung ist, betrieben werden kann oder in einer elektronischen Vorrichtung oder dergleichen, die mit dem Kopfhörer 1100 verbunden, synchronisiert, gekoppelt oder dergleichen ist, betrieben werden kann. Falls die Signalverarbeitungseinrichtung 200 in solch einer elektronischen Vorrichtung oder dergleichen betrieben wird, funktioniert die Signalverarbeitungseinrichtung 200 entsprechend dem Kopfhörer 100. Außerdem können der Kopfhörer 100 und die elektronische Vorrichtung durch die Ausführung des Programms so implementiert sein, dass sie eine Funktion der Signalverarbeitungseinrichtung 200 aufweisen. Falls die Signalverarbeitungseinrichtung 200 durch das Programm implementiert wird, kann das Programm im Kopfhörer 100 oder in der elektronischen Vorrichtung vorab installiert werden, oder es kann durch einen Download, ein Speichermedium oder dergleichen verteilt und von einem Benutzer selbst installiert werden.
  • [1-3. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 3 und 4 die Verarbeitung durch die Signalverarbeitungseinrichtung 200 in der ersten Ausführungsform beschrieben.
  • Der Schwingungssensor 140 erfasst Schwingung des Gehäuses 110 und gibt ein Schwingungssensorsignal, das als Ergebnis des Erfassens erhalten wird, an die Signalverarbeitungseinrichtung 200 aus. Wenn der Schwingungssensor 140 ein Schwingungssensorsignal ausgibt, empfängt die Rauschadditionseinheit 202 das Schwingungssensorsignal in Schritt S101.
  • Außerdem erzeugt die Rauscherzeugungseinheit 201 in Schritt S102 Rauschen und gibt das Rauschen an die Rauschadditionseinheit 202 aus. Es ist zu erwähnen, dass Schritt S102 nicht unbedingt nach Schritt S101 ausgeführt zu werden braucht, sondern er kann auch vor Schritt S101 ausgeführt werden, oder Schritt S101 und Schritt S102 können fast gleichzeitig ausgeführt werden.
  • Als Nächstes addiert die Rauschadditionseinheit 202 in Schritt S103 das von der Rauscherzeugungseinheit 201 erzeugte Rauschen zum Schwingungssensorsignal und gibt das Schwingungssensorsignal, zu dem das Rauschen addiert ist, an die Signalverarbeitungseinheit 203 aus. Die Rauschadditionseinheit 202 addiert Rauschen zum Schwingungssensorsignal, während der Schwingungssensor 140 die Schwingung des Gehäuses 110 erfasst und das Schwingungssensorsignal in die Rauschadditionseinheit 202 eingegeben wird.
  • Als Nächstes führt die Signalverarbeitungseinheit 203 in Schritt S104 Äußerungserkennungsverarbeitung auf der Basis des Schwingungssensorsignals durch, zu dem das Rauschen durch die Rauschadditionseinheit 202 addiert ist. Falls die Signalverarbeitungseinheit 203 eine Äußerung durch den Träger erkennt, gibt die Signalverarbeitungseinheit 203 Informationen, die ein Ergebnis der Erkennung angeben, an eine externe Verarbeitungseinheit oder dergleichen aus.
  • 4A ist ein Beispiel, in dem eine Übertragungskomponente der Schwingung des Gehäuses 110 zum Schwingungssensor 140 durch eine Beziehung zwischen Zeit und Schalldruck dargestellt ist, die aus dem Schwingungssensorsignal erhalten wird, wobei die Schwingung auf die Tonausgabe von der Schwingungswiedergabeeinheit 130 zurückzuführen ist. In 4A wird kein Rauschen zum Schwingungssensorsignal addiert. Falls daher eine menschliche Stimme in der Tonausgabe von der Schwingungswiedergabeeinheit 130 enthalten ist, wird ein Schwingungsmuster ähnlich einem Schwingungsmuster in einem Fall, in dem sich der Träger äußert, in den Schwingungssensor 140 eingegeben, auch wenn sich der Träger nicht äußert. In diesem Fall kann der Schwingungssensor 140 die Schwingung des Gehäuses 110 aufgrund der Stimme in der Tonausgabe von der Schwingungswiedergabeeinheit 130 erfassen und die Signalverarbeitungseinheit 203 kann irrtümlicherweise erkennen, dass der Träger sich geäußert hat.
  • In der ersten Ausführungsform wird Rauschen zu einem Schwingungssensorsignal addiert, um diese fehlerhafte Erkennung zu verhindern. Durch Addieren von Rauschen zum Schwingungssensorsignal ändert sich eine Übertragungskomponente der Schwingung des Gehäuses 110 zum Schwingungssensor 140, wie in 4B veranschaulicht, und wird durch das Rauschen maskiert. Wenn folglich eine menschliche Stimme in der Tonausgabe von der Schwingungswiedergabeeinheit 130 enthalten ist, ähnelt ein Schwingungsmuster eines Schwingungssensorsignals in einem Fall, in dem Schwingung des Gehäuses 110 aufgrund von Ton von der Schwingungswiedergabeeinheit 130 erfasst wird, nicht einem Schwingungsmuster eines Schwingungssensorsignals in einem Fall, in dem Schwingung des Gehäuses 110 aufgrund einer Äußerung durch den Träger erfasst wird. Durch die Addition von Rauschen unterscheidet sich das Schwingungssensorsignal von einem Schwingungssensorsignal in einem Fall, in dem Schwingung aufgrund menschlicher Stimme erfasst wird, wodurch es möglich ist, zu verhindern, dass die Signalverarbeitungseinheit 203 irrtümlicherweise eine Äußerung durch den Träger erkennt.
  • Es ist zu erwähnen, dass in einem Fall, in dem eine Größe einer Stimme einer Äußerung durch den Träger hinlänglich größer als eine Größe von Ton ist, der von der Schwingungswiedergabeeinheit 130 ausgegeben wird, keine Maskierung durchgeführt wird, selbst wenn Rauschen zum Schwingungssensorsignal addiert wird, das Schwingung des Gehäuses 110 aufgrund der Äußerung durch den Träger anzeigt, und daher kann die Signalverarbeitungseinheit 203 die Äußerung des Trägers basierend darauf selbst für ein Schwingungssensorsignal erkennen, zu dem das Rauchen addiert ist.
  • Verarbeitung durch die Signalverarbeitungseinrichtung 200 wird in der ersten Ausführungsform so durchgeführt, wie vorstehend beschrieben.
  • <2. Zweite Ausführungsform>
  • [2-1. Konfiguration einer Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 5 eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer zweiten Ausführungsform beschrieben. Die Konfiguration eines Kopfhörers 100 ähnelt dem Konfiguration des Kopfhörers 100 in der ersten Ausführungsform.
  • Die Signalverarbeitungseinrichtung 200 weist eine Schwingungsberechnungseinheit 204, eine Rauscherzeugungseinheit 201, eine Rauschadditionseinheit 202 und eine Signalverarbeitungseinheit 203 auf.
  • Die Schwingungsberechnungseinheit 204 berechnet eine Momentangröße eines Wiedergabesignals zum Ausgeben von Ton von einer Schwingungswiedergabeeinheit 130. Die Schwingungsberechnungseinheit 204 gibt ein Berechnungsergebnis an die Rauscherzeugungseinheit 201 aus. Die Größe des Wiedergabesignals weist eine Momentangröße auf, wobei „momentan“ zum Beispiel in Einheiten von Millisekunden ist, aber die vorliegende Technologie ist nicht darauf beschränkt. Die Größe des Wiedergabesignals kann eine Schwingungsspitze innerhalb einer vorgegebenen Zeit oder ein Mittelwert innerhalb einer vorgegebenen Zeit sein.
  • Beim Berechnen der Momentangröße eines Wiedergabesignals kann die Schwingungsberechnungseinheit 204 ein bestimmtes Zeitintervall des von der Schwingungswiedergabeeinheit 130 wiedergegebenen Wiedergabesignals ausschneiden, nach Bedarf ein Filter wie etwa ein Hochpassfilter, ein Tiefpassfilter oder ein Bandpassfilter anwenden und Energie (einen Effektivwert oder dergleichen) eines nachfolgenden Wiedergabesignals erhalten.
  • Die Rauscherzeugungseinheit 201 bestimmt auf der Basis eines Ergebnisses der Berechnung durch die Schwingungsberechnungseinheit 204 eine Größe von Rauschen, das zum Schwingungssensorsignal addiert werden soll, und erzeugt Rauschen. Die Rauscherzeugungseinheit 201 erhöht das erzeugte Rauschen, wenn die Größe des Wiedergabesignals groß ist, und verringert das erzeugte Rauschen, wenn die Größe des Wiedergabesignals klein ist, um die Größe des Rauschens gemäß der Momentangröße des Wiedergabesignals zeitlich zu ändern, sodass die Größe des Rauschens proportional zur Größe des Wiedergabesignals ist.
  • Außerdem wird im Voraus vorhergesagt, wie viel Schalldruck der Tonausgabe von der Schwingungswiedergabeeinheit 130 auf einen Schwingungssensor 140 übertragen wird, und die Größe des Rauschens kann auf der Basis des Vorhersagewerts bestimmt werden. Falls zum Beispiel im Voraus bekannt ist, dass eine Größe eines im Schwingungssensor 140 durch Übertragung zum Schwingungssensor 140 aufgezeichneten Signals einer Schwingung eines Gehäuses 110 aufgrund von Ton, der von der Schwingungswiedergabeeinheit 130 ausgegeben wird, das 0,1-fache einer Größe eines Wiedergabesignals zum Ausgeben von Ton von der Schwingungswiedergabeeinheit 130 beträgt und, falls eine Größe des von der Schwingungswiedergabeeinheit 130 ausgegebenen Tons A ist, dann muss eine Größe des von der Rauscherzeugungseinheit 201 erzeugten Rauschens nur auf 0,1A gesetzt werden.
  • Demnach wird in der zweiten Ausführungsform die Größe des zum Schwingungssensorsignal addierten Rauschens gemäß einer Momentangröße eines Wiedergabesignal zum Ausgeben von Ton von der Schwingungswiedergabeeinheit 130 zeitlich geändert.
  • Es ist zu erwähnen, dass wie in der ersten Ausführungsform zum Beispiel weißes Rauschen, Schmalbandrauschen, rosa Rauschen oder dergleichen als das Rauschen verwendet werden können. Die Art des Rauschens ist nicht beschränkt, solange das Signal von einer Schwingungscharakteristik eines Erkennungsziels verschieden ist, und das Rauschen kann gemäß dem Wiedergabesignal selektiv verwendet werden.
  • Wie in der ersten Ausführungsform addiert die Rauschadditionseinheit 202 das von der Rauscherzeugungseinheit 201 erzeugte Rauschen zum Schwingungssensorsignal und gibt das Schwingungssensorsignal an die Signalverarbeitungseinheit 203 aus.
  • Wie in der ersten Ausführungsform erkennt die Signalverarbeitungseinheit 203 eine Äußerung durch einen Träger auf der Basis des Schwingungssensorsignals, zu dem das Rauschen durch die Rauschadditionseinheit 202 addiert wurde.
  • Die Signalverarbeitungseinrichtung 200 gemäß der zweiten Ausführungsform ist so ausgebildet, wie vorstehend beschrieben.
  • [2-2. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 6 und 7 Verarbeitung durch die Signalverarbeitungseinrichtung 200 in der zweiten Ausführungsform beschrieben.
  • Der Schwingungssensor 140 erfasst Schwingung des Gehäuses 110 und gibt ein Schwingungssensorsignal, das als Ergebnis des Erfassens erhalten wird, an die Signalverarbeitungseinrichtung 200 aus. Wenn der Schwingungssensor 140 ein Schwingungssensorsignal ausgibt, empfängt die Rauschadditionseinheit 202 das Schwingungssensorsignal in Schritt S201.
  • Wenn außerdem ein Wiedergabesignal von einer Signalausgabeeinheit 121 ausgegeben wird, empfängt die Schwingungsberechnungseinheit 204 das Wiedergabesignal in Schritt S202.
  • Als Nächstes berechnet die Schwingungsberechnungseinheit 204 in Schritt S203 eine Momentangröße des Wiedergabesignals. Die Schwingungsberechnungseinheit 204 gibt ein Berechnungsergebnis an die Rauscherzeugungseinheit 201 aus. Es ist zu erwähnen, dass Schritt S202 und S203 nicht unbedingt nach Schritt S201 ausgeführt zu werden brauchen, sondern sie können auch vor Schritt S201 ausgeführt werden, oder sie können fast gleichzeitig mit Schritt S201 ausgeführt werden.
  • Als Nächstes erzeugt die Rauscherzeugungseinheit 201 in Schritt S204 Rauschen, das zum Schwingungssensorsignal addiert werden soll, auf der Basis der von der Schwingungsberechnungseinheit 204 berechneten Größe des Wiedergabesignals und gibt das Rauschen an die Rauschadditionseinheit 202 aus.
  • Als Nächstes addiert die Rauschadditionseinheit 202 in Schritt S205 das Rauschen zum Schwingungssensorsignal und gibt das Schwingungssensorsignal, zu dem das Rauschen addiert ist, an die Signalverarbeitungseinheit 203 aus. Die Rauschadditionseinheit 202 addiert Rauschen zum Schwingungssensorsignal, während der Schwingungssensor 140 eine Schwingung erfasst, die aufgrund von Ton erzeugt wird, der von der Schwingungswiedergabeeinheit 130 ausgegeben wird, und das Schwingungssensorsignal in die Rauschadditionseinheit 202 eingegeben wird.
  • Als Nächstes führt die Signalverarbeitungseinheit 203 in Schritt S206 Äußerungserkennungsverarbeitung auf der Basis des Schwingungssensorsignals durch, zu dem das Rauschen durch die Rauschadditionseinheit 202 addiert wurde. Die Äußerungserkennungsverarbeitung wird durch ein Verfahren durchgeführt, das dem Verfahren zur Äußerungserkennungsverarbeitung in der ersten Ausführungsform ähnelt. Falls die Signalverarbeitungseinheit 203 eine Äußerung durch den Träger erkennt, gibt die Signalverarbeitungseinheit 203 Informationen, die ein Ergebnis der Erkennung angeben, an eine externe Verarbeitungseinheit oder dergleichen aus.
  • 7A ist ein Beispiel, in dem eine Übertragungskomponente der Schwingung des Gehäuses 110 zum Schwingungssensor 140 durch eine Beziehung zwischen Zeit und Schalldruck dargestellt ist, die aus dem Schwingungssensorsignal erhalten wird, wobei die Schwingung auf die Tonausgabe von der Schwingungswiedergabeeinheit 130 zurückzuführen ist. In 7A wird kein Rauschen zum Schwingungssensorsignal addiert. Falls daher eine menschliche Stimme in der Tonausgabe von der Schwingungswiedergabeeinheit 130 enthalten ist, wird ein Schwingungsmuster ähnlich einem Schwingungsmuster in einem Fall, in dem sich der Träger äußert, in den Schwingungssensor 140 eingegeben, auch wenn sich der Träger nicht äußert. In diesem Fall kann der Schwingungssensor 140 die Schwingung des Gehäuses 110 aufgrund der Stimme in der Tonausgabe von der Schwingungswiedergabeeinheit 130 erfassen und die Signalverarbeitungseinheit 203 kann irrtümlicherweise erkennen, dass der Träger sich geäußert hat.
  • Außerdem bedeutet das Addieren von Rauschen zum Schwingungssensorsignal Addieren von Rauschen zum Schwingungssensorsignal, falls die Schwingung des Gehäuses 110 aufgrund der Äußerung durch den Träger erfasst wird. Folglich kann sich die Genauigkeit des Erkennens der Äußerung durch den Träger durch die Signalverarbeitungseinheit 203 verschlechtern.
  • Um diese fehlerhafte Erkennung und die Verschlechterung der Genauigkeit der Äußerungserkennung zu verhindern, wird in der zweiten Ausführungsform Rauschen, das gemäß der Momentangröße des Wiedergabesignal zum Ausgeben von Ton von der Schwingungswiedergabeeinheit 130 zeitlich geändert wird, zum Schwingungssensorsignal addiert. Durch Addieren des gemäß der Momentangröße des Wiedergabesignals zeitlich geänderten Rauschens zum Schwingungssensorsignal ist das zum Schwingungssensorsignal zu addierende Rauschen umso größer, je größer die Schwingung des Gehäuses 110 ist und, falls die Schwingung des Gehäuses 110 gering ist, ist auch das zum Schwingungssensorsignal zu addierende Rauschen gering, und eine Übertragungskomponente der Schwingung des Gehäuses 110 aufgrund des von der Schwingungswiedergabeeinheit 130 ausgegebenen Tons zum Schwingungssensor 140 ändert sich, wie in 7B dargestellt, und wird durch das Rauschen maskiert.
  • Wenn folglich eine menschliche Stimme in der Tonausgabe von der Schwingungswiedergabeeinheit 130 enthalten ist, ähnelt ein Schwingungsmuster eines Schwingungssensorsignals in einem Fall, in dem Schwingung des Gehäuses 110 aufgrund des von der Schwingungswiedergabeeinheit 130 ausgegebenen Tons erfasst wird, nicht einem Schwingungsmuster eines Schwingungssensorsignals in einem Fall, in dem Schwingung des Gehäuses 110 aufgrund einer Äußerung durch den Träger erfasst wird. Daher unterscheidet sich das Schwingungssensorsignal von einem Schwingungssensorsignal, falls Schwingung aufgrund menschlicher Stimme erfasst wird, wodurch verhindert werden kann, dass die Signalverarbeitungseinheit 203 irrtümlicherweise eine Äußerung durch den Träger erkennt.
  • Da außerdem das zum Schwingungssensorsignal addierte Rauschen ein minimales Rauschen ist, das erforderlich ist, um gemäß der Momentangröße des Wiedergabesignals zeitlich geändert zu werden und die Übertragungskomponente zum Schwingungssensor 140 zu maskieren, wird das Schwingungssensorsignal nicht mehr als nötig maskiert. Daher ist es möglich, eine Erfolgsrate des Erkennens einer Äußerung durch den Träger auf der Basis des Schwingungssensorsignals aufrechtzuerhalten.
  • Verarbeitung durch die Signalverarbeitungseinrichtung 200 in der zweiten Ausführungsform wird so durchgeführt, wie vorstehend beschrieben.
  • Es ist zu erwähnen, dass, falls die von der Schwingungsberechnungseinheit 204 berechnete Momentangröße des Wiedergabesignals gleich einem oder kleiner als ein vorgegebener Schwellenwert th1 ist, möglicherweise kein Rauschen zum Schwingungssensorsignal addiert wird.
  • Außerdem kann eine Frequenzcharakteristik des zu addierenden Rauschens gemäß einer Frequenzcharakteristik der von der Schwingungswiedergabeeinheit 130 wiedergegebenen Schwingung geändert werden. Zum Beispiel kann Rauschen eine Frequenzcharakteristik aufweisen, die umgekehrt proportional zur Frequenzcharakteristik der von der Schwingungswiedergabeeinheit 130 wiedergegebenen Schwingung ist, so dass die Frequenzcharakteristik des Schwingungssensorsignals nach dem Addieren von Rauschen flach sein kann.
  • Der Schwingungssensor 140 erfasst Schwingung des Gehäuses 110 und gibt ein Schwingungssensorsignal, das als Ergebnis des Erfassens erhalten wird, an die Signalverarbeitungseinrichtung 200 aus. In der ersten und der zweiten Ausführungsform wird die Äußerungserkennung durch die Signalverarbeitungseinheit 203 nach dem Addieren von Rauschen zum Schwingungssensorsignal durchgeführt. Wenn die Größe des Tons der Äußerung durch den Träger hinlänglich größer als die Stimmausgabe von der Schwingungswiedergabeeinheit 130 ist, wird die Übertragungskomponente der Schwingung des Gehäuses 110 aufgrund der Stimme des Trägers nicht durch das Rauschen maskiert, selbst wenn die Übertragungskomponente der Schwingung des Gehäuses 110 aufgrund des von der Schwingungswiedergabeeinheit 130 ausgegebenen Tons durch das Rauschen maskiert wird, und daher kann die Signalverarbeitungseinheit 203 die Äußerung durch den Träger erkennen.
  • Die erste und die zweite Ausführungsform können selbst in einem Fall ausgeführt werden, in dem das Wiedergabesignal zum Ausgeben von der Schwingungswiedergabeeinheit 130 und das Schwingungssensorsignal zeitlich nicht streng miteinander synchronisiert sind. Falls zum Beispiel ein Takt des Wiedergabesignals und ein Takt des Schwingungssensorsignals sich voneinander unterscheiden, das heißt, falls es schwierig oder unmöglich ist, das Wiedergabesignal und das Schwingungssensorsignal in Abhängigkeit von einer Systemkonfiguration vollständig zu synchronisieren, sind die erste Ausführungsform und die zweite Ausführungsform effektiv.
  • Es ist zu erwähnen, dass in der zweiten Ausführungsform, falls die von der Schwingungswiedergabeeinheit 130 wiedergegebene Schwingung groß ist, das zum Schwingungssensorsignal addierte Rauschen ebenfalls zunimmt und das Schwingungssensorsignal maskiert wird, wodurch die Genauigkeit des Erkennens der Äußerung durch den Träger abnehmen kann. Dies ist darauf zurückzuführen, dass eine relative Größe der Stimme des Trägers in Bezug auf die Größe des von der Schwingungswiedergabeeinheit 130 ausgegebenen Tons klein ist. In solch einem Fall muss sich der Träger daher mit einer Stimme äußern, die lauter als die Größe des von der Schwingungswiedergabeeinheit 130 ausgegebene Ton ist.
  • Daher kann der Träger bei einer elektronischen Vorrichtung 300, beispielsweise einem Smartphone, die mit dem Kopfhörer 100 verbunden, synchronisiert, gekoppelt oder dergleichen ist, über diese Tatsache informiert werden, wie in 8 veranschaulicht. Beispiele für Verfahren zur Benachrichtigung umfassen eine Anzeige einer Nachricht oder eines Symbols auf einem Bildschirm 301, der in 8A veranschaulicht ist, und Aufleuchten oder Blinken der LED 302, die in 8B veranschaulicht ist. Neben dem Smartphone kann die elektronische Vorrichtung eine am Körper tragbare Vorrichtung, ein Personalcomputer, eine Tablet-Endgerät, eine tragbare Musikwiedergabevorrichtung oder dergleichen sein.
  • Alternativ kann ein Eingabevorgang vorbereitet werden, der es einem Träger ermöglicht, einen Grund zu erfahren, wenn eine Äußerung durch den Träger nicht erkannt werden kann, und der Grund kann dem Träger mitgeteilt werden, wenn der Eingabevorgang auf der elektronischen Vorrichtung 300 oder dem Kopfhörer 100 durchgeführt wird.
  • <3. Dritte Ausführungsform>
  • [3-1. Konfiguration einer Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 9 eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer dritten Ausführungsform beschrieben. Die Konfiguration eines Kopfhörers 100 ähnelt dem Konfiguration des Kopfhörers 100 in der ersten Ausführungsform.
  • Die Signalverarbeitungseinrichtung 200 weist eine Übertragungskomponentenvorhersageeinheit 205, eine Übertragungskomponentensubtraktionseinheit 206 und eine Signalverarbeitungseinheit 203 auf.
  • Auf der Basis eines von einer Signalausgabeeinheit 121 an eine Schwingungswiedergabeeinheit 130 ausgegebenen Wiedergabesignals sagt die Übertragungskomponentenvorhersageeinheit 205 eine Übertragungskomponente von Schwingung eines Gehäuses 110 zu einem Schwingungssensor 140 aufgrund eines von der Schwingungswiedergabeeinheit 130 ausgegebenen Tons vorher. Die Übertragungskomponentenvorhersageeinheit 205 gibt die vorhergesagte Übertragungskomponente an die Übertragungskomponentensubtraktionseinheit 206 aus.
  • Als ein Verfahren zur Vorhersage einer Übertragungskomponente gibt es zum Beispiel ein Verfahren, in dem eine Charakteristik von Übertragung (Impulsantwort) von der Schwingungswiedergabeeinheit 130 zum Schwingungssensor 140 im Voraus (zum Beispiel vor dem Versand eines Produkts, das die Signalverarbeitungseinrichtung 200) aufweist) gemessen wird, und die im Voraus gemessene Übertragungscharakteristik wird in dem von der Schwingungswiedergabeeinheit 130 als Ton ausgegebenen Wiedergabesignal gefaltet.
  • Da sich die Übertragungscharakteristik in Abhängigkeit von einer Bedingung wie etwa einer Größe oder einer Art des Wiedergabesignals ändern kann, können Übertragungscharakteristiken unter einer Mehrzahl von Bedingungen gemessen werden und eine geeignete Übertragungscharakteristik kann gemäß einer Bedingung wie etwa der Größe des Wiedergabesignals ausgewählt und gefaltet werden.
  • Außerdem kann sich die Übertragungscharakteristik im Kopfhörer 100 in Abhängigkeit von verschiedenen Bedingungen wie etwa einem Unterschied beim Träger, einem Unterschied in der Größe oder im Material eines Ohrstückes 150 oder einem Unterschied im Zustand des Kontakts mit einem Ohr des Trägers ändern. Um dies zu bewältigen, kann die Übertragungscharakteristik in einem Zustand gemessen werden, in dem der Träger den Kopfhörer 100 verwendet. Wenn bei der Messung der Übertragungscharakteristik bei einer vom Träger beabsichtigten Zeitvorgabe eine Messstartanweisung gegeben wird, kann ein spezifiziertes Signal wie etwa ein Sweep-Signal von der Schwingungswiedergabeeinheit 130 wiedergegeben werden und die Übertragungscharakteristik kann auf der Basis eines Signals des Schwingungssensors 140 zu diesem Zeitpunkt erhalten werden.
  • Da in dem vorstehend beschriebenen Verfahren die Übertragungskomponentensubtraktionseinheit 206 Signale in Einheiten von Abtastwerten subtrahiert, müssen ein Schwingungssensorsignal und die von der Übertragungskomponentenvorhersageeinheit 205 vorhergesagte Übertragungskomponente die gleichen Abtastfrequenzen aufweisen und zeitlich in Einheiten von Abtastwerten miteinander synchronisiert sein. Falls sich eine ursprüngliche Abtastfrequenz eines von der Schwingungswiedergabeeinheit 130 wiedergegebenen Wiedergabesignals von der Abtastfrequenz des Schwingungssensorsignals unterscheidet, muss das vorstehend beschriebene Verfahren nur nach dem Durchführen einer Abtastfrequenzumwandlung durchgeführt werden. Falls außerdem das Wiedergabesignal und das Schwingungssensorsignal aufgrund von Softwareverarbeitung zeitlich verschoben sind, muss nur eine entsprechende Synchronisationskorrekturverarbeitung durchgeführt werden. Außerdem kann ein Takt gemeinsam genutzt werden, sodass das Wiedergabesignal mit dem Schwingungssensorsignal synchronisiert ist. Außerdem können Takte des Schwingungssensors 140 und der Schwingungswiedergabeeinheit 130 und eine Abtastrate durch Verwenden einer Verzögerungsschaltung synchronisiert werden.
  • Die Übertragungskomponentensubtraktionseinheit 206 subtrahiert die von der Übertragungskomponentenvorhersageeinheit 205 vorhergesagte Übertragungskomponente vom Schwingungssensorsignal und gibt das Schwingungssensorsignal, das der Subtraktionsverarbeitung unterzogen wurde, an die Signalverarbeitungseinheit 203 aus. Die Übertragungskomponentensubtraktionseinheit 206 entspricht einer Verarbeitungseinheit in den Ansprüchen. Die Übertragungskomponentensubtraktionseinheit 206, die eine Verarbeitungseinheit ist, ändert ein Schwingungssensorsignal so, dass eine Äußerung in der Äußerungserkennungsverarbeitung durch die Signalverarbeitungseinheit 203 schwer zu erkennen ist.
  • Die Signalverarbeitungseinheit 203 erkennt eine Äußerung durch den Träger auf der Basis des Schwingungssensorsignals, an dem die Subtraktionsverarbeitung durch die Übertragungskomponentensubtraktionseinheit 206 durchgeführt wird. Ein Äußerungserkennungsverfahren ähnelt dem Äußerungserkennungsverfahren in der ersten Ausführungsform.
  • Die Signalverarbeitungseinrichtung 200 gemäß der dritten Ausführungsform ist so ausgebildet, wie vorstehend beschrieben.
  • [3-2. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 10 Verarbeitung durch die Signalverarbeitungseinrichtung 200 in der dritten Ausführungsform beschrieben.
  • Der Schwingungssensor 140 erfasst Schwingung des Gehäuses 110 und gibt ein Schwingungssensorsignal, das als Ergebnis des Erfassens erhalten wird, an die Signalverarbeitungseinrichtung 200 aus. Wenn der Schwingungssensor 140 ein Schwingungssensorsignal ausgibt, empfängt die Übertragungskomponentensubtraktionseinheit 206 das Schwingungssensorsignal in Schritt S301.
  • Wenn außerdem ein Wiedergabesignal von einer Signalausgabeeinheit 121 ausgegeben wird, empfängt die Übertragungskomponentenvorhersageeinheit 205 das Wiedergabesignal in Schritt S302.
  • Als Nächstes sagt die Übertragungskomponentenvorhersageeinheit 205 in Schritt S303 die Übertragungskomponente auf der Basis des Wiedergabesignals vorher und gibt ein Ergebnis der Vorhersage an die Übertragungskomponentensubtraktionseinheit 206 aus.
  • Es ist zu erwähnen, dass Schritt S302 und S303 nicht unbedingt nach Schritt S301 ausgeführt zu werden brauchen, sondern sie können auch vor oder fast gleichzeitig mit Schritt S301 ausgeführt werden.
  • Als Nächstes subtrahiert die Übertragungskomponentensubtraktionseinheit 206 in Schritt S304 eine vorhergesagte Übertragungskomponente vom Schwingungssensorsignal und gibt das Schwingungssensorsignal, das der Subtraktionsverarbeitung unterzogen wurde, an die Signalverarbeitungseinheit 203 aus. Die Subtraktion der vorhergesagten Übertragungskomponente vom Schwingungssensorsignal durch die Übertragungskomponentensubtraktionseinheit 206 wird durchgeführt, während der Schwingungssensor 140 eine von der Schwingungswiedergabeeinheit 130 erzeugte Schwingung erfasst und das Schwingungssensorsignal an die Rauschadditionseinheit 202 ausgegeben wird.
  • Als Nächstes führt die Signalverarbeitungseinheit 203 in Schritt S305 Äußerungserkennungsverarbeitung auf der Basis des Schwingungssensorsignals durch, das der Subtraktionsverarbeitung unterzogen wurde. Die Äußerungserkennungsverarbeitung wird durch ein Verfahren durchgeführt, das dem Verfahren zur Äußerungserkennungsverarbeitung in der ersten Ausführungsform ähnelt. Falls die Signalverarbeitungseinheit 203 eine Äußerung durch den Träger erkennt, gibt die Signalverarbeitungseinheit 203 Informationen, die ein Ergebnis der Erkennung angeben, an eine externe Verarbeitungseinheit oder dergleichen aus.
  • Verarbeitung durch die Signalverarbeitungseinrichtung 200 in der dritten Ausführungsform wird so durchgeführt, wie vorstehend beschrieben. In der dritten Ausführungsform wird die Übertragungskomponente, wobei es sich um einen Einfluss von Schwingung des Gehäuses 110 aufgrund eines von der Schwingungswiedergabeeinheit 130 ausgegebenen Tons auf ein Schwingungssensorsignal handelt, vorhergesagt und vom Schwingungssensorsignal subtrahiert, wodurch es möglich ist, Verschlechterung der Äußerungserkennungsleistung aufgrund von Schwingung zu verhindern, die von der Schwingungswiedergabeeinheit 130 wiedergegeben wird.
  • <4. Vierte Ausführungsform>
  • [4-1. Konfiguration einer Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 11 eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer vierten Ausführungsform beschrieben. Die Konfiguration eines Kopfhörers 100 ähnelt dem Konfiguration des Kopfhörers 100 in der ersten Ausführungsform.
  • Die Signalverarbeitungseinrichtung 200 weist eine Schwingungsberechnungseinheit 204, eine Signalverarbeitungssteuereinheit 207 und eine Signalverarbeitungseinheit 203 auf.
  • Wie in der zweiten Ausführungsform berechnet die Schwingungsberechnungseinheit 204 eine Momentangröße eines Wiedergabesignals zum Ausgeben von Ton von einer Schwingungswiedergabeeinheit 130. Die Schwingungsberechnungseinheit 204 gibt ein Berechnungsergebnis an die Signalverarbeitungssteuereinheit 207 aus. Die Größe des Wiedergabesignals weist eine Momentangröße auf, wobei „momentan“ zum Beispiel in Einheiten von Millisekunden ist, aber die vorliegende Technologie ist nicht darauf beschränkt. Die Größe des Wiedergabesignals kann eine Schwingungsspitze innerhalb einer vorgegebenen Zeit oder ein Mittelwert innerhalb einer vorgegebenen Zeit sein.
  • Die Signalverarbeitungssteuereinheit 207 führt auf der Basis eines Ergebnisses der Berechnung durch die Schwingungsberechnungseinheit 204 Steuerung zum Ein- /Ausschalten des Betriebs der Signalverarbeitungseinheit 203 durch. Die Signalverarbeitungssteuereinheit 207 führt Verarbeitung zum Ausschalten des betriebs der Signalverarbeitungseinheit 203 durch, sodass eine Äußerung schwer zu erkennen ist. Falls eine von der Schwingungsberechnungseinheit 204 berechnete Größe des Wiedergabesignals gleich einem oder größer als ein voreingestellter Schwellenwert th2 ist, gibt die Signalverarbeitungssteuereinheit 207 ein Steuersignal zum Ausschalten der Signalverarbeitungseinheit 203 aus, sodass die Signalverarbeitungseinheit 203 keine Signalverarbeitung durchführt. Falls indessen die Größe des Wiedergabesignals nicht gleich einem oder größer als der Schwellenwert th2 ist, gibt die Signalverarbeitungseinheit 203 ein Steuersignal zum Einschalten der Signalverarbeitungseinheit 203 aus, sodass die Signalverarbeitungseinheit 203 Signalverarbeitung durchführt. Der Schwellenwert th2 wird auf einen Wert gesetzt, bei dem die Größe des Wiedergabesignals voraussichtlich die Signalverarbeitung unter Verwendung des Schwingungssensorsignals beeinflusst. Die Signalverarbeitungssteuereinheit 207 entspricht einer Verarbeitungseinheit in den Ansprüchen.
  • Die Signalverarbeitungseinheit 203 erkennt eine Äußerung durch einen Träger auf der Basis des Schwingungssensorsignals. Ein Äußerungserkennungsverfahren ähnelt dem Äußerungserkennungsverfahren in der ersten Ausführungsform. Die Signalverarbeitungseinheit 203 funktioniert nur, falls das Steuersignal zum Einschalten der Signalverarbeitungseinheit 203 von der Signalverarbeitungssteuereinheit 207 empfangen wird.
  • Die Signalverarbeitungseinrichtung 200 gemäß der vierten Ausführungsform ist so ausgebildet, wie vorstehend beschrieben.
  • [4-2. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 12 eine Verarbeitung durch die Signalverarbeitungseinrichtung 200 gemäß der vierten Ausführungsform beschrieben.
  • Der Schwingungssensor 140 erfasst Schwingung des Gehäuses 110 und gibt ein Schwingungssensorsignal, das als Ergebnis des Erfassens erhalten wird, an die Signalverarbeitungseinrichtung 200 aus. Wenn der Schwingungssensor 140 ein Schwingungssensorsignal ausgibt, empfängt die Signalverarbeitungseinheit 203 das Schwingungssensorsignal in Schritt S401.
  • Außerdem empfängt die Schwingungsberechnungseinheit 204 in Schritt S402 ein von einer Signalausgabeeinheit 121 ausgegebenes Wiedergabesignal.
  • Als Nächstes berechnet die Schwingungsberechnungseinheit 204 in Schritt S403 eine Momentangröße des Wiedergabesignals. Die Schwingungsberechnungseinheit 204 gibt ein Berechnungsergebnis an die Signalverarbeitungseinheit 203 aus.
  • Es ist zu erwähnen, dass Schritt S403 nicht unbedingt nach Schritt S401 und S402 ausgeführt zu werden braucht, sondern er kann auch oder vor fast gleichzeitig mit Schritt S401 und S402 ausgeführt werden.
  • Als Nächstes vergleicht die Signalverarbeitungssteuereinheit 207 in Schritt S404 die Größe des Wiedergabesignals mit dem Schwellenwert th2 und, falls die Größe des Wiedergabesignals nicht gleich einem oder größer als der Schwellenwert th2 ist, geht die Verarbeitung zu Schritt S405 (Nein in Schritt S404) weiter.
  • Als Nächstes gibt die Signalverarbeitungssteuereinheit 207 in Schritt S405 ein Steuersignal zum Einschalten der Signalverarbeitungseinheit 203 aus, sodass die Signalverarbeitungseinheit 203 Äußerungserkennungsverarbeitung ausführt.
  • In Schritt S406 führt die Signalverarbeitungseinheit 203 dann die Äußerungserkennungsverarbeitung durch. Falls die Signalverarbeitungseinheit 203 eine Äußerung durch den Träger erkennt, gibt die Signalverarbeitungseinheit 203 Informationen, die ein Ergebnis der Erkennung angeben, an eine externe Verarbeitungseinheit oder dergleichen aus.
  • Falls indessen die Größe des Wiedergabesignals in Schritt S404 gleich einem oder größer als der Schwellenwert th2 ist, geht die Verarbeitung zu Schritt S407 (Ja in Schritt S404) weiter.
  • Als Nächstes gibt die Signalverarbeitungssteuereinheit 207 in Schritt S407 ein Steuersignal zum Ausschalten der Signalverarbeitungseinheit 203 aus, sodass die Signalverarbeitungseinheit 203 die Äußerungserkennungsverarbeitung nicht ausführt. Folglich führt die Signalverarbeitungseinheit 203 die Äußerungserkennungsverarbeitung nicht durch.
  • Die Verarbeitung in der vierten Ausführungsform wird so durchgeführt, wie vorstehend beschrieben. Gemäß der vierten Ausführungsform wird Signalverarbeitung durch die Signalverarbeitungseinheit 203 nicht durchgeführt, falls eine Größe eines Wiedergabesignals gleich einem oder größer als ein Schwellenwert th2 ist, wodurch eine nachteilige Auswirkung auf einen Träger aufgrund der Signalverarbeitung verhindert werden kann.
  • <5. Fünfte Ausführungsform>
  • [5-1. Konfiguration einer Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 13 eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer fünften Ausführungsform beschrieben. Die Konfiguration eines Kopfhörers 100 ähnelt dem Konfiguration des Kopfhörers 100 in der ersten Ausführungsform.
  • Die Signalverarbeitungseinrichtung 200 weist eine Schwingungsberechnungseinheit 204, eine Verstärkungsberechnungseinheit 208, eine Verstärkungsadditionseinheit 209 und eine Signalverarbeitungseinheit 203 auf.
  • Wie in der zweiten Ausführungsform berechnet die Schwingungsberechnungseinheit 204 eine Momentangröße eines Wiedergabesignals zum Ausgeben von Ton von einer Schwingungswiedergabeeinheit 130. Die Schwingungsberechnungseinheit 204 gibt ein Berechnungsergebnis an die Verstärkungsberechnungseinheit 208 aus. Die Größe des Wiedergabesignals weist eine Momentangröße auf, wobei „momentan“ zum Beispiel in Einheiten von Millisekunden ist, aber die vorliegende Technologie ist nicht darauf beschränkt. Die Größe des Wiedergabesignals kann eine Schwingungsspitze innerhalb einer vorgegebenen Zeit oder ein Mittelwert innerhalb einer vorgegebenen Zeit sein.
  • Falls die von der Schwingungsberechnungseinheit 204 berechnete Größe des Wiedergabesignals gleich einem oder größer als ein voreingestellter Schwellenwert th3 ist, berechnet die Verstärkungsberechnungseinheit 208 eine Verstärkung, sodass das Schwingungssensorsignal reduziert wird (berechnet eine Verstärkung von unter 0 dB), und gibt ein Ergebnis der Berechnung an die Verstärkungsadditionseinheit 209 aus.
  • Auf der Basis des Ergebnisses der Berechnung durch die Verstärkungsberechnungseinheit 208 führt die Verstärkungsadditionseinheit 209 Verarbeitung zum Multiplizieren des Schwingungssensorsignals mit der Verstärkung durch. Folglich wird das Schwingungssensorsignal reduziert. Die Verstärkungsadditionseinheit 209 entspricht einer Verarbeitungseinheit in den Ansprüchen.
  • Die Signalverarbeitungseinheit 203 erkennt die Äußerung durch den Träger auf der Basis des mit der Verstärkung durch die Verstärkungsadditionseinheit 209 multiplizierten Schwingungssensorsignals. Die Äußerungserkennungsverarbeitung wird durch ein Verfahren durchgeführt, das dem Verfahren zur Äußerungserkennungsverarbeitung in der ersten Ausführungsform ähnelt. Falls die Signalverarbeitungseinheit 203 eine Äußerung durch den Träger erkennt, gibt die Signalverarbeitungseinheit 203 Informationen, die ein Ergebnis der Erkennung angeben, an eine externe Verarbeitungseinheit oder dergleichen aus.
  • Die Signalverarbeitungseinrichtung 200 gemäß der fünften Ausführungsform ist so ausgebildet, wie vorstehend beschrieben.
  • [5-2. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 14 die Verarbeitung durch die Signalverarbeitungseinrichtung 200 in der fünften Ausführungsform beschrieben.
  • Der Schwingungssensor 140 erfasst Schwingung des Gehäuses 110 und gibt ein Schwingungssensorsignal, das als Ergebnis des Erfassens erhalten wird, an die Signalverarbeitungseinrichtung 200 aus. Wenn der Schwingungssensor 140 ein Schwingungssensorsignal ausgibt, empfängt die Verstärkungsadditionseinheit 209 das Schwingungssensorsignal in Schritt S501.
  • Wenn außerdem ein Wiedergabesignal von der Signalausgabeeinheit 121 ausgegeben wird, empfängt die Schwingungsberechnungseinheit 204 das Wiedergabesignal in Schritt S502.
  • Als Nächstes berechnet die Schwingungsberechnungseinheit 204 in Schritt S503 eine Momentangröße des Wiedergabesignals. Die Schwingungsberechnungseinheit 204 gibt ein Berechnungsergebnis an die Verstärkungsberechnungseinheit 208 aus. Es ist zu erwähnen, dass Schritt S502 und S503 nicht unbedingt nach Schritt S501 ausgeführt zu werden brauchen, sondern sie können auch vor Schritt S501 ausgeführt werden, oder sie können fast gleichzeitig mit Schritt S501 ausgeführt werden.
  • Falls als Nächstes in Schritt S504 die von der Schwingungsberechnungseinheit 204 berechnete Größe des Wiedergabesignals gleich einem oder größer als ein voreingestellter Schwellenwert th3 ist, berechnet die Verstärkungsberechnungseinheit 208 eine Verstärkung, sodass das Schwingungssensorsignal reduziert wird, und gibt ein Ergebnis der Berechnung an die Verstärkungsadditionseinheit 209 aus.
  • Als Nächstes multipliziert die Verstärkungsadditionseinheit 209 in Schritt S505 das Schwingungssensorsignal mit der Verstärkung und gibt das mit der Verstärkung multiplizierte Schwingungssensorsignal an die Signalverarbeitungseinheit 203 aus. Die Verstärkungsadditionseinheit 209 führt Verarbeitung zum Multiplizieren des Schwingungssensorsignals mit der Verstärkung durch, während der Schwingungssensor 140 eine Schwingung erfasst, die aufgrund von Ton erzeugt wird, der von der Schwingungswiedergabeeinheit 130 ausgegeben wird, und das Schwingungssensorsignal in eine Rauschadditionseinheit 202 eingegeben wird.
  • Als Nächstes führt die Signalverarbeitungseinheit 203 in Schritt S506 Äußerungserkennungsverarbeitung auf der Basis des mit der Verstärkung durch die Verstärkungsadditionseinheit 209 multiplizierten Schwingungssensorsignals durch. Die Äußerungserkennungsverarbeitung wird durch ein Verfahren durchgeführt, das dem Verfahren zur Äußerungserkennungsverarbeitung in der ersten Ausführungsform ähnelt. Falls die Signalverarbeitungseinheit 203 eine Äußerung durch den Träger erkennt, gibt die Signalverarbeitungseinheit 203 Informationen, die ein Ergebnis der Erkennung angeben, an eine externe Verarbeitungseinheit oder dergleichen aus.
  • Die Verarbeitung in der fünften Ausführungsform wird so durchgeführt, wie vorstehend beschrieben. Gemäß der fünften Ausführungsform führt die Signalverarbeitungseinheit 203 Äußerungserkennungsverarbeitung auf der Basis eines durch Multiplizieren des Schwingungssensorsignals mit einer Verstärkung reduzierten Schwingungssensorsignals durch, wodurch die Möglichkeit eines irrtümlichen Erkennens einer Äußerung durch einen Träger in einem Fall, in dem der Träger sich nicht äußert, reduziert werden kann.
  • Es ist zu erwähnen, dass es möglich ist, die Menge der Verstärkung zum Multiplizieren des Schwingungssensorsignals in der Verstärkungsadditionseinheit 209 zu reduzieren, wenn eine von der Schwingungsberechnungseinheit 204 berechnete Größe eines Wiedergabesignals zunimmt. Falls außerdem die von der Schwingungsberechnungseinheit 204 berechnete Größe des Wiedergabesignals kleiner als ein vorgegebener Wert ist, die Verstärkung auf einen Anfangswert (0 dB) zurückgesetzt wird.
  • <6. Sechste Ausführungsform>
  • [6-1. Konfiguration einer Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 15 eine Konfiguration einer Signalverarbeitungseinrichtung 200 gemäß einer sechsten Ausführungsform beschrieben. Die Konfiguration eines Kopfhörers 100 ähnelt dem Konfiguration des Kopfhörers 100 in der ersten Ausführungsform.
  • Die Signalverarbeitungseinrichtung 200 weist eine Schwingungsberechnungseinheit 204 und eine Signalverarbeitungseinheit 203 auf.
  • Wie in der zweiten Ausführungsform berechnet die Schwingungsberechnungseinheit 204 eine Momentangröße eines Wiedergabesignals zum Ausgeben von Ton von einer Schwingungswiedergabeeinheit 130. Die Schwingungsberechnungseinheit 204 gibt ein Berechnungsergebnis an die Verstärkungsberechnungseinheit 208 aus. Die Größe des Wiedergabesignals weist eine Momentangröße auf, wobei „momentan“ zum Beispiel in Einheiten von Millisekunden ist, aber die vorliegende Technologie ist nicht darauf beschränkt. Die Größe des Wiedergabesignals kann eine Schwingungsspitze innerhalb einer vorgegebenen Zeit oder ein Mittelwert innerhalb einer vorgegebenen Zeit sein.
  • Die Signalverarbeitungseinheit 203 erkennt eine Äußerung durch einen Träger auf der Basis des Schwingungssensorsignals. Die Signalverarbeitungseinheit 203 entspricht einer Verarbeitungseinheit in den Ansprüchen.
  • Die Signalverarbeitungseinrichtung 200 gemäß der sechsten Ausführungsform ist so ausgebildet, wie vorstehend beschrieben.
  • [6-2. Verarbeitung durch die Signalverarbeitungseinrichtung 200]
  • Als Nächstes wird unter Bezugnahme auf 16 die Verarbeitung durch die Signalverarbeitungseinrichtung 200 in der sechsten Ausführungsform beschrieben.
  • Der Schwingungssensor 140 erfasst Schwingung des Gehäuses 110 und gibt ein Schwingungssensorsignal, das als Ergebnis des Erfassens erhalten wird, an die Signalverarbeitungseinrichtung 200 aus. Wenn der Schwingungssensor 140 ein Schwingungssensorsignal ausgibt, empfängt die Signalverarbeitungseinheit 203 das Schwingungssensorsignal in Schritt S601.
  • Wenn außerdem ein Wiedergabesignal von der Signalausgabeeinheit 121 ausgegeben wird, empfängt die Schwingungsberechnungseinheit 204 das Wiedergabesignal in Schritt S602.
  • Als Nächstes berechnet die Schwingungsberechnungseinheit 204 in Schritt S603 eine Momentangröße des Wiedergabesignals. Die Schwingungsberechnungseinheit 204 gibt ein Berechnungsergebnis an die Signalverarbeitungseinheit 203 aus. Es ist zu erwähnen, dass Schritt S602 und S603 nicht unbedingt nach Schritt S601 ausgeführt zu werden brauchen, sondern sie können auch vor Schritt S601 ausgeführt werden, oder sie können fast gleichzeitig mit Schritt S601 ausgeführt werden.
  • Als Nächstes führt die Signalverarbeitungseinheit 203 in Schritt S604 Äußerungserkennungsverarbeitung auf der Basis des Schwingungssensorsignals durch. Die Äußerungserkennungsverarbeitung wird durch ein Verfahren durchgeführt, das dem Verfahren zur Äußerungserkennungsverarbeitung in der ersten Ausführungsform ähnelt. Falls die Signalverarbeitungseinheit 203 eine Äußerung durch den Träger erkennt, gibt die Signalverarbeitungseinheit 203 Informationen, die ein Ergebnis der Erkennung angeben, an eine externe Verarbeitungseinheit oder dergleichen aus.
  • Bei der internen Verarbeitung der Signalverarbeitungseinheit 203 wird eine Möglichkeit, dass der Schwingungssensorsignal eine menschliche Stimme enthält, durch Verwenden eines neuronalen Netzwerks oder dergleichen berechnet und es werden Parameter von 0 bis 1 erzeugt. Hinsichtlich der Parameter entspricht 0 einer Öligen Wahrscheinlichkeit, dass eine menschliche Stimme enthalten ist, und 1 entspricht einer 100%igen Wahrscheinlichkeit, dass eine menschliche Stimme enthalten. Die Signalverarbeitungseinheit 203 vergleicht den Parameter mit einem vorgegebenen Schwellenwert th4 und, wenn der Parameter gleich einem oder größer als der Schwellenwert th4 ist, beurteilt sie, dass der Träger sich geäußert hat, und gibt ein Ergebnis der Erkennung aus, das anzeigt, dass der Träger sich geäußert hat. Falls indessen der Parameter nicht gleich oder größer als der Schwellenwert th4 ist, wird beurteilt, das der Träger sich nicht geäußert hat, und es wird ein Ergebnis der Erkennung ausgegeben, das anzeigt, dass der Träger sich nicht geäußert hat.
  • Falls in diesem Fall die von der Schwingungsberechnungseinheit 204 berechnete Größe des Wiedergabesignals gleich einem oder größer als ein voreingestellter Schwellenwert th5 ist, erhöht die Signalverarbeitungseinheit 203 den Schwellenwert th4 um einen vorgegebenen Betrag (bringt den Schwellenwert th4 nahe 1), wodurch Erkennung einer Äußerung durch den Träger erschwert wird.
  • Darüber hinaus kann der Betrag, um welchen der Schwellenwert th4 erhöht wird, erhöht werden, wenn die von der Schwingungsberechnungseinheit 204 berechnete Größe des Wiedergabesignals zunimmt. Falls außerdem die von der Schwingungsberechnungseinheit 204 berechnete Größe des Wiedergabesignals unter einen vorgegebenen Wert reduziert wird, kann der Schwellenwert th4 auf einen Anfangswert zurückgesetzt wird.
  • Die Verarbeitung in der sechsten Ausführungsform wird so durchgeführt, wie vorstehend beschrieben. Gemäß der sechsten Ausführungsform wird ein Schwellenwert zum Beurteilen im Vergleich mit einem Parameter, dass ein Träger sich geäußert hat, so gesetzt, dass er Erkennung einer Äußerung erschwert, wodurch die Möglichkeit eines irrtümlichen Erkennens einer Äußerung durch einen Träger in einem Fall, in dem der Träger sich nicht äußert, reduziert werden kann.
  • <7. <Anwendungsbeispiel>
  • Falls eine Signalverarbeitungseinheit 203 gemäß den vorstehend beschriebenen Ausführungsformen eins bis vier eine Äußerung durch einen Träger erkannt hat, gibt die Signalverarbeitungseinheit 203 ein Ergebnis der Erkennung an eine externe Verarbeitungseinheit 400 außerhalb der Signalverarbeitungseinrichtung 200 aus, wie in 17 veranschaulicht. Dann kann das Äußerungserkennungsergebnis auf verschiedene Arten der Verarbeitung in der externen Verarbeitungseinheit 400 angewendet werden.
  • Wenn die externe Verarbeitungseinheit 400 ein Erkennungsergebnis, dass der Träger in einem Zustand, in dem der Träger einen Kopfhörer trägt und Ton (Musik oder dergleichen) hört, der von einer Schwingungswiedergabevorrichtung 130 ausgegeben wird, von der Signalverarbeitungseinrichtung 200 empfängt, führt die externe Verarbeitungseinheit 400 Verarbeitung zum Stoppen der Tonausgabe von der Schwingungswiedergabeeinheit 130 durch. Der von der Schwingungswiedergabeeinheit 130 ausgegebene Ton kann zum Beispiel durch Erzeugen eines Steuersignals, das eine elektronische Vorrichtung, die ein Wiedergabesignal ausgibt, zum Stoppen der Ausgabe des Wiedergabesignals anweist, und Senden des Steuersignals über eine Kommunikationseinheit an die elektronische Vorrichtung gestoppt werden.
  • Durch Erkennen, dass der Träger, der den Kopfhörer 100 trägt und den Ton hört, sich geäußert hat, und Stoppen der Tonausgabe von der Schwingungswiedergabeeinheit 130 braucht der Träger den Kopfhörer 100 nicht abzunehmen, um mit einer Person zu sprechen, oder braucht er die elektronische Vorrichtung, die das Wiedergabesignal ausgibt, nicht zum Stoppen der Tonausgabe betätigen.
  • Durch Erhöhen der Genauigkeit der Äußerungserkennung durch die Signalverarbeitungseinheit 203 gemäß der vorliegenden Technologie kann die externe Verarbeitungseinheit 400 daran gehindert werden, den von der Schwingungswiedergabeeinheit 130 ausgegebenen Ton irrtümlicherweise zu stoppen.
  • Die von der externen Verarbeitungseinheit 400 durchgeführte Verarbeitung ist nicht auf die Verarbeitung zum Stoppen der Tonausgabe von der Schwingungswiedergabeeinheit 130 beschränkt. Als weitere Verarbeitung gibt es zum Beispiel die Verarbeitung zum Umschalten eines Betriebsmodus des Kopfhörers 100.
  • Konkret ist die Betriebsmodusumschaltverarbeitung Verarbeitung zum Umschalten eines Betriebsmodus des Kopfhörers 100 in einen sogenannten Externton-Erfassungsmodus, falls der Externton-Erfassungsmodus enthalten ist, in dem der Kopfhörer 100 von der Schwingungswiedergabeeinheit 130 und einem Mikrofon Ton ausgibt, der vom Mikrofon erfasst wird, so dass der Träger den Ton leicht hören kann.
  • Durch Erkennen der Äußerung durch den Träger und Umschalten des Modus des Kopfhörers 100 in den Externton-Erfassungsmodus gemäß der vorliegenden Technologie kann der Träger bequem mit einer Person sprechen, ohne den Kopfhörer 100 abzunehmen. Dies ist zum Beispiel praktisch in einem Fall, in dem der Träger mit einem Familienmitglied oder einem Freund spricht, in einem Fall, in dem der Träger eine Bestellung in einem Restaurant oder dergleichen aufgibt, in einem Fall, in dem der Träger mit einem Steward (CA - Cabin Attendant) in einem Flugzeug spricht, und so weiter.
  • Es ist zu erwähnen, dass der Betriebsmodus des Kopfhörers vor dem Umschalten in den Externton-Erfassungsmodus ein normaler Modus oder ein Rauschunterdrückungsmodus sein kann.
  • Es ist zu erwähnen, dass die externe Verarbeitungseinheit 400 sowohl die Verarbeitung zum Stoppen der Tonausgabe von der Schwingungswiedergabeeinheit 130 als auch die Verarbeitung zum Umschalten des Betriebsmodus des Kopfhörers 100 durchführen kann. Durch das Stoppen der Ausgabe des Tons von der Schwingungswiedergabeeinheit 130 und das Umschalten des Betriebsmodus des Kopfhörers 100 in den Externton-Erfassungsmodus kann der Träger bequemer mit einer Person sprechen. Es ist zu erwähnen, dass die Verarbeitung zum Stoppen der Tonausgabe von der Schwingungswiedergabeeinheit 130 und die Verarbeitung zum Umschalten des Betriebsmodus des Kopfhörers 100 auch verschiedene Verarbeitungseinheiten durchführen können.
  • Es ist zu erwähnen, dass die externe Verarbeitungseinheit 400 durch Verarbeitung durch einen auf dem Substrat 120 innerhalb des Kopfhörers vorgesehenen Prozessor implementiert sein kann, oder sie kann durch Verarbeitung durch eine elektronische Vorrichtung implementiert sein, die mit dem Kopfhörer 100 verbunden, synchronisiert, gekoppelt oder dergleichen ist, und die Signalverarbeitungseinrichtung 200 kann mit der externen Verarbeitungseinheit 400 versehen sein.
  • <8. Modifikationen>
  • Obgleich die Ausführungsformen der vorliegenden Technologie vorstehend spezifisch beschrieben wurden, ist die vorliegende Technologie nicht auf die vorstehend beschriebenen Ausführungsformen beschränkt, sondern es sind verschiedene Modifikationen basierend auf der technischen Idee der vorliegenden Technologie möglich.
  • Die Schwingungswiedergabeeinrichtung, die die Schwingungswiedergabeeinheit 130 und einen Schwingungssensor 140 aufweist, kann ein Ohrhörer oder eine am Kopf angebrachte Anzeige sein.
  • Außerdem kann die „Signalverarbeitung unter Verwendung eines Schwingungssensorsignals“, die von der Signalverarbeitungseinheit 203 durchgeführt wird, zum Beispiel Verarbeitung zum Erkennen einer spezifischen Schwingung sein, die zum Beispiel auf eine Äußerung durch den Träger, ein Klopfen oder Pulse des Trägers oder dergleichen zurückzuführen ist.
  • Falls in der ersten und der zweiten Ausführungsform Schalldruck von Ton, der von der Schwingungswiedergabeeinheit 130 wiedergegeben wird, gleich einem oder geringer als ein vorgegebener Schwellenwert th3 ist, kann Schwingung des Gehäuses 110 aufgrund des von der Schwingungswiedergabeeinheit 130 wiedergegebenen Tons vom Schwingungssensor 140 nicht erfasst werden oder, da die Schwingung gering ist, selbst wenn sie erfasst wird, kann in der Annahme, dass die Signalverarbeitung nicht fehlerhaft ausgeführt wird, kein Rauschen zum Schwingungssensorsignal addiert werden.
  • Der Kopfhörer 100 kann zwei oder mehr Schwingungswiedergabeeinheiten 130 und zwei oder mehr Schwingungssensoren 140 aufweisen. In diesem Fall wird in der ersten und der zweiten Ausführungsform Rauschen, das zu einem von jedem der Schwingungssensoren 140 ausgegebenen Schwingungssensorsignal addiert werden soll, auf der Basis von Schwingung bestimmt, die von jeder der Schwingungswiedergabeeinheiten 130 wiedergegeben wird. Außerdem wird in der dritten Ausführungsform Verarbeitung durch Verwenden einer Charakteristik von Übertragung von jeder der Schwingungswiedergabeeinheiten 130 zu jedem der Schwingungssensoren 140 durchgeführt.
  • Die vorliegende Technologie kann auch die folgenden Konfigurationen aufweisen.
    1. (1) Signalverarbeitungseinrichtung, aufweisend eine Verarbeitungseinheit, die gemäß einer Schwingungswiedergabeeinrichtung arbeitet, die eine Schwingungswiedergabeeinheit, die Schwingung wiedergibt, und einen Schwingungssensor, der Schwingung erfasst, aufweist und Verarbeitung zum Erschweren des Erkennens einer Äußerung bei Äußerungserkennungsverarbeitung zum Erkennen einer Äußerung durch einen Träger der Schwingungswiedergabeeinrichtung auf der Basis des Schwingungssensorsignals durchführt.
    2. (2) Signalverarbeitungseinrichtung nach (1), wobei die Verarbeitungseinheit die Verarbeitung auf der Basis eines Wiedergabesignals zum Wiedergeben von Schwingung von der Schwingungswiedergabeeinheit durchführt.
    3. (3) Signalverarbeitungseinrichtung nach (1) oder (2), wobei die Verarbeitung das Schwingungssensorsignal so ändert, dass die Äußerung in der Äußerungserkennungsverarbeitung schwer zu erkennen ist.
    4. (4) Signalverarbeitungseinrichtung nach einem von (1) bis (3), wobei der Schwingungssensor die Äußerung durch den Träger auf der Basis des vom Schwingungssensor ausgegebenen Schwingungssensorsignals durch Erfassen von Schwingung eines Gehäuses der Schwingungswiedergabeeinrichtung erkennt.
    5. (5) Signalverarbeitungseinrichtung nach (3), wobei die Verarbeitungseinheit eine Rauschadditionseinheit ist, die Rauschen zum Schwingungssensorsignal addiert.
    6. (6) Signalverarbeitungseinrichtung nach (5), wobei die Signalverarbeitungseinheit ferner eine Schwingungsberechnungseinheit aufweist, die eine Größe eines Wiedergabesignal zum Wiedergeben von Schwingung von der Schwingungswiedergabeeinheit berechnet, wobei die Rauschadditionseinheit Rauschen, das der Größe des Wiedergabesignals entspricht, zum Schwingungssensorsignal addiert.
    7. (7) Signalverarbeitungseinrichtung nach (3), wobei die Verarbeitungseinheit eine Übertragungskomponentensubtraktionseinheit ist, die eine Übertragungskomponente von Schwingung zu einem Schwingungssensor vom Schwingungssensorsignal subtrahiert, wobei die Schwingung durch die Schwingungswiedergabeeinheit wiedergegeben wird.
    8. (8) Signalverarbeitungseinrichtung nach (7), wobei die Signalverarbeitungseinrichtung ferner eine Übertragungskomponentenvorhersageeinheit aufweist, die die Übertragungskomponente auf der Basis eines Wiedergabesignals zum Wiedergeben von Schwingung von der Schwingungswiedergabeeinheit vorhersagt und die vorhergesagte Übertragungskomponente an die Übertragungskomponentensubtraktionseinheit ausgibt.
    9. (9) Signalverarbeitungseinrichtung nach (2), wobei die Verarbeitungseinheit ein Signalverarbeitungssteuereinheit ist, die Aktivierung/Deaktivierung der Äußerungserkennungsverarbeitung steuert.
    10. (10) Signalverarbeitungseinrichtung nach (9), wobei die Signalverarbeitungssteuereinheit Steuerung zum Deaktivieren der Äußerungserkennungsverarbeitung durchführt, falls eine Größe des Wiedergabesignals gleich einem oder größer als ein vorgegebener Schwellenwert ist.
    11. (11) Signalverarbeitungseinrichtung nach (9), wobei die Signalverarbeitungssteuereinheit Steuerung zum Aktivieren der Äußerungserkennungsverarbeitung durchführt, falls eine Größe des Wiedergabesignals nicht gleich einem oder größer als ein vorgegebener Schwellenwert ist.
    12. (12) Signalverarbeitungseinrichtung nach (3), wobei die Verarbeitungseinheit eine Verstärkungsadditionseinheit ist, die das Schwingungssensorsignal mit einer Verstärkung multipliziert, die das Schwingungssensorsignal reduziert.
    13. (13) Signalverarbeitungseinrichtung nach (2), wobei die Verarbeitungseinheit einen Schwellenwert anpasst, der auf der Basis einer Größe des Wiedergabesignals beurteilt, dass eine Äußerung durch den Träger erkannt wird.
    14. (14) Signalverarbeitungseinrichtung nach einem von (1) bis (13), wobei die Signalverarbeitungseinrichtung, die in der Schwingungswiedergabeeinrichtung arbeitet, die Schwingungswiedergabeeinheit und den Schwingungssensor aufweist.
    15. (15) Signalverarbeitungseinrichtung nach einem von (1) bis (14), wobei die Schwingungswiedergabeeinrichtung ein Kopfhörer ist.
    16. (16) Signalverarbeitungseinrichtung nach einem von (1) bis (15), wobei der Schwingungssensor ein Beschleunigungssensor ist.
    17. (17) Signalverarbeitungseinrichtung nach einem von (1) bis (16), wobei das Wiedergabesignal ein Tonsignal ist und die Schwingungswiedergabeeinheit Schwingung mit der Ausgabe von Ton wiedergibt.
    18. (18) Signalverarbeitungsverfahren, aufweisend, dass es entsprechend einer Schwingungswiedergabeeinrichtung ausgeführt wird, die eine Schwingungswiedergabeeinheit, die Schwingung wiedergibt, und einen Schwingungssensor, der Schwingung erfasst, aufweist und Verarbeitung zum Erschweren des Erkennens einer Äußerung bei Äußerungserkennungsverarbeitung zum Erkennen einer Äußerung durch einen Träger der Schwingungswiedergabeeinrichtung auf der Basis des Schwingungssensorsignals durchführt.
    19. (19) Programm, das einen Computer zum Ausführen eines Signalverarbeitungsverfahrens veranlasst, das aufweist, dass es entsprechend einer Schwingungswiedergabeeinrichtung ausgeführt wird, die eine Schwingungswiedergabeeinheit, die Schwingung wiedergibt, und einen Schwingungssensor, der Schwingung erfasst, aufweist und Verarbeitung zum Erschweren des Erkennens einer Äußerung bei Äußerungserkennungsverarbeitung zum Erkennen einer Äußerung durch einen Träger der Schwingungswiedergabeeinrichtung auf der Basis des Schwingungssensorsignals durchführt.
  • BEZUGSZEICHENLISTE
  • 100
    Schwingungswiedergabeeinrichtung
    130
    Schwingungswiedergabeeinheit
    140
    Rauschadditionseinheit
    200
    Signalverarbeitungseinrichtung
    202
    Schwingungssensor
    203
    Signalverarbeitungseinheit
    205
    Übertragungskomponentenvorhersageeinheit
    206
    Übertragungskomponentensubtraktionseinheit
    207
    Signalverarbeitungssteuereinheit
    209
    Verstärkungsadditionseinheit
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 2011188462 [0003]

Claims (19)

  1. Signalverarbeitungseinrichtung, umfassend eine Verarbeitungseinheit, die entsprechend einer Schwingungswiedergabeeinrichtung arbeitet, die eine Schwingungswiedergabeeinheit, die Schwingung wiedergibt, und einen Schwingungssensor, der Schwingung erfasst, aufweistund Verarbeitung zum Erschweren des Erkennens einer Äußerung bei Äußerungserkennungsverarbeitung zum Erkennen einer Äußerung durch einen Träger der Schwingungswiedergabeeinrichtung auf einer Basis des Schwingungssensorsignals durchführt.
  2. Signalverarbeitungseinrichtung nach Anspruch 1, wobei die Verarbeitungseinheit die Verarbeitung auf einer Basis eines Wiedergabesignals zum Wiedergeben von Schwingung von der Schwingungswiedergabeeinheit durchführt.
  3. Signalverarbeitungseinrichtung nach Anspruch 1, wobei die Verarbeitung das Schwingungssensorsignal so ändert, dass die Äußerung in der Äußerungserkennungsverarbeitung schwer zu erkennen ist.
  4. Signalverarbeitungseinrichtung nach Anspruch 1, wobei der Schwingungssensor die Äußerung durch den Träger auf einer Basis des vom Schwingungssensor ausgegebenen Schwingungssensorsignals durch Erfassen von Schwingung eines Gehäuses der Schwingungswiedergabeeinrichtung erkennt.
  5. Signalverarbeitungseinrichtung nach Anspruch 3, wobei die Verarbeitungseinheit eine Rauschadditionseinheit ist, die Rauschen zum Schwingungssensorsignal addiert.
  6. Signalverarbeitungseinrichtung nach Anspruch 5, wobei die Signalverarbeitungseinheit ferner eine Schwingungsberechnungseinheit umfasst, die eine Größe eines Wiedergabesignals zum Wiedergeben von Schwingung von der Schwingungswiedergabeeinheit berechnet, wobei die Rauschadditionseinheit Rauschen, das der Größe des Wiedergabesignals entspricht, zum Schwingungssensorsignal addiert.
  7. Signalverarbeitungseinrichtung nach Anspruch 3, wobei die Verarbeitungseinheit eine Übertragungskomponentensubtraktionseinheit ist, die eine Übertragungskomponente von Schwingung zu einem Schwingungssensor vom Schwingungssensorsignal subtrahiert, wobei die Schwingung durch die Schwingungswiedergabeeinheit wiedergegeben wird.
  8. Signalverarbeitungseinrichtung nach Anspruch 7, wobei die Signalverarbeitungseinrichtung ferner eine Übertragungskomponentenvorhersageeinheit umfasst, die die Übertragungskomponente auf einer Basis eines Wiedergabesignals zum Wiedergegeben von Schwingung von der Schwingungswiedergabeeinheit vorhersagt und die vorhergesagte Übertragungskomponente an die Übertragungskomponentensubtraktionseinheit ausgibt.
  9. Signalverarbeitungseinrichtung nach Anspruch 2, wobei die Verarbeitungseinheit eine Signalverarbeitungssteuereinheit ist, die Aktivierung/Deaktivierung der Äußerungserkennungsverarbeitung steuert.
  10. Signalverarbeitungseinrichtung nach Anspruch 9, wobei die Signalverarbeitungssteuereinheit Steuerung zum Deaktivieren der Äußerungserkennungsverarbeitung durchführt, falls eine Größe des Wiedergabesignals gleich einem oder größer als ein vorgegebener Schwellenwert ist.
  11. Signalverarbeitungseinrichtung nach Anspruch 9, wobei die Signalverarbeitungssteuereinheit Steuerung zum Aktivieren der Äußerungserkennungsverarbeitung durchführt, falls eine Größe des Wiedergabesignals nicht gleich einem oder größer als ein vorgegebener Schwellenwert ist.
  12. Signalverarbeitungseinrichtung nach Anspruch 3, wobei die Verarbeitungseinheit eine Verstärkungsadditionseinheit ist, die das Schwingungssensorsignal mit einer Verstärkung multipliziert, die das Schwingungssensorsignal reduziert.
  13. Signalverarbeitungseinrichtung nach Anspruch 2, wobei die Verarbeitungseinheit einen Schwellenwert anpasst, der auf einer Basis einer Größe des Wiedergabesignals beurteilt, dass eine Äußerung durch den Träger erkannt wird.
  14. Signalverarbeitungseinrichtung nach Anspruch 1, wobei die Signalverarbeitungseinrichtung, die in der Schwingungswiedergabeeinrichtung arbeitet, die Schwingungswiedergabeeinheit und den Schwingungssensor aufweist.
  15. Signalverarbeitungseinrichtung nach Anspruch 1, wobei die Schwingungswiedergabeeinrichtung ein Kopfhörer ist.
  16. Signalverarbeitungseinrichtung nach Anspruch 1, wobei der Schwingungssensor einen Beschleunigungssensor ist.
  17. Signalverarbeitungseinrichtung nach Anspruch 1, wobei das Wiedergabesignal ein Tonsignal ist und die Schwingungswiedergabeeinheit Schwingung mit der Ausgabe von Ton wiedergibt.
  18. Signalverarbeitungsverfahren, umfassend, dass es: entsprechend einer Schwingungswiedergabeeinrichtung ausgeführt wird, die eine Schwingungswiedergabeeinheit, die Schwingung wiedergibt, und einen Schwingungssensor, der Schwingung erfasst, aufweist und Verarbeitung zum Erschweren des Erkennens einer Äußerung bei Äußerungserkennungsverarbeitung zum Erkennen einer Äußerung durch einen Träger der Schwingungswiedergabeeinrichtung auf einer Basis des Schwingungssensorsignals durchführt.
  19. Programm, das einen Computer zum Ausführen eines Signalverarbeitungsverfahrens veranlasst, das umfasst, dass es: entsprechend einer Schwingungswiedergabeeinrichtung ausgeführt wird, die eine Schwingungswiedergabeeinheit, die Schwingung wiedergibt, und einen Schwingungssensor, der Schwingung erfasst, aufweist und Verarbeitung zum Erschweren des Erkennens einer Äußerung bei Äußerungserkennungsverarbeitung zum Erkennen einer Äußerung durch einen Träger der Schwingungswiedergabeeinrichtung auf einer Basis des Schwingungssensorsignals durchführt.
DE112022002887.4T 2021-05-31 2022-02-28 Signalverarbeitungseinrichtung, Signalverarbeitungsverfahren und Programm Pending DE112022002887T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2021091684 2021-05-31
JP2021-091684 2021-05-31
PCT/JP2022/008288 WO2022254834A1 (ja) 2021-05-31 2022-02-28 信号処理装置、信号処理方法およびプログラム

Publications (1)

Publication Number Publication Date
DE112022002887T5 true DE112022002887T5 (de) 2024-03-21

Family

ID=84324140

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112022002887.4T Pending DE112022002887T5 (de) 2021-05-31 2022-02-28 Signalverarbeitungseinrichtung, Signalverarbeitungsverfahren und Programm

Country Status (4)

Country Link
EP (1) EP4351165A1 (de)
CN (1) CN117356107A (de)
DE (1) DE112022002887T5 (de)
WO (1) WO2022254834A1 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011188462A (ja) 2010-03-04 2011-09-22 Japan Science & Technology Agency 発話検出装置及び音声通信システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3106543B2 (ja) * 1990-05-28 2000-11-06 松下電器産業株式会社 音声信号処理装置
JP6069830B2 (ja) * 2011-12-08 2017-02-01 ソニー株式会社 耳孔装着型収音装置、信号処理装置、収音方法
US11276384B2 (en) * 2019-05-31 2022-03-15 Apple Inc. Ambient sound enhancement and acoustic noise cancellation based on context

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011188462A (ja) 2010-03-04 2011-09-22 Japan Science & Technology Agency 発話検出装置及び音声通信システム

Also Published As

Publication number Publication date
WO2022254834A1 (ja) 2022-12-08
EP4351165A1 (de) 2024-04-10
CN117356107A (zh) 2024-01-05

Similar Documents

Publication Publication Date Title
US11294619B2 (en) Earphone software and hardware
DE202018107147U1 (de) Audiovorrichtung mit kontextuell betätigtem Ventil
EP3048779B1 (de) Lautstärkeeinstellungsverfahren und -vorrichtung
CN103152546B (zh) 基于模式识别和延迟前馈控制的视频会议回声抑制方法
CN112770214B (zh) 耳机的控制方法、装置及耳机
DE112016006126T5 (de) Okklusionsreduzierung und Rauschunterdrückung auf der Grundlage einer Dichtqualität
DE102019128014A1 (de) Akustische in-ohr-erkennung für eine hörbare vorrichtung
DE112015006800T5 (de) Verfahren und Kopfhörersatz zur Verbesserung einer Tonqualität
JP2022009238A (ja) メディア補償されたパススルーおよびモード切り換え
CN113038337B (zh) 一种音频播放方法、无线耳机和计算机可读存储介质
US9439011B2 (en) Wearable speaker user detection
CN114071308A (zh) 耳机自适应调音方法、装置、耳机及可读存储介质
CN110191397B (zh) 一种降噪方法及蓝牙耳机
US11684516B2 (en) Hearing protection and communication apparatus using vibration sensors
DE112022002887T5 (de) Signalverarbeitungseinrichtung, Signalverarbeitungsverfahren und Programm
EP3319337A1 (de) Verfahren zur takterkennung mittels eines hörgerätes
CN110740413A (zh) 一种环境音监测参数校准系统及方法
DE102015212609A1 (de) Verfahren zum Betrieb eines Hörgerätesystems und Hörgerätesystem
DE102022204702A1 (de) Verfahren und system zur verarbeitung von entfernter aktiver sprache während eines anrufs
KR101693482B1 (ko) 하울링 및 에코 제거 기능을 갖는 헤드셋
CN113473304A (zh) 啸叫声抑制方法、装置、耳机及存储介质
DE112019005697T5 (de) Verfahren zur Bereitstellung von Dienstleistungen unter Verwendung eines Ohrbügels
EP4343760A1 (de) Erkennung transienter rauschereignisse für sprachentrauschung
DE102013217235A1 (de) Hörer und Headset
DE102022104516A1 (de) Automatischer akustischer handoff