DE112017007005T5 - Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung - Google Patents

Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung Download PDF

Info

Publication number
DE112017007005T5
DE112017007005T5 DE112017007005.8T DE112017007005T DE112017007005T5 DE 112017007005 T5 DE112017007005 T5 DE 112017007005T5 DE 112017007005 T DE112017007005 T DE 112017007005T DE 112017007005 T5 DE112017007005 T5 DE 112017007005T5
Authority
DE
Germany
Prior art keywords
acoustic signal
acoustic
signal
unit
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE112017007005.8T
Other languages
English (en)
Other versions
DE112017007005B4 (de
Inventor
Satoru Furuta
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112017007005T5 publication Critical patent/DE112017007005T5/de
Application granted granted Critical
Publication of DE112017007005B4 publication Critical patent/DE112017007005B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M19/00Current supply arrangements for telephone systems
    • H04M19/02Current supply arrangements for telephone systems providing ringing current or supervisory tones, e.g. dialling tone or busy tone
    • H04M19/04Current supply arrangements for telephone systems providing ringing current or supervisory tones, e.g. dialling tone or busy tone the ringing-current being generated at the substations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/002Applications of echo suppressors or cancellers in telephonic connections
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/271Devices whereby a plurality of signals may be stored simultaneously controlled by voice recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6075Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants

Abstract

Eine Akustiksignal-Verarbeitungsvorrichtung umfasst eine Akustiksignal-Analyseeinheit 30, die ein akustisches Merkmal eines Empfangssignals von einer Seite eines fernen Endes analysiert und dabei ein geeignetes Steuersignal erzeugt, einen Echounterdrücker 40a, der ein in ein Eingangsakustiksignal eingemischtes akustisches Echo unterdrückt, einen Rauschunterdrücker 40b, der in das Eingangsakustiksignal eingemischtes Rauschen unterdrückt, und eine Sprachverbesserungseinheit 40c, die ein Merkmal im Eingangsakustiksignal enthaltener Sprache verbessert, so dass unabhängig vom Typ eines Mobiltelefons oder eines Kommunikationsnetzes eine hohe Sprachqualität aufrechterhalten werden kann und Freisprech-Sprachanrufe hoher Qualität und eine sehr genaue Spracherkennung möglich werden.

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Erfindung betrifft eine Akustiksignal-Verarbeitungsvorrichtung, ein Akustiksignal-Verarbeitungsverfahren und eine Freisprech-Kommunikationsvorrichtung, die eine komfortable Sprachinterkommunikation und sehr genaue Spracherkennung in einem Sprachkommunikationssystem, in dem eine Sprachinterkommunikation über ein Kommunikationsnetz ausgeführt wird, verwirklichen.
  • TECHNISCHER HINTERGRUND
  • Einhergehend mit dem in den letzten Jahren gemachten Fortschritt in der Technologie der digitalen Signalverarbeitung sind Freisprech-Sprachanrufe in Kraftfahrzeugen und Freisprechoperationen durch Spracherkennung weit verbreitet geworden. Bei solchen Freisprechfunktionen in Kraftfahrzeugen wird eine von einer Person in einem Kraftfahrzeug geäußerte Stimme (Sendestimme) durch ein Mikrofon aufgenommen, wird die aufgenommene Stimme in Fällen eines Sprachanrufs über ein Mobiltelefon oder ein Kommunikationsnetz zur Partei eines Anrufs gesendet und wird die aufgenommene Stimme in Fällen einer Spracherkennung zu einem Computer zur Spracherkennung gesendet. Ferner wird die von der Partei des Anrufs geäußerte Stimme oder die vom Computer ausgegebene Stimme (als Empfangsstimme bezeichnet) ähnlich von einem Lautsprecher über das Mobiltelefon oder das Kommunikationsnetz ins Innere des Kraftfahrzeugs ausgegeben.
  • Solche Anrufe und Operationen werden in vielen Fällen in einer Umgebung mit hohen Pegeln eines akustischen Echos und Geräuschen, bei denen Fahrgeräusche des Fahrzeugs oder ein von einem Audiolautsprecher oder dergleichen erzeugtes akustisches Signal (akustisches Echo) in erheblichem Maße in das Mikrofon zurückgeworfen wird, ausgeführt, so dass nicht nur ein von einem Sprecher geäußertes Sprachsignal, sondern auch unnötige Signale wie Hintergrundgeräusche und akustische Echos in das Mikrofon eingegeben werden, was zur Verschlechterung der Kommunikationsstimme und zu einem Abfall der Spracherkennungsrate führt. Daher ist dieser Typ von Freisprech-Kommunikationsvorrichtungen herkömmlicherweise mit einem Echounterdrücker zur Unterdrückung des akustischen Echos und einem Rauschunterdrücker zur Unterdrückung von Geräuschen in der Art der Fahrgeräusche eines Fahrzeugs versehen.
  • Bei den vorstehend beschriebenen herkömmlichen Freisprech-Kommunikationsvorrichtungen wurden Werte von Parametern zum Steuern des Echounterdrückers und des Rauschunterdrückers jedoch auf bestimmte zur Zeit der Entwicklung der Vorrichtung eingestellte Werte gesetzt, um einen geeigneten Betrieb zu verwirklichen. Demgemäß gibt es abhängig vom Typ des mit der Freisprech-Kommunikationsvorrichtung verbundenen Mobiltelefons oder vom Typ des verwendeten Kommunikationsnetzes Fälle, in denen der Echounterdrücker und der Rauschunterdrücker ihre Leistungsfähigkeit infolge einer Differenz in einem für die Komprimierung von Audiodaten im Mobiltelefon verwendeten Sprachcodierverfahren oder einer Differenz in einem Sendesignalpegel im Kommunikationsnetz nicht ausreichend bereitstellen können, ein akustisches Echo oder Rauschen in der Sendestimme verbleibt oder ein Gefühl einer Zerstörung der Kommunikationsstimme infolge einer übermäßigen Unterdrückung der Sendestimme auftritt und folglich die bei der Entwicklung oder dergleichen angenommene vorgeschriebene Klangqualität des Anrufs nicht aufrechterhalten werden kann.
  • Daher ist zur Verwirklichung eines komfortablen Sprachanrufs und einer sehr genauen Spracherkennung eine Akustiksignal-Verarbeitungsvorrichtung erforderlich, die in der Lage ist, die Sendestimme durch Absorbieren der Differenz im Sprachcodierverfahren, im Kommunikationsnetz usw. abhängig vom Typ des mit der Freisprech-Kommunikationsvorrichtung verbundenen Mobiltelefons oder vom Typ des verwendeten Kommunikationsnetzes zu korrigieren.
  • Als Verfahren für die erwähnte Korrektur der Sendestimme existieren herkömmliche Verfahren, bei denen beispielsweise der Typ, die Telefonnummer oder dergleichen des verbundenen Mobiltelefons verwendet wird (beispielsweise Patentdokument 1 und Patentdokument 2). Diese herkömmlichen Verfahren halten die Qualität der Sendestimme durch Ändern des Inhalts der akustischen Verarbeitung des Sendesignals abhängig von Informationen über eine vorgeschriebene Telefonnummer und Informationen über das verbundene Mobiltelefon aufrecht.
  • DOKUMENTE ZUM STAND DER TECHNIK
  • PATENTDOKUMENTE
    • Patentdokument 1: japanische Patentanmeldung mit der Veröffentlichungsnummer 2000-165488 (siehe beispielsweise Absätze 0063 bis 0067)
    • Patentdokument 2: japanische Patentanmeldung mit der Veröffentlichungsnummer 2001-268212 (siehe beispielsweise Absätze 0021 bis 0046)
  • KURZFASSUNG DER ERFINDUNG
  • DURCH DIE ERFINDUNG ZU LÖSENDES PROBLEM
  • In Fällen eines anonymen Anrufs, bei denen die Telefonnummer der Partei nicht erfasst werden kann, in Fällen, in denen in der Zukunft ein Mobiltelefon auftritt, das ein neues Sprachcodierverfahren verwendet, usw. wird jedoch keine Kennung zur Identifikation in der Art einer Telefonnummer bereitgestellt, so dass bei den in Patentdokument 1 und Patentdokument 2 beschriebenen herkömmlichen Verfahren das Problem auftritt, dass es infolge der Unmöglichkeit, eine klare Unterscheidung vorzunehmen, unmöglich wird, eine akustische Signalverarbeitung korrekt auszuführen, sich die Klangqualität der Sendestimme verschlechtert und die Genauigkeit der Spracherkennung abfällt.
  • Eine Aufgabe der vorliegenden Erfindung, die gemacht wurde, um die vorstehend beschriebenen Probleme zu lösen, besteht darin, eine Akustiksignal-Verarbeitungsvorrichtung, ein Akustiksignal-Verarbeitungsverfahren und eine Freisprech-Kommunikationsvorrichtung bereitzustellen, wodurch eine hohe Qualität der Kommunikationsstimme selbst in Situationen aufrechterhalten werden kann, in denen keine Kennung zur Identifikation in der Art einer Telefonnummer bereitgestellt wird.
  • MITTEL ZUM LÖSEN DES PROBLEMS
  • Eine Akustiksignal-Verarbeitungsvorrichtung gemäß einem Aspekt der vorliegenden Erfindung weist Folgendes auf: eine Akustiksignal-Analyseeinheit, die ein akustisches Merkmal eines von einer Seite eines fernen Endes eingegebenen ersten akustischen Signals einer Empfangsstimme analysiert und ein Steuersignal zur Korrektur eines von einer Seite eines nahen Endes eingegebenen zweiten akustischen Signals einer Sendestimme entsprechend einem Analyseergebnis erzeugt, und eine Akustiksignal-Korrektureinheit, die eine Korrektur des zweiten akustischen Signals auf der Grundlage des Steuersignals ausführt.
  • Ein Akustiksignal-Verarbeitungsverfahren gemäß einem anderen Aspekt der vorliegenden Erfindung weist Folgendes auf: einen Akustiksignal-Analyseschritt zur Analyse eines akustischen Merkmals eines von einer Seite eines fernen Endes eingegebenen ersten akustischen Signals einer Empfangsstimme und zur Erzeugung eines Steuersignals zur Korrektur eines von einer Seite eines nahen Endes eingegebenen zweiten akustischen Signals einer Sendestimme entsprechend einem Analyseergebnis und einen Akustiksignal-Korrekturschritt zur Korrektur des zweiten akustischen Signals auf der Grundlage des Steuersignals.
  • Eine Freisprech-Kommunikationsvorrichtung gemäß einem anderen Aspekt der vorliegenden Erfindung weist Folgendes auf: die erwähnte Akustiksignal-Verarbeitungsvorrichtung, eine Analog-Digital-Wandlungseinheit, die eine Analog-Digital-Wandlung am zweiten akustischen Signal ausführt und dabei ein Digitalsignal erzeugt, und eine Digital-Analog-Wandlungseinheit, die eine Digital-Analog-Wandlung am ersten akustischen Signal ausführt und dabei ein Analogsignal erzeugt.
  • WIRKUNG DER ERFINDUNG
  • Gemäß der vorliegenden Erfindung kann selbst in Situationen, in denen keine Kennung zur Identifikation, wie beispielsweise eine Telefonnummer, bereitgestellt wird, eine hohe Sprachqualität aufrechterhalten werden und werden folglich ein Freisprech-Sprachanruf hoher Qualität und eine sehr genaue Spracherkennung möglich.
  • Figurenliste
  • Es zeigen:
    • 1 ein Diagramm einer allgemeinen Konfiguration einer Freisprech-Kommunikationsvorrichtung gemäß einer ersten Ausführungsform der vorliegenden Erfindung,
    • 2 ein Diagramm einer allgemeinen Konfiguration einer Akustiksignal-Analyseeinheit gemäß der ersten Ausführungsform,
    • 3 ein Blockdiagramm eines Beispiels einer Hardwarekonfiguration der Freisprech-Kommunikationsvorrichtung gemäß der ersten Ausführungsform,
    • 4 ein Blockdiagramm eines anderen Beispiels der Hardwarekonfiguration der Freisprech-Kommunikationsvorrichtung gemäß der ersten Ausführungsform,
    • 5 ein Flussdiagramm eines Teils des Betriebs der Freisprech-Kommunikationsvorrichtung gemäß der ersten Ausführungsform und
    • 6 ein Diagramm einer allgemeinen Konfiguration einer Akustiksignal-Verarbeitungsvorrichtung gemäß einer zweiten Ausführungsform der vorliegenden Erfindung.
  • MODUS ZUR AUSFÜHRUNG DER ERFINDUNG
  • Modi zur Ausführung der vorliegenden Erfindung werden nachstehend mit Bezug auf die anliegende Zeichnung beschrieben, um die vorliegende Erfindung detaillierter zu erklären. In der folgenden Beschreibung wird eine Person, die Sprache direkt zu einer Freisprech-Kommunikationsvorrichtung gemäß Ausführungsformen sendet, als ein sich am nahen Ende befindender Sprecher bezeichnet und wird eine Person, welche die mit dem sich am nahen Ende befindenden Sprecher sprechende Partei ist und Sprache zur Freisprech-Kommunikationsvorrichtung gemäß den Ausführungsformen über ein Kommunikationsnetz sendet, als sich am fernen Ende befindender Sprecher bezeichnet. Eine nachstehend beschriebene Akustiksignal-Verarbeitungsvorrichtung ist in der Lage, eine akustische Signalverarbeitung als eine der Funktionen der Freisprech-Kommunikationsvorrichtung zu implementieren. Die Akustiksignal-Verarbeitungsvorrichtung ist in der Lage, ein Verfahren zur Verarbeitung akustischer Signale zu implementieren.
  • Erste Ausführungsform
  • Konfiguration
  • 1 ist ein Diagramm, das die allgemeine Konfiguration einer Freisprech-Kommunikationsvorrichtung 100 gemäß einer ersten Ausführungsform der vorliegenden Erfindung zeigt. Die Freisprech-Kommunikationsvorrichtung 100 führt eine Sprachkommunikation zwischen einem sich am nahen Ende befindenden Sprecher 500 und einem sich am fernen Ende befindenden Sprecher 501 aus. Wie in 1 dargestellt ist, weist die Freisprech-Kommunikationsvorrichtung 100 eine Akustiksignal-Verarbeitungsvorrichtung 101, ein Mikrofon 10, einen Lautsprecher 12, eine Analog-Digital-Wandlungseinheit 20 und eine Digital-Analog-Wandlungseinheit 21 auf. Die Akustiksignal-Verarbeitungsvorrichtung 101 weist eine Akustiksignal-Analyseeinheit 30 und eine Akustiksignal-Korrektureinheit 40 auf. Die Akustiksignal-Korrektureinheit 40 weist einen Echounterdrücker 40a, einen Rauschunterdrücker 40b und eine Sprachverbesserungseinheit 40c auf.
  • Wie in 1 dargestellt ist, ist die Freisprech-Kommunikationsvorrichtung 100 mit einem Mobiltelefon 70 verbunden. Das Mobiltelefon 70 wird vom sich am nahen Ende befindenden Sprecher 500 getragen. Wie in 1 dargestellt ist, ist das Mobiltelefon 70 durch ein Kommunikationsnetz 80 mit einem Mobiltelefon 90 verbunden. Das Mobiltelefon 90 wird vom sich am fernen Ende befindenden Sprecher 501 getragen.
  • Die Freisprech-Kommunikationsvorrichtung 100 in 1 ist als ein Beispiel der in einem Fahrzeugnavigationssystem eines Kraftfahrzeugs installierten Freisprech-Kommunikationsvorrichtung 100 dargestellt. Es sei bemerkt, dass die Freisprech-Kommunikationsvorrichtung 100 nicht auf die Installation im Fahrzeugnavigationssystem eines Kraftfahrzeugs beschränkt ist, sondern dass sie beispielsweise in verschiedenen Fahrzeugtypen in der Art eines Zugs oder eines Flugzeugs installiert werden kann.
  • 1 zeigt einen Fall, in dem ein Benutzer (sich am nahen Ende befindender Sprecher 500) in einem fahrenden Kraftfahrzeug eine Sprachinterkommunikation mit einer Partei (einem sich am fernen Ende befindenden Sprecher 501) ausführt. In 1 führt der sich am nahen Ende befindende Sprecher 500 einen Freisprechanruf im Kraftfahrzeug aus, während der sich am fernen Ende befindende Sprecher 501 den Anruf mit dem Mobiltelefon in der Hand ausführt.
  • Zur Vereinfachung der Erklärung ist die Erläuterung in diesem Patentdokument auf die Freisprech-Anruffunktion begrenzt, während die anderen Funktionen des Fahrzeugnavigationssystems des Kraftfahrzeugs übergangen werden. Hier ist die vom sich am nahen Ende befindenden Sprecher 500 geäußerte Stimme als Sendestimme definiert und ist die vom sich am fernen Ende befindenden Sprecher 501 geäußerte Stimme als Empfangsstimme definiert.
  • Eine Eingabe in die Freisprech-Kommunikationsvorrichtung 100 umfasst nicht nur die vom Mikrofon 10 erfasste Sendestimme des sich am nahen Ende befindenden Sprechers 500, sondern auch Geräusche in der Art der Fahrgeräusche des Kraftfahrzeugs, der vom Lautsprecher 12 ausgegebenen Empfangsstimme des sich am fernen Ende befindenden Sprechers 501, der vom Fahrzeugnavigationssystem ausgegebenen Anleitungsstimme, eines akustischen Echos von Musik oder dergleichen vom Fahrzeugaudiosystem usw., welche gemeinsam als Eingangsakustiksignal bezeichnet werden.
  • Eine andere Eingabe in die Freisprech-Kommunikationsvorrichtung 100 ist die vom Mobiltelefon 70 ausgegebene Empfangsstimme des sich am fernen Ende befindenden Sprechers 501. Das Mobiltelefon 70 führt eine Sprachkommunikation durch Verbindung mit dem Fahrzeugnavigationssystem durch eine Drahtverbindung, durch ein drahtloses lokales Netz (LAN) oder durch eine Kurzstrecken-Drahtloskommunikation in der Art von Bluetooth (eingetragenes Warenzeichen) aus.
  • Beim Beispiel aus 1 wird angenommen, dass die Sprachkommunikation zwischen dem Mobiltelefon 70 und der Freisprech-Kommunikationsvorrichtung 100 unter Verwendung von Digitalsignalen verarbeitet wird, wobei eine Analog-Digital-Wandlung fortgelassen wird. Die Empfangsstimme wird durch ein Mikrofon 11 des vom sich am fernen Ende befindenden Sprecher 501 getragenen Mobiltelefons 90 eingegeben und durch das Kommunikationsnetz 80 zum mit der Freisprech-Kommunikationsvorrichtung 100 verbundenen Mobiltelefon 70 gesendet.
  • Die Konfiguration der Freisprech-Kommunikationsvorrichtung 100 gemäß der ersten Ausführungsform und ihr Arbeitsprinzip werden nachstehend mit Bezug auf 1 beschrieben. Die Analog-Digital-Wandlungseinheit 20 führt eine Analog-Digital-Wandlung des erwähnten Eingangsakustiksignals aus, tastet das Signal bei einer vorgeschriebenen Abtastfrequenz (beispielsweise 8 kHz) ab und wandelt das Signal in ein in Einheiten von Rahmen (beispielsweise 20 ms) unterteiltes Digitalsignal um. Das in das Digitalsignal umgewandelte Eingangsakustiksignal wird in den Echounterdrücker 40a eingegeben.
  • Die Akustiksignal-Analyseeinheit 30 analysiert ein akustisches Merkmal eines Empfangssignals als erstes Akustiksignal der vom sich am fernen Ende befindenden Sprecher 501 geäußerten Empfangsstimme und gibt entsprechend dem Analyseergebnis ein Steuersignal D3 zur Korrektur des Eingangsakustiksignals als zweites Akustiksignal der Sendestimme aus. Das Steuersignal D3 dient dem Steuern der Akustiksignal-Korrektureinheit 40 (des Echounterdrückers 40a, des Rauschunterdrückers 40b und der Sprachverbesserungseinheit 40c). Der detaillierte Betrieb der Akustiksignal-Analyseeinheit 30 wird später beschrieben.
  • Der Echounterdrücker (EC: Echo Canceller) 40a liest das Eingangsakustiksignal und das in die Freisprech-Kommunikationsvorrichtung 100 eingegebene Empfangssignal ein und unterdrückt das in das Eingangsakustiksignal eingemischte akustische Echo. Die Unterdrückung des akustischen Echos durch den Echounterdrücker 40a kann durch ein öffentlich bekanntes Verfahren unter Verwendung eines adaptiven Filters beispielsweise durch das normierte Verfahren nach der Methode der kleinsten Quadrate (LMS) ausgeführt werden. Es sei bemerkt, dass das Empfangssignal zum Lernen der Filterkoeffizienten des adaptiven Filters verwendet wird. Das der akustischen Echounterdrückung unterzogene Eingangsakustiksignal wird in den Rauschunterdrücker 40b eingegeben.
  • Der Rauschunterdrücker (NC: Noise Canceller) 40b unterdrückt das in das Eingangsakustiksignal eingemischte Rauschen. Für die Rauschunterdrückung durch den Rauschunterdrücker 40b können nach der Umwandlung des Eingangsakustiksignals in ein Spektrum im Frequenzbereich durch eine schnelle Fouriertransformation (FFT) oder dergleichen das spektrale Subtraktionsverfahren sowie öffentlich bekannte Verfahren durch Leistungsspektrumssteuerung in der Art des Minimaler-mittlerer-quadratischer-Fehler(MMSE)-Schätzungsverfahrens und des Maximum-a-Posteriori(MAP)-Schätzungsverfahrens verwendet werden. Abgesehen von den im Frequenzbereich verwendeten Verfahren kann ein Verfahren im Zeitbereich in der Art des Wiener-Filter-Verfahrens verwendet werden.
  • Die Sprachverbesserungseinheit (SE: Speech Enhancement) 40c ist eine Verarbeitungseinheit, die einen Verbesserungsprozess an der im Eingangsakustiksignal enthaltenen Sprache in Bezug auf Teile, deren Merkmale verbessert und ausgedrückt werden sollen, ausführt. Für den Sprachverbesserungsprozess gemäß dieser Ausführungsform kann beispielsweise eine Formantenverbesserung verwendet werden, die zur Verbesserung des so genannten Formanten als wichtige Peakkomponente (Komponente mit einer hohen Spektrumsamplitude) des Sprachspektrums verwendet wird.
  • Als Beispiel des Verfahrens zur Formantenverbesserung wird ein Autokorrelationskoeffizient anhand eines Hanning-gefensterten Sprachsignals erhalten, wird ein Bandbreitenerweiterungsprozess ausgeführt, wird danach ein linearer Vorhersagekoeffizient zwölfter Ordnung durch das Levinson-Durbin-Verfahren erhalten und wird ein Formantenverbesserungskoeffizient anhand des linearen Vorhersagekoeffizienten erhalten.
  • Dann kann die Formantenverbesserung durch Anwenden eines Synthesefilters des Auto-regressiver-gleitender-Mittelwert(ARMA)-Typs unter Verwendung des erhaltenen Formantenverbesserungskoeffizienten ausgeführt werden. Das Verfahren zur Formantenverbesserung ist nicht auf das vorstehend beschriebene Verfahren beschränkt, sondern es können andere öffentlich bekannte Verfahren verwendet werden.
  • Abgesehen vom vorstehend beschriebenen Sprachverbesserungsprozess kann die Sprachverbesserungseinheit 40c verschiedene öffentlich bekannte Sprachverbesserungsprozesse verwenden, wie einen Prozess zur Hervorhebung der harmonischen Struktur der Sprach-Pitch-Hervorhebung und einen Entzerrungsprozess zur Änderung der Frequenzeigenschaften des Sendesignals, sowie eine Auto-Verstärkungssteuerung (AGC) zur adaptiven Regelung des Audiopegels.
  • Die Sendestimme nach dem Durchlaufen des vorstehend beschriebenen Sprachverbesserungsprozesses wird an das Mobiltelefon 70 ausgegeben, das Mobiltelefon 70 sendet die Sendestimme durch das Kommunikationsnetz 80 zum Mobiltelefon 90 auf der am fernen Ende gelegenen Seite als Partei, und das Mobiltelefon 90 gibt die Sendestimme durch einen Empfänger 13 an den sich am fernen Ende befindenden Sprecher 501 aus.
  • Als nächstes wird ein Beispiel des Betriebs der erwähnten Akustiksignal-Analyseeinheit 30 mit Bezug auf 2 beschrieben. Wie in 2 dargestellt ist, besteht die Akustiksignal-Analyseeinheit 30 aus einer Akustische-Parameter-Berechnungseinheit 31, einer Akustische-Parameter-Analyseeinheit 32, einer Steuersignal-Erzeugungseinheit 33, einem Musterverzeichnis 34 und einer Steuertabelle 35. Wie in 2 dargestellt ist, wird das Empfangssignal gemäß der Empfangsstimme in die Akustische-Parameter-Berechnungseinheit 31 eingegeben.
  • Die Akustische-Parameter-Berechnungseinheit 31 führt einen Fensterprozess am eingegebenen aktuellen Rahmen des Empfangssignals aus, berechnet anschließend einen Mel-Frequenz-Cepstrumkoeffizienten (MFCC) N-ter Ordnung beispielsweise durch Cepstrumanalyse und gibt den MFCC N-ter Ordnung als analytischen akustischen Parameter D1 an die Akustische-Parameter-Analyseeinheit 32 aus. Hierbei ist N eine positive ganze Zahl.
  • Es sei bemerkt, dass die Cepstrumanalyse ein öffentlich bekanntes Verfahren ist, so dass hier auf die Erklärung verzichtet wird. Ein geeignetes Beispiel der MFCC-Ordnung ist N = 16, die Ordnung kann jedoch abhängig von den Frequenzeigenschaften des Empfangssignals oder dergleichen geeignet geändert werden.
  • Die Akustische-Parameter-Analyseeinheit 32 bezieht sich auf das Musterverzeichnis 34 als erste Speichereinheit, führt einen Vergleich zwischen MFCC-Daten (ersten Referenzdaten) im Musterverzeichnis 34 und dem darin eingegebenen analytischen akustischen Parameter D1 aus und gibt ein Ergebnis, das beispielsweise den geringsten euklidischen Abstand angibt, als Parameteranalyseergebnis D2, das den erhaltenen MFCC-Daten entspricht, an die Steuersignal-Erzeugungseinheit 33 aus.
  • Das Musterverzeichnis 34 ist eine Datenbank, in der mehrere MFCC-Datenbestandteile, die zuvor unter Verwendung einer großen Vielfalt und einer großen Menge akustischer Signaldaten gelernt und geclustert wurden, mit Erkennungszahlen in Bezug auf Lernzeitbedingungen assoziiert sind.
  • Die Steuersignal-Erzeugungseinheit 33 bezieht sich auf Referenzdaten (zweite Referenzdaten) in der Steuertabelle 35 als zweite Speichereinheit und erzeugt das Steuersignal D3 zur jeweiligen Steuerung des Echounterdrückers 40a, des Rauschunterdrückers 40b und der Sprachverbesserungseinheit 40c. Wenn beispielsweise als Ergebnis der Analyse der Empfangsstimme abgeleitet wird, dass das auf der am fernen Ende gelegenen Seite verwendete Mobiltelefon 90 einen Codegetrenntlage-Vielfachzugriff (CDMA) verwendet, wählt die Steuersignal-Erzeugungseinheit 33 ein Steuersignal D3 zur Echounterdrückung, zur Rauschunterdrückung und zur Sprachverbesserung in CDMA aus mehreren Steuermustern in der Steuertabelle 35 aus und gibt das ausgewählte Steuersignal D3 aus.
  • Beispielsweise erzeugt die Steuersignal-Erzeugungseinheit 33 ein Steuersignal D3 zur Verstärkung des Sprachverbesserungsprozesses und einen Echounterdrückungsbetrag beim Echounterdrückungsprozess, während der Rauschunterdrückungsbetrag im Rauschunterdrückungsprozess verringert wird. Insbesondere erzeugt die Steuersignal-Erzeugungseinheit 33 ein Steuersignal D3 zur Erhöhung des Maximalwerts des Restechounterdrückungsbetrags des Echounterdrückers 40a von 20 dB auf 40 dB und zur Erhöhung des Formantenverbesserungskoeffizienten als einer der Sprachverbesserungsprozesse von 0,2 auf 0,4, während der Maximalwert des Rauschunterdrückungsbetrags des Rauschunterdrückers 40b von 12 dB auf 3 dB verringert wird.
  • Durch Ausführen der vorstehend beschriebenen Steuerung wird eine Destabilisierung der CDMA-Stimmcodierung durch im Sendesignal enthaltene Restechokomponenten unterbunden, wird die Stimmcodiereffizienz durch starke Verbesserung eines Sprachmerkmals in der Sendestimme erhöht und wird folglich ein Anruf hoher Qualität möglich.
  • Ein weiterer Vorteil wird folgendermaßen erhalten: Während ein von der Freisprech-Kommunikationsvorrichtung 100 getrennter Rauschunterdrückungsprozess in einen CDMA-Stimmcodieralgorithmus eingebracht wurde, geschah bei herkömmlichen Verfahren infolge einer Doppelverarbeitung durch den Rauschunterdrückungsprozess in der Freisprech-Kommunikationsvorrichtung 100 und den CDMA-Rauschunterdrückungsprozess eine übermäßige Rauschunterdrückung, was zu einer erhöhten gefühlten Sprachzerstörung führte. Dagegen wird die Rauschunterdrückung bei der Ausführung der Steuerung gemäß dieser Ausführungsform mit einem geeigneten Rauschunterdrückungsbetrag gesteuert, wodurch das Sprachzerstörungsgefühl beseitigt wird, eine hohe Sprachqualität aufrechterhalten werden kann und ein Sprachanruf hoher Qualität ausgeführt werden kann.
  • Abgesehen von der vorstehend beschriebenen Steuerung kann eine Steuerung ausgeführt werden, bei der der Rauschunterdrückungsprozess in der Freisprech-Kommunikationsvorrichtung 100 in Fällen angehalten wird, in denen beispielsweise abgeleitet wird, dass beide Mobiltelefone 70 und 90 auf der Seite des nahen Endes und der Seite des fernen Endes CDMA verwenden, abgeleitet wird, dass ein Rauschunterdrückungsprozess im Kommunikationsnetz ausgeführt wird, auch wenn das Kommunikationsverfahren unbekannt ist, oder dergleichen.
  • Ferner kann in Fällen, in denen als Ergebnis der Analyse der Empfangsstimme ein erhebliches Gefühl einer Sprachdiskontinuität abgeleitet wird, nämlich in Fällen, in denen zahlreiche Übertragungsfehler im Kommunikationsnetz auftreten, eine Steuerung zur weiteren Sprachverbesserung ausgeführt werden. Durch diese Prozesse können der Rauschunterdrückungsprozess und der Sprachverbesserungsprozess durch Untersuchen verschiedener Bedingungen auf der Grundlage des Empfangssignals gesteuert werden.
  • Wenngleich der Maximalwert des Restechounterdrückungsbetrags des Echounterdrückers 40a von 20 dB auf 40 dB erhöht wird und der Formantenverbesserungskoeffizient bei einem der Sprachverbesserungsprozesse von 0,2 auf 0,4 erhöht wird, während der Maximalwert des Rauschunterdrückungsbetrags des Rauschunterdrückers 40b bei einem Beispiel der Steuerung der Verarbeitung durch den Echounterdrücker 40a, den Rauschunterdrücker 40b und die Sprachverbesserungseinheit 40c von 12 dB auf 3 dB verringert wird, ist die Steuerung nicht auf dieses Beispiel beschränkt, und sie kann beispielsweise abhängig von einem Faktor in der Art der Frequenzeigenschaften oder des Eingangspegels des Mikrofons zur Aufnahme des Eingangsakustiksignals geeignet geändert werden.
  • Es sei bemerkt, dass, wenngleich die Akustische-Parameter-Berechnungseinheit 31 gemäß der vorstehend beschriebenen Ausführungsform den MFCC als analytischen akustischen Parameter verwendet, dieser nicht auf dieses Beispiel beschränkt ist, und dass beispielsweise zusätzlich auch gut ein Parameter verwendet werden kann, der ein Merkmal der Stimme repräsentiert, wie ein durch FFT erhaltener Autokorrelationskoeffizient oder ein dadurch erhaltenes Leistungsspektrum.
  • Wenngleich gemäß der vorstehend beschriebenen Ausführungsform von der Akustische-Parameter-Analyseeinheit 32 in der Akustiksignal-Analyseeinheit 30 ein Mustervergleichsverfahren verwendet wird, ist das Verfahren nicht auf dieses Beispiel beschränkt, und es kann auch ein auf dem Maschinenlernen beruhendes Verfahren ausgeführt werden, statt die Akustische-Parameter-Analyseeinheit 32 und das Musterverzeichnis 34 zu verwenden.
  • Als auf dem Maschinenlernen beruhendes Verfahren kann ein Identifikationsverfahren verwendet werden, das beispielsweise auf Support Vector Machine (SVM), AdaBoost oder dergleichen oder einem neuronalen Netz beruht.
  • Beim auf einem neuronalen Netz beruhenden Verfahren kann beispielsweise eine Ableitung und ein verbesserter Typ eines öffentlich bekannten neuronalen Netzes in der Art eines rekurrenten neuronalen Netzes (RNN), das einen Teil des Ausgangssignals in den Eingang zurückgibt, oder eines Long Short-Term Memory(LSTM)-RNN, das durch Verbessern der Kopplungselementstruktur des RNN erhalten wird, verwendet werden.
  • 3 ist ein Blockdiagramm, das ein Beispiel der Hardwarekonfiguration der Freisprech-Kommunikationsvorrichtung 100 gemäß der ersten Ausführungsform zeigt. Die Hardwarekonfiguration der Freisprech-Kommunikationsvorrichtung 100 gemäß der ersten Ausführungsform kann durch eine hochintegrierte Schaltung (LSI) in der Art eines digitalen Signalprozessors (DSP), eine anwendungsspezifische integrierte Schaltung (ASIC) oder ein feldprogrammierbares Gate-Array (FPGA) implementiert werden.
  • Wie in 3 dargestellt ist, besteht die Hardware der Freisprech-Kommunikationsvorrichtung 100 gemäß der ersten Ausführungsform aus einer Signal-Ein-/Ausgabeeinheit 202, einer Signalverarbeitungsschaltung 203, einem Aufzeichnungsmedium 204 und einer Signalleitung 205 beispielsweise in der Art eines Busses. Ferner ist, wie in 3 dargestellt ist, die Freisprech-Kommunikationsvorrichtung 100 mit einem akustischen Wandler 201 und einer externen Vorrichtung 206 verbunden.
  • Die Signal-Ein-/Ausgabeeinheit 202 ist eine Schnittstellenschaltung, welche die Funktion des Verbindens mit dem akustischen Wandler 201 und der externen Vorrichtung 206 implementiert. Als akustischer Wandler 201 können eine Vorrichtung in der Art eines Mikrofons, welche akustische Vibrationen erfasst und sie in ein elektrisches Signal wandelt, und eine Vorrichtung beispielsweise in der Art eines Lautsprechers, die ein elektrisches Signal in akustische Vibrationen wandelt, verwendet werden.
  • Die Funktionen der Akustiksignal-Analyseeinheit 30, des Echounterdrückers 40a, des Rauschunterdrückers 40b und der Sprachverbesserungseinheit 40c, wie in 1 dargestellt, können durch die Signalverarbeitungsschaltung 203 und das Aufzeichnungsmedium 204 implementiert werden. Die Analog-Digital-Wandlungseinheit 20 und die Digital-Analog-Wandlungseinheit 21 aus 1 entsprechen der Signal-Ein-/Ausgabeeinheit 202.
  • Das Aufzeichnungsmedium 204 wird zur Sammlung verschiedener Datentypen in der Art von Signaldaten oder verschiedener Einstellungsdaten der Signalverarbeitungsschaltung 203 verwendet. Als Aufzeichnungsmedium 204 kann beispielsweise ein flüchtiger Speicher in der Art eines synchronen DRAMs (SDRAMs) oder ein nichtflüchtiger Speicher in der Art eines Festplattenlaufwerks (HDD) oder eines Halbleiterlaufwerks (SSD) verwendet werden.
  • Das Aufzeichnungsmedium 204 kann Daten in Bezug auf die Anfangszustände des Echounterdrückers 40a, des Rauschunterdrückers 40b und der Sprachverbesserungseinheit 40c, verschiedene Einstellungsdaten, Steuertabellendaten, Musterverzeichnisdaten usw. speichern.
  • Das Sendesignal wird nach Durchlaufen der akustischen Signalverarbeitung durch die Signalverarbeitungsschaltung 203 über die Signal-Ein-/Ausgabeeinheit 202 zur externen Vorrichtung 206 ausgesendet. Die externe Vorrichtung 206 entspricht dem mit der Freisprech-Kommunikationsvorrichtung 100 verbundenen Mobiltelefon 70 aus 1. Demgegenüber wird das vom Mobiltelefon 70 ausgegebene Empfangssignal über die Signal-Ein-/Ausgabeeinheit 202 in die Signalverarbeitungsschaltung 203 eingegeben.
  • 4 ist ein Blockdiagramm eines anderen Beispiels der Hardwarekonfiguration der Freisprech-Kommunikationsvorrichtung 100 gemäß der ersten Ausführungsform. Wie in 4 dargestellt ist, kann die Hardwarekonfiguration der Freisprech-Kommunikationsvorrichtung 100 gemäß der ersten Ausführungsform durch einen Computer ausgeführt werden, der eine Zentralverarbeitungseinheit (CPU) aufweist, wie einen tragbaren Computer vom Tablettyp, einen Mikrocomputer, der in eine Vorrichtung in der Art eines Fahrzeugnavigationssystems einzubetten ist, oder dergleichen.
  • Wie in 4 dargestellt ist, besteht die Hardware der Freisprech-Kommunikationsvorrichtung 100 gemäß der ersten Ausführungsform aus einer Signal-Ein-/Ausgabeeinheit 301, einem Prozessor 300, der eine CPU 302 aufweist, einem Speicher 303, einem Aufzeichnungsmedium 304 und einer Signalleitung 305 beispielsweise in der Art eines Busses.
  • Die Signal-Ein-/Ausgabeeinheit 301 ist eine Schnittstellenschaltung, welche die Funktion des Verbindens mit dem akustischen Wandler 201 und der externen Vorrichtung 206 implementiert. Der Speicher 303 ist eine Speichereinrichtung in der Art eines ROMs oder eines RAMs, die als Programmspeicher zu verwenden ist, welcher verschiedene Programme zur Implementation eines Freisprech-Kommunikationsprozesses gemäß dieser Ausführungsform speichert, ein Arbeitsspeicher, der verwendet wird, wenn der Prozessor eine Datenverarbeitung ausführt, ein Speicher zur Verbreitung von Signaldaten usw.
  • Die Funktionen der Akustiksignal-Analyseeinheit 30, des Echounterdrückers 40a, des Rauschunterdrückers 40b und der Sprachverbesserungseinheit 40c, wie in 1 dargestellt, können durch den Prozessor 300, den Speicher 303 und das Aufzeichnungsmedium 304 implementiert werden. Die Analog-Digital-Wandlungseinheit 20 und die Digital-Analog-Wandlungseinheit 21 aus 1 entsprechen der Signal-Ein-/Ausgabeeinheit 301.
  • Das Aufzeichnungsmedium 304 wird zur Sammlung verschiedener Datentypen in der Art von Signaldaten oder verschiedener Einstellungsdaten des Prozessors 300 verwendet. Als Aufzeichnungsmedium 304 kann beispielsweise ein flüchtiger Speicher in der Art eines SDRAMs oder ein nichtflüchtiger Speicher in der Art einer HDD oder einer SSD verwendet werden.
  • Das Aufzeichnungsmedium 304 kann Programme einschließlich eines Betriebssystems (OS) und verschiedene Datentypen in der Art verschiedener Einstellungsdaten und akustischer Signaldaten sammeln. Es sei bemerkt, dass die Daten im Speicher 303 im Aufzeichnungsmedium 304 gesammelt werden können.
  • Der Prozessor 300 ist in der Lage, durch die Verwendung des RAMs im Speicher 303 als Arbeitsspeicher eine der Akustiksignal-Analyseeinheit 30, dem Echounterdrücker 40a, dem Rauschunterdrücker 40b und der Sprachverbesserungseinheit 40c entsprechende Signalverarbeitung auszuführen und entsprechend einem aus dem ROM in den Speicher 303 geladenen Computerprogramm zu arbeiten.
  • Das Sendesignal wird, nachdem es der akustischen Signalverarbeitung durch den Prozessor 300 unterzogen wurde, über die Signal-Ein-/Ausgabeeinheit 301 zur externen Vorrichtung 206 gesendet. Die externe Vorrichtung 206 entspricht dem mit der Freisprech-Kommunikationsvorrichtung 100 verbundenen Mobiltelefon 70 aus 1. Demgegenüber wird das vom Mobiltelefon 70 ausgegebene Empfangssignal über die Signal-Ein-/Ausgabeeinheit 301 in den Prozessor 300 eingegeben.
  • Die Programme, welche die Freisprech-Kommunikationsvorrichtung 100 gemäß dieser Ausführungsform implementieren, können entweder in einer Speichervorrichtung im Softwareprogramme ausführenden Computer gespeichert sein oder über ein Speichermedium in der Art einer CD-ROM verteilt werden.
  • Es ist auch möglich, die Programme durch ein drahtloses oder festverdrahtetes Netz in der Art eines LANs von einem anderen Computer zu erhalten. Ferner können verschiedene Datentypen auch in Bezug auf den akustischen Wandler 201 oder die externe Vorrichtung 206, die mit der Freisprech-Kommunikationsvorrichtung 100 gemäß dieser Ausführungsform verbunden ist, über ein drahtloses oder festverdrahtetes Netz gesendet und empfangen werden.
  • Betrieb
  • Als nächstes wird der Betrieb der jeweiligen Teile der Freisprech-Kommunikationsvorrichtung 100 mit Bezug auf ein Flussdiagramm aus 5 beschrieben. 5 ist ein Flussdiagramm, das einen Teil des Betriebs der Freisprech-Kommunikationsvorrichtung 100 gemäß der Ausführungsform zeigt. Wie in 5 dargestellt ist, nimmt die Analog-Digital-Wandlungseinheit 20 das Eingangsakustiksignal mit vorgeschriebenen Rahmenintervallen entgegen (Schritt ST1Al) und gibt das Eingangsakustiksignal an den Echounterdrücker 40a aus.
  • Nachfolgend vergleicht der Echounterdrücker 40a in Schritt ST1B die Probenanzahl t mit einem vorgeschriebenen Wert T, und wenn die Probenanzahl t kleiner als der vorgeschriebene Wert T ist (JA in Schritt ST1B), kehrt der Prozess zu Schritt ST1A zurück und wird die Verarbeitung von Schritt ST1A wiederholt, bis die Probenanzahl t t = 160 erreicht.
  • Wenn die Probenanzahl t größer oder gleich dem vorgeschriebenen Wert T ist (NEIN in Schritt ST1B), wird der Prozess in Schritt ST2 fortgesetzt und nimmt die Akustiksignal-Analyseeinheit 30 das Empfangssignal der vom sich am fernen Ende befindenden Sprecher 501 geäußerten Empfangsstimme entgegen (Schritt ST2).
  • Nachfolgend wird der Prozess in Schritt ST3 fortgesetzt und analysiert die Akustiksignal-Analyseeinheit 30 das akustische Merkmal der vom sich am fernen Ende befindenden Sprecher 501 geäußerten Empfangsstimme und gibt das jeweilige Steuersignal zum Steuern des Echounterdrückers 40a, des Rauschunterdrückers 40b und der Sprachverbesserungseinheit 40c, wie später beschrieben, gemäß dem Analyseergebnis aus (Schritt ST3).
  • Nachfolgend wird der Prozess in Schritt ST4 fortgesetzt und liest der Echounterdrücker 40a das Eingangsakustiksignal und das in die Freisprech-Kommunikationsvorrichtung 100 eingegebene Empfangssignal ein und führt den Echounterdrückungsprozess zur Unterdrückung des in das Eingangsakustiksignal eingemischten akustischen Echos aus (Schritt 4).
  • Danach wird der Prozess in Schritt ST5 fortgesetzt und führt der Rauschunterdrücker 40b den Rauschunterdrückungsprozess zur Unterdrückung des in das Eingangsakustiksignal eingemischten Rauschens aus (Schritt ST5).
  • Danach wird der Prozess in Schritt ST6 fortgesetzt und führt die Sprachverbesserungseinheit 40c den Verbesserungsprozess an der im Eingangsakustiksignal enthaltenen Sprache in Bezug auf Teile, die ein Merkmal der Sprache gut repräsentieren, aus (Schritt ST6).
  • Nachfolgend wird der Prozess in Schritt ST7A fortgesetzt und führt die Digital-Analog-Wandlungseinheit 21 einen Prozess zur Ausgabe des Empfangssignals von der Freisprech-Kommunikationsvorrichtung aus (Schritt ST7A), während auch das Sendesignal ausgegeben wird.
  • Nachfolgend wird der Prozess in Schritt ST7B fortgesetzt und wird ein Vergleich zwischen der Probenanzahl t und einem vorgeschriebenen Wert T ausgeführt. Wenn die Probenanzahl t kleiner als der vorgeschriebene Wert T ist (JA in Schritt ST7B), kehrt der Prozess zu Schritt ST7A zurück und wird die Verarbeitung von Schritt ST7A wiederholt, bis die Probenanzahl t t = 160 erreicht.
  • Anschließend wird der Prozess in Schritt ST8 fortgesetzt und kehrt der Prozess zu Schritt ST1A zurück, wenn der Freisprech-Kommunikationsprozess fortgesetzt wird (JA in Schritt ST8). Umgekehrt wird der Freisprech-Kommunikationsprozess beendet, wenn dieser nicht fortgesetzt wird (NEIN in Schritt ST8) .
  • Wirkung
  • Wie vorstehend beschrieben wurde, umfasst die Freisprech-Kommunikationsvorrichtung 100 gemäß der ersten Ausführungsform die Akustiksignal-Analyseeinheit 30, die ein akustisches Merkmal des Empfangssignals von der Seite des fernen Endes analysiert und dabei ein geeignetes Steuersignal erzeugt, den Echounterdrücker 40a, der das in das Eingangsakustiksignal eingemischte akustische Echo unterdrückt, den Rauschunterdrücker 40b, der das in das Eingangsakustiksignal eingemischte Rauschen unterdrückt, und die Sprachverbesserungseinheit 40c, welche ein Merkmal der im Eingangsakustiksignal enthaltenen Sprache verbessert. Mit dieser Konfiguration kann eine hohe Sprachqualität aufrechterhalten werden und wird ein Sprachanruf hoher Qualität selbst in Situationen möglich, in denen keine Kennung zur Identifikation in der Art einer Telefonnummer bereitgestellt wird.
  • Insbesondere wird eine Destabilisierung der CDMA-Stimmcodierung infolge im Sendesignal enthaltener Restechokomponenten unterbunden, wird die Stimmcodiereffizienz durch eine starke Verbesserung eines Sprachmerkmals in der Sendestimme erhöht und wird folglich ein Anruf hoher Qualität möglich.
  • Weil ferner bei herkömmlichen Technologien ein von der Freisprech-Kommunikationsvorrichtung getrennter Rauschunterdrückungsprozess in den CDMA-Stimmcodieralgorithmus eingebracht wurde, geschieht infolge der Doppelverarbeitung durch den Rauschunterdrückungsprozess in der Freisprech-Kommunikationsvorrichtung und den Rauschunterdrückungsprozess im CDMA-System eine übermäßige Rauschunterdrückung, was zu einer erhöhten gefühlten Sprachzerstörung führt.
  • Dagegen wird bei der Freisprech-Kommunikationsvorrichtung 100 gemäß der ersten Ausführungsform der Rauschunterdrückungsprozess nicht zweimal ausgeführt, so dass die Rauschunterdrückung mit einem geeigneten Rauschunterdrückungsbetrag gesteuert wird, wodurch das Sprachzerstörungsgefühl beseitigt wird und eine hohe Sprachqualität aufrechterhalten werden kann und ein Sprachanruf hoher Qualität ausgeführt werden kann.
  • Zweite Ausführungsform
  • Wenngleich beim Beispiel gemäß der ersten Ausführungsform ein Fall beschrieben wurde, in dem die Seite des fernen Endes der sich am fernen Ende befindende Sprecher 501 als einen Sprachanruf vornehmende Person ist, kann die Konfiguration gemäß der vorliegenden Erfindung auch auf Fälle angewendet werden, in denen die Seite des fernen Endes durch eine Spracherkennungsvorrichtung ersetzt ist, und ein solcher Fall wird nachstehend als zweite Ausführungsform beschrieben.
  • 6 zeigt die allgemeine Konfiguration einer Akustiksignal-Verarbeitungsvorrichtung 101 gemäß der zweiten Ausführungsform der vorliegenden Erfindung. In 6 unterscheidet sich die Akustiksignal-Verarbeitungsvorrichtung 101 von der in 1 dargestellten Vorrichtung gemäß der ersten Ausführungsform in der Hinsicht, dass die Akustiksignal-Verarbeitungsvorrichtung 101 über das Kommunikationsnetz 80 mit einem Festnetztelefon 91 und einer Spracherkennungsvorrichtung 92 verbunden ist. Der Rest der Konfiguration gleicht jener gemäß der ersten Ausführungsform, so dass auf ihre Erklärung verzichtet wird und entsprechenden Komponenten die gleichen Bezugszahlen zugewiesen werden.
  • Die Akustiksignal-Analyseeinheit 30, der Echounterdrücker 40a, der Rauschunterdrücker 40b bzw. die Sprachverbesserungseinheit 40c führen die gleichen Prozesse aus, die in der ersten Ausführungsform detailliert beschrieben wurden, und die Sendestimme wird durch das Mobiltelefon 70 und das Kommunikationsnetz 80 zum Festnetztelefon 91 gesendet. Die vom Festnetztelefon 91 empfangene Sendestimme wird zur Spracherkennungsvorrichtung 92 gesendet.
  • Die Spracherkennungsvorrichtung 92 führt die Erkennung der Sprache aus, die im Sendesignal der vom Festnetztelefon 91 empfangenen Sendestimme enthalten ist, wandelt das Spracherkennungsergebnis unter Verwendung eines öffentlich bekannten Text-zu-Sprache(TTS: Text To Speech)- Wandlungsprozesses in eine synthetische Stimme um und sendet die synthetische Stimme durch das Festnetztelefon 91 und das Kommunikationsnetz 80 als Empfangsstimme zum Mobiltelefon 70. Es sei bemerkt, dass der auf dem erhaltenen Spracherkennungsergebnis beruhende Prozess eine von der vorliegenden Erfindung getrennte Komponente ist, so dass hier auf seine Erklärung verzichtet wird. Ferner braucht das Festnetztelefon 91 nicht unbedingt ein Festnetztelefon zu sein, und es kann stattdessen ein Mobiltelefon verwendet werden.
  • Mit der wie vorstehend erwähnt konfigurierten Akustiksignal-Verarbeitungsvorrichtung 101 gemäß der zweiten Ausführungsform wird eine sehr genaue Spracherkennung möglich, weil unabhängig vom Typ des Mobiltelefons oder des Kommunikationsnetzes eine hohe Qualität der Sendestimme aufrechterhalten werden kann.
  • Wie vorstehend beschrieben, umfasst die Akustiksignal-Verarbeitungsvorrichtung 101 gemäß der zweiten Ausführungsform die Akustiksignal-Analyseeinheit 30, die ein akustisches Merkmal des Empfangssignals von der Seite des fernen Endes analysiert und dabei ein geeignetes Steuersignal erzeugt, den Echounterdrücker 40a, der das in das Eingangsakustiksignal eingemischte akustische Echo unterdrückt, den Rauschunterdrücker 40b, der das in das Eingangsakustiksignal eingemischte Rauschen unterdrückt, und die Sprachverbesserungseinheit 40c, die ein Merkmal der im Eingangsakustiksignal enthaltenen Sprache verbessert, so dass eine hohe Qualität der Sendestimme selbst in Situationen aufrechterhalten werden kann, in denen keine Kennung zur Identifikation in der Art einer Telefonnummer bereitgestellt wird. Dementsprechend kann auf der Seite der Spracherkennungsvorrichtung 92 leicht erkennbare Sprache gesendet werden und eine sehr genaue Spracherkennung ausgeführt werden.
  • Modifikationen
  • Wenngleich in den vorstehenden Ausführungsformen Beispiele beschrieben wurden, bei denen die Freisprech-Kommunikationsvorrichtung 100 und die Akustiksignal-Verarbeitungsvorrichtung 101 in einem Fahrzeugnavigationssystem installiert waren, sind die Freisprech-Kommunikationsvorrichtung 100 und die Akustiksignal-Verarbeitungsvorrichtung 101 nicht auf solche Beispiele beschränkt und können die Freisprech-Kommunikationsvorrichtung 100 und die Akustiksignal-Verarbeitungsvorrichtung 101 beispielsweise auch auf Notrufgegensprechanlagen von Fahrstühlen oder dergleichen, Gegensprechanlagen gewöhnlicher Haushalte oder Büros, eine Lautsprecherkonversation von TV-Konferenzsystemen, Spracherkennungs-Dialogsysteme von Robotern usw. angewendet werden, und die in den Ausführungsformen beschriebenen Vorteile werden ähnlich auch für Geräusche oder akustische Echos erreicht, die in diesen akustischen Umgebungen auftreten.
  • Wenngleich die Audiosignalverarbeitung in der Art des vom Echounterdrücker 40a ausgeführten Echounterdrückungsprozesses, des vom Rauschunterdrücker 40b ausgeführten Rauschunterdrückungsprozesses und des von der Sprachverbesserungseinheit 40c ausgeführten Spracherkennungsprozesses gemäß den vorstehenden Ausführungsformen am Sendesignal der Sendestimme ausgeführt werden, kann die Audiosignalverarbeitung auch am Empfangssignal der Empfangsstimme ausgeführt werden.
  • Wenngleich in den vorstehenden Ausführungsformen angenommen wurde, dass die Frequenzbandbreite des Eingangssignals 8 kHz beträgt, ist die Frequenzbandbreite nicht auf dieses Beispiel beschränkt und ist die vorliegende Erfindung beispielsweise auch auf Audiosignale größerer Bandbreiten anwendbar.
  • Zusätzlich ist innerhalb des Schutzumfangs der vorliegenden Erfindung auch eine Modifikation oder ein Fortlassen jeglicher Komponenten in den Ausführungsformen möglich.
  • INDUSTRIELLE ANWENDBARKEIT
  • Weil demgemäß ein Sprachanruf hoher Qualität (oder eine sehr genaue Spracherkennung) möglich ist, sind die Freisprech-Kommunikationsvorrichtung 100 und die Akustiksignal-Verarbeitungsvorrichtung 101 gemäß der vorliegenden Erfindung zur Verwendung für die Tonqualitätsverbesserung von Sprachkommunikationssystemen, Freisprechkommunikationssystemen, TV-Konferenzsystemen usw. von Fahrzeugnavigationssystemen, Mobiltelefonen, Gegensprechanlagen usw., in denen eine Sprachkommunikation oder ein Spracherkennungssystem eingeführt wurde, und zur Verbesserung der Erkennungsrate von Spracherkennungssystemen geeignet.
  • Bezugszeichenliste
  • 10, 11: Mikrofon, 12: Lautsprecher, 13: Empfänger, 20: Analog-Digital-Wandlungseinheit, 21: Digital-Analog-Wandlungseinheit, 30: Akustiksignal-Analyseeinheit, 31: Akustische-Parameter-Berechnungseinheit, 32: Akustische-Parameter-Analyseeinheit, 33: Steuersignal-Erzeugungseinheit, 34: Musterverzeichnis, 35: Steuertabelle, 40: Akustiksignal-Korrektureinheit, 40a: Echounterdrücker, 40b: Rauschunterdrücker, 40c: Sprachverbesserungseinheit, 70: Mobiltelefon, 80: Kommunikationsnetz, 90: Mobiltelefon, 91: Festnetztelefon, 92: Spracherkennungsvorrichtung, 100: Freisprech-Kommunikationsvorrichtung, 101: Akustiksignal-Verarbeitungsvorrichtung, 500: sich am nahen Ende befindender Sprecher, 501: sich am fernen Ende befindender Sprecher.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 2000165488 [0006]
    • JP 2001268212 [0006]

Claims (10)

  1. Akustiksignal-Verarbeitungsvorrichtung, umfassend: eine Akustiksignal-Analyseeinheit, die ein akustisches Merkmal eines von einer Seite eines fernen Endes eingegebenen ersten akustischen Signals einer Empfangsstimme analysiert und ein Steuersignal zur Korrektur eines von einer Seite eines nahen Endes eingegebenen zweiten akustischen Signals einer Sendestimme entsprechend einem Analyseergebnis erzeugt, und eine Akustiksignal-Korrektureinheit, die eine Korrektur des zweiten akustischen Signals auf der Grundlage des Steuersignals ausführt.
  2. Akustiksignal-Verarbeitungsvorrichtung nach Anspruch 1, wobei die Akustiksignal-Korrektureinheit einen Echounterdrücker aufweist, der einen Echounterdrückungsprozess als Korrektur zur Entfernung eines im zweiten akustischen Signal enthaltenen akustischen Echos auf der Grundlage des Steuersignals ausführt.
  3. Akustiksignal-Verarbeitungsvorrichtung nach Anspruch 1 oder 2, wobei die Akustiksignal-Korrektureinheit einen Rauschunterdrücker aufweist, der auf der Grundlage des Steuersignals einen Rauschunterdrückungsprozess als Korrektur zur Entfernung im zweiten akustischen Signal enthaltenen Rauschens ausführt.
  4. Akustiksignal-Verarbeitungsvorrichtung nach einem der Ansprüche 1 bis 3, wobei die Akustiksignal-Korrektureinheit eine Sprachverbesserungseinheit aufweist, die auf der Grundlage des Steuersignals einen Sprachverbesserungsprozess als Korrektur zur Verbesserung eines Merkmals im zweiten akustischen Signal enthaltener Sprache ausführt.
  5. Akustiksignal-Verarbeitungsvorrichtung nach Anspruch 1, wobei die Akustiksignal-Korrektureinheit einen Echounterdrücker, der auf der Grundlage des Steuersignals einen Echounterdrückungsprozess zur Entfernung eines im zweiten akustischen Signal enthaltenen akustischen Echos ausführt, einen Rauschunterdrücker, der auf der Grundlage des Steuersignals einen Rauschunterdrückungsprozess zur Entfernung im zweiten akustischen Signal enthaltenen Rauschens ausführt, und eine Sprachverbesserungseinheit, die auf der Grundlage des Steuersignals einen Sprachverbesserungsprozess zur Verbesserung eines Merkmals der im zweiten akustischen Signal enthaltener Sprache ausführt, aufweist und die Akustiksignal-Korrektureinheit auf der Grundlage des Steuersignals eine Steuerung zur Erhöhung eines Echounterdrückungsbetrags des Echounterdrückungsprozesses, zur Intensivierung des Sprachverbesserungsprozesses und zur Verringerung eines Rauschunterdrückungsbetrags des Rauschunterdrückungsprozesses ausführt.
  6. Akustiksignal-Verarbeitungsvorrichtung nach einem der Ansprüche 1 bis 5, wobei die Akustiksignal-Analyseeinheit aufweist: eine erste Speichereinheit, die erste Referenzdaten speichert, eine zweite Speichereinheit, die zweite Referenzdaten speichert, eine Akustische-Parameter-Berechnungseinheit, die einen analytischen akustischen Parameter durch Analysieren des ersten akustischen Signals erzeugt, eine Akustische-Parameter-Analyseeinheit, die den analytischen akustischen Parameter unter Verwendung der ersten Referenzdaten analysiert und dabei ein Parameteranalyseergebnis erzeugt, und eine Steuersignal-Erzeugungseinheit, die das Steuersignal unter Verwendung der zweiten Referenzdaten auf der Grundlage des Parameteranalyseergebnisses erzeugt.
  7. Akustiksignal-Verarbeitungsvorrichtung nach Anspruch 6, wobei die Akustische-Parameter-Berechnungseinheit den analytischen akustischen Parameter durch Berechnen eines Mel-Frequenz-Cepstrumkoeffizienten N-ter Ordnung durch Cepstrumanalyse erzeugt, wobei N eine positive ganze Zahl ist.
  8. Akustiksignal-Verarbeitungsvorrichtung nach Anspruch 4 oder 5, wobei der Sprachverbesserungsprozess ein Formantenverbesserungsprozess zur Verbesserung einer Komponente eines Sprachspektrums mit einer hohen Spektrumsamplitude, ein Tonhöhenhervorhebungsprozess zur Hervorhebung der harmonischen Struktur einer Stimme oder ein Entzerrungsprozess zum Ändern von Frequenzeigenschaften eines akustischen Signals ist.
  9. Freisprech-Kommunikationsvorrichtung, umfassend: die Akustiksignal-Verarbeitungsvorrichtung nach einem der Ansprüche 1 bis 8, eine Analog-Digital-Wandlungseinheit, die eine Analog-Digital-Wandlung am zweiten akustischen Signal ausführt und dabei ein Digitalsignal erzeugt, und eine Digital-Analog-Wandlungseinheit, die eine Digital-Analog-Wandlung am ersten akustischen Signal ausführt und dabei ein Analogsignal erzeugt.
  10. Akustiksignal-Verarbeitungsverfahren, umfassend: einen Akustiksignal-Analyseschritt zur Analyse eines akustischen Merkmals eines von einer Seite eines fernen Endes eingegebenen ersten akustischen Signals einer Empfangsstimme und Erzeugung eines Steuersignals zur Korrektur eines von einer Seite eines nahen Endes eingegebenen zweiten akustischen Signals einer Sendestimme entsprechend einem Analyseergebnis und einen Akustiksignal-Korrekturschritt zum Ausführen einer Korrektur des zweiten akustischen Signals auf der Grundlage des Steuersignals.
DE112017007005.8T 2017-03-08 2017-03-08 Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung Active DE112017007005B4 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/009275 WO2018163328A1 (ja) 2017-03-08 2017-03-08 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置

Publications (2)

Publication Number Publication Date
DE112017007005T5 true DE112017007005T5 (de) 2019-10-31
DE112017007005B4 DE112017007005B4 (de) 2023-03-30

Family

ID=63449002

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112017007005.8T Active DE112017007005B4 (de) 2017-03-08 2017-03-08 Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung

Country Status (5)

Country Link
US (1) US20200045166A1 (de)
JP (1) JP6545419B2 (de)
CN (1) CN110383798B (de)
DE (1) DE112017007005B4 (de)
WO (1) WO2018163328A1 (de)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11394425B2 (en) * 2018-04-19 2022-07-19 Cisco Technology, Inc. Amplifier supporting full duplex (FDX) operations
CN112437957A (zh) * 2018-07-27 2021-03-02 杜比实验室特许公司 用于全面收听的强加间隙插入
CN109087660A (zh) * 2018-09-29 2018-12-25 百度在线网络技术(北京)有限公司 用于回声消除的方法、装置、设备以及计算机可读存储介质
CN109599098A (zh) * 2018-11-01 2019-04-09 百度在线网络技术(北京)有限公司 音频处理方法和装置
US20200184991A1 (en) * 2018-12-05 2020-06-11 Pascal Cleve Sound class identification using a neural network
US11887588B2 (en) * 2019-06-20 2024-01-30 Lg Electronics Inc. Display device
CN111933164B (zh) * 2020-06-29 2022-10-25 北京百度网讯科技有限公司 语音处理模型的训练方法、装置、电子设备和存储介质
CN113241089B (zh) * 2021-04-16 2024-02-23 维沃移动通信有限公司 语音信号增强方法、装置及电子设备

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3282596B2 (ja) 1998-11-25 2002-05-13 株式会社デンソー 無線通信装置
JP2002043985A (ja) * 2000-07-25 2002-02-08 Matsushita Electric Ind Co Ltd 音響エコーキャンセラー装置
US7177416B1 (en) * 2002-04-27 2007-02-13 Fortemedia, Inc. Channel control and post filter for acoustic echo cancellation
JP4245617B2 (ja) * 2006-04-06 2009-03-25 株式会社東芝 特徴量補正装置、特徴量補正方法および特徴量補正プログラム
JP5346350B2 (ja) * 2011-04-04 2013-11-20 日本電信電話株式会社 反響消去装置とその方法とプログラム
JP5923994B2 (ja) * 2012-01-23 2016-05-25 富士通株式会社 音声処理装置及び音声処理方法
JP2014045342A (ja) * 2012-08-27 2014-03-13 Sharp Corp エコー抑制装置、通信装置、エコー抑制方法及びエコー抑制プログラム
NZ706162A (en) * 2012-10-23 2018-07-27 Interactive Intelligence Inc System and method for acoustic echo cancellation
US9275625B2 (en) * 2013-03-06 2016-03-01 Qualcomm Incorporated Content based noise suppression
US8861713B2 (en) * 2013-03-17 2014-10-14 Texas Instruments Incorporated Clipping based on cepstral distance for acoustic echo canceller
JP6136995B2 (ja) * 2014-03-07 2017-05-31 株式会社Jvcケンウッド 雑音低減装置
CN203941693U (zh) * 2014-06-09 2014-11-12 高秀敏 一种远程声音信号处理分析装置
US9520139B2 (en) * 2014-06-19 2016-12-13 Yang Gao Post tone suppression for speech enhancement
CN105374364B (zh) * 2014-08-25 2019-08-27 联想(北京)有限公司 信号处理方法及电子设备
CN105374359B (zh) * 2014-08-29 2019-05-17 中国电信股份有限公司 语音数据的编码方法和系统
GB2525051B (en) * 2014-09-30 2016-04-13 Imagination Tech Ltd Detection of acoustic echo cancellation
JP6396829B2 (ja) * 2015-03-16 2018-09-26 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報処理装置、判定方法及びコンピュータプログラム
CN104936101B (zh) * 2015-04-29 2018-01-30 成都陌云科技有限公司 一种主动式降噪装置
CN104835498B (zh) * 2015-05-25 2018-12-18 重庆大学 基于多类型组合特征参数的声纹识别方法
CN106024004B (zh) * 2016-05-11 2019-03-26 Tcl移动通信科技(宁波)有限公司 一种移动终端双麦降噪处理方法、系统及移动终端

Also Published As

Publication number Publication date
JPWO2018163328A1 (ja) 2019-11-07
DE112017007005B4 (de) 2023-03-30
CN110383798B (zh) 2021-05-11
US20200045166A1 (en) 2020-02-06
WO2018163328A1 (ja) 2018-09-13
JP6545419B2 (ja) 2019-07-17
CN110383798A (zh) 2019-10-25

Similar Documents

Publication Publication Date Title
DE112017007005B4 (de) Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung
DE602005000539T2 (de) Verstärkungsgesteuerte Geräuschunterdrückung
DE112011104737B4 (de) Geräuschunterdrückungsvorrichtung
DE10041512B4 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE69830721T2 (de) Verfahren und vorrichtung zur bestimmung der übertragungsrate in einem kommunikationssystem
DE112009000805B4 (de) Rauschreduktion
DE60108401T2 (de) System zur erhöhung der sprachqualität
DE602005001048T2 (de) Erweiterung der Bandbreite eines schmalbandigen Sprachsignals
DE60027438T2 (de) Verbesserung eines verrauschten akustischen signals
DE102017116528B4 (de) Verfahren und Vorrichtung zur Audiosignal-Qualitätsverbesserung basierend auf quantitativer SNR-Analyse und adaptiver Wiener-Filterung
DE112016006218B4 (de) Schallsignal-Verbesserungsvorrichtung
EP1143416A2 (de) Geräuschunterdrückung im Zeitbereich
DE102008039330A1 (de) Vorrichtung und Verfahren zum Berechnen von Filterkoeffizienten zur Echounterdrückung
DE112007003625T5 (de) Echounterdrückungsvorrichtung, echounterdrückungssystem, Echounterdrückungsverfahren und Computerprogramm
DE102014100407A1 (de) Geräuschminderungsvorrichtungen und Geräuschminderungsverfahren
EP0747880B1 (de) Spracherkennungssystem
DE102008027848A1 (de) Echounterdrücker, Echounterdrückungsverfahren und computerlesbares Speichermedium
DE19935808A1 (de) Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit
DE112011106045B4 (de) Audiosignal-Wiederherstellungsvorrichtung und Audiosignal-Wiederherstellungsverfahren
DE112010005895T5 (de) Störungsunterdrückungsvorrichtung
WO1995007597A1 (de) Mobilfunkgerät mit freisprecheinrichtung
DE69635141T2 (de) Verfahren zur Erzeugung von Sprachmerkmalsignalen und Vorrichtung zu seiner Durchführung
AT509570B1 (de) Methode und apparat zur einkanal-sprachverbesserung basierend auf einem latenzzeitreduzierten gehörmodell
DE102013011761A1 (de) Kraftfahrzeug mit einer Freisprecheinrichtung und Verfahren zur Erzeugung eines Frequenzganges für Freisprecheinrichtungen
DE602005000897T2 (de) Eingangsschallprozessor

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R084 Declaration of willingness to licence
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final