DE102018129733A1 - Eine Niederleistungs-Echounterdrückung unterstützender Anwendungsprozessor, elektronische Vorrichtung mit demselben und Verfahren zum Betreiben desselben - Google Patents

Eine Niederleistungs-Echounterdrückung unterstützender Anwendungsprozessor, elektronische Vorrichtung mit demselben und Verfahren zum Betreiben desselben Download PDF

Info

Publication number
DE102018129733A1
DE102018129733A1 DE102018129733.5A DE102018129733A DE102018129733A1 DE 102018129733 A1 DE102018129733 A1 DE 102018129733A1 DE 102018129733 A DE102018129733 A DE 102018129733A DE 102018129733 A1 DE102018129733 A1 DE 102018129733A1
Authority
DE
Germany
Prior art keywords
audio
voice
trigger
application processor
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102018129733.5A
Other languages
English (en)
Inventor
Sun-Kyu Kim
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of DE102018129733A1 publication Critical patent/DE102018129733A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

Ein Anwendungsprozessor (2000) ist geschaffen. Der Anwendungsprozessor (2000) weist einen Systembus (2100), einen Host-Prozessor (100), ein Sprachauslösesystem (200) und ein Audio-Teilsystem (300), die mit dem Systembus (2100) elektrisch verbunden sind, auf. Das Sprachauslösesystem (200) führt basierend auf einem Auslöseeingangssignal, das durch eine Auslöseschnittstelle geliefert wird, einen Sprachauslösebetrieb durch und gibt ein Auslöseereignis aus. Das Audio-Teilsystem (300) verarbeitet durch eine Audio-Schnittstelle Audioströme. Während eine Audiowiedergabe durch die Audio-Schnittstelle durchgeführt wird, führt der Anwendungsprozessor (2000) hinsichtlich Mikrofondaten, die von einem Mikrofon (40, 61, 81) empfangen werden, eine Echo-Unterdrückung durch, um kompensierte Daten zu erzeugen, und das Sprachauslösesystem (200) führt basierend auf den kompensierten Daten den Sprachauslösebetrieb durch.

Description

  • QUERVERWEIS AUF VERWANDTE ANMELDUNG
  • Diese Anmeldung beansprucht die Priorität der koreanischen Patentanmeldung Nr. 10-2018-0009388 , eingereicht am 25. Januar 2018 beim Koreanischen Amt für Geistiges Eigentum (KIPO), deren Offenbarung hierin in ihrer Gesamtheit durch Verweis aufgenommen ist.
  • HINTERGRUND
  • Technisches Gebiet
  • Geräte, Verfahren, Vorrichtungen und Herstellungserzeugnisse, die mit der vorliegenden Offenbarung in Einklang stehen, beziehen sich allgemein auf integrierte Halbleiterschaltungen und insbesondere auf einen Anwendungsprozessor, der eine Niederleistungs-Echounterdrückung unterstützt, eine elektronische Vorrichtung, die den Anwendungsprozessor aufweist, und auf ein zugeordnetes Verfahren.
  • Erläuterung des Standes der Technik
  • Sprachbasierte oder geräuschbasierte intelligente Schnittstellen wurden in jüngster Vergangenheit eingeführt. Ein Vorteil solcher sprachbasierter intelligenter Schnittstellen besteht darin, dass Benutzer mit einer Vorrichtung auf eine freihändige Art und Weise interagieren können, ohne die Vorrichtung zu berühren oder sogar auf dieselbe zu schauen. Ein freihändiger Betrieb kann besonders nützlich sein, wenn eine Person eine Vorrichtung nicht physisch berühren kann oder dies nicht sollte, z. B. wenn diese fährt oder wenn diese eine Behinderung hat, etc. Um die sprachbasierte intelligente Schnittstelle in Gang zu setzen, müssen jedoch Benutzer typischerweise einen Knopf drücken oder ein Symbol bzw. ein Icon auf einem Berührungsbildschirm auswählen. Diese Tasteingabe beeinträchtigt das Benutzererlebnis der sprachbasierten intelligenten Schnittstelle.
  • Die elektronischen Vorrichtungen wurden dementsprechend entwickelt, um unter Verwendung von Spracheingaben, gesprochenen Eingaben, Geräuscheingaben, Sinneseingaben etc. und nicht einer Tasteingabe eine sprachbasierte intelligente Schnittstelle zu aktivieren. Die elektronische Vorrichtung führt ein ununterbrochenes oder unterbrochenes Überwachen eines Audiokanals durch, um die Spracheingabe zu erfassen und ein Trigger- bzw. Auslöseereignis zum In-Gang-Setzen der sprachbasierten intelligenten Schnittstelle auszugeben. Auf den Betrieb zum Ausgeben des Auslöseereignisses kann als ein Sprachauslösebetrieb Bezug genommen werden. Dieses Überwachen des Audiokanals verbraucht einen elektrischen Strom, der in in der Hand gehaltenen oder transportablen Vorrichtungen, die auf Batterien angewiesen sind, eine beschränkte Ressource ist. Es ist somit vorteilhaft, eine energieeffiziente Lösung zu schaffen, die dem Sprachauslösebetrieb zugeordnet ist.
  • KURZFASSUNG
  • Ein Aspekt besteht darin, einen Anwendungsprozessor und eine elektronische Vorrichtung, die einen Anwendungsprozessor, der zum Unterstützen einer Niederleistungs-Echounterdrückung fähig ist, aufweist, zu schaffen.
  • Ein anderer Aspekt besteht darin, ein Verfahren zum Betreiben eines Anwendungsprozessors, der fähig ist, eine Niederleistungs-Echounterdrückung zu unterstützen, zu schaffen.
  • Gemäß einem Aspekt einer beispielhaften Ausführungsform oder von mehreren beispielhaften Ausführungsformen weist ein Anwendungsprozessor einen Systembus, einen Host-Prozessor, ein Sprachauslösesystem und ein Audio-Teilsystem, die mit dem Systembus elektrisch verbunden sind, auf. Das Sprachauslösesystem führt basierend auf einem Auslöseeingangssignal, das durch eine Auslöseschnittstelle geliefert wird, einen Sprachauslösebetrieb aus und gibt ein Auslöseereignis aus. Das Audio-Teilsystem verarbeitet durch eine Audio-Schnittstelle Audioströme bzw. -streams. Während eine Audiowiedergabe durch die Audio-Schnittstelle durchgeführt wird, führt der Anwendungsprozessor hinsichtlich Mikrofondaten, die von einem Mikrofon empfangen werden, eine Echounterdrückung durch, um kompensierte Daten zu erzeugen, und das Sprachauslösesystem führt basierend auf den kompensierten Daten den Sprachauslösebetrieb durch.
  • Gemäß einem anderen Aspekt einer beispielhaften Ausführungsform oder von mehreren beispielhaften Ausführungsformen weist eine elektronische Vorrichtung mindestens eine Audio-Eingabe-Ausgabe-Vorrichtung und einen Anwendungsprozessor auf, der einen Systembus, einen Host-Prozessor, der mit dem Systembus elektrisch verbunden ist, ein Sprachauslösesystem, das mit dem Systembus elektrisch verbunden ist, wobei das Sprachauslösesystem konfiguriert ist, um basierend auf einem Auslöseeingangssignal, das durch eine Auslöseschnittstelle geliefert wird, einen Sprachauslösebetrieb durchzuführen und ein Auslöseereignis auszugeben, und ein Audio-Teilsystem aufweist, das eine Audio-Schnittstelle aufweist und mit dem Systembus elektrisch verbunden ist, wobei das Audio-Teilsystem konfiguriert ist, um durch die Audio-Schnittstelle Audioströme zu verarbeiten, wobei, während eine Audiowiedergabe durch die Audio-Schnittstelle durchgeführt wird, der Anwendungsprozessor hinsichtlich Mikrofondaten, die von einem Mikrofon empfangen werden, eine Echounterdrückung durchführt, um kompensierte Daten zu erzeugen, und das Sprachauslösesystem basierend auf den kompensierten Daten den Sprachauslösebetrieb durchführt.
  • Gemäß einem anderen Aspekt einer beispielhaften Ausführungsform oder von mehreren beispielhaften Ausführungsformen weist ein Verfahren zum Betreiben eines Anwendungsprozessors ein Durchführen durch ein Sprachauslösesystem eines Sprachauslösebetriebs basierend auf einem Auslöseeingangssignal, das durch eine Auslöseschnittstelle geliefert wird, um ein Auslöseereignis auszugeben, wobei das Sprachauslösesystem in einem einzelnen Halbleiterchip, der den Anwendungsprozessor bildet, mit einem Host-Prozessor, einem Audio-Teilsystem und einem Systembus, der den Host-Prozessor, das Sprachauslösesystem und das Audio-Teilsystem elektrisch verbindet, intergiert ist, ein Verarbeiten von Audioströmen durch eine Audio-Schnittstelle des Audio-Teilsystems durch das Audio-Teilsystem, ein Durchführen, während eine Audiowiedergabe durch die Audio-Schnittstelle durchgeführt wird, einer Echounterdrückung hinsichtlich Mikrofondaten, die von einem Mikrofon empfangen werden, um kompensierte Daten zu erzeugen, und ein Durchführen des Sprachauslösebetriebs basierend auf den kompensierten Daten durch das Sprachauslösesystem auf.
  • Figurenliste
  • Beispielhafte Ausführungsformen werden aus der folgenden detaillierten Beschreibung, die in Verbindung mit den beigefügten Zeichnungen vorgenommen wird, deutlicher verstanden werden. Es zeigen:
    • 1 ein Flussdiagramm, das ein Verfahren zum Betreiben eines Anwendungsprozessors gemäß bespielhaften Ausführungsformen darstellt;
    • 2A ein Blockdiagramm, das eine elektronische Vorrichtung gemäß bespielhaften Ausführungsformen darstellt;
    • 2B eine beispielhafte Implementierung der elektronischen Vorrichtung von 2A;
    • 3 ein Blockdiagramm, das einen Anwendungsprozessor gemäß beispielhaften Ausführungsformen darstellt;
    • 4 ein Blockdiagramm, das einen Echounterdrücker, den ein Anwendungsprozessor gemäß beispielhaften Ausführungsformen aufweist, darstellt;
    • 5 ein Blockdiagramm, das eine beispielhafte Verbindung eines Sprachauslösesystems und eines Audio-Teilsystems bei einem Anwendungsprozessor gemäß bespielhaften Ausführungsformen darstellt;
    • 6 ein Diagramm, das eine beispielhafte Ausführungsform eines Briefkasten- bzw. Mailbox-Moduls, das der Anwendungsprozessor von 5 aufweist, darstellt;
    • 7 ein Flussdiagramm, das ein Verfahren zum Betreiben eines Anwendungsprozessors gemäß bespielhaften Ausführungsformen darstellt;
    • 8 ein Blockdiagramm zum Beschreiben des Verfahrens zum Betreiben des Anwendungsprozessors von 7;
    • 9 ein Flussdiagramm, das ein Verfahren zum Betreiben eines Anwendungsprozessors gemäß bespielhaften Ausführungsformen darstellt;
    • 10 ein Blockdiagramm zum Beschreiben des Verfahrens zum Betreiben des Anwendungsprozessors von 9;
    • 11 ein Blockdiagramm, das eine beispielhafte Verbindung eines Sprachauslösesystems und eines Audio-Teilsystems bei einem Anwendungsprozessor gemäß bespielhaften Ausführungsformen darstellt;
    • 12 ein Flussdiagramm, das ein Verfahren zum Betreiben eines Anwendungsprozessors gemäß bespielhaften Ausführungsformen darstellt;
    • 13 ein Blockdiagramm zum Beschreiben des Verfahrens zum Betreiben des Anwendungsprozessors von 12;
    • 14 ein Blockdiagramm, das eine beispielhafte Verbindung eines Sprachauslösesystems und eines Audio-Teilsystems bei einem Anwendungsprozessor gemäß bespielhaften Ausführungsformen darstellt;
    • 15 ein Flussdiagram, das ein Verfahren zum Betreiben eines Anwendungsprozessors gemäß bespielhaften Ausführungsformen darstellt;
    • 16 ein Blockdiagramm zum Beschreiben des Verfahrens zum Betreiben des Anwendungsprozessors von 15; und
    • 17A und 17B Diagramme zum Beschreiben von Strombereichen eines Anwendungsprozessors gemäß beispielhaften Ausführungsformen.
  • DETAILLIERTE BESCHREIBUNG
  • Verschiedene beispielhafte Ausführungsformen werden im Folgenden unter Bezugnahme auf die beigefügten Zeichnungen, in denen einige beispielhafte Ausführungsformen gezeigt werden, vollständiger beschrieben werden. In den Zeichnungen beziehen sich dieselben Ziffern durchgehend auf gleiche Elemente. Eine sich wiederholende Beschreibung wird möglicherweise weggelassen.
  • Der Anwendungsprozessor, die elektronische Vorrichtung, die den Anwendungsprozessor aufweist, und das Verfahren zum Betreiben des Anwendungsprozessors gemäß beispielhaften Ausführungsformen können durch Integrieren des Sprachauslösesystems in dem Anwendungsprozessor den Sprachauslösebetrieb mit einem niedrigen Strom und einer hohen Effizienz durchführen. Das Sprachauslösesystem auf einem Chip kann einige Vorgänge in dem Anwendungsprozessor statt in einem Host-Prozessor durchführen, um den Stromverbrauch zu reduzieren und das Leistungsvermögen der elektronischen Vorrichtung zu steigern. Die Audiowiedergabe und die Echounterdrückung können zusätzlich mit einem niedrigen Strom durchgeführt werden, und ein Leistungsvermögen des Sprachauslösebetriebs kann durch Unterstützen der Datenkommunikation zwischen dem Sprachauslösesystem und dem Audio-Teilsystem unter Verwendung des Briefkastenmoduls gesteigert werden.
  • 1 ist ein Flussdiagramm, das ein Verfahren zum Betreiben eines Anwendungsprozessors gemäß beispielhaften Ausführungsformen darstellt.
  • Bezug nehmend auf 1 wird bei einem Anwendungsprozessor, in dem ein Host-Prozessor, ein Sprachtriggersystem bzw. Sprachauslösesystem, ein Audio-Teilsystem und ein Systembus, der den Host-Prozessor, das Sprachauslösesystem und das Audio-Teilsystem elektrisch verbindet, als ein einzelner Halbleiterchip integriert sind, ein Sprachauslösebetrieb durch das Sprachauslösesystem basierend auf einem Auslöseeingangssignal, das durch eine Auslöseschnittstelle geliefert wird, um ein Auslöseereignis auszugeben, durchgeführt (S100).
  • Audio-Ströme, die durch eine Audio-Schnittstelle wiedergegeben oder aufgezeichnet werden, werden durch das Audio-Teilsystem verarbeitet (S200). Das Audio-Teilsystem kann ferner die Übertragung der Audioströme zwischen der Audio-Schnittstelle und einer Speichervorrichtung unterstützen.
  • Der Sprachauslösebetrieb in dieser Offenbarung kann einen Betrieb angeben, um zu überwachen, ob das Auslöseeingangssignal ein spezielles Auslösegeräusch aufweist, und um ein Auslöseereignis, wie z. B. ein Unterbrechungssignal, auszugeben, um einen Spracherkennungsmodus oder eine sprachbasierte intelligente Schnittstelle in Gang zu setzen, wenn das Auslösegeräusch erfasst wird. Das In-Gang-Setzen des Spracherkennungsmodus kann ein Starten des Host-Prozessors und/oder des Systembusses in einem aktiven Modus aufweisen. Um einen Stromverbrauch zu reduzieren, kann, mit anderen Worten, der Sprachauslösebetrieb während eines Schlafmodus durchgeführt werden (z. B. während der Systembus und der Host-Prozessor gesperrt sind und lediglich das Sprachauslösesystem freigeschaltet ist), und der Systembus und der Host-Prozessor können in den aktiven Modus eintreten oder zu demselben aufwachen, wenn das Auslöseereignis ausgegeben wird, um den Spracherkennungsmodus in Gang zu setzen.
  • Bei einigen beispielhaften Ausführungsformen kann das Auslösegeräusch ein Wort und/oder einen Satz einer menschlichen Sprache bzw. Stimme aufweisen. Bei anderen beispielhaften Ausführungsformen kann das Auslösegeräusch andere Geräusche als die menschliche Stimme, wie z. B. ein Pfeifen, ein Geräusch eines Händeklatschens, eine Sirene, ein Kollisionsgeräusch, eine Schallwelle eines speziellen Frequenzbereichs etc., aufweisen. In dieser Offenbarung können die Benutzersprachinformationen dem im Vorhergehenden beschriebenen Auslösegeräusch entsprechen.
  • Während die Audiowiedergabe durch die Audio-Schnittstelle durchgeführt wird, wird eine Echounterdrückung hinsichtlich Mikrofondaten, die von einem Mikrofon empfangen werden, durchgeführt, um unter Verwendung des direkten Busses kompensierte Daten zu erzeugen (S300). Die Audiowiedergabe kann beispielsweise durch die Audio-Schnittstelle während einer Einmischungsbedingung durchgeführt werden, und die Echounterdrückung kann hinsichtlich der Mikrofondaten, die von dem Mikrofon empfangen werden, durchgeführt werden, um die kompensierten Daten zu erzeugen. Die Echounterdrückung wird unter Bezugnahme auf 4 beschrieben werden.
  • Der Sprachauslösebetrieb wird durch das Sprachauslösesystem basierend auf den kompensierten Daten durchgeführt (S400).
  • Der Anwendungsprozessor, die elektronische Vorrichtung, die den Anwendungsprozessor aufweist, und das Verfahren zum Betreiben des Anwendungsprozessors gemäß beispielhaften Ausführungsformen können durch Integrieren des Sprachauslösesystems in dem Anwendungsprozessor den Sprachauslösebetrieb mit einem niedrigen Strom und einer hohen Effizienz durchführen. Die Audio-Wiedergabe kann zusätzlich mit einem niedrigen Strom durchgeführt werden, und eine Genauigkeit (z. B. eine Erkennungsrate) des Sprachauslösebetriebs kann gesteigert werden.
  • 2A ist ein Blockdiagramm, das eine elektronische Vorrichtung gemäß beispielhaften Ausführungsformen darstellt.
  • Bezug nehmend auf 2A weist eine elektronische Vorrichtung 1000 einen Anwendungsprozessor AP 2000, eine Speichervorrichtung 1200, eine Datenspeichervorrichtung 1300, eine Mehrzahl von Funktionsmodulen, die ein Kommunikationsmodul 1400, ein Kameramodul 1500, ein Eingabe-/Ausgabe-(I/O-) Modul 1600 und ein Audio-Modul 1700 aufweisen, und eine integrierte Strommanagementschaltung PMIC 1800 auf.
  • Der Anwendungsprozessor 2000 steuert Gesamtvorgänge der elektronischen Vorrichtung 1000. Der Anwendungsprozessor 2000 kann beispielsweise die Speichervorrichtung 1200, die Datenspeichervorrichtung 1300 und die Mehrzahl von Funktionsmodulen 1400, 1500, 1600 und 1700 steuern. Der Anwendungsprozessor 2000 kann ein System auf einem Chip (SoC) sein.
  • Der Anwendungsprozessor 2000 kann einen Systembus 2100, einen Host-Prozessor 100 (der ferner eine zentrale Verarbeitungseinheit (CPU) genannt wird), ein Sprachauslösesystem VTS 200 und ein Audio-Verarbeitungssystem AUD 250, die mit dem Systembus 2100 elektrisch verbunden sind, aufweisen.
  • Das Sprachauslösesystem 200 kann mit dem Systembus 2100 elektrisch verbunden sein, einen Sprachauslösebetrieb durchführen und basierend auf einem Auslöseeingangssignal, das durch eine Auslöseschnittstelle geliefert wird, ein Auslöseereignis ausgeben. Das Audio-Verarbeitungssystem 250 kann ein Audio-Teilsystem aufweisen und kann ferner ein Sensorzentrum bzw. einen Sensor-Hub aufweisen, wie es im Folgenden beschrieben werden wird. Das Audio-Teilsystem kann mit dem Systembus 2100 elektrisch verbunden sein, um Audioströme, die durch eine Audio-Schnittstelle wiedergegeben oder aufgezeichnet werden, zu verarbeiten. Das Audio-Teilsystem kann zusätzlich ferner die Übertragung der Audioströme zwischen der Audio-Schnittstelle und der Speichervorrichtung 1200 unterstützen. Beispielhafte Ausführungsformen des Sprachauslösesystems 200 und des Audio-Verarbeitungssystems 250 werden im Folgenden unter Bezugnahme auf 3 bis 17B beschrieben werden.
  • Die Speichervorrichtung 1200 und die Datenspeichervorrichtung 1300 können Daten für Vorgänge der elektronischen Vorrichtung 1000 speichern. Die Speichervorrichtung 1200 kann eine flüchtige Speichervorrichtung, wie z. B. einen dynamischen Speicher mit wahlfreiem Zugriff (DRAM), einen statischen Speicher mit wahlfreiem Zugriff (SRAM), einen mobilen DRAM etc., aufweisen. Die Datenspeichervorrichtung 1300 kann eine nichtflüchtige Speichervorrichtung, wie z. B. einen löschbaren, programmierbaren Nur-Lese-Speicher (EPROM), einen elektrisch löschbaren, programmierbaren Nur-Lese-Speicher (EEPROM), einen Flash-Speicher, einen Phasenänderungsspeicher mit wahlfreiem Zugriff (PRAM), einen Widerstandsspeicher mit wahlfreiem Zugriff (RRAM), einen Nano-Schwebe-Gate-Speicher (NFGM), einen Polymerspeicher mit wahlfreiem Zugriff (PoRAM), einen magnetischen Speicher mit wahlfreiem Zugriff (MRAM), einen ferroelektrischen Speicher mit wahlfreiem Zugriff (FRAM) etc., aufweisen. Bei einigen beispielhaften Ausführungsformen kann die Datenspeichervorrichtung 1300 ferner eine eingebettete Multimedia-Karte (eMMC), einen Universal-Flash-Datenspeicher (UFS), ein Festkörperlaufwerk (SSD), ein Festplattenlaufwerk (HDD), eine CD-ROM etc. aufweisen.
  • Die Funktionsmodule 1400, 1500, 1600 und 1700 können verschiedene Funktionen der elektronischen Vorrichtung 1000 erfüllen. Die elektronische Vorrichtung 1000 kann beispielsweise ein Kommunikationsmodul 1400, das eine Kommunikationsfunktion erfüllt, (z. B. ein Code-Aufteilungs-Mehrfachzugriffs- (CDMA-) Modul, ein Long-Term-Evolution- (LTE-) Modul, ein Hochfrequenz- (HF-) Modul, ein Ultrabreitband- (UWC-) Modul, ein Wireless-Local-Area-Network- (WLAN-) Modul, ein Worldwide-Interoperability-for-a-Microwave-Access- (WIMAX-) Modul etc.) das Kameramodul 1500, das eine Kamerafunktion erfüllt, das Eingabe-Ausgabe- (I/O-) Modul 1600, das ein Anzeigemodul, das eine Anzeigefunktion erfüllt, und ein Berührungsfeld- bzw. Touch-Panel-Modul, das eine berührungsfühlende Funktion erfüllt, aufweist, und das Audiomodul 1700, das ein Mikrofon- (MIC-) Modul, ein Lautsprechermodul etc. aufweist und die Ein-/Ausgabe von Audiosignalen durchführt, aufweisen. Bei einigen beispielhaften Ausführungsformen kann die elektronische Vorrichtung 1000 ferner ein Global-Positioning-System-(GPS-)Modul, ein Gyroskop-Modul etc. aufweisen. Die Funktionsmodule 1400, 1500, 1600 und 1700 bei der elektronischen Vorrichtung 1000 sind jedoch nicht darauf beschränkt.
  • Die integrierte Strommanagementschaltung 1800 kann dem Anwendungsprozessor 2000, der Speichervorrichtung 1200, der Datenspeichervorrichtung 1300 und den Funktionsmodulen 1400, 1500, 1600 und 1700 eine Betriebsspannung liefern.
  • 2B ist eine beispielhafte Implementierung der elektronischen Vorrichtung von 2A.
  • Die elektronische Vorrichtung 1000 von 2A kann eine Vorrichtung, wie z. B. ein Desktop-Computer, ein Laptop-Computer, ein Mobilfunktelefon, ein Smartphone, ein MP3-Spieler, ein persönlicher digitaler Assistent (PDA), ein transportabler Multimedia-Spieler (PMP), ein digitaler Fernseher, eine digitale Kamera, ein Server-Computer, eine Workstation, eine Set-top-Box, eine tragbare Spielekonsole, ein Navigationssystem, eine tragbare Vorrichtung, eine Vorrichtung des Internets der Dinge (IoT), eine Vorrichtung des Internets von Allem (IoE), ein E-Book, eine Vorrichtung für eine virtuelle Realität (VR), eine Vorrichtung für eine erweiterte Realität (AR) etc., sein. Die elektronische Vorrichtung 1000 kann typischerweise ansprechend auf eine direkte Benutzereingabe betrieben werden, kann jedoch ferner verwendet werden, um über das Internet oder andere Netzsysteme mit anderen Vorrichtungen zu kommunizieren. 2B stellt ein Mobilfunktelefon oder ein Smartphone, das einen Berührungsbildschirm aufweist, als ein Beispiel der elektronischen Vorrichtung 1000 von 2A dar.
  • Bezug nehmend auf 2B weist eine elektronische Vorrichtung 1000a eine Vorderkamera 2, einen Lautsprecher 3, einen Annäherungssensor 4, einen Helligkeitssensor 5, eine Universal-Serial-Bus- (USB-) Schnittstelle 6, einen Ein/Aus-Knopf 7, einen Lautstärkeknopf 8, einen Anzeige- und Berührungsbildschirm 9, Icons bzw. Symbole 10, einen Menüknopf 11, einen Ausgangspunkt- bzw. Home-Knopf 12, einen Zurück-Knopf 13, ein Mikrofon 14, eine Audio-Ausgabeschnittstelle 15 und eine Antenne 16 auf.
  • Die Vorderkamera 2 kann in eine Richtung gewandt sein, in die der Anzeige- und Berührungsbildschirm 9 gewandt ist, und wird für einen Videoanruf oder eine Video- oder Fotoaufnahme verwendet. Der Lautsprecher 3 kann Audiodaten ausgeben, wenn der Benutzer durch ein Berühren des Anzeige- und Berührungsbildschirms 9 an einem der Symbole 10 oder Eingeben eines Signals durch Sprache Multimediadaten abspielt, mit einem anderen Benutzer über ein öffentliches Telefonvermittlungsnetz spricht oder ein Betriebsgeräusch der elektronischen Vorrichtung 1000a oder ein Benachrichtigungsgeräusch abgespielt werden. Der Annäherungssensor 4 kann ein Ein oder Aus des Anzeige- und Berührungsbildschirms 9 steuern, um Strom zu sparen und einen Fehlbetrieb zu verhindern, wenn ein Benutzer die elektronische Vorrichtung 1000a hoch an einem Ohr für eine Telefonkonversation hält. Der Helligkeitssensor 5 kann die Vorgänge des Anzeige- und Berührungsbildschirms 9 und der Vorderkamera 2 gemäß der Menge an aus der Umgebung der elektronischen Vorrichtung 1000a einfallenden Licht steuern. Die USB-Schnittstelle 6 kann eine Eingabe/Ausgabe-Schnittstelle für eine Datenkommunikation mit externen Vorrichtungen und für eine Stromzufuhr sein.
  • Der Ein/Aus-Knopf 7 kann den Strom der elektronischen Vorrichtung 1000a ein- oder ausschalten oder kann den Anzeige- und Berührungsbildschirm 9 ein- oder ausschalten. Der Lautstärkeknopf 8 kann die Audioausgabe des Lautsprechers 3 steuern. Die Symbole 10, die unterschiedlichen Funktionen entsprechen, können auf dem Anzeige- und Berührungsbildschirm 9 angezeigt werden. Ein Benutzer kann beispielsweise ein Symbol 10, das einem Wiederabspielen von Multimedia-Daten entspricht, berühren.
  • Der Menüknopf 11 kann einem Benutzer ermöglichen, ein Menü, das Symbole und Einstellungen aufweist, durchzublättern. Der Ausgangspunktknopf 12 kann ermöglichen, dass ein Ausganspunktschirm bei einem Mehrfach-Arbeitsmodus selbst dann erscheint, während die elektronische Vorrichtung 1 einen bestimmten Vorgang auf dem Anzeige- und Berührungsbildschirm 9 durchführt. Der Zurück-Knopf 13 kann einen Vorgang, der durch die elektronische Vorrichtung 1000a aktuell durchgeführt wird, abbrechen und bringt einen Benutzer zu einem vorausgehenden Bildschirm zurück.
  • Das Mikrofon 14 kann eine Eingabe-Ausgabe- (I/O-) Schnittstelle für Sprachanrufe oder Spracheingabesignale sein. Die Audio-Ausgabeschnittstelle 15, z. B. eine Kopfhörerbuchse, kann für eine Audioausgabe von Multimedia-Daten, die abgespielt werden, dienen. Obwohl es nicht gezeigt wird, können eine Audioausgabe und eine Mikrofoneingabe durch eine Vorrichtung, die Bluetooth unterstützt, schnittstellenmäßig verbunden bzw. gekoppelt sein. Die Antenne 16 kann verwendet werden, um einen Digital-Media-Broadcasting- bzw. digitalen Medienausstrahlungsdienst zu empfangen. Die Elemente der elektronischen Vorrichtung 1000a können auf verschiedene Weisen ausgeführt sein, die für Fachleute realisierbar sind. Einige der Elemente in 2B können weggelassen sein oder durch andere Elemente ersetzt sein.
  • 3 ist ein Blockdiagramm, das einen Anwendungsprozessor gemäß beispielhaften Ausführungsformen darstellt.
  • Bezug nehmend auf 3 kann ein Anwendungsprozessor 2000 einen Systembus SYSBUS 2100, einen Host-Prozessor 100, ein Sprachauslösesystem 200, ein Audio-Teilsystem 300 und einen Sensor-Hub 400 aufweisen. Das Audio-Verarbeitungssystem 250 in 2A kann das Audio-Teilsystem 300 und den Sensor-Hub 400 aufweisen. Gemäß beispielhaften Ausführungsformen kann der Anwendungsprozessor 2000 ferner einen aktiven Strommanager APM, Mail-Box- bzw. Briefkastenmodule MBXa, MBXb und MBXc und eine Unterbrechungssteuerung ITRC aufweisen.
  • Auf den Systembus 2100 kann als eine Zusammenschaltungsvorrichtung oder ein Backbone bzw. Hauptstrang Bezug genommen werden. Der Systembus 2100 kann einen Bus einer höheren Schicht, einen Bus einer niedrigeren Schicht und eine Brücke bzw. Bridge, die dieselben verbindet, aufweisen. Der Systembus 2100 kann beispielsweise verschiedene Busse, wie z. B. eine Advanced-Extensible-Schnittstelle (AXI), einen Advanced-High-Performance-Bus (AHB), einen Advanced-Peripheral-Bus (APB) etc., und mindestens eine Brücke, die die Advanced-Extensible-Schnittstelle (AXI), den Advanced-High-Performance-Bus (AHB), den Advanced-Peripheral-Bus (APB) etc. verbindet, aufweisen. Der Host-Prozessor 100 kann auf externe Vorrichtungen, wie z. B. eine Speichervorrichtung 1200 und/oder eine Datenspeichervorrichtung 1300, durch den Systembus 2100 zugreifen. Der Host-Prozessor 100 kann zusätzlich durch den Systembus 2100 mit dem Sprachauslösesystem 200, dem Audio-Teilsystem 300 und dem Sensor-Hub 400 kommunizieren.
  • Obwohl eine Unterbrechungssteuerung ITRC in 3 für eine Bequemlichkeit einer Darstellung dargestellt wird, kann die Unterbrechungssteuerung ITRC mindestens eine allgemeine Unterbrechungssteuerung (GIC), mindestens eine vektorgesteuerte Unterbrechungssteuerung (VIC) etc. aufweisen. Die Unterbrechungssteuerung ITRC kann beispielsweise als eine programmierbare Unterbrechungsteuerung (PIC) implementiert sein. Die programmierbare Unterbrechungssteuerung kann mit mehreren Schichten, die ein Prioritätssystem, das durch Vektoren dargestellt wird, haben, implementiert sein. Die programmierbare Unterbrechungssteuerung kann von peripheren Vorrichtungen ein Unterbrechungssignal empfangen, Prioritäten des empfangenen Unterbrechungssignals bestimmen und ein Unterbrechungssignal mit einer Zeigeradresse auf einen Prozessor oder eine Steuerung ausgeben.
  • Der aktive Strommanager APM kann einen Strom des Anwendungsprozessors 2000 managen. Der aktive Strommanager APM kann einen Strom, der jeweiligen Bereichen oder Funktionsblöcken des Anwendungsprozessors 2000 zugeführt wird, managen. Die Briefkastenmodule MBXa, MBXb und MBXc können eine Synchronisation einer Datenkommunikation zwischen den Elementen in dem Anwendungsprozessor 2000 oder einer Datenkommunikation zwischen dem Anwendungsprozessor 2000 und externen Vorrichtungen unterstützen. Die Briefkastenmodule MBXa, MBXb und MBXc werden im Folgenden unter Bezugnahme auf 6 beschrieben werden.
  • Das Sprachauslösesystem 200 ist mit dem Systembus 2100 elektrisch verbunden. Das Sprachauslösesystem 200 führt basierend auf einem Auslöseeingangssignal, das durch eine Auslöseschnittstelle geliefert wird, einen Sprachauslösebetrieb durch und gibt ein Auslöseereignis aus. Bei einigen beispielhaften Ausführungsformen kann das Sprachauslösesystem 200 von einem digitalen Mikrofon DMIC 40 und/oder einem Audio-Codec (Codierer und Decodierer) CODEC 50 das Auslöseeingangssignal empfangen. Die Auslöseschnittstelle des Sprachauslösesystems 200 kann, mit anderen Worten, mit dem digitalen Mikrofon 40 und dem Audio-Codec 50 direkt verbunden sein. Der Audio-Codec 50 kann ein Codieren und Decodieren (oder eine Analog-zu-Digital-Wandlung (ADC) und eine Digital-zu-Analog-Wandlung (DAC)) eines Audiosignals, das von dem digitalen Mikrofon 40 und/oder einem analogen Mikrofon AMIC 61 empfangen wird, und eines Audiosignals, das zu einem Lautsprecher 62 ausgegeben wird, durchführen. Das digitale Mikrofon 40 kann ein Mikrofon auf der Leiterplatte, das mit dem Anwendungsprozessor 2000 an einer Leiterplatte der elektronischen Vorrichtung angebracht ist, sein. Das analoge Mikrofon 61 und der Lautsprecher 62 können Vorrichtungen sein, die an Anschlüssen des Audio-Codecs 50 befestigt sind und von denselben lösbar sind.
  • Das Audio-Teilsystem 300 ist mit dem Systembus 2100 elektrisch verbunden. Das Audio-Teilsystem 300 verarbeitet Audioströme, die durch eine Audio-Schnittstelle wiedergegeben oder aufgezeichnet werden, und unterstützt eine Übertragung der Audioströme zwischen der Speichervorrichtung 1200 und der Audio-Schnittstelle. Bei einigen beispielhaften Ausführungsformen kann das Audio-Teilsystem 300 die Audioströme mit dem Audio-Codec 50 und/oder einem Bluetooth-Modul BTM 70 austauschen. Die Audio-Schnittstelle des Audio-Teilsystems 300 kann, mit anderen Worten, mit dem Audio-Codec 50 und dem Bluetooth-Modul 70 direkt verbunden sein. Das Bluetooth-Modul 70 kann durch ein Bluetooth-Audio-Modul BTAUD 80 mit einem Bluetooth-Mikrofon BMIC 81 und einem Bluetooth-Lautsprecher 82 verbunden sein, um das Audiosignal von dem Bluetooth-Mikrofon 81 zu empfangen und um das Audiosignal zu dem Bluetooth-Lautsprecher 82 auszugeben. Das Bluetooth-Modul 70 kann mit einem anderen Bluetooth-Lautsprecher 85 oder einer anderen Bluetooth-Vorrichtung direkt verbunden sein. Obwohl es nicht in 3 dargestellt wird, kann das Audio-Teilsystem 300 mit einem Universal-Serial-Bus- (USB-) Modul verbunden sein, um den Audiostrom mit dem USB-Modul auszutauschen.
  • Der Sensor-Hub 400 ist mit dem Systembus elektrisch verbunden. Der Sensor-Hub 400 verarbeitet Signale, die von einem Sensor oder mehreren Sensoren SEN1 31 und SEN2 32 geliefert werden. Der Sensor-Hub 400 kann physikalische Größen, die der elektronischen Vorrichtung zugeordnet sind, messen und die physikalischen Größen verarbeiten, um einen Betriebsstatus der elektronischen Vorrichtung zu erfassen und den erfassten Betriebsstatus zu verarbeiten. Die Sensoren 31 und 32 können beispielsweise einen Bewegungssensor, einen Kreiselsensor, einen Atmosphärendrucksensor, einen magnetischen Sensor, einen Beschleunigungsmesser, einen Griffsensor, einen Annäherungssensor, einen biometrischen Sensor, einen Temperatur-/Feuchtigkeitssensor, einen Beleuchtungsstärkensensor, einen Ultraviolett- (UV-) Sensor, einen Elektronasen- (E-Nose- ) Sensor, einen Elektromyographie- (EMG-) Sensor, einen Elektroenzephalogramm-(EEG-) Sensor, einen Elektrokardiogramm- (ECG-) Sensor, einen Infrarot- (IR-) Sensor, einen Irissensor und/oder einen Fingerabdrucksensor aufweisen.
  • Bei einigen beispielhaften Ausführungsformen können sowohl der Systembus 2100, das Sprachauslösesystem 200, das Audio-Teilsystem 300 als auch der Sensor-Hub 400 in einem einzelnen Halbleiterchip integriert sein, der den Anwendungsprozessor 2000 bildet. Bei anderen beispielhaften Ausführungsformen können der Systembus 2100, das Sprachauslösesystem 200 und das Audio-Teilsystem 300 in einem einzelnen Chip integriert sein, und der Sensor-Hub 400 kann außerhalb des Anwendungsprozessors 2000 angeordnet sein. In jedem Fall ist jedoch das Sprachauslösesystem 200 in dem Anwendungsprozessor 2000 vorgesehen, und somit können der Anwendungsprozessor, die elektronische Vorrichtung, die den Anwendungsprozessor aufweist, und das Verfahren zum Betreiben des Anwendungsprozessors gemäß beispielhaften Ausführungsformen durch Integrieren des Sprachauslösesystems in dem Anwendungsprozessor den Sprachauslösebetrieb mit einem niedrigen Strom und einer hohen Effizienz durchführen.
  • 4 ist ein Blockdiagramm, das einen Echounterdrücker darstellt, den ein Anwendungsprozessor gemäß beispielhaften Ausführungsformen aufweist.
  • Bezug nehmend auf 4 kann ein Echounterdrücker 95 ein Filter 96 und eine Echosperre 97 aufweisen.
  • Ein Audio-Ausgangssignal x(t), das von dem Audio-Teilsystem 300 geliefert wird, kann aus einem Lautsprecher 98 ausgegeben werden und zu einem Benutzer ausgegeben werden. Ein Mikrofon 99 kann ein Audio-Eingangssignal y(t) ausgeben. Obwohl es nicht gezeigt ist, kann eine Digital-zu-Analog-Wandlung (DAC) auf das Audio-Ausgangssignal x(t) (z. B. ein digitales Signal) vor einem Abspielen aus dem Lautsprecher 98 angewendet werden, und eine Analog-zu-Digital-Wandlung (ADC) kann auf ein Signal, das durch das Mikrofon 99 eingefangen wird, angewendet werden, um zu dem Audio-Eingangssignal y(t) (z. B. einem digitalen Signal) in die Echosperre 97 gelangen.
  • Das Audio-Eingangssignal y(t) von dem Mikrofon 99 kann ein Nahsignal v(t) und ein Echosignal s(t) aufweisen. Auf das Nahsignal v(t) kann als ein gewünschtes Signal oder Primärsignal Bezug genommen werden, das der Benutzer dazu bestimmt hat, um durch das Mikrofon 99 empfangen zu werden. Das Echosignal s(t) kann eine Echokomponente, die aus Audiosignalen, die aus dem Lautsprecher 98 ausgegeben werden, resultiert, aufweisen. Obwohl es nicht gezeigt ist, kann das Audio-Eingangssignal y(t) ferner Rauschen aufweisen. Die Echokomponente und das Rauschen können als Störungen für das Nahsignal v(t) wirken, und somit ist es vorteilhaft, die Echokomponente und das Rauschen zu unterdrücken oder zu beseitigen.
  • Bei einigen beispielhaften Ausführungsformen kann mindestens einer von verschiedenen Algorithmen, wie z. B. eine Double-Talk- bzw. Doppelsprecherfassung, eine Step-Size- bzw. Schrittweitensteuerung etc., verwendet werden, um die Echounterdrückung durchzuführen.
  • Das Filter 96 kann das Echosignal s(t), das das Audio-Eingangssignal y(t) aufweist, basierend auf dem Audio-Ausgangssignal x(t) und dem Audio-Eingangssignal y(t) schätzen, um ein geschätzte Echosignal s'(t) zu erzeugen. Das Filter 96 kann, mit anderen Worten, die Echokomponente in dem Audio-Eingangssignal y(t) und einen Echopfad, der die Echokomponente verursacht, nachbilden und schätzen, wie der Echopfad das gewünschte Audio-Ausgangssignal x(t) auf eine ungewünschte Echokomponente in dem Audio-Eingangssignal y(t) ändert. Das Audio-Ausgangssignal x(t) kann als ein Bezugssignal verwendet werden.
  • Der Echopfad beschreibt die Wirkungen der akustischen Pfade, die durch ein Fernsignal von dem Lautsprecher 98 zu dem Mikrofon 99 durchlaufen werden. Das Fernsignal kann direkt von dem Lautsprecher 98 zu dem Mikrofon 99 laufen, oder das Fernsignal kann an verschiedenen Oberflächen in einer Umgebung eines Nahanschlusses reflektiert werden. Der Echopfad, der durch das Fernsignal, das aus dem Lautsprecher 98 ausgegeben wird, durchquert wird, kann als ein System betrachtet werden, das einen Frequenz- und einen Phasengang, die mit der Zeit variieren können, hat.
  • Bei einigen beispielhaften Ausführungsformen kann der Echopfad basierend auf mindestens einem von verschiedenen linearen Filtern, wie z. B. einem Filter mit endlicher Impulsantwort (FIR), einem Filter mit unendlicher Impulsantwort (IIR) etc., nachgebildet werden. Die Schätzung des Echopfades kann beispielsweise ein Vektor sein, der (N+1) Werte hat, wobei N eine natürliche Zahl ist, und das Filter 96 kann als ein Filter einer N-ten Ordnung, das eine endliche Länge (in der Zeit) hat, implementiert sein.
  • Bei einigen beispielhaften Ausführungsformen kann die Schätzung des Echopfads nicht explizit berechnet werden, kann jedoch mittels Filterkoeffizienten dargestellt werden, die aus mindestens einem von verschiedenen stochastischen Gradientenalgorithmen, wie z. B. kleinsten mittleren Quadraten (LMS), normierten kleinsten mittleren Quadraten (NLMS), einer schnellen affinen Projektion (FAP) und rekursiven kleinsten Quadraten (RLS) etc., erhalten werden.
  • Bei einigen beispielhaften Ausführungsformen kann die Schätzung des Echopfads kontinuierlich in Echtzeit aktualisiert werden.
  • Die Echosperre 97 kann basierend auf dem geschätzte Echosignal s'(t) und dem Audioeingangssignal y(t) ein geschätztes Nahsignal v'(t) erzeugen. Die Echosperre 97 kann beispielsweise auf das Audio-Eingangssignal y(t) basierend auf dem geschätzten Echosignal s'(t) eine Echosperrung anwenden, um das geschätzte Nahsignal v'(t) zu erzeugen, wodurch das Echo in dem empfangenen Audiosignal gesperrt wird. Das geschätzte Nahsignal v'(t) kann umso näher an dem Nahsignal v(t) sein, sowie der Echopfad präziser geschätzt wird. Das heißt, sowie sich die Präzision der Schätzung des Echopfads verbessert, wird das geschätzte Nahsignal v'(t) eine nähere Näherung des Nahsignals v(t).
  • Bei einigen beispielhaften Ausführungsformen kann die Echosperre 97 als ein Echo-Subtrahierer implementiert sein. Der Echo-Subtrahierer kann beispielsweise das geschätzte Echosignal s'(t) von dem Audio-Eingangssignal y(t) subtrahieren, um das geschätzte Nahsignal v'(t) zu erzeugen.
  • Gemäß beispielhaften Ausführungsformen können die Elemente in dem Echounterdrücker 96 mit verschiedenen Konfigurationen implementiert sein, einige Elemente in dem Echounterdrücker 95 können weggelassen oder durch andere Elemente ersetzt sein, und einige Elemente können dem Echounterdrücker 95 hinzugefügt sein. Gemäß beispielhaften Ausführungsformen kann mindestens ein Teil des Echounterdrückers 95 als Hardware, wie z. B. eine Schaltung, oder als Anweisungen und/oder Programmroutinen (z. B. ein Softwareprogramm), die durch einen Prozessor oder mehrere Prozessoren ausgeführt werden, implementiert sein.
  • 5 ist ein Blockdiagramm, das eine beispielhafte Verbindung eines Sprachauslösesystems und eines Audio-Teilsystems bei einem Anwendungsprozessor gemäß beispielhaften Ausführungsformen darstellt. Der Host-Prozessor 100 und andere Elemente von 3 sind anwesend, werden jedoch in 5 für eine Bequemlichkeit einer Darstellung weggelassen.
  • Bezug nehmend auf 5 kann ein Anwendungsprozessor 2001 einen Systembus SYSBUS 2100, ein Sprachauslösesystem 201, ein Audio-Teilsystem 301 und ein Briefkastenmodul MBX aufweisen. Das Audio-Verarbeitungssystem 250 in 2A kann das Audio-Teilsystem 301 aufweisen.
  • Das Sprachauslösesystem 201 ist mit dem Systembus 2100 elektrisch verbunden. Das Sprachauslösesystem 201 führt basierend auf einem Mikrofon-Auslöseeingangssignal SDMIC und/oder einem Codec-Auslöseeingangssignal SAMIC, die oder das durch eine Auslöseschnittstelle TIF geliefert werden oder wird, einen Sprachauslösebetrieb durch. Das Sprachauslösesystem 201 kann das Mikrofon-Auslöseeingangssignal SDMIC von einem digitalen Mikrofon DMIC 40 und/oder das Codec-Auslöseeingangssignal SAMIC von einem Audio-Codec (Codierer und Decodierer) CODEC 50 empfangen. Ein Mikrofon-Taktsignal MICCLK kann zwischen dem Sprachauslösesystem 201, dem digitalen Mikrofon 40 und dem Audio-Codec 50 für eine Synchronisation einer Signalübertragung übertragen werden. Die Mikrofon- und Codec-Auslöseeingangssignale SDMIC und SAMIC und das Mikrofon-Taktsignal MICCLK können durch Kontaktstellen PD11, PD12 und PD13 übertragen werden. Die Kontaktstellen PD11, PD12 und PD13 können implementiert sein, derart, dass verhindert werden kann, dass die verwendete Kontaktstelle andere nicht verwendete Kontaktstellen stört.
  • Das Audio-Teilsystem 301 ist mit dem Systembus 2100 elektrisch verbunden. Das Audio-Teilsystem 301 verarbeitet Audioströme, die durch eine Audio-Schnittstelle AIF wiedergegeben oder aufgezeichnet werden, und unterstützt eine Übertragung der Audioströme zwischen der Speichervorrichtung 1200 und der Audio-Schnittstelle. Bei einigen beispielhaften Ausführungsformen kann das Audio-Teilsystem 301 die Audioströme mit dem Audio-Codec 50 austauschen. Das Audio-Teilsystem 301 kann durch eine Audio-Eingangskontaktstelle PD21 von dem Audio-Codec 50 ein Audio-Eingangssignal SDI empfangen und durch eine Audio-Ausgangskontaktstelle PD22 ein Audio-Ausgangssignal SDO zu dem Audio-Codec 50 senden.
  • Das Sprachauslösesystem 201 kann eine Auslöseschnittstellenschaltung IFV 211, einen Wrapper bzw. Verpacker WRPP 221, einen Auslösespeicher MEMV 231 und einen Auslöseprozessor PRCV 241 aufweisen.
  • Die Auslöseschnittstellenschaltung 211 und die Kontaktstellen PD11, PD12 und PD13 können die Auslöseschnittstelle TIF bilden, um das Mikrofon-Auslöseeingangssignal SDMIC, das von dem digitalen Mikrofon 40 geliefert wird, und/oder das Codec-Auslösesignal SAMIC, das von dem Audio-Codec 50 geliefert wird, abzutasten und zu wandeln. Der Verpacker 221 kann Daten, die von der Auslöseschnittstellenschaltung 211 geliefert werden, in dem Auslösespeicher 231 speichern. Der Verpacker 221 kann ein Unterbrechungssignal zu dem Auslöseprozessor 241 ausgeben, wenn eine Schwellenmenge an Daten in dem Auslösespeicher 231 gespeichert wurde, so dass der Auslöseprozessor 241 basierend auf den Daten, die in dem Auslösespeicher 231 gespeichert sind, den Sprachauslösebetrieb durchführen kann.
  • Bei einigen beispielhaften Ausführungsformen kann das Sprachauslösesystem 201 als die Mikrofon- und Codec-Auslöseeingangssignale SDMIC und SAMIC ein Pulsdichtemodulations- (PDM-) Signal empfangen. Die Auslöseschnittstellenschaltung 211 kann das PDM-Signal in Pulscodemodulations- (PCM-) Daten wandeln. Der Verpacker 221 kann die PCM-Daten in dem Auslösespeicher 231 speichern. Der Verpacker 221 kann als eine Steuerung für einen direkten Speicherzugriff implementiert sein.
  • Das Audio-Teilsystem 301 kann eine Audio-Schnittstellenschaltung IFA 311, eine Steuerung 321 für einen direkten Speicherzugriff DMA, einen Audiospeicher MEMA 331 und eine Audioprozessor PRCA 341 aufweisen.
  • Die Audio-Schnittstellenschaltung 311 und die Audio-Eingangs- und Ausgangskontaktstellen PD21 und PD22 können die Audio-Schnittstelle AIF bilden, um die Audioströme durch das Audio-Eingangssignal SDI und das Audio-Ausgangssignal SDO zu übertragen. Der Audiospeicher 331 kann Daten der Audioströme speichern, und die Steuerung 321 für einen direkten Speicherzugriff kann einen Zugriff auf den Audiospeicher steuern, d. h. ein Datenlesen aus dem Audiospeicher 331 und ein Datenschreiben in den Audiospeicher 331. Der Audio-Prozessor 341 kann Daten, die in dem Audiospeicher 331 gespeichert sind, verarbeiten.
  • Bei einigen beispielhaften Ausführungsformen kann der Audio-Prozessor 341 in dem Audio-Teilsystem 301 einen Echounterdrücker AEC 701 aufweisen. Der Echo-Unterdrücker 701 kann der unter Bezugnahme auf 4 beschriebene Echounterdrücker 95 sein.
  • Bei einigen beispielhaften Ausführungsformen kann die Audio-Schnittstellenschaltung IFA 311 mit dem I2S- (Inter-IC-Sound-) oder dem IIS-(Integrated-Interchip-Sound-)Standard kompatibel sein. Obwohl es in 5 nicht dargestellt wird, kann die Audio-Schnittstellenschaltung 311 basierend auf Taktsignalen gemäß dem I2S-Standard in Betrieb sein. Bei einigen beispielhaften Ausführungsformen kann die Audio-Schnittstellenschaltung 311 mit dem digitalen Mikrofon 40 und/oder dem Audio-Codec 50 direkt verbunden sein.
  • Bei einigen beispielhaften Ausführungsformen kann der Anwendungsprozessor 2001 ferner ein Briefkastenmodul MBX, das konfiguriert ist, um eine Synchronisation einer Datenkommunikation zwischen dem Sprachauslösesystem 201 und dem Audio-Teilsystem 301 zu unterstützen, aufweisen.
  • Es ist vorteilhaft, eine Echounterdrückung während der Audiowiedergabe durchzuführen, um eine Erkennungsrate des Sprachauslösebetriebs zu steigern. Während die Audiowiedergabe durch die Audio-Schnittstelle AIF durchgeführt wird, kann der Anwendungsprozessor 2001 gemäß beispielhaften Ausführungsformen die Echounterdrückung hinsichtlich Mikrofondaten, die von einem Mikrofon (z. B. dem digitalen Mikrofon 40 oder dem analogen Mikrofon 61) empfangen werden, durchführen, um kompensierte Daten zu erzeugen, und das Sprachauslösesystem 201 kann basierend auf den kompensierten Daten den Sprachauslösebetrieb durchführen. Die Echounterdrückung kann durch den Echounterdrücker 701 in dem Audio-Teilsystem 301 durchgeführt werden.
  • Der Anwendungsprozessor 2001 kann die Datenkommunikation zwischen dem Sprachauslösesystem 201 und dem Audio-Teilsystem 301 unter Verwendung des Briefkastenmoduls MBX durch den Systembus 2100 durchführen. Insofern können oder kann, während die Audiowiedergabe durch die Audio-Schnittstelle AIF durchgeführt wird, und während die Echounterdrückung durchgeführt wird, der Host-Prozessor 100 und/oder der Systembus 200 einen Schlafmodus beibehalten und nicht zu einem aktiven Modus für den Sprachauslösebetrieb aufwachen. Das heißt, während die Audiowiedergabe durch die Audio-Schnittstelle AIR durchgeführt wird und während eine Echounterdrückung durchgeführt wird, befinden sich lediglich das Audio-Teilsystem 301, Komponenten, die sich auf das Briefkastenmodul MBX beziehen, und das Sprachauslösesystem 201 in einem aktiven Modus.
  • 6 ist ein Diagramm, das eine beispielhafte Ausführungsform eines Briefkastenmoduls, das der Anwendungsprozessor von 5 aufweist, darstellt.
  • Bezug nehmend auf 6 kann ein Briefkastenmodul 900 eine Schnittstelle APB-SCHNITTSTELLE 910, einen Nachrichtenkasten NACHRICHT 920, eine erste Registerschaltung 930, die eine Mehrzahl von Registern INTGR0, INTCR0, INTMR0, INTSR0 und INTMSR0 aufweist, und eine zweiten Registerschaltung 940, die eine Mehrzahl von Registern INTGR1, INTCR1, INTMR1, INTSR1 und INTMSR1 aufweist, aufweisen. 6 stellt ein nicht beschränkendes Beispiel dar, dass das Briefkastenmodul 900 mit einer AHB2APB-Brücke des Systembusses 2100 durch eine APB-Schnittstelle verbunden ist und der Nachrichtenkasten 920 mit gemeinsam verwendeten Registern mit 6*32 Bits implementiert ist. Dies ist jedoch lediglich ein Beispiel, und der Typ der Schnittstelle 910 und die Zahl und die Bitzahl der Register in dem Nachrichtenkasten 920 kann verschieden bestimmt sein. Die erste Registerschaltung 930 kann ein Unterbrechungssignal (IRQ ZU PRCV), das zu dem Auslöseprozessor 241 in dem Sprachauslösesystem 201 geliefert wird, erzeugen, und die zweite Registerschaltung 940 kann ein Unterbrechungssignal (IRQ ZU PRCA), das zu dem Audioprozessor 341 in dem Audio-Teilsystem 301 geliefert wird, erzeugen. Das Datensenden zwischen dem Sprachauslösesystem 201 und dem Audio-Teilsystem 301 kann unter Verwendung des Briefkastenmoduls 900 synchronisiert werden.
  • Das Briefkastenmodul 900 kann durch Senden eine Unterbrechungssignals, nachdem entweder der Auslöseprozessor 241 oder der Audioprozessor 341 eine Nachricht in den Briefkasten 920 geschrieben hat, eine bilaterale Kommunikation durchführen. Die Synchronisation des Datensendens zwischen dem Sprachauslösesystem 201 und dem Audio-Teilsystem 301 kann durch ein Abrufverfahren etc. implementiert sein.
  • 7 ist ein Flussdiagramm, das ein Verfahren zum Betreiben eines Anwendungsprozessors gemäß beispielhaften Ausführungsformen darstellt. 8 ist ein Blockdiagramm zum Beschreiben des Verfahrens zum Betreiben des Anwendungsprozessors von 7.
  • Bezug nehmend auf 7 und 8 kann, während eine Audiowiedergabe durch ein Audio-Teilsystem ASS durch eine Ausgangskontaktstelle einer Audio-Schnittstelle AIF basierend auf Audio-Ausgangsdaten eines Audio-Ausgangssignals SDO durchgeführt wird, ein Sprachauslösesystem VTS durch eine Auslöseschnittstelle TIF ein Auslöseeingangssignal SMIC empfangen (S510).
  • Das Sprachauslösesystem VTS kann unter Verwendung des Briefkastenmoduls MBX Abtastdaten DSM des Auslöseeingangssignals SMIC zu dem Audio-Teilsystem ASS übertragen (S520). Die Abtastdaten DSM können beispielsweise durch den Systembus 2100 von dem Sprachauslösesystem VTS zu dem Audio-Teilsystem ASS übertragen werden.
  • Ein Echounterdrücker AEC in dem Audio-Teilsystem ASS kann eine Echounterdrückung hinsichtlich der Abtastdaten DSM basierend auf den Audio-Ausgangsdaten des Audio-Ausgangssignals SDO durchführen, um kompensierte Abtastdaten CDSM zu erzeugen (S530). Die Audio-Ausgangsdaten können als ein Bezugssignal verwendet werden, und die Abtastdaten DSM können als ein empfangenes Signal für die Echounterdrückung verwendet werden.
  • Das Audio-Teilsystem ASS kann unter Verwendung des Briefkastenmoduls MBX die kompensierten Abtastdaten CDSM zu dem Sprachauslösesystem VTS übertragen (S540). Die kompensierten Abtastdaten CDSM können beispielsweise durch den Systembus 2100 von dem Audio-Teilsystem ASS zu dem Sprachauslösesystem VTS übertragen werden.
  • Das Sprachauslösesystem VTS kann basierend auf den kompensierten Abtastdaten CSM einen Sprachauslösebetrieb durchführen (S550). Der Sprachauslösebetrieb kann basierend auf den kompensierten Abtastdaten CDSM, auf die die Echounterdrückung angewendet wurde, durchgeführt werden, und somit kann eine Erkennungsrate des Sprachauslösebetriebs gesteigert werden.
  • 9 ist ein Flussdiagramm, das ein Verfahren zum Betreiben eines Anwendungsprozessors gemäß beispielhaften Ausführungsformen darstellt. 10 ist ein Blockdiagramm zum Beschreiben des Verfahrens zum Betreiben des Anwendungsprozessors von 9.
  • Bezug nehmend auf 9 und 10 kann, während eine Audiowiedergabe durch ein Audio-Teilsystem ASS durch eine Ausgangskontaktstelle einer Audio-Schnittstelle AIF basierend auf den Audio-Ausgangsdaten eines Audio-Ausgangssignals SDO durchgeführt wird, das Audio-Teilsystem ASS durch eine Eingangskontaktstelle der Audio-Schnittstelle AIF ein Audio-Eingangssignal SDI empfangen (S610).
  • Eine Echounterdrücker AEC in dem Audio-Teilsystem ASS kann hinsichtlich Audio-Eingangsdaten des Audio-Eingangssignals SDI basierend auf den Audio-Ausgangsdaten des Audio-Ausgangssignals SDO eine Echounterdrückung durchführen, um kompensierte Audio-Eingangsdaten CSDI zu erzeugen (S620). Die Audio-Ausgangsdaten können als ein Bezugssignal verwendet werden, und die Audio-Eingangsdaten können als ein empfangenes Signal für die Echounterdrückung verwendet werden.
  • Das Audio-Teilsystem ASS kann unter Verwendung des Briefkastenmoduls MBX die kompensierten Audio-Eingangsdaten CSDI zu dem Sprachauslösesystem VTS übertragen. (S630). Die kompensierten Audio-Eingangsdaten CSDI können beispielsweise durch den Systembus 2100 von dem Audio-Teilsystem ASS zu dem Sprachauslösesystem VTS übertragen werden.
  • Das Sprachauslösesystem VTS kann basierend auf den kompensierten Audio-Eingangsdaten CSDI einen Sprachauslösebetrieb durchführen (S640). Der Sprachauslösebetrieb kann basierend auf den kompensierten Audio-Eingangsdaten CSDI, auf die die Echounterdrückung angewendet wurde, durchgeführt werden, und somit kann eine Erkennungsrate des Sprachauslösebetriebs gesteigert werden.
  • Bei einigen beispielhaften Ausführungsformen kann die Auslöseschnittstelle TIF gesperrt sein, während die Audiowiedergabe durchgeführt wird. Die Auslöseschnittstelle TIF kann, mit anderen Worten, das Auslöseeingangssignal SMIC nicht empfangen, und das Sprachauslösesystem VTS kann basierend auf den kompensierten Audio-Eingangsdaten CSDI statt dem Auslöseeingangssignal SMIC den Sprachauslösebetrieb durchführen.
  • 11 ist ein Blockdiagramm, das eine beispielhafte Verbindung eines Sprachauslösesystems und eines Audio-Teilsystems bei einem Anwendungsprozessor gemäß beispielhaften Ausführungsformen darstellt. Der Host-Prozessor 100 und andere Elemente von 3 sind anwesend, werden jedoch für eine Bequemlichkeit einer Darstellung in 11 weggelassen, und die Beschreibung, die sich aufgrund von 3 und 5 wiederholt, kann weggelassen werden.
  • Bezug nehmend auf 11 kann ein Anwendungsprozessor 2002 einen Systembus SYSBUS 2100, ein Sprachauslösesystem 202, ein Audio-Teilsystem 302 und ein Briefkastenmodul MBX aufweisen. Das Audio-Verarbeitungssystem 250 in 2A kann das Audio-Teilsystem 302 aufweisen.
  • Das Sprachauslösesystem 202 kann eine Auslöseschnittstellenschaltung IFV 212, einen Verpacker WRPP 222, einen Auslösespeicher MEMV 232 und einen Auslöseprozessor PRCV 242 aufweisen.
  • Das Audio-Teilsystem 302 kann eine Audio-Schnittstellenschaltung IFA 312, eine Steuerung 322 für einen direkten Speicherzugriff DMA, einen Audiospeicher MEMA 332 und einen Audio-Prozessor PRCA 342 aufweisen.
  • Im Vergleich zu dem Echounterdrücker 701, den das Audio-Teilsystem 301 des Anwendungsprozessors 2001 von 5 aufweist, kann der Auslöseprozessor 242 in dem Sprachauslösesystem 202 des Anwendungsprozessors 2002 einen Echounterdrücker 702 aufweisen, wie es bei der beispielhaften Ausführungsform von 11 gezeigt wird. Der Echounterdrücker 702 kann der Echounterdrücker 95 sein, der unter Bezugnahme auf 4 beschrieben wurde. Bei einem Beispiel von 11 kann eine Echounterdrückung durch den Echounterdrücker 702 in dem Sprachauslösesystem 202 durchgeführt werden.
  • 12 ist ein Flussdiagramm, das ein Verfahren zum Betreiben eines Anwendungsprozessors gemäß beispielhaften Ausführungsformen darstellt. 13 ist ein Blockdiagramm zum Beschreiben des Verfahrens zum Betreiben des Anwendungsprozessors von 12.
  • Bezug nehmend auf 12 und 13 kann, während eine Audiowiedergabe durch ein Audio-Teilsystem ASS durch eine Ausgangskontaktstelle einer Audio-Schnittstelle AIF basierend auf Audio-Ausgangsdaten SDO', die einem Audio-Ausgangsignal SDO entsprechen, durchgeführt wird, ein Sprachauslösesystem VTS durch eine Auslöseschnittstelle TIF ein Auslöseeingangssignal SMIC empfangen (S710).
  • Das Audio-Teilsystem ASS kann unter Verwendung des Briefkastenmoduls MBX die Audio-Ausgangsdaten SDO' zu dem Sprachauslösesystem VTS übertragen (S720). Die Audio-Ausgangsdaten SDO' können beispielsweise durch den Systembus 2100 von dem Audio-Teilsystem ASS zu dem Sprachauslösesystem VTS übertragen werden.
  • Ein Echounterdrücker AEC in dem Sprachauslösesystem VTS kann hinsichtlich Abtastdaten des Auslöseeingangssignals SMIC basierend auf den Audio-Ausgangsdaten SDO' eine Echounterdrückung durchführen, um kompensierte Abtastdaten zu erzeugen (S730). Die Audio-Ausgangsdaten SDO' können als ein Bezugssignal verwendet werden, und die Abtastdaten können als ein empfangenes Signal für die Echounterdrückung verwendet werden.
  • Das Sprachauslösesystem VTS kann basierend auf den kompensierten Abtastdaten einen Sprachauslösebetrieb durchführen (S740). Der Sprachauslösebetrieb kann basierend auf den kompensierten Abtastdaten, auf die die Echounterdrückung angewendet wurde, durchgeführt werden, und somit kann eine Erkennungsrate des Sprachauslösebetriebs gesteigert werden.
  • 14 ist ein Blockdiagramm, das eine beispielhafte Verbindung eines Sprachauslösesystems und eines Audio-Teilsystems bei einem Anwendungsprozessor gemäß beispielhaften Ausführungsformen darstellt. Der Host-Prozessor 100 und andere Elemente von 3 sind anwesend, werden jedoch für eine Bequemlichkeit einer Darstellung in 14 weggelassen, und eine Beschreibung, die sich aufgrund von 3 und 5 wiederholt, kann weggelassen werden.
  • Bezug nehmend auf 14 kann ein Anwendungsprozessor 2003 einen Systembus SYSBUS 2100, ein Sprachauslösesystem 203, ein Audio-Teilsystem 303 und ein Briefkastenmodul MBX aufweisen. Das Audio-Verarbeitungssystem 250 in 2A kann das Audio-Teilsystem 303 aufweisen.
  • Das Sprachauslösesystem 203 kann eine Auslöseschnittstellenschaltung IFV 213, einen Verpacker WRPP 223, einen Auslösespeicher MEMV 233 und einen Auslöseprozessor PRCV 243 aufweisen.
  • Das Audio-Teilsystem 303 kann eine Audio-Schnittstellenschaltung IFA 313, eine Steuerung 323 für einen direkten Speicherzugriff DMA, einen Audiospeicher MEMA 333 und einen Audioprozessor PRCA 343 aufweisen.
  • Im Vergleich zu dem Echounterdrücker 701, den das Audio-Teilsystem 301 des Anwendungsprozessors 2001 von 5 aufweist, und dem Echounterdrücker 702, den das Sprachauslösesystem 202 des Anwendungsprozessors 2002 von 11 aufweist, kann ein Audio-Codec 55, der mit der Auslöseschnittstelle TIF und der Audio-Schnittstelle AIF des Anwendungsprozessors 2003 von 14 verbunden ist, einen Echounterdrücker 703 aufweisen. Der Echounterdrücker 703 kann der Echo-Unterdrücker 95, der unter Bezugnahme auf 4 beschrieben wurde, sein. Bei einem Beispiel von 14 kann eine Echounterdrückung durch den Echounterdrücker 703 in dem Audio-Codec 55 durchgeführt werden.
  • 15 ist ein Flussdiagramm, das ein Verfahren zum Betreiben eines Anwendungsprozessors gemäß beispielhaften Ausführungsformen darstellt. 16 ist ein Blockdiagramm zum Beschreiben des Verfahrens zum Betreiben des Anwendungsprozessors von 15.
  • Bezug nehmend auf 15 und 16 kann, während eine Audiowiedergabe durch ein Audio-Teilsystem ASS durch eine Ausgangskontaktstelle einer Audio-Schnittstelle AIF basierend auf Audio-Ausgangsdaten eines Audio-Ausgangssignals SDO durchgeführt wird, ein Audio-Codec CODEC Mikrofondaten DMC von einem analogen Mikrofon empfangen (S810).
  • Ein Echounterdrücker AEC in dem Audio-Codec CODEC kann basierend auf den Audio-Ausgangsdaten eine Echounterdrückung hinsichtlich der Mikrofondaten DMC durchführen, um ein kompensiertes Auslöseeingangssignal CSAIC zu erzeugen (S820). Die Audio-Ausgangsdaten des Audio-Ausgangssignals SDO können als ein Bezugssignal verwendet werden, und die Mikrofondaten DMC können als ein empfangenes Signal für die Echounterdrückung verwendet werden.
  • Der Audio-Codec CODEC kann das kompensierte Auslöseeingangssignal CSAIC durch eine Auslöseschnittstelle TIF zu einem Sprachauslösesystem VTS übertragen (S830).
  • Das Sprachauslösesystem VTS kann basierend auf dem kompensierten Auslöseeingangssignal CSAIC einen Sprachauslösebetrieb durchführen (S840). Der Sprachauslösebetrieb kann basierend auf dem kompensierten Auslöseeingangssignal CSAIC, auf das die Echounterdrückung angewendet wurde, durchgeführt werden, und somit kann eine Erkennungsrate des Sprachauslösebetriebs gesteigert werden.
  • Bei dem Beispiel von 16 kann das kompensierte Auslöseeingangssignal CSAIC durch die Auslöseschnittstelle TIF direkt zu dem Sprachauslösesystem VTS übertragen werden, und somit können/kann der Host-Prozessor und/oder der Systembus 2100 ebenfalls den Schlafmodus beibehalten und nicht zu dem aktiven Modus für den Sprachauslösebetrieb aufwachen.
  • Obwohl es nicht gezeigt wird, kann das Sprachauslösesystem den Audio-Codec 50 in 5 und 11 oder den Audio-Codec 55 in 14 aufweisen oder derselbe kann zwischen dem Sprachauslösesystem und dem Audioteilsystem angeordnet sein, oder das Audio-Teilsystem kann ferner mit dem Bluetooth-Modul 70, das mit dem Bluetooth-Mikrofon BMIC 81 und dem Bluetooth-Lautsprecher 82 verbunden ist, oder dem USB-Modul, das mit einem USB-Mikrofon und einem USB-Lautsprecher verbunden ist, verbunden sein, oder der Audio-Codec 50 kann durch das Bluetooth-Modul 70 und/oder das USB-Modul gemäß beispielhaften Ausführungsformen ersetzt sein.
  • 17A und 17B sind Diagramme zum Beschreiben von Strombereichen eines Anwendungsprozessors gemäß beispielhaften Ausführungsformen.
  • Ein Anwendungsprozessor kann eine Mehrzahl von Strombereichen aufweisen, denen unabhängig Strom zugeführt wird. 17A und 17B stellen einen ersten Strombereich PWDM1 und einen zweiten Strombereich PWDM2 als ein Beispiel dar. Der erste Strombereich PWDM1 entspricht einem Bereich, dem immer Strom zugeführt wird, in dem sowohl in einem aktiven Modus als auch einem Bereitschaftsmodus (oder einem Schlafmodus) Strom zugeführt wird, und der zweite Strombereich PWDM2 entspricht einem Stromsparbereich, in dem Strom in dem Bereitschaftsmodus blockiert wird.
  • Bezug nehmend auf 17A können ein Systemzähler SYSCNT, ein aktiver Strommanager APM und ein Sprachauslösesystem VTS in dem Bereich PWDM1, dem immer Strom zugeführt wird, angeordnet sein. Eine Mehrzahl von Hardwareblöcken, wie zum Beispiel ein Host-Prozessor CPU, ein Audio-Teilsystem ABOX, ein Sensor-Hub CHUB etc., können in dem Stromsparbereich PWDM2 angeordnet sein.
  • Der Systemzähler SYSCNT kann Zeitinformationen TM erzeugen und die Zeitinformationen TM zu internen Schaltungen des Systems liefern. Der aktive Strommanager APM kann eine Mehrzahl von Stromfreischaltsignalen EN erzeugen, um eine Stromzufuhr, eine Stromblockierung etc. von verschiedenen Elementen in dem System zu erzeugen. Das Sprachauslösesystem VTS kann ein Unterbrechungssignal ITRR, das das Auslöseereignis darstellt, erzeugen.
  • In dieser Offenbarung stellt der aktive Modus dar, dass mindestens der Host-Prozessor CPU freigeschaltet ist und ein Betriebssystem (OS) läuft. Der Schlafmodus oder der Bereitschaftsmodus stellt einen Stromabschaltmodus dar, bei dem der Host-Prozessor CPU gesperrt ist.
  • Im Vergleich zu der Anordnung von 17A kann das Sprachauslösesystem VTS in dem Stromsparbereich PWDM2 angeordnet sein, wie es in 17B dargestellt wird.
  • Wie in 17A und 17B dargestellt wird, können der Host-Prozessor CPU, das Sprachauslösesystem VTS, das Audio-Teilsystem ABOX und der Sensor-Hub CHUB Strom-Gating- bzw. -Gatterschaltungen PG1, PG2, PG3 bzw. PG4 aufweisen. Die Stromgatterschaltungen PG1-PG4 können ansprechend auf Stromfreischaltsignale EN1, EN2, EN3 und EN4 selektiv Strom zuführen. Insofern können das Sprachauslösesystem VTS, das Audio-Teilsystem ABOX und der Sensor-Hub CHUB stromgattergesteuert werden und unabhängig von dem Host-Prozessor CPU freigeschaltet werden. Bei einigen beispielhaften Ausführungsformen kann das Sprachauslösesystem VTS bei dem aktiven Strommanager APM anfragen, den Sensor-Hub CHUB freizugeben oder zu sperren, so dass der Sensor-Hub CHUB freigeschaltet werden kann.
  • Der vorliegende Erfindungsgedanke kann auf elektronische Vorrichtungen und Systeme, die Sprachauslösefunktion unterstützen, angewendet sein. Der vorliegende Erfindungsgedanke kann beispielsweise auf Systeme, wie z. B. einen Desktop-Computer, einen Laptop-Computer, ein Mobilfunktelefon, ein Smartphone, einen MP3-Spieler, einen persönlichen digitalen Assistenten (PDA), einen transportablen Multimedia-Spieler (PMP), einen digitalen Fernseher, eine digitale Kamera, einen Server-Computer, eine Workstation, eine Set-top-Box, eine transportable Spielekonsole, ein Navigationssystem, eine tragbare Vorrichtung, eine Vorrichtung des Internets der Dinge (IoT), eine Vorrichtung des Internets von Allem (IoE), ein E-Book, eine Vorrichtung für eine virtuelle Realität (VR), eine Vorrichtung für eine erweiterte Realität (AR) etc., angewendet sein.
  • Das Vorhergehende stellt beispielhafte Ausführungsformen dar und sollte nicht als dieselben beschränkend aufgefasst werden. Obwohl ein paar beispielhafte Ausführungsformen beschrieben wurden, werden Fachleute ohne weiteres anerkennen, dass viele Modifikationen an den beispielhaften Ausführungsformen möglich sind, ohne von den neuen Lehren und Vorteilen der vorliegenden Offenbarung materiell abzuweichen. Alle solche Modifikationen sollen dementsprechend in dem Schutzbereich der vorliegenden Offenbarung, wie er in den Ansprüchen definiert ist, umfasst sein. Es versteht sich daher von selbst, dass das Vorhergehende verschiedene beispielhafte Ausführungsformen darstellt und nicht als auf die offenbarten spezifischen beispielhaften Ausführungsformen beschränkt aufgefasst werden sollte, und dass Modifikationen an den offenbarten beispielhaften Ausführungsformen sowie an anderen beispielhaften Ausführungsformen in dem Schutzbereich der beigefügten Ansprüche umfasst sein sollen.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • KR 1020180009388 [0001]

Claims (15)

  1. Anwendungsprozessor (AP; 2000; 2001; 2002; 2003) mit: einem Systembus (2100); einem Host-Prozessor (100), der mit dem Systembus (2100) elektrisch verbunden ist, einem Sprachauslösesystem (VTS; 200; 201; 202; 203), das mit dem Systembus (2100) elektrisch verbunden ist, wobei das Sprachauslösesystem (VTS; 200; 201; 202; 203) konfiguriert ist, um basierend auf einem Auslöseeingangssignal (SDMIC, SAMIC; SMIC), das durch eine Auslöseschnittstelle (TIF) geliefert wird, einen Sprachauslösebetrieb durchzuführen (S100) und ein Auslöseereignis (ITRR) auszugeben; und einem Audio-Teilsystem (ASS; ABOX; 300; 301; 302; 303), das eine Audio-Schnittstelle (AIF) aufweist und mit dem Systembus (2100) elektrisch verbunden ist, wobei das Audio-Teilsystem (ASS; ABOX; 300; 301; 302; 303) konfiguriert ist, um durch die Audio-Schnittstelle (AIF) Audioströme zu verarbeiten (S200), wobei, während eine Audiowiedergabe durch die Audio-Schnittstelle (AIF) durchgeführt wird, der Anwendungsprozessor (AP; 2000; 2001; 2002; 2003) hinsichtlich Mikrofondaten, die von einem Mikrofon (40, 61, 81; 99) empfangen werden, eine Echounterdrückung durchführt, um kompensierte Daten zu erzeugen (S300), und das Sprachauslösesystem (VTS; 200; 201; 202; 203) basierend auf den kompensierten Daten den Sprachauslösebetrieb durchführt (S400).
  2. Anwendungsprozessor (AP; 2000; 2001; 2002; 2003) nach Anspruch 1, bei dem sowohl der Systembus (2100), der Host-Prozessor (100), das Sprachauslösesystem (VTS; 200; 201; 202; 203) als auch das Audio-Teilsystem (ASS; ABOX; 300; 301; 302; 303) in einem einzelnen Halbleiterchip integriert sind.
  3. Anwendungsprozessor (AP; 2000; 2001; 2002; 2003) nach Anspruch 1, bei dem, während die Audiowiedergabe durch die Audio-Schnittstelle (AIF) durchgeführt wird, der Host-Prozessor (100) einen Schlafmodus beibehält, und der Host-Prozessor (100) nicht zu einem aktiven Modus für den Sprachauslösebetrieb aufwacht.
  4. Anwendungsprozessor (AP; 2000; 2001; 2002; 2003) nach Anspruch 1, mit ferner: einem Briefkastenmodul (MBX; MBXc), das konfiguriert ist, um eine Synchronisation einer Datenkommunikation zwischen dem Sprachauslösesystem (VTS; 200; 201; 202; 203) und dem Audio-Teilsystem (ASS; ABOX; 300; 301; 302; 303) zu unterstützen.
  5. Anwendungsprozessor (AP; 2001) nach Anspruch 4, bei dem das Audio-Teilsystem (301) folgendes Merkmal aufweist: einen Echounterdrücker (AEC, 701), der konfiguriert ist, um die Echounterdrückung durchzuführen.
  6. Anwendungsprozessor (AP; 2001) nach Anspruch 5, bei dem, während die Audiowiedergabe durch eine Ausgangskontaktstelle (PD22) der Audio-Schnittstelle (AIF) basierend auf Audio-Ausgangsdaten durchgeführt wird, das Sprachauslösesystem (VTS; 201) das Auslöseeingangssignal (SDMIC, SAMIC; SMIC) durch die Auslöseschnittstelle (TIF) empfängt (S510).
  7. Anwendungsprozessor (AP; 2001) nach Anspruch 6, bei dem das Sprachauslösesystem (VTS; 201) unter Verwendung des Briefkastenmoduls (MBX) Abtastdaten (DSM) des Auslöseeingangssignals (SDMIC, SAMIC; SMIC) zu dem Audio-Teilsystem (ASS; 301) überträgt (S520), der Echo-Unterdrücker (AEC, 701) in dem Audio-Teilsystem (ASS; 301) die Echounterdrückung hinsichtlich der Abtastdaten (DSM) basierend auf den Audio-Ausgangsdaten durchführt, um kompensierte Abtastdaten (CDSM) zu erzeugen (S530), und das Audio-Teilsystem (301) unter Verwendung des Briefkastenmoduls (MBX) die kompensierten Abtastdaten (CDSM) zu dem Sprachauslösesystem (S540) überträgt, und das Sprachauslösesystem (VTS; 201) basierend auf den kompensierten Abtastdaten (CDSM) den Sprachauslösebetrieb durchführt (S550).
  8. Anwendungsprozessor (AP; 2001) nach Anspruch 5, bei dem, während die Audiowiedergabe durch eine Ausgangskontaktstelle (PD22) der Audio-Schnittstelle (AIF) basierend auf Audio-Ausgangsdaten durchgeführt wird, das Audio-Teilsystem (ASS; 301) durch eine Eingangskontaktstelle (PD21) der Audio-Schnittstelle (AIF) ein Audio-Eingangssignal (SDI) empfängt (S610).
  9. Anwendungsprozessor (AP; 2001) nach Anspruch 8, bei dem der Echounterdrücker (AEC, 701) in dem Audio-Teilsystem (ASS; 301) die Echounterdrückung hinsichtlich Audio-Eingangsdaten des Audio-Eingangssignals (SDI) basierend auf den Audio-Ausgangsdaten durchführt, um kompensierte Audio-Eingangsdaten (CSDI) zu erzeugen (S620), und das Audio-Teilsystem (301) unter Verwendung des Briefkastenmoduls (MBX) die kompensierten Audio-Eingangsdaten (CSDI) zu dem Sprachauslösesystem (VTS; 201) überträgt (S630), und das Sprachauslösesystem (VTS; 201) basierend auf den kompensierten Audio-Eingangsdaten (CSDI) den Sprachauslösebetrieb durchführt (S640).
  10. Anwendungsprozessor (AP; 2002) nach Anspruch 4, bei dem das Sprachauslösesystem (VTS; 202) einen Echounterdrücker (AEC, 702), der konfiguriert ist, um die Echo-Unterdrückung durchzuführen, aufweist, und während die Audiowiedergabe durch eine Ausgangskontaktstelle (PD22) der Audio-Schnittstelle (AIF) basierend auf Audio-Ausgangsdaten durchgeführt wird, das Sprachauslösesystem (202) durch die Auslöseschnittstelle (TIF) das Auslöseeingangssignal (SDMIC, SAMIC; SMIC) empfängt (S710).
  11. Anwendungsprozessor (AP; 2002) nach Anspruch 10, bei dem das Audio-Teilsystem (ASS; 302) unter Verwendung des Briefkastenmoduls (MBX) die Audio-Ausgangsdaten (SDO') zu dem Sprachauslösesystem (VTS; 202) überträgt (S720).
  12. Anwendungsprozessor (AP; 2002) nach Anspruch 11, bei dem der Echounterdrücker (AEC, 702) in dem Sprachauslösesystem (VTS; 202) die Echounterdrückung hinsichtlich Abtastdaten des Auslöseeingangssignals (SDMIC, SAMIC; SMIC) basierend auf den Audio-Ausgangsdaten (SDO') durchführt, um kompensierte Abtastdaten zu erzeugen (S730), und das Sprachauslösesystem (VTS; 202) basierend auf den kompensierten Abtastdaten den Sprachauslösebetrieb durchführt (S740).
  13. Anwendungsprozessor (AP; 2003) nach Anspruch 4, bei dem ein Audio-Codec (55), der mit der Auslöseschnittstelle (TIF) verbunden ist, einen Echounterdrücker (AEC, 703) aufweist, der konfiguriert ist, um die Echo-Unterdrückung durchzuführen, und während die Audiowiedergabe durch eine Ausgangskontaktstelle (PD22) der Audio-Schnittstelle (AIF) basierend auf Audio-Ausgangsdaten durchgeführt wird, der Audio-Codec (55) die Mikrofondaten (DMC) von einem analogen Mikrofon (61) empfängt (S810).
  14. Anwendungsprozessor (AP; 2003) nach Anspruch 13, bei dem der Echounterdrücker (AEC, 703) in dem Audio-Codec (55) die Echounterdrückung hinsichtlich der Mikrofondaten (DMC) basierend auf den Audio-Ausgangsdaten durchführt, um ein kompensiertes Auslöseeingangssignal (CSAIC) zu erzeugen (S820), und der Audio-Codec (55) das kompensierte Auslöseeingangssignal (CSAIC) durch die Auslöseschnittstelle (TIF) zu dem Sprachauslösesystem (VTS; 203) überträgt (S830), und das Sprachauslösesystem (VTS; 203) basierend auf dem kompensierten Auslöseeingangssignal (CSAIC) den Sprachauslösebetrieb durchführt (S840).
  15. Anwendungsprozessor (AP; 2000; 2001; 2002; 2003) nach Anspruch 1, bei dem sowohl das Sprachauslösesystem (VTS; 200; 201; 202; 203) als auch das Audio-Teilsystem (ABOX; 300; 301; 302; 303) stromgattergesteuert sind und unabhängig von dem Host-Prozessor (100) freigeschaltet werden.
DE102018129733.5A 2018-01-25 2018-11-26 Eine Niederleistungs-Echounterdrückung unterstützender Anwendungsprozessor, elektronische Vorrichtung mit demselben und Verfahren zum Betreiben desselben Pending DE102018129733A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020180009388A KR102459920B1 (ko) 2018-01-25 2018-01-25 저전력 에코 제거를 지원하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법
KR10-2018-0009388 2018-01-25

Publications (1)

Publication Number Publication Date
DE102018129733A1 true DE102018129733A1 (de) 2019-07-25

Family

ID=67145183

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102018129733.5A Pending DE102018129733A1 (de) 2018-01-25 2018-11-26 Eine Niederleistungs-Echounterdrückung unterstützender Anwendungsprozessor, elektronische Vorrichtung mit demselben und Verfahren zum Betreiben desselben

Country Status (5)

Country Link
US (1) US11044368B2 (de)
KR (1) KR102459920B1 (de)
CN (1) CN110087166B (de)
DE (1) DE102018129733A1 (de)
TW (1) TWI794342B (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10225395B2 (en) * 2015-12-09 2019-03-05 Whatsapp Inc. Techniques to dynamically engage echo cancellation
US11863710B2 (en) 2021-11-01 2024-01-02 Mediatek Inc. Audio device and method for detecting device status of audio device in audio/video conference

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180009388A (ko) 2009-05-15 2018-01-26 아플릭스 자동 체결구의 수형 부분을 형성하는 연결 요소

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU7115400A (en) * 1999-08-31 2001-03-26 Accenture Llp System, method, and article of manufacture for a voice recognition system for identity authentication in order to gain access to data on the internet
US20020055844A1 (en) * 2000-02-25 2002-05-09 L'esperance Lauren Speech user interface for portable personal devices
WO2004046950A1 (en) * 2002-11-15 2004-06-03 Infineon Technologies Ag Mailbox interface between processors
KR100660607B1 (ko) 2005-04-27 2006-12-21 김봉석 에코기능을 구비한 리모컨
CN101106405A (zh) 2006-07-12 2008-01-16 北京大学深圳研究生院 回声消除器、回声消除方法及其双端通话检测系统
CN101878637B (zh) 2007-11-29 2013-09-18 艾利森电话股份有限公司 用于对语音信号进行回声消除的方法和配置
US8223986B2 (en) * 2009-11-19 2012-07-17 Apple Inc. Electronic device and external equipment with digital noise cancellation and digital audio path
US9104423B2 (en) * 2012-05-16 2015-08-11 Nvidia Corporation Method and system for advance wakeup from low-power sleep states
KR20150104615A (ko) 2013-02-07 2015-09-15 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US9542933B2 (en) 2013-03-08 2017-01-10 Analog Devices Global Microphone circuit assembly and system with speech recognition
US10192557B2 (en) 2013-08-26 2019-01-29 Samsung Electronics Co., Ltd Electronic device and method for voice recognition using a plurality of voice recognition engines
WO2015034504A1 (en) 2013-09-05 2015-03-12 Intel Corporation Mobile phone with variable energy consuming speech recognition module
WO2015038105A1 (en) 2013-09-11 2015-03-19 Intel Corporation Low power voice triggers for finding mobile devices
US20150221307A1 (en) * 2013-12-20 2015-08-06 Saurin Shah Transition from low power always listening mode to high power speech recognition mode
CN106062661B (zh) * 2014-03-31 2021-09-07 英特尔公司 用于常开常听的语音识别系统的位置感知功率管理方案
KR102208477B1 (ko) 2014-06-30 2021-01-27 삼성전자주식회사 마이크 운용 방법 및 이를 지원하는 전자 장치
US9530404B2 (en) * 2014-10-06 2016-12-27 Intel Corporation System and method of automatic speech recognition using on-the-fly word lattice generation with word histories
EP3125072B8 (de) * 2015-07-29 2018-11-14 Samsung Electronics Co., Ltd. Verfahren zur stromverwaltung und elektronische vorrichtung
US9667803B2 (en) * 2015-09-11 2017-05-30 Cirrus Logic, Inc. Nonlinear acoustic echo cancellation based on transducer impedance
KR102476600B1 (ko) * 2015-10-21 2022-12-12 삼성전자주식회사 전자 장치, 그의 음성 인식 방법 및 비일시적 컴퓨터 판독가능 기록매체
CN106297815B (zh) * 2016-07-27 2017-09-01 武汉诚迈科技有限公司 一种语音识别场景中回音消除的方法
CN107454508B (zh) * 2017-08-23 2020-07-14 深圳创维-Rgb电子有限公司 麦克风阵列的电视机及电视系统
US10601599B2 (en) * 2017-12-29 2020-03-24 Synaptics Incorporated Voice command processing in low power devices

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180009388A (ko) 2009-05-15 2018-01-26 아플릭스 자동 체결구의 수형 부분을 형성하는 연결 요소

Also Published As

Publication number Publication date
TW201933335A (zh) 2019-08-16
KR20190090553A (ko) 2019-08-02
US20190228788A1 (en) 2019-07-25
TWI794342B (zh) 2023-03-01
CN110087166A (zh) 2019-08-02
CN110087166B (zh) 2022-01-14
KR102459920B1 (ko) 2022-10-27
US11044368B2 (en) 2021-06-22

Similar Documents

Publication Publication Date Title
TWI605342B (zh) 共享虛擬記憶體的技術
DE102018128244A1 (de) Applikationsprozessor für niedrigleistungsbetrieb und eine elektronische einrichtung, die diesen umfasst
US11256638B2 (en) Application processor supporting interrupt during audio playback, electronic device including the same and method of operating the same
US11315582B2 (en) Method for recovering audio signals, terminal and storage medium
CN111445901B (zh) 音频数据获取方法、装置、电子设备及存储介质
CN112614500B (zh) 回声消除方法、装置、设备及计算机存储介质
DE102018129733A1 (de) Eine Niederleistungs-Echounterdrückung unterstützender Anwendungsprozessor, elektronische Vorrichtung mit demselben und Verfahren zum Betreiben desselben
CN108681474A (zh) 应用预加载方法、装置、存储介质及终端
CN110136733B (zh) 一种音频信号的解混响方法和装置
WO2021203906A1 (zh) 自动音量调整方法、装置、介质和设备
DE102018128225A1 (de) Anwendungsprozessor mit Sprachtriggersystem mit niedriger Leistung und direktem Weg zum Unterbrechen, elektronisches Gerät mit demselben und Verfahren zum Betreiben desselben
CN107343101A (zh) 一种实现定向录音的方法、装置、设备及存储介质
CN112750449A (zh) 回声消除方法、装置、终端、服务器及存储介质
US10783887B2 (en) Application processor including low power voice trigger system with external interrupt, electronic device including the same and method of operating the same
CN117711382A (zh) 音频信号处理模型的训练方法、装置、电子设备及介质
CN116501227B (zh) 图片显示方法、装置、电子设备及存储介质
CN114900730B (zh) 延时估计稳态值的获取方法、装置、电子设备和存储介质
US20140003612A1 (en) Information terminal and computer program product
WO2023212441A1 (en) Systems and methods for reducing echo using speech decomposition
CN118332255A (zh) 噪声消除方法、装置、电子设备及存储介质
CN117793361A (zh) 数据编码和数据解码的方法、装置、设备
CN114283826A (zh) 一种语音信号处理的方法及其相关设备
CN114520949A (zh) 音量控制方法、装置、设备及介质

Legal Events

Date Code Title Description
R012 Request for examination validly filed