CN108806677B - 音频处理装置及音频处理方法 - Google Patents

音频处理装置及音频处理方法 Download PDF

Info

Publication number
CN108806677B
CN108806677B CN201810421761.2A CN201810421761A CN108806677B CN 108806677 B CN108806677 B CN 108806677B CN 201810421761 A CN201810421761 A CN 201810421761A CN 108806677 B CN108806677 B CN 108806677B
Authority
CN
China
Prior art keywords
audio signal
sampling frequency
audio
processor
setting command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810421761.2A
Other languages
English (en)
Other versions
CN108806677A (zh
Inventor
林宏锜
林贸鸿
张学誉
谢易霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Merry Electronics Shenzhen Co ltd
Original Assignee
Merry Electronics Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Merry Electronics Shenzhen Co ltd filed Critical Merry Electronics Shenzhen Co ltd
Publication of CN108806677A publication Critical patent/CN108806677A/zh
Application granted granted Critical
Publication of CN108806677B publication Critical patent/CN108806677B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/22Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only 
    • H04R1/222Arrangements for obtaining desired frequency or directional characteristics for obtaining desired frequency characteristic only  for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02087Noise filtering the noise being separate speech, e.g. cocktail party
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/23Direction finding using a sum-delay beam-former
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Otolaryngology (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及一种音频处理装置以及音频处理方法。音频处理装置包括麦克风阵列、处理器以及音频信号处理器。麦克风阵列用以提供具有第一采样频率的外部音频信号。外部音频信号包括第一音频信号以及第二音频信号。处理器依据外部音频信号以及第二音频信号提供第一设定命令以及第二设定命令。音频信号处理器依据第一设定命令产生具有第二采样频率的第二音频信号,依据第二设定命令将第二音频信号的第二采样频率调整为第一采样频率,依据具有第一采样频率的第二音频信号分离出外部音频信号中的第一语音信号。

Description

音频处理装置及音频处理方法
技术领域
本发明涉及音频处理技术领域,特别是涉及一种音频处理装置以及音频处理方法。
背景技术
现阶段的音频处理技术中,如何有效地将麦克风阵列所收集到的音频信号中的语音指令以及非语音指令信号(例如是播放中的音乐)分离出来,是目前音频处理主要技术需求。然而,例如当播放中的音乐的取样频率不同于麦克风阵列的取样频率时,语音指令不容易从音频信号中分离出来,如此一来,语音指令可辨识性将会降低,从而使对应的音频处理装置依据不清楚的语音指令而产生不正确的响应操作。
发明内容
基于此,有必要针对音频处理装置由于依据不清楚的语音指令而产生不正确的响应操作的问题,提供一种音频处理装置以及音频处理方法,用以提高语音指令的可辨识性,并且维持高质量的音乐播放效果。
本发明提供一种音频处理装置,音频处理装置包括麦克风阵列、处理器以及音频信号处理器。麦克风阵列接收外部音频信号以提供具有第一采样频率的外部音频信号,其中外部音频信号包括第一音频信号以及第二音频信号。处理器接收第二音频信号并且依据外部音频信号以及第二音频信号提供第一设定命令以及第二设定命令。音频信号处理器耦接于麦克风阵列以及处理器之间。音频信号处理器通过麦克风阵列接收所述外部音频信号以及通过处理器接收所述第二音频信号。音频信号处理器依据所述第一设定命令产生具有第二采样频率的所述第二音频信号,依据所述第二设定命令将所述第二音频信号的所述第二采样频率调整为所述第一采样频率。音频信号处理器依据具有所述第一采样频率的所述第二音频信号来分离出所述外部音频信号中的所述第一音频信号。
本发明提供一种音频处理方法,包括:接收外部音频信号以提供具有第一采样频率的外部音频信号,其中外部音频信号包括第一音频信号以及第二音频信号;接收第二音频信号并且依据外部音频信号以及第二音频信号提供第一设定命令以及第二设定命令;依据第一设定命令产生具有第二采样频率的第二音频信号;依据第二设定命令将第二音频信号的第二采样频率调整为第一采样频率;以及依据具有第一采样频率的第二音频信号来分离出外部音频信号中的第一音频信号。
基于上述,本发明的音频处理装置接收具有第一采样频率的外部音频信号以及第二音频信号。音频处理装置产生具有第二采样频率的第二音频信号,并且将第二音频信号的第二采样频率调整为第一采样频率。音频处理装置依据具有第一采样频率的第二音频信号来分离出外部音频信号中的第一音频信号,借以提高语音指令在音乐播放环境的可辨识性,并且维持高质量的音乐播放效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他实施例的附图。
图1是依据本发明一实施例所绘示的音频处理装置的示意图。
图2是依据本发明一实施例所绘示的音频处理方法流程图。
图3是依据本发明一实施例所绘示的第二音频信号的处理方法流程图。
图4是依据本发明一实施例所绘示的第一音频信号的处理方法流程图。
图5是依据本发明另一实施例所绘示的音频处理装置的示意图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施方式。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本发明的公开内容理解的更加透彻全面。
需要说明的是,当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
请同时参考图1,图1是依据本发明一实施例所绘示的音频处理装置的示意图。音频处理装置100包括麦克风阵列110、处理器120以及音频信号处理器130。麦克风阵列110用以接收外部音频信号SE。外部音频信号SE包括第一音频信号SA1以及第二音频信号SA2。在本实施例中,麦克风阵列110的取样频率为第一取样频率f1,因此麦克风阵列110在接收外部音频信号SE后会提供具有第一取样频率f1(如16kHz或48kHz等)的外部音频信号SE_f1。在本实施例中,第一音频信号SA1是来自于用户所提供的语音指令,而第二音频信号SA2可例如音乐等非语音指令的音频信号。
处理器120接收第二音频信号SA2,并且处理器120依据外部音频信号SE_f1以及第二音频信号SA2提供第一设定命令SC1以及第二设定命令SC2。在本实施例中,处理器120可例如是音频编解码器(codec)。处理器120可例如是通过芯片间声音(IntegratedInterchip Sound,I2S)传输接口、通用串行总线(Universal Serial Bus,USB)、串行外围接口总线(SerialPeripheral Interface Bus,SPI)、通用异步收发(UniversalAsynchronous Receiver/Transmitter,UART)或无线网络接口来接收第二音频信号SA2。在本实施例中,处理器120在麦克风阵列110设置于音频处理装置100上时,可取得外部音频信号SE_f1的第一采样频率f1。
音频信号处理器130耦接于麦克风阵列110以及处理器120之间。音频信号处理器130可通过芯片间声音I2S或SPI传输接口与处理器120进行连接。音频信号处理器130依据第一设定命令SC1产生具有第二采样频率f2(如8kHz~768kHz)的第二音频信号SA2_f2,音频信号处理器130依据第二设定命令SC2将第二音频信号SA2_f2的第二采样频率f2调整为第一采样频率f1。举例来说,第二音频信号SA2_f2的第二采样频率f2是192kHz,而第一采样频率f1是48kHz。经由音频信号处理器130调整后,第二音频信号SA2_f1是具有48kHz采样频率的音频信号。音频信号处理器130依据具有第一采样频率f1的第二音频信号SA2_f1从外部音频信号SE_f1中分离出具有第一采样频率f1的第一音频信号SA1_f1。在本实施例中,音频处理装置100还包括扬声器140。扬声器140耦接于音频信号处理器130。扬声器140用以输出音频信号处理器130所提供的第二音频信号SA2_f2。
请同时参考图1及图2,图2是依据本发明一实施例所绘示的音频处理方法流程图。麦克风阵列110在步骤S210接收外部音频信号SE,并提供具有第一采样频率f1的外部音频信号SE_f1。处理器120在步骤S220接收第二音频信号SA2以及获得第二音频信号SA2的第二采样频率f2,并且处理器120依据外部音频信号SE_f1以及第二音频信号SA2提供第一设定命令SC1以及第二设定命令SC2。音频信号处理器130接收麦克风阵列110所提供的外部音频信号SE_f1以及接收来自于处理器120的第二音频信号SA2_f2。在步骤S230中,音频信号处理器130依据第一设定命令SC1产生具有第二采样频率f2的第二音频信号SA2_f2。在步骤S240中,依据所述第二设定命令SC2将第二音频信号SA2_f2的第二采样频率f2调整为第一采样频率f1,以产生具有第一采样频率f1的第二音频信号SA2_f1。音频信号处理器130在步骤S250依据具有第一采样频率f1的第二音频信号SA2_f1来分离出外部音频信号SE_f1中的第一音频信号SA1_f1。
进一步来说明第二音频信号SA2_f2的处理方法,首先请参考图1及图3,图3是依据本发明一实施例所绘示的第二音频信号的处理方法流程图。其中,步骤S310~S320可对应于图2的步骤S220,而步骤S330~S340可对应于图2的步骤S230。在图1及图3的实施例中,处理器120在步骤S310接收第二音频信号SA2,会在步骤S320判断目前第二音频信号SA2的第二采样频率f2是否发生改变。当处理器120判断第二采样频率f2改变时,也就是当目前第二音频信号SA2的第二采样频率f2与前一次接收到的第二音频信号SA2’(未示出)的第二采样频率f2’(未示出)不同,处理器120对音频信号处理器130提供第一设定命令SC1来指示音频信号处理器130将音频信号处理器130的采样频率从第二采样频率f2’调整为第二采样频率f2并且接收目前第二音频信号SA2。音频信号处理器130依据第一设定命令SC1接收目前第二音频信号SA2并且在步骤S330将音频信号处理器130的第二采样频率f2’调整为第二采样频率f2。接着音频信号处理器130在步骤S340产生具有调整后的第二采样频率f2的第二音频信号SA2_f2。反之,当处理器120判断第二采样频率f2改变时,也就是当目前第二音频信号SA2_f2的第二采样频率f2与前一次接收到的第二音频信号SA2’的第二采样频率f2’相同,处理器120对音频信号处理器130则提供第一设定命令SC1来指示音频信号处理器130接收目前第二音频信号SA2_f2。音频信号处理器130则不调整第二采样频率f2’,并在步骤S340中产生第二音频信号SA2_f2。
举例来说,处理器120在步骤S310接收目前的音乐信号时,会在步骤S320判断目前音乐信号的第二采样频率f2与前一首音乐信号的第二采样频率f2’是否相同。当处理器120判断目前音乐信号的第二采样频率f2与前一首音乐信号的第二采样频率f2’不相同,处理器120对音频信号处理器130提供第一设定命令SC1。音频信号处理器130则在步骤S330依据第一设定命令SC1将第二采样频率f2’调整为第二采样频率f2,并且在步骤S340产生具有调整后的第二采样频率f2的目前音乐信号。也就是说,处理器120在步骤S320中的判断操作、第一设定命令SC1的提供以及频信号处理器130则在步骤S330中的第二采样频率的调整,都是在前一首音乐信号播放结束之后以及目前音乐信号开始播放之前进行。
音频处理装置100还可以包括扬声器140。扬声器140用以播放音频信号处理器130所产生的具有第二采样频率f2(例如是8kHz~768kHz)的第二音频信号SA2_f2。如此一来,音频处理装置100可在接收到第二音频信号SA2_f2后,能够维持高质量的音频信号播放效果。
进一步来说明,请同时参考图1及图4,图4是依据本发明一实施例所绘示的第一音频信号的处理方法流程图。其中步骤S410~S420可对应于图2的步骤S220,步骤S430可对应于图2的步骤S240,而步骤S440可对应于图2的步骤S250。处理器120在步骤S410接收到第二音频信号SA2_f2,会在步骤S420判断第二音频信号SA2_f2的第二采样频率f2是否与麦克风阵列所提供的第一采样频率f1相同。当处理器120在步骤S420判断第二音频信号SA2_f2的所述第二采样频率f2与第一采样频率f1不相同,处理器120对音频信号处理器130提供第二设定命令SC2来指示音频信号处理器130将第二音频信号SA2_f2的第二采样频率f2调整为第一采样频率f1。音频信号处理器130在步骤S430依据第二设定命令SC2将第二音频信号SA2_f2的第二采样频率f2调整为第一采样频率f1,借以产生具有第一采样频率f1的第二音频信号SA2_f1。接下来,音频信号处理器130在步骤S440依据具有第一采样频率f1的第二音频信号SA2_f1分离出外部音频信号SE_f1中的第一音频信号SA1_f1。反之,当处理器120在步骤S420判断第二音频信号SA2_f2的所述第二采样频率f2与第一采样频率f1是相同的,处理器120对音频信号处理器130提供第二设定命令SC2来指示音频信号处理器130不调整第二采样频率f2。音频信号处理器130则依据第二设定命令SC2不调整第二音频信号SA2_f2的第二采样频率f2并且在步骤S440依据第二音频信号SA2_f2(由于第二采样频率f2等于第一采样频率f1,因此第二音频信号SA2_f2也可以被视为第二音频信号SA2_f1)分离出外部音频信号SE_f1中的第一音频信号SA1_f1。
在此值得一提的是,音频信号处理器130接收外部音频信号SE_f1以及具有第一采样频率f1的第二音频信号SA2_f1,并且借由第二音频信号SA2_f1分离出外部音频信号SE_f1中的第一音频信号SA1_f1。如此一来,音频处理装置100可有效地过滤外部音频信号SE_f1中的第二音频信号SA2_f1并分离出外部音频信号SE_f1,借以提高语音指令的可辨识性。
在本实施例中,音频信号处理器130可借由盲信号分离(Blind SourcesSeparation)法、声回波抵消(Acoustic Echo Cancellation)法、到达方向估测(directionofarrival)或波束赋形(Beamforming)等信号分离技术来分离出第一音频信号SA1_f1。
再请参考图1,在图1的实施例中,当音频信号处理器130分离出第一音频信号SA1_f1之后,处理器可接收第一音频信号SA1_f1,并且输出所述第一音频信号。在本实施例中,处理器120还依据第一音频信号SA1_f1中取得音频指令,并且处理器120可依据音频指令提供对应于音频指令的响应操作。在一些实施例中,处理器120还可以将第一音频信号SA1_f1传送至外部的电子装置或云端数据库(未示出)。外部的电子装置或云端数据库可依据第一音频信号SA1_f1取得语音指令,并依据语音指令以提供对应于语音指令的响应操作。
在一些实施例中,处理器120还可以进一步地接收音频信号处理器130所反馈的第一设定命令SC1以及第二设定命令SC2,借以记录处理器120本身所提供的设定过程。
请参考图5,图5是依据本发明另一实施例所绘示的音频处理装置的示意图。在本实施例中,音频处理装置500的音频信号处理器530包括音频编译码器532、采样频率同步器534以及外部音频信号处理器536。音频编解码器532耦接至处理器520,音频编解码器532可通过芯片间声音(Integrated Interchip Sound,I2S)传输接口接收处理器520所提供的第一设定命令SC1,并依据第一设定命令SC1将音频编解码器532的采样频率调整为所述第二采样频率f2,并通过处理器520接收第二音频信号SA2以产生具有第二采样频率f2的第二音频信号SA2_f2。在本实施例中,音频处理装置500还包括扬声器540。扬声器540耦接至音频编解码器532,扬声器540用以播放音频编解码器532所提供的第二音频信号SA2_f2。
采样频率同步器534耦接至音频编解码器532。采样频率同步器534从音频编译码器接收532接收第二音频信号SA2_f2。采样频率同步器534依据处理器520所提供的第二设定命令SC2以将第二音频信号SA2_f2的第二采样频率f2调整为第一采样频率f1以产生具有第一采样频率f1的第二音频信号SA2_f1。在本实施例中,采样频率同步器534可直接接收处理器520所提供的第二设定命令SC2。在其他部分实施例中,采样频率同步器534可通过音频编解码器532接收处理器520所提供的第二设定命令SC2,借以减少音频信号处理器530与处理器520之间的连接脚位。本发明并不以第二设定命令SC2的传输路径为限。
外部音频信号处理器536耦接至采样频率同步器534。外部音频信号处理器536接收采样频率同步器534所提供的第二音频信号SA2_f1以及。外部音频信号处理器536依据第二音频信号SA2_f1并且通过借由盲信号分离(Blind Sources Separation)法、声回波抵消(Acoustic Echo Cancellation)法、到达方向估测(direction ofarrival)或波束赋形(Beamforming)等信号分离技术来分离出第一音频信号SA1_f1。
在一些实施例中,外部音频信号处理器536内可具有采样频率,可进行进一步地转换麦克风阵列510所提供的外部音频信号SE_f1的采样频率。如此一来,音频处理装置500的音频信号处理器530在分离出第一音频信号SA的过程中,可以不需受限于麦克风阵列510的采样频率,而是以外部音频信号处理器536内的采样频率为准。外部音频信号处理器536的采样频率是通过处理器520所提供的第三设定命令设定或者是开机预设参数来设定。
在本实施例中,外部音频信号处理器536在来分离出第一音频信号SA1_f1后,将第一音频信号SA1_f1传送到采样频率同步器534。采样频率同步器534可将第一音频信号SA1_f1传送到处理器520。在本实施例中,采样频率同步器534也可以进一步对第一音频信号SA1_f1的第一采样频率f1进行调整以产生具有第三采样频率f3的第一音频信号SA1_f3(未示出)。采样频率同步器534将第一音频信号SA1_f3传送到处理器520。
综上所述,本发明的音频处理装置接收具有第一采样频率的外部音频信号以及第二音频信号。音频处理装置产生具有第二采样频率的第二音频信号,并且将第二音频信号的第二采样频率调整为第一采样频率,借以维持高质量的第二音频信号播放效果。此外,音频处理装置依据具有第一采样频率的第二音频信号来分离出外部音频信号中的第一音频信号。如此一来,语音指令可在第二音频信号的播放环境下被清楚地辨识,从而使音频处理装置能够提供正确的响应操作。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (18)

1.一种音频处理装置,包括:
一麦克风阵列,接收一外部音频信号以提供具有一第一采样频率的所述外部音频信号,其中所述外部音频信号包括一第一音频信号以及一第二音频信号;
一处理器,接收所述第二音频信号并且依据所述外部音频信号以及所述第二音频信号提供一第一设定命令以及一第二设定命令;以及
一音频信号处理器,耦接于所述麦克风阵列以及所述处理器之间,依据所述第一设定命令产生具有一第二采样频率的所述第二音频信号并且接收所述外部音频信号以及通过处理器接收所述第二音频信号,依据所述第二设定命令将所述第二音频信号的所述第二采样频率调整为所述第一采样频率,依据具有所述第一采样频率的所述第二音频信号来分离出所述外部音频信号中的所述第一音频信号;
当所述第二采样频率改变时,所述处理器对所述音频信号处理器提供所述第一设定命令以使所述音频信号处理器的采样频率调整为所述第二采样频率并产生具有调整后的所述第二采样频率的所述第二音频信号。
2.根据权利要求1所述的音频处理装置,其特征在于,当所述第二音频信号的所述第二采样频率与所述第一采样频率不相同,所述处理器对所述音频信号处理器提供所述第二设定命令以使所述音频信号处理器将所述第二音频信号的所述第二采样频率调整为所述第一采样频率。
3.根据权利要求1所述的音频处理装置,其特征在于,所述处理器接收所述第一音频信号,并且输出所述第一音频信号。
4.根据权利要求1所述的音频处理装置,其特征在于,所述音频信号处理器包括:
一音频编解码器,耦接至所述处理器,接收所述处理器所提供的所述第一设定命令并依据所述第一设定命令将所述音频编解码器的采样频率调整为所述第二采样频率,并通过所述处理器接收所述第二音频信号以产生具有所述第二采样频率的所述第二音频信号。
5.根据权利要求4所述的音频处理装置,其特征在于,还包括:
一扬声器,耦接至所述音频编解码器,播放具有所述第二采样频率的所述第二音频信号。
6.根据权利要求4所述的音频处理装置,其特征在于,所述音频信号处理器包括:
一采样频率同步器,耦接至所述音频编解码器,从所述音频编解码器接收具有所述第二采样频率的所述第二音频信号,依据所述第二设定命令将所述第二音频信号的所述第二采样频率调整为所述第一采样频率,借以产生具有所述第一采样频率的所述第二音频信号。
7.根据权利要求6所述的音频处理装置,其特征在于,所述音频信号处理器还包括:
一外部音频信号处理器,耦接至所述采样频率同步器,接收具有所述第一采样频率的所述第二音频信号并且接收所述外部音频信号,依据具有所述第一采样频率的所述第二音频信号并且通过一信号分离技术来分离出所述外部音频信号中的所述第一音频信号,
其中所述外部音频信号处理器的采样频率是通过所述处理器所提供的一第三设定命令设定或一开机预设参数来设定。
8.根据权利要求7所述的音频处理装置,其特征在于,所述信号分离技术是盲信号分离(Blind Sources Separation)法、声回波抵消(Acoustic Echo Cancellation)法、到达方向估测(directionofarrival)或波束赋形(Beamforming)。
9.根据权利要求7所述的音频处理装置,其特征在于,所述外部音频信号处理器将所述第一音频信号通过所述采样频率同步器传送到所述处理器。
10.根据权利要求1所述的音频处理装置,其特征在于,所述处理器还依据所述第一音频信号取得一语音指令,并依据所述语音指令提供对应于所述语音指令的响应操作。
11.一种音频处理方法,包括:
接收一外部音频信号以提供具有一第一采样频率的所述外部音频信号,其中所述外部音频信号包括一第一音频信号以及一第二音频信号;
接收所述第二音频信号并且依据所述外部音频信号以及所述第二音频信号提供一第一设定命令以及一第二设定命令;
依据所述第一设定命令产生具有一第二采样频率的所述第二音频信号;
依据所述第二设定命令将所述第二音频信号的所述第二采样频率调整为所述第一采样频率;以及
依据具有所述第一采样频率的所述第二音频信号来分离出所述外部音频信号中的所述第一音频信号;
依据所述第一设定命令产生具有所述第二采样频率的所述第二音频信号的步骤包括:
当所述第二采样频率改变时,提供所述第一设定命令以调整所述第二采样频率以产生具有调整后的所述第二采样频率的所述第二音频信号。
12.根据权利要求11所述的音频处理方法,其特征在于,依据所述第一设定命令产生具有所述第二采样频率的所述第二音频信号的步骤还包括:
播放具有所述第二采样频率的所述第二音频信号。
13.根据权利要求11所述的音频处理方法,其特征在于,依据所述第二设定命令将所述第二音频信号的所述第二采样频率调整为所述第一采样频率的步骤包括:
当所述第二音频信号的所述第二采样频率与所述第一采样频率不相同,提供所述第二设定命令以将所述第二音频信号的所述第二采样频率调整为所述第一采样频率。
14.根据权利要求11所述的音频处理方法,其特征在于,依据具有所述第一采样频率的所述第二音频信号来分离出所述外部音频信号中的所述第一音频信号的步骤包括:
输出所述第一音频信号。
15.根据权利要求11所述的音频处理方法,其特征在于,依据所述第二设定命令将所述第二音频信号的所述第二采样频率调整为所述第一采样频率的步骤包括:
依据所述第二设定命令将所述第二音频信号的所述第二采样频率调整为所述第一采样频率,借以产生具有所述第一采样频率的所述第二音频信号。
16.根据权利要求11所述的音频处理方法,其特征在于,依据具有所述第一采样频率的所述第二音频信号来分离出所述外部音频信号中的所述第一音频信号的步骤包括:
接收具有所述第一采样频率的所述第二音频信号并且接收所述外部音频信号,依据具有所述第一采样频率的所述第二音频信号并且通过一信号分离技术来分离出所述外部音频信号中的所述第一音频信号。
17.根据权利要求16所述的音频处理方法,其特征在于,所述信号分离技术是盲信号分离(Blind Sources Separation)法、声回波抵消(Acoustic Echo Cancellation)法、到达方向估测(direction ofarrival)或波束赋形(Beamforming)。
18.根据权利要求11所述的音频处理方法,其特征在于,还包括:
依据所述第一音频信号取得一语音指令,并依据所述语音指令提供对应于所述语音指令的响应操作。
CN201810421761.2A 2018-02-14 2018-05-04 音频处理装置及音频处理方法 Expired - Fee Related CN108806677B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW107105542A TWI665661B (zh) 2018-02-14 2018-02-14 音頻處理裝置及音頻處理方法
TW107105542 2018-02-14

Publications (2)

Publication Number Publication Date
CN108806677A CN108806677A (zh) 2018-11-13
CN108806677B true CN108806677B (zh) 2020-10-13

Family

ID=64093330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810421761.2A Expired - Fee Related CN108806677B (zh) 2018-02-14 2018-05-04 音频处理装置及音频处理方法

Country Status (3)

Country Link
US (1) US10424316B2 (zh)
CN (1) CN108806677B (zh)
TW (1) TWI665661B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110166882B (zh) * 2018-09-29 2021-05-25 腾讯科技(深圳)有限公司 远场拾音设备、及远场拾音设备中采集人声信号的方法
CN115223578B (zh) * 2022-09-21 2023-07-14 浙江地芯引力科技有限公司 一种音频信号同步方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751918A (zh) * 2008-12-18 2010-06-23 李双清 新型消音装置及消音方法
WO2016013740A1 (ko) * 2014-07-22 2016-01-28 한화테크윈 주식회사 멀티 채널 오디오 데이터의 시각화 장치 및 방법
CN105723458A (zh) * 2013-09-12 2016-06-29 沙特阿拉伯石油公司 用于滤除噪声和还原声信号遭到衰减的高频分量的动态阈值方法、系统、计算机可读介质和程序代码
CN106653001A (zh) * 2016-11-17 2017-05-10 沈晓明 婴儿哭声的辩识方法及其系统
CN107342093A (zh) * 2017-06-07 2017-11-10 惠州Tcl移动通信有限公司 一种音频信号的降噪处理方法及系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6944474B2 (en) * 2001-09-20 2005-09-13 Sound Id Sound enhancement for mobile phones and other products producing personalized audio for users
US7251322B2 (en) * 2003-10-24 2007-07-31 Microsoft Corporation Systems and methods for echo cancellation with arbitrary playback sampling rates
US20070019802A1 (en) * 2005-06-30 2007-01-25 Symbol Technologies, Inc. Audio data stream synchronization
CN1909744A (zh) * 2005-08-05 2007-02-07 乐金电子(惠州)有限公司 可按不同源分离输出的车辆用音频系统
US20070076000A1 (en) * 2005-09-30 2007-04-05 Brand Matthew E Method for selecting a low dimensional model from a set of low dimensional models representing high dimensional data
US8874439B2 (en) * 2006-03-01 2014-10-28 The Regents Of The University Of California Systems and methods for blind source signal separation
US8068619B2 (en) * 2006-05-09 2011-11-29 Fortemedia, Inc. Method and apparatus for noise suppression in a small array microphone system
US9064497B2 (en) * 2012-02-22 2015-06-23 Htc Corporation Method and apparatus for audio intelligibility enhancement and computing apparatus
WO2014021890A1 (en) * 2012-08-01 2014-02-06 Dolby Laboratories Licensing Corporation Percentile filtering of noise reduction gains
CN104601764A (zh) * 2013-10-31 2015-05-06 中兴通讯股份有限公司 移动终端的噪音处理方法、装置及系统
WO2016034454A1 (en) * 2014-09-05 2016-03-10 Thomson Licensing Method and apparatus for enhancing sound sources
TWI573133B (zh) * 2015-04-15 2017-03-01 國立中央大學 音訊處理系統及方法
KR20170035504A (ko) * 2015-09-23 2017-03-31 삼성전자주식회사 전자 장치 및 전자 장치의 오디오 처리 방법
JP2017191309A (ja) * 2016-04-08 2017-10-19 晋哉 齋藤 ブラインド信号分離方法およびその装置
TWI622043B (zh) * 2016-06-03 2018-04-21 瑞昱半導體股份有限公司 聲源分離方法與裝置
CN107657962B (zh) * 2017-08-14 2020-06-12 广东工业大学 一种语音信号的喉声和气声识别与分离方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751918A (zh) * 2008-12-18 2010-06-23 李双清 新型消音装置及消音方法
CN105723458A (zh) * 2013-09-12 2016-06-29 沙特阿拉伯石油公司 用于滤除噪声和还原声信号遭到衰减的高频分量的动态阈值方法、系统、计算机可读介质和程序代码
WO2016013740A1 (ko) * 2014-07-22 2016-01-28 한화테크윈 주식회사 멀티 채널 오디오 데이터의 시각화 장치 및 방법
CN106653001A (zh) * 2016-11-17 2017-05-10 沈晓明 婴儿哭声的辩识方法及其系统
CN107342093A (zh) * 2017-06-07 2017-11-10 惠州Tcl移动通信有限公司 一种音频信号的降噪处理方法及系统

Also Published As

Publication number Publication date
TWI665661B (zh) 2019-07-11
US20190251983A1 (en) 2019-08-15
CN108806677A (zh) 2018-11-13
US10424316B2 (en) 2019-09-24
TW201935467A (zh) 2019-09-01

Similar Documents

Publication Publication Date Title
US8194900B2 (en) Method for operating a hearing aid, and hearing aid
EP1085782A2 (en) Voice control system with a microphone array
WO2006028587A3 (en) Headset for separation of speech signals in a noisy environment
US10510361B2 (en) Audio processing apparatus that outputs, among sounds surrounding user, sound to be provided to user
JP2006139307A (ja) 声音効果処理と騒音制御を有する装置及びその方法
US20080086309A1 (en) Method for operating a hearing aid, and hearing aid
WO2021263136A3 (en) Systems, apparatus, and methods for acoustic transparency
US20220246161A1 (en) Sound modification based on frequency composition
CN108806677B (zh) 音频处理装置及音频处理方法
US10909332B2 (en) Signal processing terminal and method
WO2020017518A1 (ja) 音声信号処理装置
CN113228710A (zh) 听力装置中的声源分离及相关方法
CN111787479B (zh) 一种修正tws耳机听感的方法和系统
US10178482B2 (en) Audio transmission system and audio processing method thereof
US10952005B1 (en) Stereo paired speaker system with center extraction
US20090285422A1 (en) Method for operating a hearing device and hearing device
JP2019110447A (ja) 電子機器、電子機器の制御方法、及び、電子機器の制御プログラム
US9792917B2 (en) Audio processing device and method and electro-acoustic converting device and method
CN107529112B (zh) 音频传输系统及其音频处理的方法
US20180254056A1 (en) Sounding device, audio transmission system, and audio analysis method thereof
WO2019044664A1 (ja) 音声信号処理装置
CN113115178B (zh) 音频信号处理方法及装置
KR102575293B1 (ko) 음성을 처리하기 위한 음성 처리 장치, 음성 처리 시스템 및 음성 처리 방법
US11587578B2 (en) Method for robust directed source separation
CN111263272B (zh) 一种音频信号分流回传方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201013